CN112041434A

CN112041434A - 用于美容性应用的编码一种或多种美容蛋白的重组核酸

Info

Publication number: CN112041434A
Application number: CN201980028654.6A
Authority: CN
Inventors: S·克里希南; T·派里; P·阿加瓦尔
Original assignee: Krystal Biotech Inc
Current assignee: Krystal Biotech Inc
Priority date: 2018-04-27
Filing date: 2019-04-26
Publication date: 2020-12-04
Also published as: CO2020013588A2; KR20210005141A; JP2024056823A; BR112020021804A2; SG11202009895TA; US20210045988A1; CA3095187A1; MX2020011257A; CL2023001338A1; AU2023285844A1; AU2019260757B2; EP3810149A4; US20190328644A1; US10786438B2; CL2020002755A1; WO2019210219A1; JP2021521894A; AU2019260757A1; EP3810149A1

Abstract

本公开提供了包含一种或多种编码一种或多种美容蛋白(例如一种或多种人胶原蛋白)的多核苷酸的重组核酸；包含所述重组核酸的病毒；包含所述重组核酸和/或所述病毒的组合物(例如美容制剂)；它们的使用方法；以及它们的制品或药盒。

Description

用于美容性应用的编码一种或多种美容蛋白的重组核酸

相关申请的交叉引用

本申请要求2018年4月27日提交的美国临时申请序列号62/663,476的优先权权益，所述美国临时申请以引用的方式整体并入本文。

采用ASCII文本文件的序列表提交

采用ASCII文本文件的以下提交的内容以引用的方式整体并入本文：序列表的计算机可读形式(CRF)(文件名称：761342000640SEQLIST.txt，记录日期：2019年4月26日，大小：437KB)。

技术领域

本公开部分地涉及包含一种或多种编码一种或多种美容蛋白(例如一种或多种人胶原(collagen)蛋白)的多核苷酸的重组核酸；包含所述重组核酸的病毒；包含所述重组核酸和/或所述病毒的组合物(例如美容制剂)；它们的使用方法；以及它们的制品或药盒。

背景技术

如同人体中的所有器官一样，皮肤随着时间的推移而经受连续以及经常是累积性的改变。皮肤的老化由于众多因素而发生，包括皮肤内的固有变化，重力的影响和作用于皮肤的面部肌肉，软组织丧失或移位、以及组织弹性的丧失。引起关注的是，皮肤的“老化”表型可由环境因素加速，最特别是长期暴露于紫外线照射(例如来自太阳)。在临床上，皮肤的老化表型可描述为起皱，下陷，和/或相比于它的年轻对应物，通常具有较小弹性和回弹力，但这个表型内的变化存在于天然时序性老化与光老化之间。

真皮细胞外基质(ECM)构成皮肤的主体，并且赋予强度与回弹力两者。胶原，作为对皮肤提供支撑的结缔组织的主要组分，随着个人年龄而降低。在老化皮肤中，胶原原纤维显示高水平的降解和断裂，并且通过真皮纤维母细胞在减弱速率下补充。这些降解和断裂的胶原束变得松散并丧失强度(从而破坏真皮ECM的结构组织)，并且无法解脱地导致皮肤的“老化”表现。

已开发用于使人皮肤的外观改进的众多皮肤护理产品。皱纹和皮肤皱褶通常用真皮和真皮下注射美容性面部填充剂治疗；然而，这种浅表方法不解决潜伏在皮肤老化下的结构变化，特别是胶原的损害或丧失。因此，存在对用以在想要抗击或逆转皮肤老化的生理影响的个体中补充、强化或替换真皮ECM组分(例如人胶原)的替代性策略的明确需要。

本文引用的所有参考资料，包括专利申请、专利公布、非专利文献和NCBI/UniProtKB/Swiss-Prot登录号，都以引用的方式整体并入本文，所述引用的程度就好像已特定地和单独地指出将每个单独的参考资料以引用的方式并入一样。

发明内容

为满足这些和其他需要，本文提供了编码一种或多种美容蛋白的重组核酸(例如重组疱疹病毒基因组)，所述重组核酸供在用于美容性/美容应用(例如治疗皱纹)的病毒(例如疱疹病毒)、组合物、制剂、药剂和/或方法中使用。本发明者已显示本文所述的重组减毒病毒能够1)有效转导人表皮/真皮细胞，以及2)成功表达所编码外源性人胶原(mRNA和蛋白)，其中所述蛋白可接着定位至皮肤等同性器官型培养物中的适当区域(参见例如实施例2)。此外，本发明者已显示本文所述的病毒可在无重大宿主细胞细胞毒性下以局部或真皮内方式成功施用，从而允许在体内施用之后从这些病毒表达的人胶原定位至真皮ECM的适当区域，而无对皮肤的可观察损害(参见例如实施例3和7)。此外，本发明者已显示多种不同HSV骨架可用于构建表达人胶原的病毒(参见例如实施例2)，多种策略可用于从单一重组基因组成功表达超过一种人胶原蛋白(参见例如实施例5)，并且候选病毒可在时序性或UV诱导的皮肤老化的多个相关体外和体内模型中成功表达人胶原蛋白(参见例如实施例6和7)。此外，本发明者已显示本文所述的病毒可被成功工程化来在体外以及在体内表达其他美容蛋白(例如人层粘连蛋白(laminin))，其中这些蛋白定位至真皮ECM的适当区域(参见例如实施例8)。在不希望受理论束缚下，本文所述的数据提供强力证据表明本公开的重组核酸和/或病毒可构成一种用于递送美容蛋白(例如人胶原蛋白，诸如人胶原1和人胶原3)，并且特别是用以在美容性应用中补充或替换天然人真皮ECM蛋白(例如以减少年龄或光诱导的皱纹的出现)的新型手段。

因此，本公开的某些方面涉及一种包含编码第一多肽的第一多核苷酸的重组疱疹病毒基因组，所述第一多肽包含第一美容蛋白。在一些实施方案中，重组疱疹病毒基因组包含第一多核苷酸的两个或更多个拷贝。在一些实施方案中，重组疱疹病毒基因组是有复制能力的。在一些实施方案中，重组疱疹病毒基因组是复制缺陷性的。在可与任何先前实施方案组合的一些实施方案中，重组疱疹病毒基因组选自重组单纯疱疹病毒(herpes simplexvirus)基因组、重组水痘带状疱疹(varicella zoster)病毒基因组、重组人巨细胞病毒基因组、重组疱疹病毒6A基因组、重组疱疹病毒6B基因组、重组疱疹病毒7基因组、重组卡波西氏肉瘤(Kaposi’s sarcoma)相关疱疹病毒基因组以及它们的任何衍生物。在可与任何先前实施方案组合的一些实施方案中，重组疱疹病毒基因组是重组单纯疱疹病毒基因组。在一些实施方案中，重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组、重组2型单纯疱疹病毒(HSV-2)基因组或它们的任何衍生物。

在一些实施方案中，重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组包含失活性突变。在可与任何先前实施方案组合的一些实施方案中，失活性突变在单纯疱疹病毒基因中。在一些实施方案中，失活性突变是单纯疱疹病毒基因的编码序列的缺失。在一些实施方案中，单纯疱疹病毒基因选自感染细胞蛋白(Infected Cell Protein，ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(thymidine kinase，tk)、长独特区域(UL)41和UL55。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP4基因的一个或两个拷贝中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在UL41基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因的一个或两个拷贝中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP27基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在UL55基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在接合区域中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组包含接合区域的缺失。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或两个内包含第一多核苷酸。

在可与任何先前实施方案组合的一些实施方案中，第一美容蛋白选自第一胶原蛋白、第一纤连蛋白(fibronectin)、第一弹性蛋白(elastin)、第一光蛋白聚糖(lumican)蛋白、第一玻连蛋白(vitronectin)、第一玻连蛋白受体蛋白、第一层粘连蛋白、第一神经调质(neuromodulator)蛋白和第一原纤蛋白(fibrillin)。在可与任何先前实施方案组合的一些实施方案中，第一美容蛋白包含与选自SEQ ID NO:15-21以及53-64的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，第一美容蛋白是结构性细胞外基质蛋白(例如胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中，第一美容蛋白是胶原蛋白、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原蛋白、人弹性蛋白、人纤连蛋白或人层粘连蛋白)。在可与任何先前实施方案组合的一些实施方案中，第一胶原蛋白是人胶原蛋白。在可与任何先前实施方案组合的一些实施方案中，第一胶原蛋白选自胶原α-1(I)链多肽(COL1-1)、胶原α-2(I)链多肽(COL1-2)、胶原α-1(II)链多肽(COL2)、胶原α-1(III)链多肽(COL3)、胶原α-1(IV)链多肽(COL4-1)、胶原α-2(IV)链多肽(COL4-2)、胶原α-3(IV)链多肽(COL4-3)、胶原α-4(IV)链多肽(COL4-4)、胶原α-5(IV)链多肽(COL4-5)、胶原α-6(IV)链多肽(COL4-6)、胶原α-1(V)链多肽(COL5-1)、胶原α-2(V)链多肽(COL5-2)、胶原α-3(V)链多肽(COL5-3)、胶原α-1(VI)链多肽(COL6-1)、胶原α-2(VI)链多肽(COL6-2)、胶原α-3(VI)链多肽(COL6-3)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)、胶原α-6(VI)链多肽(COL6-6)、胶原α-1(VIII)链多肽(COL8)、胶原α-1(IX)链多肽(COL9-1)、胶原α-2(IX)链多肽(COL9-2)、胶原α-3(IX)链多肽(COL9-3)、胶原α-1(X)链多肽(COL10)、胶原α-1(XI)链多肽(COL11-1)、胶原α-2(XI)链多肽(COL11-2)、胶原α-1(XII)链多肽(COL12)、胶原α-1(XIII)链多肽(COL13)、胶原α-1(XIV)链多肽(COL14)、胶原α-1(XV)链多肽(COL15)、胶原α-1(XVI)链多肽(COL16)、胶原α-1(XVII)链多肽(COL17)、胶原α-1(XVIII)链多肽(COL18)、胶原α-1(XIX)链多肽(COL19)、胶原α-1(XX)链多肽(COL20)、胶原α-1(XXI)链多肽(COL21)、胶原α-1(XXII)链多肽(COL22)、胶原α-1(XXIII)链多肽(COL23)、胶原α-1(XXIV)链多肽(COL24)、胶原α-1(XXV)链多肽(COL25)、胶原α-1(XXVI)链多肽(COL26)、胶原α-1(XXVII)链多肽(COL27)和胶原α-1(XXVIII)链多肽(COL28)。在可与任何先前实施方案组合的一些实施方案中，第一胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1和COL17。在可与任何先前实施方案组合的一些实施方案中，第一胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在可与任何先前实施方案组合的一些实施方案中，第一胶原蛋白是COL3。在可与任何先前实施方案组合的一些实施方案中，第一胶原蛋白是人COL3。在可与任何先前实施方案组合的一些实施方案中，第一胶原蛋白包含与SEQID NO:17的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在可与任何先前实施方案组合的一些实施方案中，第一美容蛋白不是胶原α-1(VII)链多肽(COL7)。

在一些实施方案中，第一多肽基本上由第一美容蛋白组成。在一些实施方案中，第一多肽由第一美容蛋白组成。在一些实施方案中，第一多肽包含：(a)第一美容蛋白；(b)另一美容蛋白；和(c)使(a)连接于(b)的接头多肽。在一些实施方案中，另一美容蛋白选自胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖蛋白、玻连蛋白、玻连蛋白受体蛋白、层粘连蛋白、神经调质蛋白和原纤蛋白。在一些实施方案中，另一美容蛋白是结构性细胞外基质蛋白(例如胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中，另一美容蛋白是胶原蛋白、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原蛋白、人弹性蛋白、人纤连蛋白或人层粘连蛋白)。在一些实施方案中，另一胶原蛋白(例如另一人胶原蛋白)选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中，另一胶原蛋白(例如另一人胶原蛋白)选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7和COL17。在一些实施方案中，第一美容蛋白和另一美容蛋白是不同的。在一些实施方案中，第一美容蛋白是COL1-1(例如人COL1-1)，并且另一美容蛋白是COL1-2(例如人COL1-2)。在一些实施方案中，接头多肽是可裂解接头多肽。在一些实施方案中，接头多肽包含与选自SEQ ID NO:28-31的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在可与任何先前实施方案组合的一些实施方案中，第一多核苷酸编码多顺反子mRNA，所述多顺反子mRNA包含：(a)编码第一多肽的第一开放阅读框(ORF)；(b)编码额外美容蛋白的第二ORF；和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。在一些实施方案中，额外美容蛋白选自胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖蛋白、玻连蛋白、玻连蛋白受体蛋白、层粘连蛋白、神经调质蛋白和原纤蛋白。在一些实施方案中，额外美容蛋白是结构性细胞外基质蛋白(例如胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中，额外美容蛋白是胶原蛋白、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原蛋白、人弹性蛋白、人纤连蛋白或人层粘连蛋白)。在一些实施方案中，额外胶原蛋白(例如额外人胶原蛋白)选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中，额外胶原蛋白(例如额外人胶原蛋白)选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7和COL17。在一些实施方案中，第一美容蛋白和额外美容蛋白是不同的。在一些实施方案中，第一美容蛋白是COL1-1(例如人COL1-1)，并且额外美容蛋白是COL1-2(例如人COL1-2)。在一些实施方案中，编码IRES的核酸序列与选自SEQ IDNO:22或SEQ ID NO:23的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

在可与任何先前实施方案组合的一些实施方案中，重组疱疹病毒基因组还包含编码第二美容蛋白的第二多核苷酸。在一些实施方案中，第二美容蛋白选自胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖蛋白、玻连蛋白、玻连蛋白受体蛋白、层粘连蛋白、神经调质蛋白和原纤蛋白。在一些实施方案中，第二美容蛋白是结构性细胞外基质蛋白(例如胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中，第二美容蛋白是胶原蛋白、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原蛋白、人弹性蛋白、人纤连蛋白或人层粘连蛋白)。在一些实施方案中，第二胶原蛋白(例如第二人胶原蛋白)选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中，第二胶原蛋白(例如第二人胶原蛋白)选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7和COL17。在一些实施方案中，第一美容蛋白和第二美容蛋白是不同的。在一些实施方案中，第一美容蛋白是COL1-1(例如人COL1-1)，并且第二美容蛋白是COL1-2(例如人COL1-2)。在一些实施方案中，第一美容蛋白是COL1-1(例如人COL1-1)，并且第二美容蛋白是COL3(例如人COL3)。

在可与任何先前实施方案组合的一些实施方案中，相较于相应野生型疱疹病毒基因组，重组疱疹病毒基因组当引入靶标细胞中时具有降低的细胞毒性。在一些实施方案中，靶标细胞是表皮和/或真皮的细胞。在一些实施方案中，靶标细胞是人细胞。在一些实施方案中，靶标细胞是纤维母细胞。

本公开的其他方面涉及一种包含本文所述的任何重组疱疹病毒基因组的疱疹病毒。在一些实施方案中，疱疹病毒是有复制能力的。在一些实施方案中，疱疹病毒是复制缺陷性的。在一些实施方案中，疱疹病毒是减毒的。在可与任何先前实施方案组合的一些实施方案中，相较于相应野生型疱疹病毒，疱疹病毒具有降低的细胞毒性。在可与任何先前实施方案组合的一些实施方案中，疱疹病毒选自单纯疱疹病毒、水痘带状疱疹病毒、人巨细胞病毒、疱疹病毒6A、疱疹病毒6B、疱疹病毒7和卡波西氏肉瘤相关疱疹病毒。在可与任何先前实施方案组合的一些实施方案中，疱疹病毒是单纯疱疹病毒。在一些实施方案中，单纯疱疹病毒是1型单纯疱疹病毒(HSV-1)、2型单纯疱疹病毒(HSV-2)或它们的任何衍生物。在一些实施方案中，单纯疱疹病毒是1型单纯疱疹病毒(HSV-1)。

本公开的其他方面涉及一种组合物，所述组合物包含：(a)本文所述的任何重组疱疹病毒基因组和/或本文所述的任何疱疹病毒；和(b)赋形剂。在一些实施方案中，组合物是无菌的。在可与任何先前实施方案组合的一些实施方案中，组合物适于局部、经皮、皮下、真皮内、口服、鼻内、气管内、舌下、经颊、经直肠、经阴道、吸入、静脉内、动脉内、肌肉内、心内、骨内、腹膜内、经粘膜、玻璃体内、视网膜下、关节内、关节周、局部或皮上施用。在可与任何先前实施方案组合的一些实施方案中，组合物适于真皮内施用。在可与任何先前实施方案组合的一些实施方案中，组合物适于浅表注射。在可与任何先前实施方案组合的一些实施方案中，组合物是美容组合物。在可与任何先前实施方案组合的一些实施方案中，组合物是皮肤护理产品。

本公开的其他方面涉及本文所述的任何重组疱疹病毒基因组和/或本文所述的任何疱疹病毒作为药剂(例如用于美容性适应症)的用途。

本公开的其他方面涉及本文所述的任何重组疱疹病毒基因组和/或本文所述的任何疱疹病毒作为疗法(例如作为美容性或美容疗法)的用途。

本公开的其他方面涉及本文所述的任何重组疱疹病毒基因组和/或本文所述的任何疱疹病毒制造可用于治疗皮肤学老化的一种或多种征象或症状的药剂的用途。

本公开的其他方面涉及一种增强、增加、加强和/或补充受试者中一种或多种真皮细胞外基质蛋白的水平的方法，所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。

本公开的其他方面涉及一种增强、增加、加强和/或补充受试者中一种或多种胶原蛋白的水平的方法，所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中，一种或多种胶原蛋白是胶原3。在一些实施方案中，内源性胶原3的水平由于时序性老化或光老化而降低。

本公开的其他方面涉及一种增强、增加、加强和/或补充受试者的软组织的方法，所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中，将组合物注射至受试者的软组织中。

本公开的其他方面涉及一种使有需要的受试者的皮肤状况、品质和/或外观改进的方法，所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中，向一个或多个日光损害或其他UV暴露部位、粗糙纹理部位、皮肤下陷部位、皱纹部位或它们的任何组合施用组合物。

本公开的其他方面涉及一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法，所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中，皮肤中一种或多种浅表凹陷选自由以下组成的组：鼻唇皱褶、鱼尾纹(crows’feet)、皱眉纹、烦恼纹(worry line)、疤痕、眉间纹、眉下垂、泪槽、鼻颊纹、兔宝宝纹(bunny line)、面颊/面中部下垂、木偶纹(marionette line)、罂粟陷窝(poppy dimpling)、微笑纹(smile line)、笑纹(laugh line)、下巴皱痕、颈纹、颈阔肌带以及它们的任何组合。

本公开的其他方面涉及一种使有需要的受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者增加和/或改进的方法，所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。

在可与任何先前实施方案组合的一些实施方案中，受试者的皮肤是老化中的皮肤。在可与任何先前实施方案组合的一些实施方案中，受试者的皮肤已由于暴露于紫外光而受损害。在可与任何先前实施方案组合的一些实施方案中，受试者的皮肤是有皱纹的。

本公开的其他方面涉及一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法，所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中，一种或多种皮肤学老化征象的减弱由以下方面指示：(a)细纹和/或皱纹得到治疗、减轻和/或预防；(b)皮肤孔尺寸得到降低；(c)皮肤厚度、饱满度和/或紧固度得到改进；(d)皮肤光滑度、柔韧性和/或柔软度得到改进；(e)皮肤色泽、光亮度和/或透明度得到改进；(f)原胶原和/或胶原产生得到改进；(g)皮肤纹理得到改进和/或再纹理化得到促进；(h)皮肤轮廓的外观得到改进；(i)皮肤光泽和/或亮度得到恢复；(j)由于老化和/或绝经而减退的皮肤外观得到改进；(k)皮肤保湿得到改进；(l)皮肤弹性和/或回弹力得到增加；(m)皮肤下陷得到治疗、减轻和/或预防；(n)皮肤紧致度得到改进；(o)色素斑点、斑点化皮肤和/或疤痕(诸如痤疮疤痕)得到减轻；(p)就光衍射或反射来说的皮肤光学性质得到改进；或(q)它们的任何组合。

在可与任何先前实施方案组合的一些实施方案中，受试者是人。在可与任何先前实施方案组合的一些实施方案中，疱疹病毒或组合物局部、经皮方式、皮下方式、皮上方式、真皮内方式、口服方式、舌下方式、经颊方式、经直肠方式、经阴道方式、静脉内方式、动脉内方式、肌肉内方式、骨内方式、心内方式、腹膜内方式、经粘膜方式、玻璃体内方式、视网膜下方式、关节内方式、关节周方式、局部方式、或通过吸入来向受试者施用。在可与任何先前实施方案组合的一些实施方案中，疱疹病毒或组合物以真皮内方式向受试者施用。在可与任何先前实施方案组合的一些实施方案中，疱疹病毒或组合物通过浅表注射来施用。

本公开的其他方面涉及一种组合物，所述组合物包含：包含重组核酸的单纯疱疹病毒(HSV)，其中所述重组核酸包含编码第一多肽的第一多核苷酸，所述第一多肽包含第一人胶原蛋白；以及赋形剂。在一些实施方案中，重组核酸包含第一多核苷酸的两个或更多个拷贝。在可与任何先前实施方案组合的一些实施方案中，HSV是复制缺陷性的。在可与任何先前实施方案组合的一些实施方案中，HSV是有复制能力的。在可与任何先前实施方案组合的一些实施方案中，HSV是单纯疱疹1型病毒、单纯疱疹2型病毒或它们的任何衍生物。

在一些实施方案中，重组核酸是单纯疱疹病毒扩增子。在一些实施方案中，单纯疱疹病毒扩增子是HSV-1扩增子或HSV-1杂合扩增子。在一些实施方案中，HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子、以及HSV/EBV/RV杂合扩增子、或HSV/睡美人(Sleeping Beauty)杂合扩增子。

在一些实施方案中，重组核酸是重组单纯疱疹病毒基因组。在一些实施方案中，重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在单纯疱疹病毒基因中包含失活性突变。在一些实施方案中，单纯疱疹病毒基因选自由感染细胞蛋白(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和UL55组成的组。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP4基因的一个或两个拷贝中包含失活突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在UL41基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP27基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中，失活性突变是一种或多种基因的编码序列的缺失。

在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在病毒基因座内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP22病毒基因座内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在UL41病毒基因座内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中，相较于野生型单纯疱疹病毒，HSV具有降低的细胞毒性。

在可与任何先前实施方案组合的一些实施方案中，第一人胶原蛋白选自胶原α-1(I)链多肽(COL1-1)、胶原α-2(I)链多肽(COL1-2)、胶原α-1(II)链多肽(COL2)、胶原α-1(III)链多肽(COL3)、胶原α-1(IV)链多肽(COL4-1)、胶原α-2(IV)链多肽(COL4-2)、胶原α-3(IV)链多肽(COL4-3)、胶原α-4(IV)链多肽(COL4-4)、胶原α-5(IV)链多肽(COL4-5)、胶原α-6(IV)链多肽(COL4-6)、胶原α-1(V)链多肽(COL5-1)、胶原α-2(V)链多肽(COL5-2)、胶原α-3(V)链多肽(COL5-3)、胶原α-1(VI)链多肽(COL6-1)、胶原α-2(VI)链多肽(COL6-2)、胶原α-3(VI)链多肽(COL6-3)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)、胶原α-6(VI)链多肽(COL6-6)、胶原α-1(VII)链多肽(COL7)、胶原α-1(VIII)链多肽(COL8)、胶原α-1(IX)链多肽(COL9-1)、胶原α-2(IX)链多肽(COL9-2)、胶原α-3(IX)链多肽(COL9-3)、胶原α-1(X)链多肽(COL10)、胶原α-1(XI)链多肽(COL11-1)、胶原α-2(XI)链多肽(COL11-2)、胶原α-1(XII)链多肽(COL12)、胶原α-1(XIII)链多肽(COL13)、胶原α-1(XIV)链多肽(COL14)、胶原α-1(XV)链多肽(COL15)、胶原α-1(XVI)链多肽(COL16)、胶原α-1(XVII)链多肽(COL17)、胶原α-1(XVIII)链多肽(COL18)、胶原α-1(XIX)链多肽(COL19)、胶原α-1(XX)链多肽(COL20)、胶原α-1(XXI)链多肽(COL21)、胶原α-1(XXII)链多肽(COL22)、胶原α-1(XXIII)链多肽(COL23)、胶原α-1(XXIV)链多肽(COL24)、胶原α-1(XXV)链多肽(COL25)、胶原α-1(XXVI)链多肽(COL26)、胶原α-1(XXVII)链多肽(COL27)和胶原α-1(XXVIII)链多肽(COL28)。在可与任何先前实施方案组合的一些实施方案中，第一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在可与任何先前实施方案组合的一些实施方案中，编码第一人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在可与任何先前实施方案组合的一些实施方案中，第一人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在可与任何先前实施方案组合的一些实施方案中，第一人胶原蛋白不是COL7。

在可与任何先前实施方案组合的一些实施方案中，第一多肽包含：(a)第一人胶原蛋白；(b)另一人胶原蛋白；和(c)使(a)连接于(b)的接头多肽。在一些实施方案中，接头多肽是可裂解接头多肽。在一些实施方案中，接头多肽包含与选自SEQ ID NO:28-31的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，另一人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中，另一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在一些实施方案中，编码另一人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些实施方案中，另一人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，第一人胶原蛋白和另一人胶原蛋白是不同的。

在可与任何先前实施方案组合的一些实施方案中，第一多核苷酸编码多顺反子mRNA，所述多顺反子mRNA包含：(a)编码第一多肽的第一开放阅读框(ORF)；(b)编码额外人胶原蛋白的第二ORF；和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。在一些实施方案中，编码IRES的核酸序列与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些实施方案中，额外人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中，额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在一些实施方案中，编码额外人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些实施方案中，额外人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，第一人胶原蛋白和额外人胶原蛋白是不同的。

在可与任何先前实施方案组合的一些实施方案中，重组核酸还包含编码第二人胶原蛋白的第二多核苷酸。在一些实施方案中，重组核酸包含第二多核苷酸的两个或更多个拷贝。在一些实施方案中，第二人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中，第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在一些实施方案中，编码第二人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些实施方案中，第二人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，第一人胶原蛋白和第二人胶原蛋白是不同的。

在可与任何先前实施方案组合的一些实施方案中，重组核酸是重组单纯疱疹病毒基因组，并且其中所述重组单纯疱疹病毒基因组在病毒基因座内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在ICP22病毒基因座内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在UL41病毒基因座内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸，并且在ICP22病毒基因座内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸，并且在UL41病毒基因座内包含第二多核苷酸。

在可与任何先前实施方案组合的一些实施方案中，赋形剂适合于经皮肤(全身性或局部)、经皮、皮下和/或真皮内施用。在可与任何先前实施方案组合的一些实施方案中，赋形剂包括羟丙基甲基纤维素凝胶。在可与任何先前实施方案组合的一些实施方案中，赋形剂适合于真皮内施用。在可与任何先前实施方案组合的一些实施方案中，赋形剂包括磷酸盐缓冲剂。在可与任何先前实施方案组合的一些实施方案中，赋形剂包括甘油。在可与任何先前实施方案组合的一些实施方案中，赋形剂包括脂质载体。在可与任何先前实施方案组合的一些实施方案中，赋形剂包括纳米粒子载体。

在可与任何先前实施方案组合的一些实施方案中，组合物是美容组合物。在一些实施方案中，美容组合物是皮肤护理产品。

本公开的其他方面涉及一种包括本文所述的任何组合物和关于施用组合物的说明书的药盒。

本公开的其他方面涉及一种增强、增加、加强和/或补充受试者中一种或多种人胶原蛋白的水平的方法，所述方法包括向所述受试者施用有效量的本文所述的任何组合物。

本公开的其他方面涉及一种增强、增加、加强和/或补充受试者的软组织的方法，所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中，将组合物注射至受试者的软组织中。

本公开的其他方面涉及一种使有需要的受试者的皮肤品质、状况和/或外观改进的方法，所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中，状况选自日光损害、老化、UV暴露、粗糙纹理、皮肤下陷、皱纹以及它们的任何组合。

本公开的其他方面涉及一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法，所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中，组合物的施用持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来减少受试者的皮肤中一种或多种浅表凹陷的出现。在一些实施方案中，相较于在施用组合物之前受试者的皮肤中一种或多种浅表凹陷的出现，在施用组合物之后，受试者的皮肤中一种或多种浅表凹陷的出现得以减少。

本公开的其他方面涉及一种使有需要的受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者增加和/或改进的方法，所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中，在施用组合物之后，受试者的皮肤持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来维持纹理、光滑度、弹性或张力增加和/或改进中的至少一者。在一些实施方案中，相较于在施用组合物之前受试者的皮肤的纹理、光滑度、弹性或张力，在施用组合物之后，受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者得以增加和/或改进。

本公开的其他方面涉及一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法，所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中，一种或多种皮肤学老化征象的减弱选自：(a)细纹和/或皱纹得到治疗、减轻和/或预防；(b)皮肤孔尺寸得到降低；(c)皮肤厚度、饱满度和/或紧固度得到改进；(d)皮肤光滑度、柔韧性和/或柔软度得到改进；(e)皮肤色泽、光亮度和/或透明度得到改进；(f)原胶原和/或胶原产生得到改进；(g)皮肤纹理得到改进和/或再纹理化得到促进；(h)皮肤轮廓的外观得到改进；(i)皮肤光泽和/或亮度得到恢复；(j)由于老化和/或绝经而减退的皮肤外观得到改进；(k)皮肤保湿得到改进；(l)皮肤弹性和/或回弹力得到增加；(m)皮肤下陷得到治疗、减轻和/或预防；(n)皮肤紧致度得到改进；(o)色素斑点、斑点化皮肤和/或痤疮疤痕得到减轻；(p)就光衍射或反射来说的皮肤光学性质得到改进；和(q)它们的任何组合。在一些实施方案中，相较于在施用组合物之前受试者的一种或多种皮肤学老化征象，在施用组合物之后，受试者的一种或多种皮肤学老化征象得到减弱。

在可与任何先前实施方案组合的一些实施方案中，受试者是人。在可与任何先前实施方案组合的一些实施方案中，组合物以经皮肤(全身性或局部)方式、经皮方式、皮下方式和/或真皮内方式向受试者施用。在一些实施方案中，组合物通过浅表注射来施用。在一些实施方案中，组合物以真皮内方式向受试者施用。在一些实施方案中，向受试者施用组合物一次。在一些实施方案中，向受试者施用组合物至少两次。在一些实施方案中，在施用之间，经过至少约15、至少约30、至少约60、至少约90或至少约120天。在可与任何先前实施方案组合的一些实施方案中，向受试者的一个或多个受影响和/或未受影响区域施用组合物。在可与任何先前实施方案组合的一些实施方案中，在施用之前对皮肤进行磨削。

本公开的其他方面涉及一种包含编码第一多肽的第一多核苷酸的重组核酸，所述第一多肽包含第一人胶原蛋白，其中所述重组核酸是重组单纯疱疹病毒基因组。在一些实施方案中，重组核酸包含第一多核苷酸的两个或更多个拷贝。在一些实施方案中，重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。

在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在单纯疱疹病毒基因中包含失活性突变。在一些实施方案中，单纯疱疹病毒基因选自由感染细胞蛋白(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和UL55组成的组。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP4基因的一个或两个拷贝中包含失活突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在UL41基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在ICP27基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中，失活性突变是一种或多种基因的编码序列的缺失。

在可与任何先前实施方案组合的一些实施方案中，第一人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL2。在可与任何先前实施方案组合的一些实施方案中，第一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在可与任何先前实施方案组合的一些实施方案中，编码第一人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在可与任何先前实施方案组合的一些实施方案中，第一人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在可与任何先前实施方案组合的一些实施方案中，第一人胶原蛋白不是COL7。

在可与任何先前实施方案组合的一些实施方案中，重组单纯疱疹病毒基因组在病毒基因座内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在ICP22病毒基因座内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在UL41病毒基因座内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸，并且在ICP22病毒基因座内包含第二多核苷酸。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸，并且在UL41病毒基因座内包含第二多核苷酸。

本公开的其他方面涉及一种包含本文所述的任何重组核酸的宿主细胞。在一些实施方案中，宿主细胞是真核细胞。在一些实施方案中，宿主细胞是哺乳动物细胞。在一些实施方案中，宿主细胞是人细胞或非人灵长类动物细胞。在一些实施方案中，宿主细胞是Vero细胞。在一些实施方案中，宿主细胞是补充性宿主细胞。

本公开的其他方面涉及一种收集单纯疱疹病毒的方法，所述方法包括：(a)使补充性宿主细胞与本文所述的任何重组核酸接触；以及(b)收集通过所述补充性宿主细胞产生的所述单纯疱疹病毒。

本公开的其他方面涉及一种收集单纯疱疹病毒的方法，所述方法包括：(a)培养包含本文所述的任何重组核酸的宿主细胞；以及(b)收集通过所述宿主细胞产生的所述单纯疱疹病毒。

附图说明

本专利或申请文件含有至少一个以彩色制作的附图。具有彩色附图的本专利或专利申请公布的副本将在请求并支付必要费用后由专利局提供。

图1A-图1N显示野生型和经修饰单纯疱疹病毒基因组的示意图。图1A显示野生型单纯疱疹病毒基因组。图1B显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列。图1C显示包含ICP4(两个拷贝)的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列。图1D显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸含有1)可操作地连接于第一异源性启动子的第一人胶原多肽的编码序列，和2)可操作地连接于第二异源性启动子的第二人胶原多肽的编码序列。第一人胶原多肽与第二人胶原多肽两者在相同DNA链上编码。图1E显示包含ICP4(两个拷贝)的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸含有1)可操作地连接于第一异源性启动子的第一人胶原多肽的编码序列，和2)可操作地连接于第二异源性启动子的第二人胶原多肽的编码序列。第一人胶原多肽与第二人胶原多肽两者在相同DNA链上编码。图1F显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸含有1)可操作地连接于第一异源性启动子的第一人胶原多肽的编码序列，和2)可操作地连接于第二异源性启动子的第二人胶原多肽的编码序列。第一人胶原多肽和第二人胶原多肽在相反DNA链上编码。图1G显示包含ICP4(两个拷贝)的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸含有1)可操作地连接于第一异源性启动子的第一人胶原多肽的编码序列，和2)可操作地连接于第二异源性启动子的第二人胶原多肽的编码序列。第一人胶原多肽和第二人胶原多肽在相反DNA链上编码。图1H显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸编码可操作地连接于异源性启动子的多顺反子mRNA。多顺反子mRNA含有由内部核糖体进入位点(IRES)分隔的第一人胶原多肽的编码序列和第二人胶原多肽的编码序列。图1I显示包含ICP4(两个拷贝)的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸编码可操作地连接于异源性启动子的多顺反子mRNA。多顺反子mRNA含有由内部核糖体进入位点(IRES)分隔的第一人胶原多肽的编码序列和第二人胶原多肽的编码序列。图1J显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸含有可操作地连接于异源性启动子的嵌合多肽的编码序列。嵌合多肽包含由可裂解接头分隔的第一人胶原多肽的氨基酸序列和第二人胶原多肽的氨基酸序列。图1K显示包含ICP4(两个拷贝)的编码序列的缺失，具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组，所述多核苷酸含有可操作地连接于异源性启动子的嵌合多肽的编码序列。嵌合多肽包含由可裂解接头分隔的第一人胶原多肽的氨基酸序列和第二人胶原多肽的氨基酸序列。图1L显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失，具有整合在ICP4基因座中的每一者处的第一多核苷酸和整合在ICP22基因座处的第二多核苷酸的经修饰单纯疱疹病毒基因组，所述第一多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列，所述第二多核苷酸含有可操作地连接于异源性启动子的第二人胶原多肽的编码序列。图1M显示包含ICP4(两个拷贝)、ICP22和UL41的编码序列的缺失，具有整合在ICP4基因座中的每一者处的第一多核苷酸和整合在UL41基因座处的第二多核苷酸的经修饰单纯疱疹病毒基因组，所述第一多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列，所述第二多核苷酸含有可操作地连接于异源性启动子的第二人胶原多肽的编码序列。图1N显示包含ICP4(两个拷贝)和UL41的编码序列的缺失，具有整合在ICP4基因座中的每一者处的第一多核苷酸和整合在UL41基因座处的第二多核苷酸的经修饰单纯疱疹病毒基因组，所述第一多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列，所述第二多核苷酸含有可操作地连接于异源性启动子的第二人胶原多肽的编码序列。

图2A-图2B显示携带人胶原7(COL7)表达盒的复制缺陷性单纯疱疹1型病毒的示意图。图2A显示病毒“KCA211”的示意图。图2B显示病毒“SAR-COL7”的示意图。

图3A-图3B显示用KCA211或SAR-COL7在所指示MOI下感染的HaCaT细胞中的人COL7表达。图3A显示用KCA211或SAR-COL7在所指示MOI下感染的HaCaT细胞中的人COL7表达，如通过qPCR所评估。数据显示为在相对于GAPDH加以归一化之后，相对于SAR-COL7的倍数变化。图3B显示未感染HaCaT细胞或用KCA211或SAR-COL7在所指示MOI下感染的HaCaT细胞中的人COL7表达，如通过蛋白质印迹分析所评估。

图4A-图4B显示模拟感染的从健康患者分离的原代人细胞(正常)以及模拟或SAR-COL7感染的从罹患隐性营养不良性大疱性表皮松解(RDEB)的患者分离的原代人细胞中的人COL7表达的免疫荧光图像。图4A显示模拟感染的野生型和RDEB原代人角质化细胞中或用SAR-COL7在所指示感染复数(MOI)下感染的RDEB原代人角质化细胞中的人COL7表达。图4B显示模拟感染的野生型和RDEB原代人纤维母细胞中或用SAR-COL7在所指示MOI下感染的RDEB原代人纤维母细胞中的人COL7表达。

图5A-图5B显示对模拟感染的从健康患者分离的原代人细胞以及模拟或SAR-COL7感染的从罹患隐性营养不良性大疱性表皮松解(EB)的患者分离的原代人细胞中的人COL7表达的定量PCR分析。图5A显示模拟感染的野生型(N-HDK)和RDEB(EB-HDK)原代人角质化细胞中或用SAR-COL7在所指示MOI下感染的RDEB原代人角质化细胞中的人COL7表达。COL7表达显示为相比于模拟感染的野生型原代人角质化细胞的相对倍数变化。图5B显示模拟感染的野生型(N-HDF)和RDEB(EB-HDF)原代人纤维母细胞中或用SAR-COL7在所指示MOI下感染的RDEB原代人纤维母细胞中的人COL7表达。COL7表达显示为相比于模拟感染的野生型原代人纤维母细胞的相对倍数变化。

图6A-图6B显示未感染(对照)或SAR-COL7感染的RDEB原代人角质化细胞对微孔板的未处理(塑料)或经处理孔的细胞粘附。图6A显示对未处理孔(塑料)或用递增浓度的大鼠尾胶原1处理的孔的细胞粘附。图6B显示对未处理孔(塑料)或用递增浓度的人血浆纤连蛋白处理的孔的细胞粘附。

图7显示在用SAR-COL7感染的RDEB原代人角质化细胞和纤维母细胞构建的器官型培养物中，在第5天时在基底膜区(BMZ)处，人COL7表达和沉积的代表性免疫荧光图像。角质化细胞与纤维母细胞两者均在培养物构建之后在所指示MOI下加以原位感染。

图8A-图8D显示在未感染小鼠皮肤(对照)中或在局部或真皮内递送SAR-COL7之后在小鼠皮肤中观察到的人COL7A1转录物和基因组水平，如通过qPCR所评估。误差棒代表SEM。图8A显示在感染之后第3天，小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图8B显示在感染之后第3天，小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。图8C显示在感染之后第6天，小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图8D显示在感染之后第6天，小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。

图9A-图9B显示在递送SAR-COL7之后，小鼠皮肤中的人COL7表达的代表性免疫荧光图像。图9A显示在真皮内递送SAR-COL7之后，小鼠皮肤中的人COL7表达的代表性免疫荧光图像。图9B显示在局部递送SAR-COL7之后，小鼠皮肤中的人COL7表达的代表性免疫荧光图像。

图10A-图10B显示在真皮内递送媒介物、SAR-COL7或KCA211之后在BALB/c小鼠皮肤中观察到的人COL7A1转录物和基因组水平，如通过qPCR所评估。图10A显示BALB/c小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图10B显示BALB/c小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。

图11A-图11B显示在高剂量真皮内递送HSV-GFP(GFP对照)或SAR-COL7之后，在亚效小鼠皮肤中的每个注射部位处观察到的人COL7A1转录物和基因组水平，如通过qPCR所评估。每个棒条代表在所指示时间点的单一样品。图11A显示亚效小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图11B显示亚效小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。

图12A-图12B显示在高剂量真皮内递送HSV-GFP(GFP对照)或SAR-COL7之后，亚效小鼠皮肤中的人COL7表达的代表性免疫荧光图像。图12A显示由亚效小鼠1(在第3天收集)获得的在10倍和20倍放大下的对照(GFP)和SAR-COL7免疫荧光成像。图12B显示由亚效小鼠2和亚效小鼠3(在第7天收集)获得的SAR-COL7免疫荧光成像。图代表用10倍透镜获得的16个视野的平铺图像，捕获了整个皮肤截面。

图13显示来自亚效小鼠1、2和3(在第3和3天收集)的经H&E染色样品。样品取自未处理亚效小鼠皮肤以及在真皮内递送HSV-GFP或SAR-COL7之后的亚效小鼠皮肤。

图14A-图14B显示在真皮内递送SAR-COL7之后，亚效小鼠皮肤中的人COL7表达的代表性电子显微照片图像。致密层是穿过图像的中央的所指示暗带；黑点是人COL7l的经染色NC结构域，蓝色箭号指示锚定原纤维的形成。图14A显示用对人COL7的NC2结构域具有特异性的抗体(LH24)染色的受感染亚效小鼠皮肤的电子显微照片图像。图14B显示用对人COL7的NC1结构域具有特异性的抗体(NP185)染色的受感染亚效小鼠皮肤的电子显微照片图像。

图15A-图15B显示在低剂量真皮内递送SAR-COL7之后，在亚效小鼠皮肤中的每个注射部位处观察到的人COL7A1转录物和基因组水平，如通过qPCR所评估。每个棒条代表在所指示时间点的单一样品。图15A显示亚效小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图15B显示亚效小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。

图16显示在低剂量真皮内递送SAR-COL7之后，亚效小鼠皮肤(来自小鼠1)中的人COL7表达的代表性免疫荧光图像。

图17A-图17C显示在用编码单独COL1A1(插入ICP4基因座中)或COL1A1和COL1A2(分别插入ICP4和ICP22基因座中)的HSV的所指示克隆感染的Vero细胞的情况下的人COL1A1和COL1A2核酸和蛋白质分析。图17A显示在用所指示HSV克隆感染之后5天，存在于Vero细胞中的人COL1A1转录物的水平，如通过qRT-PCR分析所测定。呈现两个平行测定的数据±SEM。图17B显示在用所指示HSV克隆感染之后5天，存在于Vero细胞中的人COL1A2转录物的水平，如通过qRT-PCR分析所测定。呈现两个平行测定的数据±SEM。图17C显示在用如通过qRT-PCR确定的所指示COL1A1/COL1A2阳性克隆感染之后5天，Vero细胞中的人COL1A1和COL1A2蛋白表达的蛋白质印迹分析。未感染(模拟)Vero细胞用作阴性对照；GAPDH用作上样对照。

图18显示在用编码插入ICP4基因座中的COL1A1-IRES-COL1A2序列的HSV分离株(IRES-分离株6)感染之后5天，Vero细胞中的人COL1A1和COL1A2蛋白表达的蛋白质印迹分析。用不含有IRES构建体(无插入)的分离株进行的感染用作阴性对照；GAPDH用作上样对照。

图19A-图19B显示在用C3vec01感染的永生化人角质化细胞(HaCaTs)的情况下的人COL3核酸和蛋白质分析。图19A显示在用C3vec01在所指示MOI下感染之后，存在于永生化人角质化细胞(HK)中的人COL3A1转录物的水平。未感染(模拟)和HSV-mCherry感染(mCherry)细胞用作阴性对照。呈现两个平行测定的数据±SEM。图19B显示在用C3vec01在所指示MOI下感染之后48小时，永生化人角质化细胞中的人COL3蛋白表达的代表性免疫荧光图像。未感染(模拟)细胞用作阴性对照。

图20A-图20B显示在用C3vec01感染的永生化人真皮纤维母细胞(HDF)的情况下的人COL3核酸和蛋白质分析。图20A显示在用C3vec01在所指示MOI下感染之后，存在于永生化人真皮纤维母细胞(HDF)中的人COL3A1转录物的水平。未感染(模拟)和HSV-mCherry感染(mCherry)细胞用作阴性对照。呈现两个平行测定的数据±SEM。图20B显示在用C3vec01在所指示MOI下感染之后48小时，永生化人真皮纤维母细胞中的人COL3蛋白表达的代表性免疫荧光图像。未感染(模拟)细胞用作阴性对照。

图21A-图21D显示在用C3vec01在所指示MOI下感染的来源于两个不同供应商的老化原代人纤维母细胞(HDF)的情况下的人COL3核酸和蛋白质分析。图21A显示在用C3vec01在所指示MOI下感染之后，存在于从65岁女性患者或73岁男性患者收集的原代HDF(供应商1)中的人COL3A1转录物的水平。未感染(模拟)细胞用作阴性对照。呈现两个平行测定的数据±SEM。图21B显示在用C3vec01在所指示MOI下感染之后，从73岁男性患者收集的原代HDF(供应商1)中的人COL3A1蛋白表达的蛋白质印迹分析。未感染(模拟)细胞用作阴性对照；重组人COL3A1(rCOL3A1)用作阳性对照；GAPDH用作上样对照。图21C显示在用C3vec01在所指示MOI下感染之后，存在于从75岁女性患者或73岁男性患者收集的原代HDF(供应商2)中的人COL3A1转录物的水平。未感染(模拟)细胞用作阴性对照。呈现两个平行测定的数据±SEM。图21D显示在用C3vec01在所指示MOI下感染之后，从75岁女性患者收集的原代HDF(供应商2)中的人COL3A1蛋白表达的蛋白质印迹分析。未感染(模拟)细胞用作阴性对照；重组人COL3A1(rCOL3A1)用作阳性对照；GAPDH用作上样对照。

图22A-图22B显示在UV暴露后，在永生化人真皮纤维母细胞(HDF)的情况下的人COL3核酸和蛋白质分析。图22A显示在暴露于各种剂量和时间的UV光之后24小时，分泌至培养的HDF的上清液中的COL3的浓度，如通过ELISA所评估。从并行培养的非UV暴露(-UV)HDF收集的上清液用作对照。图22B显示在用C3vec01在所指示MOI下感染之后，存在于UV暴露的永生化人真皮纤维母细胞(HDF)中的人COL3A1转录物的水平。未感染(模拟)和HSV-mCherry感染(mCherry)细胞用作阴性对照。呈现两个平行测定的数据±SEM。

图23A-图23C显示在真皮内施加之后48小时，取自经对照或C3vec01处理的年轻(6-8周龄)和年老(约13月龄)C57BL/6小鼠的皮肤活检体的COL3核酸和蛋白质分析。图23A显示在真皮内施用C3vec01或媒介物对照之后48小时，存在于取自年轻和年老小鼠的皮肤活检体中的人COL3A1 DNA的水平，如通过qPCR分析所评估。图23B显示在真皮内施用C3vec01或媒介物对照之后48小时，存在于取自年轻和年老小鼠的皮肤活检体中的人COL3A1转录物的水平，如通过qRT-PCR分析所评估。对于qPCR和qRT-PCR分析中的每种条件，数据呈现为四个组织样品(两个平行测定/组织样品)的平均值±SEM。图23C显示在真皮内施用C3vec01之后48小时，取自年轻和年老小鼠的皮肤活检体中的人COL3表达的代表性免疫荧光图像。真皮内施用了单独媒介物的年轻小鼠用作阴性对照。DAPI染色用于使核显现。

图24A-图24B显示用所指示病毒分离株感染的Vero细胞中野生型(WT)人LamB3的表达。图24A显示受感染Vero细胞中野生型人LAMB3的表达，如通过qPCR分析所评估。图24B显示受感染Vero细胞中野生型人LamB3蛋白的表达，如通过蛋白质印迹所评估。

图25显示用所指示病毒分离株感染的Vero细胞中野生型(WT)或密码子优化(CO)人LamB3蛋白的表达，如通过蛋白质印迹所评估。未感染Vero细胞用作阴性对照。

图26显示用所指示病毒分离株感染的原代人角质化细胞中野生型(WT)或密码子优化(CO)人LamB3蛋白的表达，如通过蛋白质印迹所评估。未感染原代角质化细胞用作阴性对照。

图27A-图27C显示用所指示病毒分离株感染的Vero细胞中野生型(WT)和密码子优化(CO)人LamC2的表达。图27A显示受感染Vero细胞中野生型人LAMC2的表达，如通过qPCR分析所评估。图27B显示受感染Vero细胞中密码子优化人LAMC2的表达，如通过qPCR分析所评估。图27C显示受感染Vero细胞中野生型和密码子优化人LamC2蛋白的表达，如通过蛋白质印迹所评估。选择表达密码子优化LamC2的框示病毒分离株“LGA”用于进行额外实验。

图28A-图28C显示在所指示感染复数(MOI)下受感染的永生化原代人角质化细胞中从病毒分离株“LGA”表达的人LAMC2。图28A显示在用病毒分离株“LGA”在所指示MOI下感染之后，原代永生化人角质化细胞中的病毒基因组拷贝数。图28B显示在用病毒分离株“LGA”在所指示MOI下感染之后，原代永生化人角质化细胞中表达的密码子优化LAMC2的转录物水平。图28C显示在用病毒分离株“LGA”在所指示MOI下感染之后，原代永生化人角质化细胞中人LamC2蛋白的表达，如通过蛋白质印迹所评估。

图29A-图29D显示在真皮内施加之后72小时，取自经对照(媒介物)或HSV分离株“LGA”处理小鼠的皮肤活检体的LAMC2核酸和蛋白质分析。图29A显示经处理动物上的真皮内注射部位的示意图。图29B显示在真皮内施用HSV分离株LGA或媒介物对照之后72小时，存在于取自小鼠的皮肤活检体中的人LAMC2 DNA的水平，如通过qPCR分析所评估。图29C显示在真皮内施用HSV分离株LGA或媒介物对照之后72小时，存在于取自小鼠的皮肤活检体中的人LAMC2转录物的水平，如通过qRT-PCR分析所评估。对于qPCR和qRT-PCR分析中的每种条件，数据呈现为两个平行测定的平均值±SEM。图29D显示在真皮内施用HSV分离株LGA之后72小时，取自小鼠的皮肤活检体中的人LAMC2表达的代表性免疫荧光图像。真皮内施用单独媒介物的部位用作阴性对照。DAPI染色用于使核显现；pKal染色用于使小鼠层粘连蛋白-332显现。

具体实施方式

在一些实施方案中，本公开涉及编码一种或多种美容蛋白的重组核酸(例如重组疱疹病毒基因组)，以及这些重组核酸在用于将一种或多种美容蛋白递送至皮肤，诸如向皮肤上，向皮肤中和/或穿过皮肤(例如向真皮ECM)进行递送的病毒(例如在疱疹病毒)、组合物、制剂、药剂和/或方法中的用途。在一些实施方案中，本公开涉及编码一种或多种美容蛋白的重组核酸(例如重组疱疹病毒基因组)，以及这些重组核酸在用以增加、加强和/或补充一种或多种真皮ECM蛋白(例如一种或多种胶原蛋白)的病毒(例如在疱疹病毒)、组合物、制剂、药剂和/或方法中的用途。在一些实施方案中，本公开涉及编码一种或多种美容蛋白的重组核酸(例如重组疱疹病毒基因组)，以及这些重组核酸在处于美容性情形下(例如用以减轻一种或多种皮肤学老化征象)的病毒(例如在疱疹病毒)、组合物、制剂、药剂和/或方法中的用途。在一些实施方案中，本公开涉及包含重组疱疹病毒载体的组合物以及包括向哺乳动物的皮肤上，向哺乳动物的皮肤中和/或穿过哺乳动物的皮肤递送所述重组疱疹病毒载体的方法，其中所述重组疱疹病毒载体包含在哺乳动物细胞中可操作的启动子和被表达来在哺乳动物皮肤中实现美容作用的异源性核酸。异源性核酸可递送至哺乳动物的哺乳动物靶标皮肤细胞，包括使所述哺乳动物的表皮、真皮或皮下组织与包含重组疱疹病毒载体的组合物在向所述表皮、真皮或皮下组织上，向所述表皮、真皮或皮下组织中，和/或穿过所述表皮、真皮或皮下组织运送所述重组疱疹病毒载体，并且引入它在其中表达的所述靶标皮肤细胞中所凭借的条件下接触。在不希望受理论束缚下，据信向个体施用本文所述的重组核酸、病毒和/或制剂中的一者或多者将允许功能性真皮ECM蛋白(例如人胶原)在所述个体中的产生增加。此外，在不希望受理论束缚下，据信通过施用本文所述的重组核酸、病毒和/或制剂中的一者或多者来增加、加强和/或补充个体中美容蛋白的水平将导致以下中的至少一者：1)软组织的增强、加强和/或补充；2)皮肤品质、状况和/或外观的改进；3)皮肤中一种或多种浅表凹陷(例如皱纹)的减少；4)皮肤的纹理、光滑度、弹性和/或张力的改进；和/或5)一种或多种皮肤学老化征象的减轻。最后，在不希望受理论束缚下，据信本文所述的重组核酸、病毒、组合物和方法提供了一种用于在美容性环境中递送功能性美容蛋白的新型策略。

以下描述阐述示例性方法、参数等。然而，应认识到这种描述不意图作为对本公开的范围的限制，而是代之以作为对示例性实施方案的描述而提供。

I.一般性技术

本文中描述或参考的技术和程序通常由本领域技术人员所充分了解，并且通常由本领域技术人员使用常规方法加以采用，所述方法诸如像以下中描述的广泛利用的方法：Sambrook等,Molecular Cloning:A Laboratory Manual第3版(2001)Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.；Current Protocols in MolecularBiology(F.M.Ausubel等人编,(2003))；丛书Methods in Enzymology(Academic Press,Inc.)；PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor编(1995))；Harlow和Lane编(1988)；Oligonucleotide Synthesis(M.J.Gait编,1984)；Methods in Molecular Biology,Humana Press；Cell Biology:A Laboratory Notebook(J.E.Cellis编,1998)Academic Press；Animal Cell Culture(R.I.Freshney)编,1987)；Introduction to Cell and Tissue Culture(J.P.Mather和P.E.Roberts,1998)PlenumPress；Cell and Tissue Culture:Laboratory Procedures(A.Doyle,J.B.Griffiths和D.G.Newell编,1993-8)J.Wiley and Sons；Gene Transfer Vectors for MammalianCells(J.M.Miller和M.P.Calos编,1987)；PCR:The Polymerase Chain Reaction,(Mullis等人编,1994)；Short Protocols in Molecular Biology(Wiley and Sons,1999)。

II.定义

在详细描述本公开之前，应了解本公开不限于毫无疑问可变化的特定组合物或生物系统。还应了解本文所用的术语仅出于描述特定实施方案的目的，并且不意图具有限制性。

如本文所用，除非内容另外明确规定，否则单数形式“一个(种)(a/an)”和“这个(种)(the)”包括复数个(种)指示物。因此，举例来说，提及“一个(种)分子”任选地包括两个(种)或更多个(种)所述分子的组合，以此类推。

如本文所用，术语“和/或”可包括相关所列条目中的一者或多者的任何和所有组合。举例来说，术语“a和/或b”可指“单独a”、“单独b”、“a或b”或“a和b”；术语“a、b和/或c”可指“单独a”、“单独b”、“单独c”、“a或b”、“a或c”、“b或c”、“a、b或c”、“a和b”、“a和c”、“b和c”、或“a、b和c”；等。

如本文所用，术语“约”是指相应值的易于为本技术领域中的熟练人士所知的通常误差范围。在本文中提及“约”某一值或参数包括(并且描述)有关那个值或参数本身的实施方案。

应了解，本公开的方面和实施方案包括“包含”、“由……组成”以及“基本上由……组成”方面和实施方案。

如本文所用，术语“多核苷酸”“核酸序列”、“核酸”以及它们的变化形式对于以下各物来说将是通用的：多脱氧核糖核苷酸(含有2-脱氧-D-核糖)、多核糖核苷酸(含有D-核糖)、是嘌呤或嘧啶碱基的N-糖苷的任何其他类型的多核苷酸、以及含有非核苷酸骨架的其他聚合物，前提是所述聚合物以允许进行如见于DNA和RNA中的碱基配对和碱基堆积的构型含有核苷碱基。因此，这些术语包括已知类型的核酸序列修饰，例如用类似物对一个或多个天然存在的核苷酸的取代，以及核苷酸间修饰。

如本文所用，当将核酸与另一核酸序列放置成功能性关系时，所述核酸是“操作性地连接的”或“可操作地连接的”。举例来说，如果启动子或增强子影响编码序列的转录，那么所述启动子或增强子可操作地连接于所述序列；或如果使核糖体结合位点定位以便促进翻译，那么所述核糖体结合位点可操作地连接于编码序列。通常，“操作性地连接”或“可操作地连接”意指所连接的DNA序列是邻接的。

如本文所用，术语“载体”是指用于将异源性核酸引入细胞中以达成其表达或复制的离散元件。表达载体包括能够表达与调控序列诸如启动子区域操作性地连接的核酸的载体，所述调控序列能够实现所述核酸的表达。因此，表达载体可指在引入适当宿主细胞中后导致核酸的表达的DNA或RNA构建体，诸如质粒、噬菌体、重组病毒或其他载体。适当表达载体为本领域技术人员所熟知，并且包括可在真核细胞中复制的那些，以及保持游离的那些或整合至宿主细胞基因组中的那些。

如本文所用，“开放阅读框”或“ORF”是指编码蛋白质或多肽的一段连续DNA或RNA核酸。通常，核酸包含翻译起始信号或起始密码子诸如ATG或AUG，以及终止密码子。

如本文所用，“非翻译区”或“UTR”是指在开放阅读框的5’和/或3’末端的非翻译核酸。在多核苷酸中包括一个或多个UTR可影响所述多核苷酸的转录后调控、mRNA稳定性和/或翻译。

如本文所用，术语“转基因”是指在引入细胞中之后能够在适当条件下转录成RNA并翻译和/或表达的多核苷酸。在一些方面，它对它被引入其中的细胞赋予所需性质，或另外导致所需美容、治疗或诊断效果。

如本文所用，术语“多肽”、“蛋白质”和“肽”可互换使用，并且可指两个或更多个氨基酸的聚合物。

如本文所用，“受试者”、“宿主”或“个体”是指分类为哺乳动物的任何动物，包括人、家养动物和农场动物、以及动物园动物、运动动物或玩赏动物，诸如狗、马、猫、母牛，以及研究中使用的动物，诸如小鼠、大鼠、仓鼠、兔和非人灵长类动物等。在一些实施方案中，哺乳动物是人。

如本文所用，术语“药物制剂”或“药物组合物”是指呈容许一种或多种活性成分的生物活性有效的形式，并且不含有对组合物或制剂将施用的受试者具有不可接受毒性的额外组分的制剂。“药学上可接受的”赋形剂(例如媒介物、添加剂)是可合理地向受试者施用以提供所采用的一种或多种活性成分的有效剂量的那些。

如本文所用，“经皮肤施用”或“以经皮肤方式施用”是指通过使包含组合物的制剂直接地或以其他方式与受试者的皮肤的全部(“全身性”)或一部分(“局部”)接触来向受试者递送组合物。所述术语涵盖若干施用途径，包括但不限于局部和经皮。局部施用可用作一种用以将组合物递送至受试者的表皮或真皮或它们的特定层的手段。

如本文所用，“治疗”是指旨在在临床病变的过程期间改变所治疗的个体或细胞的天然过程的临床干预。合乎需要的治疗作用包括降低疾病/病症/缺陷进展的速率，改善或缓和疾病/病症/缺陷状态，以及缓解或改进预后。举例来说，如果一种或多种与皮肤学老化相关的症状得以减轻、缓和或消除，包括减少或消除皱纹，那么个体被成功“治疗”。

如本文所用，术语“延迟疾病/病症/缺陷的进展”是指推迟、阻碍、减缓、延缓、稳定和/或延后所述疾病/病症/缺陷(例如皮肤皱纹)的发展。视疾病/病症/缺陷的历史和/或所治疗的个体而定，这个延迟可具有不同时长或时间。如为本领域普通技术人员所显而易知，充分或显著延迟可实际上涵盖预防，因为个体不显现疾病/病症/缺陷。

III.重组核酸

本公开的某些方面涉及包含一种或多种编码美容蛋白的多核苷酸(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、十种或更多种等)的重组核酸(例如经分离重组核酸)。本文描述或本领域中已知的任何适合美容蛋白都可由本公开的多核苷酸编码，所述美容蛋白包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白、额外真皮ECM蛋白等。在一些实施方案中，美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中，美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。

在一些实施方案中，本公开涉及包含一种或多种编码胶原蛋白的多核苷酸(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、十种或更多种等)的重组核酸(例如经分离重组核酸)。在一些实施方案中，胶原蛋白是人胶原蛋白。在一些实施方案中，本公开涉及包含一种或多种编码同三聚胶原(例如同三聚人胶原，诸如人胶原3(例如包括三个COL3A1(COL3)多肽)或人胶原7(例如包含三个COL7A1(COL7)多肽))的多核苷酸的重组核酸。在一些实施方案中，本公开涉及包含一种或多种编码异三聚胶原(例如异三聚人胶原，诸如人胶原1(例如包含两个COL1A1(COL1-1)多肽和一个COL1A2(COL1-2)多肽)或人胶原4(例如包含两个COL4A1(COL4-1)多肽和一个COL4A2(COL4-2)多肽))的多核苷酸的重组核酸。在一些实施方案中，本公开涉及包含一种或多种编码同三聚胶原和异三聚胶原的多核苷酸的重组核酸(例如包含一种或多种编码人胶原1和人胶原3的多核苷酸的重组核酸)。在一些实施方案中，本公开涉及包含一种或多种编码人胶原1的多核苷酸的重组核酸。在一些实施方案中，本公开涉及包含一种或多种编码人胶原3的多核苷酸的重组核酸。

在一些实施方案中，本公开涉及包含编码第一多肽的第一多核苷酸的重组核酸，所述第一多肽包含第一美容蛋白(例如第一人胶原蛋白)。在一些实施方案中，第一多肽基本上由第一美容蛋白组成或由第一美容蛋白组成(例如基本上由第一人胶原蛋白组成或由第一人胶原蛋白组成)。在一些实施方案中，本公开涉及包含编码第一多肽的第一多核苷酸的重组核酸，所述第一多肽包含：第一美容蛋白(例如第一人胶原蛋白)、接头多肽以及另一美容蛋白(例如另一人胶原蛋白)。在一些实施方案中，第一美容蛋白和另一美容蛋白(例如第一人胶原蛋白和另一人胶原蛋白)是相同的。在一些实施方案中，第一美容蛋白和另一美容蛋白(例如第一人胶原蛋白和另一人胶原蛋白)是不同的。在一些实施方案中，接头多肽是可裂解接头多肽。

在一些实施方案中，本公开涉及包含编码第一多肽的第一多核苷酸的重组核酸，所述第一多肽包含第一美容蛋白(例如第一人胶原蛋白)，其中所述第一多核苷酸编码多顺反子mRNA，所述多顺反子mRNA包含：编码所述第一多肽的第一开放阅读框(ORF)、内部核糖体进入位点(IRES)、以及编码额外美容蛋白(例如额外人胶原蛋白)的第二ORF。在一些实施方案中，第一美容蛋白和额外美容蛋白(例如第一人胶原蛋白和额外人胶原蛋白)是相同的。在一些实施方案中，第一美容蛋白和额外美容蛋白(例如第一人胶原蛋白和额外人胶原蛋白)是不同的。

在一些实施方案中，本公开涉及重组核酸，所述重组核酸包含编码第一多肽的第一多核苷酸，所述第一多肽包含第一美容蛋白(例如第一人胶原蛋白)；以及编码第二美容蛋白(例如第二人胶原蛋白)的第二多核苷酸。在一些实施方案中，第一美容蛋白和第二美容蛋白(例如第一人胶原蛋白和第二人胶原蛋白)是相同的。在一些实施方案中，第一美容蛋白和第二美容蛋白(例如第一人胶原蛋白和第二人胶原蛋白)是不同的。

在一些实施方案中，重组核酸是载体。在一些实施方案中，重组核酸是病毒载体。在一些实施方案中，重组核酸是疱疹病毒载体。在一些实施方案中，重组核酸是单纯疱疹病毒扩增子。在一些实施方案中，重组核酸是重组疱疹病毒基因组。在一些实施方案中，重组核酸是重组单纯疱疹病毒基因组。在一些实施方案中，重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组。

编码美容蛋白的多核苷酸

编码胶原蛋白的多核苷酸

在一些实施方案中，本公开涉及一种包含一种或多种包含胶原基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何胶原基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码，所述胶原基因包括例如人胶原基因(参见例如NCBI基因标识符：1277、1278、1281、1282、1284、1291、1294、1308等)、小鼠胶原基因(参见例如NCBI基因标识符：12842、12843、12825、12826、12827、12833、12836、12821等)、黑猩猩胶原基因(参见例如NCBI基因标识符：104001053、455117、459815、452689、452661、450204、101056895、101058306等)、大鼠胶原基因(参见例如NCBI基因标识符：29393、84352、84032、290905、306628、294337、301012、294027等)、兔胶原基因(参见例如NCBI基因标识符：100347598、100008997、100009177、100358256、100358522、100343947、100356561、100339335等)等。鉴定来自额外物种的胶原基因同源物/直系同源物的方法为本领域普通技术人员所知，包括例如使用核酸序列比对程序诸如

blastn套件。在一些实施方案中，本公开的多核苷酸包含与本文描述或本领域中已知的任何胶原基因(和/或其编码序列)的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开的多核苷酸包含本文描述或本领域中已知的任何胶原基因的编码序列的密码子优化变体。在一些实施方案中，相较于相应非密码子优化野生型序列的异源性表达的稳定性和/或产率，胶原基因的编码序列的密码子优化变体的使用使所编码胶原蛋白在靶标细胞(诸如表皮和/或真皮的细胞)中的异源性表达(RNA和/或蛋白质)的稳定性和/或产率增加。可使用本领域中已知的用于针对在一种或多种靶标细胞(例如一种或多种人细胞)中的表达对序列进行密码子优化的任何适合方法，包括例如通过由Fath等人(PLoS One.2011年3月3日；6(3):e17596)描述的方法。

在一些实施方案中，本公开涉及一种或多种包含人胶原基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。本领域中已知的任何适合人胶原基因(包括其任何亚型)都可由本公开的核酸编码，所述人胶原基因包括例如COL1A1基因(参见例如NCBI基因标识符：1277；SEQ ID NO:1)、COL1A2基因(参见例如NCBI基因标识符：1278；SEQ ID NO:3)、COL2A1基因(参见例如NCBI基因标识符：1280)、COL3A1基因(参见例如NCBI基因标识符：1281；SEQ ID NO:5)、COL4A1基因(参见例如NCBI基因标识符：1282；SEQ ID NO:7)、COL4A2基因(参见例如NCBI基因标识符：1284)、COL4A3基因(参见例如NCBI基因标识符：1285)、COL4A4基因(参见例如NCBI基因标识符：1286)、COL4A5基因(参见例如NCBI基因标识符：1287)、COL4A6基因(参见例如NCBI基因标识符：1288)、COL5A1基因(参见例如NCBI基因标识符：1289)、COL5A2基因(参见例如NCBI基因标识符：1290)、COL5A3基因(参见例如NCBI基因标识符：50509)、COL6A1基因(参见例如NCBI基因标识符：1291；SEQID NO:9)、COL6A2基因(参见例如NCBI基因标识符：1292)、COL6A3基因(参见例如NCBI基因标识符：1293)、COL6A4基因(参见例如NCBI基因标识符：344875)、COL6A5基因(参见例如NCBI基因标识符：256076)、COL6A6基因(参见例如NCBI基因标识符：131873)、COL7A1基因(参见例如NCBI基因标识符：1294；SEQ ID NO:10)、COL8A1基因(参见例如NCBI基因标识符：1295)、COL9A1基因(参见例如NCBI基因标识符：1297)、COL9A2基因(参见例如NCBI基因标识符：1298)、COL9A3基因(参见例如NCBI基因标识符：1299)、COL10A1基因(参见例如NCBI基因标识符：1300)、COL11A1基因(参见例如NCBI基因标识符：1301)、COL11A2基因(参见例如NCBI基因标识符：1302)、COL12A1基因(参见例如NCBI基因标识符：1303)、COL13A1基因(参见例如NCBI基因标识符：1305)、COL14A1基因(参见例如NCBI基因标识符：7373)、COL15A1基因(参见例如NCBI基因标识符：1306)、COL16A1基因(参见例如NCBI基因标识符：1307)、COL17A1基因(参见例如NCBI基因标识符：1308；SEQ ID NO:12)、COL18A1基因(参见例如NCBI基因标识符：80781)、COL19A1基因(参见例如NCBI基因标识符：1310)、COL20A1基因(参见例如NCBI基因标识符：57642)、COL21A1基因(参见例如NCBI基因标识符：81578)、COL22A1基因(参见例如NCBI基因标识符：169044)、COL23A1基因(参见例如NCBI基因标识符：91522)、COL24A1基因(参见例如NCBI基因标识符：255631)、COL25A1基因(参见例如NCBI基因标识符：84570)、COL26A1基因(参见例如NCBI基因标识符：136227)、COL27A1基因(参见例如NCBI基因标识符：85301)、COL28A1基因(参见例如NCBI Gene ID:340267)等。在一些实施方案中，本公开的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)包含与本文描述或本领域中已知的任何人胶原基因(和/或其编码序列)的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)包含本文所述的任何人胶原基因的密码子优化变体。在一些实施方案中，相较于相应非密码子优化野生型序列的异源性表达的稳定性和/或产率，人胶原基因的密码子优化变体的使用使人胶原在靶标细胞(诸如人角质化细胞或纤维母细胞)中的异源性表达(RNA和/或蛋白质)的稳定性和/或产率增加。

在一些实施方案中，本公开的多核苷酸包含人COL1A1基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:1或SEQ ID NO:2的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:1或SEQ ID NO:2的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:1或SEQ ID NO:2的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:1或SEQ ID NO:2的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:1或SEQ ID NO:2的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000但少于4395个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:1或SEQ ID NO:2的核酸1-4392的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:1或SEQID NO:2的核酸1-4392的序列。

在一些实施方案中，本公开的多核苷酸包含人COL1A2基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:3或SEQ ID NO:4的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:3或SEQ ID NO:4的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:3或SEQ ID NO:4的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:3或SEQ ID NO:4的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:3或SEQ ID NO:4的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000但少于4101个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:3或SEQ ID NO:4的核酸1-4098的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:3或SEQID NO:4的核酸1-4098的序列。

在一些实施方案中，本公开的多核苷酸包含人COL3A1基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:5或SEQ ID NO:6的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:5或SEQ ID NO:6的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:5或SEQ ID NO:6的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:5或SEQ ID NO:6的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:5或SEQ ID NO:6的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000但少于4401个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:5或SEQ ID NO:6的核酸1-4398的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:5或SEQID NO:6的核酸1-4398的序列。

在一些实施方案中，本公开的多核苷酸包含人COL4A1基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:7或SEQ ID NO:8的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:7或SEQ ID NO:8的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:7或SEQ ID NO:8的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:7或SEQ ID NO:8的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:7或SEQ ID NO:8的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000、至少4500、至少5000但少于5010个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:7或SEQ ID NO:8的核酸1-5007的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQID NO:7或SEQ ID NO:8的核酸1-5007的序列。

在一些实施方案中，本公开的多核苷酸包含人COL6A1基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:9或SEQ ID NO:10的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:9或SEQ ID NO:10的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:9或SEQ ID NO:10的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:9或SEQ ID NO:10的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:9或SEQ ID NO:10的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000但少于3087个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:9或SEQ ID NO:10的核酸1-3084的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:9或SEQ ID NO:10的核酸1-3084的序列。

在一些实施方案中，本公开的多核苷酸包含人COL7A1基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:11或SEQ ID NO:12的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:11或SEQ ID NO:12的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:11或SEQ ID NO:12的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:11或SEQ ID NO:12的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:11或SEQ ID NO:12的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000、至少4500、至少5000、至少5500、至少6000、至少6500、至少7000、至少7500、至少8000、至少8500但少于8835个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:11或SEQ ID NO:12的核酸1-8832的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:11或SEQ ID NO:12的核酸1-8832的序列。

在一些实施方案中，本公开的多核苷酸包含人COL17A1基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:13或SEQ ID NO:14的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:13或SEQ ID NO:14的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:13或SEQ ID NO:14的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:13或SEQ ID NO:14的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:13或SEQ ID NO:14的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000但少于4494个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:13或SEQ ID NO:14的核酸1-4491的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:13或SEQ ID NO:14的核酸1-4491的序列。

在一些实施方案中，本公开的编码一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)的多核苷酸与选自SEQ ID NO:1-14的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些实施方案中，本公开的编码一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)的多核苷酸包含选自SEQ ID NO:1-14的序列。

编码纤连蛋白的多核苷酸

在一些实施方案中，本公开涉及一种包含一种或多种包含纤连蛋白基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何纤连蛋白基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码，所述纤连蛋白基因包括例如人纤连蛋白基因(参见例如NCBI基因标识符：2335)、小鼠纤连蛋白基因(参见例如NCBI基因标识符：14268)、黑猩猩纤连蛋白基因(参见例如NCBI基因标识符：459926)、大鼠纤连蛋白基因(参见例如NCBI基因标识符：25661)、兔纤连蛋白基因(参见例如NCBI基因标识符：100328589)等。鉴定来自额外物种的纤连蛋白基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的多核苷酸包含与本文描述或本领域中已知的任何纤连蛋白基因(和/或其编码序列)的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含本文描述或本领域中已知的任何纤连蛋白基因(和/或其编码序列)的密码子优化变体。

在一些实施方案中，本公开涉及一种或多种包含人纤连蛋白基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。在一些实施方案中，本公开的多核苷酸包含人FN1基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:35或SEQ ID NO:36的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:35或SEQ ID NO:36的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:35或SEQ ID NO:36的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:35或SEQ ID NO:36的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:35或SEQ ID NO:36的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000、至少约4500、至少约5000、至少约5500、至少约6000、至少约6500、至少约7000但少于7434个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:35或SEQ ID NO:36的核酸1-7431的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:35或SEQID NO:36的核酸1-7431的序列。

编码弹性蛋白的多核苷酸

在一些实施方案中，本公开涉及一种包含一种或多种包含弹性蛋白基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何弹性蛋白基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码，所述弹性蛋白基因包括例如人弹性蛋白基因(参见例如NCBI基因标识符：2006)、小鼠弹性蛋白基因(参见例如NCBI基因标识符：13717)、黑猩猩弹性蛋白基因(参见例如NCBI基因标识符：463943)、大鼠弹性蛋白基因(参见例如NCBI基因标识符：25043)、兔弹性蛋白基因(参见例如NCBI基因标识符：100344271)等。鉴定来自额外物种的弹性蛋白基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的多核苷酸包含与本文描述或本领域中已知的任何弹性蛋白基因(和/或其编码序列)的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含本文描述或本领域中已知的任何弹性蛋白基因(和/或其编码序列)的密码子优化变体。

在一些实施方案中，本公开涉及一种或多种包含人弹性蛋白基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。在一些实施方案中，本公开的多核苷酸包含人ELN基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:37或SEQ ID NO:38的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:37或SEQ ID NO:38的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:37或SEQ ID NO:38的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:37或SEQ ID NO:38的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:37或SEQ ID NO:38的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250但少于2361个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:37或SEQ ID NO:38的核酸1-2358的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:37或SEQ ID NO:38的核酸1-2358的序列。

编码光蛋白聚糖蛋白的多核苷酸

在一些实施方案中，本公开涉及一种包含一种或多种包含光蛋白聚糖基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何光蛋白聚糖基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码，所述光蛋白聚糖基因包括例如人光蛋白聚糖基因(参见例如NCBI基因标识符：4060)、小鼠光蛋白聚糖基因(参见例如NCBI基因标识符：17022)、黑猩猩光蛋白聚糖基因(参见例如NCBI基因标识符：452119)、大鼠光蛋白聚糖基因(参见例如NCBI基因标识符：81682)、兔光蛋白聚糖基因(参见例如NCBI基因标识符：100008665)等。鉴定来自额外物种的光蛋白聚糖基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的多核苷酸包含与本文描述或本领域中已知的任何光蛋白聚糖基因(和/或其编码序列)的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含本文描述或本领域中已知的任何光蛋白聚糖基因(和/或其编码序列)的密码子优化变体。

在一些实施方案中，本公开涉及一种或多种包含人光蛋白聚糖基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。在一些实施方案中，本公开的多核苷酸包含人LUM基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:39或SEQ ID NO:40的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:39或SEQ ID NO:40的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:39或SEQ ID NO:40的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:39或SEQ ID NO:40的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:39或SEQ ID NO:40的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000但少于1017个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:39或SEQ ID NO:40的核酸1-1014的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:39或SEQ ID NO:40的核酸1-1014的序列。

编码玻连蛋白和玻连蛋白受体蛋白的多核苷酸

在一些实施方案中，本公开涉及一种包含一种或多种包含玻连蛋白或玻连蛋白受体基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何玻连蛋白或玻连蛋白受体基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码，所述玻连蛋白或玻连蛋白受体基因包括例如人玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符：7448和3685)、小鼠玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符：22370和16410)、黑猩猩玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符：738261和459807)、大鼠玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符：29169和257645)、兔玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符：100009128和100008956)等。鉴定来自额外物种的玻连蛋白或玻连蛋白受体基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的多核苷酸包含与本文描述或本领域中已知的任何玻连蛋白或玻连蛋白受体基因(和/或其编码序列)的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含本文描述或本领域中已知的任何玻连蛋白或玻连蛋白受体基因(和/或其编码序列)的密码子优化变体。

在一些实施方案中，本公开涉及一种或多种包含人玻连蛋白或玻连蛋白受体基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。在一些实施方案中，本公开的多核苷酸包含人VTN基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:41或SEQ ID NO:42的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:41或SEQID NO:42的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:41或SEQ ID NO:42的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:41或SEQ ID NO:42的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:41或SEQ ID NO:42的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少约1250但少于1437个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:41或SEQ ID NO:42的核酸1-1034的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:41或SEQ ID NO:42的核酸1-1034的序列。

编码层粘连蛋白的多核苷酸

在一些实施方案中，本公开涉及一种包含一种或多种包含层粘连蛋白基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何层粘连蛋白基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码，所述层粘连蛋白基因包括例如人层粘连蛋白基因(参见例如NCBI基因标识符：284217、3908、3909、3910、3911、3912、3913、3914、3915、3918和10319)、小鼠层粘连蛋白基因(参见例如NCBI基因标识符：16774、16780和16782)、黑猩猩层粘连蛋白基因(参见例如NCBI基因标识符：455339、469668和457571)、大鼠层粘连蛋白基因(参见例如NCBI基因标识符：307582、305078和192362)、兔层粘连蛋白基因(参见例如NCBI基因标识符：100346886和100342905)等。鉴定来自额外物种的层粘连蛋白基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的多核苷酸包含与本文描述或本领域中已知的任何层粘连蛋白基因(和/或其编码序列)的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含本文描述或本领域中已知的任何层粘连蛋白基因(和/或其编码序列)的密码子优化变体。

在一些实施方案中，本公开涉及一种或多种包含人层粘连蛋白基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)，所述人层粘连蛋白基因诸如是人LAMA1基因(参见例如NCBI基因标识符：284217)、人LAMA2基因(参见例如NCBI基因标识符：3908)、人LAMA3基因(参见例如NCBI基因标识符：3909)、人LAMA4基因(参见例如NCBI基因标识符：3910)、人LAMA5基因(参见例如NCBI基因标识符：3911)、人LAMB1基因(参见例如NCBI基因标识符：3912)、人LAMB2基因(参见例如NCBI基因标识符：3913)、人LAMB3基因(参见例如NCBI基因标识符：3914)、人LAMC1基因(参见例如NCBI基因标识符：3915)、人LAMC2基因(参见例如NCBI基因标识符：3918)、或人LAMC3基因(参见例如NCBI基因标识符：10319)。

在一些实施方案中，本公开的多核苷酸包含人LAMA3基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:43或SEQ ID NO:44的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:43或SEQ ID NO:44的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:43或SEQ ID NO:44的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:43或SEQ ID NO:44的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:43或SEQ ID NO:44的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000、至少约4500、至少约5000但少于5175个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:43或SEQ ID NO:44的核酸1-5172的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:43或SEQ ID NO:44的核酸1-5172的序列。

在一些实施方案中，本公开的多核苷酸包含人LAMB3基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:45或SEQ ID NO:46的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:45或SEQ ID NO:46的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:45或SEQ ID NO:46的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:45或SEQ ID NO:46的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:45或SEQ ID NO:46的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500但少于3519个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:45或SEQ ID NO:46的核酸1-3516的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:45或SEQID NO:46的核酸1-3516的序列。

在一些实施方案中，本公开的多核苷酸包含人LAMC2基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:47或SEQ ID NO:48的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ IDNO:47或SEQ ID NO:48的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:47或SEQ ID NO:48的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:47或SEQ ID NO:48的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:47或SEQ ID NO:48的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500但少于3582个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:47或SEQ ID NO:48的核酸1-3579的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:47或SEQID NO:48的核酸1-3579的序列。

编码神经调质蛋白的多核苷酸

在一些实施方案中，本公开涉及一种包含一种或多种包含神经调质基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何神经调质基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码，所述神经调质基因包括例如肉毒梭菌(clostridium botulinum)神经调质基因(参见例如NCBI基因标识符：5185061和39483740)等。鉴定来自额外物种的神经调质基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的多核苷酸包含与本文描述或本领域中已知的任何神经调质基因(和/或其编码序列)的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含本文描述或本领域中已知的任何神经调质基因(和/或其编码序列)的密码子优化变体。

在一些实施方案中，本公开涉及一种或多种包含肉毒梭菌神经调质基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。

在一些实施方案中，本公开的多核苷酸包含肉毒梭菌botA基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:49或SEQ IDNO:50的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:49或SEQ ID NO:50的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:49或SEQ ID NO:50的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:49或SEQ ID NO:50的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:49或SEQ ID NO:50的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少约1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500但少于3891个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:49或SEQ ID NO:50的核酸1-3888的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:49或SEQ ID NO:50的核酸1-3888的序列。

在一些实施方案中，本公开的多核苷酸包含肉毒梭菌botB基因的编码序列(或其密码子优化变体)。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:51或SEQ IDNO:52的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:51或SEQ ID NO:52的序列。

在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:51或SEQ ID NO:52的序列的5’截短形式、3’截短形式或片段。在一些实施方案中，SEQ ID NO:51或SEQ ID NO:52的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:51或SEQ ID NO:52的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少约1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500但少于3876个连续核苷酸的多核苷酸。在一些实施方案中，本公开的多核苷酸包含与SEQ ID NO:51或SEQ ID NO:52的核酸1-3873的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含SEQ ID NO:51或SEQ ID NO:52的核酸1-3873的序列。

编码原纤蛋白的多核苷酸

在一些实施方案中，本公开涉及一种包含一种或多种包含原纤蛋白基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何原纤蛋白基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码，所述原纤蛋白基因包括例如人原纤蛋白基因(参见例如NCBI基因标识符：2200、2201和84467)、小鼠原纤蛋白基因(参见例如NCBI基因标识符：14118和14119)、黑猩猩原纤蛋白基因(参见例如NCBI基因标识符：453411、471621和455669)、大鼠原纤蛋白基因(参见例如NCBI基因标识符：83727和689008)、兔原纤蛋白基因(参见例如NCBI基因标识符：100350931、100357126和100359336)等。鉴定来自额外物种的原纤蛋白基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的多核苷酸包含与本文描述或本领域中已知的任何原纤蛋白基因(和/或其编码序列)的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，本公开的多核苷酸包含本文描述或本领域中已知的任何原纤蛋白基因(和/或其编码序列)的密码子优化变体。

在一些实施方案中，本公开涉及一种或多种包含人原纤蛋白基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)，所述人原纤蛋白基因诸如是人FBN1基因(参见例如NCBI基因标识符：2200)、人FBN2基因(参见例如NCBI基因标识符：2201)、或人FBN3基因(参见例如NCBI基因标识符：84467)。

示例性多核苷酸

在一些实施方案中，本公开的编码一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)的多核苷酸与选自SEQ ID NO:1-14或35-52的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些实施方案中，本公开的编码一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)的多核苷酸包含选自SEQ ID NO:1-14或35-52的序列。

在一些实施方案中，本公开的编码一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)的多核苷酸与选自SEQ ID NO:1-14、35-38或43-48的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。在一些实施方案中，本公开的编码一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)的多核苷酸包含选自SEQ ID NO:1-14、35-38或43-48的序列。

本公开的编码美容蛋白(例如人胶原蛋白)的多核苷酸可还编码额外编码序列和非编码序列。额外编码序列和非编码序列的实例可包括但不限于编码额外多肽标签(例如与美容蛋白同框编码以产生融合蛋白)的序列、内含子(例如天然、经修饰或异源性内含子)、5’和/或3’UTR(例如天然、经修饰或异源性5’和/或3’UTR)等。适合多肽标签的实例可包括但不限于纯化标签，诸如his标签、flag标签、麦芽糖结合蛋白和谷胱甘肽-S-转移酶标签；检测标签，诸如可以光度测量方式检测的标签(例如绿色荧光蛋白、红色荧光蛋白等)；以及具有可检测酶活性的标签(例如碱性磷酸酶等)；含有分泌序列、信号序列、前导序列和/或稳定化序列的标签；蛋白酶裂解位点(例如弗林蛋白酶(furin)裂解位点、TEV裂解位点、凝血酶(Thrombin)裂解位点等)等的任何组合。在一些实施方案中，5’和/或3’UTR使多核苷酸的稳定性、定位和/或翻译效率增加。在一些实施方案中，5’和/或3’UTR使蛋白质表达的水平和/或持续时间改进。在一些实施方案中，5’和/或3’UTR包括可阻断或降低脱靶表达(例如抑制在特定细胞类型(例如神经元细胞)中，在细胞周期中的特定时间，在特定发育阶段等情况下的表达)的元件(例如一个或多个miRNA结合位点等)。在一些实施方案中，5’和/或3’UTR包括可使美容蛋白在特定细胞类型(诸如人角质化细胞和/或纤维母细胞)中的表达增强的元件(例如一个或多个miRNA结合位点等)。

在一些实施方案中，本公开的编码美容蛋白(例如人胶原蛋白)的多核苷酸可操作地连接于一种或多种(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、十种或更多种等)调控序列。术语“调控序列”可包括增强子、绝缘子、启动子和其他表达控制元件(例如多腺苷酸化信号)。可使用本领域中已知的任何一种或多种适合增强子，包括例如来自哺乳动物基因(诸如球蛋白、弹性蛋白酶、白蛋白、α-胎蛋白、胰岛素等)的增强子序列、来自真核细胞病毒的增强子序列(诸如在复制起点的后侧上的SV40增强子(bp100-270)、巨细胞病毒早期启动子增强子、在复制起点的后侧上的多瘤病毒增强子、腺病毒增强子等)以及它们的任何组合。可使用本领域中已知的任何一种或多种适合绝缘子，包括例如HSV染色质边界(CTRL/CTCF结合/绝缘子)元件CTRL1和/或CTRL2、鸡过敏位点4绝缘子(cHS4)、人HNRPA2B1—CBX3遍在性染色质开放元件(UCOE)、来自人干扰素β基因(IFNB1)的骨架/基质附着区(S/MAR)以及它们的任何组合。可使用本领域中已知的任何适合启动子(例如适于在哺乳动物宿主细胞中进行的转录)，包括例如从病毒(诸如多瘤病毒、鸡痘病毒、腺病毒(诸如腺病毒2)、牛乳头状瘤病毒、禽肉瘤病毒、巨细胞病毒、逆转录病毒、乙型肝炎病毒、猿猴病毒40(SV40)等)的基因组获得的启动子、来自异源性哺乳动物基因的启动子(诸如肌动蛋白启动子(例如β-肌动蛋白启动子)、泛素启动子(例如泛素C(UbC)启动子)、磷酸甘油酸激酶(PGK)启动子、免疫球蛋白启动子，来自热激启动子等)、来自同源性哺乳动物基因的启动子(例如天然人胶原、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白、层粘连蛋白和/或原纤蛋白启动子)、合成启动子(诸如CAGG启动子)以及它们的任何组合，前提是所述启动子可与宿主细胞相容。调控序列可包括指导核酸的组成型表达的那些，以及组织特异性调控序列和/或诱导型或阻遏型序列。

在一些实施方案中，本公开的编码美容蛋白(例如人胶原蛋白)的多核苷酸可操作地连接于一种或多种异源性启动子。在一些实施方案中，一种或多种异源性启动子是组成型启动子、组织特异性启动子、时间启动子、空间启动子、诱导型启动子和阻遏型启动子中的一者或多者。在一些实施方案中，一种或多种异源性启动子是人巨细胞病毒(HCMV)立即早期启动子、人延伸因子-1(EF1)启动子、人β-肌动蛋白启动子、人UbC启动子、人PGF启动子、合成CAGG启动子以及它们的任何组合中的一者或多者。在一些实施方案中，本公开的编码美容蛋白(例如人胶原蛋白)的多核苷酸可操作地连接于HCMV启动子。

在一些实施方案中，本公开的多核苷酸不包含胶原α-1(VII)链多肽(COL7)(例如编码胶原α-1(VII)链多肽(COL7)的转基因)的编码序列。在一些实施方案中，本公开的多核苷酸不包含赖氨酰基羟化酶3多肽(LH3)(例如编码赖氨酰基羟化酶3多肽(LH3)的转基因)的编码序列。在一些实施方案中，本公开的多核苷酸不包含角蛋白(Keratin)I型细胞骨架17多肽(KRT17)(例如编码角蛋白I型细胞骨架17多肽(KRT17)的转基因)的编码序列。在一些实施方案中，本公开的多核苷酸不包含转谷氨酰胺酶(TGM)多肽(例如人转谷氨酰胺酶多肽，诸如人TGM1多肽)(例如编码转谷氨酰胺酶(TGM)多肽(例如人转谷氨酰胺酶多肽，诸如人TGM1多肽)的转基因)的编码序列。在一些实施方案中，本公开的多核苷酸不包含层粘连蛋白亚单位β-3多肽(LAMB3)(例如编码层粘连蛋白亚单位β-3多肽(LAMB3)的转基因)的编码序列。在一些实施方案中，本公开的多核苷酸不包含胶原α-1(VII)链多肽、赖氨酰基羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的任何嵌合多肽(例如编码胶原α-1(VII)链多肽、赖氨酰基羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的任何嵌合多肽的转基因)的编码序列。在一些实施方案中，本公开的多核苷酸不包含胶原α-1(VII)链多肽、赖氨酰基羟化酶3多肽、角蛋白I型细胞骨架17多肽、转谷氨酰胺酶(TGM)多肽(例如人转谷氨酰胺酶多肽，诸如人TGM1多肽)、层粘连蛋白亚单位β-3(LAMB3)多肽(例如人LamB3多肽)和/或它们的任何嵌合多肽(例如编码胶原α-1(VII)链多肽、赖氨酰基羟化酶3多肽、角蛋白I型细胞骨架17多肽、转谷氨酰胺酶(TGM)多肽(例如人转谷氨酰胺酶多肽，诸如人TGM1多肽)、层粘连蛋白亚单位β-3(LAMB3)多肽(例如人LamB3多肽)和/或它们的任何嵌合多肽的转基因)的编码序列。

美容蛋白

胶原蛋白

在一些实施方案中，本公开涉及一种或多种编码全长胶原蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何胶原蛋白都可由本公开的多核苷酸编码，所述胶原蛋白包括例如人胶原蛋白(参见例如UniProt登录号P02452、P08123、P02461、P02462、P08572、P12109、Q02388、Q9UMD9等)、小鼠胶原蛋白(参见例如UniProt登录号P11087、Q01149、P08121、P02463、P08122、Q04857、Q63870、Q07563等)、黑猩猩胶原蛋白(参见例如UniProt登录号A0A2I3SM98、A0A2J8L483、H2QJ46、K7C8P4、K7C8W0、A0A2J8M8U9、H2QMJ5、H2Q2J4等)、大鼠胶原蛋白(参见例如UniProt登录号P02454、P02466、P13941、P02466、F1M6Q3、D3ZUL3、D3ZE04、D3ZE04等)、兔胶原蛋白(参见例如UniProt登录号G1T4A5、Q28668、G1T8J0、G1U9R7、G1T548、G1T380、G1T548等)等。鉴定来自额外物种的胶原蛋白同源物/直系同源物的方法为本领域普通技术人员所知，包括例如使用氨基酸序列比对程序诸如

blastp套件或OrthoDB。在一些实施方案中，本公开的胶原多肽包含与本文描述或本领域中已知的任何胶原多肽的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开涉及一种或多种编码人胶原蛋白的多核苷酸。本领域中已知的任何适合人胶原蛋白都可由本公开的多核苷酸编码，所述人胶原蛋白包括例如胶原α-1(I)链多肽(COL1-1)(参见例如UniProt登录号P02452；SEQ ID NO:15)、胶原α-2(I)链多肽(COL1-2)(参见例如UniProt登录号P08123；SEQ ID NO:16)、胶原α-1(II)链多肽(COL2)(参见例如UniProt登录号P02458)、胶原α-1(III)链多肽(COL3)(参见例如UniProt登录号P2461；SEQ ID NO:17)、胶原α-1(IV)链多肽(COL4-1)(参见例如UniProt登录号P02462；SEQ ID NO:18)、胶原α-2(IV)链多肽(COL4-2)(参见例如UniProt登录号P08572)、胶原α-3(IV)链多肽(COL4-3)(参见例如UniProt登录号Q01955)、胶原α-4(IV)链多肽(COL4-4)(参见例如UniProt登录号P53420)、胶原α-5(IV)链多肽(COL4-5)(参见例如UniProt登录号29400)、胶原α-6(IV)链多肽(COL4-6)(参见例如UniProt登录号Q14031)、胶原α-1(V)链多肽(COL5-1)(参见例如UniProt登录号P20908)、胶原α-2(V)链多肽(COL5-2)(参见例如UniProt登录号P05997)、胶原α-3(V)链多肽(COL5-3)(参见例如UniProt登录号P25940)、胶原α-1(VI)链多肽(COL6-1)(参见例如UniProt登录号P12109；SEQ ID NO:19)、胶原α-2(VI)链多肽(COL6-2)(参见例如UniProt登录号P12110)、胶原α-3(VI)链多肽(COL6-3)(参见例如UniProt登录号P12111)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)(参见例如UniProt登录号A8TX70)、胶原α-6(VI)链多肽(COL6-6)(参见例如UniProt登录号A6NMZ7)、胶原α-1(VII)链多肽(COL7)(参见例如UniProt登录号Q02388；SEQID NO:20)、胶原α-1(VIII)链多肽(COL8)(参见例如UniProt登录号P27658)、胶原α-1(IX)链多肽(COL9-1)(参见例如UniProt登录号P20849)、胶原α-2(IX)链多肽(COL9-2)(参见例如UniProt登录号Q14055)、胶原α-3(IX)链多肽(COL9-3)(参见例如UniProt登录号Q14050)、胶原α-1(X)链多肽(COL10)(参见例如UniProt登录号Q03692)、胶原α-1(XI)链多肽(COL11-1)(参见例如UniProt登录号P12107)、胶原α-2(XI)链多肽(COL11-2)(参见例如UniProt登录号P13942)、胶原α-1(XII)链多肽(COL12)(参见例如UniProt登录号Q99715)、胶原α-1(XIII)链多肽(COL13)(参见例如UniProt登录号Q5TAT6)、胶原α-1(XIV)链多肽(COL14)(参见例如UniProt登录号Q05707)、胶原α-1(XV)链多肽(COL15)(参见例如UniProt登录号P39059)、胶原α-1(XVI)链多肽(COL16)(参见例如UniProt登录号Q07092)、胶原α-1(XVII)链多肽(COL17)(参见例如UniProt登录号Q9UMD9；SEQ ID NO:21)、胶原α-1(XVIII)链多肽(COL18)(参见例如UniProt登录号P39060)、胶原α-1(XIX)链多肽(COL19)(参见例如UniProt登录号Q14993)、胶原α-1(XX)链多肽(COL20)(参见例如UniProt登录号Q9P218)、胶原α-1(XXI)链多肽(COL21)(参见例如UniProt登录号Q96P44)、胶原α-1(XXII)链多肽(COL22)(参见例如UniProt登录号Q8NFW1)、胶原α-1(XXIII)链多肽(COL23)(参见例如UniProt登录号Q86Y22)、胶原α-1(XXIV)链多肽(COL24)(参见例如UniProt登录号Q17RW2)、胶原α-1(XXV)链多肽(COL25)(参见例如UniProt登录号Q9BXS0)、胶原α-1(XXVI)链多肽(COL26)(参见例如UniProt登录号Q96A83)、胶原α-1(XXVII)链多肽(COL27)(参见例如UniProt登录号Q8IZC6)、胶原α-1(XXVIII)链多肽(COL28)(参见例如UniProt登录号Q2UY09)等。在一些实施方案中，本公开的多核苷酸包含与编码本文描述或本领域中已知的任何人胶原多肽的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。鉴定额外人胶原或胶原样多肽同源物/直系同源物的方法为本领域普通技术人员所知，包括例如使用氨基酸序列比对程序诸如

blastp套件或OrthoDB。

在一些实施方案中，本公开的多核苷酸编码人COL1-1蛋白。在一些实施方案中，编码COL1-1蛋白的多核苷酸是编码包含与SEQ ID NO:15的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人COL1-1蛋白的多核苷酸是编码包含SEQ ID NO:15的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码COL1-1蛋白的多核苷酸是编码SEQ ID NO:15的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:15的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400但少于1464个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人COL1-2蛋白。在一些实施方案中，编码COL1-2蛋白的多核苷酸是编码包含与SEQ ID NO:16的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人COL1-2蛋白的多核苷酸是编码包含SEQ ID NO:16的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码COL1-2蛋白的多核苷酸是编码SEQ ID NO:16的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:16的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300但少于1366个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人COL3蛋白。在一些实施方案中，编码COL3蛋白的多核苷酸是编码包含与SEQ ID NO:17的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人COL3蛋白的多核苷酸是编码包含SEQID NO:17的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码COL3蛋白的多核苷酸是编码SEQ ID NO:17的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:17的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400但少于1466个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人COL4-1蛋白。在一些实施方案中，编码COL4-1蛋白的多核苷酸是编码包含与SEQ ID NO:18的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人COL4-1蛋白的多核苷酸是编码包含SEQ ID NO:18的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码COL4-1蛋白的多核苷酸是编码SEQ ID NO:18的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:18的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600但少于1669个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人COL6-1蛋白。在一些实施方案中，编码COL6-1蛋白的多核苷酸是编码包含与SEQ ID NO:19的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人COL6-1蛋白的多核苷酸是编码包含SEQ ID NO:19的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码COL6-1蛋白的多核苷酸是编码SEQ ID NO:19的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:19的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000但少于1028个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人COL7蛋白。在一些实施方案中，编码COL7蛋白的多核苷酸是编码包含与SEQ ID NO:20的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人COL7蛋白的多核苷酸是编码包含SEQID NO:20的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码COL7蛋白的多核苷酸是编码SEQ ID NO:20的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:20的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900、至少2000、至少2100、至少2200、至少2300、至少2400、至少2500、至少2600、至少2700、至少2800、至少2900但少于2944个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人COL17蛋白。在一些实施方案中，编码COL17蛋白的多核苷酸是编码包含与SEQ ID NO:21的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人COL17蛋白的多核苷酸是编码包含SEQ ID NO:21的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码COL17蛋白的多核苷酸是编码SEQ ID NO:21的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:21的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400但少于1497个连续氨基酸。

在一些实施方案中，本公开的一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)包含含有与选自SEQ ID NO:15-21的氨基酸序列的至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列。在一些实施方案中，本公开的一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)包含选自SEQ ID NO:15-21的序列。

在一些实施方案中，本公开的一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)包含含有与选自SEQ ID NO:15-17的氨基酸序列的至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列。在一些实施方案中，本公开的一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)包含选自SEQ ID NO:15-17的序列。

纤连蛋白

在一些实施方案中，本公开涉及一种或多种编码全长纤连蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何纤连蛋白都可由本公开的多核苷酸编码，所述纤连蛋白包括例如人纤连蛋白(参见例如UniProt登录号P02751)、小鼠纤连蛋白(参见例如UniProt登录号P11276)、黑猩猩纤连蛋白(参见例如UniProt登录号P11276)、大鼠纤连蛋白(参见例如UniProt登录号P04937)、兔纤连蛋白(参见例如UniProt登录号P04937)等。鉴定来自额外物种的纤连蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的纤连蛋白包含与本文描述或本领域中已知的任何纤连蛋白的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开的多核苷酸编码人纤连蛋白。在一些实施方案中，编码人纤连蛋白的多核苷酸是编码包含与SEQ ID NO:53的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人纤连蛋白的多核苷酸是编码包含SEQID NO:53的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码人纤连蛋白的多核苷酸是编码SEQ ID NO:53的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:53的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900、至少2000、至少2100、至少2200、至少2300、至少2400但少于2477个连续氨基酸。

弹性蛋白和相关蛋白

细胞外基质中的弹性纤维对组织给与弹性性质。弹性纤维通常含有两种在形态上不同的组分-成熟弹性蛋白纤维和微原纤维，所述微原纤维主要含有原纤蛋白并且与其他蛋白质相关，所述其他蛋白质诸如是微原纤维相关糖蛋白(MAGP)、纤蛋白和弹性蛋白-微原纤维界面定位蛋白(EMILIN)。弹性蛋白和它的可溶性前体原弹性蛋白属于身体的主要结构蛋白。

在一些实施方案中，本公开涉及一种或多种编码弹性蛋白或弹性蛋白相关蛋白的多核苷酸，所述弹性蛋白相关蛋白包括原弹性蛋白、原纤蛋白、微原纤维相关糖蛋白、纤蛋白、或弹性蛋白-微原纤维界面定位蛋白。在一些实施方案中，本公开涉及一种或多种编码全长弹性蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何弹性蛋白都可由本公开的多核苷酸编码，所述弹性蛋白包括例如人弹性蛋白(参见例如UniProt登录号P15502)、小鼠弹性蛋白(参见例如UniProt登录号P15502)、黑猩猩弹性蛋白(参见例如UniProt登录号H2QUQ6)、大鼠弹性蛋白(参见例如UniProt登录号Q99372)等。鉴定来自额外物种的弹性蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的弹性蛋白包含与本文描述或本领域中已知的任何弹性蛋白的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开的多核苷酸编码人弹性蛋白。在一些实施方案中，编码人弹性蛋白的多核苷酸是编码包含与SEQ ID NO:54的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人弹性蛋白的多核苷酸是编码包含SEQID NO:54的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码人弹性蛋白的多核苷酸是编码SEQ ID NO:54的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:54的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700但少于786个连续氨基酸。

光蛋白聚糖蛋白

在一些实施方案中，本公开涉及一种或多种编码全长光蛋白聚糖蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何光蛋白聚糖蛋白都可由本公开的多核苷酸编码，所述光蛋白聚糖蛋白包括例如人光蛋白聚糖蛋白(参见例如UniProt登录号P51884)、小鼠光蛋白聚糖蛋白(参见例如UniProt登录号P51885)、黑猩猩光蛋白聚糖蛋白(参见例如UniProt登录号H2Q6L3)、大鼠光蛋白聚糖蛋白(参见例如UniProt登录号H2Q6L3)、兔光蛋白聚糖蛋白(参见例如UniProt登录号O46379)等。鉴定来自额外物种的光蛋白聚糖蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的光蛋白聚糖蛋白包含与本文描述或本领域中已知的任何光蛋白聚糖蛋白的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开的多核苷酸编码人光蛋白聚糖蛋白。在一些实施方案中，编码人光蛋白聚糖蛋白的多核苷酸是编码包含与SEQ ID NO:55的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人光蛋白聚糖蛋白的多核苷酸是编码包含SEQ ID NO:55的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码人光蛋白聚糖蛋白的多核苷酸是编码SEQ ID NO:55的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:55的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300但少于338个连续氨基酸。

玻连蛋白和玻连蛋白受体蛋白

在一些实施方案中，本公开涉及一种或多种编码全长玻连蛋白或玻连蛋白受体蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何玻连蛋白或玻连蛋白受体蛋白都可由本公开的多核苷酸编码，所述玻连蛋白或玻连蛋白受体蛋白包括例如人玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号P04004和P06756)、小鼠玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号P29788和P43406)、黑猩猩玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号H2QCH3和H2R6C3)、大鼠玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号Q7TQ11)、兔玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号P22458)等。鉴定来自额外物种的玻连蛋白或玻连蛋白受体蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的玻连蛋白或玻连蛋白受体蛋白包含与本文描述或本领域中已知的任何玻连蛋白或玻连蛋白受体蛋白的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开的多核苷酸编码人玻连蛋白。在一些实施方案中，编码人玻连蛋白的多核苷酸是编码包含与SEQ ID NO:56的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人玻连蛋白的多核苷酸是编码包含SEQID NO:56的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码人玻连蛋白的多核苷酸是编码SEQ ID NO:56的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:56的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400但少于478个连续氨基酸。

层粘连蛋白

在一些实施方案中，本公开涉及一种或多种编码全长层粘连蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何层粘连蛋白都可由本公开的多核苷酸编码，所述层粘连蛋白包括例如人层粘连蛋白(参见例如UniProt登录号P25391、P24043、Q16787、Q16363、O15230、P07942、P55268、Q13751、P11047、Q13753和Q9Y6N6)、小鼠层粘连蛋白(参见例如UniProt登录号Q61789、Q61087和Q61092)、黑猩猩层粘连蛋白(参见例如UniProt登录号H2QEC7、H2R041和H2Q0R2)、大鼠层粘连蛋白(参见例如UniProt登录号D3ZN05、F1LPI5和F1LRH4)、兔层粘连蛋白(参见例如UniProt登录号G1SY40和A0A0B5JSH0)等。鉴定来自额外物种的层粘连蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的层粘连蛋白包含与本文描述或本领域中已知的任何层粘连蛋白的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开的多核苷酸编码人层粘连蛋白，诸如人层粘连蛋白亚单位α-1(LamA1)多肽(参见例如UniProt登录号P25391)、人层粘连蛋白亚单位α-2(LamA2)多肽(参见例如UniProt登录号P24043)、人层粘连蛋白亚单位α-3(LamA3)多肽(参见例如UniProt登录号Q16787)、人层粘连蛋白亚单位α-4(LamA4)多肽(参见例如UniProt登录号Q16363)、人层粘连蛋白亚单位α-5(LamA5)多肽(参见例如UniProt登录号O15230)、人层粘连蛋白亚单位β-1(LamB1)多肽(参见例如UniProt登录号P07942)、人层粘连蛋白亚单位β-2(LamB2)多肽(参见例如UniProt登录号P55268)、人层粘连蛋白亚单位β-3(LamB3)多肽(参见例如UniProt登录号Q13751)、人层粘连蛋白亚单位γ-1(LamC1)多肽(参见例如UniProt登录号P11047)、人层粘连蛋白亚单位γ-2(LamC2)多肽(参见例如UniProt登录号Q13753)、人层粘连蛋白亚单位γ-3(LamC3)多肽(参见例如UniProt登录号Q9Y6N6)等。

在一些实施方案中，本公开的多核苷酸编码人LamA3多肽。在一些实施方案中，编码人LamA3多肽的多核苷酸是编码包含与SEQ ID NO:57的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人LamA3多肽的多核苷酸是编码包含SEQ ID NO:57的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码人LamA3多肽的多核苷酸是编码SEQ ID NO:57的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:57的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250、至少2500、至少2750、至少3000、至少3250但少于3333个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人LamB3多肽。在一些实施方案中，编码人LamB3多肽的多核苷酸是编码包含与SEQ ID NO:58的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人LamB3多肽的多核苷酸是编码包含SEQ ID NO:58的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码LamB3多肽的多核苷酸是编码SEQ ID NO:58的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:58的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100但少于1172个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人LamC2多肽。在一些实施方案中，编码人LamC2多肽的多核苷酸是编码包含与SEQ ID NO:59的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人LamC2多肽的多核苷酸是编码包含SEQ ID NO:59的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码LamC2多肽的多核苷酸是编码SEQ ID NO:59的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:59的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100但少于1193个连续氨基酸。

神经调质蛋白

在一些实施方案中，本公开涉及一种或多种编码全长神经调质蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何神经调质蛋白都可由本公开的多核苷酸编码，所述神经调质蛋白包括例如肉毒梭菌蛋白(参见例如UniProt登录号P0DPI0、Q45894、P0DPI1、P10844和B1INP5)等。鉴定来自额外物种的神经调质蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的神经调质蛋白包含与本文描述或本领域中已知的任何神经调质蛋白的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开的多核苷酸编码肉毒梭菌神经调质蛋白。

在一些实施方案中，本公开的多核苷酸编码肉毒梭菌A型神经毒素蛋白。在一些实施方案中，编码肉毒梭菌A型神经毒素蛋白的多核苷酸是编码包含与SEQ ID NO:60的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码肉毒梭菌A型神经毒素蛋白的多核苷酸是编码包含SEQ ID NO:60的氨基酸序列的多肽的多核苷酸。在一些实施方案中，本公开的肉毒梭菌A型神经毒素蛋白在对应于SEQ ID NO:60的位置27的位置处包含丙氨酸至缬氨酸突变。

在一些实施方案中，编码肉毒梭菌A型神经毒素蛋白的多核苷酸是编码SEQ IDNO:60的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:60的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200但少于1296个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码肉毒梭菌B型神经毒素蛋白。在一些实施方案中，编码肉毒梭菌B型神经毒素蛋白的多核苷酸是编码包含与SEQ ID NO:61的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码肉毒梭菌B型神经毒素蛋白的多核苷酸是编码包含SEQ ID NO:61的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码肉毒梭菌B型神经毒素蛋白的多核苷酸是编码SEQ IDNO:61的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:61的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200但少于1291个连续氨基酸。

原纤蛋白

在一些实施方案中，本公开涉及一种或多种编码全长原纤蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何原纤蛋白都可由本公开的多核苷酸编码，所述原纤蛋白包括例如人原纤蛋白(参见例如UniProt登录号P35555、P35556和Q75N90)、小鼠原纤蛋白(参见例如UniProt登录号Q61554和Q61555)、黑猩猩原纤蛋白(参见例如UniProt登录号A0A2I3RTE4和K7CZX0)、大鼠原纤蛋白(参见例如UniProt登录号G3V9M6和F1M5Q4)、兔原纤蛋白(参见例如UniProt登录号G1SKM2、G1SUS5和G1T1H4)等。鉴定来自额外物种的原纤蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中，本公开的原纤蛋白包含与本文描述或本领域中已知的任何原纤蛋白的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

在一些实施方案中，本公开的多核苷酸编码人原纤蛋白。

在一些实施方案中，本公开的多核苷酸编码人原纤蛋白-1蛋白。在一些实施方案中，编码人原纤蛋白-1蛋白的多核苷酸是编码包含与SEQ ID NO:62的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人原纤蛋白-1蛋白的多核苷酸是编码包含SEQ ID NO:62的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码人原纤蛋白-1蛋白的多核苷酸是编码SEQ ID NO:62的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:62的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250、至少2500、至少2750但少于2871个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人原纤蛋白-2蛋白。在一些实施方案中，编码人原纤蛋白-2蛋白的多核苷酸是编码包含与SEQ ID NO:63的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人原纤蛋白-2蛋白的多核苷酸是编码包含SEQ ID NO:63的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码人原纤蛋白-2蛋白的多核苷酸是编码SEQ ID NO:63的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:63的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250、至少2500、至少2750但少于2912个连续氨基酸。

在一些实施方案中，本公开的多核苷酸编码人原纤蛋白-3蛋白。在一些实施方案中，编码人原纤蛋白-3蛋白的多核苷酸是编码包含与SEQ ID NO:64的序列具有至少75％、至少80％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中，编码人原纤蛋白-3蛋白的多核苷酸是编码包含SEQ ID NO:64的氨基酸序列的多肽的多核苷酸。

在一些实施方案中，编码人原纤蛋白-3蛋白的多核苷酸是编码SEQ ID NO:64的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:64的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250、至少2500、至少2750但少于2809个连续氨基酸。

示例性美容多肽

在一些实施方案中，本公开的一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)包含含有与选自SEQ ID NO:15-21或53-64的氨基酸序列的至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列。在一些实施方案中，本公开的一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)包含选自SEQ ID NO:15-21或53-64的序列。

在一些实施方案中，本公开的一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)包含含有与选自SEQ ID NO:15-21、53-54或57-59的氨基酸序列的至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的氨基酸序列。在一些实施方案中，本公开的一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)包含选自SEQ ID NO:15-21、53-54或57-59的序列。

第一多核苷酸

在一些实施方案中，本公开涉及一种包含编码第一多肽的第一多核苷酸的重组核酸，所述第一多肽包含第一美容蛋白。第一美容蛋白可为本文描述或本领域中已知的任何美容蛋白，包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白等。在一些实施方案中，第一美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中，第一美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。

在一些实施方案中，本公开的重组核酸包含第一多核苷酸的一个拷贝。在一些实施方案中，本公开的重组核酸包含第一多核苷酸的两个或更多个(例如两个或更多个、三个或更多个、四个或更多个、五个或更多个、十个或更多个等)拷贝。在一些实施方案中，本公开的重组核酸包含第一多核苷酸的两个拷贝。

在一些实施方案中，第一美容蛋白是第一人胶原蛋白。第一人胶原蛋白可为本文描述或本领域中已知的任何人胶原蛋白。在一些实施方案中，第一人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27或COL28。在一些实施方案中，第一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL1-1。在一些实施方案中，第一人胶原蛋白是COL1-2。在一些实施方案中，第一人胶原蛋白是COL3。在一些实施方案中，第一人胶原蛋白是COL4-1。在一些实施方案中，第一人胶原蛋白是COL4-2。在一些实施方案中，第一人胶原蛋白是COL6-1。在一些实施方案中，第一人胶原蛋白是COL7。在一些实施方案中，第一人胶原蛋白不是COL7。在一些实施方案中，第一人胶原蛋白是COL17。

在一些实施方案中，第一多肽基本上由第一美容蛋白组成。在一些实施方案中，第一多肽由第一美容蛋白组成。在一些实施方案中，第一多肽是第一美容蛋白。

嵌合多肽

在一些实施方案中，第一多肽是包含第一美容蛋白的嵌合多肽。在一些实施方案中，第一多肽是包含第一美容蛋白和另一美容蛋白的嵌合多肽。在一些实施方案中，嵌合多肽包含连接第一美容蛋白和另一美容蛋白的接头多肽。在一些实施方案中，嵌合多肽从n末端至c末端包含第一美容蛋白-接头多肽-另一美容蛋白。第一美容蛋白和/或另一美容蛋白可为本文描述或本领域中已知的任何美容蛋白，包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白等。在一些实施方案中，第一美容蛋白和/或另一美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中，第一美容蛋白和/或另一美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。在一些实施方案中，第一美容蛋白和另一美容蛋白是相同的。在一些实施方案中，第一美容蛋白和另一美容蛋白是不同的。

在一些实施方案中，接头多肽是可裂解接头多肽。可在本公开的嵌合多肽中使用本领域中已知的任何可裂解接头多肽，包括例如T2A接头、P2A接头、E2A接头和F2A接头等。在一些实施方案中，接头多肽是T2A接头多肽。编码T2A接头多肽的一示例性核酸序列以SEQID NO:24提供。T2A接头多肽的一示例性氨基酸序列以SEQ ID NO:28提供。在一些实施方案中，接头多肽是P2A接头多肽。编码P2A接头多肽的一示例性核酸序列以SEQ ID NO:25提供。P2A接头多肽的一示例性氨基酸序列以SEQ ID NO:29提供。在一些实施方案中，接头多肽是E2A接头多肽。编码E2A接头多肽的一示例性核酸序列以SEQ ID NO:26提供。E2A接头多肽的一示例性氨基酸序列以SEQ ID NO:30提供。在一些实施方案中，接头多肽是F2A接头多肽。编码F2A接头多肽的一示例性核酸序列以SEQ ID NO:27提供。F2A接头多肽的一示例性氨基酸序列以SEQ ID NO:31提供。

在一些实施方案中，接头多肽包含与选自SEQ ID NO:28-31的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，接头多肽包含选自SEQ ID NO:28-31的序列。

在一些实施方案中，第一美容蛋白是第一胶原蛋白(例如第一人胶原蛋白)，并且另一美容蛋白是另一胶原蛋白(例如另一人胶原蛋白)。编码包含第一人胶原蛋白、接头多肽和另一人胶原蛋白的嵌合多肽的一示例性核酸序列以SEQ ID NO:32提供。

在一些实施方案中，第一美容蛋白是第一人胶原蛋白，并且另一美容蛋白是另一人胶原蛋白。另一人胶原蛋白可为本文描述或本领域中已知的任何人胶原蛋白。在一些实施方案中，另一人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27或COL28。在一些实施方案中，另一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，另一人胶原蛋白是COL1-1。在一些实施方案中，另一人胶原蛋白是COL1-2。在一些实施方案中，另一人胶原蛋白是COL3。在一些实施方案中，另一人胶原蛋白是COL4-1。在一些实施方案中，另一人胶原蛋白是COL4-2。在一些实施方案中，另一人胶原蛋白是COL6-1。在一些实施方案中，另一人胶原蛋白是COL7。在一些实施方案中，另一人胶原蛋白不是COL7。在一些实施方案中，另一人胶原蛋白是COL17。在一些实施方案中，第一人胶原蛋白和另一人胶原蛋白是相同的。在一些实施方案中，第一人胶原蛋白和另一人胶原蛋白是不同的。

在一些实施方案中，第一人胶原蛋白是COL1-1，并且另一人胶原蛋白选自COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL1-1，并且另一人胶原蛋白是COL1-2。在一些实施方案中，第一人胶原蛋白是COL1-1，并且另一人胶原蛋白是COL3。

在一些实施方案中，第一人胶原蛋白是COL1-2，并且另一人胶原蛋白是COL1-1、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL1-2，并且另一人胶原蛋白是COL1-1。

在一些实施方案中，第一人胶原蛋白是COL3，并且另一人胶原蛋白选自COL1-1、COL1-2、COL4-1、COL4-2、COL6-1、COL7或COL17。

在一些实施方案中，第一人胶原蛋白是COL4-1，并且另一人胶原蛋白是COL1-1、COL1-2、COL3、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL4-1，并且另一人胶原蛋白是COL4-2。

在一些实施方案中，第一人胶原蛋白是COL6-1，并且另一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL7或COL17。

在一些实施方案中，第一人胶原蛋白是COL7，并且另一人胶原蛋白是COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL17。

在一些实施方案中，第一人胶原蛋白是COL17，并且另一人胶原蛋白是COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL7。

在一些实施方案中，第一美容蛋白是第一层粘连蛋白(例如第一人层粘连蛋白)，并且另一美容蛋白是另一层粘连蛋白(例如另一人层粘连蛋白)。在一些实施方案中，第一美容蛋白是第一人层粘连蛋白，并且另一美容蛋白是另一人层粘连蛋白。另一人层粘连蛋白可为本文描述或本领域中已知的任何人层粘连蛋白。在一些实施方案中，第一人层粘连蛋白是人LamA3多肽，并且另一人层粘连蛋白是人LamB3多肽。在一些实施方案中，第一人层粘连蛋白是人LamA3多肽，并且另一人层粘连蛋白是人LamC2多肽。在一些实施方案中，第一人层粘连蛋白是人LamB3多肽，并且另一人层粘连蛋白是人LamC2多肽。

在一些实施方案中，第一多核苷酸编码单顺反子mRNA。在一些实施方案中，单顺反子mRNA包含编码第一多肽的开放阅读框(ORF)。

在一些实施方案中，第一多核苷酸编码多顺反子mRNA。在一些实施方案中，多顺反子mRNA包含编码第一多肽的开放阅读框(ORF)。

多顺反子mRNA

在一些实施方案中，第一多核苷酸编码多顺反子mRNA。在一些实施方案中，多顺反子mRNA包含编码第一多肽的开放阅读框(ORF)。在一些实施方案中，第一多核苷酸编码多顺反子mRNA，所述多顺反子mRNA包含：1)编码第一多肽的第一开放阅读框(ORF)，和2)编码额外美容蛋白的第二开放阅读框(ORF)。在一些实施方案中，多顺反子mRNA还包含分隔第一ORF和第二ORF的内部核糖体进入位点(IRES)。在一些实施方案中，多顺反子mRNA从5’至3’包含编码第一多肽的第一ORF-IRES-编码额外美容蛋白的第二ORF。第一多肽可为本文所述的任何第一多肽。额外美容蛋白可为本文描述或本领域中已知的任何美容蛋白，包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白等。在一些实施方案中，额外美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中，额外美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。

可在本公开的多顺反子mRNA中使用本领域中已知的任何适合IRES，包括例如病毒源性IRES(例如源于脊髓灰质炎病毒、鼻病毒、脑心肌炎病毒(EMCV)、口蹄疫病毒、丙型肝炎病毒、经典猪瘟病毒、劳斯肉瘤病毒(rous sarcoma virus)、人免疫缺陷病毒、蟋蟀麻痹病毒、卡波西氏肉瘤相关疱疹病毒等的IRES)、细胞mRNA源性IRES(例如源于生长因子mRNA诸如纤维母细胞生长因子2、血小板源性生长因子B和血管内皮生长因子的IRES；源于转录因子mRNA诸如触角足蛋白、超级双胸蛋白(ultrabithorax)和NF-κB阻遏因子的IRES；源于致癌基因mRNA诸如c-myc、pim-1和蛋白质激酶p58^PITSLRE等的IRES)、合成IRES(例如CP148IRES)以及其他IRES(参见例如Mokrejs等(2007)A Bioinformatical Approach to theAnalysis of Viral and Cellular Internal Ribosome Entry Sites.Columbus F编.NewMessenger RNA Research Communications.Hauppauge,NY:Nova Science Publishers；第133-166页)。在一些实施方案中，IRES是CP148 IRES。编码CP148IRES的一示例性核酸序列以SEQ ID NO:22提供。在一些实施方案中，IRES是EMCV IRES。编码EMCV IRES的一示例性核酸序列以SEQ ID NO:23提供。

在一些实施方案中，编码IRES的核酸序列包括与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。在一些实施方案中，编码IRES的核酸序列包括SEQ ID NO:22或SEQ ID NO:23的序列。

在一些实施方案中，第一多肽是第一胶原蛋白(例如第一人胶原蛋白)，并且额外美容蛋白是额外胶原蛋白(例如额外人胶原蛋白)。编码包含第一ORF、IRES和第二ORF的多顺反子mRNA的一示例性核酸以SEQ ID NO:33或SEQ ID NO:34提供。额外人胶原蛋白可为本文所述的任何人胶原蛋白。在一些实施方案中，额外人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27或COL28。在一些实施方案中，额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，额外人胶原蛋白是COL1-1。在一些实施方案中，额外人胶原蛋白是COL1-2。在一些实施方案中，额外人胶原蛋白是COL3。在一些实施方案中，额外人胶原蛋白是COL4-1。在一些实施方案中，额外人胶原蛋白是COL4-2。在一些实施方案中，额外人胶原蛋白是COL6-1。在一些实施方案中，额外人胶原蛋白是COL7。在一些实施方案中，额外人胶原蛋白不是COL7。在一些实施方案中，额外人胶原蛋白是COL17。在一些实施方案中，第一人胶原蛋白和额外人胶原蛋白是相同的。在一些实施方案中，第一人胶原蛋白和额外人胶原蛋白是不同的。

在一些实施方案中，第一人胶原蛋白是COL1-1，并且额外人胶原蛋白选自COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL1-1，并且额外人胶原蛋白是COL1-2。在一些实施方案中，第一人胶原蛋白是COL1-1，并且额外人胶原蛋白是COL3。

在一些实施方案中，第一人胶原蛋白是COL1-2，并且额外人胶原蛋白选自COL1-1、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL1-2，并且额外人胶原蛋白是COL1-1。

在一些实施方案中，第一人胶原蛋白是COL3，并且额外人胶原蛋白选自COL1-1、COL1-2、COL4-1、COL4-2、COL6-1、COL7或COL17。

在一些实施方案中，第一人胶原蛋白是COL4-1，并且额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL4-1，并且额外人胶原蛋白是COL4-2。

在一些实施方案中，第一人胶原蛋白是COL6-1，并且额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL7或COL17。

在一些实施方案中，第一人胶原蛋白是COL7，并且额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL17。

在一些实施方案中，第一人胶原蛋白是COL17，并且额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL7。

在一些实施方案中，第一多肽是第一胶原蛋白(例如第一人胶原蛋白)，并且额外美容蛋白是额外胶原蛋白(例如额外人胶原蛋白)。

在一些实施方案中，第一多肽是第一层粘连蛋白(例如第一人层粘连蛋白)，并且额外美容蛋白是额外层粘连蛋白(例如额外人层粘连蛋白)。在一些实施方案中，第一多肽是第一人层粘连蛋白，并且额外美容蛋白是额外人层粘连蛋白。额外人层粘连蛋白可为本文描述或本领域中已知的任何人层粘连蛋白。在一些实施方案中，第一人层粘连蛋白是人LamA3多肽，并且额外人层粘连蛋白是人LamB3多肽。在一些实施方案中，第一人层粘连蛋白是人LamA3多肽，并且额外人层粘连蛋白是人LamC2多肽。在一些实施方案中，第一人层粘连蛋白是人LamB3多肽，并且额外人层粘连蛋白是人LamC2多肽。

第二多核苷酸

在一些实施方案中，本公开涉及一种还包含编码第二美容蛋白的第二多核苷酸的重组核酸。第二美容蛋白可为本文描述或本领域中已知的任何美容蛋白，包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白等。在一些实施方案中，第二美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中，第二美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。在一些实施方案中，第一美容蛋白和第二美容蛋白是相同的。在一些实施方案中，第一美容蛋白和第二美容蛋白是不同的。在一些实施方案中，重组核酸包含第二多核苷酸的一个拷贝。在一些实施方案中，重组核酸包含第二多核苷酸的两个或更多个(例如两个或更多个、三个或更多个、四个或更多个、五个或更多个、十个或更多个等)拷贝。在一些实施方案中，重组核酸包含第二多核苷酸的两个拷贝。

在一些实施方案中，第二美容蛋白是胶原蛋白。在一些实施方案中，第二美容蛋白是第二人胶原蛋白。第二人胶原蛋白可为本文所述的任何人胶原蛋白。在一些实施方案中，第二人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27或COL28。在一些实施方案中，第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7或COL17。在一些实施方案中，第二人胶原蛋白是COL1-1。在一些实施方案中，第二人胶原蛋白是COL1-2。在一些实施方案中，第二人胶原蛋白是COL3。在一些实施方案中，第二人胶原蛋白是COL4-1。在一些实施方案中，第二人胶原蛋白是COL4-2。在一些实施方案中，第二人胶原蛋白是COL6-1。在一些实施方案中，第二人胶原蛋白是COL7。在一些实施方案中，第二人胶原蛋白不是COL7。在一些实施方案中，第二人胶原蛋白是COL17。

在一些实施方案中，第一多核苷酸编码第一胶原蛋白，并且第二多核苷酸编码第二胶原蛋白。在一些实施方案中，第一多核苷酸编码第一人胶原蛋白，并且第二多核苷酸编码第二人胶原蛋白。在一些实施方案中，第一人胶原蛋白(由第一多核苷酸编码)和第二人胶原蛋白(由第二多核苷酸编码)是相同的。在一些实施方案中，第一人胶原蛋白(由第一多核苷酸编码)和第二人胶原蛋白(由第二多核苷酸编码)是不同的。

在一些实施方案中，第一人胶原蛋白是COL1-1，并且第二人胶原蛋白选自COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL1-1，并且第二人胶原蛋白是COL1-2。在一些实施方案中，第一人胶原蛋白是COL1-1，并且第二人胶原蛋白是COL3。

在一些实施方案中，第一人胶原蛋白是COL1-2，并且第二人胶原蛋白选自COL1-1、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL1-2，并且第二人胶原蛋白是COL1-1。

在一些实施方案中，第一人胶原蛋白是COL3，并且第二人胶原蛋白选自COL1-1、COL1-2、COL4-1、COL4-2、COL6-1、COL7或COL17。

在一些实施方案中，第一人胶原蛋白是COL4-1，并且第二人胶原蛋白选自COL1-2、COL1-2、COL3、COL4-2、COL6-1、COL7或COL17。在一些实施方案中，第一人胶原蛋白是COL4-1，并且第二人胶原蛋白是COL4-2。

在一些实施方案中，第一人胶原蛋白是COL6-1，并且第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL7或COL17。

在一些实施方案中，第一人胶原蛋白是COL7，并且第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL17。

在一些实施方案中，第一人胶原蛋白是COL17，并且第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL7。

在一些实施方案中，第一多核苷酸编码第一层粘连蛋白(例如第一人层粘连蛋白)，并且第二多核苷酸编码第二层粘连蛋白(例如第二人层粘连蛋白)。在一些实施方案中，第一多核苷酸编码第一人层粘连蛋白多肽，并且第二多核苷酸编码第二人层粘连蛋白。第二人层粘连蛋白可为本文描述或本领域中已知的任何人层粘连蛋白。在一些实施方案中，第一人层粘连蛋白是人LamA3多肽，并且第二人层粘连蛋白是人LamB3多肽。在一些实施方案中，第一人层粘连蛋白是人LamA3多肽，并且第二人层粘连蛋白是人LamC2多肽。在一些实施方案中，第一人层粘连蛋白是人LamB3多肽，并且第二人层粘连蛋白是人LamC2多肽。

重组核酸

在一些实施方案中，本公开涉及包含本文所述的多核苷酸中的任何一者或多者的重组核酸。在一些实施方案中，重组核酸包含第一多核苷酸的一个拷贝。在一些实施方案中，重组核酸包含第一多核苷酸的两个拷贝。在一些实施方案中，重组核酸包含第一多核苷酸的一个拷贝和第二多核苷酸的一个拷贝。在一些实施方案中，重组核酸包含第一多核苷酸的一个拷贝和第二多核苷酸的两个拷贝。在一些实施方案中，重组核酸包含第一多核苷酸的两个拷贝和第二多核苷酸的一个拷贝。在一些实施方案中，重组核酸包含第一多核苷酸的两个拷贝和第二多核苷酸的两个拷贝。

在一些实施方案中，重组核酸是载体(例如表达载体、展示载体等)。在一些实施方案中，载体是DNA载体或RNA载体。通常，可使用适于在受试者中维持、繁殖和/或表达多核苷酸以产生一种或多种多肽的载体。适合载体的实例可包括例如质粒、粘粒、游离体、转座子和病毒载体(例如腺病毒载体、腺相关病毒载体、痘苗病毒载体、辛德毕斯(Sindbis)病毒载体、麻疹载体、疱疹病毒载体、慢病毒载体、逆转录病毒载体等)。在一些实施方案中，载体是疱疹病毒载体。在一些实施方案中，载体能够在宿主细胞中自主复制。在一些实施方案中，载体不能在宿主细胞中自主复制。在一些实施方案中，载体可整合至宿主DNA中。在一些实施方案中，载体不能整合至宿主DNA中(例如是游离型的)。制备含有一种或多种目标多核苷酸的载体的方法为本领域普通技术人员所熟知，包括例如通过化学合成，或通过人工操控核酸的经分离区段(例如通过遗传工程化技术)。

在一些实施方案中，本公开的重组核酸是单纯疱疹病毒(HSV)扩增子。疱疹病毒扩增子，包括结构特征和制备所述疱疹病毒扩增子的方法，通常为本领域普通技术人员所知(参见例如de Silva S.和Bowers W.“Herpes Virus Amplicon Vectors”.Viruses 2009,1,594-629)。在一些实施方案中，单纯疱疹病毒扩增子是HSV-1扩增子。在一些实施方案中，单纯疱疹病毒扩增子是HSV-1杂合扩增子。HSV-1杂合扩增子的实例可包括但不限于HSV/AAV杂合扩增子、HSV/EBV杂合扩增子、HSV/EBV/RV杂合扩增子、和/或HSV/睡美人杂合扩增子。在一些实施方案中，扩增子是HSV/AAV杂合扩增子。在一些实施方案中，扩增子是HSV/睡美人杂合扩增子。

在一些实施方案中，本公开的重组核酸是重组疱疹病毒基因组。重组疱疹病毒基因组可为来自本领域中已知的DNA病毒的疱疹病毒科的任何成员的重组基因组，包括例如重组单纯疱疹病毒基因组、重组水痘带状疱疹病毒基因组、重组人巨细胞病毒基因组、重组疱疹病毒6A基因组、重组疱疹病毒6B基因组、重组疱疹病毒7基因组、重组卡波西氏肉瘤相关疱疹病毒基因组、以及它们的任何组合或任何衍生物。在一些实施方案中，重组疱疹病毒基因组包含一个或多个(例如一个或多个、两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个、十个或更多个等)失活性突变。在一些实施方案中，一个或多个失活性突变在一种或多种(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种、十种或更多种等)疱疹病毒基因中。在一些实施方案中，重组疱疹病毒基因组是减毒的(例如相较于相应野生型疱疹病毒基因组)。在一些实施方案中，重组疱疹病毒基因组是有复制能力的。在一些实施方案中，重组疱疹病毒基因组是复制缺陷性的。

在一些实施方案中，重组核酸是重组单纯疱疹病毒(HSV)基因组。在一些实施方案中，重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组、重组2型单纯疱疹病毒(HSV-2)基因组或它们的任何衍生物。在一些实施方案中，重组单纯疱疹病毒基因组是重组HSV-1基因组。在一些实施方案中，重组单纯疱疹病毒基因组是有复制能力的。在一些实施方案中，重组单纯疱疹病毒基因组是复制缺陷性的。在一些实施方案中，重组单纯疱疹病毒基因组包含一个或多个(例如一个或多个、两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个、十个或更多个等)失活性突变。在一些实施方案中，一个或多个失活性突变在一种或多种(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种、十种或更多种等)单纯疱疹病毒基因中。如本文所用，“失活性突变”可指导致基因或调节子产物(RNA或蛋白质)具有降低、不可检测或消除的数量和/或功能(例如相较于缺乏失活性突变的相应序列)的任何突变。失活性突变的实例可包括但不限于在给定基因或调节子的转录控制序列(启动子、增强子、绝缘子等)和/或编码序列中的缺失、插入、点突变和重排。可使用本领域中已知的测量基因或调节子产物的数量的任何适合方法，包括例如qPCR、Northern印迹、RNA测序、蛋白质印迹、ELISA等。

在一些实施方案中，重组单纯疱疹病毒基因组在感染细胞蛋白(或感染细胞多肽)(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和/或UL55单纯疱疹病毒基因中的至少一者、至少两者、至少三者、至少四者、至少五者、至少六者、至少七者或全部八者中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP34.5和/或ICP47单纯疱疹病毒基因中不包含失活性突变(例如以避免产生免疫刺激性病毒)。在一些实施方案中，重组单纯疱疹病毒基因组在ICP34.5单纯疱疹病毒基因(一个或两个拷贝)中不包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP47单纯疱疹病毒基因中不包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP34.5(一个或两个拷贝)和ICP47单纯疱疹病毒基因中不包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组不是溶瘤性的。

在一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变，并且还在ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47、UL41和/或UL55基因中包含引发性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变，并且在ICP4基因(一个或两个拷贝)中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变，并且在ICP22基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变，并且在UL41基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变，在ICP4基因(一个或两个拷贝)中包含失活性突变，并且在ICP22基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变，在ICP4基因(一个或两个拷贝)中包含失活性突变，并且在UL41基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变，在ICP22基因中包含失活性突变，并且在UL41基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变，在ICP4基因(一个或两个拷贝)中包含失活性突变，在ICP22基因中包含失活性突变，并且在UL41基因中包含失活性突变。在一些实施方案中，失活性突变是ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22和/或UL41基因的编码序列的缺失。在一些实施方案中，重组单纯疱疹病毒基因组还在ICP27、ICP47和/或UL55基因中包含失活性突变。

在一些实施方案中，重组单纯疱疹病毒基因组在ICP4基因(一个或两个拷贝)中包含失活性突变。在一些实施方案中，重组复合疱疹(herpes complex)病毒基因组在ICP4(一个或两个拷贝)中包含失活性突变，并且还在ICP0(一个或两个拷贝)、ICP22、ICP27、ICP47、UL41和/或UL55基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4基因(一个或两个拷贝)中包含失活性突变，并且在ICP22基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4基因(一个或两个拷贝)中包含失活性突变，并且在UL41基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4基因(一个或两个拷贝)中包含失活性突变，在ICP22基因中包含失活性突变，并且在UL41基因中包含失活性突变。在一些实施方案中，失活性突变是ICP4(一个或两个拷贝)、ICP22和/或UL41基因的编码序列的缺失。在一些实施方案中，重组单纯疱疹病毒基因组还在ICP0、ICP27、ICP47和/或UL55基因中包含失活性突变。

在一些实施方案中，重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变，并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP27、ICP47、UL41和/或UL55基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变，并且在UL41基因中包含失活性突变。在一些实施方案中，失活性突变是ICP22和/或UL41基因的编码序列的缺失。在一些实施方案中，重组单纯疱疹病毒基因组还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP27、ICP47和/或UL55基因中包含失活性突变。

在一些实施方案中，重组单纯疱疹病毒基因组在ICP27基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP27基因中包含失活性突变，并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP47、UL41和/或UL55基因中包含失活性突变。在一些实施方案中，失活性突变是ICP27基因的编码序列的缺失。

在一些实施方案中，重组单纯疱疹病毒基因组在ICP47基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP47基因中包含失活性突变，并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27、UL41和/或UL55基因中包含失活性突变。在一些实施方案中，失活性突变是ICP47基因的编码序列的缺失。

在一些实施方案中，重组单纯疱疹病毒基因组在UL41基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在UL41基因中包含失活性突变，并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47和/或UL55基因中包含失活性突变。在一些实施方案中，失活性突变是UL41基因的编码序列的缺失。

在一些实施方案中，重组单纯疱疹病毒基因组在UL55基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在UL55基因中包含失活性突变，并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47和/或UL41基因中包含失活性突变。在一些实施方案中，失活性突变是UL55基因的编码序列的缺失。

在一些实施方案中，重组单纯疱疹病毒基因组在包含内部重复长(IRL)区域和内部重复短(IRS)区域的内部重复(接合)区域中包含失活性突变(例如所述内部重复(接合)区域的缺失)。在一些实施方案中，接合区域的失活(例如缺失)消除ICP4基因和ICP0基因各自一个拷贝。在一些实施方案中，接合区域的失活(例如缺失)进一步使ICP22和ICP47基因的启动子失活(例如缺失)。如果需要，那么这些基因中的一者或两者的表达可通过将立即早期启动子插入重组单纯疱疹病毒基因组中来恢复(参见例如Hill等(1995).Nature 375(6530):411-415；Goldsmith等(1998).J Exp Med 187(3):341-348)。在不希望受理论束缚下，据信使接合区域失活(例如缺失)可促进重组单纯疱疹病毒基因组的稳定性和/或允许重组单纯疱疹病毒基因组容纳更多和/或更大转基因。

在一些实施方案中，重组单纯疱疹病毒基因组在ICP4(一个或两个拷贝)、ICP22和ICP27基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4(一个或两个拷贝)、ICP27和UL55基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47和UL55基因中包含失活性突变。在一些实施方案中，ICP4(一个或两个拷贝)、ICP27和/或UL55基因中的失活性突变是ICP4(一个或两个拷贝)、ICP27和/或UL55基因的编码序列的缺失。在一些实施方案中，ICP22和ICP47基因中的失活性突变是ICP22和ICP47基因的启动子区域中的缺失(例如ICP22和ICP47编码序列是完整的，但不具有转录活性)。在一些实施方案中，重组单纯疱疹病毒基因组在ICP4(一个或两个拷贝)、ICP27和UL55基因的编码序列中包含缺失，并且在ICP22和ICP47基因的启动子区域中包含缺失。在一些实施方案中，重组单纯疱疹病毒基因组还在ICP0和/或UL41基因中包含失活性突变。

在一些实施方案中，重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)和ICP4(一个或两个拷贝)基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)和ICP22基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22和ICP27基因中包含失活性突变。在一些实施方案中，重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27和UL55基因中包含失活性突变。在一些实施方案中，ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27和/或UL55基因中的失活性突变包括ICP0、ICP4(一个或两个拷贝)、ICP22、ICP27和/或UL55基因的编码序列的缺失。在一些实施方案中，重组单纯疱疹病毒基因组还在ICP47和/或UL41基因中包含失活性突变。

在一些实施方案中，重组单纯疱疹病毒基因组在一个、两个、三个、四个、五个、六个、七个或更多个病毒基因座内包含本公开的一种或多种多核苷酸。适合病毒基因座的实例可包括不限于ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47、tk、UL41和UL55单纯疱疹病毒基因座。在一些实施方案中，重组单纯疱疹病毒基因组在病毒ICP4基因座中的一个或两个内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP4基因座中的一个或两个中携带编码第一人胶原蛋白的第一多核苷酸；重组病毒在ICP4基因座中的一个或两个中携带编码第二人胶原蛋白的第二多核苷酸；等)。在一些实施方案中，重组单纯疱疹病毒基因组在病毒ICP22基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP22基因座中携带编码第一人胶原蛋白的第一多核苷酸；重组病毒在ICP22基因座中携带编码第二人胶原蛋白的第二多核苷酸；等)。在一些实施方案中，重组单纯疱疹病毒基因组在病毒UL41基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在UL41基因座中携带编码第一人胶原蛋白的第一多核苷酸；重组病毒在UL41基因座中携带编码第二人胶原蛋白的第二多核苷酸；等)。在一些实施方案中，重组单纯疱疹病毒基因组在病毒ICP4基因座中的一个或两个内包含本公开的一种或多种多核苷酸，并且在病毒ICP22基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP4基因座中的一个或两个中携带编码第一人胶原蛋白的第一多核苷酸，并且在ICP22基因座中携带编码第二人胶原蛋白的第二多核苷酸；重组病毒在ICP4基因座中的一个或两个中携带编码第二人胶原蛋白的第二多核苷酸，并且在ICP22基因座中携带编码第一人胶原蛋白的第一多核苷酸；等)。在一些实施方案中，重组单纯疱疹病毒基因组在病毒ICP4基因座中的一个或两个内包含本公开的一种或多种多核苷酸，并且在病毒UL41基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP4基因座中的一个或两个中携带编码第一人胶原蛋白的第一多核苷酸，并且在UL41基因座中携带编码第二人胶原蛋白的第二多核苷酸；重组病毒在ICP4基因座中的一个或两个中携带编码第二人胶原蛋白的第二多核苷酸，并且在UL41基因座中携带编码第一人胶原蛋白的第一多核苷酸；等)。在一些实施方案中，重组单纯疱疹病毒基因组在病毒ICP4基因座中的一个或两个内包含本公开的一种或多种多核苷酸，在病毒ICP22基因座内包含本公开的一种或多种多核苷酸，并且在病毒UL41基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP4基因座中的一个或两个中携带编码第一人胶原蛋白的第一多核苷酸，并且在ICP22和UL41基因座中携带编码第二人胶原蛋白的第二多核苷酸；重组病毒在ICP4基因座中的一个或两个中携带编码第二人胶原蛋白的第二多核苷酸，并且在ICP22和UL41基因座中携带编码第一人胶原蛋白的第一多核苷酸；等)。

在一些实施方案中，重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)已被工程化来使一种或多种毒性单纯疱疹基因(诸如HSV ICP0基因的一个或两个拷贝、HSV ICP4基因的一个或两个拷贝、ICP22基因和/或UL41基因)的表达降低或消除。在一些实施方案中，相较于相应野生型疱疹病毒基因组(例如野生型单纯疱疹病毒基因组)，重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)已被工程化来使重组基因组(例如当引入靶标细胞中时)的细胞毒性降低。在一些实施方案中，相较于相应野生型疱疹病毒基因组，重组病毒基因组(例如重组单纯疱疹病毒基因组)的细胞毒性(例如在人角质化细胞和/或纤维母细胞中)降低至少约5％、至少约10％、至少约15％、至少约20％、至少约25％、至少约30％、至少约35％、至少约40％、至少约45％、至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％或至少约99％(例如测量重组ΔICP4(一个或两个拷贝)单纯疱疹病毒基因组相对于野生型单纯疱疹病毒基因组的在人角质化细胞或纤维母细胞(原代细胞或细胞系)中的相对细胞毒性；测量重组ΔICP4(一个或两个拷贝)/ΔICP22单纯疱疹病毒基因组相对于野生型单纯疱疹病毒基因组的在人角质化细胞或纤维母细胞(原代细胞或细胞系)中的相对细胞毒性；等)。在一些实施方案中，相较于相应野生型疱疹病毒基因组，重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)的细胞毒性(例如在人角质化细胞和/或纤维母细胞中)降低至至少约1/1.5、至少约1/2、至少约1/3、至少约1/4、至少约1/5、至少约1/6、至少约1/7、至少约1/8、至少约1/9、至少约1/10、至少约1/15、至少约1/20、至少约1/25、至少约1/50、至少约1/75、至少约1/100、至少约1/250、至少约1/500、至少约1/750、至少约1/1000，或降低更多(例如测量重组ΔICP4(一个或两个拷贝)单纯疱疹病毒基因组相对于野生型单纯疱疹病毒基因组的在人角质化细胞或纤维母细胞(原代细胞或细胞系)中的相对细胞毒性；测量重组ΔICP4(一个或两个拷贝)/ΔICP22单纯疱疹病毒基因组相对于野生型单纯疱疹病毒基因组的在人角质化细胞或纤维母细胞(原代细胞或细胞系)中的相对细胞毒性；等)。测量细胞毒性的方法为本领域普通技术人员所知，包括例如通过使用活体染料(甲臜染料)、蛋白酶生物标志物、MTT测定(或使用相关四唑嗡盐诸如XTT、MTS、水溶性四唑嗡盐等的测定)，测量ATP含量等。

在一些实施方案中，相较于相应野生型疱疹病毒基因组(例如野生型单纯疱疹病毒基因组)，重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)已被工程化来使在靶标细胞暴露于重组基因组之后，重组疱疹病毒基因组对宿主细胞增殖的影响降低。在一些实施方案中，靶标细胞是人细胞。在一些实施方案中，靶标细胞是表皮和/或真皮的细胞。在一些实施方案中，靶标细胞是角质化细胞和/或纤维母细胞。在一些实施方案中，相较于在暴露于相应野生型疱疹病毒基因组之后的宿主细胞增殖，在暴露于重组基因组之后的宿主细胞增殖(例如人角质化细胞和/或纤维母细胞)加快至少约5％、至少约10％、至少约15％、至少约20％、至少约25％、至少约30％、至少约35％、至少约40％、至少约45％、至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％或至少约99％(例如在人角质化细胞或纤维母细胞(原代细胞或细胞系)的情况下，相对于在暴露于野生型单纯疱疹病毒基因组之后的细胞增殖，测量在暴露于重组ΔICP4(一个或两个拷贝)单纯疱疹病毒基因组之后的相对细胞增殖；在人角质化细胞或纤维母细胞(原代细胞或细胞系)的情况下，相对于在暴露于野生型单纯疱疹病毒基因组之后的细胞增殖，测量在暴露于重组ΔICP4(一个或两个拷贝)/ΔICP22单纯疱疹病毒基因组之后的相对细胞增殖；等)。在一些实施方案中，相较于在暴露于相应野生型疱疹病毒基因组之后的宿主细胞增殖，在暴露于重组基因组之后的宿主细胞增殖(例如人角质化细胞和/或纤维母细胞)加快至至少约1.5倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约50倍、至少约75倍、至少约100倍、至少约250倍、至少约500倍、至少约750倍或至少约1000倍(例如在人角质化细胞或纤维母细胞(原代细胞或细胞系)的情况下，相对于在暴露于野生型单纯疱疹病毒基因组之后的细胞增殖，测量在暴露于重组ΔICP4(一个或两个拷贝)单纯疱疹病毒基因组之后的相对细胞增殖；在人角质化细胞或纤维母细胞(原代细胞或细胞系)的情况下，相对于在暴露于野生型单纯疱疹病毒基因组之后的细胞增殖，测量在暴露于重组ΔICP4(一个或两个拷贝)/ΔICP22单纯疱疹病毒基因组之后的相对细胞增殖；等)。测量细胞增殖的方法为本领域普通技术人员所知，包括例如通过使用Ki67细胞增殖测定、BrdU细胞增殖测定等。

载体(例如疱疹病毒载体)可包括本公开的一种或多种呈适于在宿主细胞中表达多核苷酸的形式的多核苷酸。载体可包括一种或多种操作性地连接于待表达的多核苷酸的调控序列(例如如上所述)。

在一些实施方案中，本公开的重组核酸(例如重组单纯疱疹病毒基因组)包含本文所述的多核苷酸中的一者或多者，所述一者或多者以任何定向插入所述重组核酸中。如果重组核酸包含本文所述的两种或更多种多核苷酸(例如两种或更多种、三种或更多种等)，那么多核苷酸可以彼此相同定向或相反定向加以插入。在不希望受理论束缚下，以反义定向将两种多核苷酸(例如两种转基因)并入重组核酸(例如载体)中可有助于避免通读，并且确保每种多核苷酸的适当表达。

IV.病毒

本公开的某些方面涉及包含本文所述的多核苷酸和/或重组核酸中的任一者的病毒。在一些实施方案中，病毒能够感染受试者(例如人)的一种或多种靶标细胞。在一些实施方案中，病毒适于将多核苷酸和/或重组核酸递送至受试者(例如人受试者)的一种或多种靶标细胞中。在一些实施方案中，一种或多种靶标细胞是一种或多种人细胞。在一些实施方案中，一种或多种靶标细胞是皮肤的一种或多种细胞(例如表皮、真皮和/或皮下组织的一种或多种细胞)。在一些实施方案中，一种或多种细胞选自角质化细胞、黑素细胞、朗格汉斯细胞(Langerhans cell)、梅克尔细胞(Merkel cell)、肥大细胞、纤维母细胞和/或脂肪细胞。在一些实施方案中，一种或多种细胞是角质化细胞。在一些实施方案中，一种或多种细胞存在于角质层、颗粒层、棘层、基底层和/或基底膜中。在一些实施方案中，一种或多种靶标细胞是一种或多种表皮细胞。

可使用本领域中已知的任何适合病毒，包括例如腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、疱疹病毒(例如单纯疱疹病毒)、痘苗病毒和/或它们的任何杂合病毒。在一些实施方案中，病毒是减毒的。在一些实施方案中，病毒是复制缺陷性的。在一些实施方案中，病毒是有复制能力的。在一些实施方案中，相对于未修饰野生型病毒的组织趋性，病毒已被修饰来改变它的组织趋性。在一些实施方案中，相较于相应野生型病毒，病毒具有降低的细胞毒性。用于产生包含重组核酸的病毒的方法为本领域普通技术人员所熟知。

在一些实施方案中，病毒是DNA病毒的疱疹病毒科的成员，包括例如单纯疱疹病毒、水痘带状疱疹病毒、人巨细胞病毒、疱疹病毒6A、疱疹病毒6B、疱疹病毒7和卡波西氏肉瘤相关疱疹病毒等。在一些实施方案中，疱疹病毒是减毒的。在一些实施方案中，疱疹病毒是复制缺陷性的。在一些实施方案中，疱疹病毒是有复制能力的。在一些实施方案中，相较于相应野生型疱疹病毒，疱疹病毒具有降低的细胞毒性。在一些实施方案中，疱疹病毒不是溶瘤性的。

在一些实施方案中，病毒是单纯疱疹病毒。包含重组核酸的单纯疱疹病毒可通过例如在WO2015/009952和/或WO2017/176336中公开的方法产生。在一些实施方案中，单纯疱疹病毒是减毒的。在一些实施方案中，单纯疱疹病毒是有复制能力的。在一些实施方案中，单纯疱疹病毒是复制缺陷性的。在一些实施方案中，单纯疱疹病毒是单纯疱疹1型病毒(HSV-1)、单纯疱疹2型病毒(HSV-2)或它们的任何衍生物。在一些实施方案中，单纯疱疹病毒是单纯疱疹1型病毒(HSV-1)。在一些实施方案中，HSV-1是减毒的。在一些实施方案中，相较于相应野生型HSV-1，HSV-1具有降低的细胞毒性。在一些实施方案中，HSV-1不是溶瘤性的。

在一些实施方案中，相对于未修饰野生型单纯疱疹病毒的组织趋性，单纯疱疹病毒已被修饰来改变它的组织趋性。在一些实施方案中，单纯疱疹病毒包含经修饰包膜。在一些实施方案中，经修饰包膜包含一种或多种(例如一种或多种、两种或更多种、三种或更多种、四种或更多种等)突变单纯疱疹病毒糖蛋白。单纯疱疹病毒糖蛋白的实例可包括但不限于糖蛋白gB、gC、gD、gH和gL。在一些实施方案中，相对于野生型单纯疱疹病毒，经修饰包膜改变单纯疱疹病毒组织趋性。

在一些实施方案中，本公开的病毒(例如疱疹病毒)对一种或多种靶标细胞(例如一种或多种人角质化细胞和/或纤维母细胞)的转导效率(体外和/或体内)是至少约25％。举例来说，病毒对一种或多种靶标细胞的转导效率可为至少约25％、至少约30％、至少约35％、至少约40％、至少约45％、至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约99％、至少约99.5％或更高。在一些实施方案中，病毒是单纯疱疹病毒，并且病毒对一种或多种靶标细胞(例如一种或多种人角质化细胞和/或纤维母细胞)的转导效率是约85％至约100％。在一些实施方案中，病毒是单纯疱疹病毒，并且病毒对一种或多种靶标细胞(例如一种或多种人角质化细胞和/或纤维母细胞)的转导效率是至少约85％、至少约86％、至少约87％、至少约88％、至少约89％、至少约90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或100％。在体外或在体内测量病毒转导效率的方法为本领域普通技术人员所熟知，包括例如qPCR分析、深度测序、蛋白质印迹、荧光分析(诸如荧光原位杂交(FISH)、荧光报告基因表达、免疫荧光、FACS)等。

V.组合物和制剂

本公开的某些方面涉及包含重组核酸(例如重组疱疹病毒基因组)和/或病毒(例如包含本文所述的重组基因组的疱疹病毒，诸如包含重组单纯疱疹病毒基因组的单纯疱疹病毒)中的任一者以及赋形剂或载体(例如药学上可接受的赋形剂或载体)的组合物和制剂(例如药物组合物和制剂)。在一些实施方案中，组合物或制剂是美容组合物或制剂(例如皮肤护理产品)。

在一些实施方案中，组合物或制剂包含本文所述的病毒(例如疱疹病毒)中的任何一者或多者。在一些实施方案中，组合物或制剂包含约10⁴至约10¹²个空斑形成单位(PFU)/mL的病毒。举例来说，组合物或制剂可包含约10⁴至约10¹²、约10⁵至约10¹²、约10⁶至约10¹²、约10⁷至约10¹²、约10⁸至约10¹²、约10⁹至约10¹²、约10¹⁰至约10¹²、约10¹¹至约10¹²、约10⁴至约10¹¹、约10⁵至约10¹¹、约10⁶至约10¹¹、约10⁷至约10¹¹、约10⁸至约10¹¹、约10⁹至约10¹¹、约10¹⁰至约10¹¹、约10⁴至约10¹⁰、约10⁵至约10¹⁰、约10⁶至约10¹⁰、约10⁷至约10¹⁰、约10⁸至约10¹⁰、约10⁹至约10¹⁰、约10⁴至约10⁹、约10⁵至约10⁹、约10⁶至约10⁹、约10⁷至约10⁹、约10⁸至约10⁹、约10⁴至约10⁸、约10⁵至约10⁸、约10⁶至约108、约10⁷至约10⁸、约10⁴至约10⁷、约10⁵至约10⁷、约10⁶至约10⁷、约10⁴至约10⁶、约10⁵至约10⁶、或约10⁴至约10⁵PFU/mL的病毒。在一些实施方案中，组合物或制剂包含约10⁴、约10⁵、约10⁶、约10⁷、约10⁸、约10⁹、约10¹⁰、约10¹¹或约10¹²PFU/mL的病毒。

如本文所述的组合物和制剂(例如药物组合物和制剂)可通过使一种或多种具有所需纯度的活性成分(诸如重组核酸或病毒)与一种或多种可接受的载体或赋形剂混合来制备。可接受的载体或赋形剂(例如药学上可接受的载体或赋形剂)在所用剂量和浓度下通常对接受者无毒，并且可包括但不限于：缓冲剂(诸如磷酸盐、柠檬酸盐、乙酸盐和其他有机酸)；抗氧化剂(诸如抗坏血酸和甲硫氨酸)；防腐剂(诸如十八烷基二甲基苯甲基氯化铵、苯扎氯铵、苄索氯铵、苯酚、丁醇或苯甲醇、对羟基苯甲酸烷基酯、儿茶酚、间苯二酚、环己醇、3-戊醇和间甲酚)；氨基酸(诸如甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、精氨酸或赖氨酸)；低分子量(小于约10个残基)多肽；蛋白质(诸如血清白蛋白、明胶或免疫球蛋白)；多元醇(诸如甘油，例如包括10％甘油的制剂)；亲水性聚合物(诸如聚乙烯吡咯烷酮)；单糖、二糖和其他碳水化合物(包括葡萄糖、甘露糖或糊精)；螯合剂(诸如EDTA)；糖(诸如蔗糖、甘露糖醇、海藻糖或山梨糖醇)；成盐反离子(诸如钠)；金属络合物(诸如Zn-蛋白质络合物)；脂质体(例如阳离子脂质)；纳米粒子载体；和/或非离子表面活性剂(诸如聚乙二醇(PEG))。对载体的彻底讨论可在REMINGTON’S PHARMACEUTICAL SCIENCES(Mack Pub.Co.,N.J.1991)中获得。

在一些实施方案中，组合物或制剂包含一种或多种脂质(例如阳离子脂质)载体。在一些实施方案中，组合物或制剂包含一种或多种纳米粒子载体。纳米粒子是可携带囊封化药物以达成快速或控制释放的亚微米(小于约1000nm)大小的药物递送载体，所述药物诸如是合成小分子、蛋白质、肽、细胞、病毒和基于核酸的生物治疗剂。多种分子(例如蛋白质、肽、重组核酸等)可使用本领域中熟知的方法来高效囊封在纳米粒子中。在一些实施方案中，“囊封”在纳米粒子中的分子可指含于所述纳米粒子内或连接于所述纳米粒子的表面和/或与所述纳米粒子的表面联合或呈它们的任何组合的形式的分子(诸如病毒)。用于本文所述的组合物或制剂中的纳米粒子可为本领域中已知的任何类型的生物可相容纳米粒子，包括例如包含聚(乳酸)、聚(乙醇酸)、PLGA、PLA、PGA以及它们的任何组合的纳米粒子(参见例如Vauthier等Adv Drug Del Rev.(2003)55:519-48；US2007/0148074；US2007/0092575；US2006/0246139；US5753234；US7081483；以及WO2006/052285)。

在一些实施方案中，载体或赋形剂(例如药学上可接受的载体或赋形剂)可适合于或适于本领域中已知的任何施用途径，包括例如静脉内、肌肉内、皮下、经皮肤、鼻内、气管内、舌下、经颊、局部、口服、经皮、真皮内、腹膜内、眶内、玻璃体内、视网膜下、经粘膜、关节内、通过浅表注射、通过植入、通过吸入、鞘内、室内和/或鼻内施用。在一些实施方案中，载体或赋形剂(例如药学上可接受的载体或赋形剂)适合于或适于局部、经皮、皮下和/或真皮内施用。在一些实施方案中，载体或赋形剂适合于或适于局部、经皮和/或真皮内施用。在一些实施方案中，载体或赋形剂适合于或适于浅表注射。

适合于或适于在局部、经皮、皮下、浅表和/或真皮内施加/施用中使用的载体或赋形剂的实例可包括但不限于软膏、油、糊、乳膏、气雾、混悬液、乳液、脂肪软膏、凝胶、粉末、液体、洗液、溶液、喷雾、贴片(例如经皮贴片或微针贴片)、粘合带、微针或微针阵列、以及吸入物。在一些实施方案中，载体或赋形剂(例如药学上可接受的载体或赋形剂)包括软膏、油、糊、乳膏、气雾、混悬液、乳液、脂肪软膏、凝胶、粉末、液体、洗液、溶液、喷雾、粘合带和吸入物中的一者或多者(例如一者或多者、两者或更多者、三者或更多者、四者或更多者、五者或更多者等)。在一些实施方案中，载体包括贴片(例如粘着于皮肤的贴片)，诸如经皮贴片或微针贴片。在一些实施方案中，载体包括微针或微针阵列。用于制备和使用适于组合物递送的微针阵列的方法通常在本领域中是已知的(Kim Y.等“Microneedles for drug andvaccine delivery”.Advanced Drug Delivery Reviews 2012,64(14):1547-68)。

在一些实施方案中，组合物或制剂(例如药物组合物或制剂)适合于或适于本领域中已知的任何施用途径，包括例如静脉内、肌肉内、皮下、经皮肤、口服、鼻内、气管内、舌下、经颊、局部、经皮、真皮内、腹膜内、眶内、玻璃体内、视网膜下、经粘膜、关节内、通过浅表注射、通过植入、通过吸入、鞘内、室内和/或鼻内施用。在一些实施方案中，组合物或制剂适合于或适于经皮肤、局部、经皮、皮下和/或真皮内施用。在一些实施方案中，药物组合物或制剂适合于或适于局部、经皮和/或真皮内施用。在一些实施方案中，组合物或制剂适合于或适于真皮内施用。在一些实施方案中，组合物或制剂适合于或适于浅表注射。

在一些实施方案中，组合物或制剂(例如药物组合物或制剂)还包含一种或多种额外组分。额外组分的实例可包括但不限于粘合剂(例如预凝胶化玉米淀粉、聚乙烯吡咯烷酮或羟丙基甲基纤维素等)；填充剂(例如乳糖和其他糖、微晶纤维素、果胶、明胶、硫酸钙、乙基纤维素、聚丙烯酸盐或磷酸氢钙等)；润滑剂(例如硬脂酸镁、滑石、二氧化硅、胶体二氧化硅、硬脂酸、金属硬脂酸盐、氢化植物油、玉米淀粉、聚乙二醇、苯甲酸钠、乙酸钠等)；崩解剂(例如淀粉、淀粉乙醇酸钠等)；湿润剂(例如月桂基硫酸钠等)；盐溶液；醇；聚乙二醇；明胶；乳糖；淀粉酶；硬脂酸镁；滑石；硅酸；粘性石蜡；羟甲基纤维素；聚乙烯吡咯烷酮；甜味剂；调味剂；芳香剂；着色剂；保湿剂；遮光剂；抗细菌剂；能够使多核苷酸稳定或防止它们的降解的试剂等。在一些实施方案中，组合物或制剂包含羟丙基甲基纤维素凝胶。在一些实施方案中，组合物或制剂包含磷酸盐缓冲剂。在一些实施方案中，组合物或制剂包含甘油(例如以约1％、约2％、约3％、约4％、约5％、约6％、约7％、约8％、约9％、约10％、约15％等)。

待用于体内施用的组合物和制剂(例如药物组合物和制剂)通常是无菌的。无菌性可易于例如通过经无菌过滤膜过滤来实现。

在一些实施方案中，本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于将一种或多种编码胶原蛋白(例如人胶原蛋白诸如胶原3)的多核苷酸递送至受试者的一种或多种细胞(例如一种或多种胶原缺乏性细胞)中。在一些实施方案中，本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于疗法中。在一些实施方案中，本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于治疗将受益于胶原多肽的表达的美容或美容性状况(例如与胶原缺乏相关的美容或美容性状况(诸如老化和/或UV损害的皮肤))。在一些实施方案中，本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于治疗皮肤学老化(例如如下所述)。

在一些实施方案中，本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于制备或制造药剂。在一些实施方案中，本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于制备或制造可用于将一种或多种编码胶原蛋白(例如人胶原蛋白诸如胶原3)的多核苷酸递送至受试者的一种或多种细胞(例如一种或多种胶原缺乏性细胞)中的药剂。在一些实施方案中，本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于制备或制造可用于治疗将受益于胶原多肽的表达的美容或美容性状况(例如与胶原缺乏相关的美容或美容性状况(诸如老化和/或UV损害的皮肤))的药剂。在一些实施方案中，本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于制备或制造可用于治疗皮肤学老化(例如如下所述)的药剂。

VI.方法

本公开的某些方面涉及一种增强、增加、加强和/或补充受试者中(例如受试者的一种或多种细胞中)一种或多种真皮细胞外基质蛋白的水平的方法，所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中，受试者是人。

本公开的其他方面涉及使受试者中真皮细胞外基质的结构和/或组织稳定或改进的方法，所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中，受试者是人。

本公开的其他方面涉及一种增强、增加、加强和/或补充受试者中(例如受试者的一种或多种细胞中)一种或多种人胶原蛋白的水平的方法，所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中，受试者是人。

在一些实施方案中，相较于受试者的一种或多种相应未治疗细胞(例如在治疗之前的一种或多种细胞、在治疗期间的一种或多种未感染细胞等)中一种或多种胶原的内源性水平，重组核酸、病毒、药剂和/或组合物向受试者的施用使受试者的一种或多种细胞中的胶原(例如COL1-1；COL1-2；COL3；COL1-1和COL1-2；COL1-1和COL3；等)水平(转录物或蛋白质水平)增加至少约10％。举例来说，相较于受试者的一种或多种相应未治疗细胞中一种或多种胶原的内源性水平，重组核酸、病毒、药剂和/或组合物的施用可使受试者的一种或多种细胞中的胶原水平(转录物或蛋白质水平)增加至少约10％、至少约15％、至少约20％、至少约25％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约99％或更多。在一些实施方案中，相较于受试者的一种或多种相应未治疗细胞(例如在治疗之前的一种或多种细胞、在治疗期间的一种或多种未感染细胞等)中一种或多种胶原的内源性水平，重组核酸、病毒、药剂和/或组合物向受试者的施用使受试者的一种或多种细胞中的胶原水平(转录物或蛋白质水平)增加至至少约2倍。举例来说，相较于受试者的一种或多种相应未治疗细胞中一种或多种胶原的内源性水平，重组核酸、病毒、药剂和/或组合物的施用可使受试者的一种或多种细胞中的胶原水平(转录物或蛋白质水平)增加至至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约50倍、至少约75倍、至少约100倍、至少约250倍、至少约500倍、至少约750倍、至少约1000倍或更多倍。从样品测量转录物或蛋白质水平的方法为本领域普通技术人员所熟知，包括例如通过qPCR、RNA测序、ELISA、蛋白质印迹、质谱测定法等。

本公开的其他方面涉及一种增强、增加、加强和/或补充受试者的软组织的方法，所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中，受试者是人。在一些实施方案中，将重组核酸、病毒、药剂和/或组合物注射至受试者的软组织中。在一些实施方案中，受试者的皮肤是老化中的皮肤。在一些实施方案中，受试者的皮肤已由于暴露于紫外光(例如来自太阳，来自晒黑床等)而受损害。在一些实施方案中，受试者的皮肤是有皱纹的。

在一些实施方案中，重组核酸、病毒、药剂和/或组合物可用于用以修复和/或加强受试者的软组织的方法中。在一些实施方案中，“组织修复”是指恢复组织构造和/或功能，并且涵盖组织再生和置换。在一些实施方案中，修复或加强软组织是指用于恢复皮肤的年轻外观(例如相较于外观归因于由时序性老化或其他物理、化学或UV损害所致的缺陷的“老化”皮肤)的程序。在一些实施方案中，重组核酸、病毒、药剂和/或组合物可用于美容软组织应用中，诸如以填充皱纹、纹路、皱褶、疤痕，以及使真皮组织增强(例如使薄唇饱满，填充凹眼和/或浅面颊等)。

本公开的其他方面涉及一种使有需要的受试者的皮肤品质、状况和/或外观改进的方法，所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中，受试者是人。在一些实施方案中，皮肤状况是日光损害、老化、UV暴露、粗糙纹理、皮肤下陷和/或皱纹中的一者或多者。皮肤品质、状况和/或外观的改进(例如相较于在治疗之前)可使用包括例如FACE Q、GAIS等的本领域中已知的任何适当方法或量表来评估。在一些实施方案中，受试者的皮肤是老化中的皮肤。在一些实施方案中，受试者的皮肤已由于暴露于紫外光(例如来自太阳，来自晒黑床等)而受损害。在一些实施方案中，受试者的皮肤是有皱纹的。

本公开的其他方面涉及一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法，所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中，受试者是人。在一些实施方案中，重组核酸、病毒、药剂和/或组合物的施用持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来减少受试者的皮肤中一种或多种浅表凹陷的出现。在一些实施方案中，相较于在施用组合物之前受试者的皮肤中一种或多种浅表凹陷的出现，在施用组合物之后，受试者的皮肤中一种或多种浅表凹陷的出现得以减少。在一些实施方案中，皮肤中一种或多种浅表凹陷是细纹和皱纹(例如前额皱纹、“鱼尾纹”、在眼或口的边缘的皱纹等)中的一者或多者。在一些实施方案中，对一种或多种浅表皮肤凹陷的治疗通过相较于非治疗皮肤，在皮肤纹理或皮肤品质诸如光滑度、水化和弹性方面的改进来度量。在一些实施方案中，对一种或多种浅表皮肤凹陷的治疗通过浅表凹陷的严重性(例如深度)的减轻和/或皮肤的给定区域中细纹或皱纹的数目的降低来度量。在一些实施方案中，受试者的皮肤是老化中的皮肤。在一些实施方案中，受试者的皮肤已由于暴露于紫外光(例如来自太阳，来自晒黑床等)而受损害。在一些实施方案中，受试者的皮肤是有皱纹的。

本公开的其他方面涉及一种使受试者的皮肤的纹理、光滑度、弹性和/或张力中的至少一者增加和/或改进的方法，所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中，受试者是人。在一些实施方案中，在施用组合物之后，受试者的皮肤持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来维持纹理、光滑度、弹性或张力增加和/或改进中的至少一者。在一些实施方案中，相较于在施用组合物之前受试者的皮肤的纹理、光滑度、弹性或张力，在施用组合物之后，受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者得以增加和/或改进。测量皮肤的纹理、光滑度、弹性和/或张力的方法为本领域技术人员所知。在一些实施方案中，受试者的皮肤是老化中的皮肤。在一些实施方案中，受试者的皮肤已由于暴露于紫外光(例如来自太阳，来自晒黑床等)而受损害。在一些实施方案中，受试者的皮肤是有皱纹的。

本公开的其他方面涉及一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法，所述方法包括向所述受试者施用有效量的本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中，受试者是人。在一些实施方案中，减弱一种或多种皮肤学老化征象包括以下中的任何一者或多者：治疗、减轻和/或预防细纹和/或皱纹；降低皮肤孔尺寸；改进皮肤厚度、饱满度和/或紧固度；改进皮肤光滑度、柔韧性和/或柔软度；改进皮肤色泽、光亮度和/或透明度；改进原胶原和/或胶原产生；改进皮肤纹理和/或促进再纹理化；改进皮肤轮廓的外观；恢复皮肤光泽和/或亮度；改进由于老化和/或绝经而减退的皮肤外观；改进皮肤保湿；增加皮肤弹性和/或回弹力；治疗、减轻和/或预防皮肤下陷；改进皮肤紧致度；减轻色素斑点、斑点化皮肤和/或疤痕(诸如痤疮疤痕)；和/或改进就光衍射或反射来说的皮肤光学性质。在一些实施方案中，相较于在施用组合物之前受试者的一种或多种皮肤学老化征象，在施用组合物之后，受试者的一种或多种皮肤学老化征象得到减弱。可使用本领域中已知的用于测量一种或多种皮肤学老化征象的任何适合方法。

在一些实施方案中，在用有效量的本文所述的重组核酸、病毒、药剂和/或组合物中的任一者治疗之前，对受试者的皮肤的一个或多个部分进行磨削，或使得所述一个或多个部分更加可穿透。可使用本领域中已知的磨削皮肤或使皮肤可穿透性增加的任何适合方法，包括例如使用皮肤滚轮，重复使用粘合带来移除皮肤细胞层(胶带剥落)，用解剖刀或刀片刮削，使用砂纸，使用化学穿透增强剂或电能，使用声波或超声波能，使用光(例如激光)能，使用长度适于刺穿但不完全穿过表皮的微米大小的针或刀片等。

在一些实施方案中，本公开的方法用于美容应用，诸如减少或消除皮肤中一种或多种浅表凹陷，减少或消除一种或多种皱纹，和/或预防一种或多种皱纹的出现或再现。在一些实施方案中，皮肤中一种或多种浅表凹陷或皱纹选自鼻唇皱褶、鱼尾纹、皱眉纹、烦恼纹、疤痕、眉间纹、眉下垂、泪槽、鼻颊纹、兔宝宝纹、面颊/面中部下垂、木偶纹、罂粟陷窝、微笑纹、笑纹、下巴皱痕、颈纹、颈阔肌带以及它们的任何组合。

在一些实施方案中，“有效量”是为影响特定状况(例如美容状况诸如皮肤老化)的一种或多种征象或症状的可测量改进或预防所述一种或多种征象或症状所需的至少最小量。“有效量”可根据诸如患者的年龄、性别和重量的因素而变化。有效量还是其中有益作用胜过治疗的任何毒性或有害作用的量。有效量可以一次或多次施用加以施用。出于本公开的目的，重组核酸、病毒、药剂和/或组合物的有效量是足以直接或间接实现可测量改进的量。如在临床情形下所了解，重组核酸、病毒、药剂和/或组合物的有效量可或可不与另一药物、化合物或组合物联合实现。因此，可在施用一种或多种药剂的情形下考虑“有效量”，并且如果在与一种或多种其他药剂联合的情况下可实现或实现了合乎需要的结果，那么单一药剂可被视为以有效量给与。

在一些实施方案中，向受试者施用重组核酸、病毒、药剂和/或组合物一次。在一些实施方案中，向受试者施用重组核酸、病毒、药剂和/或组合物至少两次(例如至少2次、至少3次、至少4次、至少5次、至少10次等)。在一些实施方案中，在施用之间(例如在第一施用与第二施用之间，在第二施用与第三施用之间，等)，经过至少约15天(例如至少约15天、至少约20天、至少约30天、至少约40天、至少约50天、至少约60天、至少约70天、至少约80天、至少约90天、至少约100天、至少约120天等)。

本文所述的重组核酸、病毒、药剂和/或组合物或制剂可通过本领域中已知的任何适合方法或途径施用，包括不限于通过口服施用、舌下施用、经颊施用、局部施用、经直肠施用、通过吸入、经皮施用、皮下注射、真皮内注射、浅表注射、静脉内(IV)注射、动脉内注射、肌肉内注射、心内注射、骨内注射、腹膜内注射、经粘膜施用、经阴道施用、尿道内施用、玻璃体内施用、眶内施用、视网膜下施用、关节内施用、关节周施用、局部施用、皮上施用或它们的任何组合。因此，本公开涵盖将本文所述的重组核酸、病毒、药剂和/或组合物或制剂中的任一者递送至个体的方法。

在一些实施方案中，重组核酸、病毒、药剂和/或组合物或制剂以经皮肤方式、局部、经皮方式、皮下方式和/或真皮内方式向受试者施用。在一些实施方案中，重组核酸、病毒、药剂和/或组合物或制剂以真皮内方式和/或皮下方式施用。在一些实施方案中，重组核酸、病毒、药剂和/或组合物或制剂通过浅表注射来施用。在一些实施方案中，重组核酸、病毒、药剂和/或组合物或制剂局部和/或经皮方式施用。在一些实施方案中，每天一次、两次、三次、四次、五次或更多次施用重组核酸、病毒、药剂和/或组合物或制剂。在一些实施方案中，向个体的一个或多个受影响(例如有皱纹)区域施用重组核酸、病毒、药剂和/或组合物或制剂。在一些实施方案中，向个体的一个或多个未受影响区域施用组合物。

在一些实施方案中，在皮肤中在浅表深度下施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，在约2000微米或更小的深度下将重组核酸、病毒、药剂和/或组合物引入皮肤中。举例来说，可在约2000微米或更小，约1750微米或更小，约1500微米或更小，约1250微米或更小，约1000微米或更小，约900微米或更小，约800微米或更小，约700微米或更小，约600微米或更小，或约500微米或更小的深度下向皮肤中施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，在约0.5mm与5.0mm之间的注射深度下引入重组核酸、病毒、药剂和/或组合物。举例来说，可在约0.5mm与5.0mm，约0.5mm与4.5mm，约0.5mm与4.0mm，约0.5mm与3.5mm，约0.5mm与3.0mm，约0.5mm与2.5mm，约0.5mm与2.0mm，约0.5mm与1.5mm，约0.5mm与1.0mm，1.0mm与5.0mm，约1.0mm与4.5mm，约1.0mm与4.0mm，约1.0mm与3.5mm，约1.0mm与3.0mm，约1.0mm与2.5mm，约1.0mm与2.0mm，约1.0mm与1.5mm，1.5mm与5.0mm，约1.5mm与4.5mm，约1.5mm与4.0mm，约1.5mm与3.5mm，约1.5mm与3.0mm，约1.5mm与2.5mm，约1.5mm与2.0mm等之间的注射深度下引入重组核酸、病毒、药剂和/或组合物。

在一些实施方案中，重组核酸、病毒、药剂和/或组合物通过以约1mm至约30mm之间的距离加以间隔开的注射来施用。举例来说，重组核酸、病毒、药剂和/或组合物可通过以约1mm与30mm，2mm与30mm，5mm与30mm，10mm与30mm，15mm与30mm，1mm与20mm，2mm与20mm，5mm与20mm，10mm与20mm，15mm与20mm，1mm与15mm，2mm与15mm，5mm与15mm，10mm与15mm，1mm与10mm，2mm与10mm，5mm与10mm，1mm与5mm，2mm与5mm等之间的距离加以间隔开的注射来施用。在一些实施方案中，注射以至少约1mm、至少约2mm、至少约5mm、至少约10mm、至少约15mm、至少约20mm、至少约30mm或更大的距离加以间隔开。

身体的众多区域可用本文所述的重组核酸、病毒、药剂和/或组合物治疗，包括例如面部、前额、唇、头皮、颈、臂、手、腿、膝、足、胸、背、腹股沟、臀部、大腿等。在一些实施方案中，向面部施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个鼻唇皱褶施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，在一只或两只眼的周围施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个鱼尾纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个皱眉纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个疤痕(例如痤疮疤痕)施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个眉间纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个眉下垂施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个深度泪槽施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个鼻颊纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个兔宝宝纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个面颊/面中部下垂施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个木偶纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个罂粟陷窝部位施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个下巴皱痕施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个颈纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中，向一个或多个颈阔肌带施用重组核酸、病毒、药剂和/或组合物。

在一些实施方案中，当将重组核酸递送至受试者的一种或多种靶标细胞中时，重组核酸表达一种或多种美容蛋白(例如人胶原)。在一些实施方案中，一种或多种美容蛋白(例如人胶原)的表达增强、增加、加强和/或补充一种或多种靶标细胞中人胶原的水平。在一些实施方案中，一种或多种美容蛋白(例如人胶原)的表达增强、增加、加强和/或补充由一种或多种靶标细胞分泌的人胶原的水平。在一些实施方案中，一种或多种美容蛋白(例如人胶原)的表达增强、增加、加强和/或补充细胞外基质中人胶原的水平。在一些实施方案中，一种或多种美容蛋白(例如人胶原)的表达增强、增加、加强和/或补充受试者中细胞外基质的稳定性。在一些实施方案中，一种或多种美容蛋白(例如人胶原)的表达增强、加强和/或补充受试者的软组织。在一些实施方案中，一种或多种美容蛋白(例如人胶原)的表达使个体的皮肤品质、状况和/或外观改进。在一些实施方案中，一种或多种美容蛋白(例如人胶原)的表达使受试者的皮肤中的一种或多种浅表凹陷(例如皱纹)减少。在一些实施方案中，一种或多种美容蛋白(例如人胶原)的表达使受试者的皮肤的纹理、光滑度、弹性和/或张力改进。在一些实施方案中，一种或多种美容蛋白(例如人胶原)的表达使受试者的一种或多种皮肤学老化征象减轻。

VII.宿主细胞

本公开的某些方面涉及一种或多种包含本文所述的任何重组核酸的宿主细胞。可使用本领域中已知的任何适合宿主细胞(原核或真核)，包括例如：原核细胞，包括真细菌，诸如革兰氏阴性或革兰氏阳性生物体，例如肠杆菌科(Enterobacteriaceae)诸如埃希氏菌属(Escherichia)(例如大肠杆菌(E.coli))、肠杆菌属(Enterobacter)、欧文氏菌属(Erminia)、克雷伯氏菌属(Klebsiella)、变形杆菌属(Proteus)、沙门氏菌属(Salmonella)(例如鼠伤寒沙门氏菌(S.typhimurium))、沙雷氏菌属(Serratia)(例如粘质沙雷氏菌(S.marcescans))和志贺氏菌属(Shigella)，以及杆菌(Bacilli)诸如枯草芽孢杆菌(B.subtilis)和地衣芽孢杆菌(B.licheniformis)；真菌细胞(例如酿酒酵母(S.cerevisiae))；昆虫细胞(例如S2细胞等)；以及哺乳动物细胞，包括由SV40转化的猴肾CV1株系(COS-7，ATCC CRL 1651)、人胚肾株系(293细胞或被亚克隆来达成悬浮培养生长的293细胞)、幼小仓鼠肾细胞(BHK，ATCC CCL 10)、小鼠塞尔托利细胞(Sertoli cell)(TM4)、猴肾细胞(CV1 ATCC CCL 70)、非洲绿猴肾细胞(VERO-76，ATCC CRL-1587)、人宫颈癌细胞(HELA，ATCC CCL 2)、犬肾细胞(MDCK，ATCC CCL 34)、水牛大鼠肝细胞(BRL 3A，ATCC CRL1442)、人肺细胞(W138，ATCC CCL 75)、人肝细胞(Hep G2，HB 8065)、小鼠乳腺肿瘤(MMT060562，ATCC CCL51)、TRI细胞、MRC 5细胞、FS4细胞、人肝细胞瘤株系(Hep G2)、中国仓鼠卵巢(CHO)细胞，包括DHFR"CHO细胞，以及骨髓瘤细胞系，诸如NS0和Sp2/0。在一些实施方案中，宿主细胞是人或非人灵长类动物细胞。在一些实施方案中，宿主细胞是Vero细胞。在一些实施方案中，宿主细胞是补充性宿主细胞。在一些实施方案中，宿主细胞(例如Vero细胞)表达一种或多种单纯疱疹病毒基因(例如ICP4基因)。在一些实施方案中，宿主细胞是来自细胞系的细胞。适合宿主细胞或细胞系的实例可包括但不限于293、HeLa、SH-Sy5y、Hep G2、CACO-2、A549、L929、3T3、K562、CHO-K1、MDCK、HUVEC、Vero、N20、COS-7、PSN1、VCaP、CHO细胞等。

在一些实施方案中，重组核酸是单纯疱疹病毒载体。在一些实施方案中，重组核酸是单纯疱疹病毒扩增子。在一些实施方案中，重组核酸是HSV-1扩增子或HSV-1杂合扩增子。在一些实施方案中，使包含辅助病毒的宿主细胞与本文所述的HSV-1扩增子或HSV-1杂合扩增子接触，从而导致产生包含本文所述的一种或多种重组核酸的病毒。在一些实施方案中，从经接触宿主细胞的上清液收集病毒。通过使包含辅助病毒的宿主细胞与HSV-1扩增子或HSV-1/杂合扩增子接触来产生病毒的方法在本领域中是已知的。

在一些实施方案中，宿主细胞是补充性宿主细胞。在一些实施方案中，补充性宿主细胞表达一种或多种在本文所述的任何病毒载体中失活的基因。在一些实施方案中，使补充性宿主细胞与本文所述的重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)接触。在一些实施方案中，使补充性宿主细胞与重组疱疹病毒基因组接触导致产生包含本文所述的一种或多种重组核酸的疱疹病毒。在一些实施方案中，从经接触宿主细胞的上清液收集病毒。通过使补充性宿主细胞与重组单纯疱疹病毒接触来产生病毒的方法一般地描述于WO2015 009952和/或WO2017/176336中。

VIII.制品或药盒

本公开的某些方面涉及一种包括本文所述的重组核酸、病毒、药剂和/或组合物或制剂(例如药物组合物或制剂)中的任一者的制品或药盒。在一些实施方案中，制品或药盒包括包含关于施用重组核酸、病毒、药剂和/或组合物或制剂(例如以治疗真皮细胞外基质蛋白(例如胶原)缺乏和/或矫正一种或多种皮肤学老化征象)的说明的包装插页。

适于重组核酸、病毒、药剂和/或组合物或制剂的容器可包括例如瓶、小瓶、袋、管和注射器。容器可由多种材料诸如玻璃、塑料(诸如聚氯乙烯或聚烯烃)或金属合金(诸如不锈钢或哈斯特合金(hastelloy))形成。在一些实施方案中，容器包括在容器上或与容器相伴的标签，其中所述标签指示使用说明。制品或药盒可还包括从商业和使用者观点来看可合乎需要的其他材料，包括其他缓冲剂、稀释剂、过滤器、针、注射器、包装插页等。

IX.列举的实施方案

实施方案1：一种组合物，所述组合物包含：(a)包含重组核酸的单纯疱疹病毒(HSV)，其中所述重组核酸包含编码第一多肽的第一多核苷酸，所述第一多肽包含第一人胶原蛋白，和(b)赋形剂。

实施方案2：如实施方案1所述的组合物，其中所述重组核酸包含所述第一多核苷酸的两个或更多个拷贝。

实施方案3：如实施方案1或2所述的组合物，其中所述HSV是复制缺陷性的。

实施方案4：如实施方案1或2所述的组合物，其中所述HSV是有复制能力的。

实施方案5：如实施方案1-4中的任一者所述的组合物，其中所述HSV是单纯疱疹1型病毒、单纯疱疹2型病毒或它们的任何衍生物。

实施方案6：如实施方案1-5中的任一者所述的组合物，其中所述重组核酸是单纯疱疹病毒扩增子。

实施方案7：如实施方案6所述的组合物，其中所述单纯疱疹病毒扩增子是HSV-1扩增子或HSV-1杂合扩增子。

实施方案8：如实施方案7所述的组合物，其中所述HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子、以及HSV/EBV/RV杂合扩增子、或HSV/睡美人杂合扩增子。

实施方案9：如实施方案1-5中的任一者所述的组合物，其中所述重组核酸是重组单纯疱疹病毒基因组。

实施方案10：如实施方案9所述的组合物，其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。

实施方案11：如实施方案9或10所述的组合物，其中所述重组单纯疱疹病毒基因组在单纯疱疹病毒基因中包含失活性突变。

实施方案12：如实施方案11所述的组合物，其中所述单纯疱疹病毒基因选自由感染细胞蛋白(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和UL55组成的组。

实施方案13：如实施方案12所述的组合物，其中所述重组单纯疱疹病毒基因组在所述ICP4基因的一个或两个拷贝中包含失活突变。

实施方案14：如实施方案12或13所述的组合物，其中所述重组单纯疱疹病毒基因组在所述ICP22基因中包含失活性突变。

实施方案15：如实施方案12-14中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在所述UL41基因中包含失活突变。

实施方案16：如实施方案12-15中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在所述ICP0基因中包含失活突变。

实施方案17：如实施方案12-16中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在所述ICP27基因中包含失活突变。

实施方案18：如实施方案11-17中的任一者所述的组合物，其中所述失活性突变是所述一种或多种基因的编码序列的缺失。

实施方案19：如实施方案9-18中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在病毒基因座内包含所述第一多核苷酸。

实施方案20：如实施方案9-19中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸。

实施方案21：如实施方案9-20中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在ICP22病毒基因座内包含所述第一多核苷酸。

实施方案22：如实施方案9-21中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述第一多核苷酸。

实施方案23：如实施方案1-22中的任一者所述的组合物，其中相较于野生型单纯疱疹病毒，所述HSV具有降低的细胞毒性。

实施方案24：如实施方案1-23中的任一者所述的组合物，其中所述第一人胶原蛋白选自由以下组成的组：胶原α-1(I)链多肽(COL1-1)、胶原α-2(I)链多肽(COL1-2)、胶原α-1(II)链多肽(COL2)、胶原α-1(III)链多肽(COL3)、胶原α-1(IV)链多肽(COL4-1)、胶原α-2(IV)链多肽(COL4-2)、胶原α-3(IV)链多肽(COL4-3)、胶原α-4(IV)链多肽(COL4-4)、胶原α-5(IV)链多肽(COL4-5)、胶原α-6(IV)链多肽(COL4-6)、胶原α-1(V)链多肽(COL5-1)、胶原α-2(V)链多肽(COL5-2)、胶原α-3(V)链多肽(COL5-3)、胶原α-1(VI)链多肽(COL6-1)、胶原α-2(VI)链多肽(COL6-2)、胶原α-3(VI)链多肽(COL6-3)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)、胶原α-6(VI)链多肽(COL6-6)、胶原α-1(VII)链多肽(COL7)、胶原α-1(VIII)链多肽(COL8)、胶原α-1(IX)链多肽(COL9-1)、胶原α-2(IX)链多肽(COL9-2)、胶原α-3(IX)链多肽(COL9-3)、胶原α-1(X)链多肽(COL10)、胶原α-1(XI)链多肽(COL11-1)、胶原α-2(XI)链多肽(COL11-2)、胶原α-1(XII)链多肽(COL12)、胶原α-1(XIII)链多肽(COL13)、胶原α-1(XIV)链多肽(COL14)、胶原α-1(XV)链多肽(COL15)、胶原α-1(XVI)链多肽(COL16)、胶原α-1(XVII)链多肽(COL17)、胶原α-1(XVIII)链多肽(COL18)、胶原α-1(XIX)链多肽(COL19)、胶原α-1(XX)链多肽(COL20)、胶原α-1(XXI)链多肽(COL21)、胶原α-1(XXII)链多肽(COL22)、胶原α-1(XXIII)链多肽(COL23)、胶原α-1(XXIV)链多肽(COL24)、胶原α-1(XXV)链多肽(COL25)、胶原α-1(XXVI)链多肽(COL26)、胶原α-1(XXVII)链多肽(COL27)和胶原α-1(XXVIII)链多肽(COL28)。

实施方案25：如实施方案1-24中的任一者所述的组合物，其中所述第一人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。

实施方案26：如实施方案1-25中的任一者所述的组合物，其中编码所述第一人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案27：如实施方案1-26中的任一者所述的组合物，其中所述第一人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案28：如实施方案1-27中的任一者所述的组合物，其中所述第一人胶原蛋白不是COL7。

实施方案29：如实施方案1-28中的任一者所述的组合物，其中所述第一多肽包含：(a)所述第一人胶原蛋白；(b)另一人胶原蛋白；和(c)使(a)连接于(b)的接头多肽。

实施方案30：如实施方案29所述的组合物，其中所述接头多肽是可裂解接头多肽。

实施方案31：如实施方案29或30所述的组合物，其中所述接头多肽包含与选自由SEQ ID NO:28-31组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案32：如实施方案29-31中的任一者所述的组合物，其中所述另一人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。

实施方案33：如实施方案29-32中的任一者所述的组合物，其中所述另一人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。

实施方案34：如实施方案29-33中的任一者所述的组合物，其中编码所述另一人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案35：如实施方案29-34中的任一者所述的组合物，其中所述另一人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案36：如实施方案29-35中的任一者所述的组合物，其中所述第一人胶原蛋白和所述另一人胶原蛋白是不同的。

实施方案37：如实施方案1-36中的任一者所述的组合物，其中所述第一多核苷酸编码多顺反子mRNA，所述多顺反子mRNA包含：(a)编码所述第一多肽的第一开放阅读框(ORF)；(b)编码额外人胶原蛋白的第二ORF；和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。

实施方案38：如实施方案37所述的组合物，其中编码所述IRES的核酸序列与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案39：如实施方案37或38所述的组合物，其中所述额外人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。

实施方案40：如实施方案37-39中的任一者所述的组合物，其中所述额外人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。

实施方案41：如实施方案37-40中的任一者所述的组合物，其中编码所述额外人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案42：如实施方案37-41中的任一者所述的组合物，其中所述额外人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案43：如实施方案37-42中的任一者所述的组合物，其中所述第一人胶原蛋白和所述额外人胶原蛋白是不同的。

实施方案44：如实施方案1-43中的任一者所述的组合物，其中所述重组核酸还包含编码第二人胶原蛋白的第二多核苷酸。

实施方案45：如实施方案44所述的组合物，其中所述重组核酸包含所述第二多核苷酸的两个或更多个拷贝。

实施方案46,如实施方案44或45所述的组合物，其中所述第二人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。

实施方案47：如实施方案44-46中的任一者所述的组合物，其中所述第二人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。

实施方案48：如实施方案44-48中的任一者所述的组合物，其中编码所述第二人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案49：如实施方案44-48中的任一者所述的组合物，其中所述第二人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案50：如实施方案44-49中的任一者所述的组合物，其中所述第一人胶原蛋白和所述第二人胶原蛋白是不同的。

实施方案51：如实施方案44-50中的任一者所述的组合物，其中所述重组核酸是重组单纯疱疹病毒基因组，并且其中所述重组单纯疱疹病毒基因组在病毒基因座内包含所述第二多核苷酸。

实施方案52：如实施方案51所述的组合物，其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第二多核苷酸。

实施方案53：如实施方案51或52所述的组合物，其中所述重组单纯疱疹病毒基因组在ICP22病毒基因座内包含所述第二多核苷酸。

实施方案54：如实施方案51-53中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述第二多核苷酸。

实施方案55：如实施方案51-54中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸，并且在ICP22病毒基因座内包含所述第二多核苷酸。

实施方案56：如实施方案51-54中的任一者所述的组合物，其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸，并且在UL41病毒基因座内包含所述第二多核苷酸。

实施方案57：如实施方案1-56中的任一者所述的组合物，其中所述赋形剂适合于经皮肤(全身性或局部)、经皮、皮下和/或真皮内施用。

实施方案58：如实施方案1-57中的任一者所述的组合物，其中所述赋形剂包括羟丙基甲基纤维素凝胶。

实施方案59：如实施方案1-58中的任一者所述的组合物，其中所述赋形剂适合于真皮内施用。

实施方案60：如实施方案1-59中的任一者所述的组合物，其中所述赋形剂包括磷酸盐缓冲剂。

实施方案61：如实施方案1-60中的任一者所述的组合物，其中所述赋形剂包括甘油。

实施方案62：如实施方案1-61中的任一者所述的组合物，其中所述赋形剂包括脂质载体。

实施方案63：如实施方案1-62中的任一者所述的组合物，其中所述赋形剂包括纳米粒子载体。

实施方案64：如实施方案1-63中的任一者所述的组合物，其中所述组合物是美容组合物。

实施方案65：如实施方案64所述的组合物，其中所述美容组合物是皮肤护理产品。

实施方案66：一种药盒，所述药盒包括：(a)如实施方案1-65中的任一者所述的组合物；和(b)关于施用所述组合物的说明书。

实施方案67：一种增强、增加、加强和/或补充受试者中一种或多种人胶原蛋白的水平的方法，所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。

实施方案68：一种增强、增加、加强和/或补充受试者的软组织的方法，所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。

实施方案69：如实施方案68所述的方法，其中将所述组合物注射至所述受试者的软组织中。

实施方案70：一种使有需要的受试者的皮肤品质、状况和/或外观改进的方法，所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。

实施方案71：如实施方案70所述的方法，其中所述状况选自由日光损害、老化、UV暴露、粗糙纹理、皮肤下陷、皱纹以及它们的任何组合组成的组。

实施方案72：一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法，所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。

实施方案73：如实施方案72所述的方法，其中所述组合物的施用持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来减少所述受试者的皮肤中所述一种或多种浅表凹陷的出现。

实施方案74：如实施方案72或73所述的方法，其中相较于在施用所述组合物之前所述受试者的皮肤中所述一种或多种浅表凹陷的出现，在施用所述组合物之后，所述受试者的皮肤中所述一种或多种浅表凹陷的出现得以减少。

实施方案75：一种使有需要的受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者增加和/或改进的方法，所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。

实施方案76：如实施方案75所述的方法，其中在施用所述组合物之后，所述受试者的皮肤持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来维持纹理、光滑度、弹性或张力增加和/或改进中的至少一者。

实施方案77：如实施方案75或76所述的方法，其中相较于在施用所述组合物之前所述受试者的皮肤的所述纹理、光滑度、弹性或张力，在施用所述组合物之后，所述受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者得以增加和/或改进。

实施方案78：如实施方案70-77中的任一者所述的方法，其中所述受试者的皮肤是老化中的皮肤。

实施方案79：如实施方案70-78中的任一者所述的方法，其中所述受试者的皮肤已由于暴露于紫外光而受损害。

实施方案80：如实施方案70-79中的任一者所述的方法，其中所述受试者的皮肤是有皱纹的。

实施方案81：一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法，所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。

实施方案82：如实施方案81所述的方法，其中一种或多种皮肤学老化征象的所述减弱选自由以下组成的组：(a)细纹和/或皱纹得到治疗、减轻和/或预防；(b)皮肤孔尺寸得到降低；(c)皮肤厚度、饱满度和/或紧固度得到改进；(d)皮肤光滑度、柔韧性和/或柔软度得到改进；(e)皮肤色泽、光亮度和/或透明度得到改进；(f)原胶原和/或胶原产生得到改进；(g)皮肤纹理得到改进和/或再纹理化得到促进；(h)皮肤轮廓的外观得到改进；(i)皮肤光泽和/或亮度得到恢复；(j)由于老化和/或绝经而减退的皮肤外观得到改进；(k)皮肤保湿得到改进；(l)皮肤弹性和/或回弹力得到增加；(m)皮肤下陷得到治疗、减轻和/或预防；(n)皮肤紧致度得到改进；(o)色素斑点、斑点化皮肤和/或痤疮疤痕得到减轻；(p)就光衍射或反射来说的皮肤光学性质得到改进；和(q)它们的任何组合。

实施方案83：如实施方案81或82所述的方法，其中相较于在施用所述组合物之前所述受试者的所述一种或多种皮肤学老化征象，在施用所述组合物之后，所述受试者的所述一种或多种皮肤学老化征象得到减弱。

实施方案84：如实施方案67-83中的任一者所述的方法，其中所述受试者是人。

实施方案85：如实施方案67-84中的任一者所述的方法，其中所述组合物以经皮肤(全身性或局部)方式、经皮方式、皮下方式和/或真皮内方式向所述受试者施用。

实施方案86：如实施方案67-85中的任一者所述的方法，其中所述组合物通过浅表注射来施用。

实施方案87：如实施方案67-85中的任一者所述的方法，其中所述组合物以真皮内方式向所述受试者施用。

实施方案88：如实施方案67-87中的任一者所述的方法，其中向所述受试者施用所述组合物一次。

实施方案89：如实施方案67-87中的任一者所述的方法，其中向所述受试者施用所述组合物至少两次。

实施方案90：如实施方案89所述的方法，其中在施用之间，经过至少约15、至少约30、至少约60、至少约90或至少约120天。

实施方案91：如实施方案67-90中的任一者所述的方法，其中向所述受试者的一个或多个受影响和/或未受影响区域施用所述组合物。

实施方案92：如实施方案67-91中的任一者所述的方法，其中在施用之前对所述受试者的皮肤进行磨削。

实施方案93：一种包含编码第一多肽的第一多核苷酸的重组核酸，所述第一多肽包含第一人胶原蛋白，其中所述重组核酸是重组单纯疱疹病毒基因组。

实施方案94：如实施方案93所述的重组核酸，其中所述重组核酸包含所述第一多核苷酸的两个或更多个拷贝。

实施方案95：如实施方案93或94所述的重组核酸，其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。

实施方案96：如实施方案93-95中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在单纯疱疹病毒基因中包含失活性突变。

实施方案97：如实施方案96所述的重组核酸，其中所述单纯疱疹病毒基因选自由ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55组成的组。

实施方案98：如实施方案97所述的重组核酸，其中所述重组单纯疱疹病毒基因组在所述ICP4基因的一个或两个拷贝中包含失活突变。

实施方案99：如实施方案97或98所述的重组核酸，其中所述重组单纯疱疹病毒基因组在所述ICP22基因中包含失活性突变。

实施方案100：如实施方案97-99中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在所述UL41基因中包含失活突变。

实施方案101：如实施方案97-100中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在所述ICP0基因中包含失活突变。

实施方案102：如实施方案97-101中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在所述ICP27基因中包含失活突变。

实施方案103：如实施方案96-102中的任一者所述的重组核酸，其中所述失活性突变是所述一种或多种基因的编码序列的缺失。

实施方案104：如实施方案93-103中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在病毒基因座内包含所述第一多核苷酸。

实施方案105：如实施方案93-104中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸。

实施方案106：如实施方案93-105中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在ICP22病毒基因座内包含所述第一多核苷酸。

实施方案107：如93-106中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述第一多核苷酸。

实施方案108：如实施方案93-107中的任一者所述的重组核酸，其中所述第一人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。

实施方案109：如实施方案93-108中的任一者所述的重组核酸，其中所述第一人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。

实施方案110：如实施方案93-109中的任一者所述的重组核酸，其中编码所述第一人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案111：如实施方案93-110中的任一者所述的重组核酸，其中所述第一人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案112：如实施方案93-111中的任一者所述的重组核酸，其中所述第一人胶原蛋白不是COL7。

实施方案113：如实施方案93-112中的任一者所述的重组核酸，其中所述第一多肽包含：(a)所述第一人胶原蛋白；(b)另一人胶原蛋白；和(c)使(a)连接于(b)的接头多肽。

实施方案114：如实施方案113所述的重组核酸，其中所述接头多肽是可裂解接头多肽。

实施方案115：如实施方案113或114所述的重组核酸，其中所述接头多肽包含与选自由SEQ ID NO:28-31组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案116：如实施方案113-115中的任一者所述的重组核酸，其中所述另一人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。

实施方案117：如实施方案113-116中的任一者所述的重组核酸，其中所述另一人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。

实施方案118：如实施方案113-117中的任一者所述的重组核酸，其中编码所述另一人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案119：如实施方案113-118中的任一者所述的重组核酸，其中所述另一人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案120：如实施方案113-119中的任一者所述的重组核酸，其中所述第一人胶原蛋白和所述另一人胶原蛋白是不同的。

实施方案121：如实施方案93-120中的任一者所述的重组核酸，其中所述第一多核苷酸编码多顺反子mRNA，所述多顺反子mRNA包含：(a)编码所述第一多肽的第一开放阅读框(ORF)；(b)编码额外人胶原蛋白的第二ORF；和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。

实施方案122：如实施方案121所述的重组核酸，其中编码所述IRES的核酸序列与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案123：如实施方案121或122所述的重组核酸，其中所述额外人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。

实施方案124：如实施方案121-123中的任一者所述的重组核酸，其中所述额外人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。

实施方案125：如实施方案121-124中的任一者所述的重组核酸，其中编码所述额外人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案126：如实施方案121-125中的任一者所述的重组核酸，其中所述额外人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案127：如实施方案121-126中的任一者所述的重组核酸，其中所述第一人胶原蛋白和所述额外人胶原蛋白是不同的。

实施方案128：如实施方案93-127中的任一者所述的重组核酸，其中所述重组核酸还包含编码第二人胶原蛋白的第二多核苷酸。

实施方案129：如实施方案128所述的重组核酸，其中所述重组核酸包含所述第二多核苷酸的两个或更多个拷贝。

实施方案130：如实施方案128或129所述的重组核酸，其中所述第二人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。

实施方案131：如实施方案128-130中的任一者所述的重组核酸，其中所述第二人胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。

实施方案132：如实施方案128-131中的任一者所述的重组核酸，其中编码所述第二人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

实施方案133：如实施方案128-132中的任一者所述的重组核酸，其中所述第二人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

实施方案134：如实施方案128-133中的任一者所述的重组核酸，其中所述第一人胶原蛋白和所述第二人胶原蛋白是不同的。

实施方案135：如实施方案128-134中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在病毒基因座内包含所述第二多核苷酸。

实施方案136：如实施方案135所述的重组核酸，其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第二多核苷酸。

实施方案137：如实施方案135或136所述的重组核酸，其中所述重组单纯疱疹病毒基因组在ICP22病毒基因座内包含所述第二多核苷酸。

实施方案138：如实施方案135-137中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述第二多核苷酸。

实施方案139：如实施方案135-138中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸，并且在ICP22病毒基因座内包含所述第二多核苷酸。

实施方案140：如实施方案135-138中的任一者所述的重组核酸，其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸，并且在UL41病毒基因座内包含所述第二多核苷酸。

实施方案141：一种宿主细胞，所述宿主细胞包含如实施方案93-140中的任一者所述的重组核酸。

实施方案142：如实施方案141所述的宿主细胞，其中所述宿主细胞是真核细胞。

实施方案143：如实施方案141或142所述的宿主细胞，其中所述宿主细胞是哺乳动物细胞。

实施方案144：如实施方案141-143中的任一者所述的宿主细胞，其中所述宿主细胞是人细胞或非人灵长类动物细胞。

实施方案145：如实施方案141-144中的任一者所述的宿主细胞，其中所述宿主细胞是Vero细胞。

实施方案146：如实施方案141-145中的任一者所述的宿主细胞，其中所述宿主细胞是补充性宿主细胞。

实施方案147：一种收集单纯疱疹病毒的方法，所述方法包括：(a)使补充性宿主细胞与如实施方案93-140中的任一者所述的重组核酸接触；以及(b)收集通过所述补充性宿主细胞产生的所述单纯疱疹病毒。

实施方案148：一种收集单纯疱疹病毒的方法，所述方法包括：(a)培养如实施方案141-146中的任一者所述的宿主细胞；以及(b)收集通过所述宿主细胞产生的所述单纯疱疹病毒。

说明书被认为足以使得本领域技术人员能够实施本公开。除本文显示和描述的那些修改之外，本公开的各种修改也将根据先前描述而变得为本领域技术人员显而易知，并且落在随附权利要求的范围内。

实施例

通过参考以下实施例，本公开将得以更充分了解。然而，它不应解释为限制本公开的范围。应了解本文所述的实施例和实施方案仅出于说明目的，并且根据所述实施例和实施方案的各种修改或变化将为本领域技术人员所想起，并将包括在本申请的精神和界限以及随附权利要求的范围内。

实施例1：编码一种或多种人胶原蛋白的经修饰的单纯疱疹病毒载体

为制备能够在靶标哺乳动物细胞(诸如人角质化细胞或纤维母细胞)中表达一种或多种人胶原蛋白的经修饰的单纯疱疹病毒基因组载体，首先修饰单纯疱疹病毒基因组(图1A)以使一种或多种单纯疱疹病毒基因失活。所述修饰可使基因组在哺乳动物细胞中的毒性降低。接着，产生这些经修饰/减毒重组病毒构建体的变体以使它们携带一种或多种编码一种或多种人胶原蛋白的多核苷酸。这些变体包括：1)包含整合在每个ICP4基因座处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组(图1B)；2)包含整合在每个ICP4基因座处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒的重组经ΔICP4修饰HSV-1基因组(图1C)；3)包含整合在每个ICP4基因座处的含有在相同DNA链上的在第一异源性启动子的控制下的第一人胶原蛋白的编码序列和在第二异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组(图1D)；4)包含整合在每个ICP4基因座处的含有在相同DNA链上的在第一异源性启动子的控制下的第一人胶原蛋白的编码序列和在第二异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4修饰HSV-1基因组(图1E)；5)包含整合在每个ICP4基因座处的含有在相反DNA链上的在第一异源性启动子的控制下的第一人胶原蛋白的编码序列和在第二异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组(图1F)；6)包含整合在每个ICP4基因座处的含有在相反DNA链上的在第一异源性启动子的控制下的第一人胶原蛋白的编码序列和在第二异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4修饰HSV-1基因组(图1G)；7)包含整合在ICP4基因座中的每一者处的编码在异源性启动子的控制下的多顺反子mRNA的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组，其中所述多顺反子mRNA含有由内部核糖体进入位点(IRES)分隔的第一人胶原蛋白的编码序列和第二人胶原蛋白的编码序列(图1H)；8)包含整合在ICP4基因座中的每一者处的编码在异源性启动子的控制下的多顺反子mRNA的表达盒的重组经ΔICP4修饰HSV-1基因组，其中所述多顺反子mRNA含有由内部核糖体进入位点(IRES)分隔的第一人胶原蛋白的编码序列和第二人胶原蛋白的编码序列(图1I)；9)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的嵌合蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组，其中所述嵌合蛋白含有由接头多肽的氨基酸序列分隔的第一人胶原蛋白的氨基酸序列和第二人胶原蛋白的氨基酸序列(图1J)；10)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的嵌合蛋白的编码序列的表达盒的重组经ΔICP4修饰HSV-1基因组，其中所述嵌合蛋白含有由接头多肽的氨基酸序列分隔的第一人胶原蛋白的氨基酸序列和第二人胶原蛋白的氨基酸序列(图1K)；11)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒，以及整合在ICP22基因座处的含有在异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组(图1L)；12)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒，以及整合在UL41基因座处的含有在异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22/ΔUL41修饰的HSV-1基因组(图1M)；和13)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒，以及整合在UL41基因座处的含有在异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔUL41修饰的HSV-1基因组(图1N)。

将这些经修饰的单纯疱疹病毒基因组载体转染至被修饰来表达一种或多种疱疹病毒基因的经工程化的Vero细胞中。这些经工程化的Vero细胞将在其中包装有经修饰的基因组的复制缺陷性单纯疱疹病毒分泌至上清液中。接着对上清液进行收集，浓缩，并且经5μm过滤器进行无菌过滤。

实施例2：编码人COL7的HSV候选物的构建和体外分析

胶原α-1(VII)链蛋白(COL7)起使皮肤强化和稳定的作用。简要来说，使COL7A1转录物翻译，所得COL7肽通过羟基化和糖基化加以翻译后修饰，并且糖基化COL7三肽形成从细胞分泌的被称为原胶原的三螺旋。原胶原在分泌后缔合成更高级结构，从而形成锚定原纤维，所述锚定原纤维接着可用于帮助组织上皮基底膜，使上皮基底膜稳定，并且有助于上皮基底膜的粘着。上皮基底膜负责使上皮锚定于下伏的疏松结缔组织，并且为达成真皮-表皮稳定性所必需(真皮-表皮接合完整性)。营养不良性大疱性表皮松解是一种由COL7A1基因中的突变引起的遗传性遗传病状；这个基因中的突变使营养不良性大疱性表皮松解患者中COL7使表皮适当地连接于真皮的能力受损，从而导致皮肤脆弱。作为大疱性表皮松解的最重度形式的隐性营养不良性大疱性表皮松解(RDEB)的特征最经常在于皮肤和粘膜广泛起疱和结疤。

以下实施例描述被修饰来表达人胶原α-1(VII)链多肽(COL7)的重组单纯疱疹1型病毒的构建，并且还提供了显示重组HSV能够在体外在来自健康者和RDEB患者的原代人角质化细胞和纤维母细胞中表达功能性人胶原的实验。

材料和方法

病毒构建

如下产生“KCA211”病毒载体(图2A)：首先通过使病毒ICP4基因的两个拷贝的编码序列缺失(ΔICP4)来修饰野生型单纯疱疹病毒基因组。经ΔICP4修饰的病毒基因组还被工程化来在ICP4基因座中的每一者中含有mCherry表达盒。病毒基因组接着被进一步修饰来编码野生型人COL7。简要来说，将含有由ICP4的上游(US)和下游(DS)区域侧接的野生型COL7的编码序列(在hCMV启动子的控制下)的质粒转染至被修饰来表达疱疹病毒ICP4基因的Vero细胞中。这些经转染的细胞接着用以上所述的经修饰的ΔICP4 mCherry表达性病毒感染。侧接于COL7的US和DS ICP4区域允许进行双交换，以及替换mCherry基因座中的每一者。关于不存在mCherry荧光进行的目视筛选接着用于鉴定含有重组病毒的细胞。

如下产生“SAR-COL7”病毒载体(图2B)：首先通过使病毒ICP4基因的两个拷贝以及单一拷贝ICP22基因的编码序列缺失(ΔICP4/ΔICP22)来修饰野生型单纯疱疹病毒基因组。经ΔICP4/ΔICP22修饰是病毒基因组还被工程化来在ICP4基因座中的每一者中含有mCherry表达盒。病毒基因组接着被进一步修饰来编码野生型人COL7。简要来说，将含有由ICP4的上游(US)和下游(DS)区域侧接的野生型COL7的编码序列(在hCMV启动子的控制下)的质粒转染至被修饰来表达疱疹病毒ICP4基因的Vero细胞中。这些经转染细胞接着用以上所述的经修饰的ΔICP4/ΔICP22 mCherry表达性病毒感染。侧接于COL7的US和DS ICP4区域允许进行双交换，以及替换mCherry基因座中的每一者。关于不存在mCherry荧光进行的目视筛选接着用于鉴定含有重组病毒的细胞。

细胞培养

先前从作为常规手术或诊断程序的一部分获取的皮肤活检体分离细胞。从每名患者或在儿童的情况下从父母或法定监护人获得知情书面同意。这个研究根据赫尔辛基宣言(Helsinki declaration)进行。所有细胞都在37℃下在5％CO₂中培养。使人纤维母细胞在补充以10％胎牛血清(

血清，目录号PS-FB1)的杜贝卡氏改良必需培养基(Dulbecco’s modified essential medium)中生长。在补充以10％FBS、10ng/mL表皮生长因子、10-10霍乱毒素、0.4μg/mL氢化可的松(hydrocortisone)、5μg/mL转铁蛋白(transferrin)、5μg/mL胰岛素和5μg/mL碘塞罗宁(liothyronine)的DMEM/汉姆氏F12培养基(Ham’s F12medium)(3:1)中培养RDEB和正常角质化细胞。所有培养基都含有抗坏血酸(150μM)。使角质化细胞在有丝分裂活化的3T3细胞滋养层存在下以及在10μM Rho激酶抑制剂Y-27632存在下生长。

病毒感染

将病毒等分试样储存在-80℃下，并且在使用之前使其在组织培养层流通风橱下除霜。在感染之前在使细胞从组织培养塑料制品脱离以及在血球计上计数之后测定靶标细胞数目。感染复数(MOI)由病毒效价和靶标细胞数目计算，并且在含有10％血清的DMEM中稀释适当体积的病毒储备物并与靶标细胞一起在37℃下孵育2小时。接着移除病毒，并且在用预先温热的培养基洗涤两次之后向靶标细胞供给新鲜培养基。

蛋白质印迹

将角质化细胞在8x10⁵下铺于100mm培养皿中以在次日实现70-80％汇合。在感染之后48小时，用放射免疫沉淀测定缓冲液使细胞裂解。将裂解物放置在离心机中，在4℃下持续5分钟，并且使上清液与6x拉姆利(Laemmli)上样缓冲液混合。在上样于SDS-PAGE上之前，将样品在95℃下煮沸5分钟。对于COL7检测，将5-30μg蛋白质上样于6％丙烯酰胺凝胶上。用于COL7检测的初级抗体是兔抗体(Sigma，目录号HPA042420)。将经解析的蛋白质转移于硝化纤维素膜上，根据初级抗体的要求在具有5％奶或5％BSA的PBS-0.1％吐温中封闭，并且与初级抗体一起孵育过夜。在与IgG-HRP缀合二级抗体(Santa Cruz Biotechnology)一起孵育之后，使膜与蛋白质印迹底物(ThermoFisher，目录号32106)一起孵育，并且暴露于胶片(ThermoFisher Scientific，目录号34090)。

qRT-PCR

根据制造商方案使用

小型试剂盒(Qiagen)分离RNA。使用NanoDrop^TM分光光度计(Fisher Scientific)定量RNA提取物，并且1.5μg RNA用于使用SuperScript III第一链合成系统(Invitrogen)进行cDNA合成。对于qPCR，使用SYBR精选主混合物(LifeTechnologies)，并且以1:25稀释cDNA样品以充当模板。一式三份进行实验。

粘附测定

使96孔板未包被，或用10、20或50μg/mL大鼠尾胶原1(BD Biosciences)或人纤连蛋白(Millipore)以100μL反应体积在4℃下包被过夜，接着用PBS洗涤，并且用PBS+0.1％BSA在37℃下封闭1小时。将模拟物(对照)或经SAR-COL7感染的RDEB角质化细胞(2.4x10⁴个细胞于100μL DMEM/HamF12+0.1％BSA中)添加至板中，并且在37℃下孵育90分钟。将孔用PBS洗涤三次以移除任何未结合的细胞，并且将粘附细胞用PFE固定20分钟。固定细胞接着用70％乙醇处理，用结晶紫染色，在100％乙醇中拆解，并且通过用Flex Station 3板读取器(Molecular Devices)在630nM下测量吸光度来定量。

器官型皮肤等同物

将牛纤维蛋白原(90％可凝结，MP Biomedicals)在37℃下在1.1％NaCl中溶解4小时，接着用0.45μm尼龙膜过滤器过滤。在使用胰蛋白酶和离心的情况下收集纤维母细胞，并且再混悬于培养基中以达到2x10⁶个细胞/毫升的最终浓度。使150μL细胞混悬液与1mL凝血酶(thrombin)(3IU–Sigma Aldrich)混合，并且将细胞/凝血酶混合物在1:1的比率下添加至纤维蛋白原中。将混合物在1mL/孔下快速但温和地分配至12孔板中，并且在37℃下孵育。在20分钟之后，添加补充以抗坏血酸和在10μg/mL的最终浓度下的抑肽酶(aprotinin)(Sigma)的培养基。使基质成熟5-7天，同时每隔一天更换培养基。将角质化细胞在2x10⁶个细胞/孔下铺于上部上，并且在次日，使培养物在金属格网上升高至空气-液体界面，并且开始用氨来呫诺(amlexanox)处理。每隔一天用新鲜药物、抗坏血酸和抑肽酶更换培养基。在处理的一周或两周时收集培养物，并且与OCT一起冷冻在液氮冷却的异戊烷中。使用低温恒温器(Avantik QS11)切割8μm切片，并且用多克隆抗COL7抗体在1:800的稀释度下进行免疫染色。用DAPI(Invitrogen)对核进行复染。

结果

首先，通过qPCR和蛋白质印迹分析评估了在HaCaT人角质化细胞细胞系中从经修饰HSV进行的COL7表达以确定经修饰HSV是否能够表达它们的运载物。用SAR-COL7或KCA211在0.3-10的范围内的MOI下转导HaCaT细胞。在感染之后48小时，收集并处理细胞以进行qPCR(图3A)或蛋白质印迹(图3B)分析。结果证明全长COL7以剂量依赖性方式从用任一经修饰HSV感染的人角质化细胞表达。

接着，进行免疫荧光实验以显现COL7在用SAR-COL7在各种MOI(在0.1至10的范围内)下感染24-48小时的原代RDEB角质化细胞或RDEB纤维母细胞中的表达。相较于未感染正常角质化细胞和纤维母细胞以及RDEB角质化细胞和纤维母细胞，对于角质化细胞(图4A)与纤维母细胞(图4B)两者，在SAR-COL7的所有测试剂量下都观察到强烈COL7信号。SAR-COL7在0.1-1的MOI下在纤维母细胞中的感染效率在16-36％的范围内。SAR-COL7在3.0以及以上的MOI下在纤维母细胞中的感染效率是≥90％。

用SAR-COL7在不同MOI下感染RDEB患者源性人真皮角质化细胞(HDK)和纤维母细胞(HDF)以评价COL7A1 RNA表达。正常HDK和HDF以及模拟感染的RDEB HDK和HDF用作阴性对照。观察到在用SAR-COL7感染的HDK(图5A)与HDF(图5B)两者中，COL7A1转录物以剂量依赖性方式增加。还计算了在感染之后相对于未感染健康HDK(表1A)或未感染健康HDF(表1B)的相对COL7A1转录物表达倍数变化。在是3的MOI下，相对于健康HDK和HDF中的野生型COL7A1转录物水平，使用COL7A1编码性HSV能够使COL7A1转录物表达增加约26倍(在RDEB HDK中)和60倍(在RDEB HDF中)。

表1A：在HDK中的COL7A1表达

细胞类型：	MOI：	相比于N-HDK的倍数变化：
			正常HDK(N-HDK)	0	1.00
RDEB HDK(EB-HDK)	0	0.79
			RDEB HDK(EB-HDK)	0.3	7.00
RDEB HDK(EB-HDK)	1.0	13.73
			RDEB HDK(EB-HDK)	3.0	26.25

表1B：在HDF中的COL7A1表达

细胞类型：	MOI：	相比于N-HDF的倍数变化：
			正常HDF(N-HDF)	0	1.000
RDEB HDF(EB-HDF)	0	0.340
			RDEB HDF(EB-HDF)	0.1	1.805
RDEB HDF(EB-HDF)	0.3	5.134
			RDEB HDF(EB-HDF)	1.0	30.788
RDEB HDF(EB-HDF)	3.0	60.571

接着，通过细胞粘附测定来测试从SAR-COL7表达的人COL7的功能性。研究了未感染的RDEB角质化细胞以及用SAR-COL7在不同MOI下感染的RDEB角质化细胞粘附于用胶原1或纤连蛋白处理的孔的能力。引起关注的是，使用基于板的粘附测定，用SAR-COL7感染的RDEB角质化细胞以剂量依赖性方式显示对胶原1(图6A)和纤连蛋白(图6B)的粘附增加。

最后，由RDEB纤维母细胞和角质化细胞组成的皮肤等同性(SE)器官型培养物用于评价在基底膜区(BMZ)处，COL7从SAR-COL7的表达。用RDEB或正常纤维母细胞和角质化细胞构建器官培养物。在器官培养物构建之前用SAR-COL7感染RDEB细胞(数据未显示)，或在于空气-液体界面处升高之前将SAR-COL7逐滴添加于培养物上(图7)。对所得皮肤等同物(SE)进行分离，切片，并且染色以获得免疫荧光来检测COL7蛋白表达。在由用SAR-COL7感染的细胞获得的这些器官型培养物中检测到COL7，并且观察到COL7蛋白开始沉积在BMZ处。这个数据表明SAR-COL7不仅可高效递送COL7A1以及表达COL7蛋白，而且COL7蛋白开始在器官型培养物中进行组织，类似于在体内对COL7蛋白所预期的组织样式。

总之，本文提供的数据指示复制缺陷性HSV可作为载体用于在2D或3D培养系统中在野生型原代人细胞以及从罹患胶原缺乏症的患者分离的原代人细胞中有效递送和表达高水平的功能性人胶原，而无任何明显毒性。

实施例3：在野生型动物中对编码人COL7的HSV候选物的体内分析

以下实施例描述显示构建并在体外在人细胞中验证的重组病毒(参见以上实施例2)能够在体内在野生型动物中表达所编码的人胶原的实验。研究的目的部分地在于评价HSV介导的胶原表达在健康的有免疫能力的动物中的皮肤生物分布。

材料和方法

测试物品

向小鼠施用的制剂中的活性成分是在PBS+10％甘油中配制的在4.8x10⁸个空斑形成单位(PFU)/mL的效价下的经修饰的单纯疱疹病毒SAR-COL7或KCA211(参见以上实施例2)。用于真皮内施用的媒介物是杜贝卡氏磷酸盐缓冲盐水(DPBS)+10％甘油。用于局部施用的媒介物是在无菌双蒸水中配制的3％羟丙基甲基纤维素(HPMC)凝胶。

动物

使用在6与10周龄之间的健康雄性BALB/c小鼠。方案中使用的所有程序都依照适用的动物福利法案，并且由当地机构动物护理和使用委员会(IACUC)核准。

真皮内注射

在测试物品施用之前以及期间，使用得麻效(Dexdomitor)(30μL0.05mg/mL)和舒泰(Telzol)(50μL 10mg/mL)的混合物使小鼠麻醉。用安醒顺(Antisedan)(50μL 0.5mg/mL)逆转镇静剂。使用电动宠物剪将背部和侧腹区域剃毛，并且用酒精湿巾擦拭所述区域。使用芒图(Mantoux)技术用注射器和27G针(VWR，目录号BD305620)进行真皮内注射，从而确保在每个部位处创建浅表“泡”。将病毒保持在干冰上，在室温下解冻，并且在解冻后30分钟内施用。向每只小鼠的背部施用两处真皮内注射，并且“泡”的边缘用永久性标记加以标记。

局部施加

对开放伤口或经磨削或划痕皮肤进行局部施用。使用电动剪将背部和侧腹区域剃毛。划痕通过用机械琢美(Dremel)打磨机温和磨削皮肤，继之以用22G针进行浅表穿孔来进行。对于创建伤口，使用锋利剪刀移除皮肤的5-6mm直径活检体。为将局部制剂限于经磨削或受伤部位，从1.5mL微量离心管的经切割和热压处理顶端创建孔。保留盖子，并且切割一侧用透明粘性敷料覆盖。使用手术胶水使“孔”粘附于经磨削/受伤区域，其中盖子一侧向下。使100μL SAR-COL7与20μL局部媒介物混合，并且通过注射穿过透明粘性敷料以使局部凝胶限制在伤口上以及防止渗漏来施加于伤口。

组织收集

在SAR-COL7施用之后的所指示时间点，使小鼠安乐死，并且使用8mm活检穿孔器移除注射部位。活检体的一半使用液氮快速冷冻，而另一半包埋在OCT中并低温保存以进行免疫荧光染色。

实时定量PCR

快速冷冻的一半活检体在-80℃下储存直至分析。对于处理和分析，遵循制造商方案(Qiagen)，将样品再混悬于用新鲜DTT制备的350μL RLT缓冲液中。在25％幅度下对样品进行3次超声处理，伴有在冰上间歇性孵育1分钟，并且根据制造商方案(Qiagen AllPrepDNA和RNA提取试剂盒)进行DNA和RNA提取。将RNA样品与DNA样品两者再混悬于蒸馏去离子无RNA酶水中，并且在Take3微板读取器(BioRad)上以分光光度方式定量。

使用跨越人COL7A1开放阅读框的3’末端和3’UTR，从而特异性检测COL7A1转基因的定制引物/探针测定，通过Taqman实时PCR分析对COL7A1 DNA拷贝和RNA转录物进行绝对定量。100ng的DNA和RNA分别用于qPCR和qRT-PCR测定，并且在100ng小鼠基因组或RNA基质中制备含有待扩增的区域的质粒标准物。GAPDH用作两种分析的对照。

免疫荧光染色

将OCT冷冻组织在5-8μm下切片，并且使其风干多达1小时。将载片在-20℃下于100％甲醇中浸渍10分钟，并且使其风干。通过在室温下在PBS中洗涤3次(每次5分钟)来使甲醇固定切片再水化。使切片与由10％血清(混合物种)组成的封闭溶液一起在潮湿腔室中在室温下孵育1小时。移除过量封闭溶液，并且在每个切片上施加一滴在5％封闭溶液中制备的初级抗体(抗人胶原7抗体，Sigma，目录号HPA042420；抗整合素α6抗体(克隆goH3)，BDBiosciences，目录号555734)溶液(30-50μL/切片)。使切片与初级抗体一起在4℃下孵育16小时，在室温下在PBS中洗涤3次，每次5分钟，并且在以1:400在PBS中稀释下施加二级抗体(抗兔AF 647，Invitrogen，目录号A21244；抗大鼠抗体AF-594，Invitrogen，目录号A11007)，在潮湿腔室中在室温下持续1小时。重复3次PBS洗涤，接着将载片在室温下于赫希斯特(Hoechst)溶液(1:1000)中浸渍5分钟。重复3次PBS洗涤，并且将经染色的切片用封固介质(Fluorometer G，Southern Biotech，目录号0100-01)封固并用盖片覆盖。在脱水之后(约24小时)使用广视野荧光显微镜使切片成像。

结果

分成6组的总计30只雄性BALB/c小鼠用于这个研究。在第1天通过真皮内注射或局部施加来施用SAR-COL7，并且在第3天收集一个子组的小鼠，而其余小鼠在第6天加以收集。第2组中的动物通过真皮内注射来接受处于相同体积下的低剂量的SAR-COL7(4.8x10⁶pfu/部位)，并且第1组充当真皮内群组的对照。在第4、5和6组中，以120μL的总体积向受伤(第4和6组)或经磨削(第5组)区域施加局部媒介物(第4组)或呈局部凝胶剂形式的SAR-COL7(第5和6组)。收集组织，并且处理以进行如上所述的qPCR和免疫荧光分析。

进行处死后qPCR分析。在通过真皮内或局部施加来接受SAR-COL7的所有群组中都检测到COL7A1转录物和DNA水平(图8A-图8D)，并且观察到明确剂量响应。在真皮内群组与局部群组(SAR-COL7高剂量真皮内群组、高剂量伤口群组和高剂量经磨削群组)之间，转录物和DNA水平是类似的，从而表明局部施加在递送COL7A1方面与真皮内注射同样高效。总之，相比于第3天样品(图8A-图8B)，在第6天样品(图8C-图8D)中，DNA和RNA水平是较低的，此不是出乎意料的，因为SAR-COL7是一种保持游离的非整合载体(其将被预期随时间而清除)。

接着，进行免疫荧光实验以显现在体内SAR-COL7感染之后的COL7表达。如在提供于图9A-图9B中的代表性图像中所观察，在考查的两个时间点，在大多数动物群组中检测到COL7。许多样品显示COL7正确定位在BMZ处以及毛囊周围。在一些情况下，特别地在真皮内施加的情况下，在皮肤的靠近于下伏筋膜的深层中观察到强烈COL7表达，此可能由于注射是在皮下而非在真皮内。类似地，在其中BMZ可能在磨削期间被移除(如由缺乏代表性goH3染色所暗示)的许多经磨削皮肤样品中，强烈COL7染色限于皮肤表面。总之，在免疫荧光样品中存在COL7强烈支持了经修饰的HSV SAR-COL7的稳健功效。

此外，在体内测试了KCA211表达人COL7的能力，并且与SAR-COL7施用进行比较。发现KCA211也在体内在有免疫能力的小鼠中表达COL7转基因(图10A-图10B)。

总之，数据指示经修饰HSV能够在局部或真皮内施用之后在体内在健康的有免疫能力的动物中递送和表达人胶原蛋白，并且此外，从局部施用至受损害皮肤或开放伤口中的病毒进行的胶原表达与向完整皮肤中进行的真皮内施用类似。

实施例4：在亚效动物中对低剂量和高剂量的编码人COL7的HSV候选物的体内分析

以下实施例描述显示构建并在体外在人细胞中(参见以上实施例2)以及在体内在野生型小鼠中(参见以上实施例3)验证的重组病毒能够在体内在COL7亚效小鼠中表达功能性人胶原的实验。研究的目的部分地在于评价HSV介导的胶原表达在缺乏COL7的有免疫能力的动物中的皮肤生物分布。

材料和方法

除非相反指示，否则如以上实施例3中所述进行实验。

亚效小鼠

COL7亚效小鼠模型(Fritsch等J Clin Invest.2008年5月；118(5):1669-79)用于这个研究中。这个亚效小鼠模型是营养不良性大疱性表皮松解(DEB)的有免疫能力的动物模型，其中小鼠表达正常水平的约10％的COL7。它们的表型紧密类似于重度人DEB的特征，包括粘膜与皮肤起疱、甲营养不良以及肢端的连指手套样畸形。

小鼠通过flp/frt介导的对小鼠COL7A1的外显子2的移除来产生。缺乏COL7A1的两个功能性拷贝的动物(Col7a1flNew/flNeo)，被称为COL7亚效小鼠，表达正常水平的约10％的COL7。从总计15个交配对，获得了58只幼仔，其中同窝仔在2-7只小鼠/窝的范围内。在这58个幼仔之中，6个幼仔被基因分型为亚效幼仔。用从耳穿孔组织样品提取的DNA对小鼠进行基因分型。PCR分析检测到在COL7A1的外显子2的上游存在loxP位点。野生型(WT)小鼠显示在269个碱基对(bp)下的条带，亚效小鼠显示在435bp下的条带，而杂合性小鼠显示两种条带。所有程序都依照适用的动物福利法案，并且由当地机构动物护理和使用委员会(IACUC)核准。

真皮内注射

在测试物品施用之前以及期间，使用2％异氟烷，在吸入麻醉下维持小鼠。在眼上施加眼用软膏(

兽用)以防止干燥。使用芒图技术用31G针进行真皮内注射。在指定剂量下向每只小鼠的背部施用多达四处真皮内注射。

组织收集

在组织收集之前，通过CO₂吸入继之以颈脱位来使动物安乐死。使用锋利剪刀对注射部位进行活检。

苏木精和伊红(H&E)染色

将低温保存的组织在5-8μm的厚度下切片，并且使其风干多达一小时。将载片在-20℃下于100％甲醇中浸渍十分钟，并且使其风干。使甲醇固定切片在室温下在PBS中再水化5分钟。将切片在室温下在苏木精(魏格特氏改良苏木精(Weigert’s modifiedhematoxylin))中孵育5-10分钟，继之以在室温下在PBS中洗涤15分钟。接着将切片在伊红(伊红Y溶液，目录号HT110116)中冲洗3次，随后在水中冲洗一次。

通过在70％乙醇中浸渍10次，在95％乙醇中浸渍十次，以及在100％乙醇中浸渍十次来用乙醇使切片逐渐脱水。将切片放置以进行干燥，用封固介质(Fischer Scientific，目录号SPF15-100)封固并用盖片覆盖。在脱水之后(约24小时)使用亮视野显微镜使切片成像。

电子显微术

通过以下方式来制备用于电子显微术的皮肤：在含1.5％戊二醛/1.5％多聚甲醛的含有0.05％丹宁酸的杜贝卡氏无血清培养基(SFM)中浸渍至少一小时，随后在SFM中进行充分冲洗，并且在1％OsO₄中持续60分钟进行固定后步骤。在SFM中洗涤样品，接着在直至100％的一系列分级乙醇中脱水，在氧化丙烯中冲洗，并且历经两小时的总时间在斯珀尔氏环氧树脂(Spurr’s epoxy)中浸润，通过微波能来加速。使样品在70℃下历经18小时加以聚合。通过以下方式来制备额外样品：在SFM中充分冲洗，接着在4℃下在以1:5在SFM中稀释的小鼠IgM LH24抗体或小鼠IgG NP185抗体中浸渍过夜。接着将样品在SFM中充分冲洗，在冰上暴露于金增强溶液(Nanoprobes)15分钟，接着快速升温至25℃，并且再孵育5分钟。将样品用冰冷SFM冲洗，固定，并且包埋。

结果

三只亚效小鼠用于高剂量SAR-COL7研究。在第1天，所有小鼠都通过真皮内注射来接受4.6x10⁷ PFU/50μL/注射部位的剂量(表2)。将每个动物剃毛，并且在背部上在4个部位处加以注射，包括1处对照注射和3处SAR-COL7注射。一个动物(小鼠3)在第3天在相同的4个部位处接受第二注射。一只小鼠(小鼠1)在第3天被处死，而小鼠2和小鼠3在第7天被处死。

表2：关于真皮内注射高剂量SAR-COL7的研究设计

进行处死后qPCR分析。在所有三只小鼠中，在每个病毒注射部位处都检测到COL7A1转录物(图11A)和DNA水平(图11B)。在测定中，所有对照样品(PBS或HSV-GFP)中的转录物水平都处于或低于检测水平，因此在图中仅包括1个对照(第3天，样品1，HSV-GFP)用于比较。观察到在单次施用SAR-COL7之后截至第7天，DNA和转录物水平存在一定降低(小鼠2)；然而，在再施用SAR-COL7后，DNA和转录物水平增加(小鼠3)。

接着，进行免疫荧光(IF)实验以显现在体内SAR-COL7感染之后，COL7在亚效小鼠中的表达(图12A-图12B)。IF实验证明在第3天时间点和第7天时间点，在BMZ中以及在毛囊(HF)周围观察到稳健和广布的COL7蛋白表达。未观察到对皮肤形态的负性影响(即使在重复施用之后)，因为经SAR-COL7治疗样品显示正常皮肤形态，不具有纤维化或急性炎症的明显征象(图13)。总之，在免疫荧光样品中存在COL7强烈支持了SAR-COL7在递送能够在下伏皮肤子结构中分泌以及适当组织的人胶原方面的稳健功效。

还通过电子显微术评价了第3天活检体的锚定原纤维形成。在以适当方式结构化的锚定原纤维中，COL7的NC1结构域(其用NP158抗体染色)朝向致密层排列，而COL7的NC2结构域(其用LH24抗体染色)远离致密层排列。来自经SAR-COL7注射的小鼠的活检体显示了用LH24(图14A)抗体与NP185(图14B)抗体两者达成的COL7染色，并且重要的是，电子显微术(EM)图像揭示了锚定原纤维的形成。致密层作为穿过EM图像的中央的暗带被观察到。外源性人COL7的NC2结构域远离致密层加以定位，而外源性人COL7的NC1结构域沿致密层加以定位，如将在以适当方式形成的锚定原纤维中所预期。这个数据指示SAR-COL7不仅可表达能够在BMZ处分泌和适当组织的所编码的人COL7，但是所分泌的COL7具有功能性，并且在所得锚定原纤维中适当定位，从而支撑亚效小鼠的皮肤组织。

三只额外亚效小鼠用于低剂量SAR-COL7研究。在第1天，所有小鼠都通过真皮内注射来在3(小鼠1)或2(小鼠2和3)个部位中接受6.4x10⁶ PFU/50μL/注射部位的剂量的SAR-COL7(表3)。

表3：关于真皮内注射低剂量SAR-COL7的研究设计

小鼠：	治疗日：	注射部位的数目：	终止日：
				1	1	3	3
2	1	2	3
				3	1	2	7

进行处死后qPCR分析。在所有三只小鼠中，在每个病毒注射部位处都检测到COL7A1转录物(图15A)和DNA水平(图15B)。观察到剂量响应。尽管相对于在高剂量研究中观察到的那些DNA和转录物水平，在这些低剂量样品中的COL7A1的DNA水平与转录物水平两者均较低，但COL7A1表达仍然是可检测的。尽管DNA或RNA水平存在约2个对数降低，但在经低剂量SAR-COL7注射的动物的皮肤中，COL7蛋白仍然是可检测的(图16)。在BMZ中以及在毛囊周围均观察到COL7蛋白。数据指示即使在较低剂量下，经修饰的HSV仍然有效递送和表达所编码的人胶原蛋白，所述所编码的人胶原蛋白接着分泌并定位至皮肤的适当区域。

总之，实施例中提供的数据指示本文所述的经修饰的HSV能够：1)在体外以及在器官型培养中转导皮肤细胞以产生功能性人胶原(参见实施例2)；2)在局部施加和真皮内施加之后，在体内在健康的有免疫能力的动物中转导皮肤以及递送人胶原(参见实施例3)；以及3)在体内在胶原缺乏性动物中转导皮肤，递送人胶原，并且引发锚定原纤维的形成(参见实施例4)。在不希望受理论束缚下，据信本文所述的重组载体提供了一种用于将功能性人胶原递送至皮肤的合乎需要的策略，从而允许达成用以在美容环境中支撑真皮和/或表皮的新型方法。

实施例5：编码人胶原1的多种经工程化HSV的构建和验证

以下实施例描述用于对重组HSV-1进行工程化以成功表达人胶原1的两种不同方法。因为人胶原1是一种包含COL1A1多肽的两个拷贝和COL1A2多肽的一个拷贝的异三聚大分子，所以进行两种不同策略以产生编码人COL1A1与COL1A2两者的单一HSV基因组；这两种方法一般地描绘于图1H-图1I和图1L中，并且在以下详细描述。

作为第一方法，重组HSV-1初始被工程化来将含有异源性启动子和多腺苷酸序列的人COL1A1表达盒并入ICP4基因座中的每一者中，如以上实施例2中所述。挑选推定含有人COL1A1盒的多个病毒空斑，并且通过在Vero细胞中感染以测试COL1A1表达来筛选(数据未显示)。至少三个分离株(克隆1A1、2A1和3A1)关于人COL1A1转基因表达呈阳性。然后，人COL1A1阳性克隆1A1和2A1接着被工程化来并入含有与COL1A1盒不同的异源性启动子以及它自身的多腺苷酸序列且插入ICP22基因座中的人COL1A2表达盒。接着筛选七个分离株(克隆1A2-1A1、1B2-1A1、1C1-1A1、1B3-2A1、3B1-1A1和3B1-2A1)以鉴定能够表达人COL1A1与COL1A2两者，并因此能够表达全长人胶原1的减毒HSV-1病毒。

用七个推定COL1A1-COL1A2阳性分离株中的一者或三个单独COL1A1分离株中的一者(作为COL1A2表达的阴性对照)感染Vero细胞以鉴定能够表达两种转基因的重组HSV-1克隆。使对Vero细胞的感染进行五天，通过温和刮削来收集细胞，并且通过在6000xg下离心五分钟来收集细胞集结块。收集每个集结块的一半用于qRT-PCR分析，而对另一半进行处理以进行蛋白质印迹。使用跨越人COL1A1或COL1A2开放阅读框(ORF)的3’末端和3’非翻译区(UTR)，并且对转基因具有特异性的定制引物/探针测定，通过Taqman实时PCR分析对COL1A1或COL1A2 RNA拷贝进行绝对定量。从用所有三种单独COL1A1病毒感染的细胞以及用6/7的COL1A1-COL1A2病毒感染的细胞提取的RNA对于人COL1A1转基因表达呈阳性(图17A)。引起关注的是，仅3/7的COL1A1-COL1A2病毒(克隆1B2-1A1、1C1-1A1和1B3-2A1)还表达可检测水平的人COL1A2(图17B)。对在用这三个分离株感染的细胞溶解产物中的COL1A1和COL1A2蛋白表达进行蛋白质印迹以确保转基因在核酸水平与蛋白质水平两者上均表达。简要来说，将细胞集结块再混悬于含有Halt蛋白酶抑制剂混合物的RIPA缓冲液中，在4℃下孵育十分钟，并且接着在室温下用全能核酸酶处理10分钟。接着用含有5％2-巯基乙醇的4x LDS样品缓冲液稀释样品，并且在Tris-甘氨酸凝胶上解析。将模拟感染的Vero细胞裂解物作为阴性对照上样于凝胶上。将蛋白质转移至PVDF，封闭，接着用初级抗体(抗人COL1A1，ThermoFisher目录号PA5-29569；抗人COL1A2，Abcam目录号ab96723；或抗GAPDH，Abcam目录号ab9485)染色过夜。接着洗涤经染色的膜，与二级抗体一起孵育，然后显色。与qRT-PCR分析一致，所有三个克隆都能够在可检测水平下表达人COL1A1蛋白与COL1A2蛋白两者(图17C)。

并行探求第二方法以产生COL1A1-COL1A2阳性重组减毒HSV载体。在此处，产生了从5’至3’编码人COL1A1 ORF、合成IRES和人COL1A2 ORF的多核苷酸构建体。接着将这个基于IRES的构建体(在还含有异源性启动子和多腺苷酸序列的表达盒中编码)插入ICP4基因座中的每一者中，如以上实施例2中所述。挑选多个空斑，并且筛选以鉴定具有正确插入的IRES构建体的载体。简要来说，用推定IRES病毒分离株感染Vero细胞，使感染进行五天，并且收集细胞并处理以进行qPCR和qRT-PCR分析。使用识别合成IRES的定制引物/探针测定，通过Taqman实时PCR分析对插入DNA和RNA拷贝进行绝对定量。通过qPCR和qRT-PCR分析筛选了13个病毒分离株；关于IRES DNA和包含IRES序列的RNA转录物，这些分离株中仅一者(分离株6)测试呈阳性(数据未显示)。为确认这个分离株能够在蛋白质水平上表达人COL1A1与COL1A2两者，处理受感染的Vero细胞以进行如上所述的蛋白质印迹。根据qPCR显示无表达盒并入，并且根据qRT-PCR显示无转基因表达的病毒分离株(分离株1)用作阴性对照。与qPCR/qRT-PCR数据相应，病毒分离株6能够在感染之后表达人COL1A1蛋白与COL1A2蛋白两者(图18)。

总之，在这个样品的情况下呈现的数据指示：(1)成功构建了在感染所靶向细胞之后自如表达人COL1A1与COL1A2两者的多种重组HSV-1载体；(2)载体可被工程化来表达异三聚人胶原蛋白；以及(3)可采用多种不同方法来从单一重组基因组表达多种蛋白质。在不希望受理论束缚下，据信人胶原1从重组HSV-1基因组的成功表达提供了对使用经工程化的HSV来表达任何异三聚胶原蛋白(例如人胶原4)的支持。

实施例6：编码人胶原3的经工程化的HSV的构建、验证和体外表征

以下实施例描述成功表达人胶原3的重组HSV-1(被称为C3vec01)的工程化。此外，以下实施例描述建立适于表征C3vec01的功效的多种相关2D细胞培养模型系统的体外实验，包括在剂量探索研究中使用永生化人角质化细胞和纤维母细胞，使用从多名年老人患者活检获得的原代人真皮纤维母细胞作为在年长患者中进行C3vec01介导的胶原3挽救的模型，以及使用体外经UV照射永生化人纤维母细胞作为日光暴露/皮肤老化的模型。

人皮肤主要由通过真皮纤维母细胞来产生、组织和维持的富含胶原的结缔组织组成。真皮胶原占人皮肤的>90％(干重)，并且主要由COL1和COL3原纤维在约85:15的典型比率下组成。这些原纤维对皮肤提供强度，并且对于维持皮肤组织构造至关重要。

皮肤老化特征主要归因于异常胶原体内平衡，从而导致净胶原缺乏；胶原的生物合成降低，胶原原纤维断裂增加，以及存在进行性真皮胶原丧失，所述事项全都促进老化表型。皮肤老化受内部因素与外部因素两者的组合的影响：内在因素-时间的推移、遗传、细胞代谢、激素等；以及外在因素–长期光照暴露、污染、电离辐射等。这些因素共同导致对皮肤的累积性结构和生理改变，从而最终导致皮肤皱纹的出现和恶化。

皮肤活力恢复，即逆转或修复皮肤中的不规整(诸如皱纹)的过程，部分地通过新胶原的合成(胶原新生)来实现。在皮肤中，胶原新生受胶原1和胶原3的沉积以及胶原1与胶原3之间的复杂相互作用的影响。COL3出现在胶原原纤维生成期间的早期，并且由COL1对这个COL3的后续替换是胶原原纤维成熟和细胞外基质重新组织的关键步骤(Wang等,2018,Journal of the Chinese Medical Association,81(2),第94-101页)。此外，COL3调控COL1纤维的尺寸(Liu等,1997,Proc Natl Acad Sci U S A,94(5),第1853-6页)，并且使COL1弹性增强(Asgari等,2017,Sci Rep,7(1),第1392页)。因此，早期COL3表达的出现以及随后被COL1替换已用作可注射面部填充剂在人中具有功效的标志(Yutskovskaya等,2014,J Drugs Dermatol,13(9),第1047-52页)。

除非另外指示，否则所有实验都如上所述来进行。

为开始研究，重组HSV-1被工程化来将含有异源性启动子和多腺苷酸序列的人COL3A1表达盒并入ICP4基因座中的每一者中。挑选推定含有人COL3A1盒的多个病毒空斑，并且通过在Vero细胞中感染以测试COL3A1表达来筛选(数据未显示)。高表达性克隆中的一者，被称为C3vec01，随后被选择用于额外体外(以下描述)和体内(实施例7)分析。

首先，进行剂量探索研究以测定在永生化人角质化细胞(图19)与永生化人真皮纤维母细胞(图20)两者中，C3vec01介导的对它的所编码人运载物的递送的功效。在0.3至3的范围内的各种感染复数(MOI)下感染永生化细胞48小时，并且通过多种测定来定量和定性测量人胶原3表达。观察到在永生化HK和HDF(分别是图19A和图20A)中，根据qPCR分析在效应DNA方面(数据未显示)，以及根据qRT-PCR分析在效应转录物水平方面均存在剂量依赖性增加。模拟感染的细胞以及用含有与C3vec01相同的HSV-1骨架但代之以编码mCherry效应物的病毒感染的细胞用作阴性对照。与这些结果相应，观察到在永生化HK(图19B)和HDF(图20B)中，根据免疫荧光，在C3vec01感染之后在COL3蛋白表达方面存在剂量依赖性增加。尽管永生化HDF在感染之前表达内源性人COL3(如所预期)，但在用C3vec01感染之后观察到COL3表达显著增加，即使在低剂量下也是这样(初级抗COL3抗体，Abcam目录号ab7778)。在未感染的永生化角质化细胞中观察到少许至无可检测内源性COL3。重要的是，在用C3vec01感染的永生化角质化细胞或纤维母细胞的情况下，未观察到对细胞形态或活力的显著影响，即使在高剂量下也是这样。

随着皮肤老化，驻留真皮纤维母细胞产生较少胶原3，并且皮肤中COL1:COL3的比率朝向胶原1进行偏移。为通过新胶原3的合成来提供皮肤活力恢复，重要的是了解C3vec01是否将能够有效感染老化真皮纤维母细胞以及稳健表达它的所编码人胶原3。因此，在来源于两个不同供应商的细胞的情况下测试C3vec01在多种MOI下感染老化原代真皮纤维母细胞以及表达外源性胶原3的能力。下表4提供这个研究中使用的四个原代HDF样品的供者信息。

表4：原代人真皮纤维母细胞供者

年龄

性别

种族

组织

目录号

批号

公司

73

男

白种人

皮肤/眼睑

C-12302

435Z009.2

PromoCell

65

女

白种人

皮肤/眼睑

C-12302

417Z010.2

PromoCell

73

男

白种人

左下背部

CC-2511

0000633428

Lonza

75

女

白种人

背部

CC-2511

18TL057585

Lonza

相较于永生化HDF，在C3vec01感染来自供应商1(图21A)和供应商2(图21C)的原代HDF之后，观察到类似剂量依赖性增加，伴有相当或更高COL3转录物水平。还通过蛋白质印迹分析(初级抗COL3抗体，Abcam目录号ab7778)测试了来自每个供应商的代表性原代细胞的样品的COL3表达。C3vec01能够在从73岁男性患者(图21B)和75岁女性患者(图21D)活检获得的原代HDF中挽救高水平的人胶原3表达，即使在测试的最低MOI下也是这样。

最后，测试了C3vec01在UV暴露的永生化人纤维母细胞中诱导稳健胶原3表达的能力。日光暴露和相应UV损害已知是老化皮肤表型的单一最大外在促进因素，并且多个团体已采用体外皮肤纤维母细胞UV暴露系统来对光老化的某些方面建模(参见例如Qin等2018,Cell Physiol Biochem 46(5):1849-1860)。为确认UV暴露导致人真皮纤维母细胞分泌较少胶原3(如将鉴于光老化皮肤的表型所预期)，通过ELISA来测量在三种不同水平的UV暴露之前和之后，COL3向培养的永生化人真皮纤维母细胞的上清液中的分泌(图22A)。实际上，UV照射培养的纤维母细胞使内源性COL3表达显著降低。COL1表达在这个实验中被并行监测，并且不受UV照射显著影响，从而指示与对蛋白质合成的整体抑制不同，UV暴露诱导对COL3的特异性阻遏。接着，测试了C3vec01感染经UV照射永生化HDF以及表达外源性COL3的能力。在此处，使永生化HDF暴露于UV照射，接着使其恢复24小时，随后用C3vec01在0.3或1的MOI下感染。在感染之后48小时，通过qRT-PCR分析来评估外源性人COL3。在两种测试MOI下均检测到受C3vec01感染的经UV照射HDF中的强烈COL3表达(图22B)，从而指示C3vec01高效转导了光损害细胞以及递送了它的所编码运载物。模拟感染的细胞以及用含有与C3vec01相同的HSV-1骨架但代之以编码mCherry效应物的病毒感染的细胞用作阴性对照以确保转基因检测的特异性。

总之，这个实施例中呈现的数据指示重组HSV-1载体C3vec01高效转导多种人皮肤细胞类型，能够挽救胶原3在从年老患者收集的老化原代纤维母细胞中的表达，并且能够补救胶原3从UV损害的HDF进行的表达。在不希望受理论束缚下，据信数据支持使用编码人胶原3的重组HSV来矫正老化皮肤的胶原缺陷。

实施例7：真皮内施用的C3vec01的体内表征

以下实施例描述建立在年轻的和年老的健康的有免疫能力的动物中真皮内施用C3vec01的方法的体内实验。

除非另外指示，否则所有实验都如上所述来进行。

这个实施例中进行的所有程序都依照适用的动物福利法案，并且由当地机构动物护理和使用委员会(IACUC)核准。

在进一步操作之前，将小鼠的背部剃毛。接着将C3vec01(或媒介物对照)在真皮内注射至小鼠的背部中的四个部位。在感染以及后续恢复时期之后，使动物安乐死，并且使用8mm穿孔活检移除处理部位。将每个活检体的一半快速冷冻在液氮中以进行qPCR/qRT-PCR分析，而对另一半进行处理以进行免疫荧光分析。

处理组织样品以进行如上所述的核酸和蛋白质分析。对于COL3免疫荧光染色，使用兔抗人胶原3初级抗体(Abcam，目录号ab7778)和Alexa

488缀合的二级抗体。在含有DAPI的封固介质中封固组织样品以使核显现。

在年轻(6-8周龄)和年老(约13月龄)C57BL/6小鼠中进行体内药理学研究以评价在真皮内施用载体后，在有免疫能力的动物中，C3vec01介导的人COL3表达。总计10只动物用于这项研究。首先将每只小鼠的背部剃毛，接着在每个动物4个部位处用2x10⁸ PFU/部位的C3vec01(或媒介物对照)在真皮内注射。在给药后48小时或1周对经注射部位进行活检，并且通过qPCR和免疫荧光来评价人COL3表达。下表5提供实验设计的概要。

表5：研究设计和测试物品施用

真皮内递送C3vec01导致在注射后48小时收集的皮肤活检体中检测到高水平的经转导载体基因组(图23A)，以及在年轻小鼠与年老小鼠两者中均产生高水平的人胶原3转录物(图23B)。基于免疫荧光的检测还显示相对于经媒介物处理的皮肤，在经C3vec01处理的皮肤中的整个真皮中，人COL3的水平都明显增加(图23C)，从而与转录物水平相关联。

总之，这个实施例中提供的数据指示在体内在真皮内注射之后可高效转导皮肤以及表达人胶原3。在不希望受理论束缚下，据信此处呈现的体内研究为在美容性环境中使用HSV-1作为用以递送人胶原3的新型基因疗法提供进一步支持。

实施例8：编码人层粘连蛋白的经修饰的单纯疱疹病毒载体的产生和验证

为开始研究，重组疱疹病毒载体被工程化来并入两种人层粘连蛋白即LAMB3或LAMC2的野生型或密码子优化变体，如以上实施例3中所述。对于每种类型的病毒，挑选许多分离株。为测试某些分离株是否能够表达所编码的野生型人LAMB3蛋白，将ICP4补充性Vero细胞铺于6孔板中，并且用野生型LamB3编码病毒的12个未滴定病毒分离株感染直至完成感染。在感染之后，收集RNA，产生cDNA，并且通过qPCR来测定野生型LamB3从每个分离株的表达(图24A)。所有12个分离株都能够在不同水平下在经转导的Vero细胞中表达野生型人LamB3。还通过蛋白质印迹来测试了这些分离株中的10者表达人LamB3的能力。将ICP4补充性Vero细胞铺于6孔板中，并且用野生型LamB3表达性病毒的10个未滴定病毒分离株感染直至完成感染。用LamB3表达质粒转染一孔的Vero细胞，作为阳性对照。在感染之后，将细胞通过温和刮削来收集，离心以收集细胞集结块，吸出培养基，并且用PBS洗涤细胞集结块一次。在洗涤之后，将每个细胞集结块再混悬于含有蛋白酶抑制剂的200μL RIPA缓冲液中，并且在4℃下孵育再混悬液20分钟，其中每5分钟进行温和搅拌。在孵育之后，在17,000x g下离心样品5分钟，移除上清液，并且将含有5％2-巯基甲醇的4x LDS还原样品缓冲液添加至每个澄清上清液中。接着将样品煮沸10分钟，随后上样于4-20％Tris-甘氨酸聚丙烯酰胺凝胶上。在电泳之后，将蛋白质转移至PVDF膜，并且将膜在5％奶/TBS中封闭30分钟。接着将初级兔抗LamB3抗体(Abcam，目录号ab128864)在以1:1000在5％奶/TBS中稀释下添加至PVDF膜，并且在室温下孵育过夜(约16小时)。印迹接着用TBS洗涤3次，每次5分钟，接着用处于5％奶/TBS中的AP缀合山羊抗兔IgG抗体(Sigma，目录号A3687)在室温下染色1小时。接着将膜用TBS洗涤3次，每次5分钟，添加BCIP/NBT，并且在室温下使印迹显色约10分钟。与qPCR数据一致，所有10个病毒分离株都能够在不同水平下表达所编码野生型人LamB3(图24B)。

还通过蛋白质印迹分析来测试了编码人LamB3的密码子优化变体的病毒在Vero细胞中表达它们的运载物的能力。简要来说，密码子优化(CO)LamB3编码病毒的10个未滴定病毒分离株用于感染Vero细胞，收集细胞集结块，将每个集结块再混悬于含有蛋白酶抑制剂的RIPA缓冲液中，并且使用这些细胞溶解产物进行蛋白质印迹，如上所描述。所有10个病毒分离株都能够在Vero细胞中表达所编码的密码子优化人LamB3(图25)。

接着，测试编码野生型或密码子优化的LAMB3的四个病毒分离株转导原代人细胞以及表达它们的运载物的能力。在1.0的感染复数(MOI)下感染永生化原代正常角质化细胞48小时。未感染的细胞用作阴性对照。接着通过蛋白质印迹来考查LamB3在受感染人角质化细胞中的表达。使用初级兔抗LamB3抗体(Abcam，目录号ab 128864)，如上所述来进行蛋白质印迹。与使用Vero细胞产生的数据一致，确认了表达野生型和密码子优化LamB3的病毒分离株有效转导原代人角质化细胞以及在适合水平下表达它们的所编码的构建体(图26)。

为测试含有LamC2的分离株是否能够表达所编码的野生型或密码子优化的人LAMC2，将ICP4补充性Vero细胞铺于6孔板中，并且用许多未滴定的野生型或密码子优化的LamC2表达性病毒分离株感染直至完成感染。在感染之后，收集RNA，产生cDNA，并且通过qPCR来测定野生型LamC2(图27A)或密码子优化LamC2(图27B)从每个分离株的表达。8/12分离株能够在不同水平下在经转导的Vero细胞中表达野生型人LamC2，而3/7分离株能够表达密码子优化的人LamC2。接着通过蛋白质印迹来测试了某些野生型和密码子优化分离株表达人LamC2的能力。将ICP4补充性Vero细胞铺于6孔板中，并且用未滴定病毒分离株感染直至完成感染。使一孔Vero细胞未受感染，作为阴性对照。在感染之后，细胞通过温和刮削来收集，离心以收集细胞集结块，吸出培养基，并且用PBS洗涤细胞集结块一次。在洗涤之后，将每个细胞集结块再混悬于含有蛋白酶抑制剂的200μL RIPA缓冲液中，并且在4℃下孵育再混悬液20分钟，其中每5分钟进行温和搅拌。在孵育之后，在17,000x g下离心样品5分钟，移除上清液，并且将含有5％2-巯基甲醇的4x LDS还原样品缓冲液添加至每个澄清的上清液中。接着将样品煮沸10分钟，随后上样于4-20％Tris-甘氨酸聚丙烯酰胺凝胶上。在电泳之后，将蛋白质转移至PVDF膜，并且将膜在5％奶/TBS中封闭30分钟。接着将初级兔抗LamC2抗体(Abcam，目录号ab96327)在以1:1000在5％奶/TBS中稀释下添加至PVDF膜中，并且在室温下孵育过夜(约16小时)。印迹接着用TBS洗涤3次，每次5分钟，接着用处于5％奶/TBS中的AP缀合的山羊抗兔IgG抗体(Sigma，目录号A3687)在室温下染色1小时。接着将膜用TBS洗涤3次，每次5分钟，添加BCIP/NBT，并且在室温下使印迹显色约10分钟。与qPCR数据一致，测试病毒分离株中的全部9者都也能够表达所编码的人LamC2(图27C)。

选择密码子优化的LamC2表达性病毒分离株“LGA”用于在人细胞中进一步测试。用LGA分离株在0.3、1.0或3.0的感染复数(MOI)下感染永生化原代正常角质化细胞48小时。未感染(对照)和mCherry表达性病毒感染的细胞用作阴性对照。在感染48小时之后，从永生化角质化细胞提取DNA和RNA，并且进行qPCR/qRT-PCR(图28A-图28B)。在永生化角质化细胞的情况下，对于LGA分离株，观察到良好剂量-响应，如通过每50ng DNA所检测到的病毒基因组拷贝数所评估(图28A)。引起关注的是，尽管当使MOI从0.3增加至1.0时在转录物水平上观察到剂量响应，但当使MOI从1.0增加至3.0时未观察到转录物水平的额外增加(图28B)。还通过蛋白质印迹来考查LamC2在受感染人角质化细胞中的表达。如上所述来进行蛋白质印迹(使用初级兔抗LamC2抗体(Abcam，目录号ab96327))。与转录物分析一致，当使MOI从0.3增加至1.0，而非从1.0增加至3.0时，在蛋白质水平上观察到剂量响应(图28C)。

最后，为测试分离株“LGA”是否能够在体内递送时表达它的人层粘连蛋白，在动物中在真皮内注射之后，通过qPCR、qRT-PCR和免疫荧光来评估人LAMC2表达。将在PBS+10％甘油(媒介物)中配制的1x10⁸ PFU的LGA在真皮内注射至两只小鼠的背侧皮肤和足垫中。以真皮内方式向一只小鼠的背侧皮肤施用相等体积的单独媒介物以充当阴性对照。在这个研究中处理的两个动物的注射部位的示意图提供于图29A中。

在施用后72小时，从每个处理部位获取完全厚度8mm活检体，并且一分为二。将每个节段的一半快速冷冻在液氮中，并且随后处理以进行qPCR和qRT-PCR分析来定量背侧皮肤中的LAMC2 DNA拷贝数(图29B)和转录物水平(图29C)。将每个活检体的剩余一半包埋在OCT中以测定免疫荧光(IF)。低温切片中的LAMC2表达通过使用抗人LAMC2抗体(Abcam，目录号ab96327)进行免疫荧光分析来测定。为确认从LGA表达的人LAMC2正确定位至皮肤的在其中得见天然层粘连蛋白-332的区域，还关于小鼠层粘连蛋白-332对背侧皮肤样品进行复染(pKal)。真皮内施用LGA导致对小鼠皮肤的成功转导，其中所编码的人转基因在表皮的正确层中稳健表达。组织学评价显示在经处理的部位处无炎症性浸润，从而证明这个疗法具有安全性。

总之，这个实施例中呈现的数据证明(1)HSV载体可被成功工程化来稳健表达人层粘连蛋白(尤其是人层粘连蛋白-332的β或γ亚单位)，(2)基于HSV的载体(LGA)可在体内成功递送人层粘连蛋白-332，以及(3)重组人层粘连蛋白-332亚单位在经处理的动物的表皮的适当区域中表达以及定位至经处理的动物的表皮的适当区域。

序列表

<110> 克里斯托生物技术股份有限公司(Krystal Biotech, Inc.)

克里希南•苏马(KRISHNAN, Suma)

帕里•特雷弗(PARRY, Trevor)

阿加瓦尔•普嘉(AGARWAL, Pooja)

<120> 用于美容性应用的编码一种或多种美容蛋白的重组核酸

<130> 761342000640

<140> 尚未分配

<141> 同时随同提交

<150> US 62/663,476

<151> 2018-04-27

<160> 64

<170> FastSEQ for Windows Version 4.0

<210> 1

<211> 4395

<212> DNA

<213> 智人(Homo sapiens)

<400> 1

atgttcagct ttgtggacct ccggctcctg ctcctcttag cggccaccgc cctcctgacg 60

cacggccaag aggaaggcca agtcgagggc caagacgaag acatcccacc aatcacctgc 120

gtacagaacg gcctcaggta ccatgaccga gacgtgtgga aacccgagcc ctgccggatc 180

tgcgtctgcg acaacggcaa ggtgttgtgc gatgacgtga tctgtgacga gaccaagaac 240

tgccccggcg ccgaagtccc cgagggcgag tgctgtcccg tctgccccga cggctcagag 300

tcacccaccg accaagaaac caccggcgtc gagggaccca agggagacac tggcccccga 360

ggcccaaggg gacccgcagg cccccctggc cgagatggca tccctggaca gcctggactt 420

cccggacccc ccggaccccc cggacctccc ggaccccctg gcctcggagg aaactttgct 480

ccccagctgt cttatggcta tgatgagaaa tcaaccggag gaatttccgt gcctggcccc 540

atgggtccct ctggtcctcg tggtctccct ggcccccctg gtgcacctgg tccccaaggc 600

ttccaaggtc cccctggtga gcctggcgag cctggagctt caggtcccat gggtccccga 660

ggtcccccag gtccccctgg aaagaatgga gatgatgggg aagctggaaa acctggtcgt 720

cctggtgagc gtgggcctcc tgggcctcag ggtgctcgag gattgcccgg aacagctggc 780

ctccctggaa tgaagggaca cagaggtttc agtggtttgg atggtgccaa gggagatgct 840

ggtcctgctg gtcctaaggg tgagcctggc agccctggtg aaaatggagc tcctggtcag 900

atgggccccc gtggcctgcc tggtgagaga ggtcgccctg gagcccctgg ccctgctggt 960

gctcgtggaa atgatggtgc tactggtgct gccgggcccc ctggtcccac cggccccgct 1020

ggtcctcctg gcttccctgg tgctgttggt gctaagggtg aagctggtcc ccaagggccc 1080

cgaggctctg aaggtcccca gggtgtgcgt ggtgagcctg gcccccctgg ccctgctggt 1140

gctgctggcc ctgctggaaa ccctggtgct gatggacagc ctggtgctaa aggtgccaat 1200

ggtgctcctg gtattgctgg tgctcctggc ttccctggtg cccgaggccc ctctggaccc 1260

cagggccccg gcggccctcc tggtcccaag ggtaacagcg gtgaacctgg tgctcctggc 1320

agcaaaggag acactggtgc taagggagag cctggccctg ttggtgttca aggaccccct 1380

ggccctgctg gagaggaagg aaagcgagga gctcgaggtg aacccggacc cactggcctg 1440

cccggacccc ctggcgagcg tggtggacct ggtagccgtg gtttccctgg cgcagatggt 1500

gttgctggtc ccaagggtcc cgctggtgaa cgtggttctc ctggccctgc tggccccaaa 1560

ggatctcctg gtgaagctgg tcgtcccggt gaagctggtc tgcctggtgc caagggtctg 1620

actggaagcc ctggcagccc tggtcctgat ggcaaaactg gcccccctgg tcccgccggt 1680

caagatggtc gccccggacc cccaggccca cctggtgccc gtggtcaggc tggtgtgatg 1740

ggattccctg gacctaaagg tgctgctgga gagcccggca aggctggaga gcgaggtgtt 1800

cccggacccc ctggcgctgt cggtcctgct ggcaaagatg gagaggctgg agctcaggga 1860

ccccctggcc ctgctggtcc cgctggcgag agaggtgaac aaggccctgc tggctccccc 1920

ggattccagg gtctccctgg tcctgctggt cctccaggtg aagcaggcaa acctggtgaa 1980

cagggtgttc ctggagacct tggcgcccct ggcccctctg gagcaagagg cgagagaggt 2040

ttccctggcg agcgtggtgt gcaaggtccc cctggtcctg ctggtccccg aggggccaac 2100

ggtgctcccg gcaacgatgg tgctaagggt gatgctggtg cccctggagc tcccggtagc 2160

cagggcgccc ctggccttca gggaatgcct ggtgaacgtg gtgcagctgg tcttccaggg 2220

cctaagggtg acagaggtga tgctggtccc aaaggtgctg atggctctcc tggcaaagat 2280

ggcgtccgtg gtctgactgg ccccattggt cctcctggcc ctgctggtgc ccctggtgac 2340

aagggtgaaa gtggtcccag cggccctgct ggtcccactg gagctcgtgg tgcccccgga 2400

gaccgtggtg agcctggtcc ccccggccct gctggctttg ctggcccccc tggtgctgac 2460

ggccaacctg gtgctaaagg cgaacctggt gatgctggtg ctaaaggcga tgctggtccc 2520

cctggccctg ccggacccgc tggaccccct ggccccattg gtaatgttgg tgctcctgga 2580

gccaaaggtg ctcgcggcag cgctggtccc cctggtgcta ctggtttccc tggtgctgct 2640

ggccgagtcg gtcctcctgg cccctctgga aatgctggac cccctggccc tcctggtcct 2700

gctggcaaag aaggcggcaa aggtccccgt ggtgagactg gccctgctgg acgtcctggt 2760

gaagttggtc cccctggtcc ccctggccct gctggcgaga aaggatcccc tggtgctgat 2820

ggtcctgctg gtgctcctgg tactcccggg cctcaaggta ttgctggaca gcgtggtgtg 2880

gtcggcctgc ctggtcagag aggagagaga ggcttccctg gtcttcctgg cccctctggt 2940

gaacctggca aacaaggtcc ctctggagca agtggtgaac gtggtccccc tggtcccatg 3000

ggcccccctg gattggctgg accccctggt gaatctggac gtgagggggc tcctggtgcc 3060

gaaggttccc ctggacgaga cggttctcct ggcgccaagg gtgaccgtgg tgagaccggc 3120

cccgctggac cccctggtgc tcctggtgct cctggtgccc ctggccccgt tggccctgct 3180

ggcaagagtg gtgatcgtgg tgagactggt cctgctggtc ccgccggtcc tgtcggccct 3240

gttggcgccc gtggccccgc cggaccccaa ggcccccgtg gtgacaaggg tgagacaggc 3300

gaacagggcg acagaggcat aaagggtcac cgtggcttct ctggcctcca gggtccccct 3360

ggccctcctg gctctcctgg tgaacaaggt ccctctggag cctctggtcc tgctggtccc 3420

cgaggtcccc ctggctctgc tggtgctcct ggcaaagatg gactcaacgg tctccctggc 3480

cccattgggc cccctggtcc tcgcggtcgc actggtgatg ctggtcctgt tggtcccccc 3540

ggccctcctg gacctcctgg tccccctggt cctcccagcg ctggtttcga cttcagcttc 3600

ctgccccagc cacctcaaga gaaggctcac gatggtggcc gctactaccg ggctgatgat 3660

gccaatgtgg ttcgtgaccg tgacctcgag gtggacacca ccctcaagag cctgagccag 3720

cagatcgaga acatccggag cccagagggc agccgcaaga accccgcccg cacctgccgt 3780

gacctcaaga tgtgccactc tgactggaag agtggagagt actggattga ccccaaccaa 3840

ggctgcaacc tggatgccat caaagtcttc tgcaacatgg agactggtga gacctgcgtg 3900

taccccactc agcccagtgt ggcccagaag aactggtaca tcagcaagaa ccccaaggac 3960

aagaggcatg tctggttcgg cgagagcatg accgatggat tccagttcga gtatggcggc 4020

cagggctccg accctgccga tgtggccatc cagctgacct tcctgcgcct gatgtccacc 4080

gaggcctccc agaacatcac ctaccactgc aagaacagcg tggcctacat ggaccagcag 4140

actggcaacc tcaagaaggc cctgctcctc cagggctcca acgagatcga gatccgcgcc 4200

gagggcaaca gccgcttcac ctacagcgtc actgtcgatg gctgcacgag tcacaccgga 4260

gcctggggca agacagtgat tgaatacaaa accaccaaga cctcccgcct gcccatcatc 4320

gatgtggccc ccttggacgt tggtgcccca gaccaggaat tcggcttcga cgttggccct 4380

gtctgcttcc tgtaa 4395

<210> 2

<211> 4395

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 2

atgttcagct tcgtggacct gagactgctg ctgctcctgg ctgctacagc cctgctgaca 60

cacggacaag aggaaggcca ggtcgaagga caggacgagg acatccctcc tatcacctgt 120

gtgcagaacg gcctgagata ccacgaccgg gatgtgtgga agcccgagcc ttgcagaatc 180

tgcgtgtgcg acaatggcaa ggtgctgtgc gacgacgtga tctgcgacga gacaaagaat 240

tgccctggcg ccgaagtgcc tgagggcgaa tgttgtcctg tgtgccctga tggcagcgag 300

agccccacag atcaagagac aacaggcgtg gaaggcccca agggcgatac aggacctaga 360

ggtcctagag gacctgccgg acctcctggc agagatggaa ttcctggaca gcctggactg 420

cccggaccac ctggacctcc agggcctcca ggtccaccag gactcggagg aaattttgcc 480

ccacagctga gctacggcta cgacgagaaa agcacaggcg gcatctctgt gcctggacct 540

atgggacctt ctggcccaag aggacttcct ggtcctcctg gtgctccagg acctcaggga 600

tttcaaggac caccaggcga acctggcgaa ccaggcgcta gtggtccaat gggaccaaga 660

ggccctcctg ggccaccagg caaaaatggc gacgatggcg aagccggaaa gcctggaagg 720

cctggcgaaa gaggcccgcc aggaccgcaa ggcgctagag ggttgcctgg aactgcagga 780

ctgcctggca tgaagggcca cagaggcttt tctggactgg atggcgctaa gggcgacgct 840

ggaccagcag gacctaaagg cgagcctgga tctcctggcg agaatggtgc acctggacag 900

atgggtccca gaggattgcc aggcgagaga ggtagacctg gcgctccggg accagccggt 960

gctagaggaa atgatggcgc aacaggtgct gctgggcctc ctggaccaac cggaccagct 1020

ggcccacctg gatttccagg cgctgttgga gcaaagggcg aagcaggccc acaaggacct 1080

aggggatctg aaggtcctca gggcgttaga ggcgagccag ggccacctgg gcctgccggt 1140

gcagctggac ctgctggaaa ccctggtgct gatggacagc caggtgccaa aggtgctaat 1200

ggcgcccctg gaattgccgg cgctccaggt tttcccggcg caagagggcc atctggacct 1260

caaggcccag gcggacctcc gggtcctaag ggaaatagcg gagagccagg cgctcctggg 1320

agtaaaggcg atactggcgc aaaaggcgaa cccggacctg tgggagttca aggacctcct 1380

ggaccagctg gcgaggaagg caaaagaggc gctaggggag aaccaggacc aacagggctc 1440

cctggtccac ctggcgagcg cggaggacct ggatctagag gattccctgg cgcagatggc 1500

gtggccggac caaaaggacc tgcaggcgaa aggggatcac caggtcctgc aggccctaag 1560

ggttctccag gcgaggctgg cagacccggc gaagctggac tcccaggtgc taagggactg 1620

acaggctcac caggatctcc cggaccagac ggaaaaacag gacctccagg accggcagga 1680

caggatggta gacccggtcc tcctggaccg cctggtgcaa gaggacaagc tggcgtgatg 1740

ggctttcctg gaccaaaagg tgcagccggc gaacctggaa aagcaggcga gaggggagtt 1800

cccggacctc caggtgctgt tggacctgcc ggaaaagatg gcgaagctgg tgcacaaggt 1860

cctccagggc cagccggacc agccggcgag agaggcgaac aaggaccagc cggatctcca 1920

ggatttcagg gactgccagg gcctgctggc ccgcctggcg aggcagggaa gccaggcgaa 1980

cagggtgttc ctggcgatct tggagcccct ggtcctagcg gagctagagg cgaaagagga 2040

tttcctggcg aaaggggcgt tcagggtcca ccgggaccag ctggaccaag gggtgcaaat 2100

ggtgccccag gcaatgacgg tgctaaaggc gacgcaggcg ccccaggtgc tcctggatct 2160

caaggcgcac ctggacttca gggaatgcct ggcgaacggg gagctgctgg acttcccggt 2220

ccaaaaggcg ataggggaga tgctggtcct aagggcgctg atggctctcc tggaaaggat 2280

ggcgtcagag gcctgacagg cccaattggc cctccgggac ctgctggcgc tccaggcgat 2340

aagggcgaat ctggacctag tggacccgct ggtcctacag gtgctagggg agccccaggc 2400

gaccggggag agcctggtcc accaggacct gctggatttg ctggacctcc tggcgctgat 2460

ggtcaacctg gtgctaaggg cgagccaggc gacgctggtg caaaaggcga cgctggtcca 2520

cctggaccgg ccggacctgc tgggccgcca ggacctattg gaaatgttgg tgcccctggc 2580

gccaaaggcg caagaggatc tgctggccca ccaggcgcta caggattccc aggtgccgct 2640

ggaagagttg gaccaccggg gccaagtgga aatgctggac caccgggacc gccaggacca 2700

gccggcaaag aaggtggaaa aggccctagg ggcgaaactg gccctgcagg caggccaggc 2760

gaagtgggcc ctccaggacc tccggggcct gccggcgaaa aaggatctcc aggcgcagat 2820

ggacccgcag gcgctcccgg aacaccaggt ccacagggaa ttgctggaca aaggggagtt 2880

gtcggcctgc caggacagag gggagagaga ggttttccag gactccctgg gccaagcgga 2940

gaacctggca aacagggacc atctggtgcc agcggagaga gagggccacc aggaccaatg 3000

ggtcctccag gattggcagg gcctcctggc gaatctggta gagaaggtgc tccaggcgcc 3060

gagggatctc ctggacgtga tggttctcct ggcgccaagg gcgatagagg cgaaacaggc 3120

ccagctggac ctccaggcgc acccggcgct ccaggcgcac caggacctgt tggccctgct 3180

ggaaaatctg gcgacagagg cgaaactgga cccgcaggac cagccggacc tgttggacct 3240

gtgggtgcta gaggacccgc tggaccacaa ggtcctagag gcgacaaggg cgaaacaggc 3300

gagcaaggcg acagaggcat caagggacac agaggattca gcggactgca gggaccacca 3360

gggccgcctg gaagtcccgg cgagcaggga ccaagcggag ctagtggtcc cgccggacct 3420

agaggaccac ctggttctgc tggtgcaccc ggaaaggacg gactgaatgg gctccccgga 3480

cctattgggc cacctggacc tagaggaaga acaggcgacg caggaccagt tggaccacct 3540

gggccacctg gaccgcctgg tcctcctgga cctccttctg ccggattcga cttcagcttc 3600

ctgcctcagc ctcctcaaga gaaggcccat gacggcggca gatattacag agccgacgac 3660

gccaacgtcg tgcgggacag agatctggaa gtggacacca cactgaagtc cctgtctcag 3720

cagatcgaga acatcagaag ccccgagggc agcagaaaga accctgccag aacctgtcgg 3780

gacctgaaga tgtgccacag cgattggaag tctggcgagt actggatcga ccccaaccag 3840

ggctgcaacc tggatgccat caaggtgttc tgcaacatgg aaaccggcga gacatgcgtg 3900

taccccacac agccatctgt ggctcagaag aactggtaca tcagcaagaa ccccaaggac 3960

aagcggcacg tttggttcgg cgagagcatg accgatggct tccagtttga gtatggcggc 4020

cagggctctg accctgccga tgttgctatc cagctgacct tcctgcggct gatgtctaca 4080

gaggccagcc agaacatcac ctaccactgc aagaacagcg tggcctacat ggatcagcag 4140

accggcaacc tgaagaaggc actgctgctt cagggcagca acgagatcga gatcagagcc 4200

gagggcaaca gccggttcac ctacagcgtg acagtggatg gctgcaccag ccatacaggc 4260

gcttggggca agaccgtgat cgagtacaag accaccaaga ccagcagact gcccatcatc 4320

gatgtggccc ctctggatgt tggggcaccc gatcaagagt tcggcttcga tgtgggccca 4380

gtgtgcttcc tgtaa 4395

<210> 3

<211> 4101

<212> DNA

<213> 智人(Homo sapiens)

<400> 3

atgctcagct ttgtggatac gcggactttg ttgctgcttg cagtaacctt atgcctagca 60

acatgccaat ctttacaaga ggaaactgta agaaagggcc cagccggaga tagaggacca 120

cgtggagaaa ggggtccacc aggcccccca ggcagagatg gtgaagatgg tcccacaggc 180

cctcctggtc cacctggtcc tcctggcccc cctggtctcg gtgggaactt tgctgctcag 240

tatgatggaa aaggagttgg acttggccct ggaccaatgg gcttaatggg acctagaggc 300

ccacctggtg cagctggagc cccaggccct caaggtttcc aaggacctgc tggtgagcct 360

ggtgaacctg gtcaaactgg tcctgcaggt gctcgtggtc cagctggccc tcctggcaag 420

gctggtgaag atggtcaccc tggaaaaccc ggacgacctg gtgagagagg agttgttgga 480

ccacagggtg ctcgtggttt ccctggaact cctggacttc ctggcttcaa aggcattagg 540

ggacacaatg gtctggatgg attgaaggga cagcccggtg ctcctggtgt gaagggtgaa 600

cctggtgccc ctggtgaaaa tggaactcca ggtcaaacag gagcccgtgg gcttcctggt 660

gagagaggac gtgttggtgc ccctggccca gctggtgccc gtggcagtga tggaagtgtg 720

ggtcccgtgg gtcctgctgg tcccattggg tctgctggcc ctccaggctt cccaggtgcc 780

cctggcccca agggtgaaat tggagctgtt ggtaacgctg gtcctgctgg tcccgccggt 840

ccccgtggtg aagtgggtct tccaggcctc tccggccccg ttggacctcc tggtaatcct 900

ggagcaaacg gccttactgg tgccaagggt gctgctggcc ttcccggcgt tgctggggct 960

cccggcctcc ctggaccccg cggtattcct ggccctgttg gtgctgccgg tgctactggt 1020

gccagaggac ttgttggtga gcctggtcca gctggctcca aaggagagag cggtaacaag 1080

ggtgagcccg gctctgctgg gccccaaggt cctcctggtc ccagtggtga agaaggaaag 1140

agaggcccta atggggaagc tggatctgcc ggccctccag gacctcctgg gctgagaggt 1200

agtcctggtt ctcgtggtct tcctggagct gatggcagag ctggcgtcat gggccctcct 1260

ggtagtcgtg gtgcaagtgg ccctgctgga gtccgaggac ctaatggaga tgctggtcgc 1320

cctggggagc ctggtctcat gggacccaga ggtcttcctg gttcccctgg aaatatcggc 1380

cccgctggaa aagaaggtcc tgtcggcctc cctggcatcg acggcaggcc tggcccaatt 1440

ggcccagctg gagcaagagg agagcctggc aacattggat tccctggacc caaaggcccc 1500

actggtgatc ctggcaaaaa cggtgataaa ggtcatgctg gtcttgctgg tgctcggggt 1560

gctccaggtc ctgatggaaa caatggtgct cagggacctc ctggaccaca gggtgttcaa 1620

ggtggaaaag gtgaacaggg tccccctggt cctccaggct tccagggtct gcctggcccc 1680

tcaggtcccg ctggtgaagt tggcaaacca ggagaaaggg gtctccatgg tgagtttggt 1740

ctccctggtc ctgctggtcc aagaggggaa cgcggtcccc caggtgagag tggtgctgcc 1800

ggtcctactg gtcctattgg aagccgaggt ccttctggac ccccagggcc tgatggaaac 1860

aagggtgaac ctggtgtggt tggtgctgtg ggcactgctg gtccatctgg tcctagtgga 1920

ctcccaggag agaggggtgc tgctggcata cctggaggca agggagaaaa gggtgaacct 1980

ggtctcagag gtgaaattgg taaccctggc agagatggtg ctcgtggtgc tcctggtgct 2040

gtaggtgccc ctggtcctgc tggagccaca ggtgaccggg gcgaagctgg ggctgctggt 2100

cctgctggtc ctgctggtcc tcggggaagc cctggtgaac gtggtgaggt cggtcctgct 2160

ggccccaatg gatttgctgg tcctgctggt gctgctggtc aacctggtgc taaaggagaa 2220

agaggagcca aagggcctaa gggtgaaaac ggtgttgttg gtcccacagg ccccgttgga 2280

gctgctggcc cagctggtcc aaatggtccc cccggtcctg ctggaagtcg tggtgatgga 2340

ggcccccctg gtatgactgg tttccctggt gctgctggac ggactggtcc cccaggaccc 2400

tctggtattt ctggccctcc tggtccccct ggtcctgctg ggaaagaagg gcttcgtggt 2460

cctcgtggtg accaaggtcc agttggccga actggagaag taggtgcagt tggtccccct 2520

ggcttcgctg gtgagaaggg tccctctgga gaggctggta ctgctggacc tcctggcact 2580

ccaggtcctc agggtcttct tggtgctcct ggtattctgg gtctccctgg ctcgagaggt 2640

gaacgtggtc taccaggtgt tgctggtgct gtgggtgaac ctggtcctct tggcattgcc 2700

ggccctcctg gggcccgtgg tcctcctggt gctgtgggta gtcctggagt caacggtgct 2760

cctggtgaag ctggtcgtga tggcaaccct gggaacgatg gtcccccagg tcgcgatggt 2820

caacccggac acaagggaga gcgcggttac cctggcaata ttggtcccgt tggtgctgca 2880

ggtgcacctg gtcctcatgg ccccgtgggt cctgctggca aacatggaaa ccgtggtgaa 2940

actggtcctt ctggtcctgt tggtcctgct ggtgctgttg gcccaagagg tcctagtggc 3000

ccacaaggca ttcgtggcga taagggagag cccggtgaaa aggggcccag aggtcttcct 3060

ggcttaaagg gacacaatgg attgcaaggt ctgcctggta tcgctggtca ccatggtgat 3120

caaggtgctc ctggctccgt gggtcctgct ggtcctaggg gccctgctgg tccttctggc 3180

cctgctggaa aagatggtcg cactggacat cctggtacag ttggacctgc tggcattcga 3240

ggccctcagg gtcaccaagg ccctgctggc ccccctggtc cccctggccc tcctggacct 3300

ccaggtgtaa gcggtggtgg ttatgacttt ggttacgatg gagacttcta cagggctgac 3360

cagcctcgct cagcaccttc tctcagaccc aaggactatg aagttgatgc tactctgaag 3420

tctctcaaca accagattga gacccttctt actcctgaag gctctagaaa gaacccagct 3480

cgcacatgcc gtgacttgag actcagccac ccagagtgga gcagtggtta ctactggatt 3540

gaccctaacc aaggatgcac tatggatgct atcaaagtat actgtgattt ctctactggc 3600

gaaacctgta tccgggccca acctgaaaac atcccagcca agaactggta taggagctcc 3660

aaggacaaga aacacgtctg gctaggagaa actatcaatg ctggcagcca gtttgaatat 3720

aatgtagaag gagtgacttc caaggaaatg gctacccaac ttgccttcat gcgcctgctg 3780

gccaactatg cctctcagaa catcacctac cactgcaaga acagcattgc atacatggat 3840

gaggagactg gcaacctgaa aaaggctgtc attctacagg gctctaatga tgttgaactt 3900

gttgctgagg gcaacagcag gttcacttac actgttcttg tagatggctg ctctaaaaag 3960

acaaatgaat ggggaaagac aatcattgaa tacaaaacaa ataagccatc acgcctgccc 4020

ttccttgata ttgcaccttt ggacatcggt ggtgctgacc aggaattctt tgtggacatt 4080

ggcccagtct gtttcaaata a 4101

<210> 4

<211> 4101

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 4

atgctgagct tcgtggacac cagaacactg ctgctgctgg ccgtgacact gtgtctggcc 60

acttgtcaga gcctgcaaga ggaaacagtg cggaaaggac ctgccggcga tagaggacct 120

agaggcgaaa gaggtcctcc tggacctcct ggtagagatg gcgaggatgg acctacagga 180

ccacctggtc caccaggacc tccagggcct cctggccttg gaggaaattt tgccgctcag 240

tacgatggca aaggcgtcgg acttggccct ggacctatgg gacttatggg cccaagagga 300

ccaccaggtg ctgcaggcgc tccaggacca caaggatttc aaggaccagc tggcgagcct 360

ggcgaacctg gacaaacagg tcctgctggt gctagaggac cagccgggcc acctggaaaa 420

gctggcgaag atgggcaccc tggaaagcct ggtagacccg gcgaaagggg tgttgttgga 480

cctcaaggcg ccagaggctt tcctggaaca cctggactgc ctggcttcaa gggcatcaga 540

ggccacaatg gcctggacgg actgaaagga caacctggtg ctcctggcgt gaaaggcgaa 600

ccaggcgcac ctggcgaaaa tggcacacca ggacaaaccg gcgcaagagg acttcctggc 660

gagagaggaa gagttggagc cccaggtcca gcaggcgcac gaggatctga tggatctgtg 720

ggacctgttg gccctgccgg acctattgga agtgctggcc ctcctggatt tcctggcgca 780

cccggaccaa agggcgaaat tggagctgtg ggaaacgccg gacctgcagg cccagctgga 840

ccaaggggag aagttggatt gcctggactg agcggaccag ttgggccacc agggaatcct 900

ggtgccaatg gactgacagg cgctaaaggt gcagctggcc ttccaggcgt tgccggtgca 960

ccaggactgc caggaccaag aggtatccct ggtcctgttg gagctgctgg cgctacgggt 1020

gccagaggac ttgttggaga acctgggcca gccggatcta agggcgagtc tggaaacaag 1080

ggcgagccag gatctgctgg tccacaaggc ccgcctggac catcaggcga agaaggcaaa 1140

cgaggcccta atggcgaagc cggtagtgcc gggcctcctg gaccaccagg ccttagagga 1200

tctcctggct ctagaggatt gccaggcgct gatggtagag caggcgttat gggtccacct 1260

ggatcaagag gcgcttctgg ccctgctggc gttagaggtc caaatggcga cgctggcaga 1320

ccaggcgagc ccggtcttat ggggcctaga gggttgcctg gaagccctgg caatatcggc 1380

ccagccggaa aagaaggccc tgttggactc cctggcatcg acggtagacc tggaccaatc 1440

ggacccgcag gcgctagggg agagcctgga aatattggct tccctgggcc taaaggcccc 1500

acaggcgatc ctggaaagaa cggcgataag ggccatgctg gactcgctgg tgcaagggga 1560

gcacctggac ctgacggaaa caatggtgct caagggccgc ctgggccaca aggtgttcaa 1620

ggtggaaaag gcgagcaggg cccacctggg cctccaggct tccaaggact tcccggacca 1680

tctgggccag caggcgaagt tggaaagcct ggcgaaagag gactgcacgg cgagtttggc 1740

ttgccgggtc ctgccggtcc acggggagag agaggccctc caggcgaatc tggcgccgca 1800

ggacctactg gccctatcgg aagcagagga cctagtggac ctccaggacc tgatggcaac 1860

aaaggcgaac ctggtgttgt gggcgctgtg ggaacagctg gaccttctgg tccttctgga 1920

ttgcccggcg agcgcggagc agctggtatt cctggtggca aaggcgaaaa gggcgagcct 1980

ggactcagag gcgagatcgg caatcccgga cgagatggcg ctagaggcgc cccaggtgca 2040

gttggtgccc cgggacctgc tggcgcaaca ggcgacagag gcgaggctgg tgccgctggt 2100

cctgccgggc cagccggtcc tagaggaagt ccaggcgaga ggggcgaagt gggacccgct 2160

ggacccaatg gatttgctgg gcccgctggc gctgctggtc aacctggcgc caaaggcgag 2220

cggggagcta aaggtcctaa aggcgagaat ggcgtcgtgg gccctactgg accagtggga 2280

gcagcaggcc ccgcaggtcc taacggacca cctggaccag ctgggtctag aggcgacggc 2340

ggaccgcctg gaatgacagg ttttccaggc gccgctggaa gaacaggtcc tccaggacca 2400

tctggcatct ctggtccacc agggccacct ggtcctgctg gaaaagaagg actgagaggc 2460

cctaggggcg atcagggtcc agttggaaga accggcgaag tcggagctgt cggcccacca 2520

ggttttgccg gcgaaaaagg ccctagcgga gaagctggaa ctgcaggacc gccgggaact 2580

cccggtcctc aaggattgct tggcgcccct ggaattctgg gactgcccgg tagtcgcgga 2640

gaacgtggac tcccaggtgt tgctggcgcc gtcggagaac cgggaccact tggaattgct 2700

ggaccacctg gtgcaagagg tccacctggt gcagttggaa gtcctggcgt taacggtgct 2760

ccaggcgaag ccggcagaga tggaaatccc ggcaatgatg gcccgcctgg gagagatgga 2820

cagcctggac ataagggcga gcgaggctac ccaggcaata ttggacctgt cggcgcagcc 2880

ggtgctcccg gacctcatgg tccagtcggt ccagccggga agcacggaaa taggggagaa 2940

acaggaccct ccggtcctgt tggcccagct ggcgcagttg gaccaagagg cccatccgga 3000

cctcagggaa tccgcggaga taagggcgaa cctggcgaga agggacctag aggactgcct 3060

gggctgaaag gccataacgg actgcaaggc ctgccaggca ttgctggcca tcatggcgat 3120

caaggtgcac ccggtagtgt gggtcccgcc ggaccgaggg gtcccgctgg tccatctgga 3180

cccgccggaa aagatggcag aacaggacat cctggcacag tggggcctgc cggaattaga 3240

ggcccacagg gacatcaagg ccccgctggg ccgccaggac ctccgggacc gccagggcca 3300

ccaggcgtta gtggcggagg atacgatttc ggctacgacg gcgacttcta cagagccgac 3360

cagcctagat ctgcccctag cctgaggcct aaggactacg aagtggacgc cacactgaag 3420

tccctgaaca accagatcga gacactgctg acccctgagg gcagcagaaa gaaccctgcc 3480

agaacctgca gggacctgag actgtctcac cccgaatggt cctccggcta ctactggatc 3540

gaccccaatc agggctgcac catggacgcc atcaaggtgt actgcgactt cagcaccggc 3600

gagacatgca tcagagccca gcctgagaac atccccgcca agaactggta cagaagcagc 3660

aaggacaaga aacacgtgtg gctgggcgag acaatcaacg ccggcagcca gttcgagtac 3720

aacgtggaag gcgtgaccag caaagagatg gccacacagc tggctttcat gagactgctg 3780

gccaattacg ccagccagaa catcacctac cactgcaaga acagcattgc ctacatggac 3840

gaggaaaccg gcaacctgaa gaaagccgtg atcctgcagg gctctaacga cgtggaactg 3900

gtggccgagg gcaacagcag attcacctac accgtgctgg tggacggctg cagcaaaaag 3960

accaacgagt ggggcaagac catcatcgag tataagacca acaagcccag cagactgccc 4020

ttcctggata tcgccccact ggatattgga ggcgccgacc aagagttctt tgtggacatc 4080

ggccccgtgt gcttcaagtg a 4101

<210> 5

<211> 4401

<212> DNA

<213> 智人(Homo sapiens)

<400> 5

atgatgagct ttgtgcaaaa ggggagctgg ctacttctcg ctctgcttca tcccactatt 60

attttggcac aacaggaagc tgttgaagga ggatgttccc atcttggtca gtcctatgcg 120

gatagagatg tctggaagcc agaaccatgc caaatatgtg tctgtgactc aggatccgtt 180

ctctgcgatg acataatatg tgacgatcaa gaattagact gccccaaccc agaaattcca 240

tttggagaat gttgtgcagt ttgcccacag cctccaactg ctcctactcg ccctcctaat 300

ggtcaaggac ctcaaggccc caagggagat ccaggccctc ctggtattcc tgggagaaat 360

ggtgaccctg gtattccagg acaaccaggg tcccctggtt ctcctggccc ccctggaatc 420

tgtgaatcat gccctactgg tcctcagaac tattctcccc agtatgattc atatgatgtc 480

aagtctggag tagcagtagg aggactcgca ggctatcctg gaccagctgg ccccccaggc 540

cctcccggtc cccctggtac atctggtcat cctggttccc ctggatctcc aggataccaa 600

ggaccccctg gtgaacctgg gcaagctggt ccttcaggcc ctccaggacc tcctggtgct 660

ataggtccat ctggtcctgc tggaaaagat ggagaatcag gtagacccgg acgacctgga 720

gagcgaggat tgcctggacc tccaggtatc aaaggtccag ctgggatacc tggattccct 780

ggtatgaaag gacacagagg cttcgatgga cgaaatggag aaaagggtga aacaggtgct 840

cctggattaa agggtgaaaa tggtcttcca ggcgaaaatg gagctcctgg acccatgggt 900

ccaagagggg ctcctggtga gcgaggacgg ccaggacttc ctggggctgc aggtgctcgg 960

ggtaatgacg gtgctcgagg cagtgatggt caaccaggcc ctcctggtcc tcctggaact 1020

gccggattcc ctggatcccc tggtgctaag ggtgaagttg gacctgcagg gtctcctggt 1080

tcaaatggtg cccctggaca aagaggagaa cctggacctc agggacacgc tggtgctcaa 1140

ggtcctcctg gccctcctgg gattaatggt agtcctggtg gtaaaggcga aatgggtccc 1200

gctggcattc ctggagctcc tggactgatg ggagcccggg gtcctccagg accagccggt 1260

gctaatggtg ctcctggact gcgaggtggt gcaggtgagc ctggtaagaa tggtgccaaa 1320

ggagagcccg gaccacgtgg tgaacgcggt gaggctggta ttccaggtgt tccaggagct 1380

aaaggcgaag atggcaagga tggatcacct ggagaacctg gtgcaaatgg gcttccagga 1440

gctgcaggag aaaggggtgc ccctgggttc cgaggacctg ctggaccaaa tggcatccca 1500

ggagaaaagg gtcctgctgg agagcgtggt gctccaggcc ctgcagggcc cagaggagct 1560

gctggagaac ctggcagaga tggcgtccct ggaggtccag gaatgagggg catgcccgga 1620

agtccaggag gaccaggaag tgatgggaaa ccagggcctc ccggaagtca aggagaaagt 1680

ggtcgaccag gtcctcctgg gccatctggt ccccgaggtc agcctggtgt catgggcttc 1740

cccggtccta aaggaaatga tggtgctcct ggtaagaatg gagaacgagg tggccctgga 1800

ggacctggcc ctcagggtcc tcctggaaag aatggtgaaa ctggacctca gggaccccca 1860

gggcctactg ggcctggtgg tgacaaagga gacacaggac cccctggtcc acaaggatta 1920

caaggcttgc ctggtacagg tggtcctcca ggagaaaatg gaaaacctgg ggaaccaggt 1980

ccaaagggtg atgccggtgc acctggagct ccaggaggca agggtgatgc tggtgcccct 2040

ggtgaacgtg gacctcctgg attggcaggg gccccaggac ttagaggtgg agctggtccc 2100

cctggtcccg aaggaggaaa gggtgctgct ggtcctcctg ggccacctgg tgctgctggt 2160

actcctggtc tgcaaggaat gcctggagaa agaggaggtc ttggaagtcc tggtccaaag 2220

ggtgacaagg gtgaaccagg cggtccaggt gctgatggtg tcccagggaa agatggccca 2280

aggggtccta ctggtcctat tggtcctcct ggcccagctg gccagcctgg agataagggt 2340

gaaggtggtg cccccggact tccaggtata gctggacctc gtggtagccc tggtgagaga 2400

ggtgaaactg gccctccagg acctgctggt ttccctggtg ctcctggaca gaatggtgaa 2460

cctggtggta aaggagaaag aggggctccg ggtgagaaag gtgaaggagg ccctcctgga 2520

gttgcaggac cccctggagg ttctggacct gctggtcctc ctggtcccca aggtgtcaaa 2580

ggtgaacgtg gcagtcctgg tggacctggt gctgctggct tccctggtgc tcgtggtctt 2640

cctggtcctc ctggtagtaa tggtaaccca ggacccccag gtcccagcgg ttctccaggc 2700

aaggatgggc ccccaggtcc tgcgggtaac actggtgctc ctggcagccc tggagtgtct 2760

ggaccaaaag gtgatgctgg ccaaccagga gagaagggat cgcctggtgc ccagggccca 2820

ccaggagctc caggcccact tgggattgct gggatcactg gagcacgggg tcttgcagga 2880

ccaccaggca tgccaggtcc taggggaagc cctggccctc agggtgtcaa gggtgaaagt 2940

gggaaaccag gagctaacgg tctcagtgga gaacgtggtc cccctggacc ccagggtctt 3000

cctggtctgg ctggtacagc tggtgaacct ggaagagatg gaaaccctgg atcagatggt 3060

cttccaggcc gagatggatc tcctggtggc aagggtgatc gtggtgaaaa tggctctcct 3120

ggtgcccctg gcgctcctgg tcatccaggc ccacctggtc ctgtcggtcc agctggaaag 3180

agtggtgaca gaggagaaag tggccctgct ggccctgctg gtgctcccgg tcctgctggt 3240

tcccgaggtg ctcctggtcc tcaaggccca cgtggtgaca aaggtgaaac aggtgaacgt 3300

ggagctgctg gcatcaaagg acatcgagga ttccctggta atccaggtgc cccaggttct 3360

ccaggccctg ctggtcagca gggtgcaatc ggcagtccag gacctgcagg ccccagagga 3420

cctgttggac ccagtggacc tcctggcaaa gatggaacca gtggacatcc aggtcccatt 3480

ggaccaccag ggcctcgagg taacagaggt gaaagaggat ctgagggctc cccaggccac 3540

ccagggcaac caggccctcc tggacctcct ggtgcccctg gtccttgctg tggtggtgtt 3600

ggagccgctg ccattgctgg gattggaggt gaaaaagctg gcggttttgc cccgtattat 3660

ggagatgaac caatggattt caaaatcaac accgatgaga ttatgacttc actcaagtct 3720

gttaatggac aaatagaaag cctcattagt cctgatggtt ctcgtaaaaa ccccgctaga 3780

aactgcagag acctgaaatt ctgccatcct gaactcaaga gtggagaata ctgggttgac 3840

cctaaccaag gatgcaaatt ggatgctatc aaggtattct gtaatatgga aactggggaa 3900

acatgcataa gtgccaatcc tttgaatgtt ccacggaaac actggtggac agattctagt 3960

gctgagaaga aacacgtttg gtttggagag tccatggatg gtggttttca gtttagctac 4020

ggcaatcctg aacttcctga agatgtcctt gatgtgcagc tggcattcct tcgacttctc 4080

tccagccgag cttcccagaa catcacatat cactgcaaaa atagcattgc atacatggat 4140

caggccagtg gaaatgtaaa gaaggccctg aagctgatgg ggtcaaatga aggtgaattc 4200

aaggctgaag gaaatagcaa attcacctac acagttctgg aggatggttg cacgaaacac 4260

actggggaat ggagcaaaac agtctttgaa tatcgaacac gcaaggctgt gagactacct 4320

attgtagata ttgcacccta tgacattggt ggtcctgatc aagaatttgg tgtggacgtt 4380

ggccctgttt gctttttata a 4401

<210> 6

<211> 4401

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 6

atgatgagct tcgtgcagaa aggcagctgg ctgctgctgg cactgctgca ccctacaatc 60

attctggccc agcaagaggc cgtggaaggc ggatgttctc acctgggaca gagctacgcc 120

gacagggatg tgtggaagcc tgagccttgc cagatctgcg tgtgtgatag cggcagcgtg 180

ctgtgcgacg acatcatctg cgacgaccaa gagctggact gccccaatcc tgagatccct 240

ttcggcgagt gctgtgccgt ttgtccccaa cctcctaccg ctcctaccag acctcctaat 300

ggacagggac ctcagggccc taaaggcgat cctggacctc ctggaatccc cggcagaaat 360

ggcgatccag gcattcctgg acagcctggc tctcctggaa gtccaggtcc acctggcatc 420

tgcgagagct gtcctacagg ccctcagaac tacagcccac agtacgacag ctacgacgtg 480

aagtctggcg tggccgttgg aggactggct ggttatccag gacctgctgg accaccaggg 540

cctccaggac cgcctggaac aagtggacat ccaggatctc ccggcagtcc cggttatcag 600

ggaccacctg gcgaacctgg acaggcagga cctagtggtc ctcctggtcc accaggtgcc 660

attggaccat ctggacctgc cggaaaggat ggcgaatctg gcagaccagg cagacctggc 720

gagagaggat tgcctggtcc tccgggtatt aagggcccag ccggcattcc aggattcccc 780

ggaatgaagg gccacagagg cttcgatgga cggaatggcg agaagggcga aacaggtgcc 840

cctggactga aaggcgaaaa tggactgcca ggcgagaatg gcgcacccgg acctatggga 900

cctagaggtg ctccaggcga aagaggaagg ccaggacttc ctggtgctgc aggcgctaga 960

ggcaatgatg gcgccagagg atctgatggc caacctgggc cgccaggacc tccaggcaca 1020

gctggctttc ccggatctcc tggtgcaaag ggcgaagtgg gaccagctgg aagccctgga 1080

tctaatggtg ccccaggaca gaggggagaa ccaggaccac aaggacatgc tggtgctcaa 1140

ggccctccgg gtcctccagg gatcaatgga tctccaggcg gcaaaggcga gatgggccct 1200

gctggaattc ctggcgctcc aggtcttatg ggagccagag ggccacctgg accagcaggc 1260

gcaaatggcg ctcctggact tagaggcgga gcaggcgagc ctggaaaaaa tggcgcaaaa 1320

ggcgagcccg gaccaagggg agaaagaggc gaagctggta ttccaggtgt ccctggtgcc 1380

aaaggcgagg acggcaaaga tggtagtcct ggcgagccag gcgccaatgg actccctggc 1440

gcagctggcg aaaggggagc acctggtttt agaggacccg ccggacctaa tggcattccc 1500

ggcgaaaaag gtccagccgg cgagcgtggt gctcccggac ctgcaggccc aagaggtgct 1560

gctggcgaac caggcagaga tggtgtccca ggcggaccag ggatgagagg catgccaggc 1620

tcacccggcg gacctggttc tgatggaaaa cccgggcctc ctggtagcca gggcgaatcc 1680

ggtagacccg gacctccggg accatcagga ccaagaggac aacctggcgt gatgggcttc 1740

cctggaccta agggaaatga cggcgctccc ggaaagaacg gcgaacgcgg tggccctggc 1800

ggtcccggtc ctcaagggcc accaggcaaa aacggcgaaa ccggtccaca aggaccacct 1860

ggacctacag gacctggcgg agataagggc gatacaggtc caccaggacc tcagggactg 1920

caaggactgc ctggaactgg cggacctcct ggcgagaatg gaaaaccagg cgaaccagga 1980

cctaagggcg acgctggtgc acctggcgca ccaggcggaa agggcgacgc aggcgctcca 2040

ggcgagaggg gacctccagg attggctggt gctccaggct tgagaggcgg agctggtcct 2100

ccaggacctg aaggtggaaa aggtgctgca ggacctcctg ggccacctgg cgctgctgga 2160

actccaggac ttcaagggat gcctggcgaa cgaggtggac ttggaagccc aggaccaaaa 2220

ggcgataagg gcgaacctgg cggaccgggt gcagatggtg ttcccggaaa agatggacca 2280

cggggcccaa caggacctat aggccctcca gggccagcag gacagccggg cgacaaaggc 2340

gaaggtggcg cccctggctt gcctggaatt gctggtccta gaggttcacc tggcgagcgg 2400

ggagaaacag gccctcctgg accggccgga tttcccggtg ctcctggcca aaatggcgag 2460

cctggcggaa aaggcgaaag aggtgcaccg ggcgaaaaag gcgaaggcgg acctcctggt 2520

gttgctggac ctcctggcgg atctggacca gctgggcctc ctggtcctca aggtgttaag 2580

ggcgaaagag gctctccagg cggacccggt gctgctggat ttcccggcgc aagaggattg 2640

cccggaccac caggctctaa tggcaatcca ggtcctcctg gacctagcgg ctctcctggc 2700

aaagatggcc caccaggacc agccggaaat actggtgctc ctggatcacc tggcgtgtcc 2760

ggaccgaaag gcgacgccgg acaaccaggc gaaaaaggat ctcctggcgc tcaagggcct 2820

cctggcgcac ctggtccatt gggaattgcc ggaattacag gtgccagagg cctggctggc 2880

ccacctggaa tgcctgggcc aagaggtagc ccgggacctc aaggcgtgaa aggcgaatct 2940

ggaaagcctg gcgccaacgg actgagcgga gaaagaggac ctccaggtcc acaaggcctg 3000

cctggattgg ctggaacagc tggcgaacct ggaagagatg gcaatcctgg ctctgatggc 3060

ttgccgggga gagatggctc cccaggtggc aagggcgatc gcggagaaaa tggtagccca 3120

ggcgctcccg gcgctccagg acacccagga ccacctggtc cagtcggacc tgctggaaag 3180

tctggcgata gaggcgagtc tggacccgca ggtcccgctg gcgccccagg gcctgccgga 3240

tctaggggag cccctggacc gcaaggacct aggggagaca aaggcgagac tggcgaacgc 3300

ggagccgctg gaatcaaagg ccatagagga ttcccaggca accctggtgc acccggatca 3360

ccaggaccgg caggacaaca aggcgctatt ggcagtccgg ggcctgctgg gccgagagga 3420

ccagttggac ctagtggacc accgggcaaa gatggaacaa gcggacaccc tggacctatc 3480

ggaccaccag gacctagagg caatagaggc gagagaggca gcgagggatc tcccggacat 3540

cctggacaac ccggtccacc ggggccacca ggcgcaccag ggccatgttg tggcggagtt 3600

ggagctgctg ccattgctgg aatcggcgga gagaaagccg gcggatttgc cccttattac 3660

ggcgacgagc ccatggattt caagatcaac accgacgaga tcatgaccag cctgaagtcc 3720

gtgaacggcc agatcgagag cctgatcagc cctgacggca gcagaaagaa ccccgccaga 3780

aactgccgcg acctgaagtt ctgtcacccc gagctgaaaa gcggcgagta ctgggttgac 3840

cccaaccagg gctgtaaact ggacgccatt aaggtgttct gcaacatgga aaccggcgag 3900

acatgcatca gcgccaatcc tctgaacgtg cccagaaagc actggtggac agatagcagc 3960

gccgagaaga agcacgtttg gttcggcgag agcatggacg gcggcttcca gttctcttac 4020

ggcaatcccg agctgcccga ggacgtgctg gatgtgcaac tggcctttct gagactgctg 4080

agcagccgcg ccagccagaa tatcacctac cactgcaaga acagcattgc ctacatggat 4140

caggccagcg gcaacgtgaa gaaagccctg aagctgatgg gcagcaacga gggcgagttt 4200

aaggccgagg gcaacagcaa gttcacctac accgtgctgg aagatggctg caccaagcac 4260

acaggcgagt ggtccaagac cgtgttcgag taccggacaa gaaaggccgt gcggctgcct 4320

atcgtggata tcgcccctta cgatatcgga ggccccgatc aagagttcgg cgttgacgtg 4380

ggccctgtgt gtttcctgta a 4401

<210> 7

<211> 5010

<212> DNA

<213> 智人(Homo sapiens)

<400> 7

atggggcccc ggctcagcgt ctggctgctg ctgctgcccg ccgcccttct gctccacgag 60

gagcacagcc gggccgctgc gaagggtggc tgtgctggct ctggctgtgg caaatgtgac 120

tgccatggag tgaagggaca aaagggtgaa agaggcctcc cggggttaca aggtgtcatt 180

gggtttcctg gaatgcaagg acctgagggg ccacagggac caccaggaca aaagggtgat 240

actggagaac caggactacc tggaacaaaa gggacaagag gacctccggg agcatctggc 300

taccctggaa acccaggact tcccggaatt cctggccaag acggcccgcc aggcccccca 360

ggtattccag gatgcaatgg cacaaagggg gagagagggc cgctcgggcc tcctggcttg 420

cctggtttcg ctggaaatcc cggaccacca ggcttaccag ggatgaaggg tgatccaggt 480

gagatacttg gccatgtgcc cgggatgctg ttgaaaggtg aaagaggatt tcccggaatc 540

ccagggactc caggcccacc aggactgcca gggcttcaag gtcctgttgg gcctccagga 600

tttaccggac caccaggtcc cccaggccct cccggccctc caggtgaaaa gggacaaatg 660

ggcttaagtt ttcaaggacc aaaaggtgac aagggtgacc aaggggtcag tgggcctcca 720

ggagtaccag gacaagctca agttcaagaa aaaggagact tcgccaccaa gggagaaaag 780

ggccaaaaag gtgaacctgg atttcagggg atgccagggg tcggagagaa aggtgaaccc 840

ggaaaaccag gacccagagg caaacccgga aaagatggtg acaaagggga aaaagggagt 900

cccggttttc ctggtgaacc cgggtaccca ggactcatag gccgccaggg cccgcaggga 960

gaaaagggtg aagcaggtcc tcctggccca cctggaattg ttataggcac aggacctttg 1020

ggagaaaaag gagagagggg ctaccctgga actccggggc caagaggaga gccaggccca 1080

aaaggtttcc caggactacc aggccaaccc ggacctccag gcctccctgt acctgggcag 1140

gctggtgccc ctggcttccc tggtgaaaga ggagaaaaag gtgaccgagg atttcctggt 1200

acatctctgc caggaccaag tggaagagat gggctcccgg gtcctcctgg ttcccctggg 1260

ccccctgggc agcctggcta cacaaatgga attgtggaat gtcagcccgg acctccaggt 1320

gaccagggtc ctcctggaat tccagggcag ccaggattta taggcgaaat tggagagaaa 1380

ggtcaaaaag gagagagttg cctcatctgt gatatagacg gatatcgggg gcctcccggg 1440

ccacagggac ccccgggaga aataggtttc ccagggcagc caggggccaa gggcgacaga 1500

ggtttgcctg gcagagatgg tgttgcagga gtgccaggcc ctcaaggtac accagggctg 1560

ataggccagc caggagccaa gggggagcct ggtgagtttt atttcgactt gcggctcaaa 1620

ggtgacaaag gagacccagg ctttccagga cagcccggca tgccagggag agcgggttct 1680

cctggaagag atggccatcc gggtcttcct ggccccaagg gctcgccggg ttctgtagga 1740

ttgaaaggag agcgtggccc ccctggagga gttggattcc caggcagtcg tggtgacacc 1800

ggcccccctg ggcctccagg atatggtcct gctggtccca ttggtgacaa aggacaagca 1860

ggctttcctg gaggccctgg atccccaggc ctgccaggtc caaagggtga accaggaaaa 1920

attgttcctt taccaggccc ccctggagca gaaggactgc cggggtcccc aggcttccca 1980

ggtccccaag gagaccgagg ctttcccgga accccaggaa ggccaggcct gccaggagag 2040

aagggcgctg tgggccagcc aggcattgga tttccagggc cccccggccc caaaggtgtt 2100

gacggcttac ctggagacat ggggccaccg gggactccag gtcgcccggg atttaatggc 2160

ttacctggga acccaggtgt gcagggccag aagggagagc ctggagttgg tctaccggga 2220

ctcaaaggtt tgccaggtct tcccggcatt cctggcacac ccggggagaa ggggagcatt 2280

ggggtaccag gcgttcctgg agaacatgga gcgatcggac cccctgggct tcaggggatc 2340

agaggtgaac cgggacctcc tggattgcca ggctccgtgg ggtctccagg agttccagga 2400

ataggccccc ctggagctag gggtccccct ggaggacagg gaccaccggg gttgtcaggc 2460

cctcctggaa taaaaggaga gaagggtttc cccggattcc ctggactgga catgccgggc 2520

cctaaaggag ataaaggggc tcaaggactc cctggcataa cgggacagtc ggggctccct 2580

ggccttcctg gacagcaggg ggctcctggg attcctgggt ttccaggttc caagggagaa 2640

atgggcgtca tggggacccc cgggcagccg ggctcaccag gaccagtggg tgctcctgga 2700

ttaccgggtg aaaaagggga ccatggcttt ccgggctcct caggacccag gggagaccct 2760

ggcttgaaag gtgataaggg ggatgtcggt ctccctggca agcctggctc catggataag 2820

gtggacatgg gcagcatgaa gggccagaaa ggagaccaag gagagaaagg acaaattgga 2880

ccaattggtg agaagggatc ccgaggagac cctgggaccc caggagtgcc tggaaaggac 2940

gggcaggcag gacagcctgg gcagccagga cctaaaggtg atccaggtat aagtggaacc 3000

ccaggtgctc caggacttcc gggaccaaaa ggatctgttg gtggaatggg cttgccagga 3060

acacctggag agaaaggtgt gcctggcatc cctggcccac aaggttcacc tggcttacct 3120

ggagacaaag gtgcaaaagg agagaaaggg caggcaggcc cacctggcat aggcatccca 3180

gggctgcgag gtgaaaaggg agatcaaggg atagcgggtt tcccaggaag ccctggagag 3240

aagggagaaa aaggaagcat tgggatccca ggaatgccag ggtccccagg ccttaaaggg 3300

tctcccggga gtgttggcta tccaggaagt cctgggctac ctggagaaaa aggtgacaaa 3360

ggcctcccag gattggatgg catccctggt gtcaaaggag aagcaggtct tcctgggact 3420

cctggcccca caggcccagc tggccagaaa ggggagccag gcagtgatgg aatcccgggg 3480

tcagcaggag agaagggtga accaggtcta ccaggaagag gattcccagg gtttccaggg 3540

gccaaaggag acaaaggttc aaagggtgag gtgggtttcc caggattagc cgggagccca 3600

ggaattcctg gatccaaagg agagcaagga ttcatgggtc ctccggggcc ccagggacag 3660

ccggggttac cgggatcccc aggccatgcc acggaggggc ccaaaggaga ccgcggacct 3720

cagggccagc ctggcctgcc aggacttccg ggacccatgg ggcctccagg gcttcctggg 3780

attgatggag ttaaaggtga caaaggaaat ccaggctggc caggagcacc cggtgtccca 3840

gggcccaagg gagaccctgg attccagggc atgcctggta ttggtggctc tccaggaatc 3900

acaggctcta agggtgatat ggggcctcca ggagttccag gatttcaagg tccaaaaggt 3960

cttcctggcc tccagggaat taaaggtgat caaggcgatc aaggcgtccc gggagctaaa 4020

ggtctcccgg gtcctcctgg ccccccaggt ccttacgaca tcatcaaagg ggagcccggg 4080

ctccctggtc ctgagggccc cccagggctg aaagggcttc agggactgcc aggcccgaaa 4140

ggccagcaag gtgttacagg attggtgggt atacctggac ctccaggtat tcctgggttt 4200

gacggtgccc ctggccagaa aggagagatg ggacctgccg ggcctactgg tccaagagga 4260

tttccaggtc caccaggccc cgatgggttg ccaggatcca tggggccccc aggcacccca 4320

tctgttgatc acggcttcct tgtgaccagg catagtcaaa caatagatga cccacagtgt 4380

ccttctggga ccaaaattct ttaccacggg tactctttgc tctacgtgca aggcaatgaa 4440

cgggcccatg gccaggactt gggcacggcc ggcagctgcc tgcgcaagtt cagcacaatg 4500

cccttcctgt tctgcaatat taacaacgtg tgcaactttg catcacgaaa tgactactcg 4560

tactggctgt ccacccctga gcccatgccc atgtcaatgg cacccatcac gggggaaaac 4620

ataagaccat ttattagtag gtgtgctgtg tgtgaggcgc ctgccatggt gatggccgtg 4680

cacagccaga ccattcagat cccaccgtgc cccagcgggt ggtcctcgct gtggatcggc 4740

tactcttttg tgatgcacac cagcgctggt gcagaaggct ctggccaagc cctggcgtcc 4800

cccggctcct gcctggagga gtttagaagt gcgccattca tcgagtgtca cggccgtggg 4860

acctgcaatt actacgcaaa cgcttacagc ttttggctcg ccaccataga gaggagcgag 4920

atgttcaaga agcctacgcc gtccaccttg aaggcagggg agctgcgcac gcacgtcagc 4980

cgctgccaag tctgtatgag aagaacataa 5010

<210> 8

<211> 5010

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 8

atgggcccta gactgtctgt gtggctgctg cttcttcctg ccgctctgct gctgcacgag 60

gaacattcta gagccgccgc taaaggcgga tgtgccggat ctggatgcgg caagtgtgat 120

tgtcacggcg tgaagggcca gaagggcgaa agaggacttc ctggactgca gggcgtgatc 180

ggatttcctg gaatgcaagg acctgaggga ccacagggac ctccaggaca aaaaggcgat 240

acaggcgaac ctggcctgcc tggcacaaag ggaacaagag gaccacctgg cgcctctggc 300

tatcctggaa atccaggact gcctggaatc ccaggacagg atggacctcc tggtcctcct 360

ggcattcctg gctgtaatgg caccaaaggc gagagaggtc cactcggacc accaggactc 420

ccaggatttg ctggaaaccc tgggccacct ggattgcctg gcatgaaggg cgatcctggc 480

gaaattctgg gacacgttcc cggcatgctg ctgaaaggcg aaaggggctt tcccggaatt 540

cctggcacac ctggtccacc aggcttgcca ggacttcaag gaccagttgg cccacctggc 600

tttacaggtc ctccaggtcc accggggcct ccagggccgc caggcgaaaa aggacaaatg 660

ggactgagct ttcagggccc caagggcgac aaaggcgatc aaggtgttag tggccctcca 720

ggtgttcctg gacaggccca ggttcaagag aaaggcgatt tcgccaccaa gggcgagaag 780

ggacagaaag gcgaaccagg ctttcaggga atgcctggcg tgggagaaaa gggcgaaccc 840

ggaaaacctg gacctagagg caaacccggc aaggatggcg ataagggcga gaaaggatct 900

cctggattcc ctggcgaacc tggatatcct ggactgatcg gtagacaggg ccctcaaggc 960

gagaagggcg aagctggacc gcctggacca ccgggaatag tgattggaac aggccctctc 1020

ggagaaaaag gcgagcgagg ataccctgga actcccggac ctaggggaga accaggacct 1080

aaaggttttc ccggactgcc aggacaacca gggcctcctg ggcttcctgt gcctggacaa 1140

gctggtgctc caggatttcc cggcgaacgt ggcgaaaagg gcgatagagg ttttcctggc 1200

acaagcctgc ctgggccttc tggaagagat ggacttcccg ggccaccagg ttctcccgga 1260

ccacctggac agcctggcta taccaatggc atcgtcgagt gtcaacccgg tccacctggc 1320

gatcaaggac ctcctggaat accaggccag cctggcttta tcggcgagat tggagagaaa 1380

gggcaaaaag gggagagctg cctgatctgc gacatcgatg gatacagagg ccctcctgga 1440

cctcaaggcc caccaggcga gataggtttt ccagggcaac ctggcgcaaa aggcgaccgt 1500

ggactccctg gtagagatgg tgttgctggc gttccaggac cacaaggcac ccctggactt 1560

attggacagc caggtgcaaa gggcgagcca ggcgagttct acttcgacct gagacttaaa 1620

ggcgacaagg gcgaccctgg ctttcctgga caacctggaa tgcccggtag agctggatca 1680

ccaggccgtg atggacatcc agggttgccc ggaccaaaag gctctccagg atctgtgggc 1740

ctcaaaggcg aaagaggccc tccaggcgga gttggatttc ctggctctag aggcgatact 1800

ggcccaccag gtccacctgg atatggacct gctggcccta ttggagataa gggccaagca 1860

ggattcccag gcggacccgg ttctccaggc cttccgggtc ctaaaggcga gcctggaaaa 1920

atcgttccac tgcctggacc tccaggcgct gaaggattgc ctggatctcc cggttttcct 1980

ggaccgcaag gcgatagagg attccccgga acacccggta gaccaggcct tcctggcgag 2040

aaaggtgctg tgggtcaacc tggaatcggc tttcctgggc ctcctggtcc aaaaggtgtt 2100

gatggactgc ccggcgatat gggcccaccg ggaacaccag gcagacccgg ctttaatgga 2160

ttgcccggaa atcccggcgt ccaaggccag aaaggcgagc ccggtgttgg ccttcctgga 2220

cttaaaggac ttccaggcct gccaggcata cctgggacac ctggcgaaaa gggatctatc 2280

ggagttcctg gcgtgccagg cgaacatggt gcaattggtc cacctgggct gcaaggcatt 2340

agaggcgaac ccgggcctcc aggactccct ggctctgttg gaagtccagg cgtccccgga 2400

attggaccac caggtgctag gggacctcct ggcggacaag gtccaccagg attgtctgga 2460

ccacctggga tcaaaggcga gaaaggcttc cccggctttc ccggccttga tatgcctgga 2520

cctaaaggcg ataagggtgc ccagggcctg cctggaatta ctggacaaag cggcttgccc 2580

gggcttcccg gacaacaggg tgctccgggt attcctgggt ttcccggatc taagggcgaa 2640

atgggcgtga tgggtacacc tgggcaacca ggatcaccgg gacctgttgg agcaccgggg 2700

ttgcccggcg aaaaaggcga ccacggattc ccaggatcaa gcggaccaag aggcgatccg 2760

ggattgaaag gcgataaggg cgacgtggga cttcctggca aaccaggctc tatggacaag 2820

gtggacatgg gctccatgaa gggacaaaag ggcgatcagg gcgaaaaggg ccagatcgga 2880

cctatcggcg aaaagggtag tagaggcgat cctggaacac ccggcgttcc cggaaaagat 2940

ggacaagcag gccaaccggg gcagccaggg ccaaaaggcg atcctggtat ttctggaaca 3000

ccaggtgcac caggactgcc cggacctaaa ggatctgttg gaggaatggg attgccaggg 3060

acacccggcg agaaaggtgt tcctggaata cctggacctc agggctctcc tggactgcca 3120

ggcgacaaag gtgctaaagg cgaaaaggga caagccggac ctcctggcat tggcatacct 3180

ggacttaggg gagagaaggg cgaccaggga attgctggtt ttcctgggag cccaggcgag 3240

aaaggcgaaa aaggctctat cggcatcccc ggcatgcccg gatctccagg tcttaaaggt 3300

tcacctggca gcgtgggcta tccgggatca cctggccttc caggcgaaaa gggcgacaaa 3360

ggactgcctg gccttgatgg catacctggc gtgaaaggcg aagcaggact tcccggtaca 3420

cctggaccta caggaccagc tggccaaaaa ggcgaaccgg gatctgatgg aattcccggc 3480

tctgctggcg aaaaaggcga gccaggcctt cctggaagag gcttcccagg atttcctggc 3540

gcaaagggcg ataagggctc taagggcgaa gtcggctttc caggacttgc cggttctcct 3600

ggcatcccag gttccaaggg cgaacaagga ttcatgggtc ctccgggtcc tcagggtcaa 3660

ccagggttgc ctggaagccc tggacatgcc acagaaggac caaaaggcga cagaggacct 3720

cagggacaac ctgggcttcc cggccttcca ggaccaatgg gtcctcctgg actccccggt 3780

attgatggcg tcaagggcga caagggaaat ccaggatggc caggtgctcc aggcgttccc 3840

ggtccaaagg gcgatcccgg gtttcaaggg atgcctggta tcggaggaag ccccggcatt 3900

actggaagca aaggcgacat gggaccacca ggcgtgcccg gttttcaggg acctaaaggg 3960

ttgccaggcc tgcagggaat caaaggcgac cagggcgatc aaggcgttcc aggtgccaag 4020

ggattgcctg ggccaccagg accgccagga ccttacgata tcattaaggg cgagcccgga 4080

ctgcctggtc ctgagggtcc tccaggattg aaaggacttc aggggctccc tggaccaaaa 4140

ggacagcagg gtgttacagg cctcgtcggt attcctggac ctccggggat acctggattt 4200

gatggtgctc ctgggcagaa aggcgaaatg ggtccagcag gaccaacagg cccaagaggt 4260

ttccccggac ctccagggcc tgatggcctg ccaggatcta tgggtccacc agggacacca 4320

tccgtggatc acggctttct ggtcaccaga cacagccaga ccatcgacga tcctcagtgt 4380

cctagcggca ccaagatcct gtatcacggc tacagcctgc tgtacgtgca gggcaatgag 4440

agagcacacg gacaggatct gggcacagcc ggcagctgtc tgcggaagtt tagcaccatg 4500

ccttttctgt tctgcaacat caacaacgtg tgcaacttcg ccagccggaa cgactacagc 4560

tactggctgt ctacccctga gcctatgcct atgagcatgg cccctatcac cggggagaac 4620

atcagaccct tcatcagcag atgtgccgtg tgcgaagccc ctgccatggt tatggctgtg 4680

cactcccaga ccattcagat ccctccatgt ccaagcggct ggtctagcct gtggatcggc 4740

tactcctttg tgatgcacac atctgccggc gcagaaggat caggacaagc ccttgctagc 4800

cccggctcct gtctggaaga attcagaagc gcccctttca tcgagtgcca cggcagaggc 4860

acctgtaact actacgccaa cgcctacagc ttttggctgg ccaccatcga gcggagcgag 4920

atgttcaaga agcccacacc ttctacactg aaggccggcg agctgagaac acacgtgtcc 4980

agatgtcaag tgtgcatgcg gcggacctga 5010

<210> 9

<211> 3087

<212> DNA

<213> 智人(Homo sapiens)

<400> 9

atgagggcgg cccgtgctct gctgcccctg ctgctgcagg cctgctggac agccgcgcag 60

gatgagccgg agaccccgag ggccgtggcc ttccaggact gccccgtgga cctgttcttt 120

gtgctggaca cctctgagag cgtggccctg aggctgaagc cctacggggc cctcgtggac 180

aaagtcaagt ccttcaccaa gcgcttcatc gacaacctga gggacaggta ctaccgctgt 240

gaccgaaacc tggtgtggaa cgcaggcgcg ctgcactaca gtgacgaggt ggagatcatc 300

caaggcctca cgcgcatgcc tggcggccgc gacgcactca aaagcagcgt ggacgcggtc 360

aagtactttg ggaagggcac ctacaccgac tgcgctatca agaaggggct ggagcagctc 420

ctcgtggggg gctcccacct gaaggagaat aagtacctga ttgtggtgac cgacgggcac 480

cccctggagg gctacaagga accctgtggg gggctggagg atgctgtgaa cgaggccaag 540

cacctgggcg tcaaagtctt ctcggtggcc atcacacccg accacctgga gccgcgtctg 600

agcatcatcg ccacggacca cacgtaccgg cgcaacttca cggcggctga ctggggccag 660

agccgcgacg cagaggaggc catcagccag accatcgaca ccatcgtgga catgatcaaa 720

aataacgtgg agcaagtgtg ctgctccttc gaatgccagc ctgcaagagg acctccgggg 780

ctccggggcg accccggctt tgagggagaa cgaggcaagc cggggctccc aggagagaag 840

ggagaagccg gagatcctgg aagacccggg gacctcggac ctgttgggta ccagggaatg 900

aagggagaaa aagggagccg tggggagaag ggctccaggg gacccaaggg ctacaaggga 960

gagaagggca agcgtggcat cgacggggtg gacggcgtga agggggagat ggggtaccca 1020

ggcctgccag gctgcaaggg ctcgcccggg tttgacggca ttcaaggacc ccctggcccc 1080

aagggagacc ccggtgcctt tggactgaaa ggagaaaagg gcgagcctgg agctgacggg 1140

gaggcgggga gaccagggag ctcgggacca tctggagacg agggccagcc gggagagcct 1200

gggccccccg gagagaaagg agaggcgggc gacgagggga acccaggacc tgacggtgcc 1260

cccggggagc ggggtggccc tggagagaga ggaccacggg ggaccccagg cacgcgggga 1320

ccaagaggag accctggtga agctggcccg cagggtgatc agggaagaga aggccccgtt 1380

ggtgtccctg gagacccggg cgaggctggc cctatcggac ctaaaggcta ccgaggcgat 1440

gagggtcccc cagggtccga gggtgccaga ggagccccag gacctgccgg accccctgga 1500

gacccggggc tgatgggtga aaggggagaa gacggccccg ctggaaatgg caccgagggc 1560

ttccccggct tccccgggta tccgggcaac aggggcgctc ccgggataaa cggcacgaag 1620

ggctaccccg gcctcaaggg ggacgaggga gaagccgggg accccggaga cgataacaac 1680

gacattgcac cccgaggagt caaaggagca aaggggtacc ggggtcccga gggcccccag 1740

ggacccccag gacaccaagg accgcctggg ccggacgaat gcgagatttt ggacatcatc 1800

atgaaaatgt gctcttgctg tgaatgcaag tgcggcccca tcgacctcct gttcgtgctg 1860

gacagctcag agagcattgg cctgcagaac ttcgagattg ccaaggactt cgtcgtcaag 1920

gtcatcgacc ggctgagccg ggacgagctg gtcaagttcg agccagggca gtcgtacgcg 1980

ggtgtggtgc agtacagcca cagccagatg caggagcacg tgagcctgcg cagccccagc 2040

atccggaacg tgcaggagct caaggaagcc atcaagagcc tgcagtggat ggcgggcggc 2100

accttcacgg gggaggccct gcagtacacg cgggaccagc tgctgccgcc cagcccgaac 2160

aaccgcatcg ccctggtcat cactgacggg cgctcagaca ctcagaggga caccacaccg 2220

ctcaacgtgc tctgcagccc cggcatccag gtggtctccg tgggcatcaa agacgtgttt 2280

gacttcatcc caggctcaga ccagctcaat gtcatttctt gccaaggcct ggcaccatcc 2340

cagggccggc ccggcctctc gctggtcaag gagaactatg cagagctgct ggaggatgcc 2400

ttcctgaaga atgtcaccgc ccagatctgc atagacaaga agtgtccaga ttacacctgc 2460

cccatcacgt tctcctcccc ggctgacatc accatcctgc tggacggctc cgccagcgtg 2520

ggcagccaca actttgacac caccaagcgc ttcgccaagc gcctggccga gcgcttcctc 2580

acagcgggca ggacggaccc cgcccacgac gtgcgggtgg cggtggtgca gtacagcggc 2640

acgggccagc agcgcccaga gcgggcgtcg ctgcagttcc tgcagaacta cacggccctg 2700

gccagtgccg tcgatgccat ggactttatc aacgacgcca ccgacgtcaa cgatgccctg 2760

ggctatgtga cccgcttcta ccgcgaggcc tcgtccggcg ctgccaagaa gaggctgctg 2820

ctcttctcag atggcaactc gcagggcgcc acgcccgctg ccatcgagaa ggccgtgcag 2880

gaagcccagc gggcaggcat cgagatcttc gtggtggtcg tgggccgcca ggtgaatgag 2940

ccccacatcc gcgtcctggt caccggcaag acggccgagt acgacgtggc ctacggcgag 3000

agccacctgt tccgtgtccc cagctaccag gccctgctcc gcggtgtctt ccaccagaca 3060

gtctccagga aggtggcgct gggctag 3087

<210> 10

<211> 3087

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 10

atgagagccg ctagagccct tctgcctctg ctgctgcaag cctgttggac agccgctcag 60

gatgagcccg aaacacctag agccgtggca ttccaggact gccccgtgga tctgttcttc 120

gtgctggata ccagcgagag cgtggccctg agactgaaac cttatggcgc cctggtggac 180

aaagtgaagt ccttcaccaa gcggttcatc gacaacctgc gcgaccggta ctacagatgc 240

gacagaaacc tcgtgtggaa cgcaggcgcc ctgcactact ctgacgaggt ggaaatcatc 300

cagggcctga ccagaatgcc tggcggaaga gatgccctga agtctagcgt ggacgccgtg 360

aagtactttg gcaagggcac ctacaccgac tgcgccatca agaaaggcct ggaacagctg 420

ctcgtcggcg gcagccatct gaaagagaac aagtacctga tcgtggttac cgacggacac 480

cctctggaag gctacaaaga accttgtggc ggactggaag atgccgtgaa cgaggccaaa 540

cacctgggcg tgaaggtgtt cagcgtggcc atcacacccg accacctgga acctcggctg 600

agcatcattg ccaccgacca cacctaccgg cggaatttca cagccgctga ttggggccag 660

agcagggatg ccgaagaggc catcagccag accatcgaca ccatcgtgga catgatcaag 720

aacaacgtgg aacaagtgtg ctgcagcttc gagtgccagc ctgctagagg acctcctgga 780

cttagaggcg accctggctt tgagggcgag agaggaaaac ctggactgcc cggcgaaaaa 840

ggcgaagctg gcgatcctgg tagacctggc gatctgggac ctgtgggcta tcagggaatg 900

aagggcgaga aaggctcccg gggagagaag ggatctagag gccctaaggg ctacaagggc 960

gaaaaaggca agaggggcat cgatggcgtg gacggcgtca aaggcgagat gggatatcct 1020

ggactccctg gctgtaaagg cagccctggc ttcgatggaa tccagggacc tccaggacct 1080

aagggcgatc caggcgcctt tggactgaaa ggcgaaaagg gcgaaccagg tgccgatggc 1140

gaagcaggca gacctggatc ttctggccct agcggagatg aaggacagcc tggcgaacct 1200

ggaccacctg gcgagaaggg cgaagccggc gacgagggaa atccaggacc agatggtgct 1260

cctggcgaaa gaggtggacc aggcgaaagg ggacctagag gaacaccagg cacaagaggc 1320

ccaagaggcg atcccggcga ggctggacct caaggcgatc agggaagaga aggaccagtg 1380

ggagttcctg gcgacccagg cgaagcagga cctatcggcc ctaagggata tagaggcgac 1440

gaaggccctc ctggatctga aggtgctaga ggcgcaccag gtccagcagg ccctccaggc 1500

gaccccggac ttatgggaga acgcggagaa gatggccctg ccggcaatgg cacagagggc 1560

tttccaggct ttcctggcta ccccggaaat agaggcgctc ctggaatcaa cggcaccaag 1620

ggatatccag ggctcaaagg cgacgaaggc gaggcaggcg atccagggga tgacaacaac 1680

gatatcgccc ctagaggcgt gaaaggcgcc aaaggctata gaggaccaga gggaccacaa 1740

ggcccacctg gtcatcaagg gccaccagga cctgacgagt gcgagatcct ggacatcatt 1800

atgaagatgt gcagctgctg cgagtgcaag tgcggcccta tcgatctgct gtttgtgctg 1860

gacagctccg agagcatcgg cctgcagaat ttcgagatcg ccaaggactt cgtggtcaaa 1920

gtgatcgaca gactgagccg ggacgagctg gtcaagtttg agcctggcca gtcttatgcc 1980

ggcgtggtgc agtacagcca cagccagatg caagagcacg tgtccctgag aagccccagc 2040

atcagaaacg tgcaagagct gaaagaagcc atcaagtccc tgcagtggat ggctggcgga 2100

acctttactg gcgaggccct gcagtacacc agagatcaac tgctgcctcc ttctcctaac 2160

aaccggattg ccctcgtgat caccgacggc agaagcgaca cccagagaga caccacacct 2220

ctgaacgtgc tgtgcagccc cggcattcag gtggtgtctg tgggcatcaa ggacgtgttc 2280

gacttcatcc ccggcagcga ccagctgaac gtgatctctt gtcaaggact ggcccctagc 2340

caaggcagac caggactgtc tctggtcaaa gagaactacg ccgagctgct cgaggacgcc 2400

ttcctgaaga atgtgacagc ccagatctgc atcgacaaga agtgccccga ctacacatgc 2460

cccatcacct ttagcagccc tgccgacatc accatcctgc tggatggctc tgctagcgtg 2520

ggcagccaca acttcgacac caccaagaga ttcgccaagc ggctggccga gagatttctg 2580

acagccggca gaaccgatcc tgctcacgat gtgcgagtgg ccgtggtcca gtattctggc 2640

acaggccagc aaagacccga gagagcctct ctgcagttcc tgcagaacta cactgccctg 2700

gcctctgccg tggatgccat ggactttatc aacgacgcca ccgacgtgaa cgacgccctg 2760

ggctatgtga cccggtttta cagagaagcc tctagcggag ccgccaagaa gagactgctg 2820

ctgttcagcg acggcaactc ccaaggtgct acaccagccg ccattgagaa ggccgtgcaa 2880

gaagctcaga gagccggcat cgagatcttc gtggtggtcg tgggcagaca agtgaacgag 2940

cctcacatca gagtgctggt caccggcaag accgccgagt acgatgtggc ttatggcgag 3000

agccacctgt tcagagtgcc cagctatcag gctctgctga gaggcgtgtt ccaccagacc 3060

gtgtctagaa aggtggccct gggatga 3087

<210> 11

<211> 8835

<212> DNA

<213> 智人(Homo sapiens)

<400> 11

atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60

gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120

ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180

ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240

acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300

ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360

gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420

cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480

caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540

gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600

ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660

ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720

tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780

ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840

caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900

accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960

gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020

cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080

cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140

ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200

cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260

ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320

gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380

gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440

cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500

cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560

gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620

gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680

gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740

ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800

gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860

gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920

cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980

taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040

gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100

tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160

tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220

gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280

gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340

aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400

ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460

atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520

tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580

actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640

cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700

caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760

ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820

ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880

gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940

agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000

gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060

ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120

tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180

gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240

ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300

cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360

atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420

gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480

atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540

caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600

cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660

agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720

cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780

gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840

ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900

cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960

gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020

ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080

cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140

ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200

gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260

ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320

cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380

cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440

gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500

ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560

gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620

gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680

cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740

cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800

ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860

cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920

gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980

ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040

gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100

cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160

cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220

gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280

ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340

agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400

aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460

ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520

aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580

gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640

ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700

ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760

aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820

aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880

gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940

aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000

gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060

cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120

attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180

ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240

cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300

cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360

agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420

ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480

gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540

ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600

ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660

ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720

caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780

cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840

ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900

gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960

gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020

aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080

gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140

cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200

ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260

agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320

ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380

ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440

ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500

aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560

gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620

cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680

gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740

ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800

ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860

ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920

ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980

atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040

cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100

ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160

gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220

cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280

gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340

ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400

cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460

gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520

gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580

gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640

gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700

acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760

acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820

actgcccagg actga 8835

<210> 12

<211> 8835

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 12

atgaccctga gactgctggt ggctgccctg tgtgctggaa ttctggctga ggctcctaga 60

gtgcgggccc agcatagaga aagagtgacc tgtacacggc tgtacgccgc cgatatcgtg 120

tttctgctgg atggcagcag cagcatcggc cggtccaatt tcagagaagt gcggagcttt 180

ctggaaggcc tggtgctgcc tttttctggc gctgcttctg cccagggcgt cagatttgcc 240

accgtgcagt acagcgacga ccctagaaca gagtttggcc tggatgctct cggcagcggc 300

ggagatgtga tcagagccat cagagagctg agctacaaag gcggcaatac cagaacaggc 360

gccgctattc tgcacgtggc cgaccatgtt tttctgcccc aactggctag acccggcgtg 420

ccaaaagtgt gcatcctgat cacagacggc aagagccagg acctggtgga tacagccgct 480

cagagactga aaggacaggg cgtgaaactg ttcgccgtgg gcatcaagaa cgccgatcct 540

gaggaactga agagagtggc cagccagcct accagcgatt tcttcttctt cgtgaacgac 600

ttcagcatcc tgcggaccct gctgcctctg gtgtctagaa gagtgtgtac aacagccggc 660

ggagtgcctg tgaccagacc tcctgatgat agcacaagcg cccctagaga tctggtgctg 720

tctgagccaa gcagccagag tctgagagtg cagtggacag ctgctagcgg ccctgtgaca 780

ggctacaagg tgcagtatac acctctgaca ggcctgggcc agcctctgcc ttctgagaga 840

caagaagtga acgtcccagc cggcgaaaca tctgtcagac tgagaggact gaggcccctg 900

accgagtacc aagtgacagt gatcgccctg tacgccaatt ctatcggcga ggccgtgtct 960

ggcacagcca gaacaacagc tctggaagga ccagagctga ccatccagaa cacaacagcc 1020

cattctctgc tggttgcttg gagatctgtg cctggcgcca ccggctatag agtgacttgg 1080

agagttctga gcggaggccc cacacagcag caagaacttg gacctggaca gggctccgtg 1140

ctgctgagag atctcgagcc tggcaccgat tacgaagtga ccgtgtctac cctgttcggc 1200

agatctgtgg gacctgccac aagcctgatg gccagaacag atgccagcgt ggaacagacc 1260

ctgaggcctg tgattctggg ccctacatct atcctgctga gctggaatct ggtgcccgag 1320

gccagaggct atagactgga atggcggaga gaaaccggcc tggaacctcc tcagaaagtg 1380

gtcctgccta gcgacgtgac aagataccag ctggatggac tgcagcccgg caccgagtac 1440

agactgacac tgtatacact gctcgagggc cacgaagtgg ccacaccagc tacagttgtg 1500

ccaacaggac ctgagctgcc tgtgtctcct gtgactgatc tgcaggccac agaactgcct 1560

ggccagagag tcagagttag ctggtcacct gttccaggcg ccacacagta cagaatcatc 1620

gtgcggtcta cacagggcgt cgagagaaca ctggttctgc ctggaagcca gaccgccttc 1680

gatctggatg atgtgcaggc cggactgtcc tacacagtca gagtgtctgc cagagtgggc 1740

cctagagaag gatctgcctc tgtgctgacc gtgcggagag agcctgaaac accactggca 1800

gtgcctggac tgagagtggt ggtgtcagat gccaccagag ttagagtggc ttggggacca 1860

gttcctggcg cctctggctt tagaatcagc tggtctacag gctctggccc cgaaagctct 1920

cagacactgc ctccagatag caccgccacc gatattacag gcctgcagcc tggaactacc 1980

taccaggtgg ccgttagcgt gctgagagga agagaagaag gccctgccgc cgtcatcgtg 2040

gctagaactg atcctctggg acctgtgcgg acagtgcacg tgacacaagc ctctagcagc 2100

agcgtgacca tcacctggac aagagtgcca ggcgctacag gatacagagt gtcctggcat 2160

tctgctcacg gccctgagaa gtctcagctg gtgtctggcg aagccacagt ggctgaactc 2220

gacggactgg aacctgacac agagtatact gtgcacgtgc gggctcatgt ggctggtgtt 2280

gatggacctc ctgcttctgt ggtcgtcaga acagcccctg aacctgtggg aagagtgtcc 2340

agactgcaga tcctgaatgc cagcagcgac gtgctgagga tcacatgggt tggagtgacc 2400

ggcgccacag cttatagact cgcctggggt agaagcgaag gcggccctat gagacatcag 2460

atcctgcctg gcaataccga ctccgccgag attagaggcc ttgaaggcgg agtgtcttac 2520

agcgttagag tgacagccct cgtgggcgat agagaaggca cacctgtgtc catcgtggtc 2580

accacacctc cagaagctcc tccagctctg ggaacactgc atgtggtgca gagaggcgag 2640

cactctctga gactgagatg ggaacctgtg ccacgcgctc agggatttct gctgcattgg 2700

caaccagaag gcggacaaga gcagagcaga gtgctgggac cagaactgag cagctaccac 2760

ctcgatggac ttgagcctgc cactcagtat agagtcagac tgtcagtgct ggggcctgcc 2820

ggcgaaggac cttctgctga agtgacagct agaaccgagt ctcccagagt gcccagcatc 2880

gagctgagag tcgtggatac ctccatcgat agcgtgacac tggcctggac acccgtgtct 2940

agagccagct cttacatcct gtcttggcgg cctctcagag gaccaggcca agaagttcct 3000

ggatctccac agacactccc aggcatcagt agctcccaga gagtgactgg acttgaacca 3060

ggcgtgtcct acatcttcag cctgacacct gtgctggacg gcgttagagg acctgaagcc 3120

tctgtgaccc agactccagt gtgtcctaga ggactggccg atgtggtgtt cctgcctcac 3180

gctacacagg acaatgccca tagagccgag gccacaagac gcgtgctgga aagactggtt 3240

cttgcccttg gaccactggg acctcaggct gttcaagtgg gcctgctgtc ctactctcac 3300

agaccctctc cactgttccc tctgaacggc tctcacgacc tgggcatcat cctgcagaga 3360

atccgggaca tgccctacat ggacccctct ggcaacaatc tgggcacagc cgttgtgact 3420

gcccacagat atatgctggc cccagatgct cctggcagac gacaacatgt ccctggcgtt 3480

atggtgctgc tggtcgatga acccctgcgg ggcgatatct ttagccctat tagagaagcc 3540

caggccagcg gcctgaatgt ggttatgctt ggaatggctg gcgccgatcc agagcagctt 3600

agaaggcttg cccctggcat ggatagcgtg cagaccttct ttgccgtgga cgatggacct 3660

tctctggatc aggctgtgtc tggactggct acagcactgt gccaggcaag cttcaccaca 3720

cagcctagac ctgagccttg tccagtgtac tgccctaagg gacagaaggg cgaacctggc 3780

gaaatgggac ttagaggcca agtgggacca cctggcgatc ctggacttcc tggaagaact 3840

ggtgctcctg gacctcaagg tcctcctgga agtgccacag ccaagggcga aagaggattc 3900

cctggcgctg atggcagacc aggatctcct ggtagagccg gcaatcctgg aacacctggc 3960

gcaccaggac tcaaaggatc tccaggactg cctggaccta gaggcgatcc aggcgagaga 4020

ggaccaagag gtccaaaagg cgaacccggt gctccaggac aagtgattgg cggagaagga 4080

cccggattgc ccggaagaaa aggcgaccct ggaccaagtg gacctccagg acctagggga 4140

cctttgggag atcccggtcc aagaggccct cctggattgc ctggtacagc catgaagggc 4200

gacaaaggcg ataggggaga aagaggacca ccaggaccag gcgaaggtgg aattgctcct 4260

ggcgaaccag ggttgcctgg actccctggc tcacctggac cacaaggacc tgttggccca 4320

cctggaaaga aaggcgaaaa gggcgattct gaggatggcg ccccagggct tcctggacaa 4380

ccaggctctc caggcgaaca aggacccaga gggcctccag gtgctattgg ccctaaaggc 4440

gacagagggt ttcccggacc acttggagaa gctggcgaaa aaggcgaacg aggacctcct 4500

ggacctgccg gatctagagg acttccaggt gttgctggca gacctggcgc taaaggtcct 4560

gaaggcccac cagggcctac aggcagacaa ggcgagaaag gcgagccagg cagacccggc 4620

gatcctgctg ttgttggacc agctgttgca ggcccaaagg gcgagaaggg cgacgttgga 4680

cctgctggac caaggggagc tacaggcgtt caaggcgaaa ggggtccacc tggacttgtt 4740

ttgccgggcg atcccggacc taagggcgac cccggcgaca ggggaccaat tggattgaca 4800

ggcagagctg ggccaccagg cgatagtggg cctccaggcg aaaaaggcga tcctggtaga 4860

cctggacctc ctgggccagt tggaccaaga ggaagagatg gcgaagtcgg agagaaaggc 4920

gacgaaggtc ctccaggcga cccaggactc cctggaaaag caggcgaaag aggtcttaga 4980

ggcgctcctg gtgttagagg ccctgttgga gaaaagggcg accaaggcga ccctggcgag 5040

gatggaagaa atggctcccc tggatctagc ggcccaaaag gcgatcgcgg cgagcccggt 5100

ccaccgggtc caccaggcag gcttgttgat actggacccg gcgctcgtga aaaaggcgag 5160

cccggcgatc gtggacaaga aggcccaaga ggacccaagg gcgatccggg actgccaggt 5220

gcaccaggcg agcgaggtat tgaaggattc agaggccctc caggaccaca aggcgatccc 5280

ggtgtcagag gacctgctgg cgagaagggc gatagaggtc ctccaggact ggatggcaga 5340

tccggacttg atggaaaacc cggcgcagct ggcccttctg gacctaatgg tgcagccgga 5400

aaagctggcg acccaggcag agatggattg ccaggattga ggggagaaca gggactcccc 5460

ggaccttctg ggccgcctgg gttgcccgga aagcctggcg aagatggcaa acctggcctg 5520

aacggcaaaa acggcgaacc gggcgatcca ggcgaagatg gcagaaaggg cgaaaaaggc 5580

gacagcggag cctctggccg agagggtaga gatggaccta aaggcgagag gggcgctcct 5640

ggaattttgg gaccccaagg accgcctggg ctgccaggtc cagttgggcc tcctggtcaa 5700

ggttttcctg gtgtcccagg cggaactgga ccaaaaggcg atagaggcga aacaggctct 5760

aagggcgagc aaggacttcc tggcgaacgt ggactgagag gcgaacctgg aagcgtgccc 5820

aatgtggaca gactcctgga aaccgccgga atcaaagcca gcgctctgcg ggaaatcgtg 5880

gaaacctggg atgagagcag cggctctttt ctgcctgtgc ctgaaagaag aaggggaccg 5940

aaaggcgatt ctggcgaaca aggtccacct ggcaaagagg gccctatcgg atttcccggc 6000

gagcggggtc ttaaaggcga ccggggagat ccgggacctc aagggccacc aggacttgct 6060

cttggagaaa gaggtcctcc ggggccatct ggacttgctg gcgagcctgg aaaacctgga 6120

ataccaggac ttcccggcag agcaggcgga gttggagagg ccggacgacc tggcgaacgc 6180

ggagaaaggg gagagaaggg cgagcgaggc gaacagggac gagatggacc accggggctc 6240

cctggaactc ctggaccgcc aggaccacct ggtcctaaag tgtcagtgga tgagcctgga 6300

ccaggtctta gcggagaaca aggacctcca ggcctgaaag gcgctaaggg cgaaccaggt 6360

tcaaatggcg atcagggacc caaaggcgat cggggcgttc caggcattaa gggcgaccgt 6420

ggcgaaccag gacctagagg acaagatggc aatcccggac tgcctggcga aagaggaatg 6480

gccggacctg agggaaagcc agggctgcaa gggcctcgcg ggccacctgg gcctgtcgga 6540

ggacatggcg accccggacc accaggtgct cccggacttg ctggaccagc aggacctcaa 6600

ggaccatctg gacttaaagg cgaaccaggc gaaacagggc caccaggcag aggacttaca 6660

ggacctacag gtgctgttgg gttgcctggt ccaccagggc caagtggact tgttggtcct 6720

caaggttcac ctggactgcc cggacaagtg ggagaaactg gcaaaccagg cgcacctggg 6780

cgagatggcg catctggaaa agacggcgat cgaggtagcc ctggtgttcc cggttctcct 6840

gggctcccag gacctgtggg ccccaagggc gaacccggac caactggcgc acctggtcaa 6900

gcagttgttg gattgcctgg cgcaaagggc gagaaaggtg ctccaggcgg attggctggc 6960

gatcttgttg gagaaccagg tgccaaaggc gacaggggct tgccaggtcc taggggagag 7020

aaaggcgaag ctggtagagc aggcgagcct ggcgatcccg gcgaggacgg acaaaaaggt 7080

gcccctgggc ctaaaggctt taagggcgat cctggtgtcg gcgtcccagg ttctcctgga 7140

ccacctgggc cgccaggcgt taagggcgat ttgggacttc ctgggctgcc tggcgctcct 7200

ggcgttgtgg gatttccagg acaaactggc cctcggggag aaatgggtca acctgggcct 7260

agcggagaaa gaggccttgc cggacctcct ggaagagagg gaatacctgg accacttgga 7320

ccgcctggac ctccaggttc tgttggacct cctggcgctt caggattgaa gggcgataag 7380

ggcgaccctg gtgttggact tcccggtcct cgtggcgaaa ggggagaacc aggcattaga 7440

ggcgaagatg gacggcctgg acaagaggga cctagaggtc ttacaggccc accaggctct 7500

agaggcgaaa ggggcgagaa aggcgacgtg ggttctgcag gacttaaggg cgacaagggc 7560

gattccgctg tgattttggg accaccggga ccaagaggcg ctaaaggcga tatgggcgag 7620

agaggcccta gaggcctgga tggcgataag gggccaagag gcgacaacgg cgacccaggc 7680

gataagggat ctaaaggcga acccggcgat aagggctctg ctggactgcc aggacttcga 7740

ggacttctgg gtccacaagg ccaacctggc gccgcaggca ttcccggcga tccgggttct 7800

cctggcaaag atggtgttcc tggcatcagg ggcgaaaagg gcgacgtcgg ttttatgggc 7860

cctcgcggat tgaaaggcga gagaggtgtt aagggcgcct gtggacttga cggcgaaaaa 7920

ggcgataagg gcgaagctgg acctcctggc agacctggat tggctggaca caagggcgag 7980

atgggagagc ccggtgttcc tggacaaagt ggcgcccctg gaaaagaagg actgatcggt 8040

ccaaagggcg accgcggatt tgatggccaa ccgggtccta aaggcgatca gggcgagaaa 8100

ggcgaaagag gcactcctgg catcggaggc tttccaggac caagcggcaa tgatggatct 8160

gctggcccgc cagggcctcc tggatctgtt ggtccaagag gaccagaagg cctgcaggga 8220

caaaaaggcg agcgcggacc accaggcgaa agagttgttg gagcacccgg cgttcccggt 8280

gctcccggcg aaagaggcga acaaggcaga cctggaccag ctggccctag aggcgaaaaa 8340

ggggaagccg ctctgaccga ggacgatatc agaggctttg tgcggcaaga gatgagccag 8400

cattgtgcct gtcaggggca gtttatcgcc agcggttcta gacctctgcc tagctatgcc 8460

gctgataccg ccggatctca gctgcatgct gtgcctgtgc ttagagtgtc tcacgccgag 8520

gaagaggaaa gagtccctcc agaggacgac gagtactccg agtatagcga gtactctgtg 8580

gaagagtatc aggaccccga ggctccttgg gatagcgacg atccatgttc tctgccactg 8640

gatgagggca gctgtaccgc ctacacactg aggtggtatc acagagccgt gaccggaagc 8700

accgaggcct gccatccttt tgtttatggc ggctgcggcg gcaacgccaa tagatttgga 8760

acaagagagg cctgcgagcg gagatgccct ccaagagtgg ttcagtctca aggcaccggc 8820

actgcccagg actaa 8835

<210> 13

<211> 4494

<212> DNA

<213> 智人(Homo sapiens)

<400> 13

atggatgtaa ccaagaaaaa caaacgagat ggaactgaag tcactgagag aattgtcact 60

gaaacagtaa ccacaagact tacatcctta ccaccaaaag gcgggaccag caatggctat 120

gctaaaacag cctctcttgg tggagggagc cggctggaga aacaaagcct gactcatggc 180

agcagcggct acataaactc aactggaagc acacgaggcc atgcctccac ctctagttac 240

aggagggctc actcacctgc ctccactctg cccaactccc caggctcaac ctttgaaagg 300

aaaactcacg ttacccgcca tgcgtatgaa gggagctcca gtggcaactc ttctccggag 360

taccctcgga aggaatttgc atcttcttca accagaggac ggagtcaaac acgagagagt 420

gaaattcgag ttcgactgca gagtgcgtcc ccatccaccc gatggacaga attggatgat 480

gttaagcgtt tgctcaaggg gagtcgatcg gcaagtgtga gccccacccg gaattcctcc 540

aacacactcc ccatccccaa gaaaggcact gtggagacca aaattgtgac agcgagctcc 600

cagtcggtgt caggcaccta cgatgcaacg atcctggatg ccaaccttcc ctcccatgtg 660

tggtcctcca ccctgcccgc ggggtcctcc atggggacct atcacaacaa catgacaacc 720

cagagctcat ccctcctcaa caccaatgcc tactctgcgg gatcagtctt cggagttcca 780

aacaacatgg cgtcctgctc acccactttg caccctggac tcagcacatc ctcctcagtg 840

tttggcatgc agaacaatct ggcccccagc ttgaccaccc tgtcccatgg caccaccacc 900

acttccacag catatggggt gaagaaaaac atgccccaga gtcctgcggc tgtgaacact 960

ggcgtttcca cctccgccgc ctgcaccaca agtgtgcaga gcgatgacct tttgcacaag 1020

gactgcaagt tcctgatcct agagaaagac aacacacctg ccaagaagga gatggagctg 1080

ctcatcatga ccaaggacag cgggaaggtc tttacagcct cccctgccag catcgctgca 1140

acttcttttt cagaagacac cctaaaaaaa gaaaagcaag ctgcctacaa tgctgactca 1200

ggcctaaaag ccgaagctaa tggagacctg aagactgtgt ccacaaaggg caagaccacc 1260

actgcagata tccacagcta cggcagcagt ggtggtggtg gcagtggagg aggtggcggt 1320

gttggtggcg ctggcggcgg cccttgggga ccagcgccag cctggtgccc ctgcggctcc 1380

tgctgcagct ggtggaagtg gctgctgggc ctgctgctca cctggctgct actcctgggg 1440

ctgctcttcg gcctcattgc tctggcggag gaggtgagga agctgaaggc gcgtgtggat 1500

gagctggaga ggatcaggag gagcatactg ccctatgggg acagcatgga tagaatagaa 1560

aaggaccgcc tccagggcat ggcacccgcg gcgggagcag acctggacaa aattgggctg 1620

cacagtgaca gccaggagga gctctggatg ttcgtgagga agaagctaat gatggaacag 1680

gaaaatggaa atctccgagg aagccctggc cctaaaggtg acatgggaag tccaggccct 1740

aaaggagatc gagggttccc tgggactcca ggtatccctg ggcccttggg ccacccaggt 1800

ccacaaggac caaagggtca aaaaggcagc gtgggagatc ctggcatgga aggccccatg 1860

ggccagagag ggcgagaagg ccccatggga cctcgtggtg aggcagggcc tcctggatct 1920

ggagagaaag gggaaagagg ggctgctggt gaaccaggtc ctcatggccc acctggtgtc 1980

ccaggttctg tgggtcccaa aggttccagc ggctctcctg gcccacaggg ccctccaggt 2040

cctgtaggtc tccaagggct ccgaggtgaa gtaggacttc ctggtgtcaa aggtgacaaa 2100

ggaccaatgg gaccaccagg acccaaaggt gaccagggtg agaaaggacc tcgaggcctc 2160

acaggcgagc ctggcatgag aggtttgcct ggtgctgttg gtgagcccgg ggctaaagga 2220

gcaatgggtc ctgctggccc agacggacac caaggcccaa gaggtgaaca aggtcttact 2280

gggatgcctg gaatccgtgg cccaccagga ccttctggag acccaggaaa gccaggtctc 2340

acaggacccc agggacctca gggacttccc ggtacccctg gccgaccagg aataaaaggt 2400

gaaccaggag ctccaggcaa gatcgtgact tcggaggggt catcgatgct cactgtccca 2460

ggccccccag gacctcctgg agccatggga cccccaggac ctccaggtgc cccaggccct 2520

gccggcccag ctggtctccc aggacatcaa gaagttctta atttacaagg tcccccaggc 2580

ccacccggcc cacgcgggcc accagggcct tccattccag gcccaccagg accccgaggc 2640

ccaccagggg agggtttgcc aggcccacca ggcccaccag gatcgttcct gtccaactca 2700

gaaaccttcc tctccggccc cccaggccca cctggccccc caggtcccaa gggagaccaa 2760

ggtcccccag gccccagagg acaccaaggc gagcaaggcc tcccaggttt ctcaacctca 2820

gggtccagtt ctttcggact caaccttcag ggaccaccag gcccacctgg cccccaggga 2880

cccaaaggtg acaaaggtga tccaggtgtt ccaggggctc ttggcattcc tagtggtcct 2940

tctgaagggg gatcatcaag taccatgtac gtgtcaggcc cgccagggcc ccctgggccc 3000

cctgggcctc cgggctctat cagcagctct ggccaggaga ttcagcagta catctctgag 3060

tacatgcaga gtgacagtat tagatcttac ctatccggag ttcagggtcc cccaggccca 3120

cctggtcccc caggacctgt caccaccatc acaggcgaga ctttcgacta ctcagagctg 3180

gcaagccacg ttgtgagcta cttacggact tcggggtacg gtgtcagctt gttctcgtcc 3240

tccatctctt ctgaagacat tctggctgtg ctgcagcggg atgacgtgcg tcagtaccta 3300

cgtcagtact tgatgggccc tcggggtccg ccagggccac caggagccag tggagatggg 3360

tccctcctgt ctttggacta tgcagagctg agtagtcgca ttctcagcta catgtcgagt 3420

tctgggatca gcattgggct tcctggtccc ccggggcccc ctggcttgcc gggaacctcc 3480

tatgaggagc tcctctcctt gctgcgaggg tctgaattca gaggcatcgt tggaccccca 3540

ggtcccccgg gtccaccagg gatcccaggc aatgtgtggt ccagcatcag cgtggaggac 3600

ctctcgtctt acttacatac tgccggcttg tcattcatcc caggccctcc aggacctcct 3660

ggtcccccag ggcctcgagg gcccccgggt gtctcaggag ccctggcaac ctatgcagct 3720

gaaaacagcg acagcttccg gagcgagctg atcagctacc tcacaagtcc tgatgtgcgc 3780

agcttcattg ttggcccccc aggccctcct gggccgcagg gaccccctgg ggacagccgc 3840

ctcctgtcca cggatgcctc ccacagtcgg ggtagcagct cctcctcaca cagctcatct 3900

gtcaggcggg gcagctccta cagctcttcc atgagcacag gaggaggtgg tgcaggctcc 3960

ctgggtgcag gcggtgcctt tggtgaagct gcaggagaca ggggtcccta tggcactgac 4020

atcggcccag gcggaggcta tggggcagca gcagaaggcg gcatgtatgc tggcaatggc 4080

ggactattgg gagctgactt tgctggagat ctggattaca atgagctggc tgtgagggtg 4140

tcagagagca tgcagcgtca gggcctactg caagggatgg cctacactgt ccagggccca 4200

ccaggccagc ctgggccaca ggggccaccc ggcatcagca aggtcttctc tgcctacagc 4260

aacgtgactg cggacctcat ggacttcttc caaacttatg gagccattca aggaccccct 4320

gggcaaaaag gagagatggg cactccagga cccaaaggtg acaggggccc tgctgggcca 4380

ccaggtcatc ctgggccacc tggccctcga ggacacaagg gagaaaaagg agacaaaggt 4440

gaccaagtct atgctgggcg gagaaggaga agaagtattg ctgtcaagcc gtga 4494

<210> 14

<211> 4494

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 14

atggacgtga ccaagaagaa caagcgcgac ggcaccgaag tgaccgagag aatcgtgacc 60

gaaaccgtga ccaccagact gaccagcctg cctcctaaag gcggcacctc taatggctac 120

gccaagacag cttctctcgg cggaggcagc agactggaaa agcagtctct gacacacggc 180

agcagcggct acatcaatag caccggctct acaagaggcc acgccagcac aagcagctac 240

agaagggctc acagccctgc cagcacactg cctaatagcc caggcagcac cttcgagaga 300

aagacccacg tgaccagaca cgcctacgag ggctctagca gcggcaatag cagccctgag 360

taccccagaa aagagttcgc cagcagcagc accagaggca gaagccagac acgggaaagc 420

gagatcagag tgcggctgca gtctgctagc cctagcacca gatggaccga gctggacgac 480

gtgaagaggc tgctgaaggg aagcagatcc gccagcgtgt cccctaccag aaacagcagc 540

aacaccctgc ctattcctaa gaaaggcacc gtcgagacta agatcgtgac agccagcagc 600

cagagcgtgt ccggcacata cgatgccaca atcctggacg ccaacctgcc tagccatgtg 660

tggtcctcta cactgcctgc cggaagcagc atgggcacct accacaacaa catgaccaca 720

cagagcagca gcctgctgaa caccaatgcc tactctgccg gctccgtgtt cggcgtgcca 780

aacaatatgg ccagctgcag ccctacactg caccctggcc tgagcacaag ctcctccgtg 840

tttggaatgc agaacaatct ggcccctagc ctgacaaccc tgagccacgg aacaaccacc 900

accagcacag cctacggcgt gaagaaaaac atgcctcagt ctccagccgc cgtgaacaca 960

ggcgttagca catctgccgc ctgtaccaca agcgtgcaga gcgacgatct gctgcacaag 1020

gactgcaagt ttctgatcct ggaaaaggac aacacgcccg ccaagaaaga gatggaactg 1080

ctgatcatga ccaaggacag cggcaaggtg ttcaccgcct ctccagcctc tatcgccgcc 1140

acaagcttta gcgaggacac cctgaagaaa gaaaagcagg ccgcctacaa cgccgactct 1200

ggactgaaag ccgaggccaa cggcgacctg aaaaccgtgt ctaccaaggg caagaccacc 1260

accgccgaca tccacagcta tggatctagc ggaggcggag gatctggtgg tggcggcgga 1320

gttggaggtg ctggcggagg accttgggga cctgctcctg cttggtgtcc ttgtggctcc 1380

tgttgcagct ggtggaagtg gctgcttggc ctgctgctga cttggctgct tcttctgggc 1440

ctgctgtttg gcctgattgc cctggctgag gaagtgcgga agctgaaggc cagagtggat 1500

gagctggaac ggatcaggcg gagcatcctg ccttacggcg acagcatgga ccggatcgag 1560

aaggacagac tgcaaggcat ggctccagca gctggcgccg atctggataa gatcggactg 1620

cacagcgaca gccaagagga actctggatg ttcgtgcgga agaaactgat gatggaacaa 1680

gagaacggca acctgagagg cagccctgga cctaagggcg atatgggaag cccaggacca 1740

aaaggcgaca gaggctttcc tggcacacct ggcattccag gacctctggg acatcctggt 1800

cctcagggcc ctaaaggcca gaaaggctct gtgggagatc ccggcatgga aggccctatg 1860

ggacagagag gtagagaagg accaatgggc cctagaggcg aagctggacc tcctggatct 1920

ggcgagaaag gcgaaagggg agctgcaggc gaaccaggac cacatggacc tccaggtgtt 1980

cccggatctg tgggccctaa gggatcttct ggttcccctg gaccacaagg cccacctgga 2040

cctgttggac tccaaggact gaggggcgaa gttggactgc caggcgtcaa gggcgacaag 2100

ggtccaatgg gaccacctgg tccaaagggc gatcagggcg aaaagggacc tagaggactg 2160

acaggcgagc ccggaatgag aggacttcct ggtgctgttg gagagcctgg cgctaaaggt 2220

gctatgggac ctgcaggccc cgacggacat caaggaccta ggggagaaca gggcctgacc 2280

ggcatgcctg gaattagagg tcctcctgga ccttccggcg atcctggcaa accaggattg 2340

actggacctc agggaccaca gggactgcct ggaacaccag gcagacctgg aatcaaaggc 2400

gaacctggcg ctcccggcaa gattgtgaca tctgagggca gctccatgct gaccgtgcct 2460

ggtccacctg ggcctccagg cgccatgggt cctccgggtc caccaggtgc tccaggacca 2520

gccggaccag caggacttcc aggccatcaa gaagtgctga acctgcaggg gcctcctggg 2580

ccgcctggac caagagggcc accagggcca tctattccag gaccaccagg tcctagaggc 2640

cctccaggcg aaggattgcc aggtcctcca gggccacctg gcagctttct gagcaacagc 2700

gagacattcc tgagcggccc tccaggacct cctggaccac caggacctaa aggcgatcaa 2760

ggacctccag gaccgagagg acatcagggc gaacaaggac tgcctggctt tagcacaagc 2820

ggcagctcta gcttcggcct caatctgcag ggtccaccag ggccaccagg acctcaaggt 2880

cctaaaggcg ataagggcga tccaggcgtt ccaggcgctc tgggtattcc ttctggacca 2940

tctgaaggcg gctcctccag cactatgtac gtgtcaggtc caccgggtcc acctggaccg 3000

ccaggaccac ctggatctat ctctagctcc ggccaagaga tccagcagta catcagcgag 3060

tacatgcagt ctgacagcat ccggtcctac ctgtctggcg ttcaaggtcc accgggacct 3120

ccggggcctc ctggacctgt tacaacaatc accggcgaga ctttcgacta cagcgagctg 3180

gcctctcacg tggtgtccta tctgagaacc agcggctatg gcgtgtccct gttcagctcc 3240

agcatcagct ccgaggacat tctggcagtg ctgcagaggg atgacgtgcg gcagtacctg 3300

agacagtatc tgatggggcc cagagggcca cctggtccac caggcgctag cggagatgga 3360

tctctgctga gcctggatta cgccgagctg agcagcagaa tcctgagcta catgagcagc 3420

tccggcatct ccattgggtt gcctggacct ccaggtccac caggattgcc tggcacaagc 3480

tacgaggaac tgctgtccct gctgaggggc agcgagttta gaggaatcgt tggaccacct 3540

gggccaccag gtccacctgg tatccctgga aatgtgtggt ctagcatcag cgtggaagat 3600

ctgagcagct acctgcacac agccggcctg agctttattc caggacctcc agggccgcca 3660

gggcctcctg gtcctcgggg accgcctggc gttagcggag cacttgcaac atatgccgcc 3720

gagaacagcg actccttcag aagcgagctg atctcctacc tgactagccc cgatgtgcgg 3780

agctttatcg ttggcccgcc tggtcctcca ggacctcaag gacctcctgg cgattctaga 3840

ctgctgagca cagatgccag ccacagcaga ggcagctcct ctagctctca ctccagttct 3900

gtgcggagag gctccagcta cagcagctct atgtcaacag gtggcggagg cgctggaagt 3960

cttggagctg gtggcgcttt tggagaagcc gctggcgatc gtggcccata cggaacagat 4020

attggacccg gcggtggata tggcgctgcc gctgaaggcg ggatgtatgc cggaaatggt 4080

ggactgctgg gcgccgattt tgctggcgac ctggactata atgagctggc cgtcagagtg 4140

tccgagagca tgcaaagaca ggggctgctt caaggcatgg cctacacagt tcaaggccca 4200

ccaggacagc ctggtccaca gggaccaccg ggaatcagca aagtgttctc tgcctacagc 4260

aacgtgaccg ccgacctgat ggacttcttc cagacctacg gcgccattca gggacctcca 4320

ggccaaaagg gcgaaatggg tacacctggg ccgaaaggcg accgaggacc tgctgggcca 4380

cctggacatc ccgggcctcc agggcctaga ggacacaaag gcgaaaaagg cgacaaaggg 4440

gaccaagtct acgccggcag acggcggaga agatccattg ccgtgaagcc ctaa 4494

<210> 15

<211> 1464

<212> PRT

<213> 智人(Homo sapiens)

<400> 15

Met Phe Ser Phe Val Asp Leu Arg Leu Leu Leu Leu Leu Ala Ala Thr

1 5 10 15

Ala Leu Leu Thr His Gly Gln Glu Glu Gly Gln Val Glu Gly Gln Asp

20 25 30

Glu Asp Ile Pro Pro Ile Thr Cys Val Gln Asn Gly Leu Arg Tyr His

35 40 45

Asp Arg Asp Val Trp Lys Pro Glu Pro Cys Arg Ile Cys Val Cys Asp

50 55 60

Asn Gly Lys Val Leu Cys Asp Asp Val Ile Cys Asp Glu Thr Lys Asn

65 70 75 80

Cys Pro Gly Ala Glu Val Pro Glu Gly Glu Cys Cys Pro Val Cys Pro

85 90 95

Asp Gly Ser Glu Ser Pro Thr Asp Gln Glu Thr Thr Gly Val Glu Gly

100 105 110

Pro Lys Gly Asp Thr Gly Pro Arg Gly Pro Arg Gly Pro Ala Gly Pro

115 120 125

Pro Gly Arg Asp Gly Ile Pro Gly Gln Pro Gly Leu Pro Gly Pro Pro

130 135 140

Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Leu Gly Gly Asn Phe Ala

145 150 155 160

Pro Gln Leu Ser Tyr Gly Tyr Asp Glu Lys Ser Thr Gly Gly Ile Ser

165 170 175

Val Pro Gly Pro Met Gly Pro Ser Gly Pro Arg Gly Leu Pro Gly Pro

180 185 190

Pro Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Pro Gly Glu Pro

195 200 205

Gly Glu Pro Gly Ala Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly

210 215 220

Pro Pro Gly Lys Asn Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly Arg

225 230 235 240

Pro Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Leu Pro

245 250 255

Gly Thr Ala Gly Leu Pro Gly Met Lys Gly His Arg Gly Phe Ser Gly

260 265 270

Leu Asp Gly Ala Lys Gly Asp Ala Gly Pro Ala Gly Pro Lys Gly Glu

275 280 285

Pro Gly Ser Pro Gly Glu Asn Gly Ala Pro Gly Gln Met Gly Pro Arg

290 295 300

Gly Leu Pro Gly Glu Arg Gly Arg Pro Gly Ala Pro Gly Pro Ala Gly

305 310 315 320

Ala Arg Gly Asn Asp Gly Ala Thr Gly Ala Ala Gly Pro Pro Gly Pro

325 330 335

Thr Gly Pro Ala Gly Pro Pro Gly Phe Pro Gly Ala Val Gly Ala Lys

340 345 350

Gly Glu Ala Gly Pro Gln Gly Pro Arg Gly Ser Glu Gly Pro Gln Gly

355 360 365

Val Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Ala Ala Gly Pro

370 375 380

Ala Gly Asn Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Ala Asn

385 390 395 400

Gly Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Ala Arg Gly

405 410 415

Pro Ser Gly Pro Gln Gly Pro Gly Gly Pro Pro Gly Pro Lys Gly Asn

420 425 430

Ser Gly Glu Pro Gly Ala Pro Gly Ser Lys Gly Asp Thr Gly Ala Lys

435 440 445

Gly Glu Pro Gly Pro Val Gly Val Gln Gly Pro Pro Gly Pro Ala Gly

450 455 460

Glu Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Pro Thr Gly Leu

465 470 475 480

Pro Gly Pro Pro Gly Glu Arg Gly Gly Pro Gly Ser Arg Gly Phe Pro

485 490 495

Gly Ala Asp Gly Val Ala Gly Pro Lys Gly Pro Ala Gly Glu Arg Gly

500 505 510

Ser Pro Gly Pro Ala Gly Pro Lys Gly Ser Pro Gly Glu Ala Gly Arg

515 520 525

Pro Gly Glu Ala Gly Leu Pro Gly Ala Lys Gly Leu Thr Gly Ser Pro

530 535 540

Gly Ser Pro Gly Pro Asp Gly Lys Thr Gly Pro Pro Gly Pro Ala Gly

545 550 555 560

Gln Asp Gly Arg Pro Gly Pro Pro Gly Pro Pro Gly Ala Arg Gly Gln

565 570 575

Ala Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Ala Gly Glu Pro

580 585 590

Gly Lys Ala Gly Glu Arg Gly Val Pro Gly Pro Pro Gly Ala Val Gly

595 600 605

Pro Ala Gly Lys Asp Gly Glu Ala Gly Ala Gln Gly Pro Pro Gly Pro

610 615 620

Ala Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Pro Ala Gly Ser Pro

625 630 635 640

Gly Phe Gln Gly Leu Pro Gly Pro Ala Gly Pro Pro Gly Glu Ala Gly

645 650 655

Lys Pro Gly Glu Gln Gly Val Pro Gly Asp Leu Gly Ala Pro Gly Pro

660 665 670

Ser Gly Ala Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Val Gln

675 680 685

Gly Pro Pro Gly Pro Ala Gly Pro Arg Gly Ala Asn Gly Ala Pro Gly

690 695 700

Asn Asp Gly Ala Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Ser

705 710 715 720

Gln Gly Ala Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala Ala

725 730 735

Gly Leu Pro Gly Pro Lys Gly Asp Arg Gly Asp Ala Gly Pro Lys Gly

740 745 750

Ala Asp Gly Ser Pro Gly Lys Asp Gly Val Arg Gly Leu Thr Gly Pro

755 760 765

Ile Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Asp Lys Gly Glu Ser

770 775 780

Gly Pro Ser Gly Pro Ala Gly Pro Thr Gly Ala Arg Gly Ala Pro Gly

785 790 795 800

Asp Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly Pro

805 810 815

Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Pro Gly Asp Ala

820 825 830

Gly Ala Lys Gly Asp Ala Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly

835 840 845

Pro Pro Gly Pro Ile Gly Asn Val Gly Ala Pro Gly Ala Lys Gly Ala

850 855 860

Arg Gly Ser Ala Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala Ala

865 870 875 880

Gly Arg Val Gly Pro Pro Gly Pro Ser Gly Asn Ala Gly Pro Pro Gly

885 890 895

Pro Pro Gly Pro Ala Gly Lys Glu Gly Gly Lys Gly Pro Arg Gly Glu

900 905 910

Thr Gly Pro Ala Gly Arg Pro Gly Glu Val Gly Pro Pro Gly Pro Pro

915 920 925

Gly Pro Ala Gly Glu Lys Gly Ser Pro Gly Ala Asp Gly Pro Ala Gly

930 935 940

Ala Pro Gly Thr Pro Gly Pro Gln Gly Ile Ala Gly Gln Arg Gly Val

945 950 955 960

Val Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu Pro

965 970 975

Gly Pro Ser Gly Glu Pro Gly Lys Gln Gly Pro Ser Gly Ala Ser Gly

980 985 990

Glu Arg Gly Pro Pro Gly Pro Met Gly Pro Pro Gly Leu Ala Gly Pro

995 1000 1005

Pro Gly Glu Ser Gly Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro

1010 1015 1020

Gly Arg Asp Gly Ser Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly

1025 1030 1035 1040

Pro Ala Gly Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro

1045 1050 1055

Val Gly Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala

1060 1065 1070

Gly Pro Ala Gly Pro Val Gly Pro Val Gly Ala Arg Gly Pro Ala Gly

1075 1080 1085

Pro Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly Asp

1090 1095 1100

Arg Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro Pro

1105 1110 1115 1120

Gly Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala Ser Gly

1125 1130 1135

Pro Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ala Pro Gly Lys

1140 1145 1150

Asp Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg

1155 1160 1165

Gly Arg Thr Gly Asp Ala Gly Pro Val Gly Pro Pro Gly Pro Pro Gly

1170 1175 1180

Pro Pro Gly Pro Pro Gly Pro Pro Ser Ala Gly Phe Asp Phe Ser Phe

1185 1190 1195 1200

Leu Pro Gln Pro Pro Gln Glu Lys Ala His Asp Gly Gly Arg Tyr Tyr

1205 1210 1215

Arg Ala Asp Asp Ala Asn Val Val Arg Asp Arg Asp Leu Glu Val Asp

1220 1225 1230

Thr Thr Leu Lys Ser Leu Ser Gln Gln Ile Glu Asn Ile Arg Ser Pro

1235 1240 1245

Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp Leu Lys Met

1250 1255 1260

Cys His Ser Asp Trp Lys Ser Gly Glu Tyr Trp Ile Asp Pro Asn Gln

1265 1270 1275 1280

Gly Cys Asn Leu Asp Ala Ile Lys Val Phe Cys Asn Met Glu Thr Gly

1285 1290 1295

Glu Thr Cys Val Tyr Pro Thr Gln Pro Ser Val Ala Gln Lys Asn Trp

1300 1305 1310

Tyr Ile Ser Lys Asn Pro Lys Asp Lys Arg His Val Trp Phe Gly Glu

1315 1320 1325

Ser Met Thr Asp Gly Phe Gln Phe Glu Tyr Gly Gly Gln Gly Ser Asp

1330 1335 1340

Pro Ala Asp Val Ala Ile Gln Leu Thr Phe Leu Arg Leu Met Ser Thr

1345 1350 1355 1360

Glu Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Val Ala Tyr

1365 1370 1375

Met Asp Gln Gln Thr Gly Asn Leu Lys Lys Ala Leu Leu Leu Gln Gly

1380 1385 1390

Ser Asn Glu Ile Glu Ile Arg Ala Glu Gly Asn Ser Arg Phe Thr Tyr

1395 1400 1405

Ser Val Thr Val Asp Gly Cys Thr Ser His Thr Gly Ala Trp Gly Lys

1410 1415 1420

Thr Val Ile Glu Tyr Lys Thr Thr Lys Thr Ser Arg Leu Pro Ile Ile

1425 1430 1435 1440

Asp Val Ala Pro Leu Asp Val Gly Ala Pro Asp Gln Glu Phe Gly Phe

1445 1450 1455

Asp Val Gly Pro Val Cys Phe Leu

1460

<210> 16

<211> 1366

<212> PRT

<213> 智人(Homo sapiens)

<400> 16

Met Leu Ser Phe Val Asp Thr Arg Thr Leu Leu Leu Leu Ala Val Thr

1 5 10 15

Leu Cys Leu Ala Thr Cys Gln Ser Leu Gln Glu Glu Thr Val Arg Lys

20 25 30

Gly Pro Ala Gly Asp Arg Gly Pro Arg Gly Glu Arg Gly Pro Pro Gly

35 40 45

Pro Pro Gly Arg Asp Gly Glu Asp Gly Pro Thr Gly Pro Pro Gly Pro

50 55 60

Pro Gly Pro Pro Gly Pro Pro Gly Leu Gly Gly Asn Phe Ala Ala Gln

65 70 75 80

Tyr Asp Gly Lys Gly Val Gly Leu Gly Pro Gly Pro Met Gly Leu Met

85 90 95

Gly Pro Arg Gly Pro Pro Gly Ala Ala Gly Ala Pro Gly Pro Gln Gly

100 105 110

Phe Gln Gly Pro Ala Gly Glu Pro Gly Glu Pro Gly Gln Thr Gly Pro

115 120 125

Ala Gly Ala Arg Gly Pro Ala Gly Pro Pro Gly Lys Ala Gly Glu Asp

130 135 140

Gly His Pro Gly Lys Pro Gly Arg Pro Gly Glu Arg Gly Val Val Gly

145 150 155 160

Pro Gln Gly Ala Arg Gly Phe Pro Gly Thr Pro Gly Leu Pro Gly Phe

165 170 175

Lys Gly Ile Arg Gly His Asn Gly Leu Asp Gly Leu Lys Gly Gln Pro

180 185 190

Gly Ala Pro Gly Val Lys Gly Glu Pro Gly Ala Pro Gly Glu Asn Gly

195 200 205

Thr Pro Gly Gln Thr Gly Ala Arg Gly Leu Pro Gly Glu Arg Gly Arg

210 215 220

Val Gly Ala Pro Gly Pro Ala Gly Ala Arg Gly Ser Asp Gly Ser Val

225 230 235 240

Gly Pro Val Gly Pro Ala Gly Pro Ile Gly Ser Ala Gly Pro Pro Gly

245 250 255

Phe Pro Gly Ala Pro Gly Pro Lys Gly Glu Ile Gly Ala Val Gly Asn

260 265 270

Ala Gly Pro Ala Gly Pro Ala Gly Pro Arg Gly Glu Val Gly Leu Pro

275 280 285

Gly Leu Ser Gly Pro Val Gly Pro Pro Gly Asn Pro Gly Ala Asn Gly

290 295 300

Leu Thr Gly Ala Lys Gly Ala Ala Gly Leu Pro Gly Val Ala Gly Ala

305 310 315 320

Pro Gly Leu Pro Gly Pro Arg Gly Ile Pro Gly Pro Val Gly Ala Ala

325 330 335

Gly Ala Thr Gly Ala Arg Gly Leu Val Gly Glu Pro Gly Pro Ala Gly

340 345 350

Ser Lys Gly Glu Ser Gly Asn Lys Gly Glu Pro Gly Ser Ala Gly Pro

355 360 365

Gln Gly Pro Pro Gly Pro Ser Gly Glu Glu Gly Lys Arg Gly Pro Asn

370 375 380

Gly Glu Ala Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly Leu Arg Gly

385 390 395 400

Ser Pro Gly Ser Arg Gly Leu Pro Gly Ala Asp Gly Arg Ala Gly Val

405 410 415

Met Gly Pro Pro Gly Ser Arg Gly Ala Ser Gly Pro Ala Gly Val Arg

420 425 430

Gly Pro Asn Gly Asp Ala Gly Arg Pro Gly Glu Pro Gly Leu Met Gly

435 440 445

Pro Arg Gly Leu Pro Gly Ser Pro Gly Asn Ile Gly Pro Ala Gly Lys

450 455 460

Glu Gly Pro Val Gly Leu Pro Gly Ile Asp Gly Arg Pro Gly Pro Ile

465 470 475 480

Gly Pro Ala Gly Ala Arg Gly Glu Pro Gly Asn Ile Gly Phe Pro Gly

485 490 495

Pro Lys Gly Pro Thr Gly Asp Pro Gly Lys Asn Gly Asp Lys Gly His

500 505 510

Ala Gly Leu Ala Gly Ala Arg Gly Ala Pro Gly Pro Asp Gly Asn Asn

515 520 525

Gly Ala Gln Gly Pro Pro Gly Pro Gln Gly Val Gln Gly Gly Lys Gly

530 535 540

Glu Gln Gly Pro Pro Gly Pro Pro Gly Phe Gln Gly Leu Pro Gly Pro

545 550 555 560

Ser Gly Pro Ala Gly Glu Val Gly Lys Pro Gly Glu Arg Gly Leu His

565 570 575

Gly Glu Phe Gly Leu Pro Gly Pro Ala Gly Pro Arg Gly Glu Arg Gly

580 585 590

Pro Pro Gly Glu Ser Gly Ala Ala Gly Pro Thr Gly Pro Ile Gly Ser

595 600 605

Arg Gly Pro Ser Gly Pro Pro Gly Pro Asp Gly Asn Lys Gly Glu Pro

610 615 620

Gly Val Val Gly Ala Val Gly Thr Ala Gly Pro Ser Gly Pro Ser Gly

625 630 635 640

Leu Pro Gly Glu Arg Gly Ala Ala Gly Ile Pro Gly Gly Lys Gly Glu

645 650 655

Lys Gly Glu Pro Gly Leu Arg Gly Glu Ile Gly Asn Pro Gly Arg Asp

660 665 670

Gly Ala Arg Gly Ala Pro Gly Ala Val Gly Ala Pro Gly Pro Ala Gly

675 680 685

Ala Thr Gly Asp Arg Gly Glu Ala Gly Ala Ala Gly Pro Ala Gly Pro

690 695 700

Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg Gly Glu Val Gly Pro Ala

705 710 715 720

Gly Pro Asn Gly Phe Ala Gly Pro Ala Gly Ala Ala Gly Gln Pro Gly

725 730 735

Ala Lys Gly Glu Arg Gly Ala Lys Gly Pro Lys Gly Glu Asn Gly Val

740 745 750

Val Gly Pro Thr Gly Pro Val Gly Ala Ala Gly Pro Ala Gly Pro Asn

755 760 765

Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Asp Gly Gly Pro Pro Gly

770 775 780

Met Thr Gly Phe Pro Gly Ala Ala Gly Arg Thr Gly Pro Pro Gly Pro

785 790 795 800

Ser Gly Ile Ser Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Lys Glu

805 810 815

Gly Leu Arg Gly Pro Arg Gly Asp Gln Gly Pro Val Gly Arg Thr Gly

820 825 830

Glu Val Gly Ala Val Gly Pro Pro Gly Phe Ala Gly Glu Lys Gly Pro

835 840 845

Ser Gly Glu Ala Gly Thr Ala Gly Pro Pro Gly Thr Pro Gly Pro Gln

850 855 860

Gly Leu Leu Gly Ala Pro Gly Ile Leu Gly Leu Pro Gly Ser Arg Gly

865 870 875 880

Glu Arg Gly Leu Pro Gly Val Ala Gly Ala Val Gly Glu Pro Gly Pro

885 890 895

Leu Gly Ile Ala Gly Pro Pro Gly Ala Arg Gly Pro Pro Gly Ala Val

900 905 910

Gly Ser Pro Gly Val Asn Gly Ala Pro Gly Glu Ala Gly Arg Asp Gly

915 920 925

Asn Pro Gly Asn Asp Gly Pro Pro Gly Arg Asp Gly Gln Pro Gly His

930 935 940

Lys Gly Glu Arg Gly Tyr Pro Gly Asn Ile Gly Pro Val Gly Ala Ala

945 950 955 960

Gly Ala Pro Gly Pro His Gly Pro Val Gly Pro Ala Gly Lys His Gly

965 970 975

Asn Arg Gly Glu Thr Gly Pro Ser Gly Pro Val Gly Pro Ala Gly Ala

980 985 990

Val Gly Pro Arg Gly Pro Ser Gly Pro Gln Gly Ile Arg Gly Asp Lys

995 1000 1005

Gly Glu Pro Gly Glu Lys Gly Pro Arg Gly Leu Pro Gly Leu Lys Gly

1010 1015 1020

His Asn Gly Leu Gln Gly Leu Pro Gly Ile Ala Gly His His Gly Asp

1025 1030 1035 1040

Gln Gly Ala Pro Gly Ser Val Gly Pro Ala Gly Pro Arg Gly Pro Ala

1045 1050 1055

Gly Pro Ser Gly Pro Ala Gly Lys Asp Gly Arg Thr Gly His Pro Gly

1060 1065 1070

Thr Val Gly Pro Ala Gly Ile Arg Gly Pro Gln Gly His Gln Gly Pro

1075 1080 1085

Ala Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Val Ser

1090 1095 1100

Gly Gly Gly Tyr Asp Phe Gly Tyr Asp Gly Asp Phe Tyr Arg Ala Asp

1105 1110 1115 1120

Gln Pro Arg Ser Ala Pro Ser Leu Arg Pro Lys Asp Tyr Glu Val Asp

1125 1130 1135

Ala Thr Leu Lys Ser Leu Asn Asn Gln Ile Glu Thr Leu Leu Thr Pro

1140 1145 1150

Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp Leu Arg Leu

1155 1160 1165

Ser His Pro Glu Trp Ser Ser Gly Tyr Tyr Trp Ile Asp Pro Asn Gln

1170 1175 1180

Gly Cys Thr Met Asp Ala Ile Lys Val Tyr Cys Asp Phe Ser Thr Gly

1185 1190 1195 1200

Glu Thr Cys Ile Arg Ala Gln Pro Glu Asn Ile Pro Ala Lys Asn Trp

1205 1210 1215

Tyr Arg Ser Ser Lys Asp Lys Lys His Val Trp Leu Gly Glu Thr Ile

1220 1225 1230

Asn Ala Gly Ser Gln Phe Glu Tyr Asn Val Glu Gly Val Thr Ser Lys

1235 1240 1245

Glu Met Ala Thr Gln Leu Ala Phe Met Arg Leu Leu Ala Asn Tyr Ala

1250 1255 1260

Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Ile Ala Tyr Met Asp

1265 1270 1275 1280

Glu Glu Thr Gly Asn Leu Lys Lys Ala Val Ile Leu Gln Gly Ser Asn

1285 1290 1295

Asp Val Glu Leu Val Ala Glu Gly Asn Ser Arg Phe Thr Tyr Thr Val

1300 1305 1310

Leu Val Asp Gly Cys Ser Lys Lys Thr Asn Glu Trp Gly Lys Thr Ile

1315 1320 1325

Ile Glu Tyr Lys Thr Asn Lys Pro Ser Arg Leu Pro Phe Leu Asp Ile

1330 1335 1340

Ala Pro Leu Asp Ile Gly Gly Ala Asp Gln Glu Phe Phe Val Asp Ile

1345 1350 1355 1360

Gly Pro Val Cys Phe Lys

1365

<210> 17

<211> 1466

<212> PRT

<213> 智人(Homo sapiens)

<400> 17

Met Met Ser Phe Val Gln Lys Gly Ser Trp Leu Leu Leu Ala Leu Leu

1 5 10 15

His Pro Thr Ile Ile Leu Ala Gln Gln Glu Ala Val Glu Gly Gly Cys

20 25 30

Ser His Leu Gly Gln Ser Tyr Ala Asp Arg Asp Val Trp Lys Pro Glu

35 40 45

Pro Cys Gln Ile Cys Val Cys Asp Ser Gly Ser Val Leu Cys Asp Asp

50 55 60

Ile Ile Cys Asp Asp Gln Glu Leu Asp Cys Pro Asn Pro Glu Ile Pro

65 70 75 80

Phe Gly Glu Cys Cys Ala Val Cys Pro Gln Pro Pro Thr Ala Pro Thr

85 90 95

Arg Pro Pro Asn Gly Gln Gly Pro Gln Gly Pro Lys Gly Asp Pro Gly

100 105 110

Pro Pro Gly Ile Pro Gly Arg Asn Gly Asp Pro Gly Ile Pro Gly Gln

115 120 125

Pro Gly Ser Pro Gly Ser Pro Gly Pro Pro Gly Ile Cys Glu Ser Cys

130 135 140

Pro Thr Gly Pro Gln Asn Tyr Ser Pro Gln Tyr Asp Ser Tyr Asp Val

145 150 155 160

Lys Ser Gly Val Ala Val Gly Gly Leu Ala Gly Tyr Pro Gly Pro Ala

165 170 175

Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Thr Ser Gly His Pro Gly

180 185 190

Ser Pro Gly Ser Pro Gly Tyr Gln Gly Pro Pro Gly Glu Pro Gly Gln

195 200 205

Ala Gly Pro Ser Gly Pro Pro Gly Pro Pro Gly Ala Ile Gly Pro Ser

210 215 220

Gly Pro Ala Gly Lys Asp Gly Glu Ser Gly Arg Pro Gly Arg Pro Gly

225 230 235 240

Glu Arg Gly Leu Pro Gly Pro Pro Gly Ile Lys Gly Pro Ala Gly Ile

245 250 255

Pro Gly Phe Pro Gly Met Lys Gly His Arg Gly Phe Asp Gly Arg Asn

260 265 270

Gly Glu Lys Gly Glu Thr Gly Ala Pro Gly Leu Lys Gly Glu Asn Gly

275 280 285

Leu Pro Gly Glu Asn Gly Ala Pro Gly Pro Met Gly Pro Arg Gly Ala

290 295 300

Pro Gly Glu Arg Gly Arg Pro Gly Leu Pro Gly Ala Ala Gly Ala Arg

305 310 315 320

Gly Asn Asp Gly Ala Arg Gly Ser Asp Gly Gln Pro Gly Pro Pro Gly

325 330 335

Pro Pro Gly Thr Ala Gly Phe Pro Gly Ser Pro Gly Ala Lys Gly Glu

340 345 350

Val Gly Pro Ala Gly Ser Pro Gly Ser Asn Gly Ala Pro Gly Gln Arg

355 360 365

Gly Glu Pro Gly Pro Gln Gly His Ala Gly Ala Gln Gly Pro Pro Gly

370 375 380

Pro Pro Gly Ile Asn Gly Ser Pro Gly Gly Lys Gly Glu Met Gly Pro

385 390 395 400

Ala Gly Ile Pro Gly Ala Pro Gly Leu Met Gly Ala Arg Gly Pro Pro

405 410 415

Gly Pro Ala Gly Ala Asn Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly

420 425 430

Glu Pro Gly Lys Asn Gly Ala Lys Gly Glu Pro Gly Pro Arg Gly Glu

435 440 445

Arg Gly Glu Ala Gly Ile Pro Gly Val Pro Gly Ala Lys Gly Glu Asp

450 455 460

Gly Lys Asp Gly Ser Pro Gly Glu Pro Gly Ala Asn Gly Leu Pro Gly

465 470 475 480

Ala Ala Gly Glu Arg Gly Ala Pro Gly Phe Arg Gly Pro Ala Gly Pro

485 490 495

Asn Gly Ile Pro Gly Glu Lys Gly Pro Ala Gly Glu Arg Gly Ala Pro

500 505 510

Gly Pro Ala Gly Pro Arg Gly Ala Ala Gly Glu Pro Gly Arg Asp Gly

515 520 525

Val Pro Gly Gly Pro Gly Met Arg Gly Met Pro Gly Ser Pro Gly Gly

530 535 540

Pro Gly Ser Asp Gly Lys Pro Gly Pro Pro Gly Ser Gln Gly Glu Ser

545 550 555 560

Gly Arg Pro Gly Pro Pro Gly Pro Ser Gly Pro Arg Gly Gln Pro Gly

565 570 575

Val Met Gly Phe Pro Gly Pro Lys Gly Asn Asp Gly Ala Pro Gly Lys

580 585 590

Asn Gly Glu Arg Gly Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Pro

595 600 605

Gly Lys Asn Gly Glu Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly

610 615 620

Pro Gly Gly Asp Lys Gly Asp Thr Gly Pro Pro Gly Pro Gln Gly Leu

625 630 635 640

Gln Gly Leu Pro Gly Thr Gly Gly Pro Pro Gly Glu Asn Gly Lys Pro

645 650 655

Gly Glu Pro Gly Pro Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly

660 665 670

Gly Lys Gly Asp Ala Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Leu

675 680 685

Ala Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu

690 695 700

Gly Gly Lys Gly Ala Ala Gly Pro Pro Gly Pro Pro Gly Ala Ala Gly

705 710 715 720

Thr Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Gly Leu Gly Ser

725 730 735

Pro Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly Ala Asp

740 745 750

Gly Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro Ile Gly

755 760 765

Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly Gly Ala

770 775 780

Pro Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg

785 790 795 800

Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala Pro Gly

805 810 815

Gln Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro Gly Glu

820 825 830

Lys Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly Gly Ser

835 840 845

Gly Pro Ala Gly Pro Pro Gly Pro Gln Gly Val Lys Gly Glu Arg Gly

850 855 860

Ser Pro Gly Gly Pro Gly Ala Ala Gly Phe Pro Gly Ala Arg Gly Leu

865 870 875 880

Pro Gly Pro Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro Gly Pro Ser

885 890 895

Gly Ser Pro Gly Lys Asp Gly Pro Pro Gly Pro Ala Gly Asn Thr Gly

900 905 910

Ala Pro Gly Ser Pro Gly Val Ser Gly Pro Lys Gly Asp Ala Gly Gln

915 920 925

Pro Gly Glu Lys Gly Ser Pro Gly Ala Gln Gly Pro Pro Gly Ala Pro

930 935 940

Gly Pro Leu Gly Ile Ala Gly Ile Thr Gly Ala Arg Gly Leu Ala Gly

945 950 955 960

Pro Pro Gly Met Pro Gly Pro Arg Gly Ser Pro Gly Pro Gln Gly Val

965 970 975

Lys Gly Glu Ser Gly Lys Pro Gly Ala Asn Gly Leu Ser Gly Glu Arg

980 985 990

Gly Pro Pro Gly Pro Gln Gly Leu Pro Gly Leu Ala Gly Thr Ala Gly

995 1000 1005

Glu Pro Gly Arg Asp Gly Asn Pro Gly Ser Asp Gly Leu Pro Gly Arg

1010 1015 1020

Asp Gly Ser Pro Gly Gly Lys Gly Asp Arg Gly Glu Asn Gly Ser Pro

1025 1030 1035 1040

Gly Ala Pro Gly Ala Pro Gly His Pro Gly Pro Pro Gly Pro Val Gly

1045 1050 1055

Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Ser Gly Pro Ala Gly Pro

1060 1065 1070

Ala Gly Ala Pro Gly Pro Ala Gly Ser Arg Gly Ala Pro Gly Pro Gln

1075 1080 1085

Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Arg Gly Ala Ala Gly

1090 1095 1100

Ile Lys Gly His Arg Gly Phe Pro Gly Asn Pro Gly Ala Pro Gly Ser

1105 1110 1115 1120

Pro Gly Pro Ala Gly Gln Gln Gly Ala Ile Gly Ser Pro Gly Pro Ala

1125 1130 1135

Gly Pro Arg Gly Pro Val Gly Pro Ser Gly Pro Pro Gly Lys Asp Gly

1140 1145 1150

Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn

1155 1160 1165

Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro Gly Gln Pro

1170 1175 1180

Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys Gly Gly Val

1185 1190 1195 1200

Gly Ala Ala Ala Ile Ala Gly Ile Gly Gly Glu Lys Ala Gly Gly Phe

1205 1210 1215

Ala Pro Tyr Tyr Gly Asp Glu Pro Met Asp Phe Lys Ile Asn Thr Asp

1220 1225 1230

Glu Ile Met Thr Ser Leu Lys Ser Val Asn Gly Gln Ile Glu Ser Leu

1235 1240 1245

Ile Ser Pro Asp Gly Ser Arg Lys Asn Pro Ala Arg Asn Cys Arg Asp

1250 1255 1260

Leu Lys Phe Cys His Pro Glu Leu Lys Ser Gly Glu Tyr Trp Val Asp

1265 1270 1275 1280

Pro Asn Gln Gly Cys Lys Leu Asp Ala Ile Lys Val Phe Cys Asn Met

1285 1290 1295

Glu Thr Gly Glu Thr Cys Ile Ser Ala Asn Pro Leu Asn Val Pro Arg

1300 1305 1310

Lys His Trp Trp Thr Asp Ser Ser Ala Glu Lys Lys His Val Trp Phe

1315 1320 1325

Gly Glu Ser Met Asp Gly Gly Phe Gln Phe Ser Tyr Gly Asn Pro Glu

1330 1335 1340

Leu Pro Glu Asp Val Leu Asp Val Gln Leu Ala Phe Leu Arg Leu Leu

1345 1350 1355 1360

Ser Ser Arg Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Ile

1365 1370 1375

Ala Tyr Met Asp Gln Ala Ser Gly Asn Val Lys Lys Ala Leu Lys Leu

1380 1385 1390

Met Gly Ser Asn Glu Gly Glu Phe Lys Ala Glu Gly Asn Ser Lys Phe

1395 1400 1405

Thr Tyr Thr Val Leu Glu Asp Gly Cys Thr Lys His Thr Gly Glu Trp

1410 1415 1420

Ser Lys Thr Val Phe Glu Tyr Arg Thr Arg Lys Ala Val Arg Leu Pro

1425 1430 1435 1440

Ile Val Asp Ile Ala Pro Tyr Asp Ile Gly Gly Pro Asp Gln Glu Phe

1445 1450 1455

Gly Val Asp Val Gly Pro Val Cys Phe Leu

1460 1465

<210> 18

<211> 1669

<212> PRT

<213> 智人(Homo sapiens)

<400> 18

Met Gly Pro Arg Leu Ser Val Trp Leu Leu Leu Leu Pro Ala Ala Leu

1 5 10 15

Leu Leu His Glu Glu His Ser Arg Ala Ala Ala Lys Gly Gly Cys Ala

20 25 30

Gly Ser Gly Cys Gly Lys Cys Asp Cys His Gly Val Lys Gly Gln Lys

35 40 45

Gly Glu Arg Gly Leu Pro Gly Leu Gln Gly Val Ile Gly Phe Pro Gly

50 55 60

Met Gln Gly Pro Glu Gly Pro Gln Gly Pro Pro Gly Gln Lys Gly Asp

65 70 75 80

Thr Gly Glu Pro Gly Leu Pro Gly Thr Lys Gly Thr Arg Gly Pro Pro

85 90 95

Gly Ala Ser Gly Tyr Pro Gly Asn Pro Gly Leu Pro Gly Ile Pro Gly

100 105 110

Gln Asp Gly Pro Pro Gly Pro Pro Gly Ile Pro Gly Cys Asn Gly Thr

115 120 125

Lys Gly Glu Arg Gly Pro Leu Gly Pro Pro Gly Leu Pro Gly Phe Ala

130 135 140

Gly Asn Pro Gly Pro Pro Gly Leu Pro Gly Met Lys Gly Asp Pro Gly

145 150 155 160

Glu Ile Leu Gly His Val Pro Gly Met Leu Leu Lys Gly Glu Arg Gly

165 170 175

Phe Pro Gly Ile Pro Gly Thr Pro Gly Pro Pro Gly Leu Pro Gly Leu

180 185 190

Gln Gly Pro Val Gly Pro Pro Gly Phe Thr Gly Pro Pro Gly Pro Pro

195 200 205

Gly Pro Pro Gly Pro Pro Gly Glu Lys Gly Gln Met Gly Leu Ser Phe

210 215 220

Gln Gly Pro Lys Gly Asp Lys Gly Asp Gln Gly Val Ser Gly Pro Pro

225 230 235 240

Gly Val Pro Gly Gln Ala Gln Val Gln Glu Lys Gly Asp Phe Ala Thr

245 250 255

Lys Gly Glu Lys Gly Gln Lys Gly Glu Pro Gly Phe Gln Gly Met Pro

260 265 270

Gly Val Gly Glu Lys Gly Glu Pro Gly Lys Pro Gly Pro Arg Gly Lys

275 280 285

Pro Gly Lys Asp Gly Asp Lys Gly Glu Lys Gly Ser Pro Gly Phe Pro

290 295 300

Gly Glu Pro Gly Tyr Pro Gly Leu Ile Gly Arg Gln Gly Pro Gln Gly

305 310 315 320

Glu Lys Gly Glu Ala Gly Pro Pro Gly Pro Pro Gly Ile Val Ile Gly

325 330 335

Thr Gly Pro Leu Gly Glu Lys Gly Glu Arg Gly Tyr Pro Gly Thr Pro

340 345 350

Gly Pro Arg Gly Glu Pro Gly Pro Lys Gly Phe Pro Gly Leu Pro Gly

355 360 365

Gln Pro Gly Pro Pro Gly Leu Pro Val Pro Gly Gln Ala Gly Ala Pro

370 375 380

Gly Phe Pro Gly Glu Arg Gly Glu Lys Gly Asp Arg Gly Phe Pro Gly

385 390 395 400

Thr Ser Leu Pro Gly Pro Ser Gly Arg Asp Gly Leu Pro Gly Pro Pro

405 410 415

Gly Ser Pro Gly Pro Pro Gly Gln Pro Gly Tyr Thr Asn Gly Ile Val

420 425 430

Glu Cys Gln Pro Gly Pro Pro Gly Asp Gln Gly Pro Pro Gly Ile Pro

435 440 445

Gly Gln Pro Gly Phe Ile Gly Glu Ile Gly Glu Lys Gly Gln Lys Gly

450 455 460

Glu Ser Cys Leu Ile Cys Asp Ile Asp Gly Tyr Arg Gly Pro Pro Gly

465 470 475 480

Pro Gln Gly Pro Pro Gly Glu Ile Gly Phe Pro Gly Gln Pro Gly Ala

485 490 495

Lys Gly Asp Arg Gly Leu Pro Gly Arg Asp Gly Val Ala Gly Val Pro

500 505 510

Gly Pro Gln Gly Thr Pro Gly Leu Ile Gly Gln Pro Gly Ala Lys Gly

515 520 525

Glu Pro Gly Glu Phe Tyr Phe Asp Leu Arg Leu Lys Gly Asp Lys Gly

530 535 540

Asp Pro Gly Phe Pro Gly Gln Pro Gly Met Pro Gly Arg Ala Gly Ser

545 550 555 560

Pro Gly Arg Asp Gly His Pro Gly Leu Pro Gly Pro Lys Gly Ser Pro

565 570 575

Gly Ser Val Gly Leu Lys Gly Glu Arg Gly Pro Pro Gly Gly Val Gly

580 585 590

Phe Pro Gly Ser Arg Gly Asp Thr Gly Pro Pro Gly Pro Pro Gly Tyr

595 600 605

Gly Pro Ala Gly Pro Ile Gly Asp Lys Gly Gln Ala Gly Phe Pro Gly

610 615 620

Gly Pro Gly Ser Pro Gly Leu Pro Gly Pro Lys Gly Glu Pro Gly Lys

625 630 635 640

Ile Val Pro Leu Pro Gly Pro Pro Gly Ala Glu Gly Leu Pro Gly Ser

645 650 655

Pro Gly Phe Pro Gly Pro Gln Gly Asp Arg Gly Phe Pro Gly Thr Pro

660 665 670

Gly Arg Pro Gly Leu Pro Gly Glu Lys Gly Ala Val Gly Gln Pro Gly

675 680 685

Ile Gly Phe Pro Gly Pro Pro Gly Pro Lys Gly Val Asp Gly Leu Pro

690 695 700

Gly Asp Met Gly Pro Pro Gly Thr Pro Gly Arg Pro Gly Phe Asn Gly

705 710 715 720

Leu Pro Gly Asn Pro Gly Val Gln Gly Gln Lys Gly Glu Pro Gly Val

725 730 735

Gly Leu Pro Gly Leu Lys Gly Leu Pro Gly Leu Pro Gly Ile Pro Gly

740 745 750

Thr Pro Gly Glu Lys Gly Ser Ile Gly Val Pro Gly Val Pro Gly Glu

755 760 765

His Gly Ala Ile Gly Pro Pro Gly Leu Gln Gly Ile Arg Gly Glu Pro

770 775 780

Gly Pro Pro Gly Leu Pro Gly Ser Val Gly Ser Pro Gly Val Pro Gly

785 790 795 800

Ile Gly Pro Pro Gly Ala Arg Gly Pro Pro Gly Gly Gln Gly Pro Pro

805 810 815

Gly Leu Ser Gly Pro Pro Gly Ile Lys Gly Glu Lys Gly Phe Pro Gly

820 825 830

Phe Pro Gly Leu Asp Met Pro Gly Pro Lys Gly Asp Lys Gly Ala Gln

835 840 845

Gly Leu Pro Gly Ile Thr Gly Gln Ser Gly Leu Pro Gly Leu Pro Gly

850 855 860

Gln Gln Gly Ala Pro Gly Ile Pro Gly Phe Pro Gly Ser Lys Gly Glu

865 870 875 880

Met Gly Val Met Gly Thr Pro Gly Gln Pro Gly Ser Pro Gly Pro Val

885 890 895

Gly Ala Pro Gly Leu Pro Gly Glu Lys Gly Asp His Gly Phe Pro Gly

900 905 910

Ser Ser Gly Pro Arg Gly Asp Pro Gly Leu Lys Gly Asp Lys Gly Asp

915 920 925

Val Gly Leu Pro Gly Lys Pro Gly Ser Met Asp Lys Val Asp Met Gly

930 935 940

Ser Met Lys Gly Gln Lys Gly Asp Gln Gly Glu Lys Gly Gln Ile Gly

945 950 955 960

Pro Ile Gly Glu Lys Gly Ser Arg Gly Asp Pro Gly Thr Pro Gly Val

965 970 975

Pro Gly Lys Asp Gly Gln Ala Gly Gln Pro Gly Gln Pro Gly Pro Lys

980 985 990

Gly Asp Pro Gly Ile Ser Gly Thr Pro Gly Ala Pro Gly Leu Pro Gly

995 1000 1005

Pro Lys Gly Ser Val Gly Gly Met Gly Leu Pro Gly Thr Pro Gly Glu

1010 1015 1020

Lys Gly Val Pro Gly Ile Pro Gly Pro Gln Gly Ser Pro Gly Leu Pro

1025 1030 1035 1040

Gly Asp Lys Gly Ala Lys Gly Glu Lys Gly Gln Ala Gly Pro Pro Gly

1045 1050 1055

Ile Gly Ile Pro Gly Leu Arg Gly Glu Lys Gly Asp Gln Gly Ile Ala

1060 1065 1070

Gly Phe Pro Gly Ser Pro Gly Glu Lys Gly Glu Lys Gly Ser Ile Gly

1075 1080 1085

Ile Pro Gly Met Pro Gly Ser Pro Gly Leu Lys Gly Ser Pro Gly Ser

1090 1095 1100

Val Gly Tyr Pro Gly Ser Pro Gly Leu Pro Gly Glu Lys Gly Asp Lys

1105 1110 1115 1120

Gly Leu Pro Gly Leu Asp Gly Ile Pro Gly Val Lys Gly Glu Ala Gly

1125 1130 1135

Leu Pro Gly Thr Pro Gly Pro Thr Gly Pro Ala Gly Gln Lys Gly Glu

1140 1145 1150

Pro Gly Ser Asp Gly Ile Pro Gly Ser Ala Gly Glu Lys Gly Glu Pro

1155 1160 1165

Gly Leu Pro Gly Arg Gly Phe Pro Gly Phe Pro Gly Ala Lys Gly Asp

1170 1175 1180

Lys Gly Ser Lys Gly Glu Val Gly Phe Pro Gly Leu Ala Gly Ser Pro

1185 1190 1195 1200

Gly Ile Pro Gly Ser Lys Gly Glu Gln Gly Phe Met Gly Pro Pro Gly

1205 1210 1215

Pro Gln Gly Gln Pro Gly Leu Pro Gly Ser Pro Gly His Ala Thr Glu

1220 1225 1230

Gly Pro Lys Gly Asp Arg Gly Pro Gln Gly Gln Pro Gly Leu Pro Gly

1235 1240 1245

Leu Pro Gly Pro Met Gly Pro Pro Gly Leu Pro Gly Ile Asp Gly Val

1250 1255 1260

Lys Gly Asp Lys Gly Asn Pro Gly Trp Pro Gly Ala Pro Gly Val Pro

1265 1270 1275 1280

Gly Pro Lys Gly Asp Pro Gly Phe Gln Gly Met Pro Gly Ile Gly Gly

1285 1290 1295

Ser Pro Gly Ile Thr Gly Ser Lys Gly Asp Met Gly Pro Pro Gly Val

1300 1305 1310

Pro Gly Phe Gln Gly Pro Lys Gly Leu Pro Gly Leu Gln Gly Ile Lys

1315 1320 1325

Gly Asp Gln Gly Asp Gln Gly Val Pro Gly Ala Lys Gly Leu Pro Gly

1330 1335 1340

Pro Pro Gly Pro Pro Gly Pro Tyr Asp Ile Ile Lys Gly Glu Pro Gly

1345 1350 1355 1360

Leu Pro Gly Pro Glu Gly Pro Pro Gly Leu Lys Gly Leu Gln Gly Leu

1365 1370 1375

Pro Gly Pro Lys Gly Gln Gln Gly Val Thr Gly Leu Val Gly Ile Pro

1380 1385 1390

Gly Pro Pro Gly Ile Pro Gly Phe Asp Gly Ala Pro Gly Gln Lys Gly

1395 1400 1405

Glu Met Gly Pro Ala Gly Pro Thr Gly Pro Arg Gly Phe Pro Gly Pro

1410 1415 1420

Pro Gly Pro Asp Gly Leu Pro Gly Ser Met Gly Pro Pro Gly Thr Pro

1425 1430 1435 1440

Ser Val Asp His Gly Phe Leu Val Thr Arg His Ser Gln Thr Ile Asp

1445 1450 1455

Asp Pro Gln Cys Pro Ser Gly Thr Lys Ile Leu Tyr His Gly Tyr Ser

1460 1465 1470

Leu Leu Tyr Val Gln Gly Asn Glu Arg Ala His Gly Gln Asp Leu Gly

1475 1480 1485

Thr Ala Gly Ser Cys Leu Arg Lys Phe Ser Thr Met Pro Phe Leu Phe

1490 1495 1500

Cys Asn Ile Asn Asn Val Cys Asn Phe Ala Ser Arg Asn Asp Tyr Ser

1505 1510 1515 1520

Tyr Trp Leu Ser Thr Pro Glu Pro Met Pro Met Ser Met Ala Pro Ile

1525 1530 1535

Thr Gly Glu Asn Ile Arg Pro Phe Ile Ser Arg Cys Ala Val Cys Glu

1540 1545 1550

Ala Pro Ala Met Val Met Ala Val His Ser Gln Thr Ile Gln Ile Pro

1555 1560 1565

Pro Cys Pro Ser Gly Trp Ser Ser Leu Trp Ile Gly Tyr Ser Phe Val

1570 1575 1580

Met His Thr Ser Ala Gly Ala Glu Gly Ser Gly Gln Ala Leu Ala Ser

1585 1590 1595 1600

Pro Gly Ser Cys Leu Glu Glu Phe Arg Ser Ala Pro Phe Ile Glu Cys

1605 1610 1615

His Gly Arg Gly Thr Cys Asn Tyr Tyr Ala Asn Ala Tyr Ser Phe Trp

1620 1625 1630

Leu Ala Thr Ile Glu Arg Ser Glu Met Phe Lys Lys Pro Thr Pro Ser

1635 1640 1645

Thr Leu Lys Ala Gly Glu Leu Arg Thr His Val Ser Arg Cys Gln Val

1650 1655 1660

Cys Met Arg Arg Thr

1665

<210> 19

<211> 1028

<212> PRT

<213> 智人(Homo sapiens)

<400> 19

Met Arg Ala Ala Arg Ala Leu Leu Pro Leu Leu Leu Gln Ala Cys Trp

1 5 10 15

Thr Ala Ala Gln Asp Glu Pro Glu Thr Pro Arg Ala Val Ala Phe Gln

20 25 30

Asp Cys Pro Val Asp Leu Phe Phe Val Leu Asp Thr Ser Glu Ser Val

35 40 45

Ala Leu Arg Leu Lys Pro Tyr Gly Ala Leu Val Asp Lys Val Lys Ser

50 55 60

Phe Thr Lys Arg Phe Ile Asp Asn Leu Arg Asp Arg Tyr Tyr Arg Cys

65 70 75 80

Asp Arg Asn Leu Val Trp Asn Ala Gly Ala Leu His Tyr Ser Asp Glu

85 90 95

Val Glu Ile Ile Gln Gly Leu Thr Arg Met Pro Gly Gly Arg Asp Ala

100 105 110

Leu Lys Ser Ser Val Asp Ala Val Lys Tyr Phe Gly Lys Gly Thr Tyr

115 120 125

Thr Asp Cys Ala Ile Lys Lys Gly Leu Glu Gln Leu Leu Val Gly Gly

130 135 140

Ser His Leu Lys Glu Asn Lys Tyr Leu Ile Val Val Thr Asp Gly His

145 150 155 160

Pro Leu Glu Gly Tyr Lys Glu Pro Cys Gly Gly Leu Glu Asp Ala Val

165 170 175

Asn Glu Ala Lys His Leu Gly Val Lys Val Phe Ser Val Ala Ile Thr

180 185 190

Pro Asp His Leu Glu Pro Arg Leu Ser Ile Ile Ala Thr Asp His Thr

195 200 205

Tyr Arg Arg Asn Phe Thr Ala Ala Asp Trp Gly Gln Ser Arg Asp Ala

210 215 220

Glu Glu Ala Ile Ser Gln Thr Ile Asp Thr Ile Val Asp Met Ile Lys

225 230 235 240

Asn Asn Val Glu Gln Val Cys Cys Ser Phe Glu Cys Gln Pro Ala Arg

245 250 255

Gly Pro Pro Gly Leu Arg Gly Asp Pro Gly Phe Glu Gly Glu Arg Gly

260 265 270

Lys Pro Gly Leu Pro Gly Glu Lys Gly Glu Ala Gly Asp Pro Gly Arg

275 280 285

Pro Gly Asp Leu Gly Pro Val Gly Tyr Gln Gly Met Lys Gly Glu Lys

290 295 300

Gly Ser Arg Gly Glu Lys Gly Ser Arg Gly Pro Lys Gly Tyr Lys Gly

305 310 315 320

Glu Lys Gly Lys Arg Gly Ile Asp Gly Val Asp Gly Val Lys Gly Glu

325 330 335

Met Gly Tyr Pro Gly Leu Pro Gly Cys Lys Gly Ser Pro Gly Phe Asp

340 345 350

Gly Ile Gln Gly Pro Pro Gly Pro Lys Gly Asp Pro Gly Ala Phe Gly

355 360 365

Leu Lys Gly Glu Lys Gly Glu Pro Gly Ala Asp Gly Glu Ala Gly Arg

370 375 380

Pro Gly Ser Ser Gly Pro Ser Gly Asp Glu Gly Gln Pro Gly Glu Pro

385 390 395 400

Gly Pro Pro Gly Glu Lys Gly Glu Ala Gly Asp Glu Gly Asn Pro Gly

405 410 415

Pro Asp Gly Ala Pro Gly Glu Arg Gly Gly Pro Gly Glu Arg Gly Pro

420 425 430

Arg Gly Thr Pro Gly Thr Arg Gly Pro Arg Gly Asp Pro Gly Glu Ala

435 440 445

Gly Pro Gln Gly Asp Gln Gly Arg Glu Gly Pro Val Gly Val Pro Gly

450 455 460

Asp Pro Gly Glu Ala Gly Pro Ile Gly Pro Lys Gly Tyr Arg Gly Asp

465 470 475 480

Glu Gly Pro Pro Gly Ser Glu Gly Ala Arg Gly Ala Pro Gly Pro Ala

485 490 495

Gly Pro Pro Gly Asp Pro Gly Leu Met Gly Glu Arg Gly Glu Asp Gly

500 505 510

Pro Ala Gly Asn Gly Thr Glu Gly Phe Pro Gly Phe Pro Gly Tyr Pro

515 520 525

Gly Asn Arg Gly Ala Pro Gly Ile Asn Gly Thr Lys Gly Tyr Pro Gly

530 535 540

Leu Lys Gly Asp Glu Gly Glu Ala Gly Asp Pro Gly Asp Asp Asn Asn

545 550 555 560

Asp Ile Ala Pro Arg Gly Val Lys Gly Ala Lys Gly Tyr Arg Gly Pro

565 570 575

Glu Gly Pro Gln Gly Pro Pro Gly His Gln Gly Pro Pro Gly Pro Asp

580 585 590

Glu Cys Glu Ile Leu Asp Ile Ile Met Lys Met Cys Ser Cys Cys Glu

595 600 605

Cys Lys Cys Gly Pro Ile Asp Leu Leu Phe Val Leu Asp Ser Ser Glu

610 615 620

Ser Ile Gly Leu Gln Asn Phe Glu Ile Ala Lys Asp Phe Val Val Lys

625 630 635 640

Val Ile Asp Arg Leu Ser Arg Asp Glu Leu Val Lys Phe Glu Pro Gly

645 650 655

Gln Ser Tyr Ala Gly Val Val Gln Tyr Ser His Ser Gln Met Gln Glu

660 665 670

His Val Ser Leu Arg Ser Pro Ser Ile Arg Asn Val Gln Glu Leu Lys

675 680 685

Glu Ala Ile Lys Ser Leu Gln Trp Met Ala Gly Gly Thr Phe Thr Gly

690 695 700

Glu Ala Leu Gln Tyr Thr Arg Asp Gln Leu Leu Pro Pro Ser Pro Asn

705 710 715 720

Asn Arg Ile Ala Leu Val Ile Thr Asp Gly Arg Ser Asp Thr Gln Arg

725 730 735

Asp Thr Thr Pro Leu Asn Val Leu Cys Ser Pro Gly Ile Gln Val Val

740 745 750

Ser Val Gly Ile Lys Asp Val Phe Asp Phe Ile Pro Gly Ser Asp Gln

755 760 765

Leu Asn Val Ile Ser Cys Gln Gly Leu Ala Pro Ser Gln Gly Arg Pro

770 775 780

Gly Leu Ser Leu Val Lys Glu Asn Tyr Ala Glu Leu Leu Glu Asp Ala

785 790 795 800

Phe Leu Lys Asn Val Thr Ala Gln Ile Cys Ile Asp Lys Lys Cys Pro

805 810 815

Asp Tyr Thr Cys Pro Ile Thr Phe Ser Ser Pro Ala Asp Ile Thr Ile

820 825 830

Leu Leu Asp Gly Ser Ala Ser Val Gly Ser His Asn Phe Asp Thr Thr

835 840 845

Lys Arg Phe Ala Lys Arg Leu Ala Glu Arg Phe Leu Thr Ala Gly Arg

850 855 860

Thr Asp Pro Ala His Asp Val Arg Val Ala Val Val Gln Tyr Ser Gly

865 870 875 880

Thr Gly Gln Gln Arg Pro Glu Arg Ala Ser Leu Gln Phe Leu Gln Asn

885 890 895

Tyr Thr Ala Leu Ala Ser Ala Val Asp Ala Met Asp Phe Ile Asn Asp

900 905 910

Ala Thr Asp Val Asn Asp Ala Leu Gly Tyr Val Thr Arg Phe Tyr Arg

915 920 925

Glu Ala Ser Ser Gly Ala Ala Lys Lys Arg Leu Leu Leu Phe Ser Asp

930 935 940

Gly Asn Ser Gln Gly Ala Thr Pro Ala Ala Ile Glu Lys Ala Val Gln

945 950 955 960

Glu Ala Gln Arg Ala Gly Ile Glu Ile Phe Val Val Val Val Gly Arg

965 970 975

Gln Val Asn Glu Pro His Ile Arg Val Leu Val Thr Gly Lys Thr Ala

980 985 990

Glu Tyr Asp Val Ala Tyr Gly Glu Ser His Leu Phe Arg Val Pro Ser

995 1000 1005

Tyr Gln Ala Leu Leu Arg Gly Val Phe His Gln Thr Val Ser Arg Lys

1010 1015 1020

Val Ala Leu Gly

1025

<210> 20

<211> 2944

<212> PRT

<213> 智人(Homo sapiens)

<400> 20

Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala

1 5 10 15

Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr

20 25 30

Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser

35 40 45

Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu

50 55 60

Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala

65 70 75 80

Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala

85 90 95

Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr

100 105 110

Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp

115 120 125

His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys

130 135 140

Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala

145 150 155 160

Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys

165 170 175

Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser

180 185 190

Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu

195 200 205

Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val

210 215 220

Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu

225 230 235 240

Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser

245 250 255

Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu

260 265 270

Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly

275 280 285

Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln

290 295 300

Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser

305 310 315 320

Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln

325 330 335

Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly

340 345 350

Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr

355 360 365

Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp

370 375 380

Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly

385 390 395 400

Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser

405 410 415

Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu

420 425 430

Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp

435 440 445

Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser

450 455 460

Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr

465 470 475 480

Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro

485 490 495

Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr

500 505 510

Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp

515 520 525

Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr

530 535 540

Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe

545 550 555 560

Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser

565 570 575

Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg

580 585 590

Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val

595 600 605

Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala

610 615 620

Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser

625 630 635 640

Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln

645 650 655

Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu

660 665 670

Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro

675 680 685

Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile

690 695 700

Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His

705 710 715 720

Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr

725 730 735

Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His

740 745 750

Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val

755 760 765

Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile

770 775 780

Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr

785 790 795 800

Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro

805 810 815

Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg

820 825 830

Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val

835 840 845

Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro

850 855 860

Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu

865 870 875 880

His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe

885 890 895

Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu

900 905 910

Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr

915 920 925

Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro

930 935 940

Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile

945 950 955 960

Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp

965 970 975

Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu

980 985 990

Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly

995 1000 1005

Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr

1010 1015 1020

Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala

1025 1030 1035 1040

Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val

1045 1050 1055

Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr

1060 1065 1070

Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro

1075 1080 1085

Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro

1090 1095 1100

Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg

1105 1110 1115 1120

Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr

1125 1130 1135

Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly

1140 1145 1150

Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro

1155 1160 1165

Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly

1170 1175 1180

Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu

1185 1190 1195 1200

Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val

1205 1210 1215

Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala

1220 1225 1230

Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro

1235 1240 1245

Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu

1250 1255 1260

Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr

1265 1270 1275 1280

Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly

1285 1290 1295

Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg

1300 1305 1310

Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro

1315 1320 1325

Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly

1330 1335 1340

Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly

1345 1350 1355 1360

Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro

1365 1370 1375

Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly

1380 1385 1390

Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg

1395 1400 1405

Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly

1410 1415 1420

Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro

1425 1430 1435 1440

Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly

1445 1450 1455

Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro

1460 1465 1470

Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu

1475 1480 1485

Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly

1490 1495 1500

Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro

1505 1510 1515 1520

Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro

1525 1530 1535

Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro

1540 1545 1550

Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr

1555 1560 1565

Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp

1570 1575 1580

Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr

1585 1590 1595 1600

Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly

1605 1610 1615

Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg

1620 1625 1630

Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro

1635 1640 1645

Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly

1650 1655 1660

Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu

1665 1670 1675 1680

Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg

1685 1690 1695

Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly

1700 1705 1710

Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly

1715 1720 1725

Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu

1730 1735 1740

Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro

1745 1750 1755 1760

Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly

1765 1770 1775

Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro

1780 1785 1790

Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp

1795 1800 1805

Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly

1810 1815 1820

Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu

1825 1830 1835 1840

Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys

1845 1850 1855

Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly

1860 1865 1870

Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro

1875 1880 1885

Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly

1890 1895 1900

Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser

1905 1910 1915 1920

Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro

1925 1930 1935

Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys

1940 1945 1950

Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly

1955 1960 1965

Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser

1970 1975 1980

Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly

1985 1990 1995 2000

Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro

2005 2010 2015

Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu

2020 2025 2030

Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala

2035 2040 2045

Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly

2050 2055 2060

Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu

2065 2070 2075 2080

Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val

2085 2090 2095

Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu

2100 2105 2110

Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys

2115 2120 2125

Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly

2130 2135 2140

Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met

2145 2150 2155 2160

Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro

2165 2170 2175

Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly

2180 2185 2190

Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu

2195 2200 2205

Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly

2210 2215 2220

Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro

2225 2230 2235 2240

Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro

2245 2250 2255

Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly

2260 2265 2270

Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro

2275 2280 2285

Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly

2290 2295 2300

Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly

2305 2310 2315 2320

Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly

2325 2330 2335

Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp

2340 2345 2350

Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys

2355 2360 2365

Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro

2370 2375 2380

Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro

2385 2390 2395 2400

Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly

2405 2410 2415

Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg

2420 2425 2430

Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val

2435 2440 2445

Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly

2450 2455 2460

Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg

2465 2470 2475 2480

Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly

2485 2490 2495

Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser

2500 2505 2510

Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro

2515 2520 2525

Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg

2530 2535 2540

Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly

2545 2550 2555 2560

Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu

2565 2570 2575

Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala

2580 2585 2590

Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly

2595 2600 2605

Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu

2610 2615 2620

Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys

2625 2630 2635 2640

Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly

2645 2650 2655

His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala

2660 2665 2670

Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp

2675 2680 2685

Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly

2690 2695 2700

Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser

2705 2710 2715 2720

Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu

2725 2730 2735

Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val

2740 2745 2750

Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln

2755 2760 2765

Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala

2770 2775 2780

Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln

2785 2790 2795 2800

His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu

2805 2810 2815

Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro

2820 2825 2830

Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu

2835 2840 2845

Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln

2850 2855 2860

Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu

2865 2870 2875 2880

Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala

2885 2890 2895

Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys

2900 2905 2910

Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg

2915 2920 2925

Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp

2930 2935 2940

<210> 21

<211> 1497

<212> PRT

<213> 智人(Homo sapiens)

<400> 21

Met Asp Val Thr Lys Lys Asn Lys Arg Asp Gly Thr Glu Val Thr Glu

1 5 10 15

Arg Ile Val Thr Glu Thr Val Thr Thr Arg Leu Thr Ser Leu Pro Pro

20 25 30

Lys Gly Gly Thr Ser Asn Gly Tyr Ala Lys Thr Ala Ser Leu Gly Gly

35 40 45

Gly Ser Arg Leu Glu Lys Gln Ser Leu Thr His Gly Ser Ser Gly Tyr

50 55 60

Ile Asn Ser Thr Gly Ser Thr Arg Gly His Ala Ser Thr Ser Ser Tyr

65 70 75 80

Arg Arg Ala His Ser Pro Ala Ser Thr Leu Pro Asn Ser Pro Gly Ser

85 90 95

Thr Phe Glu Arg Lys Thr His Val Thr Arg His Ala Tyr Glu Gly Ser

100 105 110

Ser Ser Gly Asn Ser Ser Pro Glu Tyr Pro Arg Lys Glu Phe Ala Ser

115 120 125

Ser Ser Thr Arg Gly Arg Ser Gln Thr Arg Glu Ser Glu Ile Arg Val

130 135 140

Arg Leu Gln Ser Ala Ser Pro Ser Thr Arg Trp Thr Glu Leu Asp Asp

145 150 155 160

Val Lys Arg Leu Leu Lys Gly Ser Arg Ser Ala Ser Val Ser Pro Thr

165 170 175

Arg Asn Ser Ser Asn Thr Leu Pro Ile Pro Lys Lys Gly Thr Val Glu

180 185 190

Thr Lys Ile Val Thr Ala Ser Ser Gln Ser Val Ser Gly Thr Tyr Asp

195 200 205

Ala Thr Ile Leu Asp Ala Asn Leu Pro Ser His Val Trp Ser Ser Thr

210 215 220

Leu Pro Ala Gly Ser Ser Met Gly Thr Tyr His Asn Asn Met Thr Thr

225 230 235 240

Gln Ser Ser Ser Leu Leu Asn Thr Asn Ala Tyr Ser Ala Gly Ser Val

245 250 255

Phe Gly Val Pro Asn Asn Met Ala Ser Cys Ser Pro Thr Leu His Pro

260 265 270

Gly Leu Ser Thr Ser Ser Ser Val Phe Gly Met Gln Asn Asn Leu Ala

275 280 285

Pro Ser Leu Thr Thr Leu Ser His Gly Thr Thr Thr Thr Ser Thr Ala

290 295 300

Tyr Gly Val Lys Lys Asn Met Pro Gln Ser Pro Ala Ala Val Asn Thr

305 310 315 320

Gly Val Ser Thr Ser Ala Ala Cys Thr Thr Ser Val Gln Ser Asp Asp

325 330 335

Leu Leu His Lys Asp Cys Lys Phe Leu Ile Leu Glu Lys Asp Asn Thr

340 345 350

Pro Ala Lys Lys Glu Met Glu Leu Leu Ile Met Thr Lys Asp Ser Gly

355 360 365

Lys Val Phe Thr Ala Ser Pro Ala Ser Ile Ala Ala Thr Ser Phe Ser

370 375 380

Glu Asp Thr Leu Lys Lys Glu Lys Gln Ala Ala Tyr Asn Ala Asp Ser

385 390 395 400

Gly Leu Lys Ala Glu Ala Asn Gly Asp Leu Lys Thr Val Ser Thr Lys

405 410 415

Gly Lys Thr Thr Thr Ala Asp Ile His Ser Tyr Gly Ser Ser Gly Gly

420 425 430

Gly Gly Ser Gly Gly Gly Gly Gly Val Gly Gly Ala Gly Gly Gly Pro

435 440 445

Trp Gly Pro Ala Pro Ala Trp Cys Pro Cys Gly Ser Cys Cys Ser Trp

450 455 460

Trp Lys Trp Leu Leu Gly Leu Leu Leu Thr Trp Leu Leu Leu Leu Gly

465 470 475 480

Leu Leu Phe Gly Leu Ile Ala Leu Ala Glu Glu Val Arg Lys Leu Lys

485 490 495

Ala Arg Val Asp Glu Leu Glu Arg Ile Arg Arg Ser Ile Leu Pro Tyr

500 505 510

Gly Asp Ser Met Asp Arg Ile Glu Lys Asp Arg Leu Gln Gly Met Ala

515 520 525

Pro Ala Ala Gly Ala Asp Leu Asp Lys Ile Gly Leu His Ser Asp Ser

530 535 540

Gln Glu Glu Leu Trp Met Phe Val Arg Lys Lys Leu Met Met Glu Gln

545 550 555 560

Glu Asn Gly Asn Leu Arg Gly Ser Pro Gly Pro Lys Gly Asp Met Gly

565 570 575

Ser Pro Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Thr Pro Gly Ile

580 585 590

Pro Gly Pro Leu Gly His Pro Gly Pro Gln Gly Pro Lys Gly Gln Lys

595 600 605

Gly Ser Val Gly Asp Pro Gly Met Glu Gly Pro Met Gly Gln Arg Gly

610 615 620

Arg Glu Gly Pro Met Gly Pro Arg Gly Glu Ala Gly Pro Pro Gly Ser

625 630 635 640

Gly Glu Lys Gly Glu Arg Gly Ala Ala Gly Glu Pro Gly Pro His Gly

645 650 655

Pro Pro Gly Val Pro Gly Ser Val Gly Pro Lys Gly Ser Ser Gly Ser

660 665 670

Pro Gly Pro Gln Gly Pro Pro Gly Pro Val Gly Leu Gln Gly Leu Arg

675 680 685

Gly Glu Val Gly Leu Pro Gly Val Lys Gly Asp Lys Gly Pro Met Gly

690 695 700

Pro Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Pro Arg Gly Leu

705 710 715 720

Thr Gly Glu Pro Gly Met Arg Gly Leu Pro Gly Ala Val Gly Glu Pro

725 730 735

Gly Ala Lys Gly Ala Met Gly Pro Ala Gly Pro Asp Gly His Gln Gly

740 745 750

Pro Arg Gly Glu Gln Gly Leu Thr Gly Met Pro Gly Ile Arg Gly Pro

755 760 765

Pro Gly Pro Ser Gly Asp Pro Gly Lys Pro Gly Leu Thr Gly Pro Gln

770 775 780

Gly Pro Gln Gly Leu Pro Gly Thr Pro Gly Arg Pro Gly Ile Lys Gly

785 790 795 800

Glu Pro Gly Ala Pro Gly Lys Ile Val Thr Ser Glu Gly Ser Ser Met

805 810 815

Leu Thr Val Pro Gly Pro Pro Gly Pro Pro Gly Ala Met Gly Pro Pro

820 825 830

Gly Pro Pro Gly Ala Pro Gly Pro Ala Gly Pro Ala Gly Leu Pro Gly

835 840 845

His Gln Glu Val Leu Asn Leu Gln Gly Pro Pro Gly Pro Pro Gly Pro

850 855 860

Arg Gly Pro Pro Gly Pro Ser Ile Pro Gly Pro Pro Gly Pro Arg Gly

865 870 875 880

Pro Pro Gly Glu Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Ser Phe

885 890 895

Leu Ser Asn Ser Glu Thr Phe Leu Ser Gly Pro Pro Gly Pro Pro Gly

900 905 910

Pro Pro Gly Pro Lys Gly Asp Gln Gly Pro Pro Gly Pro Arg Gly His

915 920 925

Gln Gly Glu Gln Gly Leu Pro Gly Phe Ser Thr Ser Gly Ser Ser Ser

930 935 940

Phe Gly Leu Asn Leu Gln Gly Pro Pro Gly Pro Pro Gly Pro Gln Gly

945 950 955 960

Pro Lys Gly Asp Lys Gly Asp Pro Gly Val Pro Gly Ala Leu Gly Ile

965 970 975

Pro Ser Gly Pro Ser Glu Gly Gly Ser Ser Ser Thr Met Tyr Val Ser

980 985 990

Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Ser Ile Ser

995 1000 1005

Ser Ser Gly Gln Glu Ile Gln Gln Tyr Ile Ser Glu Tyr Met Gln Ser

1010 1015 1020

Asp Ser Ile Arg Ser Tyr Leu Ser Gly Val Gln Gly Pro Pro Gly Pro

1025 1030 1035 1040

Pro Gly Pro Pro Gly Pro Val Thr Thr Ile Thr Gly Glu Thr Phe Asp

1045 1050 1055

Tyr Ser Glu Leu Ala Ser His Val Val Ser Tyr Leu Arg Thr Ser Gly

1060 1065 1070

Tyr Gly Val Ser Leu Phe Ser Ser Ser Ile Ser Ser Glu Asp Ile Leu

1075 1080 1085

Ala Val Leu Gln Arg Asp Asp Val Arg Gln Tyr Leu Arg Gln Tyr Leu

1090 1095 1100

Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Gly Ala Ser Gly Asp Gly

1105 1110 1115 1120

Ser Leu Leu Ser Leu Asp Tyr Ala Glu Leu Ser Ser Arg Ile Leu Ser

1125 1130 1135

Tyr Met Ser Ser Ser Gly Ile Ser Ile Gly Leu Pro Gly Pro Pro Gly

1140 1145 1150

Pro Pro Gly Leu Pro Gly Thr Ser Tyr Glu Glu Leu Leu Ser Leu Leu

1155 1160 1165

Arg Gly Ser Glu Phe Arg Gly Ile Val Gly Pro Pro Gly Pro Pro Gly

1170 1175 1180

Pro Pro Gly Ile Pro Gly Asn Val Trp Ser Ser Ile Ser Val Glu Asp

1185 1190 1195 1200

Leu Ser Ser Tyr Leu His Thr Ala Gly Leu Ser Phe Ile Pro Gly Pro

1205 1210 1215

Pro Gly Pro Pro Gly Pro Pro Gly Pro Arg Gly Pro Pro Gly Val Ser

1220 1225 1230

Gly Ala Leu Ala Thr Tyr Ala Ala Glu Asn Ser Asp Ser Phe Arg Ser

1235 1240 1245

Glu Leu Ile Ser Tyr Leu Thr Ser Pro Asp Val Arg Ser Phe Ile Val

1250 1255 1260

Gly Pro Pro Gly Pro Pro Gly Pro Gln Gly Pro Pro Gly Asp Ser Arg

1265 1270 1275 1280

Leu Leu Ser Thr Asp Ala Ser His Ser Arg Gly Ser Ser Ser Ser Ser

1285 1290 1295

His Ser Ser Ser Val Arg Arg Gly Ser Ser Tyr Ser Ser Ser Met Ser

1300 1305 1310

Thr Gly Gly Gly Gly Ala Gly Ser Leu Gly Ala Gly Gly Ala Phe Gly

1315 1320 1325

Glu Ala Ala Gly Asp Arg Gly Pro Tyr Gly Thr Asp Ile Gly Pro Gly

1330 1335 1340

Gly Gly Tyr Gly Ala Ala Ala Glu Gly Gly Met Tyr Ala Gly Asn Gly

1345 1350 1355 1360

Gly Leu Leu Gly Ala Asp Phe Ala Gly Asp Leu Asp Tyr Asn Glu Leu

1365 1370 1375

Ala Val Arg Val Ser Glu Ser Met Gln Arg Gln Gly Leu Leu Gln Gly

1380 1385 1390

Met Ala Tyr Thr Val Gln Gly Pro Pro Gly Gln Pro Gly Pro Gln Gly

1395 1400 1405

Pro Pro Gly Ile Ser Lys Val Phe Ser Ala Tyr Ser Asn Val Thr Ala

1410 1415 1420

Asp Leu Met Asp Phe Phe Gln Thr Tyr Gly Ala Ile Gln Gly Pro Pro

1425 1430 1435 1440

Gly Gln Lys Gly Glu Met Gly Thr Pro Gly Pro Lys Gly Asp Arg Gly

1445 1450 1455

Pro Ala Gly Pro Pro Gly His Pro Gly Pro Pro Gly Pro Arg Gly His

1460 1465 1470

Lys Gly Glu Lys Gly Asp Lys Gly Asp Gln Val Tyr Ala Gly Arg Arg

1475 1480 1485

Arg Arg Arg Ser Ile Ala Val Lys Pro

1490 1495

<210> 22

<211> 148

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 22

gaattcgtcg attcggttgc agcatttaaa gcggttgaca actttaaaag aaggaaaaag 60

aaggttgaag aaaagggtgt agtaagtaag tataagtaca gaccggagaa gtacgccggt 120

cctgattcgt ttaatttgaa agaagaaa 148

<210> 23

<211> 491

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 23

gttattttcc accatattgc cgtcttttgg caatgtgagg gcccggaaac ctggccctgt 60

cttcttgacg agcattccta ggggtctttc ccctctcgcc aaaggaatgc aaggtctgtt 120

gaatgtcgtg aaggaagcag ttcctctgga agcttcttga agacaaacaa cgtctgtagc 180

gaccctttgc aggcagcgga accccccacc tggcgacagg tgcctctgcg gccaaaagcc 240

acgtgtataa gatacacctg caaaggcggc acaaccccag tgccacgttg tgagttggat 300

agttgtggaa agagtcaaat ggctcacctc aagcgtattc aacaaggggc tgaaggatgc 360

ccagaaggta ccccattgta tgggatctga tctggggcct cggtgcacat gctttacatg 420

tgtttagtcg aggttaaaaa gcgtctaggc cccccgaacc acggggacgt ggttttcctt 480

tgaaaaacac g 491

<210> 24

<211> 75

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 24

agggccaaga ggggcagcgg cgagggcagg ggcagcctgc tgacctgcgg cgacgtggag 60

gagaaccccg gcccc 75

<210> 25

<211> 66

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 25

ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60

ggacct 66

<210> 26

<211> 69

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 26

ggaagcggac agtgtactaa ttatgctctc ttgaaattgg ctggagatgt tgagagcaac 60

cctggacct 69

<210> 27

<211> 75

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 27

ggaagcggag tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60

tccaaccctg gacct 75

<210> 28

<211> 25

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 28

Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys

1 5 10 15

Gly Asp Val Glu Glu Asn Pro Gly Pro

20 25

<210> 29

<211> 22

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 29

Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val

1 5 10 15

Glu Glu Asn Pro Gly Pro

20

<210> 30

<211> 23

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 30

Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp

1 5 10 15

Val Glu Ser Asn Pro Gly Pro

20

<210> 31

<211> 25

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 31

Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala

1 5 10 15

Gly Asp Val Glu Ser Asn Pro Gly Pro

20 25

<210> 32

<211> 8565

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 32

atgttcagct tcgtggacct gagactgctg ctgctcctgg ctgctacagc cctgctgaca 60

cacggacaag aggaaggcca ggtcgaagga caggacgagg acatccctcc tatcacctgt 120

gtgcagaacg gcctgagata ccacgaccgg gatgtgtgga agcccgagcc ttgcagaatc 180

tgcgtgtgcg acaatggcaa ggtgctgtgc gacgacgtga tctgcgacga gacaaagaat 240

tgccctggcg ccgaagtgcc tgagggcgaa tgttgtcctg tgtgccctga tggcagcgag 300

agccccacag atcaagagac aacaggcgtg gaaggcccca agggcgatac aggacctaga 360

ggtcctagag gacctgccgg acctcctggc agagatggaa ttcctggaca gcctggactg 420

cccggaccac ctggacctcc agggcctcca ggtccaccag gactcggagg aaattttgcc 480

ccacagctga gctacggcta cgacgagaaa agcacaggcg gcatctctgt gcctggacct 540

atgggacctt ctggcccaag aggacttcct ggtcctcctg gtgctccagg acctcaggga 600

tttcaaggac caccaggcga acctggcgaa ccaggcgcta gtggtccaat gggaccaaga 660

ggccctcctg ggccaccagg caaaaatggc gacgatggcg aagccggaaa gcctggaagg 720

cctggcgaaa gaggcccgcc aggaccgcaa ggcgctagag ggttgcctgg aactgcagga 780

ctgcctggca tgaagggcca cagaggcttt tctggactgg atggcgctaa gggcgacgct 840

ggaccagcag gacctaaagg cgagcctgga tctcctggcg agaatggtgc acctggacag 900

atgggtccca gaggattgcc aggcgagaga ggtagacctg gcgctccggg accagccggt 960

gctagaggaa atgatggcgc aacaggtgct gctgggcctc ctggaccaac cggaccagct 1020

ggcccacctg gatttccagg cgctgttgga gcaaagggcg aagcaggccc acaaggacct 1080

aggggatctg aaggtcctca gggcgttaga ggcgagccag ggccacctgg gcctgccggt 1140

gcagctggac ctgctggaaa ccctggtgct gatggacagc caggtgccaa aggtgctaat 1200

ggcgcccctg gaattgccgg cgctccaggt tttcccggcg caagagggcc atctggacct 1260

caaggcccag gcggacctcc gggtcctaag ggaaatagcg gagagccagg cgctcctggg 1320

agtaaaggcg atactggcgc aaaaggcgaa cccggacctg tgggagttca aggacctcct 1380

ggaccagctg gcgaggaagg caaaagaggc gctaggggag aaccaggacc aacagggctc 1440

cctggtccac ctggcgagcg cggaggacct ggatctagag gattccctgg cgcagatggc 1500

gtggccggac caaaaggacc tgcaggcgaa aggggatcac caggtcctgc aggccctaag 1560

ggttctccag gcgaggctgg cagacccggc gaagctggac tcccaggtgc taagggactg 1620

acaggctcac caggatctcc cggaccagac ggaaaaacag gacctccagg accggcagga 1680

caggatggta gacccggtcc tcctggaccg cctggtgcaa gaggacaagc tggcgtgatg 1740

ggctttcctg gaccaaaagg tgcagccggc gaacctggaa aagcaggcga gaggggagtt 1800

cccggacctc caggtgctgt tggacctgcc ggaaaagatg gcgaagctgg tgcacaaggt 1860

cctccagggc cagccggacc agccggcgag agaggcgaac aaggaccagc cggatctcca 1920

ggatttcagg gactgccagg gcctgctggc ccgcctggcg aggcagggaa gccaggcgaa 1980

cagggtgttc ctggcgatct tggagcccct ggtcctagcg gagctagagg cgaaagagga 2040

tttcctggcg aaaggggcgt tcagggtcca ccgggaccag ctggaccaag gggtgcaaat 2100

ggtgccccag gcaatgacgg tgctaaaggc gacgcaggcg ccccaggtgc tcctggatct 2160

caaggcgcac ctggacttca gggaatgcct ggcgaacggg gagctgctgg acttcccggt 2220

ccaaaaggcg ataggggaga tgctggtcct aagggcgctg atggctctcc tggaaaggat 2280

ggcgtcagag gcctgacagg cccaattggc cctccgggac ctgctggcgc tccaggcgat 2340

aagggcgaat ctggacctag tggacccgct ggtcctacag gtgctagggg agccccaggc 2400

gaccggggag agcctggtcc accaggacct gctggatttg ctggacctcc tggcgctgat 2460

ggtcaacctg gtgctaaggg cgagccaggc gacgctggtg caaaaggcga cgctggtcca 2520

cctggaccgg ccggacctgc tgggccgcca ggacctattg gaaatgttgg tgcccctggc 2580

gccaaaggcg caagaggatc tgctggccca ccaggcgcta caggattccc aggtgccgct 2640

ggaagagttg gaccaccggg gccaagtgga aatgctggac caccgggacc gccaggacca 2700

gccggcaaag aaggtggaaa aggccctagg ggcgaaactg gccctgcagg caggccaggc 2760

gaagtgggcc ctccaggacc tccggggcct gccggcgaaa aaggatctcc aggcgcagat 2820

ggacccgcag gcgctcccgg aacaccaggt ccacagggaa ttgctggaca aaggggagtt 2880

gtcggcctgc caggacagag gggagagaga ggttttccag gactccctgg gccaagcgga 2940

gaacctggca aacagggacc atctggtgcc agcggagaga gagggccacc aggaccaatg 3000

ggtcctccag gattggcagg gcctcctggc gaatctggta gagaaggtgc tccaggcgcc 3060

gagggatctc ctggacgtga tggttctcct ggcgccaagg gcgatagagg cgaaacaggc 3120

ccagctggac ctccaggcgc acccggcgct ccaggcgcac caggacctgt tggccctgct 3180

ggaaaatctg gcgacagagg cgaaactgga cccgcaggac cagccggacc tgttggacct 3240

gtgggtgcta gaggacccgc tggaccacaa ggtcctagag gcgacaaggg cgaaacaggc 3300

gagcaaggcg acagaggcat caagggacac agaggattca gcggactgca gggaccacca 3360

gggccgcctg gaagtcccgg cgagcaggga ccaagcggag ctagtggtcc cgccggacct 3420

agaggaccac ctggttctgc tggtgcaccc ggaaaggacg gactgaatgg gctccccgga 3480

cctattgggc cacctggacc tagaggaaga acaggcgacg caggaccagt tggaccacct 3540

gggccacctg gaccgcctgg tcctcctgga cctccttctg ccggattcga cttcagcttc 3600

ctgcctcagc ctcctcaaga gaaggcccat gacggcggca gatattacag agccgacgac 3660

gccaacgtcg tgcgggacag agatctggaa gtggacacca cactgaagtc cctgtctcag 3720

cagatcgaga acatcagaag ccccgagggc agcagaaaga accctgccag aacctgtcgg 3780

gacctgaaga tgtgccacag cgattggaag tctggcgagt actggatcga ccccaaccag 3840

ggctgcaacc tggatgccat caaggtgttc tgcaacatgg aaaccggcga gacatgcgtg 3900

taccccacac agccatctgt ggctcagaag aactggtaca tcagcaagaa ccccaaggac 3960

aagcggcacg tttggttcgg cgagagcatg accgatggct tccagtttga gtatggcggc 4020

cagggctctg accctgccga tgttgctatc cagctgacct tcctgcggct gatgtctaca 4080

gaggccagcc agaacatcac ctaccactgc aagaacagcg tggcctacat ggatcagcag 4140

accggcaacc tgaagaaggc actgctgctt cagggcagca acgagatcga gatcagagcc 4200

gagggcaaca gccggttcac ctacagcgtg acagtggatg gctgcaccag ccatacaggc 4260

gcttggggca agaccgtgat cgagtacaag accaccaaga ccagcagact gcccatcatc 4320

gatgtggccc ctctggatgt tggggcaccc gatcaagagt tcggcttcga tgtgggccca 4380

gtgtgcttcc tgagggccaa gaggggcagc ggcgagggca ggggcagcct gctgacctgc 4440

ggcgacgtgg aggagaaccc cggccccctg agcttcgtgg acaccagaac actgctgctg 4500

ctggccgtga cactgtgtct ggccacttgt cagagcctgc aagaggaaac agtgcggaaa 4560

ggacctgccg gcgatagagg acctagaggc gaaagaggtc ctcctggacc tcctggtaga 4620

gatggcgagg atggacctac aggaccacct ggtccaccag gacctccagg gcctcctggc 4680

cttggaggaa attttgccgc tcagtacgat ggcaaaggcg tcggacttgg ccctggacct 4740

atgggactta tgggcccaag aggaccacca ggtgctgcag gcgctccagg accacaagga 4800

tttcaaggac cagctggcga gcctggcgaa cctggacaaa caggtcctgc tggtgctaga 4860

ggaccagccg ggccacctgg aaaagctggc gaagatgggc accctggaaa gcctggtaga 4920

cccggcgaaa ggggtgttgt tggacctcaa ggcgccagag gctttcctgg aacacctgga 4980

ctgcctggct tcaagggcat cagaggccac aatggcctgg acggactgaa aggacaacct 5040

ggtgctcctg gcgtgaaagg cgaaccaggc gcacctggcg aaaatggcac accaggacaa 5100

accggcgcaa gaggacttcc tggcgagaga ggaagagttg gagccccagg tccagcaggc 5160

gcacgaggat ctgatggatc tgtgggacct gttggccctg ccggacctat tggaagtgct 5220

ggccctcctg gatttcctgg cgcacccgga ccaaagggcg aaattggagc tgtgggaaac 5280

gccggacctg caggcccagc tggaccaagg ggagaagttg gattgcctgg actgagcgga 5340

ccagttgggc caccagggaa tcctggtgcc aatggactga caggcgctaa aggtgcagct 5400

ggccttccag gcgttgccgg tgcaccagga ctgccaggac caagaggtat ccctggtcct 5460

gttggagctg ctggcgctac gggtgccaga ggacttgttg gagaacctgg gccagccgga 5520

tctaagggcg agtctggaaa caagggcgag ccaggatctg ctggtccaca aggcccgcct 5580

ggaccatcag gcgaagaagg caaacgaggc cctaatggcg aagccggtag tgccgggcct 5640

cctggaccac caggccttag aggatctcct ggctctagag gattgccagg cgctgatggt 5700

agagcaggcg ttatgggtcc acctggatca agaggcgctt ctggccctgc tggcgttaga 5760

ggtccaaatg gcgacgctgg cagaccaggc gagcccggtc ttatggggcc tagagggttg 5820

cctggaagcc ctggcaatat cggcccagcc ggaaaagaag gccctgttgg actccctggc 5880

atcgacggta gacctggacc aatcggaccc gcaggcgcta ggggagagcc tggaaatatt 5940

ggcttccctg ggcctaaagg ccccacaggc gatcctggaa agaacggcga taagggccat 6000

gctggactcg ctggtgcaag gggagcacct ggacctgacg gaaacaatgg tgctcaaggg 6060

ccgcctgggc cacaaggtgt tcaaggtgga aaaggcgagc agggcccacc tgggcctcca 6120

ggcttccaag gacttcccgg accatctggg ccagcaggcg aagttggaaa gcctggcgaa 6180

agaggactgc acggcgagtt tggcttgccg ggtcctgccg gtccacgggg agagagaggc 6240

cctccaggcg aatctggcgc cgcaggacct actggcccta tcggaagcag aggacctagt 6300

ggacctccag gacctgatgg caacaaaggc gaacctggtg ttgtgggcgc tgtgggaaca 6360

gctggacctt ctggtccttc tggattgccc ggcgagcgcg gagcagctgg tattcctggt 6420

ggcaaaggcg aaaagggcga gcctggactc agaggcgaga tcggcaatcc cggacgagat 6480

ggcgctagag gcgccccagg tgcagttggt gccccgggac ctgctggcgc aacaggcgac 6540

agaggcgagg ctggtgccgc tggtcctgcc gggccagccg gtcctagagg aagtccaggc 6600

gagaggggcg aagtgggacc cgctggaccc aatggatttg ctgggcccgc tggcgctgct 6660

ggtcaacctg gcgccaaagg cgagcgggga gctaaaggtc ctaaaggcga gaatggcgtc 6720

gtgggcccta ctggaccagt gggagcagca ggccccgcag gtcctaacgg accacctgga 6780

ccagctgggt ctagaggcga cggcggaccg cctggaatga caggttttcc aggcgccgct 6840

ggaagaacag gtcctccagg accatctggc atctctggtc caccagggcc acctggtcct 6900

gctggaaaag aaggactgag aggccctagg ggcgatcagg gtccagttgg aagaaccggc 6960

gaagtcggag ctgtcggccc accaggtttt gccggcgaaa aaggccctag cggagaagct 7020

ggaactgcag gaccgccggg aactcccggt cctcaaggat tgcttggcgc ccctggaatt 7080

ctgggactgc ccggtagtcg cggagaacgt ggactcccag gtgttgctgg cgccgtcgga 7140

gaaccgggac cacttggaat tgctggacca cctggtgcaa gaggtccacc tggtgcagtt 7200

ggaagtcctg gcgttaacgg tgctccaggc gaagccggca gagatggaaa tcccggcaat 7260

gatggcccgc ctgggagaga tggacagcct ggacataagg gcgagcgagg ctacccaggc 7320

aatattggac ctgtcggcgc agccggtgct cccggacctc atggtccagt cggtccagcc 7380

gggaagcacg gaaatagggg agaaacagga ccctccggtc ctgttggccc agctggcgca 7440

gttggaccaa gaggcccatc cggacctcag ggaatccgcg gagataaggg cgaacctggc 7500

gagaagggac ctagaggact gcctgggctg aaaggccata acggactgca aggcctgcca 7560

ggcattgctg gccatcatgg cgatcaaggt gcacccggta gtgtgggtcc cgccggaccg 7620

aggggtcccg ctggtccatc tggacccgcc ggaaaagatg gcagaacagg acatcctggc 7680

acagtggggc ctgccggaat tagaggccca cagggacatc aaggccccgc tgggccgcca 7740

ggacctccgg gaccgccagg gccaccaggc gttagtggcg gaggatacga tttcggctac 7800

gacggcgact tctacagagc cgaccagcct agatctgccc ctagcctgag gcctaaggac 7860

tacgaagtgg acgccacact gaagtccctg aacaaccaga tcgagacact gctgacccct 7920

gagggcagca gaaagaaccc tgccagaacc tgcagggacc tgagactgtc tcaccccgaa 7980

tggtcctccg gctactactg gatcgacccc aatcagggct gcaccatgga cgccatcaag 8040

gtgtactgcg acttcagcac cggcgagaca tgcatcagag cccagcctga gaacatcccc 8100

gccaagaact ggtacagaag cagcaaggac aagaaacacg tgtggctggg cgagacaatc 8160

aacgccggca gccagttcga gtacaacgtg gaaggcgtga ccagcaaaga gatggccaca 8220

cagctggctt tcatgagact gctggccaat tacgccagcc agaacatcac ctaccactgc 8280

aagaacagca ttgcctacat ggacgaggaa accggcaacc tgaagaaagc cgtgatcctg 8340

cagggctcta acgacgtgga actggtggcc gagggcaaca gcagattcac ctacaccgtg 8400

ctggtggacg gctgcagcaa aaagaccaac gagtggggca agaccatcat cgagtataag 8460

accaacaagc ccagcagact gcccttcctg gatatcgccc cactggatat tggaggcgcc 8520

gaccaagagt tctttgtgga catcggcccc gtgtgcttca agtga 8565

<210> 33

<211> 8644

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 33

atgttcagct tcgtggacct gagactgctg ctgctcctgg ctgctacagc cctgctgaca 60

cacggacaag aggaaggcca ggtcgaagga caggacgagg acatccctcc tatcacctgt 120

gtgcagaacg gcctgagata ccacgaccgg gatgtgtgga agcccgagcc ttgcagaatc 180

tgcgtgtgcg acaatggcaa ggtgctgtgc gacgacgtga tctgcgacga gacaaagaat 240

tgccctggcg ccgaagtgcc tgagggcgaa tgttgtcctg tgtgccctga tggcagcgag 300

agccccacag atcaagagac aacaggcgtg gaaggcccca agggcgatac aggacctaga 360

ggtcctagag gacctgccgg acctcctggc agagatggaa ttcctggaca gcctggactg 420

cccggaccac ctggacctcc agggcctcca ggtccaccag gactcggagg aaattttgcc 480

ccacagctga gctacggcta cgacgagaaa agcacaggcg gcatctctgt gcctggacct 540

atgggacctt ctggcccaag aggacttcct ggtcctcctg gtgctccagg acctcaggga 600

tttcaaggac caccaggcga acctggcgaa ccaggcgcta gtggtccaat gggaccaaga 660

ggccctcctg ggccaccagg caaaaatggc gacgatggcg aagccggaaa gcctggaagg 720

cctggcgaaa gaggcccgcc aggaccgcaa ggcgctagag ggttgcctgg aactgcagga 780

ctgcctggca tgaagggcca cagaggcttt tctggactgg atggcgctaa gggcgacgct 840

ggaccagcag gacctaaagg cgagcctgga tctcctggcg agaatggtgc acctggacag 900

atgggtccca gaggattgcc aggcgagaga ggtagacctg gcgctccggg accagccggt 960

gctagaggaa atgatggcgc aacaggtgct gctgggcctc ctggaccaac cggaccagct 1020

ggcccacctg gatttccagg cgctgttgga gcaaagggcg aagcaggccc acaaggacct 1080

aggggatctg aaggtcctca gggcgttaga ggcgagccag ggccacctgg gcctgccggt 1140

gcagctggac ctgctggaaa ccctggtgct gatggacagc caggtgccaa aggtgctaat 1200

ggcgcccctg gaattgccgg cgctccaggt tttcccggcg caagagggcc atctggacct 1260

caaggcccag gcggacctcc gggtcctaag ggaaatagcg gagagccagg cgctcctggg 1320

agtaaaggcg atactggcgc aaaaggcgaa cccggacctg tgggagttca aggacctcct 1380

ggaccagctg gcgaggaagg caaaagaggc gctaggggag aaccaggacc aacagggctc 1440

cctggtccac ctggcgagcg cggaggacct ggatctagag gattccctgg cgcagatggc 1500

gtggccggac caaaaggacc tgcaggcgaa aggggatcac caggtcctgc aggccctaag 1560

ggttctccag gcgaggctgg cagacccggc gaagctggac tcccaggtgc taagggactg 1620

acaggctcac caggatctcc cggaccagac ggaaaaacag gacctccagg accggcagga 1680

caggatggta gacccggtcc tcctggaccg cctggtgcaa gaggacaagc tggcgtgatg 1740

ggctttcctg gaccaaaagg tgcagccggc gaacctggaa aagcaggcga gaggggagtt 1800

cccggacctc caggtgctgt tggacctgcc ggaaaagatg gcgaagctgg tgcacaaggt 1860

cctccagggc cagccggacc agccggcgag agaggcgaac aaggaccagc cggatctcca 1920

ggatttcagg gactgccagg gcctgctggc ccgcctggcg aggcagggaa gccaggcgaa 1980

cagggtgttc ctggcgatct tggagcccct ggtcctagcg gagctagagg cgaaagagga 2040

tttcctggcg aaaggggcgt tcagggtcca ccgggaccag ctggaccaag gggtgcaaat 2100

ggtgccccag gcaatgacgg tgctaaaggc gacgcaggcg ccccaggtgc tcctggatct 2160

caaggcgcac ctggacttca gggaatgcct ggcgaacggg gagctgctgg acttcccggt 2220

ccaaaaggcg ataggggaga tgctggtcct aagggcgctg atggctctcc tggaaaggat 2280

ggcgtcagag gcctgacagg cccaattggc cctccgggac ctgctggcgc tccaggcgat 2340

aagggcgaat ctggacctag tggacccgct ggtcctacag gtgctagggg agccccaggc 2400

gaccggggag agcctggtcc accaggacct gctggatttg ctggacctcc tggcgctgat 2460

ggtcaacctg gtgctaaggg cgagccaggc gacgctggtg caaaaggcga cgctggtcca 2520

cctggaccgg ccggacctgc tgggccgcca ggacctattg gaaatgttgg tgcccctggc 2580

gccaaaggcg caagaggatc tgctggccca ccaggcgcta caggattccc aggtgccgct 2640

ggaagagttg gaccaccggg gccaagtgga aatgctggac caccgggacc gccaggacca 2700

gccggcaaag aaggtggaaa aggccctagg ggcgaaactg gccctgcagg caggccaggc 2760

gaagtgggcc ctccaggacc tccggggcct gccggcgaaa aaggatctcc aggcgcagat 2820

ggacccgcag gcgctcccgg aacaccaggt ccacagggaa ttgctggaca aaggggagtt 2880

gtcggcctgc caggacagag gggagagaga ggttttccag gactccctgg gccaagcgga 2940

gaacctggca aacagggacc atctggtgcc agcggagaga gagggccacc aggaccaatg 3000

ggtcctccag gattggcagg gcctcctggc gaatctggta gagaaggtgc tccaggcgcc 3060

gagggatctc ctggacgtga tggttctcct ggcgccaagg gcgatagagg cgaaacaggc 3120

ccagctggac ctccaggcgc acccggcgct ccaggcgcac caggacctgt tggccctgct 3180

ggaaaatctg gcgacagagg cgaaactgga cccgcaggac cagccggacc tgttggacct 3240

gtgggtgcta gaggacccgc tggaccacaa ggtcctagag gcgacaaggg cgaaacaggc 3300

gagcaaggcg acagaggcat caagggacac agaggattca gcggactgca gggaccacca 3360

gggccgcctg gaagtcccgg cgagcaggga ccaagcggag ctagtggtcc cgccggacct 3420

agaggaccac ctggttctgc tggtgcaccc ggaaaggacg gactgaatgg gctccccgga 3480

cctattgggc cacctggacc tagaggaaga acaggcgacg caggaccagt tggaccacct 3540

gggccacctg gaccgcctgg tcctcctgga cctccttctg ccggattcga cttcagcttc 3600

ctgcctcagc ctcctcaaga gaaggcccat gacggcggca gatattacag agccgacgac 3660

gccaacgtcg tgcgggacag agatctggaa gtggacacca cactgaagtc cctgtctcag 3720

cagatcgaga acatcagaag ccccgagggc agcagaaaga accctgccag aacctgtcgg 3780

gacctgaaga tgtgccacag cgattggaag tctggcgagt actggatcga ccccaaccag 3840

ggctgcaacc tggatgccat caaggtgttc tgcaacatgg aaaccggcga gacatgcgtg 3900

taccccacac agccatctgt ggctcagaag aactggtaca tcagcaagaa ccccaaggac 3960

aagcggcacg tttggttcgg cgagagcatg accgatggct tccagtttga gtatggcggc 4020

cagggctctg accctgccga tgttgctatc cagctgacct tcctgcggct gatgtctaca 4080

gaggccagcc agaacatcac ctaccactgc aagaacagcg tggcctacat ggatcagcag 4140

accggcaacc tgaagaaggc actgctgctt cagggcagca acgagatcga gatcagagcc 4200

gagggcaaca gccggttcac ctacagcgtg acagtggatg gctgcaccag ccatacaggc 4260

gcttggggca agaccgtgat cgagtacaag accaccaaga ccagcagact gcccatcatc 4320

gatgtggccc ctctggatgt tggggcaccc gatcaagagt tcggcttcga tgtgggccca 4380

gtgtgcttcc tgtaagaatt cgtcgattcg gttgcagcat ttaaagcggt tgacaacttt 4440

aaaagaagga aaaagaaggt tgaagaaaag ggtgtagtaa gtaagtataa gtacagaccg 4500

gagaagtacg ccggtcctga ttcgtttaat ttgaaagaag aaaatgctga gcttcgtgga 4560

caccagaaca ctgctgctgc tggccgtgac actgtgtctg gccacttgtc agagcctgca 4620

agaggaaaca gtgcggaaag gacctgccgg cgatagagga cctagaggcg aaagaggtcc 4680

tcctggacct cctggtagag atggcgagga tggacctaca ggaccacctg gtccaccagg 4740

acctccaggg cctcctggcc ttggaggaaa ttttgccgct cagtacgatg gcaaaggcgt 4800

cggacttggc cctggaccta tgggacttat gggcccaaga ggaccaccag gtgctgcagg 4860

cgctccagga ccacaaggat ttcaaggacc agctggcgag cctggcgaac ctggacaaac 4920

aggtcctgct ggtgctagag gaccagccgg gccacctgga aaagctggcg aagatgggca 4980

ccctggaaag cctggtagac ccggcgaaag gggtgttgtt ggacctcaag gcgccagagg 5040

ctttcctgga acacctggac tgcctggctt caagggcatc agaggccaca atggcctgga 5100

cggactgaaa ggacaacctg gtgctcctgg cgtgaaaggc gaaccaggcg cacctggcga 5160

aaatggcaca ccaggacaaa ccggcgcaag aggacttcct ggcgagagag gaagagttgg 5220

agccccaggt ccagcaggcg cacgaggatc tgatggatct gtgggacctg ttggccctgc 5280

cggacctatt ggaagtgctg gccctcctgg atttcctggc gcacccggac caaagggcga 5340

aattggagct gtgggaaacg ccggacctgc aggcccagct ggaccaaggg gagaagttgg 5400

attgcctgga ctgagcggac cagttgggcc accagggaat cctggtgcca atggactgac 5460

aggcgctaaa ggtgcagctg gccttccagg cgttgccggt gcaccaggac tgccaggacc 5520

aagaggtatc cctggtcctg ttggagctgc tggcgctacg ggtgccagag gacttgttgg 5580

agaacctggg ccagccggat ctaagggcga gtctggaaac aagggcgagc caggatctgc 5640

tggtccacaa ggcccgcctg gaccatcagg cgaagaaggc aaacgaggcc ctaatggcga 5700

agccggtagt gccgggcctc ctggaccacc aggccttaga ggatctcctg gctctagagg 5760

attgccaggc gctgatggta gagcaggcgt tatgggtcca cctggatcaa gaggcgcttc 5820

tggccctgct ggcgttagag gtccaaatgg cgacgctggc agaccaggcg agcccggtct 5880

tatggggcct agagggttgc ctggaagccc tggcaatatc ggcccagccg gaaaagaagg 5940

ccctgttgga ctccctggca tcgacggtag acctggacca atcggacccg caggcgctag 6000

gggagagcct ggaaatattg gcttccctgg gcctaaaggc cccacaggcg atcctggaaa 6060

gaacggcgat aagggccatg ctggactcgc tggtgcaagg ggagcacctg gacctgacgg 6120

aaacaatggt gctcaagggc cgcctgggcc acaaggtgtt caaggtggaa aaggcgagca 6180

gggcccacct gggcctccag gcttccaagg acttcccgga ccatctgggc cagcaggcga 6240

agttggaaag cctggcgaaa gaggactgca cggcgagttt ggcttgccgg gtcctgccgg 6300

tccacgggga gagagaggcc ctccaggcga atctggcgcc gcaggaccta ctggccctat 6360

cggaagcaga ggacctagtg gacctccagg acctgatggc aacaaaggcg aacctggtgt 6420

tgtgggcgct gtgggaacag ctggaccttc tggtccttct ggattgcccg gcgagcgcgg 6480

agcagctggt attcctggtg gcaaaggcga aaagggcgag cctggactca gaggcgagat 6540

cggcaatccc ggacgagatg gcgctagagg cgccccaggt gcagttggtg ccccgggacc 6600

tgctggcgca acaggcgaca gaggcgaggc tggtgccgct ggtcctgccg ggccagccgg 6660

tcctagagga agtccaggcg agaggggcga agtgggaccc gctggaccca atggatttgc 6720

tgggcccgct ggcgctgctg gtcaacctgg cgccaaaggc gagcggggag ctaaaggtcc 6780

taaaggcgag aatggcgtcg tgggccctac tggaccagtg ggagcagcag gccccgcagg 6840

tcctaacgga ccacctggac cagctgggtc tagaggcgac ggcggaccgc ctggaatgac 6900

aggttttcca ggcgccgctg gaagaacagg tcctccagga ccatctggca tctctggtcc 6960

accagggcca cctggtcctg ctggaaaaga aggactgaga ggccctaggg gcgatcaggg 7020

tccagttgga agaaccggcg aagtcggagc tgtcggccca ccaggttttg ccggcgaaaa 7080

aggccctagc ggagaagctg gaactgcagg accgccggga actcccggtc ctcaaggatt 7140

gcttggcgcc cctggaattc tgggactgcc cggtagtcgc ggagaacgtg gactcccagg 7200

tgttgctggc gccgtcggag aaccgggacc acttggaatt gctggaccac ctggtgcaag 7260

aggtccacct ggtgcagttg gaagtcctgg cgttaacggt gctccaggcg aagccggcag 7320

agatggaaat cccggcaatg atggcccgcc tgggagagat ggacagcctg gacataaggg 7380

cgagcgaggc tacccaggca atattggacc tgtcggcgca gccggtgctc ccggacctca 7440

tggtccagtc ggtccagccg ggaagcacgg aaatagggga gaaacaggac cctccggtcc 7500

tgttggccca gctggcgcag ttggaccaag aggcccatcc ggacctcagg gaatccgcgg 7560

agataagggc gaacctggcg agaagggacc tagaggactg cctgggctga aaggccataa 7620

cggactgcaa ggcctgccag gcattgctgg ccatcatggc gatcaaggtg cacccggtag 7680

tgtgggtccc gccggaccga ggggtcccgc tggtccatct ggacccgccg gaaaagatgg 7740

cagaacagga catcctggca cagtggggcc tgccggaatt agaggcccac agggacatca 7800

aggccccgct gggccgccag gacctccggg accgccaggg ccaccaggcg ttagtggcgg 7860

aggatacgat ttcggctacg acggcgactt ctacagagcc gaccagccta gatctgcccc 7920

tagcctgagg cctaaggact acgaagtgga cgccacactg aagtccctga acaaccagat 7980

cgagacactg ctgacccctg agggcagcag aaagaaccct gccagaacct gcagggacct 8040

gagactgtct caccccgaat ggtcctccgg ctactactgg atcgacccca atcagggctg 8100

caccatggac gccatcaagg tgtactgcga cttcagcacc ggcgagacat gcatcagagc 8160

ccagcctgag aacatccccg ccaagaactg gtacagaagc agcaaggaca agaaacacgt 8220

gtggctgggc gagacaatca acgccggcag ccagttcgag tacaacgtgg aaggcgtgac 8280

cagcaaagag atggccacac agctggcttt catgagactg ctggccaatt acgccagcca 8340

gaacatcacc taccactgca agaacagcat tgcctacatg gacgaggaaa ccggcaacct 8400

gaagaaagcc gtgatcctgc agggctctaa cgacgtggaa ctggtggccg agggcaacag 8460

cagattcacc tacaccgtgc tggtggacgg ctgcagcaaa aagaccaacg agtggggcaa 8520

gaccatcatc gagtataaga ccaacaagcc cagcagactg cccttcctgg atatcgcccc 8580

actggatatt ggaggcgccg accaagagtt ctttgtggac atcggccccg tgtgcttcaa 8640

gtga 8644

<210> 34

<211> 8987

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 34

atgttcagct tcgtggacct gagactgctg ctgctcctgg ctgctacagc cctgctgaca 60

cacggacaag aggaaggcca ggtcgaagga caggacgagg acatccctcc tatcacctgt 120

gtgcagaacg gcctgagata ccacgaccgg gatgtgtgga agcccgagcc ttgcagaatc 180

tgcgtgtgcg acaatggcaa ggtgctgtgc gacgacgtga tctgcgacga gacaaagaat 240

tgccctggcg ccgaagtgcc tgagggcgaa tgttgtcctg tgtgccctga tggcagcgag 300

agccccacag atcaagagac aacaggcgtg gaaggcccca agggcgatac aggacctaga 360

ggtcctagag gacctgccgg acctcctggc agagatggaa ttcctggaca gcctggactg 420

cccggaccac ctggacctcc agggcctcca ggtccaccag gactcggagg aaattttgcc 480

ccacagctga gctacggcta cgacgagaaa agcacaggcg gcatctctgt gcctggacct 540

atgggacctt ctggcccaag aggacttcct ggtcctcctg gtgctccagg acctcaggga 600

tttcaaggac caccaggcga acctggcgaa ccaggcgcta gtggtccaat gggaccaaga 660

ggccctcctg ggccaccagg caaaaatggc gacgatggcg aagccggaaa gcctggaagg 720

cctggcgaaa gaggcccgcc aggaccgcaa ggcgctagag ggttgcctgg aactgcagga 780

ctgcctggca tgaagggcca cagaggcttt tctggactgg atggcgctaa gggcgacgct 840

ggaccagcag gacctaaagg cgagcctgga tctcctggcg agaatggtgc acctggacag 900

atgggtccca gaggattgcc aggcgagaga ggtagacctg gcgctccggg accagccggt 960

gctagaggaa atgatggcgc aacaggtgct gctgggcctc ctggaccaac cggaccagct 1020

ggcccacctg gatttccagg cgctgttgga gcaaagggcg aagcaggccc acaaggacct 1080

aggggatctg aaggtcctca gggcgttaga ggcgagccag ggccacctgg gcctgccggt 1140

gcagctggac ctgctggaaa ccctggtgct gatggacagc caggtgccaa aggtgctaat 1200

ggcgcccctg gaattgccgg cgctccaggt tttcccggcg caagagggcc atctggacct 1260

caaggcccag gcggacctcc gggtcctaag ggaaatagcg gagagccagg cgctcctggg 1320

agtaaaggcg atactggcgc aaaaggcgaa cccggacctg tgggagttca aggacctcct 1380

ggaccagctg gcgaggaagg caaaagaggc gctaggggag aaccaggacc aacagggctc 1440

cctggtccac ctggcgagcg cggaggacct ggatctagag gattccctgg cgcagatggc 1500

gtggccggac caaaaggacc tgcaggcgaa aggggatcac caggtcctgc aggccctaag 1560

ggttctccag gcgaggctgg cagacccggc gaagctggac tcccaggtgc taagggactg 1620

acaggctcac caggatctcc cggaccagac ggaaaaacag gacctccagg accggcagga 1680

caggatggta gacccggtcc tcctggaccg cctggtgcaa gaggacaagc tggcgtgatg 1740

ggctttcctg gaccaaaagg tgcagccggc gaacctggaa aagcaggcga gaggggagtt 1800

cccggacctc caggtgctgt tggacctgcc ggaaaagatg gcgaagctgg tgcacaaggt 1860

cctccagggc cagccggacc agccggcgag agaggcgaac aaggaccagc cggatctcca 1920

ggatttcagg gactgccagg gcctgctggc ccgcctggcg aggcagggaa gccaggcgaa 1980

cagggtgttc ctggcgatct tggagcccct ggtcctagcg gagctagagg cgaaagagga 2040

tttcctggcg aaaggggcgt tcagggtcca ccgggaccag ctggaccaag gggtgcaaat 2100

ggtgccccag gcaatgacgg tgctaaaggc gacgcaggcg ccccaggtgc tcctggatct 2160

caaggcgcac ctggacttca gggaatgcct ggcgaacggg gagctgctgg acttcccggt 2220

ccaaaaggcg ataggggaga tgctggtcct aagggcgctg atggctctcc tggaaaggat 2280

ggcgtcagag gcctgacagg cccaattggc cctccgggac ctgctggcgc tccaggcgat 2340

aagggcgaat ctggacctag tggacccgct ggtcctacag gtgctagggg agccccaggc 2400

gaccggggag agcctggtcc accaggacct gctggatttg ctggacctcc tggcgctgat 2460

ggtcaacctg gtgctaaggg cgagccaggc gacgctggtg caaaaggcga cgctggtcca 2520

cctggaccgg ccggacctgc tgggccgcca ggacctattg gaaatgttgg tgcccctggc 2580

gccaaaggcg caagaggatc tgctggccca ccaggcgcta caggattccc aggtgccgct 2640

ggaagagttg gaccaccggg gccaagtgga aatgctggac caccgggacc gccaggacca 2700

gccggcaaag aaggtggaaa aggccctagg ggcgaaactg gccctgcagg caggccaggc 2760

gaagtgggcc ctccaggacc tccggggcct gccggcgaaa aaggatctcc aggcgcagat 2820

ggacccgcag gcgctcccgg aacaccaggt ccacagggaa ttgctggaca aaggggagtt 2880

gtcggcctgc caggacagag gggagagaga ggttttccag gactccctgg gccaagcgga 2940

gaacctggca aacagggacc atctggtgcc agcggagaga gagggccacc aggaccaatg 3000

ggtcctccag gattggcagg gcctcctggc gaatctggta gagaaggtgc tccaggcgcc 3060

gagggatctc ctggacgtga tggttctcct ggcgccaagg gcgatagagg cgaaacaggc 3120

ccagctggac ctccaggcgc acccggcgct ccaggcgcac caggacctgt tggccctgct 3180

ggaaaatctg gcgacagagg cgaaactgga cccgcaggac cagccggacc tgttggacct 3240

gtgggtgcta gaggacccgc tggaccacaa ggtcctagag gcgacaaggg cgaaacaggc 3300

gagcaaggcg acagaggcat caagggacac agaggattca gcggactgca gggaccacca 3360

gggccgcctg gaagtcccgg cgagcaggga ccaagcggag ctagtggtcc cgccggacct 3420

agaggaccac ctggttctgc tggtgcaccc ggaaaggacg gactgaatgg gctccccgga 3480

cctattgggc cacctggacc tagaggaaga acaggcgacg caggaccagt tggaccacct 3540

gggccacctg gaccgcctgg tcctcctgga cctccttctg ccggattcga cttcagcttc 3600

ctgcctcagc ctcctcaaga gaaggcccat gacggcggca gatattacag agccgacgac 3660

gccaacgtcg tgcgggacag agatctggaa gtggacacca cactgaagtc cctgtctcag 3720

cagatcgaga acatcagaag ccccgagggc agcagaaaga accctgccag aacctgtcgg 3780

gacctgaaga tgtgccacag cgattggaag tctggcgagt actggatcga ccccaaccag 3840

ggctgcaacc tggatgccat caaggtgttc tgcaacatgg aaaccggcga gacatgcgtg 3900

taccccacac agccatctgt ggctcagaag aactggtaca tcagcaagaa ccccaaggac 3960

aagcggcacg tttggttcgg cgagagcatg accgatggct tccagtttga gtatggcggc 4020

cagggctctg accctgccga tgttgctatc cagctgacct tcctgcggct gatgtctaca 4080

gaggccagcc agaacatcac ctaccactgc aagaacagcg tggcctacat ggatcagcag 4140

accggcaacc tgaagaaggc actgctgctt cagggcagca acgagatcga gatcagagcc 4200

gagggcaaca gccggttcac ctacagcgtg acagtggatg gctgcaccag ccatacaggc 4260

gcttggggca agaccgtgat cgagtacaag accaccaaga ccagcagact gcccatcatc 4320

gatgtggccc ctctggatgt tggggcaccc gatcaagagt tcggcttcga tgtgggccca 4380

gtgtgcttcc tgtaagttat tttccaccat attgccgtct tttggcaatg tgagggcccg 4440

gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc tcgccaaagg 4500

aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt cttgaagaca 4560

aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg acaggtgcct 4620

ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac cccagtgcca 4680

cgttgtgagt tggatagttg tggaaagagt caaatggctc acctcaagcg tattcaacaa 4740

ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg ggcctcggtg 4800

cacatgcttt acatgtgttt agtcgaggtt aaaaagcgtc taggcccccc gaaccacggg 4860

gacgtggttt tcctttgaaa aacacgatgc tgagcttcgt ggacaccaga acactgctgc 4920

tgctggccgt gacactgtgt ctggccactt gtcagagcct gcaagaggaa acagtgcgga 4980

aaggacctgc cggcgataga ggacctagag gcgaaagagg tcctcctgga cctcctggta 5040

gagatggcga ggatggacct acaggaccac ctggtccacc aggacctcca gggcctcctg 5100

gccttggagg aaattttgcc gctcagtacg atggcaaagg cgtcggactt ggccctggac 5160

ctatgggact tatgggccca agaggaccac caggtgctgc aggcgctcca ggaccacaag 5220

gatttcaagg accagctggc gagcctggcg aacctggaca aacaggtcct gctggtgcta 5280

gaggaccagc cgggccacct ggaaaagctg gcgaagatgg gcaccctgga aagcctggta 5340

gacccggcga aaggggtgtt gttggacctc aaggcgccag aggctttcct ggaacacctg 5400

gactgcctgg cttcaagggc atcagaggcc acaatggcct ggacggactg aaaggacaac 5460

ctggtgctcc tggcgtgaaa ggcgaaccag gcgcacctgg cgaaaatggc acaccaggac 5520

aaaccggcgc aagaggactt cctggcgaga gaggaagagt tggagcccca ggtccagcag 5580

gcgcacgagg atctgatgga tctgtgggac ctgttggccc tgccggacct attggaagtg 5640

ctggccctcc tggatttcct ggcgcacccg gaccaaaggg cgaaattgga gctgtgggaa 5700

acgccggacc tgcaggccca gctggaccaa ggggagaagt tggattgcct ggactgagcg 5760

gaccagttgg gccaccaggg aatcctggtg ccaatggact gacaggcgct aaaggtgcag 5820

ctggccttcc aggcgttgcc ggtgcaccag gactgccagg accaagaggt atccctggtc 5880

ctgttggagc tgctggcgct acgggtgcca gaggacttgt tggagaacct gggccagccg 5940

gatctaaggg cgagtctgga aacaagggcg agccaggatc tgctggtcca caaggcccgc 6000

ctggaccatc aggcgaagaa ggcaaacgag gccctaatgg cgaagccggt agtgccgggc 6060

ctcctggacc accaggcctt agaggatctc ctggctctag aggattgcca ggcgctgatg 6120

gtagagcagg cgttatgggt ccacctggat caagaggcgc ttctggccct gctggcgtta 6180

gaggtccaaa tggcgacgct ggcagaccag gcgagcccgg tcttatgggg cctagagggt 6240

tgcctggaag ccctggcaat atcggcccag ccggaaaaga aggccctgtt ggactccctg 6300

gcatcgacgg tagacctgga ccaatcggac ccgcaggcgc taggggagag cctggaaata 6360

ttggcttccc tgggcctaaa ggccccacag gcgatcctgg aaagaacggc gataagggcc 6420

atgctggact cgctggtgca aggggagcac ctggacctga cggaaacaat ggtgctcaag 6480

ggccgcctgg gccacaaggt gttcaaggtg gaaaaggcga gcagggccca cctgggcctc 6540

caggcttcca aggacttccc ggaccatctg ggccagcagg cgaagttgga aagcctggcg 6600

aaagaggact gcacggcgag tttggcttgc cgggtcctgc cggtccacgg ggagagagag 6660

gccctccagg cgaatctggc gccgcaggac ctactggccc tatcggaagc agaggaccta 6720

gtggacctcc aggacctgat ggcaacaaag gcgaacctgg tgttgtgggc gctgtgggaa 6780

cagctggacc ttctggtcct tctggattgc ccggcgagcg cggagcagct ggtattcctg 6840

gtggcaaagg cgaaaagggc gagcctggac tcagaggcga gatcggcaat cccggacgag 6900

atggcgctag aggcgcccca ggtgcagttg gtgccccggg acctgctggc gcaacaggcg 6960

acagaggcga ggctggtgcc gctggtcctg ccgggccagc cggtcctaga ggaagtccag 7020

gcgagagggg cgaagtggga cccgctggac ccaatggatt tgctgggccc gctggcgctg 7080

ctggtcaacc tggcgccaaa ggcgagcggg gagctaaagg tcctaaaggc gagaatggcg 7140

tcgtgggccc tactggacca gtgggagcag caggccccgc aggtcctaac ggaccacctg 7200

gaccagctgg gtctagaggc gacggcggac cgcctggaat gacaggtttt ccaggcgccg 7260

ctggaagaac aggtcctcca ggaccatctg gcatctctgg tccaccaggg ccacctggtc 7320

ctgctggaaa agaaggactg agaggcccta ggggcgatca gggtccagtt ggaagaaccg 7380

gcgaagtcgg agctgtcggc ccaccaggtt ttgccggcga aaaaggccct agcggagaag 7440

ctggaactgc aggaccgccg ggaactcccg gtcctcaagg attgcttggc gcccctggaa 7500

ttctgggact gcccggtagt cgcggagaac gtggactccc aggtgttgct ggcgccgtcg 7560

gagaaccggg accacttgga attgctggac cacctggtgc aagaggtcca cctggtgcag 7620

ttggaagtcc tggcgttaac ggtgctccag gcgaagccgg cagagatgga aatcccggca 7680

atgatggccc gcctgggaga gatggacagc ctggacataa gggcgagcga ggctacccag 7740

gcaatattgg acctgtcggc gcagccggtg ctcccggacc tcatggtcca gtcggtccag 7800

ccgggaagca cggaaatagg ggagaaacag gaccctccgg tcctgttggc ccagctggcg 7860

cagttggacc aagaggccca tccggacctc agggaatccg cggagataag ggcgaacctg 7920

gcgagaaggg acctagagga ctgcctgggc tgaaaggcca taacggactg caaggcctgc 7980

caggcattgc tggccatcat ggcgatcaag gtgcacccgg tagtgtgggt cccgccggac 8040

cgaggggtcc cgctggtcca tctggacccg ccggaaaaga tggcagaaca ggacatcctg 8100

gcacagtggg gcctgccgga attagaggcc cacagggaca tcaaggcccc gctgggccgc 8160

caggacctcc gggaccgcca gggccaccag gcgttagtgg cggaggatac gatttcggct 8220

acgacggcga cttctacaga gccgaccagc ctagatctgc ccctagcctg aggcctaagg 8280

actacgaagt ggacgccaca ctgaagtccc tgaacaacca gatcgagaca ctgctgaccc 8340

ctgagggcag cagaaagaac cctgccagaa cctgcaggga cctgagactg tctcaccccg 8400

aatggtcctc cggctactac tggatcgacc ccaatcaggg ctgcaccatg gacgccatca 8460

aggtgtactg cgacttcagc accggcgaga catgcatcag agcccagcct gagaacatcc 8520

ccgccaagaa ctggtacaga agcagcaagg acaagaaaca cgtgtggctg ggcgagacaa 8580

tcaacgccgg cagccagttc gagtacaacg tggaaggcgt gaccagcaaa gagatggcca 8640

cacagctggc tttcatgaga ctgctggcca attacgccag ccagaacatc acctaccact 8700

gcaagaacag cattgcctac atggacgagg aaaccggcaa cctgaagaaa gccgtgatcc 8760

tgcagggctc taacgacgtg gaactggtgg ccgagggcaa cagcagattc acctacaccg 8820

tgctggtgga cggctgcagc aaaaagacca acgagtgggg caagaccatc atcgagtata 8880

agaccaacaa gcccagcaga ctgcccttcc tggatatcgc cccactggat attggaggcg 8940

ccgaccaaga gttctttgtg gacatcggcc ccgtgtgctt caagtga 8987

<210> 35

<211> 7434

<212> DNA

<213> 智人(Homo sapiens)

<400> 35

atgcttaggg gtccggggcc cgggctgctg ctgctggccg tccagtgcct ggggacagcg 60

gtgccctcca cgggagcctc gaagagcaag aggcaggctc agcaaatggt tcagccccag 120

tccccggtgg ctgtcagtca aagcaagccc ggttgttatg acaatggaaa acactatcag 180

ataaatcaac agtgggagcg gacctaccta ggcaatgcgt tggtttgtac ttgttatgga 240

ggaagccgag gttttaactg cgagagtaaa cctgaagctg aagagacttg ctttgacaag 300

tacactggga acacttaccg agtgggtgac acttatgagc gtcctaaaga ctccatgatc 360

tgggactgta cctgcatcgg ggctgggcga gggagaataa gctgtaccat cgcaaaccgc 420

tgccatgaag ggggtcagtc ctacaagatt ggtgacacct ggaggagacc acatgagact 480

ggtggttaca tgttagagtg tgtgtgtctt ggtaatggaa aaggagaatg gacctgcaag 540

cccatagctg agaagtgttt tgatcatgct gctgggactt cctatgtggt cggagaaacg 600

tgggagaagc cctaccaagg ctggatgatg gtagattgta cttgcctggg agaaggcagc 660

ggacgcatca cttgcacttc tagaaataga tgcaacgatc aggacacaag gacatcctat 720

agaattggag acacctggag caagaaggat aatcgaggaa acctgctcca gtgcatctgc 780

acaggcaacg gccgaggaga gtggaagtgt gagaggcaca cctctgtgca gaccacatcg 840

agcggatctg gccccttcac cgatgttcgt gcagctgttt accaaccgca gcctcacccc 900

cagcctcctc cctatggcca ctgtgtcaca gacagtggtg tggtctactc tgtggggatg 960

cagtggctga agacacaagg aaataagcaa atgctttgca cgtgcctggg caacggagtc 1020

agctgccaag agacagctgt aacccagact tacggtggca actcaaatgg agagccatgt 1080

gtcttaccat tcacctacaa tggcaggacg ttctactcct gcaccacaga agggcgacag 1140

gacggacatc tttggtgcag cacaacttcg aattatgagc aggaccagaa atactctttc 1200

tgcacagacc acactgtttt ggttcagact cgaggaggaa attccaatgg tgccttgtgc 1260

cacttcccct tcctatacaa caaccacaat tacactgatt gcacttctga gggcagaaga 1320

gacaacatga agtggtgtgg gaccacacag aactatgatg ccgaccagaa gtttgggttc 1380

tgccccatgg ctgcccacga ggaaatctgc acaaccaatg aaggggtcat gtaccgcatt 1440

ggagatcagt gggataagca gcatgacatg ggtcacatga tgaggtgcac gtgtgttggg 1500

aatggtcgtg gggaatggac atgcattgcc tactcgcagc ttcgagatca gtgcattgtt 1560

gatgacatca cttacaatgt gaacgacaca ttccacaagc gtcatgaaga ggggcacatg 1620

ctgaactgta catgcttcgg tcagggtcgg ggcaggtgga agtgtgatcc cgtcgaccaa 1680

tgccaggatt cagagactgg gacgttttat caaattggag attcatggga gaagtatgtg 1740

catggtgtca gataccagtg ctactgctat ggccgtggca ttggggagtg gcattgccaa 1800

cctttacaga cctatccaag ctcaagtggt cctgtcgaag tatttatcac tgagactccg 1860

agtcagccca actcccaccc catccagtgg aatgcaccac agccatctca catttccaag 1920

tacattctca ggtggagacc taaaaattct gtaggccgtt ggaaggaagc taccatacca 1980

ggccacttaa actcctacac catcaaaggc ctgaagcctg gtgtggtata cgagggccag 2040

ctcatcagca tccagcagta cggccaccaa gaagtgactc gctttgactt caccaccacc 2100

agcaccagca cacctgtgac cagcaacacc gtgacaggag agacgactcc cttttctcct 2160

cttgtggcca cttctgaatc tgtgaccgaa atcacagcca gtagctttgt ggtctcctgg 2220

gtctcagctt ccgacaccgt gtcgggattc cgggtggaat atgagctgag tgaggaggga 2280

gatgagccac agtacctgga tcttccaagc acagccactt ctgtgaacat ccctgacctg 2340

cttcctggcc gaaaatacat tgtaaatgtc tatcagatat ctgaggatgg ggagcagagt 2400

ttgatcctgt ctacttcaca aacaacagcg cctgatgccc ctcctgaccc gactgtggac 2460

caagttgatg acacctcaat tgttgttcgc tggagcagac cccaggctcc catcacaggg 2520

tacagaatag tctattcgcc atcagtagaa ggtagcagca cagaactcaa ccttcctgaa 2580

actgcaaact ccgtcaccct cagtgacttg caacctggtg ttcagtataa catcactatc 2640

tatgctgtgg aagaaaatca agaaagtaca cctgttgtca ttcaacaaga aaccactggc 2700

accccacgct cagatacagt gccctctccc agggacctgc agtttgtgga agtgacagac 2760

gtgaaggtca ccatcatgtg gacaccgcct gagagtgcag tgaccggcta ccgtgtggat 2820

gtgatccccg tcaacctgcc tggcgagcac gggcagaggc tgcccatcag caggaacacc 2880

tttgcagaag tcaccgggct gtcccctggg gtcacctatt acttcaaagt ctttgcagtg 2940

agccatggga gggagagcaa gcctctgact gctcaacaga caaccaaact ggatgctccc 3000

actaacctcc agtttgtcaa tgaaactgat tctactgtcc tggtgagatg gactccacct 3060

cgggcccaga taacaggata ccgactgacc gtgggcctta cccgaagagg acagcccagg 3120

cagtacaatg tgggtccctc tgtctccaag tacccactga ggaatctgca gcctgcatct 3180

gagtacaccg tatccctcgt ggccataaag ggcaaccaag agagccccaa agccactgga 3240

gtctttacca cactgcagcc tgggagctct attccacctt acaacaccga ggtgactgag 3300

accaccattg tgatcacatg gacgcctgct ccaagaattg gttttaagct gggtgtacga 3360

ccaagccagg gaggagaggc accacgagaa gtgacttcag actcaggaag catcgttgtg 3420

tccggcttga ctccaggagt agaatacgtc tacaccatcc aagtcctgag agatggacag 3480

gaaagagatg cgccaattgt aaacaaagtg gtgacaccat tgtctccacc aacaaacttg 3540

catctggagg caaaccctga cactggagtg ctcacagtct cctgggagag gagcaccacc 3600

ccagacatta ctggttatag aattaccaca acccctacaa acggccagca gggaaattct 3660

ttggaagaag tggtccatgc tgatcagagc tcctgcactt ttgataacct gagtcccggc 3720

ctggagtaca atgtcagtgt ttacactgtc aaggatgaca aggaaagtgt ccctatctct 3780

gataccatca tcccagaggt gccccaactc actgacctaa gctttgttga tataaccgat 3840

tcaagcatcg gcctgaggtg gaccccgcta aactcttcca ccattattgg gtaccgcatc 3900

acagtagttg cggcaggaga aggtatccct atttttgaag attttgtgga ctcctcagta 3960

ggatactaca cagtcacagg gctggagccg ggcattgact atgatatcag cgttatcact 4020

ctcattaatg gcggcgagag tgcccctact acactgacac aacaaacggc tgttcctcct 4080

cccactgacc tgcgattcac caacattggt ccagacacca tgcgtgtcac ctgggctcca 4140

cccccatcca ttgatttaac caacttcctg gtgcgttact cacctgtgaa aaatgaggaa 4200

gatgttgcag agttgtcaat ttctccttca gacaatgcag tggtcttaac aaatctcctg 4260

cctggtacag aatatgtagt gagtgtctcc agtgtctacg aacaacatga gagcacacct 4320

cttagaggaa gacagaaaac aggtcttgat tccccaactg gcattgactt ttctgatatt 4380

actgccaact cttttactgt gcactggatt gctcctcgag ccaccatcac tggctacagg 4440

atccgccatc atcccgagca cttcagtggg agacctcgag aagatcgggt gccccactct 4500

cggaattcca tcaccctcac caacctcact ccaggcacag agtatgtggt cagcatcgtt 4560

gctcttaatg gcagagagga aagtccctta ttgattggcc aacaatcaac agtttctgat 4620

gttccgaggg acctggaagt tgttgctgcg acccccacca gcctactgat cagctgggat 4680

gctcctgctg tcacagtgag atattacagg atcacttacg gagagacagg aggaaatagc 4740

cctgtccagg agttcactgt gcctgggagc aagtctacag ctaccatcag cggccttaaa 4800

cctggagttg attataccat cactgtgtat gctgtcactg gccgtggaga cagccccgca 4860

agcagcaagc caatttccat taattaccga acagaaattg acaaaccatc ccagatgcaa 4920

gtgaccgatg ttcaggacaa cagcattagt gtcaagtggc tgccttcaag ttcccctgtt 4980

actggttaca gagtaaccac cactcccaaa aatggaccag gaccaacaaa aactaaaact 5040

gcaggtccag atcaaacaga aatgactatt gaaggcttgc agcccacagt ggagtatgtg 5100

gttagtgtct atgctcagaa tccaagcgga gagagtcagc ctctggttca gactgcagta 5160

accaacattg atcgccctaa aggactggca ttcactgatg tggatgtcga ttccatcaaa 5220

attgcttggg aaagcccaca ggggcaagtt tccaggtaca gggtgaccta ctcgagccct 5280

gaggatggaa tccatgagct attccctgca cctgatggtg aagaagacac tgcagagctg 5340

caaggcctca gaccgggttc tgagtacaca gtcagtgtgg ttgccttgca cgatgatatg 5400

gagagccagc ccctgattgg aacccagtcc acagctattc ctgcaccaac tgacctgaag 5460

ttcactcagg tcacacccac aagcctgagc gcccagtgga caccacccaa tgttcagctc 5520

actggatatc gagtgcgggt gacccccaag gagaagaccg gaccaatgaa agaaatcaac 5580

cttgctcctg acagctcatc cgtggttgta tcaggactta tggtggccac caaatatgaa 5640

gtgagtgtct atgctcttaa ggacactttg acaagcagac cagctcaggg agttgtcacc 5700

actctggaga atgtcagccc accaagaagg gctcgtgtga cagatgctac tgagaccacc 5760

atcaccatta gctggagaac caagactgag acgatcactg gcttccaagt tgatgccgtt 5820

ccagccaatg gccagactcc aatccagaga accatcaagc cagatgtcag aagctacacc 5880

atcacaggtt tacaaccagg cactgactac aagatctacc tgtacacctt gaatgacaat 5940

gctcggagct cccctgtggt catcgacgcc tccactgcca ttgatgcacc atccaacctg 6000

cgtttcctgg ccaccacacc caattccttg ctggtatcat ggcagccgcc acgtgccagg 6060

attaccggct acatcatcaa gtatgagaag cctgggtctc ctcccagaga agtggtccct 6120

cggccccgcc ctggtgtcac agaggctact attactggcc tggaaccggg aaccgaatat 6180

acaatttatg tcattgccct gaagaataat cagaagagcg agcccctgat tggaaggaaa 6240

aagacagacg agcttcccca actggtaacc cttccacacc ccaatcttca tggaccagag 6300

atcttggatg ttccttccac agttcaaaag acccctttcg tcacccaccc tgggtatgac 6360

actggaaatg gtattcagct tcctggcact tctggtcagc aacccagtgt tgggcaacaa 6420

atgatctttg aggaacatgg ttttaggcgg accacaccgc ccacaacggc cacccccata 6480

aggcataggc caagaccata cccgccgaat gtaggtgagg aaatccaaat tggtcacatc 6540

cccagggaag atgtagacta tcacctgtac ccacacggtc cgggactcaa tccaaatgcc 6600

tctacaggac aagaagctct ctctcagaca accatctcat gggccccatt ccaggacact 6660

tctgagtaca tcatttcatg tcatcctgtt ggcactgatg aagaaccctt acagttcagg 6720

gttcctggaa cttctaccag tgccactctg acaggcctca ccagaggtgc cacctacaac 6780

atcatagtgg aggcactgaa agaccagcag aggcataagg ttcgggaaga ggttgttacc 6840

gtgggcaact ctgtcaacga aggcttgaac caacctacgg atgactcgtg ctttgacccc 6900

tacacagttt cccattatgc cgttggagat gagtgggaac gaatgtctga atcaggcttt 6960

aaactgttgt gccagtgctt aggctttgga agtggtcatt tcagatgtga ttcatctaga 7020

tggtgccatg acaatggtgt gaactacaag attggagaga agtgggaccg tcagggagaa 7080

aatggccaga tgatgagctg cacatgtctt gggaacggaa aaggagaatt caagtgtgac 7140

cctcatgagg caacgtgtta tgatgatggg aagacatacc acgtaggaga acagtggcag 7200

aaggaatatc tcggtgccat ttgctcctgc acatgctttg gaggccagcg gggctggcgc 7260

tgtgacaact gccgcagacc tgggggtgaa cccagtcccg aaggcactac tggccagtcc 7320

tacaaccagt attctcagag ataccatcag agaacaaaca ctaatgttaa ttgcccaatt 7380

gagtgcttca tgcctttaga tgtacaggct gacagagaag attcccgaga gtaa 7434

<210> 36

<211> 7434

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 36

atgctgagag gacctggacc aggactgctg ctgctggctg ttcagtgtct gggaacagcc 60

gtgcctagca caggcgccag caagtctaaa agacaggccc agcagatggt gcagcctcag 120

tctcctgtgg ccgtgtctca gtctaagccc ggctgctacg acaacggcaa gcactaccag 180

atcaaccagc agtgggagag aacctacctg ggcaacgccc tcgtgtgtac atgttacggc 240

ggcagcagag gcttcaactg cgagtctaaa cccgaggccg aggaaacctg cttcgacaag 300

tacaccggca acacctacag agtgggcgac acctacgaga ggcccaagga cagcatgatc 360

tgggactgca catgtatcgg agccggcaga ggcagaatca gctgcacaat cgccaaccgg 420

tgtcacgaag gcggccagag ctataagatc ggcgacactt ggagaaggcc ccacgagaca 480

ggcggctaca tgctggaatg cgtgtgtctc ggcaacggca aaggcgagtg gacctgcaag 540

cctatcgccg agaagtgctt cgatcatgcc gccggaacaa gctacgtcgt gggcgagaca 600

tgggagaagc cttaccaagg ctggatgatg gtggactgta cctgcctcgg cgaaggcagc 660

ggaagaatca cctgtaccag ccggaaccgg tgcaacgacc aggataccag aaccagctac 720

cggatcggcg atacctggtc caagaaggac aaccggggca acctgctgca gtgcatctgt 780

accggaaatg gaagaggcga atggaagtgc gagcggcaca caagcgtgca gacaacatct 840

tctggcagcg gcccctttac cgatgtgcgg gctgctgttt atcagcccca gcctcatcct 900

cagcctccac cttatggcca ctgcgtgaca gatagcggcg tggtgtatag cgtgggcatg 960

cagtggctga aaacccaggg caacaagcag atgctgtgca catgcctcgg caatggcgtg 1020

tcctgccaag agacagccgt gacacagacc tatggcggca atagcaatgg cgagccttgc 1080

gtgctgccct tcacctacaa tggccggacc ttctacagct gcaccaccga gggtagacag 1140

gacggacacc tgtggtgtag caccaccagc aactacgagc aggaccagaa gtacagcttc 1200

tgcaccgacc acaccgtgct ggtgcaaacc agaggcggca attctaacgg cgccctgtgt 1260

cacttcccct ttctgtacaa caaccacaac tacaccgact gcacctccga aggcagacgg 1320

gacaacatga agtggtgcgg cacaacccag aactacgacg ccgatcagaa gttcggcttc 1380

tgtcccatgg ccgctcacga ggaaatctgt accaccaacg aaggcgtgat gtacagaatc 1440

ggcgaccagt gggacaagca gcacgacatg ggccacatga tgcggtgtac ctgcgttggc 1500

aatggtcgcg gagagtggac atgcattgcc tacagccagc tgcgggacca gtgcatcgtg 1560

gacgacatca catacaacgt gaacgacacc ttccacaagc ggcacgaaga gggacacatg 1620

ctgaactgca cctgtttcgg ccaaggcaga ggccggtgga agtgtgatcc tgtggatcag 1680

tgccaggaca gcgaaaccgg caccttttac cagatcggag actcctggga gaaatacgtg 1740

cacggcgtgc gctaccagtg ctactgttac ggcagaggaa ttggcgagtg gcactgtcag 1800

cccctgcaga cataccctag ctctagcgga cctgtcgagg tgttcatcac cgagacaccc 1860

agccagccta actctcaccc catccagtgg aatgcccctc agcctagcca catcagcaag 1920

tacatcctga gatggcggcc caagaactcc gtcggcagat ggaaagaggc caccattcct 1980

ggccacctga acagctacac catcaaggga ctgaagcccg gcgtggtcta tgagggccag 2040

ctgatctcta tccagcagta cggccaccaa gaagtgacca gattcgactt caccaccacc 2100

tccaccagca cacccgtgac cagcaatacc gtgaccggcg agacaacccc tttctctcca 2160

ctggtggcca caagcgagag cgtgaccgag attaccgcca gcagctttgt ggtgtcttgg 2220

gtgtccgcca gcgatacagt gtccggcttc agagtggaat acgagctgag cgaggaaggc 2280

gacgagcccc agtatctgga tctgccaagc accgccacca gcgtgaacat ccctgatctg 2340

ctgcccggca gaaagtacat cgtgaacgtg taccagatct ccgaggacgg cgagcagagc 2400

ctgatcctga gcacaagcca gacaacagcc cctgacgctc ctcctgatcc taccgttgat 2460

caggtggacg ataccagcat cgtcgtgcgg tggtcaagac cccaggctcc tatcaccggc 2520

tacaggatcg tgtacagccc tagcgtggaa ggcagcagca ccgagctgaa tctgcccgag 2580

acagccaata gcgtgaccct gtctgatctg cagcctggcg tgcagtacaa tatcaccatc 2640

tacgccgtgg aagagaatca agagtctacc cctgtggtca tccagcaaga gacaaccggc 2700

actcccagat ccgacaccgt tccatctcca cgggatctgc agttcgtgga agtgaccgac 2760

gtgaaagtga caatcatgtg gaccccacct gagagcgccg tgacaggcta tagagtggac 2820

gtgatccccg tgaacctgcc aggcgaacat ggacagagac tgcccatcag cagaaacacc 2880

tttgccgaag tgacaggact gtcccctggc gtgacctact acttcaaggt gttcgctgtg 2940

tcccacggca gagagagcaa acctctgaca gctcagcaga ccaccaagct ggacgcccct 3000

accaacctgc agtttgtgaa cgagacagac agcacagtgc ttgtgcggtg gacccctcca 3060

agagcacaga tcacaggata ccggctgacc gtgggcctga ccagaagagg acagcccaga 3120

cagtacaacg tgggccccag cgtgtccaag tatcccctga gaaatctcca gcctgccagc 3180

gagtacaccg tgtctctggt ggctatcaag ggcaatcaag agagccctaa ggccaccggc 3240

gtgttcacta cactgcagcc cggaagcagc atccctccat acaacacaga agtgactgaa 3300

accaccatcg tgatcacctg gacacccgct cctcggatcg gctttaagct gggcgtcaga 3360

ccttctcaag gcggcgaagc tcccagagaa gtgacaagcg atagcggcag catcgtggtg 3420

tctggactga caccaggcgt ggaatatgtg tacaccatcc aggtgctgcg cgacggccaa 3480

gaaagggatg cccctatcgt gaacaaggtg gtcacccctc tgagcccacc aacaaacctg 3540

cacctggaag ccaatcctga taccggcgtg ctgactgtgt cctgggaaag aagcaccaca 3600

cctgacatta ccggctatcg gatcaccaca acacccacca atggccagca gggcaactcc 3660

ctggaagagg tggtgcatgc cgatcagtcc agctgtacct tcgacaatct gagccctggc 3720

ctcgagtaca atgtgtccgt gtacacagtg aaggacgaca aagaaagcgt gcccatctcc 3780

gacacaatca tccctgaggt gccccagctg accgacctga gcttcgtgga tatcaccgac 3840

agcagcatcg gcctgaggtg gacacctctg aactcctcta ccatcatcgg atacagaatc 3900

accgtggtgg ccgctggcga gggcatccca atcttcgagg actttgtgga cagcagcgtg 3960

ggctactaca ccgtgactgg actggaaccc ggcatcgact acgacatcag cgtcatcacc 4020

ctgatcaatg gcggcgagag cgcccctaca acactgacac aacagactgc cgtgcctcct 4080

cctaccgatc tgcggttcac aaatatcggc cccgacacca tgagagtgac ttgggctcct 4140

ccaccaagta tcgacctgac caacttcctc gtgcggtaca gccccgtgaa gaacgaggaa 4200

gatgtggccg agctgtccat ctctcccagc gataatgccg tggtgctgac caatctgctc 4260

cccggaacag agtacgtggt gtccgttagc agcgtgtacg aacagcacga gagcacaccc 4320

ctgcggggca gacaaaaaac aggcctggat agccccaccg gaatcgactt cagcgatatc 4380

acagccaaca gcttcaccgt gcattggatc gcccctagag ccaccatcac cgggtataga 4440

atccggcatc accccgagca cttcagcggc agacctagag aagatagagt gccccactcc 4500

agaaacagca tcaccctcac caatctgaca cccggcaccg aatatgtggt gtccatcgtg 4560

gccctgaacg gcagggaaga gtctcctctg ctgatcggcc agcagagcac agtgtctgac 4620

gtgcccagag atctggaagt ggtggctgcc acacctacca gcctgctgat tagctgggat 4680

gctcctgctg tgacagtgcg gtattaccgg atcacctacg gcgagactgg cggcaactct 4740

cccgtgcaag agtttacagt gcctggcagc aagagcaccg ctaccatctc tggactcaag 4800

ccaggcgtcg actacaccat taccgtgtac gctgtgaccg gcaggggcga ttctcctgcc 4860

tcttctaagc ctatcagcat caactaccgg accgagatcg acaagccaag ccagatgcaa 4920

gtgacagatg tgcaggacaa cagcatctcc gtgaagtggc tgcctagcag ctctccagtg 4980

accgggtaca gagtgaccac cacaccaaag aacggccctg gacctaccaa gaccaagacc 5040

gctggacctg atcagaccga gatgaccatt gagggcctgc agcctaccgt cgagtatgtc 5100

gtgtctgtgt acgcccagaa tcctagcggc gagtctcagc ctcttgtgca gaccgccgtg 5160

accaacatcg acagacctaa aggcctggcc ttcaccgacg tggacgtgga ctctatcaag 5220

atcgcctggg agtcccctca gggccaagtg tccagatata gagtgaccta cagctcccct 5280

gaggacggca tccacgagct gtttccagca ccagacggcg aagaggatac cgccgaactg 5340

caaggactga ggcctggctc cgagtataca gtctcagtgg tggccctgca cgacgacatg 5400

gaaagccagc ctctgatcgg aacccagtcc accgctattc ccgctcctac agacctgaag 5460

ttcacccaag tgaccccaac cagcctgagc gcacaatgga ctcctccaaa cgtccagctg 5520

actggttata gagtgcgcgt gacacccaaa gaaaagactg gccccatgaa ggaaatcaat 5580

ctggcccctg actccagctc cgtggttgtg tctggtctta tggtggctac caaatacgag 5640

gtttccgtgt atgccctgaa ggacaccctg acctccagac ctgcacaggg cgttgtgacc 5700

acactggaaa acgtgtcccc acctcggaga gccagagtga cagacgccac cgaaaccaca 5760

atcaccattt cttggcggac caagacagag acaatcaccg gattccaggt cgacgccgtg 5820

cctgccaatg gacagacacc tatccagcgg accatcaagc ctgacgtgcg gagctacaca 5880

atcacaggcc tgcaacctgg caccgactac aagatctacc tgtacaccct gaacgacaac 5940

gcccgctcta gccccgtggt tatcgatgcc tctaccgcca tcgacgcccc aagcaatctg 6000

agatttctgg ccacaactcc caacagtctg ctcgtgtctt ggcagcctcc tcgggccaga 6060

atcactggct acatcattaa gtacgagaag ccaggcagcc ctcctagaga ggtggtccct 6120

agacctagac ctggcgtcac agaggccaca attaccggac tcgagcccgg cactgagtac 6180

acaatctacg tgatcgccct gaagaacaac cagaagtccg agccactgat tggccggaag 6240

aaaaccgacg agctgcctca gctggtcacc ctgcctcatc caaatctgca cggccccgag 6300

atcctggatg tgccatctac cgtgcagaaa accccatttg tgacacaccc cggctacgac 6360

accggaaacg gaattcagct gcctggaacc tctgggcagc agccttctgt gggacagcag 6420

atgatctttg aggaacacgg cttccggcgg accacacctc ctacaacagc cacaccaatc 6480

aggcacagac cccggcctta tcctcctaac gtgggcgaag agattcagat cggacacatc 6540

cccagagagg atgtcgacta ccacctgtat cctcacggcc caggactgaa ccctaatgcc 6600

agcacaggac aagaggccct gagccagacc actatcagct gggctccatt ccaggacacc 6660

tccgagtaca tcatctcttg tcaccccgtg ggcaccgacg aggaaccact gcaattcaga 6720

gtgcccggca cctctaccag cgccacactt acaggactga ctagaggcgc cacctataac 6780

atcatcgtgg aagccctgaa agaccagcag cggcacaaag tgcgcgaaga ggttgtgact 6840

gtgggcaatt ccgtgaacga gggcctgaat cagcccaccg acgacagctg ctttgacccc 6900

tacacagtgt cccactatgc cgtgggagat gagtgggaac gcatgtccga gagcggcttc 6960

aagctgctct gtcagtgcct cggctttggc tccggccact tcagatgcga tagctccagg 7020

tggtgccacg ataacggcgt gaactacaaa atcggagaga agtgggacag acagggcgag 7080

aacggccaga tgatgagctg cacttgtctc ggaaatggaa agggcgagtt caagtgcgac 7140

cctcacgagg ccacctgtta cgacgatggc aagacctacc acgtgggaga gcagtggcag 7200

aaagagtacc tgggcgccat ctgtagctgc acatgctttg gcgggcagcg cggctggcgc 7260

tgtgataatt gccgtagacc aggcggcgag ccatctcctg agggaacaac aggccagtcc 7320

tacaaccagt acagccagag ataccaccag cgcaccaaca ccaatgtgaa ctgccccatc 7380

gagtgcttca tgcccctgga cgtgcaggcc gacagggaag attctagaga gtga 7434

<210> 37

<211> 2361

<212> DNA

<213> 智人(Homo sapiens)

<400> 37

atggcgggtc tgacggcggc ggccccgcgg cccggagtcc tcctgctcct gctgtccatc 60

ctccacccct ctcggcctgg aggggtccct ggggccattc ctggtggagt tcctggagga 120

gtcttttatc caggggctgg tctcggagcc cttggaggag gagcgctggg gcctggaggc 180

aaacctctta agccagttcc cggagggctt gcgggtgctg gccttggggc agggctcggc 240

gccttccccg cagttacctt tccgggggct ctggtgcctg gtggagtggc tgacgctgct 300

gcagcctata aagctgctaa ggctggcgct gggcttggtg gtgtcccagg agttggtggc 360

ttaggagtgt ctgcaggtgc ggtggttcct cagcctggag ccggagtgaa gcctgggaaa 420

gtgccgggtg tggggctgcc aggtgtatac ccaggtggcg tgctcccagg agctcggttc 480

cccggtgtgg gggtgctccc tggagttccc actggagcag gagttaagcc caaggctcca 540

ggtgtaggtg gagcttttgc tggaatccca ggagttggac cctttggggg accgcaacct 600

ggagtcccac tggggtatcc catcaaggcc cccaagctgc ctggtggcta tggactgccc 660

tacaccacag ggaaactgcc ctatggctat gggcccggag gagtggctgg tgcagcgggc 720

aaggctggtt acccaacagg gacaggggtt ggcccccagg cagcagcagc agcggcagct 780

aaagcagcag caaagttcgg tgctggagca gccggagtcc tccctggtgt tggaggggct 840

ggtgttcctg gcgtgcctgg ggcaattcct ggaattggag gcatcgcagg cgttgggact 900

ccagctgcag ctgcagctgc agcagcagcc gctaaggcag ccaagtatgg agctgctgca 960

ggcttagtgc ctggtgggcc aggctttggc ccgggagtag ttggtgtccc aggagctggc 1020

gttccaggtg ttggtgtccc aggagctggg attccagttg tcccaggtgc tgggatccca 1080

ggtgctgcgg ttccaggggt tgtgtcacca gaagcagctg ctaaggcagc tgcaaaggca 1140

gccaaatacg gggccaggcc cggagtcgga gttggaggca ttcctactta cggggttgga 1200

gctgggggct ttcccggctt tggtgtcgga gtcggaggta tccctggagt cgcaggtgtc 1260

cctggtgtcg gaggtgttcc cggagtcgga ggtgtcccgg gagttggcat ttcccccgaa 1320

gctcaggcag cagctgccgc caaggctgcc aagtacggtg ctgcaggagc aggagtgctg 1380

ggtgggctag tgccaggtgc cccaggcgca gtcccaggtg tgccgggcac gggaggagtg 1440

ccaggagtgg ggaccccagc agctgcagct gctaaagcag ccgccaaagc cgcccagttt 1500

gggttagttc ctggtgtcgg cgtggctcct ggagttggcg tggctcctgg tgtcggtgtg 1560

gctcctggag ttggcttggc tcctggagtt ggcgtggctc ctggagttgg tgtggctcct 1620

ggcgttggcg tggctcccgg cattggccct ggtggagttg cagctgcagc aaaatccgct 1680

gccaaggtgg ctgccaaagc ccagctccga gctgcagctg ggcttggtgc tggcatccct 1740

ggacttggag ttggtgtcgg cgtccctgga cttggagttg gtgctggtgt tcctggactt 1800

ggagttggtg ctggtgttcc tggcttcggg gcaggtgcag atgagggagt taggcggagc 1860

ctgtcccctg agctcaggga aggagatccc tcctcctctc agcacctccc cagcaccccc 1920

tcatcaccca gggtacctgg agccctggct gccgctaaag cagccaaata tggagcagca 1980

gtgcctgggg tccttggagg gctcggggct ctcggtggag taggcatccc aggcggtgtg 2040

gtgggagccg gacccgccgc cgccgctgcc gcagccaaag ctgctgccaa agccgcccag 2100

tttggcctag tgggagccgc tgggctcgga ggactcggag tcggagggct tggagttcca 2160

ggtgttgggg gccttggagg tatacctcca gctgcagccg ctaaagcagc taaatacggt 2220

gctgctggcc ttggaggtgt cctagggggt gccgggcagt tcccacttgg aggagtggca 2280

gcaagacctg gcttcggatt gtctcccatt ttcccaggtg gggcctgcct ggggaaagct 2340

tgtggccgga agagaaaatg a 2361

<210> 38

<211> 2361

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 38

atggctggac tgacagccgc tgctcctaga cctggtgttc tgctgctgct cctgagcatt 60

ctgcaccctt ctagaccagg cggagtgcct ggtgctattc ctggcggagt tcccggcgga 120

gtgttttatc ctggtgctgg actgggagcc cttggcggag gtgctcttgg acctggtgga 180

aagcctctga aacctgtgcc tggcggactt gctggtgcag gtcttggagc cggacttgga 240

gcttttcccg ccgtgacatt tcctggcgct cttgtgccag gtggcgtggc agatgctgcc 300

gctgcttata aggctgccaa agccggcgct ggactcggag gtgttcctgg tgttggaggc 360

ctgggagttt ctgctggtgc tgtggttcct caacctggcg ctggtgttaa gcctggcaaa 420

gttccaggcg ttggactgcc tggtgtttac cctggtggtg ttctccctgg cgctagattc 480

cctggcgttg gagttcttcc tggcgtgcca acaggtgccg gcgtgaaacc taaagctcct 540

ggtgtcggcg gagccttcgc tggaatacct ggcgtgggac cttttggcgg acctcaacca 600

ggtgtccctc tgggctatcc tatcaaggcc cctaaactgc caggcggcta cggcctgcct 660

tacacaactg gcaagctgcc ctatggctat ggacctggcg gtgttgctgg cgccgctgga 720

aaagctggat accctactgg aacaggcgtg ggccctcaag cagcagctgc cgcagcagct 780

aaagccgccg ctaaatttgg agctggcgct gcaggcgttt tgcccggcgt tggcggagca 840

ggcgtcccag gtgttccagg ggcaatacct ggaatcggag gaattgccgg cgtcggaact 900

ccagctgcag cagccgcagc cgccgctgcc gcaaaagctg ctaaatatgg cgcagctgca 960

ggcttggtcc caggcggacc tggatttgga ccaggtgttg ttggagtgcc aggcgctggc 1020

gtccccggcg tgggagttcc tggtgccgga attcctgttg ttcctggcgc tggtattcct 1080

ggcgctgctg ttccaggtgt tgtgtctcct gaagccgctg ccaaggccgc tgctaaggca 1140

gctaaatacg gtgcccgacc aggcgtcgga gttggcggaa ttccaacata tggtgtcgga 1200

gccggcggat tcccaggatt tggagttgga gtcggaggca tcccgggtgt tgcaggcgtt 1260

ccaggcgtcg gcggagttcc tggcgttggt ggtgttccag gcgtgggaat ttctcctgaa 1320

gctcaggccg ctgccgctgc caaagcagcc aaatatggcg ctgccggtgc tggcgttctc 1380

ggaggattgg ttccgggtgc tccaggtgct gttccgggcg ttcccggaac tggcggtgtc 1440

cctggtgtcg gaacaccagc cgctgcagca gcaaaggctg ctgctaaagc cgctcagttt 1500

ggactggttc ctggcgtcgg agtggcacca ggtgttggag ttgcacctgg cgttggcgtg 1560

gcccctggcg tgggtcttgc tcctggtgtt ggtgttgccc caggtgtcgg agtcgctccc 1620

ggtgtcggtg tcgcacctgg tattggtcct ggtggcgttg ccgcagctgc caaatctgct 1680

gcaaaggtgg ccgccaaagc acagctgaga gctgctgccg gtcttggcgc tggaatccca 1740

ggactcggtg ttggagtggg agtgccaggt cttggtgttg gagcaggcgt gcccggactc 1800

ggagtcggag ctggtgtccc aggttttgga gctggtgcag atgaaggcgt gcggagatct 1860

ctgagccctg agctgagaga gggcgatcct agctctagcc agcatctccc tagcacacct 1920

agcagcccta gagtccctgg ggctcttgct gcagccaaag ccgctaagta tggggctgct 1980

gtccctggtg ttcttggagg acttggagca ctcggcggag tgggaattcc aggcggtgtc 2040

gttggtgcag gacctgctgc tgccgccgca gctgcaaaag cagcagctaa ggcagcccag 2100

tttggccttg ttggagccgc tggacttggt ggcctcggag ttggtggtct tggtgtcccc 2160

ggtgttggcg gacttggagg aattccacca gccgcagcag ccaaggctgc taaatacggc 2220

gctgcaggac ttggcggtgt tcttggcgga gctggacagt ttccacttgg aggcgttgca 2280

gccagacctg gctttggcct gtctcctatt tttcctggcg gcgcttgtct gggcaaagcc 2340

tgcggcagaa agcggaagta a 2361

<210> 39

<211> 1017

<212> DNA

<213> 智人(Homo sapiens)

<400> 39

atgagtctaa gtgcatttac tctcttcctg gcattgattg gtggtaccag tggccagtac 60

tatgattatg attttcccct atcaatttat gggcaatcat caccaaactg tgcaccagaa 120

tgtaactgcc ctgaaagcta cccaagtgcc atgtactgtg atgagctgaa attgaaaagt 180

gtaccaatgg tgcctcctgg aatcaagtat ctttacctta ggaataacca gattgaccat 240

attgatgaaa aggcctttga gaatgtaact gatctgcagt ggctcattct agatcacaac 300

cttctagaaa actccaagat aaaagggaga gttttctcta aattgaaaca actgaagaag 360

ctgcatataa accacaacaa cctgacagag tctgtgggcc cacttcccaa atctctggag 420

gatctgcagc ttactcataa caagatcaca aagctgggct cttttgaagg attggtaaac 480

ctgaccttca tccatctcca gcacaatcgg ctgaaagagg atgctgtttc agctgctttt 540

aaaggtctta aatcactcga ataccttgac ttgagcttca atcagatagc cagactgcct 600

tctggtctcc ctgtctctct tctaactctc tacttagaca acaataagat cagcaacatc 660

cctgatgagt atttcaagcg ttttaatgca ttgcagtatc tgcgtttatc tcacaacgaa 720

ctggctgata gtggaatacc tggaaattct ttcaatgtgt catccctggt tgagctggat 780

ctgtcctata acaagcttaa aaacatacca actgtcaatg aaaaccttga aaactattac 840

ctggaggtca atcaacttga gaagtttgac ataaagagct tctgcaagat cctggggcca 900

ttatcctact ccaagatcaa gcatttgcgt ttggatggca atcgcatctc agaaaccagt 960

cttccaccgg atatgtatga atgtctacgt gttgctaacg aagtcactct taattaa 1017

<210> 40

<211> 1017

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 40

atgagcctga gcgccttcac actgtttctg gccctgatcg gcggcacaag cggccagtac 60

tacgactacg atttcccact gagcatctac ggccagagca gccctaattg cgcccctgag 120

tgcaattgcc ccgagagcta tcctagcgcc atgtactgcg acgagctgaa gctgaagtcc 180

gtgcctatgg tgcctcctgg catcaagtac ctgtacctgc ggaacaacca gatcgaccac 240

atcgacgaga aggcctttga gaacgtgacc gacctgcagt ggctgatcct ggaccacaac 300

ctgctggaaa acagcaagat caagggccgc gtgttcagca agctgaagca gctgaagaaa 360

ctgcacatca accacaacaa cctgaccgag agcgtgggcc ctctgcctaa gtctctggaa 420

gatctgcagc tgacccacaa caagatcacc aagctgggca gcttcgaggg cctcgtgaac 480

ctgaccttca tccatctgca gcacaaccgg ctgaaagagg atgccgttag cgccgccttc 540

aagggcctga agagtctgga atacctggac ctgagcttca atcagatcgc cagactgcct 600

agcggcctgc ctgtttctct gctgacactg tacctggaca acaacaaaat cagcaacatc 660

cccgacgagt acttcaagcg gttcaacgcc ctgcagtacc tgagactgag ccacaacgag 720

ctggccgatt ctggcatccc cggcaacagc ttcaatgtgt ccagcctggt ggaactggac 780

ctgtcctaca acaagctgaa aaacatcccc accgtgaacg agaacctcga gaactactac 840

ctggaagtga accagctcga gaagttcgat atcaagagct tctgcaagat cctggggcct 900

ctgagctact ccaagattaa gcacctgagg ctggacggca accggatcag cgaaacaagc 960

ctgcctcctg atatgtacga gtgcctgaga gtggccaacg aagtgaccct gaactga 1017

<210> 41

<211> 1437

<212> DNA

<213> 智人(Homo sapiens)

<400> 41

atggcacccc tgagacccct tctcatactg gccctgctgg catgggttgc tctggctgac 60

caagagtcat gcaagggccg ctgcactgag ggcttcaacg tggacaagaa gtgccagtgt 120

gacgagctct gctcttacta ccagagctgc tgcacagact atacggctga gtgcaagccc 180

caagtgactc gcggggatgt gttcactatg ccggaggatg agtacacggt ctatgacgat 240

ggcgaggaga aaaacaatgc cactgtccat gaacaggtgg ggggcccctc cctgacctct 300

gacctccagg cccagtccaa agggaatcct gagcagacac ctgttctgaa acctgaggaa 360

gaggcccctg cgcctgaggt gggcgcctct aagcctgagg ggatagactc aaggcctgag 420

acccttcatc cagggagacc tcagccccca gcagaggagg agctgtgcag tgggaagccc 480

ttcgacgcct tcaccgacct caagaacggt tccctctttg ccttccgagg gcagtactgc 540

tatgaactgg acgaaaaggc agtgaggcct gggtacccca agctcatccg agatgtctgg 600

ggcatcgagg gccccatcga tgccgccttc acccgcatca actgtcaggg gaagacctac 660

ctcttcaagg gtagtcagta ctggcgcttt gaggatggtg tcctggaccc tgattacccc 720

cgaaatatct ctgacggctt cgatggcatc ccggacaacg tggatgcagc cttggccctc 780

cctgcccata gctacagtgg ccgggagcgg gtctacttct tcaaggggaa acagtactgg 840

gagtaccagt tccagcacca gcccagtcag gaggagtgtg aaggcagctc cctgtcggct 900

gtgtttgaac actttgccat gatgcagcgg gacagctggg aggacatctt cgagcttctc 960

ttctggggca gaacctctgc tggtaccaga cagccccagt tcattagccg ggactggcac 1020

ggtgtgccag ggcaagtgga cgcagccatg gctggccgca tctacatctc aggcatggca 1080

ccccgcccct ccttggccaa gaaacaaagg tttaggcatc gcaaccgcaa aggctaccgt 1140

tcacaacgag gccacagccg tggccgcaac cagaactccc gccggccatc ccgcgccacg 1200

tggctgtcct tgttctccag tgaggagagc aacttgggag ccaacaacta tgatgactac 1260

aggatggact ggcttgtgcc tgccacctgt gaacccatcc agagtgtctt cttcttctct 1320

ggagacaagt actaccgagt caatcttcgc acacggcgag tggacactgt ggaccctccc 1380

tacccacgct ccatcgctca gtactggctg ggctgcccag ctcctggcca tctgtag 1437

<210> 42

<211> 1437

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 42

atggcccctc ttagacccct gctgattctg gctctgctgg cttgggttgc cctggccgat 60

caagagtctt gcaagggcag atgcaccgag ggcttcaacg tggacaagaa atgccagtgc 120

gacgagctgt gcagctacta ccagagctgc tgcaccgatt acaccgccga gtgcaagccc 180

caagtgacaa gaggcgacgt gttcaccatg cctgaggacg agtacaccgt gtacgacgac 240

ggcgaggaaa agaacaacgc caccgtgcac gagcaagttg gcggaccttc tctgaccagc 300

gatctgcagg ctcagagcaa gggcaatcct gagcagaccc ctgtgctgaa gcctgaggaa 360

gaagcccctg ctcctgaagt gggagcctct aagcctgaag gcatcgacag cagacccgag 420

acactgcatc caggcagacc tcagcctcct gccgaagagg aactgtgtag cggcaagcct 480

ttcgacgcct tcaccgacct gaagaacggc agcctgttcg cctttagagg ccagtactgc 540

tacgagctgg acgagaaggc cgtgcggcct ggatatccta agctgatcag agatgtgtgg 600

ggcatcgagg gccccatcga cgccgctttc accagaatca actgtcaggg caagacctac 660

ctgttcaagg gcagccagta ttggagattc gaggacggcg tgctggaccc tgactacccc 720

agaaatatca gcgacggctt cgacggcatc cccgacaatg ttgatgctgc tctggccctg 780

cctgctcaca gctactctgg cagagaacgg gtgtacttct ttaagggcaa acagtactgg 840

gagtaccagt tccagcacca gcctagccaa gaggaatgcg agggcagctc tctgagcgcc 900

gtgtttgagc acttcgccat gatgcagaga gacagctggg aagatatttt cgagctgctg 960

ttctggggca gaaccagcgc cggaacaaga cagcctcagt tcatcagcag agactggcat 1020

ggcgtgccag gacaagtgga tgctgccatg gccggcagaa tctacatcag cggaatggcc 1080

cctagaccta gcctggccaa gaagcagcgg ttccggcaca gaaaccggaa gggctacaga 1140

agccagagag gccactccag aggccggaac cagaatagca gaaggccctc tagagccacc 1200

tggctgagcc tgtttagcag cgaggaaagc aacctgggcg ccaacaacta cgacgactac 1260

cggatggatt ggctggtgcc tgccacatgc gagcctatcc agagcgtgtt cttcttcagc 1320

ggcgacaaat attaccgcgt gaacctgcgg actcggagag tggatacagt ggaccctcct 1380

tatcctcggt ctatcgctca gtattggctg ggctgtccag ctcctggaca cctgtaa 1437

<210> 43

<211> 5175

<212> DNA

<213> 智人(Homo sapiens)

<400> 43

atgcctccag cagtgaggcg gtcagcctgc agcatgggat ggctgtggat ctttggggca 60

gccctggggc agtgtctggg ctacagttca cagcagcaaa gggtgccatt tcttcagcct 120

cccggtcaaa gtcaactgca agcgagttat gtggagttta gacccagcca gggttgtagc 180

cctggatact atcgggatca taaaggcttg tataccggac ggtgtgttcc ctgcaattgc 240

aacggacatt caaatcaatg ccaggatggc tcaggcatat gtgttaactg tcagcacaac 300

accgcgggag agcactgtga acgctgccag gagggctact atggcaacgc cgtccacgga 360

tcctgcaggg cctgcccatg tcctcacact aacagctttg ccactggctg tgtggtgaat 420

gggggagacg tgcggtgctc ctgcaaagct gggtacacag gaacacagtg tgaaaggtgt 480

gcaccgggat atttcgggaa tccccagaaa ttcggaggta gctgccaacc atgcagttgt 540

aacagcaatg gccagctggg cagctgtcat cccctgactg gagactgcat aaaccaagaa 600

cccaaagata gcagccctgc agaagaatgt gatgattgcg acagctgtgt gatgaccctc 660

ctgaacgacc tggccaccat gggcgagcag ctccgcctgg tcaagtctca gctgcagggc 720

ctgagtgcca gcgcagggct tctggagcag atgaggcaca tggagaccca ggccaaggac 780

ctgaggaatc agttgctcaa ctaccgttct gccatttcaa atcatggatc aaaaatagaa 840

ggcctggaaa gagaactgac tgatttgaat caagaatttg agactttgca agaaaaggct 900

caagtaaatt ccagaaaagc acaaacatta aacaacaatg ttaatcgggc aacacaaagc 960

gcaaaagaac tggatgtgaa gattaaaaat gtcatccgga atgtgcacat tcttttaaag 1020

cagatctctg ggacagatgg agagggaaac aacgtgcctt caggtgactt ttccagagag 1080

tgggctgaag cccagcgcat gatgagggaa ctgcggaaca ggaactttgg aaagcacctc 1140

agagaagcag aagctgataa aagggagtcg cagctcttgc tgaaccggat aaggacctgg 1200

cagaaaaccc accaggggga gaacaatggg cttgctaaca gtatccggga ttctttaaat 1260

gaatacgaag ccaaactcag tgaccttcgt gctcggctgc aggaggcagc tgcccaagcc 1320

aagcaggcaa atggcttgaa ccaagaaaac gagagagctt tgggagccat tcagagacaa 1380

gtgaaagaaa taaattccct gcagagtgat ttcaccaagt atctaaccac tgcagactca 1440

tctttgttgc aaaccaacat tgcgctgcag ctgatggaga aaagccagaa ggaatatgaa 1500

aaattagctg ccagtttaaa tgaagcaaga caagaactaa gtgacaaagt aagagaactt 1560

tccagatctg ctggcaaaac atcccttgtg gaggaggcag aaaagcacgc gcggtcctta 1620

caagagctgg caaagcagct ggaagagatc aagagaaacg ccagcgggga tgagctggtg 1680

cgctgtgctg tggatgccgc caccgcctac gagaacatcc tcaatgccat caaagcggcc 1740

gaggacgcag ccaacagggc tgccagtgca tctgaatctg ccctccagac agtgataaag 1800

gaagatctgc caagaaaagc taaaaccctg agttccaaca gtgataaact gttaaatgaa 1860

gccaagatga cacaaaagaa gctaaagcaa gaagtcagtc cagctctcaa caacctacag 1920

caaaccctga atattgtgac agttcagaaa gaagtgatag acaccaatct cacaactctc 1980

cgagatggtc ttcatgggat acagagaggt gatattgatg ctatgatcag tagtgcaaag 2040

agcatggtca gaaaggccaa cgacatcaca gatgaggttc tggatgggct caaccccatc 2100

cagacagatg tggaaagaat taaggacacc tatgggagga cacagaacga agacttcaaa 2160

aaggctctga ctgatgcaga taactcggtg aataagttaa ccaacaaact acctgatctt 2220

tggcgcaaga ttgaaagtat caaccaacag ctgttgccct tgggaaacat ctctgacaac 2280

atggacagaa tacgagaact aattcagcag gccagagatg ctgccagtaa ggttgctgtc 2340

cccatgaggt tcaatggtaa atctggagtc gaagtccgac tgccaaatga cctggaagat 2400

ttgaaaggat atacatctct gtccttgttt ctccaaaggc ccaactcaag agaaaatggg 2460

ggtactgaga atatgtttgt gatgtacctt ggaaataaag atgcctcccg ggactacatc 2520

ggcatggcag ttgtggatgg ccagctcacc tgtgtctaca acctggggga ccgtgaggct 2580

gaactccaag tggaccagat cttgaccaag agtgagacta aggaggcagt tatggatcgg 2640

gtgaaatttc agagaattta tcagtttgca aggcttaatt acaccaaagg agccacatcc 2700

agtaaaccag aaacacccgg agtctatgac atggatggta gaaatagcaa tacactcctt 2760

aatttggatc ctgaaaatgt tgtattttat gttggaggtt acccacctga ttttaaactt 2820

cccagtcgac taagtttccc tccatacaaa ggttgtattg aattagatga cctcaatgaa 2880

aatgttctga gcttgtacaa cttcaaaaaa acattcaatc tcaacacaac tgaagtggag 2940

ccttgtagaa ggaggaagga agagtcagac aaaaattatt ttgaaggtac gggctatgct 3000

cgagttccaa ctcaaccaca tgctcccatc ccaacctttg gacagacaat tcagaccacc 3060

gtggatagag gcttgctgtt ctttgcagaa aacggggatc gcttcatatc tctaaatata 3120

gaagatggca agctcatggt gagatacaaa ctgaattcag agctaccaaa agagagagga 3180

gttggagacg ccataaacaa cggcagagac cattcgattc agatcaaaat tggaaaactc 3240

caaaagcgta tgtggataaa tgtggacgtt caaaacacta taattgatgg tgaagtattt 3300

gatttcagca catattatct gggaggaatt ccaattgcaa tcagggaaag atttaacatt 3360

tctacgcctg ctttccgagg ctgcatgaaa aatttgaaga aaaccagtgg tgtcgttaga 3420

ttgaatgata ctgtgggagt aaccaaaaag tgctcggaag actggaagct tgtgcgatct 3480

gcctcattct ccagaggagg acaattgagt ttcactgatt tgggcttacc acctactgac 3540

cacctccagg cctcatttgg atttcagacc tttcaaccca gtggcatatt attagatcat 3600

cagacatgga caaggaacct gcaggtcact ctggaagatg gttacattga attgagcacc 3660

agcgatagcg gcggcccaat ttttaaatct ccacagacgt atatggatgg tttactgcat 3720

tatgtatctg taataagcga caactctgga ctacggcttc tcatcgatga ccagcttctg 3780

agaaatagca aaaggctaaa acacatttca agttcccggc agtctctgcg tctgggcggg 3840

agcaattttg agggttgtat tagcaatgtt tttgtccaga ggttatcact gagtcctgaa 3900

gtcctagatt tgaccagtaa ctctctcaag agagatgtgt ccctgggagg ctgcagttta 3960

aacaaaccac cttttctaat gttgcttaaa ggttctacca ggtttaacaa gaccaagact 4020

tttcgtatca accagctgtt gcaggacaca ccagtggcct ccccaaggag cgtgaaggtg 4080

tggcaagatg cttgctcacc acttcccaag acccaggcca atcatggagc cctccagttt 4140

ggggacattc ccaccagcca cttgctattc aagcttcctc aggagctgct gaaacccagg 4200

tcacagtttg ctgtggacat gcagacaaca tcctccagag gactggtgtt tcacacgggc 4260

actaagaact cctttatggc tctttatctt tcaaaaggac gtctggtctt tgcactgggg 4320

acagatggga aaaaattgag gatcaaaagc aaggagaaat gcaatgatgg gaaatggcac 4380

acggtggtgt ttggccatga tggggaaaag gggcgcttgg ttgtggatgg actgagggcc 4440

cgggagggaa gtttgcctgg aaactccacc atcagcatca gagcgccagt ttacctggga 4500

tcacctccat cagggaaacc aaagagcctc cccacaaaca gctttgtggg atgcctgaag 4560

aactttcagc tggattcaaa acccttgtat accccttctt caagcttcgg ggtgtcttcc 4620

tgcttgggtg gtcctttgga gaaaggcatt tatttctctg aagaaggagg tcatgtcgtc 4680

ttggctcact ctgtattgtt ggggccagaa tttaagcttg ttttcagcat ccgcccaaga 4740

agtctcactg ggatcctaat acacatcgga agtcagcccg ggaagcactt atgtgtttac 4800

ctggaggcag gaaaggtcac ggcctctatg gacagtgggg caggtgggac ctcaacgtcg 4860

gtcacaccaa agcagtctct gtgtgatgga cagtggcact cggtggcagt caccataaaa 4920

caacacatcc tgcacctgga actggacaca gacagtagct acacagctgg acagatcccc 4980

ttcccacctg ccagcactca agagccacta caccttggag gtgctccagc caatttgacg 5040

acactgagga tccctgtgtg gaaatcattc tttggctgtc tgaggaatat tcatgtcaat 5100

cacatccctg tccctgtcac tgaagccttg gaagtccagg ggcctgtcag tctgaatggt 5160

tgtcctgacc agtaa 5175

<210> 44

<211> 5175

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 44

atgcctcctg ctgtgcggag aagcgcctgt tctatgggat ggctgtggat ctttggcgcc 60

gctctgggac agtgtctggg ctactcttct cagcagcagc gggtgccatt tctgcagcca 120

cctggacagt ctcagctgca ggccagctac gtggaattca gacctagcca gggctgtagc 180

cccggctact acagagatca caagggcctg tacaccggca gatgcgtgcc ctgcaactgt 240

aacggccaca gcaaccagtg tcaggacggc tctggcatct gcgtgaactg ccagcataat 300

actgccggcg agcactgcga gagatgccaa gagggctact acggcaatgc cgtgcatggc 360

agctgtcggg cttgtccttg tcctcacacc aacagctttg ccaccggctg cgttgtgaac 420

ggcggagatg ttcggtgttc ttgcaaggcc ggctacacag gcacacagtg cgaaagatgt 480

gcccctggct actttggcaa ccctcagaag tttggcggct cctgccagcc ttgctcctgc 540

aattctaatg gccagctggg ctcttgtcac cctctgaccg gcgactgcat caatcaagag 600

cctaaggaca gcagccctgc cgaggaatgc gacgattgcg atagctgcgt gatgaccctg 660

ctgaacgacc tggccacaat gggagaacag ctgcggctgg ttaagagcca gctccaggga 720

ctgtctgcct ctgctggact gctggaacag atgcggcaca tggaaaccca ggccaaggac 780

ctgagaaacc agctgctgaa ctacagaagc gccatctcca accacggcag caagatcgaa 840

ggcctggaaa gagagctgac cgacctgaat caagagttcg agacactgca agagaaggcc 900

caagtgaaca gccggaaggc ccagactctg aacaacaacg tgaaccgggc cacacagtcc 960

gccaaagaac tggacgtgaa gatcaagaac gtgatccgga acgtgcacat cctgctgaag 1020

cagatcagcg gcacagatgg cgagggcaac aatgtgccta gcggcgactt tagcagagag 1080

tgggccgaag ctcagcggat gatgagagag ctgcggaacc ggaacttcgg caagcacctg 1140

agagaagccg aggccgacaa gagagagagc caactgctgc tcaaccggat cagaacctgg 1200

cagaaaaccc accagggcga gaacaacggc ctggccaaca gcatcagaga cagcctgaat 1260

gagtacgagg ccaagctgag cgatctgcgg gccagacttc aagaagctgc cgctcaggcc 1320

aagcaggcca acggccttaa tcaagagaac gagagagccc tgggcgccat ccagagacaa 1380

gtgaaagaga tcaacagcct gcagagcgac ttcaccaagt acctgaccac cgccgatagc 1440

agcctgctgc agacaaatat cgccctgcag ctcatggaaa agagccagaa agagtacgaa 1500

aagctggccg ccagcctgaa cgaggccagg caagaactgt ctgacaaagt gcgcgagctg 1560

agcagatccg ccggcaagac atctctggtg gaagaggccg agaagcacgc cagatctctg 1620

caagagctgg ccaaacagct ggaagagatt aagcggaacg ccagcggcga cgaactcgtc 1680

agatgtgcag tggatgccgc caccgcctac gagaacatcc tgaatgccat caaggccgcc 1740

gaggacgccg ctaatagagc cgcttctgct tctgagtctg ccctgcagac cgtgatcaaa 1800

gaggacctgc ctagaaaggc caagacactg agcagcaaca gcgacaaact gctgaatgag 1860

gccaagatga cccagaagaa actgaagcaa gaggtgtccc ctgcactgaa caacctgcag 1920

cagaccctga acatcgtgac cgtgcagaaa gaagtgatcg acaccaacct gacaaccctg 1980

agagatggcc tgcacggaat ccagagaggc gacatcgacg ccatgatcag cagcgccaag 2040

agcatggttc gaaaagccaa cgacatcacc gacgaggtgc tggacggcct gaatcctatc 2100

cagaccgacg tggaacggat caaggacacc tacggcagaa cccagaacga ggatttcaag 2160

aaggccctga ccgacgccga caactccgtg aacaagctga ccaacaagct gcccgatctg 2220

tggcggaaga tcgagagcat caaccagcaa ctgctccctc tgggcaacat cagcgacaac 2280

atggacagaa tccgggaact gatccagcag gccagagatg ccgcctccaa agtggctgtg 2340

cccatgagat tcaacggcaa gagcggagtg gaagtgcggc tgcccaacga tctggaagat 2400

ctgaagggct ataccagcct gagcctgttc ctgcagaggc ccaacagcag agagaatggc 2460

ggcaccgaga atatgttcgt gatgtacctg ggaaacaagg acgccagccg ggactatatc 2520

ggaatggccg ttgtggacgg ccagctgacc tgcgtgtaca acctgggaga cagagaagct 2580

gaactgcagg tcgaccagat cctgaccaag agcgagacaa aagaggccgt gatggacaga 2640

gtgaagttcc agcggatcta ccagttcgcc cggctgaatt acaccaaggg cgccacaagc 2700

agcaagcccg aaacacctgg cgtgtacgac atggacggcc ggaactctaa cactctgctg 2760

aatctggacc ccgagaacgt ggtgttttac gtcggcggct accctcctga cttcaagctg 2820

cctagcagac tgagcttccc accttacaag ggctgcatcg agctggatga cctgaacgaa 2880

aacgtgctgt ccctgtacaa cttcaaaaag accttcaacc tgaacaccac cgaggtggaa 2940

ccctgcaggc gcagaaaaga ggaatccgac aagaactact tcgaaggcac cggctacgcc 3000

agagtgccta cacaacctca cgctcccatt cctaccttcg gccagaccat ccagacaacc 3060

gtggatagag gcctgctgtt cttcgccgag aacggcgaca gattcatctc cctgaatatc 3120

gaggatggca agctgatggt ccgatacaag ctgaatagcg agctgcccaa agaaagaggc 3180

gtgggcgacg ccatcaacaa cggcagggat cacagcatcc agatcaagat cggcaaactg 3240

cagaaacgga tgtggatcaa cgtggacgtg cagaacacca tcatcgacgg cgaggtgttc 3300

gacttcagca cctactatct cggcggaatc cctatcgcca tcagagagcg gttcaatatc 3360

agcacccctg ccttccgggg ctgcatgaag aacctgaaaa agaccagcgg cgtcgtgcgg 3420

ctgaatgata cagtgggcgt gaccaagaag tgcagcgagg actggaagct tgtgcggagc 3480

gccagttttt ctagaggcgg acagctgagc tttaccgacc tgggactgcc tcctaccgat 3540

catctgcagg caagcttcgg attccagacc ttccagccaa gcggaatcct gctggaccac 3600

cagacctgga ccagaaacct gcaagtgacc ctggaagatg gctacatcga actgagcacc 3660

agcgactctg gcggccctat ctttaagagc cctcagacct acatggatgg gctgctgcac 3720

tacgtgtccg tgatcagcga taacagcggc ctgagactgc tgatcgacga ccagctcctg 3780

cggaacagca agcggctgaa gcacatctcc agcagcagac agagtctgag actcggcggc 3840

agcaatttcg agggctgtat cagcaacgtg ttcgtgcagc gcctgagtct gtctccagaa 3900

gtgctggacc tgaccagcaa tagcctgaag agggatgtgt ctctcggcgg ctgctccctg 3960

aacaaacctc ctttcctgat gctgctgaag ggcagcaccc ggttcaacaa gaccaagacc 4020

tttcggatca atcagctgct ccaggacacc cctgtggcta gccctagaag cgtgaaagtg 4080

tggcaggacg cctgcagtcc cctgcctaaa acacaggcca atcacggggc tctgcagttc 4140

ggcgatatcc ccacaagcca tctgctgttt aagctgcccc aagagctgct caagcctcgg 4200

agccagttcg ctgtggatat gcagaccacc tcctccagag gactggtgtt tcacaccggc 4260

accaagaaca gcttcatggc cctgtacctg agcaaaggca ggctggtgtt tgccctgggc 4320

accgacggaa agaaactgcg gatcaagagc aaagagaagt gcaacgacgg caagtggcac 4380

accgtggtgt tcggacacga tggcgagaaa ggcagactcg tggtggatgg cctgagagcc 4440

agagagggat ctctgcctgg caactccacc atctccatca gagcccctgt gtatctgggc 4500

agccctccta gcggaaagcc taagagcctg cctaccaact ccttcgtggg ctgtctgaag 4560

aactttcagc tggacagcaa gcctctgtac acccctagca gcagctttgg cgtgtcctcc 4620

tgtctcggag gccctctgga aaagggcatc tacttctctg aggaaggcgg ccacgttgtc 4680

ctggctcatt ctgttctgct gggccccgag ttcaagctgg tgttctctat ccggcctaga 4740

agcctgaccg gcatcctgat tcacatcggc agccagcctg ggaagcacct gtgtgtgtat 4800

ctcgaggccg gcaaagtgac cgccagcatg gattctggtg ctggcggcac aagcacctcc 4860

gtgacaccta agcagagcct gtgtgatggc cagtggcaca gtgtggccgt gacaatcaag 4920

cagcacattc tgcacctgga actggacacc gacagcagct ataccgccgg acagatccca 4980

tttcctccag ccagcacaca agagcctctg caccttggag gcgcccctgc caatctgacc 5040

acactgagaa tccccgtgtg gaagtccttc ttcggctgcc tgcggaatat ccatgtgaac 5100

cacattccag tgcctgtgac agaggccctg gaagtgcagg gacccgtgtc tctgaatgga 5160

tgccccgatc agtga 5175

<210> 45

<211> 3519

<212> DNA

<213> 智人(Homo sapiens)

<400> 45

atgagaccat tcttcctctt gtgttttgcc ctgcctggcc tcctgcatgc ccaacaagcc 60

tgctcccgtg gggcctgcta tccacctgtt ggggacctgc ttgttgggag gacccggttt 120

ctccgagctt catctacctg tggactgacc aagcctgaga cctactgcac ccagtatggc 180

gagtggcaga tgaaatgctg caagtgtgac tccaggcagc ctcacaacta ctacagtcac 240

cgagtagaga atgtggcttc atcctccggc cccatgcgct ggtggcagtc acagaatgat 300

gtgaaccctg tctctctgca gctggacctg gacaggagat tccagcttca agaagtcatg 360

atggagttcc aggggcccat gcccgccggc atgctgattg agcgctcctc agacttcggt 420

aagacctggc gagtgtacca gtacctggct gccgactgca cctccacctt ccctcgggtc 480

cgccagggtc ggcctcagag ctggcaggat gttcggtgcc agtccctgcc tcagaggcct 540

aatgcacgcc taaatggggg gaaggtccaa cttaacctta tggatttagt gtctgggatt 600

ccagcaactc aaagtcaaaa aattcaagag gtgggggaga tcacaaactt gagagtcaat 660

ttcaccaggc tggcccctgt gccccaaagg ggctaccacc ctcccagcgc ctactatgct 720

gtgtcccagc tccgtctgca ggggagctgc ttctgtcacg gccatgctga tcgctgcgca 780

cccaagcctg gggcctctgc aggcccctcc accgctgtgc aggtccacga tgtctgtgtc 840

tgccagcaca acactgccgg cccaaattgt gagcgctgtg cacccttcta caacaaccgg 900

ccctggagac cggcggaggg ccaggacgcc catgaatgcc aaaggtgcga ctgcaatggg 960

cactcagaga catgtcactt tgaccccgct gtgtttgccg ccagccaggg ggcatatgga 1020

ggtgtgtgtg acaattgccg ggaccacacc gaaggcaaga actgtgagcg gtgtcagctg 1080

cactatttcc ggaaccggcg cccgggagct tccattcagg agacctgcat ctcctgcgag 1140

tgtgatccgg atggggcagt gccaggggct ccctgtgacc cagtgaccgg gcagtgtgtg 1200

tgcaaggagc atgtgcaggg agagcgctgt gacctatgca agccgggctt cactggactc 1260

acctacgcca acccgcaggg ctgccaccgc tgtgactgca acatcctggg gtcccggagg 1320

gacatgccgt gtgacgagga gagtgggcgc tgcctttgtc tgcccaacgt ggtgggtccc 1380

aaatgtgacc agtgtgctcc ctaccactgg aagctggcca gtggccaggg ctgtgaaccg 1440

tgtgcctgcg acccgcacaa ctccctcagc ccacagtgca accagttcac agggcagtgc 1500

ccctgtcggg aaggctttgg tggcctgatg tgcagcgctg cagccatccg ccagtgtcca 1560

gaccggacct atggagacgt ggccacagga tgccgagcct gtgactgtga tttccgggga 1620

acagagggcc cgggctgcga caaggcatca ggccgctgcc tctgccgccc tggcttgacc 1680

gggccccgct gtgaccagtg ccagcgaggc tactgtaatc gctacccggt gtgcgtggcc 1740

tgccaccctt gcttccagac ctatgatgcg gacctccggg agcaggccct gcgctttggt 1800

agactccgca atgccaccgc cagcctgtgg tcagggcctg ggctggagga ccgtggcctg 1860

gcctcccgga tcctagatgc aaagagtaag attgagcaga tccgagcagt tctcagcagc 1920

cccgcagtca cagagcagga ggtggctcag gtggccagtg ccatcctctc cctcaggcga 1980

actctccagg gcctgcagct ggatctgccc ctggaggagg agacgttgtc ccttccgaga 2040

gacctggaga gtcttgacag aagcttcaat ggtctcctta ctatgtatca gaggaagagg 2100

gagcagtttg aaaaaataag cagtgctgat ccttcaggag ccttccggat gctgagcaca 2160

gcctacgagc agtcagccca ggctgctcag caggtctccg acagctcgcg ccttttggac 2220

cagctcaggg acagccggag agaggcagag aggctggtgc ggcaggcggg aggaggagga 2280

ggcaccggca gccccaagct tgtggccctg aggctggaga tgtcttcgtt gcctgacctg 2340

acacccacct tcaacaagct ctgtggcaac tccaggcaga tggcttgcac cccaatatca 2400

tgccctggtg agctatgtcc ccaagacaat ggcacagcct gtggctcccg ctgcaggggt 2460

gtccttccca gggccggtgg ggccttcttg atggcggggc aggtggctga gcagctgcgg 2520

ggcttcaatg cccagctcca gcggaccagg cagatgatta gggcagccga ggaatctgcc 2580

tcacagattc aatccagtgc ccagcgcttg gagacccagg tgagcgccag ccgctcccag 2640

atggaggaag atgtcagacg cacacggctc ctaatccagc aggtccggga cttcctaaca 2700

gaccccgaca ctgatgcagc cactatccag gaggtcagcg aggccgtgct ggccctgtgg 2760

ctgcccacag actcagctac tgttctgcag aagatgaatg agatccaggc cattgcagcc 2820

aggctcccca acgtggactt ggtgctgtcc cagaccaagc aggacattgc gcgtgcccgc 2880

cggttgcagg ctgaggctga ggaagccagg agccgagccc atgcagtgga gggccaggtg 2940

gaagatgtgg ttgggaacct gcggcagggg acagtggcac tgcaggaagc tcaggacacc 3000

atgcaaggca ccagccgctc ccttcggctt atccaggaca gggttgctga ggttcagcag 3060

gtactgcggc cagcagaaaa gctggtgaca agcatgacca agcagctggg tgacttctgg 3120

acacggatgg aggagctccg ccaccaagcc cggcagcagg gggcagaggc agtccaggcc 3180

cagcagcttg cggaaggtgc cagcgagcag gcattgagtg cccaagaggg atttgagaga 3240

ataaaacaaa agtatgctga gttgaaggac cggttgggtc agagttccat gctgggtgag 3300

cagggtgccc ggatccagag tgtgaagaca gaggcagagg agctgtttgg ggagaccatg 3360

gagatgatgg acaggatgaa agacatggag ttggagctgc tgcggggcag ccaggccatc 3420

atgctgcgct cagcggacct gacaggactg gagaagcgtg tggagcagat ccgtgaccac 3480

atcaatgggc gcgtgctcta ctatgccacc tgcaagtga 3519

<210> 46

<211> 3519

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 46

atgaggccct tcttcctgct gtgctttgcc ctgcctggac tgctgcatgc tcagcaggct 60

tgtagcagag gcgcctgcta tcctcctgtg ggcgatctgc ttgtgggcag aaccagattc 120

ctgcgggcca gctctacatg cggcctgaca aagcctgaga catactgcac ccagtacggc 180

gagtggcaga tgaagtgctg caagtgcgac agcagacagc cccacaacta ctacagccac 240

agagtggaaa acgtggccag cagcagcggc cctatgagat ggtggcagag ccagaacgac 300

gtgaaccccg ttagcctgca gctggacctg gacagacggt ttcagctgca agaagtgatg 360

atggaatttc agggccccat gcctgccggc atgctgatcg agagaagcag cgatttcggc 420

aagacctggc gggtgtacca gtatctggcc gccgattgca ccagcacatt ccccagagtt 480

agacagggca gaccccagag ctggcaggat gttcgttgtc agtctctgcc ccagcggcct 540

aacgctagac tgaatggcgg aaaggtgcag ctcaacctga tggacctggt gtctggcatc 600

cctgccacac agtcccagaa aatccaagaa gtgggcgaga tcaccaacct gagagtgaac 660

ttcacccggc tggctcccgt tcctcagaga ggatatcatc ctcctagcgc ctactacgcc 720

gtgtctcagc ttagactgca gggcagctgc ttctgtcacg gccacgctga tagatgcgcc 780

cctaaacctg gtgcctctgc cggaccttct acagccgtgc aagtgcacga tgtgtgcgtg 840

tgccagcaca ataccgccgg acctaactgc gagagatgtg cccctttcta caacaaccgg 900

ccttggaggc ctgccgaagg acaggatgct cacgagtgcc agagatgcga ctgcaacggc 960

cacagcgaga catgccactt tgaccctgcc gtgtttgccg cttctcaggg cgcttatggc 1020

ggcgtgtgtg acaactgcag agatcacacc gagggcaaga actgcgagcg ctgtcagctg 1080

cactacttcc ggaatagaag gccaggcgcc agcatccaag agacatgcat cagctgcgag 1140

tgcgatcccg atggtgctgt tcctggcgct ccttgtgatc ctgtgacagg ccagtgcgtg 1200

tgtaaagaac acgtgcaggg cgaaagatgc gacctgtgca agcctggctt taccggcctg 1260

acctacgcca atcctcaggg ctgccacaga tgtgattgca acatcctggg cagcagacgg 1320

gacatgccct gtgatgaaga gtctggcaga tgcctgtgcc tgcctaatgt cgtgggcccc 1380

aagtgcgatc agtgtgcccc atatcactgg aagctggcct ctggccaggg atgcgaacct 1440

tgtgcctgcg atccccacaa cagcctgtct ccacagtgca accagttcac cggccagtgt 1500

ccttgcagag aaggctttgg cggcctgatg tgttctgccg ccgctatcag acagtgcccc 1560

gatagaacat atggcgacgt ggccacaggc tgcagagcct gcgattgtga cttccgggga 1620

acagaaggac ccggctgcga taaggccagc ggaagatgtc tgtgtcggcc tggactcaca 1680

ggccccagat gtgaccagtg tcagcggggc tactgcaaca gataccctgt gtgtgtggcc 1740

tgccatcctt gcttccagac ctacgacgcc gacctgagag aacaggccct gagattcggc 1800

agactgagaa atgccaccgc cagcctttgg agcggacctg gccttgaaga tagaggcctg 1860

gcctccagaa tcctggacgc caagtctaag atcgagcaga tcagagccgt gctgtctagc 1920

ccagccgtga ccgaacaaga ggtggcccaa gtggctagcg ccatcctgag cctgagaaga 1980

actctgcagg gactgcagct cgatctgccc ctggaagagg aaacactgag cctgcctaga 2040

gatctggaaa gcctggatcg gagcttcaac ggcctgctga caatgtacca gagaaagaga 2100

gagcagttcg agaagatcag cagcgccgat cctagcggcg ccttcagaat gctgagcaca 2160

gcctatgagc agagcgccca ggctgctcag caagtgtccg atagcagcag actgctggac 2220

cagctgcggg actctagaag agaagccgaa agacttgtgc ggcaggcagg cggcggaggt 2280

ggaacaggat ctcctaaact ggtggccctg cggctggaaa tgtcctctct gcctgatctg 2340

acccctacct tcaacaagct gtgcggcaac agccggcaga tggcctgcac acctattagc 2400

tgtcctggcg agctgtgccc tcaggataat ggaaccgcct gcggctccag atgtagaggc 2460

gttttgccaa gagccggcgg agcctttctg atggctggac aagttgccga gcagctgaga 2520

ggcttcaacg ctcagctgca gcggaccaga cagatgatta gagccgccga ggaaagcgcc 2580

agccagattc aatctagcgc ccagagactg gaaacccagg tgtccgccag cagatcccag 2640

atggaagaag atgtgcggcg gacaagactg ctgatccagc aagtgcggga cttcctgacc 2700

gatcctgata ccgatgccgc cacaatccaa gaggtgtccg aagctgttct ggcactgtgg 2760

ctgcctaccg atagcgctac agtgctgcag aagatgaacg agatccaggc aatcgccgcc 2820

agactgccca atgtggatct ggtgctgagc cagaccaagc aggatatcgc cagagctaga 2880

aggctgcagg ccgaggccga agaggcaaga tctagagccc atgccgtgga aggccaagtc 2940

gaggacgttg tgggcaatct gagacaggga accgtggctc tgcaagaggc ccaggataca 3000

atgcagggca ccagcagaag cctgcgcctg atccaggata gagtggccga agtgcagcag 3060

gtcctgaggc cagccgaaaa gctggtcacc agcatgacca aacagctggg cgatttctgg 3120

acgcgcatgg aagaactgag gcatcaggca agacagcagg gcgctgaagc agtgcaggct 3180

caacaacttg ccgagggcgc ttctgaacag gctctgtctg cccaagaggg cttcgagcgg 3240

atcaagcaga agtacgccga gctgaaggac agactgggcc agagttctat gctgggcgaa 3300

cagggcgcca gaattcagag cgtgaaaaca gaggccgagg aactgttcgg cgagacaatg 3360

gaaatgatgg accggatgaa ggacatggaa ctggaactgc tgaggggcag ccaggccatc 3420

atgctgagaa gtgccgatct gacaggcctg gaaaagagag tggaacagat ccgggaccac 3480

atcaacggcc gggtgctgta ctacgccaca tgcaagtaa 3519

<210> 47

<211> 3582

<212> DNA

<213> 智人(Homo sapiens)

<400> 47

atgcctgcgc tctggctggg ctgctgcctc tgcttctcgc tcctcctgcc cgcagcccgg 60

gccacctcca ggagggaagt ctgtgattgc aatgggaagt ccaggcagtg tatctttgat 120

cgggaacttc acagacaaac tggtaatgga ttccgctgcc tcaactgcaa tgacaacact 180

gatggcattc actgcgagaa gtgcaagaat ggcttttacc ggcacagaga aagggaccgc 240

tgtttgccct gcaattgtaa ctccaaaggt tctcttagtg ctcgatgtga caactccgga 300

cggtgcagct gtaaaccagg tgtgacagga gccagatgcg accgatgtct gccaggcttc 360

cacatgctca cggatgcggg gtgcacccaa gaccagagac tgctagactc caagtgtgac 420

tgtgacccag ctggcatcgc agggccctgt gacgcgggcc gctgtgtctg caagccagct 480

gtcactggag aacgctgtga taggtgtcga tcaggttact ataatctgga tggggggaac 540

cctgagggct gtacccagtg tttctgctat gggcattcag ccagctgccg cagctctgca 600

gaatacagtg tccataagat cacctctacc tttcatcaag atgttgatgg ctggaaggct 660

gtccaacgaa atgggtctcc tgcaaagctc caatggtcac agcgccatca agatgtgttt 720

agctcagccc aacgactaga ccctgtctat tttgtggctc ctgccaaatt tcttgggaat 780

caacaggtga gctatggtca aagcctgtcc tttgactacc gtgtggacag aggaggcaga 840

cacccatctg cccatgatgt gattctggaa ggtgctggtc tacggatcac agctcccttg 900

atgccacttg gcaagacact gccttgtggg ctcaccaaga cttacacatt caggttaaat 960

gagcatccaa gcaataattg gagcccccag ctgagttact ttgagtatcg aaggttactg 1020

cggaatctca cagccctccg catccgagct acatatggag aatacagtac tgggtacatt 1080

gacaatgtga ccctgatttc agcccgccct gtctctggag ccccagcacc ctgggttgaa 1140

cagtgtatat gtcctgttgg gtacaagggg caattctgcc aggattgtgc ttctggctac 1200

aagagagatt cagcgagact ggggcctttt ggcacctgta ttccttgtaa ctgtcaaggg 1260

ggaggggcct gtgatccaga cacaggagat tgttattcag gggatgagaa tcctgacatt 1320

gagtgtgctg actgcccaat tggtttctac aacgatccgc acgacccccg cagctgcaag 1380

ccatgtccct gtcataacgg gttcagctgc tcagtgatgc cggagacgga ggaggtggtg 1440

tgcaataact gccctcccgg ggtcaccggt gcccgctgtg agctctgtgc tgatggctac 1500

tttggggacc cctttggtga acatggccca gtgaggcctt gtcagccctg tcaatgcaac 1560

aacaatgtgg accccagtgc ctctgggaat tgtgaccggc tgacaggcag gtgtttgaag 1620

tgtatccaca acacagccgg catctactgc gaccagtgca aagcaggcta cttcggggac 1680

ccattggctc ccaacccagc agacaagtgt cgagcttgca actgtaaccc catgggctca 1740

gagcctgtag gatgtcgaag tgatggcacc tgtgtttgca agccaggatt tggtggcccc 1800

aactgtgagc atggagcatt cagctgtcca gcttgctata atcaagtgaa gattcagatg 1860

gatcagttta tgcagcagct tcagagaatg gaggccctga tttcaaaggc tcagggtggt 1920

gatggagtag tacctgatac agagctggaa ggcaggatgc agcaggctga gcaggccctt 1980

caggacattc tgagagatgc ccagatttca gaaggtgcta gcagatccct tggtctccag 2040

ttggccaagg tgaggagcca agagaacagc taccagagcc gcctggatga cctcaagatg 2100

actgtggaaa gagttcgggc tctgggaagt cagtaccaga accgagttcg ggatactcac 2160

aggctcatca ctcagatgca gctgagcctg gcagaaagtg aagcttcctt gggaaacact 2220

aacattcctg cctcagacca ctacgtgggg ccaaatggct ttaaaagtct ggctcaggag 2280

gccacaagat tagcagaaag ccacgttgag tcagccagta acatggagca actgacaagg 2340

gaaactgagg actattccaa acaagccctc tcactggtgc gcaaggccct gcatgaagga 2400

gtcggaagcg gaagcggtag cccggacggt gctgtggtgc aagggcttgt ggaaaaattg 2460

gagaaaacca agtccctggc ccagcagttg acaagggagg ccactcaagc ggaaattgaa 2520

gcagataggt cttatcagca cagtctccgc ctcctggatt cagtgtctcg gcttcaggga 2580

gtcagtgatc agtcctttca ggtggaagaa gcaaagagga tcaaacaaaa agcggattca 2640

ctctcaagcc tggtaaccag gcatatggat gagttcaagc gtacacagaa gaatctggga 2700

aactggaaag aagaagcaca gcagctctta cagaatggaa aaagtgggag agagaaatca 2760

gatcagctgc tttcccgtgc caatcttgct aaaagcagag cacaagaagc actgagtatg 2820

ggcaatgcca ctttttatga agttgagagc atccttaaaa acctcagaga gtttgacctg 2880

caggtggaca acagaaaagc agaagctgaa gaagccatga agagactctc ctacatcagc 2940

cagaaggttt cagatgccag tgacaagacc cagcaagcag aaagagccct ggggagcgct 3000

gctgctgatg cacagagggc aaagaatggg gccggggagg ccctggaaat ctccagtgag 3060

attgaacagg agattgggag tctgaacttg gaagccaatg tgacagcaga tggagccttg 3120

gccatggaaa agggactggc ctctctgaag agtgagatga gggaagtgga aggagagctg 3180

gaaaggaagg agctggagtt tgacacgaat atggatgcag tacagatggt gattacagaa 3240

gcccagaagg ttgataccag agccaagaac gctggggtta caatccaaga cacactcaac 3300

acattagacg gcctcctgca tctgatggac cagcctctca gtgtagatga agaggggctg 3360

gtcttactgg agcagaagct ttcccgagcc aagacccaga tcaacagcca actgcggccc 3420

atgatgtcag agctggaaga gagggcacgt cagcagaggg gccacctcca tttgctggag 3480

acaagcatag atgggattct ggctgatgtg aagaacttgg agaacattag ggacaacctg 3540

cccccaggct gctacaatac ccaggctctt gagcaacagt ga 3582

<210> 48

<211> 3582

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 48

atgcctgctc tgtggctggg ctgctgcctg tgttttagtc tgctgctgcc agccgccaga 60

gccacatcta gaagagaagt gtgcgactgc aacggcaaga gccggcagtg catcttcgac 120

agagagctgc acagacagac cggcaacggc ttcagatgcc tgaactgcaa cgacaacacc 180

gacggcatcc actgcgagaa gtgcaagaac ggcttctacc ggcaccgcga gagggataga 240

tgcctgcctt gcaactgcaa ctccaagggc agcctgagcg ccagatgcga caatagcggc 300

agatgtagct gcaagcctgg cgtgacaggc gctagatgcg atagatgtct ccccggcttc 360

cacatgctga ccgatgccgg atgtacccag gaccagagac tgctggacag caagtgcgat 420

tgcgaccctg ccggaattgc cggaccttgt gatgccggaa gatgcgtgtg taaacctgcc 480

gtgaccggcg agagatgtga cagatgtaga agcggctact acaacctgga cggcggcaat 540

cctgaaggct gcacccagtg cttttgctac ggccacagcg ccagctgtag aagcagcgcc 600

gaatactccg tgcacaagat caccagcacc ttccaccagg atgtggacgg atggaaggcc 660

gtgcagagaa atggctctcc tgccaagctg cagtggtccc agagacacca ggacgtgttc 720

agcagcgctc agagactgga ccccgtgtac tttgtggccc ctgccaagtt cctgggcaac 780

cagcaagtgt cttacggcca gagcctgagc ttcgactaca gagtggatag aggcggcaga 840

caccccagcg ctcacgatgt gattcttgaa ggcgccggac tgcggatcac agcccctctt 900

atgcctctgg gcaagaccct gccttgtggc ctgaccaaga cctacacctt ccggctgaat 960

gagcacccca gcaacaactg gtccccacag ctgagctact tcgagtacag acggctgctg 1020

cggaacctga cagccctgag aatcagagcc acctacggcg agtacagcac cggctacatc 1080

gacaacgtga ccctgatcag cgccagacct gtttctggtg ctcctgctcc ttgggtcgag 1140

cagtgtatct gtcccgtggg ctacaagggc cagttctgcc aggattgtgc cagcggctac 1200

aagagagact ctgccagact gggccccttc ggcacatgca tcccttgtaa ttgtcaaggc 1260

ggcggagcct gcgatcccga tacaggcgat tgctacagcg gcgacgagaa ccccgatatc 1320

gagtgcgccg attgtcccat cggcttttac aacgaccctc acgaccccag atcctgcaag 1380

ccatgtcctt gccacaatgg cttcagctgc agcgtgatgc ccgaaaccga agaggtcgtg 1440

tgcaacaatt gcccaccagg cgttacaggg gccagatgtg aactgtgtgc cgacggctac 1500

ttcggcgatc cttttggaga acacggaccc gtgcgacctt gccagccttg tcagtgcaac 1560

aacaacgtgg acccaagcgc cagcggcaac tgcgatagac tgacaggcag atgtctgaag 1620

tgcatccaca ataccgccgg gatctactgt gaccagtgca aggccggcta ttttggcgac 1680

cctctggctc ccaatcctgc cgataagtgc agagcctgca actgtaaccc tatgggctct 1740

gagcctgtgg gctgcagatc tgatggaacc tgcgtgtgca agccaggctt tggcggacct 1800

aattgtgaac acggcgcctt tagctgcccc gcctgctaca atcaagtgaa gatccagatg 1860

gaccagttca tgcagcagct gcagaggatg gaagccctga tctctaaagc ccaaggcgga 1920

gatggcgtgg tgcctgatac agagctggaa ggcagaatgc agcaggccga acaggccctg 1980

caggacattc tgagagatgc ccagattagc gagggcgcct ctagaagtct gggactgcag 2040

ctggctaaag tgcggagcca agagaacagc taccagagca gactggacga cctgaagatg 2100

accgtggaaa gagtcagagc cctgggcagc cagtaccaga acagagtgcg ggatacccac 2160

cggctgatca cccagatgca actgtctctg gccgagagcg aagccagcct gggcaatacc 2220

aatattcccg ccagcgacca ctacgtgggc cccaacggtt ttaagagcct ggctcaagag 2280

gccaccagac tggccgaaag ccatgtggaa agcgcctcca acatggaaca gctgacccgg 2340

gaaaccgagg actactctaa gcaggccctg agcctcgtca gaaaagccct gcatgaaggc 2400

gtcggcagcg gctctggatc tcctgatggt gctgtggtgc agggactcgt ggaaaagctg 2460

gaaaagacca aatctctggc ccagcagctg accagagaag ccacacaggc cgagatcgag 2520

gccgacagaa gctaccagca ctcactgagg ctgctggact ccgtgtctag actgcagggc 2580

gtgtccgacc agagcttcca ggtggaagag gccaagcgga tcaagcagaa ggccgatagc 2640

ctgagcagcc tggtcaccag acacatggac gagttcaagc ggacccagaa gaacctcggc 2700

aactggaaag aggaagccca gcaactgctg cagaacggca agtctggaag agagaagtct 2760

gaccagctgc tgagcagagc caacctggcc aagtctagag cccaagaggc cctgtctatg 2820

ggcaacgcca ccttctacga ggtggaatcc atcctgaaga acctgcgcga gttcgacctg 2880

caagtggaca acagaaaggc cgaggccgag gaagccatga agagactgag ctacatcagc 2940

cagaaagtgt ccgacgcctc cgacaagaca cagcaggcag aaagagcact gggatctgcc 3000

gcagccgatg ctcagagagc taaaaacggc gctggcgagg ccctggaaat cagctctgag 3060

atcgagcaag agatcggctc cctgaatctg gaagccaatg tgacagccga tggcgccctg 3120

gccatggaaa aaggactggc ctctctgaag tccgagatga gagaggtgga aggcgagctg 3180

gaacggaaag aactggaatt cgacaccaat atggacgctg tgcagatggt catcacagag 3240

gcccagaagg tggacaccag agccaaaaat gccggcgtga ccatccagga caccctgaat 3300

actctggacg gactgctgca cctgatggat cagcctctga gcgtggacga ggaaggactg 3360

gttctgctgg aacagaagct gagccgggcc aagactcaga tcaacagcca gctgaggccc 3420

atgatgagcg aactggaaga acgggccaga cagcagaggg gccatctgca tctgctcgaa 3480

accagcatcg atggcatcct ggccgacgtg aagaatctcg agaacatccg ggacaacctg 3540

ccacctggct gctacaacac acaggcactg gaacagcagt ga 3582

<210> 49

<211> 3891

<212> DNA

<213> 肉毒梭菌(Clostridium botulinum)

<400> 49

atgccatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct 60

tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat 120

aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat 180

ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca 240

gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca 300

actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga 360

agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca 420

gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt 480

atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat 540

ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt 600

gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca 660

ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat 720

agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt 780

gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac 840

gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct 900

aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa 960

tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag 1020

ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta 1080

cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct 1140

aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac 1200

tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact 1260

ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa 1320

tcattagata aaggatacaa taaggcatta aatgatttat gtatcaaagt taataattgg 1380

gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa 1440

attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa 1500

caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt 1560

tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga 1620

aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa 1680

catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt 1740

cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca 1800

gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa 1860

gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct 1920

ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga 1980

gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca 2040

cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt 2100

aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag 2160

gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca 2220

gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat 2280

aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct 2340

atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg 2400

atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta 2460

aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa 2520

gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa 2580

agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat 2640

ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt 2700

ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa 2760

agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat 2820

tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat 2880

gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat 2940

ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa 3000

tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact 3060

aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca 3120

atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt 3180

agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat 3240

gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtatttt aaaagacttt 3300

tggggtgatt atttacaata tgataaacca tactatatgt taaatttata tgatccaaat 3360

aaatatgtcg atgtaaataa tgtaggtatt agaggttata tgtatcttaa agggcctaga 3420

ggtagcgtaa tgactacaaa catttattta aattcaagtt tgtatagggg gacaaaattt 3480

attataaaaa aatatgcttc tggaaataaa gataatattg ttagaaataa tgatcgtgta 3540

tatattaatg tagtagttaa aaataaagaa tataggttag ctactaatgc atcacaggca 3600

ggcgtagaaa aaatactaag tgcattagaa atacctgatg taggaaatct aagtcaagta 3660

gtagtaatga agtcaaaaaa tgatcaagga ataacaaata aatgcaaaat gaatttacaa 3720

gataataatg ggaatgatat aggctttata ggatttcatc agtttaataa tatagctaaa 3780

ctagtagcaa gtaattggta taatagacaa atagaaagat ctagtaggac tttgggttgc 3840

tcatgggaat ttattcctgt agatgatgga tggggagaaa ggccactgta a 3891

<210> 50

<211> 3891

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 50

atgcccttcg tgaacaagca gttcaactac aaggaccccg tgaacggcgt ggacattgcc 60

tacatcaaga tccccaacgc cggccagatg cagcccgtga aggcctttaa gatccacaac 120

aagatctggg tcatccccga gcgggacacc ttcacaaatc ccgaggaagg cgacctgaat 180

cctccacctg aagccaaaca ggtgcccgtg tcctactacg acagcaccta cctgagcacc 240

gacaacgaga aggacaacta cctgaagggc gtgaccaagc tgttcgagcg gatctacagc 300

accgatctgg gcagaatgct gctgacctct atcgtgcggg gcatcccatt ttggggcggc 360

agcacaatcg acaccgagct gaaagtgatc gacaccaact gcatcaacgt gatccagcct 420

gacggcagct acagaagcga ggaactgaac ctggtcatca tcggccccag cgccgacatc 480

atccagttcg agtgcaagag cttcggccac gaggtgctga acctgaccag aaatggctac 540

ggcagcaccc agtacatccg gttcagcccc gatttcacct tcggcttcga ggaatccctg 600

gaagtggaca ccaatcctct gctcggagcc ggcaagtttg ccaccgatcc tgctgtgaca 660

ctggcccacg aactgattca cgccggacac agactgtacg gaatcgccat caatcccaac 720

cgggtgttca aagtgaacac caacgcctac tatgagatga gcggactgga agtgtccttt 780

gaggaactgc ggaccttcgg cggacacgac gccaagttta tcgacagcct gcaagagaac 840

gagttccggc tgtactacta caacaagttc aaggatatcg ccagcacgct gaacaaggcc 900

aagagcatcg tgggcacaac agccagcctg cagtacatga agaacgtttt caaagagaag 960

tacctgctga gcgaggacac cagcggcaag ttctccgtgg acaagctgaa gttcgacaag 1020

ctgtacaaga tgctgaccga gatctacacc gaggacaact tcgtgaagtt cttcaaggtg 1080

ctcaaccgca agacctacct caacttcgac aaggccgtgt tcaagatcaa catcgtgccc 1140

aaagtcaact acaccatcta cgacggcttc aacctgcgca acaccaacct ggccgccaac 1200

ttcaacggcc agaacaccga gatcaacaac atgaacttca ccaagctgaa aaacttcacc 1260

ggcctgttcg agttctataa gctgctgtgc gtgcgcggca tcatcaccag caagaccaag 1320

agcctggaca agggctataa caaggccctg aacgacctgt gcatcaaagt taacaactgg 1380

gacctgttct tcagccccag cgaggataat ttcaccaacg acctgaacaa aggcgaggaa 1440

atcaccagcg acaccaatat cgaggccgcc gaggaaaaca tcagcctgga cctgatccag 1500

cagtactacc tgaccttcaa tttcgataac gagcccgaga acatcagcat cgagaacctg 1560

agcagcgata tcatcggaca gctggaactg atgcccaaca tcgagagatt ccccaacggc 1620

aagaagtacg agctggacaa gtacaccatg ttccactacc tgcgggccca agagttcgag 1680

cacggcaagt ctagaatcgc cctgaccaac agcgtgaacg aggccctgct gaaccccagc 1740

agagtgtaca ccttcttcag cagcgactac gtgaagaaag tcaacaaggc tacagaggcc 1800

gccatgttcc tcggctgggt tgagcagctg gtgtacgact tcaccgacga gacaagcgag 1860

gtgtccacca ccgacaagat cgccgatatc accatcatca tcccttacat cggccctgct 1920

ctgaacatcg gcaacatgct gtataaggac gatttcgtgg gcgccctgat cttctctggc 1980

gccgtgattc tgctcgagtt catccctgag atcgctatcc ccgtgctggg cacatttgct 2040

ctggtgtctt atatcgccaa caaggtgctg acagtgcaga ccatcgacaa cgccctgagc 2100

aagcggaacg agaagtggga cgaagtgtac aagtacatcg tgaccaactg gctggccaaa 2160

gtgaataccc agatcgacct gattcggaag aagatgaagg aagccctcga gaaccaggcc 2220

gaggccacaa aggccatcat caactaccag tacaatcagt acacagagga agagaagaac 2280

aacatcaatt tcaacatcga cgacctgtcc tccaagctca acgagagcat caacaaagcc 2340

atgatcaata tcaacaagtt tctgaaccag tgcagcgtca gctacctgat gaacagcatg 2400

atcccctacg gcgtgaagcg gctggaagat ttcgatgcca gcctgaagga cgctctgctg 2460

aagtacatct acgataaccg gggcaccctg atcggccagg tggacagact gaaggacaaa 2520

gtgaacaata ccctgtccac cgacattccg tttcagctga gcaaatacgt ggacaaccag 2580

agactgctga gcacattcac cgagtatatc aagaatatca tcaacacctc catcctgaac 2640

ctccgctacg agagcaacca cctgatcgat ctgagcagat acgccagcaa gatcaatatt 2700

ggctctaaag tgaacttcga cccgatcgac aagaaccaga tccagctgtt caatctcgag 2760

tctagcaaga tcgaagtgat cctgaagaac gccatcgtgt acaactctat gtacgagaac 2820

ttctccacca gcttttggat cagaatcccc aagtacttca acagcatctc cctgaacaac 2880

gagtacacga tcatcaattg catggaaaac aactccggct ggaaagtgtc cctgaactac 2940

ggcgagatca tctggacact gcaggacacc caagagatca agcagagagt ggtgttcaag 3000

tactctcaga tgatcaacat tagcgactac atcaaccggt ggatcttcgt gaccatcacc 3060

aacaaccggc tgaacaactc caagatctac atcaatggcc ggctcatcga ccagaagcct 3120

atcagcaacc tgggaaacat ccacgcctcc aacaatatca tgttcaagct ggacggctgc 3180

cgggacaccc accggtatat ctggatcaag tactttaacc tgttcgacaa agagctgaac 3240

gagaaagaga ttaaggacct gtacgacaac cagtccaaca gcggcatcct gaaggatttc 3300

tggggcgact acctgcagta tgacaagccc tactacatgc tgaatctgta cgaccccaac 3360

aaatatgtgg acgtgaacaa cgtggggatc agaggctaca tgtacctgaa aggccccaga 3420

ggcagcgtga tgaccaccaa catctacctg aactccagcc tgtacagagg caccaagttc 3480

atcatcaaga agtatgcctc cggcaacaag gacaacattg tgcggaacaa cgaccgggtg 3540

tacattaacg tggtggtcaa gaacaaagag taccggctgg ccaccaatgc ctctcaggca 3600

ggcgtggaaa agatcctgag cgccctggaa atccccgacg tgggcaatct gtctcaggtg 3660

gtcgtgatga agtccaagaa cgaccagggc atcacaaaca agtgcaagat gaacctccag 3720

gacaacaacg gcaacgacat cggctttatc ggcttccacc agtttaacaa cattgccaag 3780

ctggtcgcca gcaactggta caaccggcag atcgagagaa gcagcagaac cctgggctgc 3840

agctgggagt ttatccctgt ggatgatggc tggggcgaaa gacccctgta a 3891

<210> 51

<211> 3876

<212> DNA

<213> 肉毒梭菌(Clostridium botulinum)

<400> 51

atgccagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt 60

atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca 120

gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat 180

aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat 240

actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa 300

tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga 360

gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa 420

ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata 480

tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat 540

tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta 600

agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat 660

ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat 720

ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct 780

acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata 840

actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt 900

gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat 960

aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata 1020

gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat 1080

atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca 1140

gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata 1200

tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct 1260

tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtgtt 1320

aaagctccag gaatatgtat tgatgttgat aatgaagatt tgttctttat agctgataaa 1380

aatagttttt cagatgattt atctaaaaac gaaagaatag aatataatac acagagtaat 1440

tatatagaaa atgacttccc tataaatgaa ttaattttag atactgattt aataagtaaa 1500

atagaattac caagtgaaaa tacagaatca cttactgatt ttaatgtaga tgttccagta 1560

tatgaaaaac aacccgctat aaaaaaaatt tttacagatg aaaataccat ctttcaatat 1620

ttatactctc agacatttcc tctagatata agagatataa gtttaacatc ttcatttgat 1680

gatgcattat tattttctaa caaagtttat tcattttttt ctatggatta tattaaaact 1740

gctaataaag tggtagaagc aggattattt gcaggttggg tgaaacagat agtaaatgat 1800

tttgtaatcg aagctaataa aagcaatact atggataaaa ttgcagatat atctctaatt 1860

gttccttata taggattagc tttaaatgta ggaaatgaaa cagctaaagg aaattttgaa 1920

aatgcttttg agattgcagg agccagtatt ctactagaat ttataccaga acttttaata 1980

cctgtagttg gagccttttt attagaatca tatattgaca ataaaaataa aattattaaa 2040

acaatagata atgctttaac taaaagaaat gaaaaatgga gtgatatgta cggattaata 2100

gtagcgcaat ggctctcaac agttaatact caattttata caataaaaga gggaatgtat 2160

aaggctttaa attatcaagc acaagcattg gaagaaataa taaaatacag atataatata 2220

tattctgaaa aagaaaagtc aaatattaac atcgatttta atgatataaa ttctaaactt 2280

aatgagggta ttaaccaagc tatagataat ataaataatt ttataaatgg atgttctgta 2340

tcatatttaa tgaaaaaaat gattccatta gctgtagaaa aattactaga ctttgataat 2400

actctcaaaa aaaatttgtt aaattatata gatgaaaata aattatattt gattggaagt 2460

gcagaatatg aaaaatcaaa agtaaataaa tacttgaaaa ccattatgcc gtttgatctt 2520

tcaatatata ccaatgatac aatactaata gaaatgttta ataaatataa tagcgaaatt 2580

ttaaataata ttatcttaaa tttaagatat aaggataata atttaataga tttatcagga 2640

tatggggcaa aggtagaggt atatgatgga gtcgagctta atgataaaaa tcaatttaaa 2700

ttaactagtt cagcaaatag taagattaga gtgactcaaa atcagaatat catatttaat 2760

agtgtgttcc ttgattttag cgttagcttt tggataagaa tacctaaata taagaatgat 2820

ggtatacaaa attatattca taatgaatat acaataatta attgtatgaa aaataattcg 2880

ggctggaaaa tatctattag gggtaatagg ataatatgga ctttaattga tataaatgga 2940

aaaaccaaat cggtattttt tgaatataac ataagagaag atatatcaga gtatataaat 3000

agatggtttt ttgtaactat tactaataat ttgaataacg ctaaaattta tattaatggt 3060

aagctagaat caaatacaga tattaaagat ataagagaag ttattgctaa tggtgaaata 3120

atatttaaat tagatggtga tatagataga acacaattta tttggatgaa atatttcagt 3180

atttttaata cggaattaag tcaatcaaat attgaagaaa gatataaaat tcaatcatat 3240

agcgaatatt taaaagattt ttggggaaat cctttaatgt acaataaaga atattatatg 3300

tttaatgcgg ggaataaaaa ttcatatatt aaactaaaga aagattcacc tgtaggtgaa 3360

attttaacac gtagcaaata taatcaaaat tctaaatata taaattatag agatttatat 3420

attggagaaa aatttattat aagaagaaag tcaaattctc aatctataaa tgatgatata 3480

gttagaaaag aagattatat atatctagat ttttttaatt taaatcaaga gtggagagta 3540

tatacctata aatattttaa gaaagaggaa gaaaaattgt ttttagctcc tataagtgat 3600

tctgatgagt tttacaatac tatacaaata aaagaatatg atgaacagcc aacatatagt 3660

tgtcagttgc tttttaaaaa agatgaagaa agtactgatg agataggatt gattggtatt 3720

catcgtttct acgaatctgg aattgtattt gaagagtata aagattattt ttgtataagt 3780

aaatggtact taaaagaggt aaaaaggaaa ccatataatt taaaattggg atgtaattgg 3840

cagtttattc ctaaagatga agggtggact gaataa 3876

<210> 52

<211> 3876

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成构建体

<400> 52

atgcccgtga ccatcaacaa cttcaactac aacgacccca tcgacaacaa caacatcatt 60

atgatggaac cgcctttcgc cagaggcaca ggccggtact acaaggcctt caagatcacc 120

gaccggatct ggatcatccc cgagagatac accttcggct acaagcccga ggacttcaac 180

aagagcagcg gcatcttcaa ccgggacgtg tgcgagtact acgaccccga ctacctgaac 240

accaacgaca agaagaacat cttcctgcag accatgatca agctgttcaa ccggatcaag 300

agcaagcccc tgggcgagaa gctgctggaa atgatcatca acggcatccc ttacctgggc 360

gacagaagag tgcccctgga agagttcaac accaatatcg ccagcgtgac cgtgaacaag 420

ctgatctcta accccggcga ggtggaacgg aagaagggca tcttcgccaa cctgatcatc 480

ttcggccctg gacctgtgct gaacgagaac gagacaatcg acatcggcat ccagaaccac 540

ttcgccagca gagaaggctt cggcggcatc atgcagatga agttctgccc cgagtacgtg 600

tccgtgttca acaacgtgca agagaacaag ggcgccagca tctttaacag acggggctac 660

ttcagcgacc ccgctctgat tctgatgcac gagctgatcc acgtgctgca cggcctgtat 720

ggcatcaagg tggacgacct gcctatcgtg cccaacgaga agaaattctt catgcagtcc 780

accgacgcca tccaggccga ggaactgtac acatttggcg gacaggaccc cagcatcatc 840

acccctagca ccgacaagag catctacgac aaggtgctgc agaatttccg gggcatcgtg 900

gaccggctga acaaagtgct cgtgtgcatc agcgatccca acatcaatat caacatctac 960

aagaacaagt tcaaggataa gtacaagttc gtcgaggaca gcgagggcaa gtacagcatc 1020

gacgtggaaa gcttcgacaa gctgtacaag agcctgatgt tcggcttcac cgagacaaat 1080

atcgccgaga actacaagat caagacccgg gccagctact tctccgactc tctgcctcct 1140

gtgaagatta agaacctgct ggacaacgag atctacacca tcgaggaagg cttcaacatc 1200

agcgacaagg acatggaaaa agagtaccgg ggccagaaca aggccattaa caagcaggcc 1260

tacgaggaaa tcagcaaaga acacctggcc gtgtacaaga ttcagatgtg caagagcgtg 1320

aaggcccctg gcatctgcat tgacgtggac aatgaggacc tgttctttat cgccgacaag 1380

aacagcttta gcgacgacct gagcaagaac gagcggatcg agtacaacac ccagagcaac 1440

tacatcgaga acgacttccc catcaacgaa ctgatcctgg acaccgacct gatcagcaag 1500

atcgagctgc ccagcgagaa caccgagagc ctgaccgact tcaatgtgga cgtgcccgtg 1560

tacgagaagc agcccgccat caagaagatc tttaccgacg agaataccat cttccagtac 1620

ctgtacagcc agacctttcc tctggacatc cgggacatca gcctgacctc cagcttcgat 1680

gatgccctgc tgttcagcaa caaggtctac agcttcttca gcatggacta catcaagacc 1740

gccaacaagg tggtggaagc cggcctgttt gccggctggg ttaagcagat cgtgaacgat 1800

ttcgtgatcg aggccaacaa gtccaacacc atggacaaga tcgccgatat ctccctgatc 1860

gtgccctaca tcggactggc cctgaacgtg ggaaacgaga cagccaaggg caacttcgag 1920

aatgccttcg agattgccgg cgctagcatc ctgctcgagt tcatccctga gctgctgatc 1980

cctgtcgtgg gcgcttttct gctggaatcc tacatcgata acaaaaacaa gatcatcaag 2040

acgatcgaca acgccctgac caagcggaac gagaagtgga gcgatatgta cggactgatc 2100

gtggcccagt ggctgagcac cgtgaatacc cagttttaca ccatcaaaga agggatgtac 2160

aaggccctga attaccaggc tcaggctctg gaagagatca ttaagtaccg ctacaatatc 2220

tacagcgaga aagagaagtc taacatcaac atcgacttca acgacatcaa cagcaagctc 2280

aacgagggca tcaaccaggc cattgacaac attaacaact ttatcaacgg ctgcagcgtg 2340

tcctacctga tgaagaagat gattcctctg gccgtggaaa agctgctcga cttcgacaat 2400

accctgaaga agaacctcct gaactacatt gacgagaaca agctctacct gatcggcagc 2460

gccgagtacg agaaaagcaa agtgaacaag tacctcaaga ccatcatgcc cttcgacctg 2520

tccatctaca caaacgacac catcctgatc gagatgttta acaagtacaa cagcgagatc 2580

ctgaacaata tcatcctgaa cctgcggtac aaggacaaca atctgatcga tctgagcggc 2640

tacggcgcca aggtggaagt gtatgatggc gtggaactga acgataagaa tcagttcaag 2700

ctgaccagca gcgccaactc caagatcaga gtgacccaga accagaacat tatcttcaac 2760

agcgtgttcc tggacttctc cgtgtccttc tggatcagaa tccccaagta caagaacgac 2820

ggcattcaga actacatcca caacgagtac acaatcatca actgtatgaa gaacaacagc 2880

ggctggaaga tcagcatccg gggcaacaga atcatctgga ccctgatcga catcaatggc 2940

aagacaaaga gcgtgttctt cgagtataac atccgcgagg acatctccga gtacatcaac 3000

cggtggttct tcgtgacaat caccaacaac ctgaacaacg ccaagatcta catcaacggg 3060

aagctcgaga gcaacaccga catcaaggat atccgggaag tgatcgccaa cggcgagatc 3120

atctttaagc tggacggcga catcgaccgg acacagttca tctggatgaa gtacttttcc 3180

atcttcaata ccgagctgag ccagagcaat atcgaagaga ggtacaagat ccagtcttac 3240

agcgagtacc tgaaggactt ctggggcaac cctctgatgt acaacaaaga atattacatg 3300

ttcaacgccg gcaacaagaa ctcttacatc aagctgaaga aagacagccc cgtgggagaa 3360

atcctgacca ggtctaagta caaccagaac tccaagtata tcaactaccg ggacctgtac 3420

atcggcgaga agttcatcat ccggcgcaag agcaacagcc agtccatcaa tgacgacatc 3480

gtgcggaaag aggactatat ctacctcgac ttcttcaacc tcaatcaaga gtggcgcgtg 3540

tacacctaca agtactttaa gaaagaggaa gagaagctgt tcctggctcc tatcagcgac 3600

tccgacgagt tctacaatac catccagatc aaagagtacg acgagcagcc cacctacagc 3660

tgccagctgc tgtttaagaa ggacgaggaa tccaccgatg agatcggcct gattggcatc 3720

caccggttct acgagagcgg catcgtgttc gaagagtaca aggattactt ctgcatcagc 3780

aagtggtatc tgaaagaagt gaagcggaag ccctacaatc tgaagctggg ctgcaactgg 3840

cagtttatcc ccaaggacga aggctggacc gagtga 3876

<210> 53

<211> 2477

<212> PRT

<213> 智人(Homo sapiens)

<400> 53

Met Leu Arg Gly Pro Gly Pro Gly Leu Leu Leu Leu Ala Val Gln Cys

1 5 10 15

Leu Gly Thr Ala Val Pro Ser Thr Gly Ala Ser Lys Ser Lys Arg Gln

20 25 30

Ala Gln Gln Met Val Gln Pro Gln Ser Pro Val Ala Val Ser Gln Ser

35 40 45

Lys Pro Gly Cys Tyr Asp Asn Gly Lys His Tyr Gln Ile Asn Gln Gln

50 55 60

Trp Glu Arg Thr Tyr Leu Gly Asn Ala Leu Val Cys Thr Cys Tyr Gly

65 70 75 80

Gly Ser Arg Gly Phe Asn Cys Glu Ser Lys Pro Glu Ala Glu Glu Thr

85 90 95

Cys Phe Asp Lys Tyr Thr Gly Asn Thr Tyr Arg Val Gly Asp Thr Tyr

100 105 110

Glu Arg Pro Lys Asp Ser Met Ile Trp Asp Cys Thr Cys Ile Gly Ala

115 120 125

Gly Arg Gly Arg Ile Ser Cys Thr Ile Ala Asn Arg Cys His Glu Gly

130 135 140

Gly Gln Ser Tyr Lys Ile Gly Asp Thr Trp Arg Arg Pro His Glu Thr

145 150 155 160

Gly Gly Tyr Met Leu Glu Cys Val Cys Leu Gly Asn Gly Lys Gly Glu

165 170 175

Trp Thr Cys Lys Pro Ile Ala Glu Lys Cys Phe Asp His Ala Ala Gly

180 185 190

Thr Ser Tyr Val Val Gly Glu Thr Trp Glu Lys Pro Tyr Gln Gly Trp

195 200 205

Met Met Val Asp Cys Thr Cys Leu Gly Glu Gly Ser Gly Arg Ile Thr

210 215 220

Cys Thr Ser Arg Asn Arg Cys Asn Asp Gln Asp Thr Arg Thr Ser Tyr

225 230 235 240

Arg Ile Gly Asp Thr Trp Ser Lys Lys Asp Asn Arg Gly Asn Leu Leu

245 250 255

Gln Cys Ile Cys Thr Gly Asn Gly Arg Gly Glu Trp Lys Cys Glu Arg

260 265 270

His Thr Ser Val Gln Thr Thr Ser Ser Gly Ser Gly Pro Phe Thr Asp

275 280 285

Val Arg Ala Ala Val Tyr Gln Pro Gln Pro His Pro Gln Pro Pro Pro

290 295 300

Tyr Gly His Cys Val Thr Asp Ser Gly Val Val Tyr Ser Val Gly Met

305 310 315 320

Gln Trp Leu Lys Thr Gln Gly Asn Lys Gln Met Leu Cys Thr Cys Leu

325 330 335

Gly Asn Gly Val Ser Cys Gln Glu Thr Ala Val Thr Gln Thr Tyr Gly

340 345 350

Gly Asn Ser Asn Gly Glu Pro Cys Val Leu Pro Phe Thr Tyr Asn Gly

355 360 365

Arg Thr Phe Tyr Ser Cys Thr Thr Glu Gly Arg Gln Asp Gly His Leu

370 375 380

Trp Cys Ser Thr Thr Ser Asn Tyr Glu Gln Asp Gln Lys Tyr Ser Phe

385 390 395 400

Cys Thr Asp His Thr Val Leu Val Gln Thr Arg Gly Gly Asn Ser Asn

405 410 415

Gly Ala Leu Cys His Phe Pro Phe Leu Tyr Asn Asn His Asn Tyr Thr

420 425 430

Asp Cys Thr Ser Glu Gly Arg Arg Asp Asn Met Lys Trp Cys Gly Thr

435 440 445

Thr Gln Asn Tyr Asp Ala Asp Gln Lys Phe Gly Phe Cys Pro Met Ala

450 455 460

Ala His Glu Glu Ile Cys Thr Thr Asn Glu Gly Val Met Tyr Arg Ile

465 470 475 480

Gly Asp Gln Trp Asp Lys Gln His Asp Met Gly His Met Met Arg Cys

485 490 495

Thr Cys Val Gly Asn Gly Arg Gly Glu Trp Thr Cys Ile Ala Tyr Ser

500 505 510

Gln Leu Arg Asp Gln Cys Ile Val Asp Asp Ile Thr Tyr Asn Val Asn

515 520 525

Asp Thr Phe His Lys Arg His Glu Glu Gly His Met Leu Asn Cys Thr

530 535 540

Cys Phe Gly Gln Gly Arg Gly Arg Trp Lys Cys Asp Pro Val Asp Gln

545 550 555 560

Cys Gln Asp Ser Glu Thr Gly Thr Phe Tyr Gln Ile Gly Asp Ser Trp

565 570 575

Glu Lys Tyr Val His Gly Val Arg Tyr Gln Cys Tyr Cys Tyr Gly Arg

580 585 590

Gly Ile Gly Glu Trp His Cys Gln Pro Leu Gln Thr Tyr Pro Ser Ser

595 600 605

Ser Gly Pro Val Glu Val Phe Ile Thr Glu Thr Pro Ser Gln Pro Asn

610 615 620

Ser His Pro Ile Gln Trp Asn Ala Pro Gln Pro Ser His Ile Ser Lys

625 630 635 640

Tyr Ile Leu Arg Trp Arg Pro Lys Asn Ser Val Gly Arg Trp Lys Glu

645 650 655

Ala Thr Ile Pro Gly His Leu Asn Ser Tyr Thr Ile Lys Gly Leu Lys

660 665 670

Pro Gly Val Val Tyr Glu Gly Gln Leu Ile Ser Ile Gln Gln Tyr Gly

675 680 685

His Gln Glu Val Thr Arg Phe Asp Phe Thr Thr Thr Ser Thr Ser Thr

690 695 700

Pro Val Thr Ser Asn Thr Val Thr Gly Glu Thr Thr Pro Phe Ser Pro

705 710 715 720

Leu Val Ala Thr Ser Glu Ser Val Thr Glu Ile Thr Ala Ser Ser Phe

725 730 735

Val Val Ser Trp Val Ser Ala Ser Asp Thr Val Ser Gly Phe Arg Val

740 745 750

Glu Tyr Glu Leu Ser Glu Glu Gly Asp Glu Pro Gln Tyr Leu Asp Leu

755 760 765

Pro Ser Thr Ala Thr Ser Val Asn Ile Pro Asp Leu Leu Pro Gly Arg

770 775 780

Lys Tyr Ile Val Asn Val Tyr Gln Ile Ser Glu Asp Gly Glu Gln Ser

785 790 795 800

Leu Ile Leu Ser Thr Ser Gln Thr Thr Ala Pro Asp Ala Pro Pro Asp

805 810 815

Pro Thr Val Asp Gln Val Asp Asp Thr Ser Ile Val Val Arg Trp Ser

820 825 830

Arg Pro Gln Ala Pro Ile Thr Gly Tyr Arg Ile Val Tyr Ser Pro Ser

835 840 845

Val Glu Gly Ser Ser Thr Glu Leu Asn Leu Pro Glu Thr Ala Asn Ser

850 855 860

Val Thr Leu Ser Asp Leu Gln Pro Gly Val Gln Tyr Asn Ile Thr Ile

865 870 875 880

Tyr Ala Val Glu Glu Asn Gln Glu Ser Thr Pro Val Val Ile Gln Gln

885 890 895

Glu Thr Thr Gly Thr Pro Arg Ser Asp Thr Val Pro Ser Pro Arg Asp

900 905 910

Leu Gln Phe Val Glu Val Thr Asp Val Lys Val Thr Ile Met Trp Thr

915 920 925

Pro Pro Glu Ser Ala Val Thr Gly Tyr Arg Val Asp Val Ile Pro Val

930 935 940

Asn Leu Pro Gly Glu His Gly Gln Arg Leu Pro Ile Ser Arg Asn Thr

945 950 955 960

Phe Ala Glu Val Thr Gly Leu Ser Pro Gly Val Thr Tyr Tyr Phe Lys

965 970 975

Val Phe Ala Val Ser His Gly Arg Glu Ser Lys Pro Leu Thr Ala Gln

980 985 990

Gln Thr Thr Lys Leu Asp Ala Pro Thr Asn Leu Gln Phe Val Asn Glu

995 1000 1005

Thr Asp Ser Thr Val Leu Val Arg Trp Thr Pro Pro Arg Ala Gln Ile

1010 1015 1020

Thr Gly Tyr Arg Leu Thr Val Gly Leu Thr Arg Arg Gly Gln Pro Arg

1025 1030 1035 1040

Gln Tyr Asn Val Gly Pro Ser Val Ser Lys Tyr Pro Leu Arg Asn Leu

1045 1050 1055

Gln Pro Ala Ser Glu Tyr Thr Val Ser Leu Val Ala Ile Lys Gly Asn

1060 1065 1070

Gln Glu Ser Pro Lys Ala Thr Gly Val Phe Thr Thr Leu Gln Pro Gly

1075 1080 1085

Ser Ser Ile Pro Pro Tyr Asn Thr Glu Val Thr Glu Thr Thr Ile Val

1090 1095 1100

Ile Thr Trp Thr Pro Ala Pro Arg Ile Gly Phe Lys Leu Gly Val Arg

1105 1110 1115 1120

Pro Ser Gln Gly Gly Glu Ala Pro Arg Glu Val Thr Ser Asp Ser Gly

1125 1130 1135

Ser Ile Val Val Ser Gly Leu Thr Pro Gly Val Glu Tyr Val Tyr Thr

1140 1145 1150

Ile Gln Val Leu Arg Asp Gly Gln Glu Arg Asp Ala Pro Ile Val Asn

1155 1160 1165

Lys Val Val Thr Pro Leu Ser Pro Pro Thr Asn Leu His Leu Glu Ala

1170 1175 1180

Asn Pro Asp Thr Gly Val Leu Thr Val Ser Trp Glu Arg Ser Thr Thr

1185 1190 1195 1200

Pro Asp Ile Thr Gly Tyr Arg Ile Thr Thr Thr Pro Thr Asn Gly Gln

1205 1210 1215

Gln Gly Asn Ser Leu Glu Glu Val Val His Ala Asp Gln Ser Ser Cys

1220 1225 1230

Thr Phe Asp Asn Leu Ser Pro Gly Leu Glu Tyr Asn Val Ser Val Tyr

1235 1240 1245

Thr Val Lys Asp Asp Lys Glu Ser Val Pro Ile Ser Asp Thr Ile Ile

1250 1255 1260

Pro Glu Val Pro Gln Leu Thr Asp Leu Ser Phe Val Asp Ile Thr Asp

1265 1270 1275 1280

Ser Ser Ile Gly Leu Arg Trp Thr Pro Leu Asn Ser Ser Thr Ile Ile

1285 1290 1295

Gly Tyr Arg Ile Thr Val Val Ala Ala Gly Glu Gly Ile Pro Ile Phe

1300 1305 1310

Glu Asp Phe Val Asp Ser Ser Val Gly Tyr Tyr Thr Val Thr Gly Leu

1315 1320 1325

Glu Pro Gly Ile Asp Tyr Asp Ile Ser Val Ile Thr Leu Ile Asn Gly

1330 1335 1340

Gly Glu Ser Ala Pro Thr Thr Leu Thr Gln Gln Thr Ala Val Pro Pro

1345 1350 1355 1360

Pro Thr Asp Leu Arg Phe Thr Asn Ile Gly Pro Asp Thr Met Arg Val

1365 1370 1375

Thr Trp Ala Pro Pro Pro Ser Ile Asp Leu Thr Asn Phe Leu Val Arg

1380 1385 1390

Tyr Ser Pro Val Lys Asn Glu Glu Asp Val Ala Glu Leu Ser Ile Ser

1395 1400 1405

Pro Ser Asp Asn Ala Val Val Leu Thr Asn Leu Leu Pro Gly Thr Glu

1410 1415 1420

Tyr Val Val Ser Val Ser Ser Val Tyr Glu Gln His Glu Ser Thr Pro

1425 1430 1435 1440

Leu Arg Gly Arg Gln Lys Thr Gly Leu Asp Ser Pro Thr Gly Ile Asp

1445 1450 1455

Phe Ser Asp Ile Thr Ala Asn Ser Phe Thr Val His Trp Ile Ala Pro

1460 1465 1470

Arg Ala Thr Ile Thr Gly Tyr Arg Ile Arg His His Pro Glu His Phe

1475 1480 1485

Ser Gly Arg Pro Arg Glu Asp Arg Val Pro His Ser Arg Asn Ser Ile

1490 1495 1500

Thr Leu Thr Asn Leu Thr Pro Gly Thr Glu Tyr Val Val Ser Ile Val

1505 1510 1515 1520

Ala Leu Asn Gly Arg Glu Glu Ser Pro Leu Leu Ile Gly Gln Gln Ser

1525 1530 1535

Thr Val Ser Asp Val Pro Arg Asp Leu Glu Val Val Ala Ala Thr Pro

1540 1545 1550

Thr Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Arg Tyr

1555 1560 1565

Tyr Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu

1570 1575 1580

Phe Thr Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys

1585 1590 1595 1600

Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Gly Arg Gly

1605 1610 1615

Asp Ser Pro Ala Ser Ser Lys Pro Ile Ser Ile Asn Tyr Arg Thr Glu

1620 1625 1630

Ile Asp Lys Pro Ser Gln Met Gln Val Thr Asp Val Gln Asp Asn Ser

1635 1640 1645

Ile Ser Val Lys Trp Leu Pro Ser Ser Ser Pro Val Thr Gly Tyr Arg

1650 1655 1660

Val Thr Thr Thr Pro Lys Asn Gly Pro Gly Pro Thr Lys Thr Lys Thr

1665 1670 1675 1680

Ala Gly Pro Asp Gln Thr Glu Met Thr Ile Glu Gly Leu Gln Pro Thr

1685 1690 1695

Val Glu Tyr Val Val Ser Val Tyr Ala Gln Asn Pro Ser Gly Glu Ser

1700 1705 1710

Gln Pro Leu Val Gln Thr Ala Val Thr Asn Ile Asp Arg Pro Lys Gly

1715 1720 1725

Leu Ala Phe Thr Asp Val Asp Val Asp Ser Ile Lys Ile Ala Trp Glu

1730 1735 1740

Ser Pro Gln Gly Gln Val Ser Arg Tyr Arg Val Thr Tyr Ser Ser Pro

1745 1750 1755 1760

Glu Asp Gly Ile His Glu Leu Phe Pro Ala Pro Asp Gly Glu Glu Asp

1765 1770 1775

Thr Ala Glu Leu Gln Gly Leu Arg Pro Gly Ser Glu Tyr Thr Val Ser

1780 1785 1790

Val Val Ala Leu His Asp Asp Met Glu Ser Gln Pro Leu Ile Gly Thr

1795 1800 1805

Gln Ser Thr Ala Ile Pro Ala Pro Thr Asp Leu Lys Phe Thr Gln Val

1810 1815 1820

Thr Pro Thr Ser Leu Ser Ala Gln Trp Thr Pro Pro Asn Val Gln Leu

1825 1830 1835 1840

Thr Gly Tyr Arg Val Arg Val Thr Pro Lys Glu Lys Thr Gly Pro Met

1845 1850 1855

Lys Glu Ile Asn Leu Ala Pro Asp Ser Ser Ser Val Val Val Ser Gly

1860 1865 1870

Leu Met Val Ala Thr Lys Tyr Glu Val Ser Val Tyr Ala Leu Lys Asp

1875 1880 1885

Thr Leu Thr Ser Arg Pro Ala Gln Gly Val Val Thr Thr Leu Glu Asn

1890 1895 1900

Val Ser Pro Pro Arg Arg Ala Arg Val Thr Asp Ala Thr Glu Thr Thr

1905 1910 1915 1920

Ile Thr Ile Ser Trp Arg Thr Lys Thr Glu Thr Ile Thr Gly Phe Gln

1925 1930 1935

Val Asp Ala Val Pro Ala Asn Gly Gln Thr Pro Ile Gln Arg Thr Ile

1940 1945 1950

Lys Pro Asp Val Arg Ser Tyr Thr Ile Thr Gly Leu Gln Pro Gly Thr

1955 1960 1965

Asp Tyr Lys Ile Tyr Leu Tyr Thr Leu Asn Asp Asn Ala Arg Ser Ser

1970 1975 1980

Pro Val Val Ile Asp Ala Ser Thr Ala Ile Asp Ala Pro Ser Asn Leu

1985 1990 1995 2000

Arg Phe Leu Ala Thr Thr Pro Asn Ser Leu Leu Val Ser Trp Gln Pro

2005 2010 2015

Pro Arg Ala Arg Ile Thr Gly Tyr Ile Ile Lys Tyr Glu Lys Pro Gly

2020 2025 2030

Ser Pro Pro Arg Glu Val Val Pro Arg Pro Arg Pro Gly Val Thr Glu

2035 2040 2045

Ala Thr Ile Thr Gly Leu Glu Pro Gly Thr Glu Tyr Thr Ile Tyr Val

2050 2055 2060

Ile Ala Leu Lys Asn Asn Gln Lys Ser Glu Pro Leu Ile Gly Arg Lys

2065 2070 2075 2080

Lys Thr Asp Glu Leu Pro Gln Leu Val Thr Leu Pro His Pro Asn Leu

2085 2090 2095

His Gly Pro Glu Ile Leu Asp Val Pro Ser Thr Val Gln Lys Thr Pro

2100 2105 2110

Phe Val Thr His Pro Gly Tyr Asp Thr Gly Asn Gly Ile Gln Leu Pro

2115 2120 2125

Gly Thr Ser Gly Gln Gln Pro Ser Val Gly Gln Gln Met Ile Phe Glu

2130 2135 2140

Glu His Gly Phe Arg Arg Thr Thr Pro Pro Thr Thr Ala Thr Pro Ile

2145 2150 2155 2160

Arg His Arg Pro Arg Pro Tyr Pro Pro Asn Val Gly Glu Glu Ile Gln

2165 2170 2175

Ile Gly His Ile Pro Arg Glu Asp Val Asp Tyr His Leu Tyr Pro His

2180 2185 2190

Gly Pro Gly Leu Asn Pro Asn Ala Ser Thr Gly Gln Glu Ala Leu Ser

2195 2200 2205

Gln Thr Thr Ile Ser Trp Ala Pro Phe Gln Asp Thr Ser Glu Tyr Ile

2210 2215 2220

Ile Ser Cys His Pro Val Gly Thr Asp Glu Glu Pro Leu Gln Phe Arg

2225 2230 2235 2240

Val Pro Gly Thr Ser Thr Ser Ala Thr Leu Thr Gly Leu Thr Arg Gly

2245 2250 2255

Ala Thr Tyr Asn Ile Ile Val Glu Ala Leu Lys Asp Gln Gln Arg His

2260 2265 2270

Lys Val Arg Glu Glu Val Val Thr Val Gly Asn Ser Val Asn Glu Gly

2275 2280 2285

Leu Asn Gln Pro Thr Asp Asp Ser Cys Phe Asp Pro Tyr Thr Val Ser

2290 2295 2300

His Tyr Ala Val Gly Asp Glu Trp Glu Arg Met Ser Glu Ser Gly Phe

2305 2310 2315 2320

Lys Leu Leu Cys Gln Cys Leu Gly Phe Gly Ser Gly His Phe Arg Cys

2325 2330 2335

Asp Ser Ser Arg Trp Cys His Asp Asn Gly Val Asn Tyr Lys Ile Gly

2340 2345 2350

Glu Lys Trp Asp Arg Gln Gly Glu Asn Gly Gln Met Met Ser Cys Thr

2355 2360 2365

Cys Leu Gly Asn Gly Lys Gly Glu Phe Lys Cys Asp Pro His Glu Ala

2370 2375 2380

Thr Cys Tyr Asp Asp Gly Lys Thr Tyr His Val Gly Glu Gln Trp Gln

2385 2390 2395 2400

Lys Glu Tyr Leu Gly Ala Ile Cys Ser Cys Thr Cys Phe Gly Gly Gln

2405 2410 2415

Arg Gly Trp Arg Cys Asp Asn Cys Arg Arg Pro Gly Gly Glu Pro Ser

2420 2425 2430

Pro Glu Gly Thr Thr Gly Gln Ser Tyr Asn Gln Tyr Ser Gln Arg Tyr

2435 2440 2445

His Gln Arg Thr Asn Thr Asn Val Asn Cys Pro Ile Glu Cys Phe Met

2450 2455 2460

Pro Leu Asp Val Gln Ala Asp Arg Glu Asp Ser Arg Glu

2465 2470 2475

<210> 54

<211> 786

<212> PRT

<213> 智人(Homo sapiens)

<400> 54

Met Ala Gly Leu Thr Ala Ala Ala Pro Arg Pro Gly Val Leu Leu Leu

1 5 10 15

Leu Leu Ser Ile Leu His Pro Ser Arg Pro Gly Gly Val Pro Gly Ala

20 25 30

Ile Pro Gly Gly Val Pro Gly Gly Val Phe Tyr Pro Gly Ala Gly Leu

35 40 45

Gly Ala Leu Gly Gly Gly Ala Leu Gly Pro Gly Gly Lys Pro Leu Lys

50 55 60

Pro Val Pro Gly Gly Leu Ala Gly Ala Gly Leu Gly Ala Gly Leu Gly

65 70 75 80

Ala Phe Pro Ala Val Thr Phe Pro Gly Ala Leu Val Pro Gly Gly Val

85 90 95

Ala Asp Ala Ala Ala Ala Tyr Lys Ala Ala Lys Ala Gly Ala Gly Leu

100 105 110

Gly Gly Val Pro Gly Val Gly Gly Leu Gly Val Ser Ala Gly Ala Val

115 120 125

Val Pro Gln Pro Gly Ala Gly Val Lys Pro Gly Lys Val Pro Gly Val

130 135 140

Gly Leu Pro Gly Val Tyr Pro Gly Gly Val Leu Pro Gly Ala Arg Phe

145 150 155 160

Pro Gly Val Gly Val Leu Pro Gly Val Pro Thr Gly Ala Gly Val Lys

165 170 175

Pro Lys Ala Pro Gly Val Gly Gly Ala Phe Ala Gly Ile Pro Gly Val

180 185 190

Gly Pro Phe Gly Gly Pro Gln Pro Gly Val Pro Leu Gly Tyr Pro Ile

195 200 205

Lys Ala Pro Lys Leu Pro Gly Gly Tyr Gly Leu Pro Tyr Thr Thr Gly

210 215 220

Lys Leu Pro Tyr Gly Tyr Gly Pro Gly Gly Val Ala Gly Ala Ala Gly

225 230 235 240

Lys Ala Gly Tyr Pro Thr Gly Thr Gly Val Gly Pro Gln Ala Ala Ala

245 250 255

Ala Ala Ala Ala Lys Ala Ala Ala Lys Phe Gly Ala Gly Ala Ala Gly

260 265 270

Val Leu Pro Gly Val Gly Gly Ala Gly Val Pro Gly Val Pro Gly Ala

275 280 285

Ile Pro Gly Ile Gly Gly Ile Ala Gly Val Gly Thr Pro Ala Ala Ala

290 295 300

Ala Ala Ala Ala Ala Ala Ala Lys Ala Ala Lys Tyr Gly Ala Ala Ala

305 310 315 320

Gly Leu Val Pro Gly Gly Pro Gly Phe Gly Pro Gly Val Val Gly Val

325 330 335

Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Ala Gly Ile Pro

340 345 350

Val Val Pro Gly Ala Gly Ile Pro Gly Ala Ala Val Pro Gly Val Val

355 360 365

Ser Pro Glu Ala Ala Ala Lys Ala Ala Ala Lys Ala Ala Lys Tyr Gly

370 375 380

Ala Arg Pro Gly Val Gly Val Gly Gly Ile Pro Thr Tyr Gly Val Gly

385 390 395 400

Ala Gly Gly Phe Pro Gly Phe Gly Val Gly Val Gly Gly Ile Pro Gly

405 410 415

Val Ala Gly Val Pro Gly Val Gly Gly Val Pro Gly Val Gly Gly Val

420 425 430

Pro Gly Val Gly Ile Ser Pro Glu Ala Gln Ala Ala Ala Ala Ala Lys

435 440 445

Ala Ala Lys Tyr Gly Ala Ala Gly Ala Gly Val Leu Gly Gly Leu Val

450 455 460

Pro Gly Ala Pro Gly Ala Val Pro Gly Val Pro Gly Thr Gly Gly Val

465 470 475 480

Pro Gly Val Gly Thr Pro Ala Ala Ala Ala Ala Lys Ala Ala Ala Lys

485 490 495

Ala Ala Gln Phe Gly Leu Val Pro Gly Val Gly Val Ala Pro Gly Val

500 505 510

Gly Val Ala Pro Gly Val Gly Val Ala Pro Gly Val Gly Leu Ala Pro

515 520 525

Gly Val Gly Val Ala Pro Gly Val Gly Val Ala Pro Gly Val Gly Val

530 535 540

Ala Pro Gly Ile Gly Pro Gly Gly Val Ala Ala Ala Ala Lys Ser Ala

545 550 555 560

Ala Lys Val Ala Ala Lys Ala Gln Leu Arg Ala Ala Ala Gly Leu Gly

565 570 575

Ala Gly Ile Pro Gly Leu Gly Val Gly Val Gly Val Pro Gly Leu Gly

580 585 590

Val Gly Ala Gly Val Pro Gly Leu Gly Val Gly Ala Gly Val Pro Gly

595 600 605

Phe Gly Ala Gly Ala Asp Glu Gly Val Arg Arg Ser Leu Ser Pro Glu

610 615 620

Leu Arg Glu Gly Asp Pro Ser Ser Ser Gln His Leu Pro Ser Thr Pro

625 630 635 640

Ser Ser Pro Arg Val Pro Gly Ala Leu Ala Ala Ala Lys Ala Ala Lys

645 650 655

Tyr Gly Ala Ala Val Pro Gly Val Leu Gly Gly Leu Gly Ala Leu Gly

660 665 670

Gly Val Gly Ile Pro Gly Gly Val Val Gly Ala Gly Pro Ala Ala Ala

675 680 685

Ala Ala Ala Ala Lys Ala Ala Ala Lys Ala Ala Gln Phe Gly Leu Val

690 695 700

Gly Ala Ala Gly Leu Gly Gly Leu Gly Val Gly Gly Leu Gly Val Pro

705 710 715 720

Gly Val Gly Gly Leu Gly Gly Ile Pro Pro Ala Ala Ala Ala Lys Ala

725 730 735

Ala Lys Tyr Gly Ala Ala Gly Leu Gly Gly Val Leu Gly Gly Ala Gly

740 745 750

Gln Phe Pro Leu Gly Gly Val Ala Ala Arg Pro Gly Phe Gly Leu Ser

755 760 765

Pro Ile Phe Pro Gly Gly Ala Cys Leu Gly Lys Ala Cys Gly Arg Lys

770 775 780

Arg Lys

785

<210> 55

<211> 338

<212> PRT

<213> 智人(Homo sapiens)

<400> 55

Met Ser Leu Ser Ala Phe Thr Leu Phe Leu Ala Leu Ile Gly Gly Thr

1 5 10 15

Ser Gly Gln Tyr Tyr Asp Tyr Asp Phe Pro Leu Ser Ile Tyr Gly Gln

20 25 30

Ser Ser Pro Asn Cys Ala Pro Glu Cys Asn Cys Pro Glu Ser Tyr Pro

35 40 45

Ser Ala Met Tyr Cys Asp Glu Leu Lys Leu Lys Ser Val Pro Met Val

50 55 60

Pro Pro Gly Ile Lys Tyr Leu Tyr Leu Arg Asn Asn Gln Ile Asp His

65 70 75 80

Ile Asp Glu Lys Ala Phe Glu Asn Val Thr Asp Leu Gln Trp Leu Ile

85 90 95

Leu Asp His Asn Leu Leu Glu Asn Ser Lys Ile Lys Gly Arg Val Phe

100 105 110

Ser Lys Leu Lys Gln Leu Lys Lys Leu His Ile Asn His Asn Asn Leu

115 120 125

Thr Glu Ser Val Gly Pro Leu Pro Lys Ser Leu Glu Asp Leu Gln Leu

130 135 140

Thr His Asn Lys Ile Thr Lys Leu Gly Ser Phe Glu Gly Leu Val Asn

145 150 155 160

Leu Thr Phe Ile His Leu Gln His Asn Arg Leu Lys Glu Asp Ala Val

165 170 175

Ser Ala Ala Phe Lys Gly Leu Lys Ser Leu Glu Tyr Leu Asp Leu Ser

180 185 190

Phe Asn Gln Ile Ala Arg Leu Pro Ser Gly Leu Pro Val Ser Leu Leu

195 200 205

Thr Leu Tyr Leu Asp Asn Asn Lys Ile Ser Asn Ile Pro Asp Glu Tyr

210 215 220

Phe Lys Arg Phe Asn Ala Leu Gln Tyr Leu Arg Leu Ser His Asn Glu

225 230 235 240

Leu Ala Asp Ser Gly Ile Pro Gly Asn Ser Phe Asn Val Ser Ser Leu

245 250 255

Val Glu Leu Asp Leu Ser Tyr Asn Lys Leu Lys Asn Ile Pro Thr Val

260 265 270

Asn Glu Asn Leu Glu Asn Tyr Tyr Leu Glu Val Asn Gln Leu Glu Lys

275 280 285

Phe Asp Ile Lys Ser Phe Cys Lys Ile Leu Gly Pro Leu Ser Tyr Ser

290 295 300

Lys Ile Lys His Leu Arg Leu Asp Gly Asn Arg Ile Ser Glu Thr Ser

305 310 315 320

Leu Pro Pro Asp Met Tyr Glu Cys Leu Arg Val Ala Asn Glu Val Thr

325 330 335

Leu Asn

<210> 56

<211> 478

<212> PRT

<213> 智人(Homo sapiens)

<400> 56

Met Ala Pro Leu Arg Pro Leu Leu Ile Leu Ala Leu Leu Ala Trp Val

1 5 10 15

Ala Leu Ala Asp Gln Glu Ser Cys Lys Gly Arg Cys Thr Glu Gly Phe

20 25 30

Asn Val Asp Lys Lys Cys Gln Cys Asp Glu Leu Cys Ser Tyr Tyr Gln

35 40 45

Ser Cys Cys Thr Asp Tyr Thr Ala Glu Cys Lys Pro Gln Val Thr Arg

50 55 60

Gly Asp Val Phe Thr Met Pro Glu Asp Glu Tyr Thr Val Tyr Asp Asp

65 70 75 80

Gly Glu Glu Lys Asn Asn Ala Thr Val His Glu Gln Val Gly Gly Pro

85 90 95

Ser Leu Thr Ser Asp Leu Gln Ala Gln Ser Lys Gly Asn Pro Glu Gln

100 105 110

Thr Pro Val Leu Lys Pro Glu Glu Glu Ala Pro Ala Pro Glu Val Gly

115 120 125

Ala Ser Lys Pro Glu Gly Ile Asp Ser Arg Pro Glu Thr Leu His Pro

130 135 140

Gly Arg Pro Gln Pro Pro Ala Glu Glu Glu Leu Cys Ser Gly Lys Pro

145 150 155 160

Phe Asp Ala Phe Thr Asp Leu Lys Asn Gly Ser Leu Phe Ala Phe Arg

165 170 175

Gly Gln Tyr Cys Tyr Glu Leu Asp Glu Lys Ala Val Arg Pro Gly Tyr

180 185 190

Pro Lys Leu Ile Arg Asp Val Trp Gly Ile Glu Gly Pro Ile Asp Ala

195 200 205

Ala Phe Thr Arg Ile Asn Cys Gln Gly Lys Thr Tyr Leu Phe Lys Gly

210 215 220

Ser Gln Tyr Trp Arg Phe Glu Asp Gly Val Leu Asp Pro Asp Tyr Pro

225 230 235 240

Arg Asn Ile Ser Asp Gly Phe Asp Gly Ile Pro Asp Asn Val Asp Ala

245 250 255

Ala Leu Ala Leu Pro Ala His Ser Tyr Ser Gly Arg Glu Arg Val Tyr

260 265 270

Phe Phe Lys Gly Lys Gln Tyr Trp Glu Tyr Gln Phe Gln His Gln Pro

275 280 285

Ser Gln Glu Glu Cys Glu Gly Ser Ser Leu Ser Ala Val Phe Glu His

290 295 300

Phe Ala Met Met Gln Arg Asp Ser Trp Glu Asp Ile Phe Glu Leu Leu

305 310 315 320

Phe Trp Gly Arg Thr Ser Ala Gly Thr Arg Gln Pro Gln Phe Ile Ser

325 330 335

Arg Asp Trp His Gly Val Pro Gly Gln Val Asp Ala Ala Met Ala Gly

340 345 350

Arg Ile Tyr Ile Ser Gly Met Ala Pro Arg Pro Ser Leu Ala Lys Lys

355 360 365

Gln Arg Phe Arg His Arg Asn Arg Lys Gly Tyr Arg Ser Gln Arg Gly

370 375 380

His Ser Arg Gly Arg Asn Gln Asn Ser Arg Arg Pro Ser Arg Ala Thr

385 390 395 400

Trp Leu Ser Leu Phe Ser Ser Glu Glu Ser Asn Leu Gly Ala Asn Asn

405 410 415

Tyr Asp Asp Tyr Arg Met Asp Trp Leu Val Pro Ala Thr Cys Glu Pro

420 425 430

Ile Gln Ser Val Phe Phe Phe Ser Gly Asp Lys Tyr Tyr Arg Val Asn

435 440 445

Leu Arg Thr Arg Arg Val Asp Thr Val Asp Pro Pro Tyr Pro Arg Ser

450 455 460

Ile Ala Gln Tyr Trp Leu Gly Cys Pro Ala Pro Gly His Leu

465 470 475

<210> 57

<211> 1724

<212> PRT

<213> 智人(Homo sapiens)

<400> 57

Met Pro Pro Ala Val Arg Arg Ser Ala Cys Ser Met Gly Trp Leu Trp

1 5 10 15

Ile Phe Gly Ala Ala Leu Gly Gln Cys Leu Gly Tyr Ser Ser Gln Gln

20 25 30

Gln Arg Val Pro Phe Leu Gln Pro Pro Gly Gln Ser Gln Leu Gln Ala

35 40 45

Ser Tyr Val Glu Phe Arg Pro Ser Gln Gly Cys Ser Pro Gly Tyr Tyr

50 55 60

Arg Asp His Lys Gly Leu Tyr Thr Gly Arg Cys Val Pro Cys Asn Cys

65 70 75 80

Asn Gly His Ser Asn Gln Cys Gln Asp Gly Ser Gly Ile Cys Val Asn

85 90 95

Cys Gln His Asn Thr Ala Gly Glu His Cys Glu Arg Cys Gln Glu Gly

100 105 110

Tyr Tyr Gly Asn Ala Val His Gly Ser Cys Arg Ala Cys Pro Cys Pro

115 120 125

His Thr Asn Ser Phe Ala Thr Gly Cys Val Val Asn Gly Gly Asp Val

130 135 140

Arg Cys Ser Cys Lys Ala Gly Tyr Thr Gly Thr Gln Cys Glu Arg Cys

145 150 155 160

Ala Pro Gly Tyr Phe Gly Asn Pro Gln Lys Phe Gly Gly Ser Cys Gln

165 170 175

Pro Cys Ser Cys Asn Ser Asn Gly Gln Leu Gly Ser Cys His Pro Leu

180 185 190

Thr Gly Asp Cys Ile Asn Gln Glu Pro Lys Asp Ser Ser Pro Ala Glu

195 200 205

Glu Cys Asp Asp Cys Asp Ser Cys Val Met Thr Leu Leu Asn Asp Leu

210 215 220

Ala Thr Met Gly Glu Gln Leu Arg Leu Val Lys Ser Gln Leu Gln Gly

225 230 235 240

Leu Ser Ala Ser Ala Gly Leu Leu Glu Gln Met Arg His Met Glu Thr

245 250 255

Gln Ala Lys Asp Leu Arg Asn Gln Leu Leu Asn Tyr Arg Ser Ala Ile

260 265 270

Ser Asn His Gly Ser Lys Ile Glu Gly Leu Glu Arg Glu Leu Thr Asp

275 280 285

Leu Asn Gln Glu Phe Glu Thr Leu Gln Glu Lys Ala Gln Val Asn Ser

290 295 300

Arg Lys Ala Gln Thr Leu Asn Asn Asn Val Asn Arg Ala Thr Gln Ser

305 310 315 320

Ala Lys Glu Leu Asp Val Lys Ile Lys Asn Val Ile Arg Asn Val His

325 330 335

Ile Leu Leu Lys Gln Ile Ser Gly Thr Asp Gly Glu Gly Asn Asn Val

340 345 350

Pro Ser Gly Asp Phe Ser Arg Glu Trp Ala Glu Ala Gln Arg Met Met

355 360 365

Arg Glu Leu Arg Asn Arg Asn Phe Gly Lys His Leu Arg Glu Ala Glu

370 375 380

Ala Asp Lys Arg Glu Ser Gln Leu Leu Leu Asn Arg Ile Arg Thr Trp

385 390 395 400

Gln Lys Thr His Gln Gly Glu Asn Asn Gly Leu Ala Asn Ser Ile Arg

405 410 415

Asp Ser Leu Asn Glu Tyr Glu Ala Lys Leu Ser Asp Leu Arg Ala Arg

420 425 430

Leu Gln Glu Ala Ala Ala Gln Ala Lys Gln Ala Asn Gly Leu Asn Gln

435 440 445

Glu Asn Glu Arg Ala Leu Gly Ala Ile Gln Arg Gln Val Lys Glu Ile

450 455 460

Asn Ser Leu Gln Ser Asp Phe Thr Lys Tyr Leu Thr Thr Ala Asp Ser

465 470 475 480

Ser Leu Leu Gln Thr Asn Ile Ala Leu Gln Leu Met Glu Lys Ser Gln

485 490 495

Lys Glu Tyr Glu Lys Leu Ala Ala Ser Leu Asn Glu Ala Arg Gln Glu

500 505 510

Leu Ser Asp Lys Val Arg Glu Leu Ser Arg Ser Ala Gly Lys Thr Ser

515 520 525

Leu Val Glu Glu Ala Glu Lys His Ala Arg Ser Leu Gln Glu Leu Ala

530 535 540

Lys Gln Leu Glu Glu Ile Lys Arg Asn Ala Ser Gly Asp Glu Leu Val

545 550 555 560

Arg Cys Ala Val Asp Ala Ala Thr Ala Tyr Glu Asn Ile Leu Asn Ala

565 570 575

Ile Lys Ala Ala Glu Asp Ala Ala Asn Arg Ala Ala Ser Ala Ser Glu

580 585 590

Ser Ala Leu Gln Thr Val Ile Lys Glu Asp Leu Pro Arg Lys Ala Lys

595 600 605

Thr Leu Ser Ser Asn Ser Asp Lys Leu Leu Asn Glu Ala Lys Met Thr

610 615 620

Gln Lys Lys Leu Lys Gln Glu Val Ser Pro Ala Leu Asn Asn Leu Gln

625 630 635 640

Gln Thr Leu Asn Ile Val Thr Val Gln Lys Glu Val Ile Asp Thr Asn

645 650 655

Leu Thr Thr Leu Arg Asp Gly Leu His Gly Ile Gln Arg Gly Asp Ile

660 665 670

Asp Ala Met Ile Ser Ser Ala Lys Ser Met Val Arg Lys Ala Asn Asp

675 680 685

Ile Thr Asp Glu Val Leu Asp Gly Leu Asn Pro Ile Gln Thr Asp Val

690 695 700

Glu Arg Ile Lys Asp Thr Tyr Gly Arg Thr Gln Asn Glu Asp Phe Lys

705 710 715 720

Lys Ala Leu Thr Asp Ala Asp Asn Ser Val Asn Lys Leu Thr Asn Lys

725 730 735

Leu Pro Asp Leu Trp Arg Lys Ile Glu Ser Ile Asn Gln Gln Leu Leu

740 745 750

Pro Leu Gly Asn Ile Ser Asp Asn Met Asp Arg Ile Arg Glu Leu Ile

755 760 765

Gln Gln Ala Arg Asp Ala Ala Ser Lys Val Ala Val Pro Met Arg Phe

770 775 780

Asn Gly Lys Ser Gly Val Glu Val Arg Leu Pro Asn Asp Leu Glu Asp

785 790 795 800

Leu Lys Gly Tyr Thr Ser Leu Ser Leu Phe Leu Gln Arg Pro Asn Ser

805 810 815

Arg Glu Asn Gly Gly Thr Glu Asn Met Phe Val Met Tyr Leu Gly Asn

820 825 830

Lys Asp Ala Ser Arg Asp Tyr Ile Gly Met Ala Val Val Asp Gly Gln

835 840 845

Leu Thr Cys Val Tyr Asn Leu Gly Asp Arg Glu Ala Glu Leu Gln Val

850 855 860

Asp Gln Ile Leu Thr Lys Ser Glu Thr Lys Glu Ala Val Met Asp Arg

865 870 875 880

Val Lys Phe Gln Arg Ile Tyr Gln Phe Ala Arg Leu Asn Tyr Thr Lys

885 890 895

Gly Ala Thr Ser Ser Lys Pro Glu Thr Pro Gly Val Tyr Asp Met Asp

900 905 910

Gly Arg Asn Ser Asn Thr Leu Leu Asn Leu Asp Pro Glu Asn Val Val

915 920 925

Phe Tyr Val Gly Gly Tyr Pro Pro Asp Phe Lys Leu Pro Ser Arg Leu

930 935 940

Ser Phe Pro Pro Tyr Lys Gly Cys Ile Glu Leu Asp Asp Leu Asn Glu

945 950 955 960

Asn Val Leu Ser Leu Tyr Asn Phe Lys Lys Thr Phe Asn Leu Asn Thr

965 970 975

Thr Glu Val Glu Pro Cys Arg Arg Arg Lys Glu Glu Ser Asp Lys Asn

980 985 990

Tyr Phe Glu Gly Thr Gly Tyr Ala Arg Val Pro Thr Gln Pro His Ala

995 1000 1005

Pro Ile Pro Thr Phe Gly Gln Thr Ile Gln Thr Thr Val Asp Arg Gly

1010 1015 1020

Leu Leu Phe Phe Ala Glu Asn Gly Asp Arg Phe Ile Ser Leu Asn Ile

1025 1030 1035 1040

Glu Asp Gly Lys Leu Met Val Arg Tyr Lys Leu Asn Ser Glu Leu Pro

1045 1050 1055

Lys Glu Arg Gly Val Gly Asp Ala Ile Asn Asn Gly Arg Asp His Ser

1060 1065 1070

Ile Gln Ile Lys Ile Gly Lys Leu Gln Lys Arg Met Trp Ile Asn Val

1075 1080 1085

Asp Val Gln Asn Thr Ile Ile Asp Gly Glu Val Phe Asp Phe Ser Thr

1090 1095 1100

Tyr Tyr Leu Gly Gly Ile Pro Ile Ala Ile Arg Glu Arg Phe Asn Ile

1105 1110 1115 1120

Ser Thr Pro Ala Phe Arg Gly Cys Met Lys Asn Leu Lys Lys Thr Ser

1125 1130 1135

Gly Val Val Arg Leu Asn Asp Thr Val Gly Val Thr Lys Lys Cys Ser

1140 1145 1150

Glu Asp Trp Lys Leu Val Arg Ser Ala Ser Phe Ser Arg Gly Gly Gln

1155 1160 1165

Leu Ser Phe Thr Asp Leu Gly Leu Pro Pro Thr Asp His Leu Gln Ala

1170 1175 1180

Ser Phe Gly Phe Gln Thr Phe Gln Pro Ser Gly Ile Leu Leu Asp His

1185 1190 1195 1200

Gln Thr Trp Thr Arg Asn Leu Gln Val Thr Leu Glu Asp Gly Tyr Ile

1205 1210 1215

Glu Leu Ser Thr Ser Asp Ser Gly Gly Pro Ile Phe Lys Ser Pro Gln

1220 1225 1230

Thr Tyr Met Asp Gly Leu Leu His Tyr Val Ser Val Ile Ser Asp Asn

1235 1240 1245

Ser Gly Leu Arg Leu Leu Ile Asp Asp Gln Leu Leu Arg Asn Ser Lys

1250 1255 1260

Arg Leu Lys His Ile Ser Ser Ser Arg Gln Ser Leu Arg Leu Gly Gly

1265 1270 1275 1280

Ser Asn Phe Glu Gly Cys Ile Ser Asn Val Phe Val Gln Arg Leu Ser

1285 1290 1295

Leu Ser Pro Glu Val Leu Asp Leu Thr Ser Asn Ser Leu Lys Arg Asp

1300 1305 1310

Val Ser Leu Gly Gly Cys Ser Leu Asn Lys Pro Pro Phe Leu Met Leu

1315 1320 1325

Leu Lys Gly Ser Thr Arg Phe Asn Lys Thr Lys Thr Phe Arg Ile Asn

1330 1335 1340

Gln Leu Leu Gln Asp Thr Pro Val Ala Ser Pro Arg Ser Val Lys Val

1345 1350 1355 1360

Trp Gln Asp Ala Cys Ser Pro Leu Pro Lys Thr Gln Ala Asn His Gly

1365 1370 1375

Ala Leu Gln Phe Gly Asp Ile Pro Thr Ser His Leu Leu Phe Lys Leu

1380 1385 1390

Pro Gln Glu Leu Leu Lys Pro Arg Ser Gln Phe Ala Val Asp Met Gln

1395 1400 1405

Thr Thr Ser Ser Arg Gly Leu Val Phe His Thr Gly Thr Lys Asn Ser

1410 1415 1420

Phe Met Ala Leu Tyr Leu Ser Lys Gly Arg Leu Val Phe Ala Leu Gly

1425 1430 1435 1440

Thr Asp Gly Lys Lys Leu Arg Ile Lys Ser Lys Glu Lys Cys Asn Asp

1445 1450 1455

Gly Lys Trp His Thr Val Val Phe Gly His Asp Gly Glu Lys Gly Arg

1460 1465 1470

Leu Val Val Asp Gly Leu Arg Ala Arg Glu Gly Ser Leu Pro Gly Asn

1475 1480 1485

Ser Thr Ile Ser Ile Arg Ala Pro Val Tyr Leu Gly Ser Pro Pro Ser

1490 1495 1500

Gly Lys Pro Lys Ser Leu Pro Thr Asn Ser Phe Val Gly Cys Leu Lys

1505 1510 1515 1520

Asn Phe Gln Leu Asp Ser Lys Pro Leu Tyr Thr Pro Ser Ser Ser Phe

1525 1530 1535

Gly Val Ser Ser Cys Leu Gly Gly Pro Leu Glu Lys Gly Ile Tyr Phe

1540 1545 1550

Ser Glu Glu Gly Gly His Val Val Leu Ala His Ser Val Leu Leu Gly

1555 1560 1565

Pro Glu Phe Lys Leu Val Phe Ser Ile Arg Pro Arg Ser Leu Thr Gly

1570 1575 1580

Ile Leu Ile His Ile Gly Ser Gln Pro Gly Lys His Leu Cys Val Tyr

1585 1590 1595 1600

Leu Glu Ala Gly Lys Val Thr Ala Ser Met Asp Ser Gly Ala Gly Gly

1605 1610 1615

Thr Ser Thr Ser Val Thr Pro Lys Gln Ser Leu Cys Asp Gly Gln Trp

1620 1625 1630

His Ser Val Ala Val Thr Ile Lys Gln His Ile Leu His Leu Glu Leu

1635 1640 1645

Asp Thr Asp Ser Ser Tyr Thr Ala Gly Gln Ile Pro Phe Pro Pro Ala

1650 1655 1660

Ser Thr Gln Glu Pro Leu His Leu Gly Gly Ala Pro Ala Asn Leu Thr

1665 1670 1675 1680

Thr Leu Arg Ile Pro Val Trp Lys Ser Phe Phe Gly Cys Leu Arg Asn

1685 1690 1695

Ile His Val Asn His Ile Pro Val Pro Val Thr Glu Ala Leu Glu Val

1700 1705 1710

Gln Gly Pro Val Ser Leu Asn Gly Cys Pro Asp Gln

1715 1720

<210> 58

<211> 1172

<212> PRT

<213> 智人(Homo sapiens)

<400> 58

Met Arg Pro Phe Phe Leu Leu Cys Phe Ala Leu Pro Gly Leu Leu His

1 5 10 15

Ala Gln Gln Ala Cys Ser Arg Gly Ala Cys Tyr Pro Pro Val Gly Asp

20 25 30

Leu Leu Val Gly Arg Thr Arg Phe Leu Arg Ala Ser Ser Thr Cys Gly

35 40 45

Leu Thr Lys Pro Glu Thr Tyr Cys Thr Gln Tyr Gly Glu Trp Gln Met

50 55 60

Lys Cys Cys Lys Cys Asp Ser Arg Gln Pro His Asn Tyr Tyr Ser His

65 70 75 80

Arg Val Glu Asn Val Ala Ser Ser Ser Gly Pro Met Arg Trp Trp Gln

85 90 95

Ser Gln Asn Asp Val Asn Pro Val Ser Leu Gln Leu Asp Leu Asp Arg

100 105 110

Arg Phe Gln Leu Gln Glu Val Met Met Glu Phe Gln Gly Pro Met Pro

115 120 125

Ala Gly Met Leu Ile Glu Arg Ser Ser Asp Phe Gly Lys Thr Trp Arg

130 135 140

Val Tyr Gln Tyr Leu Ala Ala Asp Cys Thr Ser Thr Phe Pro Arg Val

145 150 155 160

Arg Gln Gly Arg Pro Gln Ser Trp Gln Asp Val Arg Cys Gln Ser Leu

165 170 175

Pro Gln Arg Pro Asn Ala Arg Leu Asn Gly Gly Lys Val Gln Leu Asn

180 185 190

Leu Met Asp Leu Val Ser Gly Ile Pro Ala Thr Gln Ser Gln Lys Ile

195 200 205

Gln Glu Val Gly Glu Ile Thr Asn Leu Arg Val Asn Phe Thr Arg Leu

210 215 220

Ala Pro Val Pro Gln Arg Gly Tyr His Pro Pro Ser Ala Tyr Tyr Ala

225 230 235 240

Val Ser Gln Leu Arg Leu Gln Gly Ser Cys Phe Cys His Gly His Ala

245 250 255

Asp Arg Cys Ala Pro Lys Pro Gly Ala Ser Ala Gly Pro Ser Thr Ala

260 265 270

Val Gln Val His Asp Val Cys Val Cys Gln His Asn Thr Ala Gly Pro

275 280 285

Asn Cys Glu Arg Cys Ala Pro Phe Tyr Asn Asn Arg Pro Trp Arg Pro

290 295 300

Ala Glu Gly Gln Asp Ala His Glu Cys Gln Arg Cys Asp Cys Asn Gly

305 310 315 320

His Ser Glu Thr Cys His Phe Asp Pro Ala Val Phe Ala Ala Ser Gln

325 330 335

Gly Ala Tyr Gly Gly Val Cys Asp Asn Cys Arg Asp His Thr Glu Gly

340 345 350

Lys Asn Cys Glu Arg Cys Gln Leu His Tyr Phe Arg Asn Arg Arg Pro

355 360 365

Gly Ala Ser Ile Gln Glu Thr Cys Ile Ser Cys Glu Cys Asp Pro Asp

370 375 380

Gly Ala Val Pro Gly Ala Pro Cys Asp Pro Val Thr Gly Gln Cys Val

385 390 395 400

Cys Lys Glu His Val Gln Gly Glu Arg Cys Asp Leu Cys Lys Pro Gly

405 410 415

Phe Thr Gly Leu Thr Tyr Ala Asn Pro Gln Gly Cys His Arg Cys Asp

420 425 430

Cys Asn Ile Leu Gly Ser Arg Arg Asp Met Pro Cys Asp Glu Glu Ser

435 440 445

Gly Arg Cys Leu Cys Leu Pro Asn Val Val Gly Pro Lys Cys Asp Gln

450 455 460

Cys Ala Pro Tyr His Trp Lys Leu Ala Ser Gly Gln Gly Cys Glu Pro

465 470 475 480

Cys Ala Cys Asp Pro His Asn Ser Leu Ser Pro Gln Cys Asn Gln Phe

485 490 495

Thr Gly Gln Cys Pro Cys Arg Glu Gly Phe Gly Gly Leu Met Cys Ser

500 505 510

Ala Ala Ala Ile Arg Gln Cys Pro Asp Arg Thr Tyr Gly Asp Val Ala

515 520 525

Thr Gly Cys Arg Ala Cys Asp Cys Asp Phe Arg Gly Thr Glu Gly Pro

530 535 540

Gly Cys Asp Lys Ala Ser Gly Arg Cys Leu Cys Arg Pro Gly Leu Thr

545 550 555 560

Gly Pro Arg Cys Asp Gln Cys Gln Arg Gly Tyr Cys Asn Arg Tyr Pro

565 570 575

Val Cys Val Ala Cys His Pro Cys Phe Gln Thr Tyr Asp Ala Asp Leu

580 585 590

Arg Glu Gln Ala Leu Arg Phe Gly Arg Leu Arg Asn Ala Thr Ala Ser

595 600 605

Leu Trp Ser Gly Pro Gly Leu Glu Asp Arg Gly Leu Ala Ser Arg Ile

610 615 620

Leu Asp Ala Lys Ser Lys Ile Glu Gln Ile Arg Ala Val Leu Ser Ser

625 630 635 640

Pro Ala Val Thr Glu Gln Glu Val Ala Gln Val Ala Ser Ala Ile Leu

645 650 655

Ser Leu Arg Arg Thr Leu Gln Gly Leu Gln Leu Asp Leu Pro Leu Glu

660 665 670

Glu Glu Thr Leu Ser Leu Pro Arg Asp Leu Glu Ser Leu Asp Arg Ser

675 680 685

Phe Asn Gly Leu Leu Thr Met Tyr Gln Arg Lys Arg Glu Gln Phe Glu

690 695 700

Lys Ile Ser Ser Ala Asp Pro Ser Gly Ala Phe Arg Met Leu Ser Thr

705 710 715 720

Ala Tyr Glu Gln Ser Ala Gln Ala Ala Gln Gln Val Ser Asp Ser Ser

725 730 735

Arg Leu Leu Asp Gln Leu Arg Asp Ser Arg Arg Glu Ala Glu Arg Leu

740 745 750

Val Arg Gln Ala Gly Gly Gly Gly Gly Thr Gly Ser Pro Lys Leu Val

755 760 765

Ala Leu Arg Leu Glu Met Ser Ser Leu Pro Asp Leu Thr Pro Thr Phe

770 775 780

Asn Lys Leu Cys Gly Asn Ser Arg Gln Met Ala Cys Thr Pro Ile Ser

785 790 795 800

Cys Pro Gly Glu Leu Cys Pro Gln Asp Asn Gly Thr Ala Cys Gly Ser

805 810 815

Arg Cys Arg Gly Val Leu Pro Arg Ala Gly Gly Ala Phe Leu Met Ala

820 825 830

Gly Gln Val Ala Glu Gln Leu Arg Gly Phe Asn Ala Gln Leu Gln Arg

835 840 845

Thr Arg Gln Met Ile Arg Ala Ala Glu Glu Ser Ala Ser Gln Ile Gln

850 855 860

Ser Ser Ala Gln Arg Leu Glu Thr Gln Val Ser Ala Ser Arg Ser Gln

865 870 875 880

Met Glu Glu Asp Val Arg Arg Thr Arg Leu Leu Ile Gln Gln Val Arg

885 890 895

Asp Phe Leu Thr Asp Pro Asp Thr Asp Ala Ala Thr Ile Gln Glu Val

900 905 910

Ser Glu Ala Val Leu Ala Leu Trp Leu Pro Thr Asp Ser Ala Thr Val

915 920 925

Leu Gln Lys Met Asn Glu Ile Gln Ala Ile Ala Ala Arg Leu Pro Asn

930 935 940

Val Asp Leu Val Leu Ser Gln Thr Lys Gln Asp Ile Ala Arg Ala Arg

945 950 955 960

Arg Leu Gln Ala Glu Ala Glu Glu Ala Arg Ser Arg Ala His Ala Val

965 970 975

Glu Gly Gln Val Glu Asp Val Val Gly Asn Leu Arg Gln Gly Thr Val

980 985 990

Ala Leu Gln Glu Ala Gln Asp Thr Met Gln Gly Thr Ser Arg Ser Leu

995 1000 1005

Arg Leu Ile Gln Asp Arg Val Ala Glu Val Gln Gln Val Leu Arg Pro

1010 1015 1020

Ala Glu Lys Leu Val Thr Ser Met Thr Lys Gln Leu Gly Asp Phe Trp

1025 1030 1035 1040

Thr Arg Met Glu Glu Leu Arg His Gln Ala Arg Gln Gln Gly Ala Glu

1045 1050 1055

Ala Val Gln Ala Gln Gln Leu Ala Glu Gly Ala Ser Glu Gln Ala Leu

1060 1065 1070

Ser Ala Gln Glu Gly Phe Glu Arg Ile Lys Gln Lys Tyr Ala Glu Leu

1075 1080 1085

Lys Asp Arg Leu Gly Gln Ser Ser Met Leu Gly Glu Gln Gly Ala Arg

1090 1095 1100

Ile Gln Ser Val Lys Thr Glu Ala Glu Glu Leu Phe Gly Glu Thr Met

1105 1110 1115 1120

Glu Met Met Asp Arg Met Lys Asp Met Glu Leu Glu Leu Leu Arg Gly

1125 1130 1135

Ser Gln Ala Ile Met Leu Arg Ser Ala Asp Leu Thr Gly Leu Glu Lys

1140 1145 1150

Arg Val Glu Gln Ile Arg Asp His Ile Asn Gly Arg Val Leu Tyr Tyr

1155 1160 1165

Ala Thr Cys Lys

1170

<210> 59

<211> 1193

<212> PRT

<213> 智人(Homo sapiens)

<400> 59

Met Pro Ala Leu Trp Leu Gly Cys Cys Leu Cys Phe Ser Leu Leu Leu

1 5 10 15

Pro Ala Ala Arg Ala Thr Ser Arg Arg Glu Val Cys Asp Cys Asn Gly

20 25 30

Lys Ser Arg Gln Cys Ile Phe Asp Arg Glu Leu His Arg Gln Thr Gly

35 40 45

Asn Gly Phe Arg Cys Leu Asn Cys Asn Asp Asn Thr Asp Gly Ile His

50 55 60

Cys Glu Lys Cys Lys Asn Gly Phe Tyr Arg His Arg Glu Arg Asp Arg

65 70 75 80

Cys Leu Pro Cys Asn Cys Asn Ser Lys Gly Ser Leu Ser Ala Arg Cys

85 90 95

Asp Asn Ser Gly Arg Cys Ser Cys Lys Pro Gly Val Thr Gly Ala Arg

100 105 110

Cys Asp Arg Cys Leu Pro Gly Phe His Met Leu Thr Asp Ala Gly Cys

115 120 125

Thr Gln Asp Gln Arg Leu Leu Asp Ser Lys Cys Asp Cys Asp Pro Ala

130 135 140

Gly Ile Ala Gly Pro Cys Asp Ala Gly Arg Cys Val Cys Lys Pro Ala

145 150 155 160

Val Thr Gly Glu Arg Cys Asp Arg Cys Arg Ser Gly Tyr Tyr Asn Leu

165 170 175

Asp Gly Gly Asn Pro Glu Gly Cys Thr Gln Cys Phe Cys Tyr Gly His

180 185 190

Ser Ala Ser Cys Arg Ser Ser Ala Glu Tyr Ser Val His Lys Ile Thr

195 200 205

Ser Thr Phe His Gln Asp Val Asp Gly Trp Lys Ala Val Gln Arg Asn

210 215 220

Gly Ser Pro Ala Lys Leu Gln Trp Ser Gln Arg His Gln Asp Val Phe

225 230 235 240

Ser Ser Ala Gln Arg Leu Asp Pro Val Tyr Phe Val Ala Pro Ala Lys

245 250 255

Phe Leu Gly Asn Gln Gln Val Ser Tyr Gly Gln Ser Leu Ser Phe Asp

260 265 270

Tyr Arg Val Asp Arg Gly Gly Arg His Pro Ser Ala His Asp Val Ile

275 280 285

Leu Glu Gly Ala Gly Leu Arg Ile Thr Ala Pro Leu Met Pro Leu Gly

290 295 300

Lys Thr Leu Pro Cys Gly Leu Thr Lys Thr Tyr Thr Phe Arg Leu Asn

305 310 315 320

Glu His Pro Ser Asn Asn Trp Ser Pro Gln Leu Ser Tyr Phe Glu Tyr

325 330 335

Arg Arg Leu Leu Arg Asn Leu Thr Ala Leu Arg Ile Arg Ala Thr Tyr

340 345 350

Gly Glu Tyr Ser Thr Gly Tyr Ile Asp Asn Val Thr Leu Ile Ser Ala

355 360 365

Arg Pro Val Ser Gly Ala Pro Ala Pro Trp Val Glu Gln Cys Ile Cys

370 375 380

Pro Val Gly Tyr Lys Gly Gln Phe Cys Gln Asp Cys Ala Ser Gly Tyr

385 390 395 400

Lys Arg Asp Ser Ala Arg Leu Gly Pro Phe Gly Thr Cys Ile Pro Cys

405 410 415

Asn Cys Gln Gly Gly Gly Ala Cys Asp Pro Asp Thr Gly Asp Cys Tyr

420 425 430

Ser Gly Asp Glu Asn Pro Asp Ile Glu Cys Ala Asp Cys Pro Ile Gly

435 440 445

Phe Tyr Asn Asp Pro His Asp Pro Arg Ser Cys Lys Pro Cys Pro Cys

450 455 460

His Asn Gly Phe Ser Cys Ser Val Met Pro Glu Thr Glu Glu Val Val

465 470 475 480

Cys Asn Asn Cys Pro Pro Gly Val Thr Gly Ala Arg Cys Glu Leu Cys

485 490 495

Ala Asp Gly Tyr Phe Gly Asp Pro Phe Gly Glu His Gly Pro Val Arg

500 505 510

Pro Cys Gln Pro Cys Gln Cys Asn Asn Asn Val Asp Pro Ser Ala Ser

515 520 525

Gly Asn Cys Asp Arg Leu Thr Gly Arg Cys Leu Lys Cys Ile His Asn

530 535 540

Thr Ala Gly Ile Tyr Cys Asp Gln Cys Lys Ala Gly Tyr Phe Gly Asp

545 550 555 560

Pro Leu Ala Pro Asn Pro Ala Asp Lys Cys Arg Ala Cys Asn Cys Asn

565 570 575

Pro Met Gly Ser Glu Pro Val Gly Cys Arg Ser Asp Gly Thr Cys Val

580 585 590

Cys Lys Pro Gly Phe Gly Gly Pro Asn Cys Glu His Gly Ala Phe Ser

595 600 605

Cys Pro Ala Cys Tyr Asn Gln Val Lys Ile Gln Met Asp Gln Phe Met

610 615 620

Gln Gln Leu Gln Arg Met Glu Ala Leu Ile Ser Lys Ala Gln Gly Gly

625 630 635 640

Asp Gly Val Val Pro Asp Thr Glu Leu Glu Gly Arg Met Gln Gln Ala

645 650 655

Glu Gln Ala Leu Gln Asp Ile Leu Arg Asp Ala Gln Ile Ser Glu Gly

660 665 670

Ala Ser Arg Ser Leu Gly Leu Gln Leu Ala Lys Val Arg Ser Gln Glu

675 680 685

Asn Ser Tyr Gln Ser Arg Leu Asp Asp Leu Lys Met Thr Val Glu Arg

690 695 700

Val Arg Ala Leu Gly Ser Gln Tyr Gln Asn Arg Val Arg Asp Thr His

705 710 715 720

Arg Leu Ile Thr Gln Met Gln Leu Ser Leu Ala Glu Ser Glu Ala Ser

725 730 735

Leu Gly Asn Thr Asn Ile Pro Ala Ser Asp His Tyr Val Gly Pro Asn

740 745 750

Gly Phe Lys Ser Leu Ala Gln Glu Ala Thr Arg Leu Ala Glu Ser His

755 760 765

Val Glu Ser Ala Ser Asn Met Glu Gln Leu Thr Arg Glu Thr Glu Asp

770 775 780

Tyr Ser Lys Gln Ala Leu Ser Leu Val Arg Lys Ala Leu His Glu Gly

785 790 795 800

Val Gly Ser Gly Ser Gly Ser Pro Asp Gly Ala Val Val Gln Gly Leu

805 810 815

Val Glu Lys Leu Glu Lys Thr Lys Ser Leu Ala Gln Gln Leu Thr Arg

820 825 830

Glu Ala Thr Gln Ala Glu Ile Glu Ala Asp Arg Ser Tyr Gln His Ser

835 840 845

Leu Arg Leu Leu Asp Ser Val Ser Arg Leu Gln Gly Val Ser Asp Gln

850 855 860

Ser Phe Gln Val Glu Glu Ala Lys Arg Ile Lys Gln Lys Ala Asp Ser

865 870 875 880

Leu Ser Ser Leu Val Thr Arg His Met Asp Glu Phe Lys Arg Thr Gln

885 890 895

Lys Asn Leu Gly Asn Trp Lys Glu Glu Ala Gln Gln Leu Leu Gln Asn

900 905 910

Gly Lys Ser Gly Arg Glu Lys Ser Asp Gln Leu Leu Ser Arg Ala Asn

915 920 925

Leu Ala Lys Ser Arg Ala Gln Glu Ala Leu Ser Met Gly Asn Ala Thr

930 935 940

Phe Tyr Glu Val Glu Ser Ile Leu Lys Asn Leu Arg Glu Phe Asp Leu

945 950 955 960

Gln Val Asp Asn Arg Lys Ala Glu Ala Glu Glu Ala Met Lys Arg Leu

965 970 975

Ser Tyr Ile Ser Gln Lys Val Ser Asp Ala Ser Asp Lys Thr Gln Gln

980 985 990

Ala Glu Arg Ala Leu Gly Ser Ala Ala Ala Asp Ala Gln Arg Ala Lys

995 1000 1005

Asn Gly Ala Gly Glu Ala Leu Glu Ile Ser Ser Glu Ile Glu Gln Glu

1010 1015 1020

Ile Gly Ser Leu Asn Leu Glu Ala Asn Val Thr Ala Asp Gly Ala Leu

1025 1030 1035 1040

Ala Met Glu Lys Gly Leu Ala Ser Leu Lys Ser Glu Met Arg Glu Val

1045 1050 1055

Glu Gly Glu Leu Glu Arg Lys Glu Leu Glu Phe Asp Thr Asn Met Asp

1060 1065 1070

Ala Val Gln Met Val Ile Thr Glu Ala Gln Lys Val Asp Thr Arg Ala

1075 1080 1085

Lys Asn Ala Gly Val Thr Ile Gln Asp Thr Leu Asn Thr Leu Asp Gly

1090 1095 1100

Leu Leu His Leu Met Asp Gln Pro Leu Ser Val Asp Glu Glu Gly Leu

1105 1110 1115 1120

Val Leu Leu Glu Gln Lys Leu Ser Arg Ala Lys Thr Gln Ile Asn Ser

1125 1130 1135

Gln Leu Arg Pro Met Met Ser Glu Leu Glu Glu Arg Ala Arg Gln Gln

1140 1145 1150

Arg Gly His Leu His Leu Leu Glu Thr Ser Ile Asp Gly Ile Leu Ala

1155 1160 1165

Asp Val Lys Asn Leu Glu Asn Ile Arg Asp Asn Leu Pro Pro Gly Cys

1170 1175 1180

Tyr Asn Thr Gln Ala Leu Glu Gln Gln

1185 1190

<210> 60

<211> 1296

<212> PRT

<213> 肉毒梭菌(Clostridium botulinum)

<400> 60

Met Pro Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly

1 5 10 15

Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met Gln Pro

20 25 30

Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg

35 40 45

Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu

50 55 60

Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr

65 70 75 80

Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu

85 90 95

Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val

100 105 110

Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys

115 120 125

Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr

130 135 140

Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile

145 150 155 160

Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr

165 170 175

Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe

180 185 190

Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu

195 200 205

Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu

210 215 220

Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn

225 230 235 240

Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu

245 250 255

Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys

260 265 270

Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn

275 280 285

Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val

290 295 300

Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys

305 310 315 320

Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu

325 330 335

Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp

340 345 350

Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn

355 360 365

Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr

370 375 380

Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn

385 390 395 400

Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu

405 410 415

Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg

420 425 430

Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Asp Lys Gly Tyr Asn Lys

435 440 445

Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe

450 455 460

Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu

465 470 475 480

Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu

485 490 495

Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro

500 505 510

Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu

515 520 525

Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu

530 535 540

Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu

545 550 555 560

His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu

565 570 575

Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys

580 585 590

Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu

595 600 605

Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr

610 615 620

Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala

625 630 635 640

Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu

645 650 655

Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala

660 665 670

Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys

675 680 685

Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu

690 695 700

Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys

705 710 715 720

Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu

725 730 735

Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn

740 745 750

Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp

755 760 765

Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile

770 775 780

Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met

785 790 795 800

Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys

805 810 815

Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly

820 825 830

Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp

835 840 845

Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser

850 855 860

Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn

865 870 875 880

Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser

885 890 895

Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn

900 905 910

Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu

915 920 925

Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser

930 935 940

Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn

945 950 955 960

Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val

965 970 975

Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu

980 985 990

Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser

995 1000 1005

Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg Leu

1010 1015 1020

Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln Lys Pro

1025 1030 1035 1040

Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile Met Phe Lys

1045 1050 1055

Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp Ile Lys Tyr Phe

1060 1065 1070

Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu Ile Lys Asp Leu Tyr

1075 1080 1085

Asp Asn Gln Ser Asn Ser Gly Ile Leu Lys Asp Phe Trp Gly Asp Tyr

1090 1095 1100

Leu Gln Tyr Asp Lys Pro Tyr Tyr Met Leu Asn Leu Tyr Asp Pro Asn

1105 1110 1115 1120

Lys Tyr Val Asp Val Asn Asn Val Gly Ile Arg Gly Tyr Met Tyr Leu

1125 1130 1135

Lys Gly Pro Arg Gly Ser Val Met Thr Thr Asn Ile Tyr Leu Asn Ser

1140 1145 1150

Ser Leu Tyr Arg Gly Thr Lys Phe Ile Ile Lys Lys Tyr Ala Ser Gly

1155 1160 1165

Asn Lys Asp Asn Ile Val Arg Asn Asn Asp Arg Val Tyr Ile Asn Val

1170 1175 1180

Val Val Lys Asn Lys Glu Tyr Arg Leu Ala Thr Asn Ala Ser Gln Ala

1185 1190 1195 1200

Gly Val Glu Lys Ile Leu Ser Ala Leu Glu Ile Pro Asp Val Gly Asn

1205 1210 1215

Leu Ser Gln Val Val Val Met Lys Ser Lys Asn Asp Gln Gly Ile Thr

1220 1225 1230

Asn Lys Cys Lys Met Asn Leu Gln Asp Asn Asn Gly Asn Asp Ile Gly

1235 1240 1245

Phe Ile Gly Phe His Gln Phe Asn Asn Ile Ala Lys Leu Val Ala Ser

1250 1255 1260

Asn Trp Tyr Asn Arg Gln Ile Glu Arg Ser Ser Arg Thr Leu Gly Cys

1265 1270 1275 1280

Ser Trp Glu Phe Ile Pro Val Asp Asp Gly Trp Gly Glu Arg Pro Leu

1285 1290 1295

<210> 61

<211> 1291

<212> PRT

<213> 肉毒梭菌(Clostridium botulinum)

<400> 61

Met Pro Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn

1 5 10 15

Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg

20 25 30

Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu

35 40 45

Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly

50 55 60

Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn

65 70 75 80

Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe

85 90 95

Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile

100 105 110

Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu

115 120 125

Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn

130 135 140

Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile

145 150 155 160

Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly

165 170 175

Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln

180 185 190

Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu

195 200 205

Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro

210 215 220

Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr

225 230 235 240

Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe

245 250 255

Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe

260 265 270

Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile

275 280 285

Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn

290 295 300

Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr

305 310 315 320

Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly

325 330 335

Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu

340 345 350

Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys

355 360 365

Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys

370 375 380

Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile

385 390 395 400

Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile

405 410 415

Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr

420 425 430

Lys Ile Gln Met Cys Lys Ser Val Lys Ala Pro Gly Ile Cys Ile Asp

435 440 445

Val Asp Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser

450 455 460

Asp Asp Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn

465 470 475 480

Tyr Ile Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp

485 490 495

Leu Ile Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr

500 505 510

Asp Phe Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys

515 520 525

Lys Ile Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln

530 535 540

Thr Phe Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp

545 550 555 560

Asp Ala Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp

565 570 575

Tyr Ile Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly

580 585 590

Trp Val Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser

595 600 605

Asn Thr Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile

610 615 620

Gly Leu Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu

625 630 635 640

Asn Ala Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro

645 650 655

Glu Leu Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile

660 665 670

Asp Asn Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys

675 680 685

Arg Asn Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp

690 695 700

Leu Ser Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr

705 710 715 720

Lys Ala Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr

725 730 735

Arg Tyr Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp

740 745 750

Phe Asn Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile

755 760 765

Asp Asn Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met

770 775 780

Lys Lys Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn

785 790 795 800

Thr Leu Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr

805 810 815

Leu Ile Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu

820 825 830

Lys Thr Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile

835 840 845

Leu Ile Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Asn Asn Ile

850 855 860

Ile Leu Asn Leu Arg Tyr Lys Asp Asn Asn Leu Ile Asp Leu Ser Gly

865 870 875 880

Tyr Gly Ala Lys Val Glu Val Tyr Asp Gly Val Glu Leu Asn Asp Lys

885 890 895

Asn Gln Phe Lys Leu Thr Ser Ser Ala Asn Ser Lys Ile Arg Val Thr

900 905 910

Gln Asn Gln Asn Ile Ile Phe Asn Ser Val Phe Leu Asp Phe Ser Val

915 920 925

Ser Phe Trp Ile Arg Ile Pro Lys Tyr Lys Asn Asp Gly Ile Gln Asn

930 935 940

Tyr Ile His Asn Glu Tyr Thr Ile Ile Asn Cys Met Lys Asn Asn Ser

945 950 955 960

Gly Trp Lys Ile Ser Ile Arg Gly Asn Arg Ile Ile Trp Thr Leu Ile

965 970 975

Asp Ile Asn Gly Lys Thr Lys Ser Val Phe Phe Glu Tyr Asn Ile Arg

980 985 990

Glu Asp Ile Ser Glu Tyr Ile Asn Arg Trp Phe Phe Val Thr Ile Thr

995 1000 1005

Asn Asn Leu Asn Asn Ala Lys Ile Tyr Ile Asn Gly Lys Leu Glu Ser

1010 1015 1020

Asn Thr Asp Ile Lys Asp Ile Arg Glu Val Ile Ala Asn Gly Glu Ile

1025 1030 1035 1040

Ile Phe Lys Leu Asp Gly Asp Ile Asp Arg Thr Gln Phe Ile Trp Met

1045 1050 1055

Lys Tyr Phe Ser Ile Phe Asn Thr Glu Leu Ser Gln Ser Asn Ile Glu

1060 1065 1070

Glu Arg Tyr Lys Ile Gln Ser Tyr Ser Glu Tyr Leu Lys Asp Phe Trp

1075 1080 1085

Gly Asn Pro Leu Met Tyr Asn Lys Glu Tyr Tyr Met Phe Asn Ala Gly

1090 1095 1100

Asn Lys Asn Ser Tyr Ile Lys Leu Lys Lys Asp Ser Pro Val Gly Glu

1105 1110 1115 1120

Ile Leu Thr Arg Ser Lys Tyr Asn Gln Asn Ser Lys Tyr Ile Asn Tyr

1125 1130 1135

Arg Asp Leu Tyr Ile Gly Glu Lys Phe Ile Ile Arg Arg Lys Ser Asn

1140 1145 1150

Ser Gln Ser Ile Asn Asp Asp Ile Val Arg Lys Glu Asp Tyr Ile Tyr

1155 1160 1165

Leu Asp Phe Phe Asn Leu Asn Gln Glu Trp Arg Val Tyr Thr Tyr Lys

1170 1175 1180

Tyr Phe Lys Lys Glu Glu Glu Lys Leu Phe Leu Ala Pro Ile Ser Asp

1185 1190 1195 1200

Ser Asp Glu Phe Tyr Asn Thr Ile Gln Ile Lys Glu Tyr Asp Glu Gln

1205 1210 1215

Pro Thr Tyr Ser Cys Gln Leu Leu Phe Lys Lys Asp Glu Glu Ser Thr

1220 1225 1230

Asp Glu Ile Gly Leu Ile Gly Ile His Arg Phe Tyr Glu Ser Gly Ile

1235 1240 1245

Val Phe Glu Glu Tyr Lys Asp Tyr Phe Cys Ile Ser Lys Trp Tyr Leu

1250 1255 1260

Lys Glu Val Lys Arg Lys Pro Tyr Asn Leu Lys Leu Gly Cys Asn Trp

1265 1270 1275 1280

Gln Phe Ile Pro Lys Asp Glu Gly Trp Thr Glu

1285 1290

<210> 62

<211> 2871

<212> PRT

<213> 智人(Homo sapiens)

<400> 62

Met Arg Arg Gly Arg Leu Leu Glu Ile Ala Leu Gly Phe Thr Val Leu

1 5 10 15

Leu Ala Ser Tyr Thr Ser His Gly Ala Asp Ala Asn Leu Glu Ala Gly

20 25 30

Asn Val Lys Glu Thr Arg Ala Ser Arg Ala Lys Arg Arg Gly Gly Gly

35 40 45

Gly His Asp Ala Leu Lys Gly Pro Asn Val Cys Gly Ser Arg Tyr Asn

50 55 60

Ala Tyr Cys Cys Pro Gly Trp Lys Thr Leu Pro Gly Gly Asn Gln Cys

65 70 75 80

Ile Val Pro Ile Cys Arg His Ser Cys Gly Asp Gly Phe Cys Ser Arg

85 90 95

Pro Asn Met Cys Thr Cys Pro Ser Gly Gln Ile Ala Pro Ser Cys Gly

100 105 110

Ser Arg Ser Ile Gln His Cys Asn Ile Arg Cys Met Asn Gly Gly Ser

115 120 125

Cys Ser Asp Asp His Cys Leu Cys Gln Lys Gly Tyr Ile Gly Thr His

130 135 140

Cys Gly Gln Pro Val Cys Glu Ser Gly Cys Leu Asn Gly Gly Arg Cys

145 150 155 160

Val Ala Pro Asn Arg Cys Ala Cys Thr Tyr Gly Phe Thr Gly Pro Gln

165 170 175

Cys Glu Arg Asp Tyr Arg Thr Gly Pro Cys Phe Thr Val Ile Ser Asn

180 185 190

Gln Met Cys Gln Gly Gln Leu Ser Gly Ile Val Cys Thr Lys Thr Leu

195 200 205

Cys Cys Ala Thr Val Gly Arg Ala Trp Gly His Pro Cys Glu Met Cys

210 215 220

Pro Ala Gln Pro His Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile Arg

225 230 235 240

Thr Gly Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Ile Pro Gly Leu

245 250 255

Cys Gln Gly Gly Asn Cys Ile Asn Thr Val Gly Ser Phe Glu Cys Lys

260 265 270

Cys Pro Ala Gly His Lys Leu Asn Glu Val Ser Gln Lys Cys Glu Asp

275 280 285

Ile Asp Glu Cys Ser Thr Ile Pro Gly Ile Cys Glu Gly Gly Glu Cys

290 295 300

Thr Asn Thr Val Ser Ser Tyr Phe Cys Lys Cys Pro Pro Gly Phe Tyr

305 310 315 320

Thr Ser Pro Asp Gly Thr Arg Cys Ile Asp Val Arg Pro Gly Tyr Cys

325 330 335

Tyr Thr Ala Leu Thr Asn Gly Arg Cys Ser Asn Gln Leu Pro Gln Ser

340 345 350

Ile Thr Lys Met Gln Cys Cys Cys Asp Ala Gly Arg Cys Trp Ser Pro

355 360 365

Gly Val Thr Val Ala Pro Glu Met Cys Pro Ile Arg Ala Thr Glu Asp

370 375 380

Phe Asn Lys Leu Cys Ser Val Pro Met Val Ile Pro Gly Arg Pro Glu

385 390 395 400

Tyr Pro Pro Pro Pro Leu Gly Pro Ile Pro Pro Val Leu Pro Val Pro

405 410 415

Pro Gly Phe Pro Pro Gly Pro Gln Ile Pro Val Pro Arg Pro Pro Val

420 425 430

Glu Tyr Leu Tyr Pro Ser Arg Glu Pro Pro Arg Val Leu Pro Val Asn

435 440 445

Val Thr Asp Tyr Cys Gln Leu Val Arg Tyr Leu Cys Gln Asn Gly Arg

450 455 460

Cys Ile Pro Thr Pro Gly Ser Tyr Arg Cys Glu Cys Asn Lys Gly Phe

465 470 475 480

Gln Leu Asp Leu Arg Gly Glu Cys Ile Asp Val Asp Glu Cys Glu Lys

485 490 495

Asn Pro Cys Ala Gly Gly Glu Cys Ile Asn Asn Gln Gly Ser Tyr Thr

500 505 510

Cys Gln Cys Arg Ala Gly Tyr Gln Ser Thr Leu Thr Arg Thr Glu Cys

515 520 525

Arg Asp Ile Asp Glu Cys Leu Gln Asn Gly Arg Ile Cys Asn Asn Gly

530 535 540

Arg Cys Ile Asn Thr Asp Gly Ser Phe His Cys Val Cys Asn Ala Gly

545 550 555 560

Phe His Val Thr Arg Asp Gly Lys Asn Cys Glu Asp Met Asp Glu Cys

565 570 575

Ser Ile Arg Asn Met Cys Leu Asn Gly Met Cys Ile Asn Glu Asp Gly

580 585 590

Ser Phe Lys Cys Ile Cys Lys Pro Gly Phe Gln Leu Ala Ser Asp Gly

595 600 605

Arg Tyr Cys Lys Asp Ile Asn Glu Cys Glu Thr Pro Gly Ile Cys Met

610 615 620

Asn Gly Arg Cys Val Asn Thr Asp Gly Ser Tyr Arg Cys Glu Cys Phe

625 630 635 640

Pro Gly Leu Ala Val Gly Leu Asp Gly Arg Val Cys Val Asp Thr His

645 650 655

Met Arg Ser Thr Cys Tyr Gly Gly Tyr Lys Arg Gly Gln Cys Ile Lys

660 665 670

Pro Leu Phe Gly Ala Val Thr Lys Ser Glu Cys Cys Cys Ala Ser Thr

675 680 685

Glu Tyr Ala Phe Gly Glu Pro Cys Gln Pro Cys Pro Ala Gln Asn Ser

690 695 700

Ala Glu Tyr Gln Ala Leu Cys Ser Ser Gly Pro Gly Met Thr Ser Ala

705 710 715 720

Gly Ser Asp Ile Asn Glu Cys Ala Leu Asp Pro Asp Ile Cys Pro Asn

725 730 735

Gly Ile Cys Glu Asn Leu Arg Gly Thr Tyr Lys Cys Ile Cys Asn Ser

740 745 750

Gly Tyr Glu Val Asp Ser Thr Gly Lys Asn Cys Val Asp Ile Asn Glu

755 760 765

Cys Val Leu Asn Ser Leu Leu Cys Asp Asn Gly Gln Cys Arg Asn Thr

770 775 780

Pro Gly Ser Phe Val Cys Thr Cys Pro Lys Gly Phe Ile Tyr Lys Pro

785 790 795 800

Asp Leu Lys Thr Cys Glu Asp Ile Asp Glu Cys Glu Ser Ser Pro Cys

805 810 815

Ile Asn Gly Val Cys Lys Asn Ser Pro Gly Ser Phe Ile Cys Glu Cys

820 825 830

Ser Ser Glu Ser Thr Leu Asp Pro Thr Lys Thr Ile Cys Ile Glu Thr

835 840 845

Ile Lys Gly Thr Cys Trp Gln Thr Val Ile Asp Gly Arg Cys Glu Ile

850 855 860

Asn Ile Asn Gly Ala Thr Leu Lys Ser Gln Cys Cys Ser Ser Leu Gly

865 870 875 880

Ala Ala Trp Gly Ser Pro Cys Thr Leu Cys Gln Val Asp Pro Ile Cys

885 890 895

Gly Lys Gly Tyr Ser Arg Ile Lys Gly Thr Gln Cys Glu Asp Ile Asp

900 905 910

Glu Cys Glu Val Phe Pro Gly Val Cys Lys Asn Gly Leu Cys Val Asn

915 920 925

Thr Arg Gly Ser Phe Lys Cys Gln Cys Pro Ser Gly Met Thr Leu Asp

930 935 940

Ala Thr Gly Arg Ile Cys Leu Asp Ile Arg Leu Glu Thr Cys Phe Leu

945 950 955 960

Arg Tyr Glu Asp Glu Glu Cys Thr Leu Pro Ile Ala Gly Arg His Arg

965 970 975

Met Asp Ala Cys Cys Cys Ser Val Gly Ala Ala Trp Gly Thr Glu Glu

980 985 990

Cys Glu Glu Cys Pro Met Arg Asn Thr Pro Glu Tyr Glu Glu Leu Cys

995 1000 1005

Pro Arg Gly Pro Gly Phe Ala Thr Lys Glu Ile Thr Asn Gly Lys Pro

1010 1015 1020

Phe Phe Lys Asp Ile Asn Glu Cys Lys Met Ile Pro Ser Leu Cys Thr

1025 1030 1035 1040

His Gly Lys Cys Arg Asn Thr Ile Gly Ser Phe Lys Cys Arg Cys Asp

1045 1050 1055

Ser Gly Phe Ala Leu Asp Ser Glu Glu Arg Asn Cys Thr Asp Ile Asp

1060 1065 1070

Glu Cys Arg Ile Ser Pro Asp Leu Cys Gly Arg Gly Gln Cys Val Asn

1075 1080 1085

Thr Pro Gly Asp Phe Glu Cys Lys Cys Asp Glu Gly Tyr Glu Ser Gly

1090 1095 1100

Phe Met Met Met Lys Asn Cys Met Asp Ile Asp Glu Cys Gln Arg Asp

1105 1110 1115 1120

Pro Leu Leu Cys Arg Gly Gly Val Cys His Asn Thr Glu Gly Ser Tyr

1125 1130 1135

Arg Cys Glu Cys Pro Pro Gly His Gln Leu Ser Pro Asn Ile Ser Ala

1140 1145 1150

Cys Ile Asp Ile Asn Glu Cys Glu Leu Ser Ala His Leu Cys Pro Asn

1155 1160 1165

Gly Arg Cys Val Asn Leu Ile Gly Lys Tyr Gln Cys Ala Cys Asn Pro

1170 1175 1180

Gly Tyr His Ser Thr Pro Asp Arg Leu Phe Cys Val Asp Ile Asp Glu

1185 1190 1195 1200

Cys Ser Ile Met Asn Gly Gly Cys Glu Thr Phe Cys Thr Asn Ser Glu

1205 1210 1215

Gly Ser Tyr Glu Cys Ser Cys Gln Pro Gly Phe Ala Leu Met Pro Asp

1220 1225 1230

Gln Arg Ser Cys Thr Asp Ile Asp Glu Cys Glu Asp Asn Pro Asn Ile

1235 1240 1245

Cys Asp Gly Gly Gln Cys Thr Asn Ile Pro Gly Glu Tyr Arg Cys Leu

1250 1255 1260

Cys Tyr Asp Gly Phe Met Ala Ser Glu Asp Met Lys Thr Cys Val Asp

1265 1270 1275 1280

Val Asn Glu Cys Asp Leu Asn Pro Asn Ile Cys Leu Ser Gly Thr Cys

1285 1290 1295

Glu Asn Thr Lys Gly Ser Phe Ile Cys His Cys Asp Met Gly Tyr Ser

1300 1305 1310

Gly Lys Lys Gly Lys Thr Gly Cys Thr Asp Ile Asn Glu Cys Glu Ile

1315 1320 1325

Gly Ala His Asn Cys Gly Lys His Ala Val Cys Thr Asn Thr Ala Gly

1330 1335 1340

Ser Phe Lys Cys Ser Cys Ser Pro Gly Trp Ile Gly Asp Gly Ile Lys

1345 1350 1355 1360

Cys Thr Asp Leu Asp Glu Cys Ser Asn Gly Thr His Met Cys Ser Gln

1365 1370 1375

His Ala Asp Cys Lys Asn Thr Met Gly Ser Tyr Arg Cys Leu Cys Lys

1380 1385 1390

Glu Gly Tyr Thr Gly Asp Gly Phe Thr Cys Thr Asp Leu Asp Glu Cys

1395 1400 1405

Ser Glu Asn Leu Asn Leu Cys Gly Asn Gly Gln Cys Leu Asn Ala Pro

1410 1415 1420

Gly Gly Tyr Arg Cys Glu Cys Asp Met Gly Phe Val Pro Ser Ala Asp

1425 1430 1435 1440

Gly Lys Ala Cys Glu Asp Ile Asp Glu Cys Ser Leu Pro Asn Ile Cys

1445 1450 1455

Val Phe Gly Thr Cys His Asn Leu Pro Gly Leu Phe Arg Cys Glu Cys

1460 1465 1470

Glu Ile Gly Tyr Glu Leu Asp Arg Ser Gly Gly Asn Cys Thr Asp Val

1475 1480 1485

Asn Glu Cys Leu Asp Pro Thr Thr Cys Ile Ser Gly Asn Cys Val Asn

1490 1495 1500

Thr Pro Gly Ser Tyr Ile Cys Asp Cys Pro Pro Asp Phe Glu Leu Asn

1505 1510 1515 1520

Pro Thr Arg Val Gly Cys Val Asp Thr Arg Ser Gly Asn Cys Tyr Leu

1525 1530 1535

Asp Ile Arg Pro Arg Gly Asp Asn Gly Asp Thr Ala Cys Ser Asn Glu

1540 1545 1550

Ile Gly Val Gly Val Ser Lys Ala Ser Cys Cys Cys Ser Leu Gly Lys

1555 1560 1565

Ala Trp Gly Thr Pro Cys Glu Met Cys Pro Ala Val Asn Thr Ser Glu

1570 1575 1580

Tyr Lys Ile Leu Cys Pro Gly Gly Glu Gly Phe Arg Pro Asn Pro Ile

1585 1590 1595 1600

Thr Val Ile Leu Glu Asp Ile Asp Glu Cys Gln Glu Leu Pro Gly Leu

1605 1610 1615

Cys Gln Gly Gly Lys Cys Ile Asn Thr Phe Gly Ser Phe Gln Cys Arg

1620 1625 1630

Cys Pro Thr Gly Tyr Tyr Leu Asn Glu Asp Thr Arg Val Cys Asp Asp

1635 1640 1645

Val Asn Glu Cys Glu Thr Pro Gly Ile Cys Gly Pro Gly Thr Cys Tyr

1650 1655 1660

Asn Thr Val Gly Asn Tyr Thr Cys Ile Cys Pro Pro Asp Tyr Met Gln

1665 1670 1675 1680

Val Asn Gly Gly Asn Asn Cys Met Asp Met Arg Arg Ser Leu Cys Tyr

1685 1690 1695

Arg Asn Tyr Tyr Ala Asp Asn Gln Thr Cys Asp Gly Glu Leu Leu Phe

1700 1705 1710

Asn Met Thr Lys Lys Met Cys Cys Cys Ser Tyr Asn Ile Gly Arg Ala

1715 1720 1725

Trp Asn Lys Pro Cys Glu Gln Cys Pro Ile Pro Ser Thr Asp Glu Phe

1730 1735 1740

Ala Thr Leu Cys Gly Ser Gln Arg Pro Gly Phe Val Ile Asp Ile Tyr

1745 1750 1755 1760

Thr Gly Leu Pro Val Asp Ile Asp Glu Cys Arg Glu Ile Pro Gly Val

1765 1770 1775

Cys Glu Asn Gly Val Cys Ile Asn Met Val Gly Ser Phe Arg Cys Glu

1780 1785 1790

Cys Pro Val Gly Phe Phe Tyr Asn Asp Lys Leu Leu Val Cys Glu Asp

1795 1800 1805

Ile Asp Glu Cys Gln Asn Gly Pro Val Cys Gln Arg Asn Ala Glu Cys

1810 1815 1820

Ile Asn Thr Ala Gly Ser Tyr Arg Cys Asp Cys Lys Pro Gly Tyr Arg

1825 1830 1835 1840

Phe Thr Ser Thr Gly Gln Cys Asn Asp Arg Asn Glu Cys Gln Glu Ile

1845 1850 1855

Pro Asn Ile Cys Ser His Gly Gln Cys Ile Asp Thr Val Gly Ser Phe

1860 1865 1870

Tyr Cys Leu Cys His Thr Gly Phe Lys Thr Asn Asp Asp Gln Thr Met

1875 1880 1885

Cys Leu Asp Ile Asn Glu Cys Glu Arg Asp Ala Cys Gly Asn Gly Thr

1890 1895 1900

Cys Arg Asn Thr Ile Gly Ser Phe Asn Cys Arg Cys Asn His Gly Phe

1905 1910 1915 1920

Ile Leu Ser His Asn Asn Asp Cys Ile Asp Val Asp Glu Cys Ala Ser

1925 1930 1935

Gly Asn Gly Asn Leu Cys Arg Asn Gly Gln Cys Ile Asn Thr Val Gly

1940 1945 1950

Ser Phe Gln Cys Gln Cys Asn Glu Gly Tyr Glu Val Ala Pro Asp Gly

1955 1960 1965

Arg Thr Cys Val Asp Ile Asn Glu Cys Leu Leu Glu Pro Arg Lys Cys

1970 1975 1980

Ala Pro Gly Thr Cys Gln Asn Leu Asp Gly Ser Tyr Arg Cys Ile Cys

1985 1990 1995 2000

Pro Pro Gly Tyr Ser Leu Gln Asn Glu Lys Cys Glu Asp Ile Asp Glu

2005 2010 2015

Cys Val Glu Glu Pro Glu Ile Cys Ala Leu Gly Thr Cys Ser Asn Thr

2020 2025 2030

Glu Gly Ser Phe Lys Cys Leu Cys Pro Glu Gly Phe Ser Leu Ser Ser

2035 2040 2045

Ser Gly Arg Arg Cys Gln Asp Leu Arg Met Ser Tyr Cys Tyr Ala Lys

2050 2055 2060

Phe Glu Gly Gly Lys Cys Ser Ser Pro Lys Ser Arg Asn His Ser Lys

2065 2070 2075 2080

Gln Glu Cys Cys Cys Ala Leu Lys Gly Glu Gly Trp Gly Asp Pro Cys

2085 2090 2095

Glu Leu Cys Pro Thr Glu Pro Asp Glu Ala Phe Arg Gln Ile Cys Pro

2100 2105 2110

Tyr Gly Ser Gly Ile Ile Val Gly Pro Asp Asp Ser Ala Val Asp Met

2115 2120 2125

Asp Glu Cys Lys Glu Pro Asp Val Cys Lys His Gly Gln Cys Ile Asn

2130 2135 2140

Thr Asp Gly Ser Tyr Arg Cys Glu Cys Pro Phe Gly Tyr Ile Leu Ala

2145 2150 2155 2160

Gly Asn Glu Cys Val Asp Thr Asp Glu Cys Ser Val Gly Asn Pro Cys

2165 2170 2175

Gly Asn Gly Thr Cys Lys Asn Val Ile Gly Gly Phe Glu Cys Thr Cys

2180 2185 2190

Glu Glu Gly Phe Glu Pro Gly Pro Met Met Thr Cys Glu Asp Ile Asn

2195 2200 2205

Glu Cys Ala Gln Asn Pro Leu Leu Cys Ala Phe Arg Cys Val Asn Thr

2210 2215 2220

Tyr Gly Ser Tyr Glu Cys Lys Cys Pro Val Gly Tyr Val Leu Arg Glu

2225 2230 2235 2240

Asp Arg Arg Met Cys Lys Asp Glu Asp Glu Cys Glu Glu Gly Lys His

2245 2250 2255

Asp Cys Thr Glu Lys Gln Met Glu Cys Lys Asn Leu Ile Gly Thr Tyr

2260 2265 2270

Met Cys Ile Cys Gly Pro Gly Tyr Gln Arg Arg Pro Asp Gly Glu Gly

2275 2280 2285

Cys Val Asp Glu Asn Glu Cys Gln Thr Lys Pro Gly Ile Cys Glu Asn

2290 2295 2300

Gly Arg Cys Leu Asn Thr Arg Gly Ser Tyr Thr Cys Glu Cys Asn Asp

2305 2310 2315 2320

Gly Phe Thr Ala Ser Pro Asn Gln Asp Glu Cys Leu Asp Asn Arg Glu

2325 2330 2335

Gly Tyr Cys Phe Thr Glu Val Leu Gln Asn Met Cys Gln Ile Gly Ser

2340 2345 2350

Ser Asn Arg Asn Pro Val Thr Lys Ser Glu Cys Cys Cys Asp Gly Gly

2355 2360 2365

Arg Gly Trp Gly Pro His Cys Glu Ile Cys Pro Phe Gln Gly Thr Val

2370 2375 2380

Ala Phe Lys Lys Leu Cys Pro His Gly Arg Gly Phe Met Thr Asn Gly

2385 2390 2395 2400

Ala Asp Ile Asp Glu Cys Lys Val Ile His Asp Val Cys Arg Asn Gly

2405 2410 2415

Glu Cys Val Asn Asp Arg Gly Ser Tyr His Cys Ile Cys Lys Thr Gly

2420 2425 2430

Tyr Thr Pro Asp Ile Thr Gly Thr Ser Cys Val Asp Leu Asn Glu Cys

2435 2440 2445

Asn Gln Ala Pro Lys Pro Cys Asn Phe Ile Cys Lys Asn Thr Glu Gly

2450 2455 2460

Ser Tyr Gln Cys Ser Cys Pro Lys Gly Tyr Ile Leu Gln Glu Asp Gly

2465 2470 2475 2480

Arg Ser Cys Lys Asp Leu Asp Glu Cys Ala Thr Lys Gln His Asn Cys

2485 2490 2495

Gln Phe Leu Cys Val Asn Thr Ile Gly Gly Phe Thr Cys Lys Cys Pro

2500 2505 2510

Pro Gly Phe Thr Gln His His Thr Ser Cys Ile Asp Asn Asn Glu Cys

2515 2520 2525

Thr Ser Asp Ile Asn Leu Cys Gly Ser Lys Gly Ile Cys Gln Asn Thr

2530 2535 2540

Pro Gly Ser Phe Thr Cys Glu Cys Gln Arg Gly Phe Ser Leu Asp Gln

2545 2550 2555 2560

Thr Gly Ser Ser Cys Glu Asp Val Asp Glu Cys Glu Gly Asn His Arg

2565 2570 2575

Cys Gln His Gly Cys Gln Asn Ile Ile Gly Gly Tyr Arg Cys Ser Cys

2580 2585 2590

Pro Gln Gly Tyr Leu Gln His Tyr Gln Trp Asn Gln Cys Val Asp Glu

2595 2600 2605

Asn Glu Cys Leu Ser Ala His Ile Cys Gly Gly Ala Ser Cys His Asn

2610 2615 2620

Thr Leu Gly Ser Tyr Lys Cys Met Cys Pro Ala Gly Phe Gln Tyr Glu

2625 2630 2635 2640

Gln Phe Ser Gly Gly Cys Gln Asp Ile Asn Glu Cys Gly Ser Ala Gln

2645 2650 2655

Ala Pro Cys Ser Tyr Gly Cys Ser Asn Thr Glu Gly Gly Tyr Leu Cys

2660 2665 2670

Gly Cys Pro Pro Gly Tyr Phe Arg Ile Gly Gln Gly His Cys Val Ser

2675 2680 2685

Gly Met Gly Met Gly Arg Gly Asn Pro Glu Pro Pro Val Ser Gly Glu

2690 2695 2700

Met Asp Asp Asn Ser Leu Ser Pro Glu Ala Cys Tyr Glu Cys Lys Ile

2705 2710 2715 2720

Asn Gly Tyr Pro Lys Arg Gly Arg Lys Arg Arg Ser Thr Asn Glu Thr

2725 2730 2735

Asp Ala Ser Asn Ile Glu Asp Gln Ser Glu Thr Glu Ala Asn Val Ser

2740 2745 2750

Leu Ala Ser Trp Asp Val Glu Lys Thr Ala Ile Phe Ala Phe Asn Ile

2755 2760 2765

Ser His Val Ser Asn Lys Val Arg Ile Leu Glu Leu Leu Pro Ala Leu

2770 2775 2780

Thr Thr Leu Thr Asn His Asn Arg Tyr Leu Ile Glu Ser Gly Asn Glu

2785 2790 2795 2800

Asp Gly Phe Phe Lys Ile Asn Gln Lys Glu Gly Ile Ser Tyr Leu His

2805 2810 2815

Phe Thr Lys Lys Lys Pro Val Ala Gly Thr Tyr Ser Leu Gln Ile Ser

2820 2825 2830

Ser Thr Pro Leu Tyr Lys Lys Lys Glu Leu Asn Gln Leu Glu Asp Lys

2835 2840 2845

Tyr Asp Lys Asp Tyr Leu Ser Gly Glu Leu Gly Asp Asn Leu Lys Met

2850 2855 2860

Lys Ile Gln Val Leu Leu His

2865 2870

<210> 63

<211> 2912

<212> PRT

<213> 智人(Homo sapiens)

<400> 63

Met Gly Arg Arg Arg Arg Leu Cys Leu Gln Leu Tyr Phe Leu Trp Leu

1 5 10 15

Gly Cys Val Val Leu Trp Ala Gln Gly Thr Ala Gly Gln Pro Gln Pro

20 25 30

Pro Pro Pro Lys Pro Pro Arg Pro Gln Pro Pro Pro Gln Gln Val Arg

35 40 45

Ser Ala Thr Ala Gly Ser Glu Gly Gly Phe Leu Ala Pro Glu Tyr Arg

50 55 60

Glu Glu Gly Ala Ala Val Ala Ser Arg Val Arg Arg Arg Gly Gln Gln

65 70 75 80

Asp Val Leu Arg Gly Pro Asn Val Cys Gly Ser Arg Phe His Ser Tyr

85 90 95

Cys Cys Pro Gly Trp Lys Thr Leu Pro Gly Gly Asn Gln Cys Ile Val

100 105 110

Pro Ile Cys Arg Asn Ser Cys Gly Asp Gly Phe Cys Ser Arg Pro Asn

115 120 125

Met Cys Thr Cys Ser Ser Gly Gln Ile Ser Ser Thr Cys Gly Ser Lys

130 135 140

Ser Ile Gln Gln Cys Ser Val Arg Cys Met Asn Gly Gly Thr Cys Ala

145 150 155 160

Asp Asp His Cys Gln Cys Gln Lys Gly Tyr Ile Gly Thr Tyr Cys Gly

165 170 175

Gln Pro Val Cys Glu Asn Gly Cys Gln Asn Gly Gly Arg Cys Ile Gly

180 185 190

Pro Asn Arg Cys Ala Cys Val Tyr Gly Phe Thr Gly Pro Gln Cys Glu

195 200 205

Arg Asp Tyr Arg Thr Gly Pro Cys Phe Thr Gln Val Asn Asn Gln Met

210 215 220

Cys Gln Gly Gln Leu Thr Gly Ile Val Cys Thr Lys Thr Leu Cys Cys

225 230 235 240

Ala Thr Ile Gly Arg Ala Trp Gly His Pro Cys Glu Met Cys Pro Ala

245 250 255

Gln Pro Gln Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile Arg Thr Gly

260 265 270

Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Ile Pro Gly Ile Cys Gln

275 280 285

Gly Gly Asn Cys Ile Asn Thr Val Gly Ser Phe Glu Cys Arg Cys Pro

290 295 300

Ala Gly His Lys Gln Ser Glu Thr Thr Gln Lys Cys Glu Asp Ile Asp

305 310 315 320

Glu Cys Ser Ile Ile Pro Gly Ile Cys Glu Thr Gly Glu Cys Ser Asn

325 330 335

Thr Val Gly Ser Tyr Phe Cys Val Cys Pro Arg Gly Tyr Val Thr Ser

340 345 350

Thr Asp Gly Ser Arg Cys Ile Asp Gln Arg Thr Gly Met Cys Phe Ser

355 360 365

Gly Leu Val Asn Gly Arg Cys Ala Gln Glu Leu Pro Gly Arg Met Thr

370 375 380

Lys Met Gln Cys Cys Cys Glu Pro Gly Arg Cys Trp Gly Ile Gly Thr

385 390 395 400

Ile Pro Glu Ala Cys Pro Val Arg Gly Ser Glu Glu Tyr Arg Arg Leu

405 410 415

Cys Met Asp Gly Leu Pro Met Gly Gly Ile Pro Gly Ser Ala Gly Ser

420 425 430

Arg Pro Gly Gly Thr Gly Gly Asn Gly Phe Ala Pro Ser Gly Asn Gly

435 440 445

Asn Gly Tyr Gly Pro Gly Gly Thr Gly Phe Ile Pro Ile Pro Gly Gly

450 455 460

Asn Gly Phe Ser Pro Gly Val Gly Gly Ala Gly Val Gly Ala Gly Gly

465 470 475 480

Gln Gly Pro Ile Ile Thr Gly Leu Thr Ile Leu Asn Gln Thr Ile Asp

485 490 495

Ile Cys Lys His His Ala Asn Leu Cys Leu Asn Gly Arg Cys Ile Pro

500 505 510

Thr Val Ser Ser Tyr Arg Cys Glu Cys Asn Met Gly Tyr Lys Gln Asp

515 520 525

Ala Asn Gly Asp Cys Ile Asp Val Asp Glu Cys Thr Ser Asn Pro Cys

530 535 540

Thr Asn Gly Asp Cys Val Asn Thr Pro Gly Ser Tyr Tyr Cys Lys Cys

545 550 555 560

His Ala Gly Phe Gln Arg Thr Pro Thr Lys Gln Ala Cys Ile Asp Ile

565 570 575

Asp Glu Cys Ile Gln Asn Gly Val Leu Cys Lys Asn Gly Arg Cys Val

580 585 590

Asn Thr Asp Gly Ser Phe Gln Cys Ile Cys Asn Ala Gly Phe Glu Leu

595 600 605

Thr Thr Asp Gly Lys Asn Cys Val Asp His Asp Glu Cys Thr Thr Thr

610 615 620

Asn Met Cys Leu Asn Gly Met Cys Ile Asn Glu Asp Gly Ser Phe Lys

625 630 635 640

Cys Ile Cys Lys Pro Gly Phe Val Leu Ala Pro Asn Gly Arg Tyr Cys

645 650 655

Thr Asp Val Asp Glu Cys Gln Thr Pro Gly Ile Cys Met Asn Gly His

660 665 670

Cys Ile Asn Ser Glu Gly Ser Phe Arg Cys Asp Cys Pro Pro Gly Leu

675 680 685

Ala Val Gly Met Asp Gly Arg Val Cys Val Asp Thr His Met Arg Ser

690 695 700

Thr Cys Tyr Gly Gly Ile Lys Lys Gly Val Cys Val Arg Pro Phe Pro

705 710 715 720

Gly Ala Val Thr Lys Ser Glu Cys Cys Cys Ala Asn Pro Asp Tyr Gly

725 730 735

Phe Gly Glu Pro Cys Gln Pro Cys Pro Ala Lys Asn Ser Ala Glu Phe

740 745 750

His Gly Leu Cys Ser Ser Gly Val Gly Ile Thr Val Asp Gly Arg Asp

755 760 765

Ile Asn Glu Cys Ala Leu Asp Pro Asp Ile Cys Ala Asn Gly Ile Cys

770 775 780

Glu Asn Leu Arg Gly Ser Tyr Arg Cys Asn Cys Asn Ser Gly Tyr Glu

785 790 795 800

Pro Asp Ala Ser Gly Arg Asn Cys Ile Asp Ile Asp Glu Cys Leu Val

805 810 815

Asn Arg Leu Leu Cys Asp Asn Gly Leu Cys Arg Asn Thr Pro Gly Ser

820 825 830

Tyr Ser Cys Thr Cys Pro Pro Gly Tyr Val Phe Arg Thr Glu Thr Glu

835 840 845

Thr Cys Glu Asp Ile Asn Glu Cys Glu Ser Asn Pro Cys Val Asn Gly

850 855 860

Ala Cys Arg Asn Asn Leu Gly Ser Phe Asn Cys Glu Cys Ser Pro Gly

865 870 875 880

Ser Lys Leu Ser Ser Thr Gly Leu Ile Cys Ile Asp Ser Leu Lys Gly

885 890 895

Thr Cys Trp Leu Asn Ile Gln Asp Ser Arg Cys Glu Val Asn Ile Asn

900 905 910

Gly Ala Thr Leu Lys Ser Glu Cys Cys Ala Thr Leu Gly Ala Ala Trp

915 920 925

Gly Ser Pro Cys Glu Arg Cys Glu Leu Asp Thr Ala Cys Pro Arg Gly

930 935 940

Leu Ala Arg Ile Lys Gly Val Thr Cys Glu Asp Val Asn Glu Cys Glu

945 950 955 960

Val Phe Pro Gly Val Cys Pro Asn Gly Arg Cys Val Asn Ser Lys Gly

965 970 975

Ser Phe His Cys Glu Cys Pro Glu Gly Leu Thr Leu Asp Gly Thr Gly

980 985 990

Arg Val Cys Leu Asp Ile Arg Met Glu Gln Cys Tyr Leu Lys Trp Asp

995 1000 1005

Glu Asp Glu Cys Ile His Pro Val Pro Gly Lys Phe Arg Met Asp Ala

1010 1015 1020

Cys Cys Cys Ala Val Gly Ala Ala Trp Gly Thr Glu Cys Glu Glu Cys

1025 1030 1035 1040

Pro Lys Pro Gly Thr Lys Glu Tyr Glu Thr Leu Cys Pro Arg Gly Ala

1045 1050 1055

Gly Phe Ala Asn Arg Gly Asp Val Leu Thr Gly Arg Pro Phe Tyr Lys

1060 1065 1070

Asp Ile Asn Glu Cys Lys Ala Phe Pro Gly Met Cys Thr Tyr Gly Lys

1075 1080 1085

Cys Arg Asn Thr Ile Gly Ser Phe Lys Cys Arg Cys Asn Ser Gly Phe

1090 1095 1100

Ala Leu Asp Met Glu Glu Arg Asn Cys Thr Asp Ile Asp Glu Cys Arg

1105 1110 1115 1120

Ile Ser Pro Asp Leu Cys Gly Ser Gly Ile Cys Val Asn Thr Pro Gly

1125 1130 1135

Ser Phe Glu Cys Glu Cys Phe Glu Gly Tyr Glu Ser Gly Phe Met Met

1140 1145 1150

Met Lys Asn Cys Met Asp Ile Asp Glu Cys Glu Arg Asn Pro Leu Leu

1155 1160 1165

Cys Arg Gly Gly Thr Cys Val Asn Thr Glu Gly Ser Phe Gln Cys Asp

1170 1175 1180

Cys Pro Leu Gly His Glu Leu Ser Pro Ser Arg Glu Asp Cys Val Asp

1185 1190 1195 1200

Ile Asn Glu Cys Ser Leu Ser Asp Asn Leu Cys Arg Asn Gly Lys Cys

1205 1210 1215

Val Asn Met Ile Gly Thr Tyr Gln Cys Ser Cys Asn Pro Gly Tyr Gln

1220 1225 1230

Ala Thr Pro Asp Arg Gln Gly Cys Thr Asp Ile Asp Glu Cys Met Ile

1235 1240 1245

Met Asn Gly Gly Cys Asp Thr Gln Cys Thr Asn Ser Glu Gly Ser Tyr

1250 1255 1260

Glu Cys Ser Cys Ser Glu Gly Tyr Ala Leu Met Pro Asp Gly Arg Ser

1265 1270 1275 1280

Cys Ala Asp Ile Asp Glu Cys Glu Asn Asn Pro Asp Ile Cys Asp Gly

1285 1290 1295

Gly Gln Cys Thr Asn Ile Pro Gly Glu Tyr Arg Cys Leu Cys Tyr Asp

1300 1305 1310

Gly Phe Met Ala Ser Met Asp Met Lys Thr Cys Ile Asp Val Asn Glu

1315 1320 1325

Cys Asp Leu Asn Ser Asn Ile Cys Met Phe Gly Glu Cys Glu Asn Thr

1330 1335 1340

Lys Gly Ser Phe Ile Cys His Cys Gln Leu Gly Tyr Ser Val Lys Lys

1345 1350 1355 1360

Gly Thr Thr Gly Cys Thr Asp Val Asp Glu Cys Glu Ile Gly Ala His

1365 1370 1375

Asn Cys Asp Met His Ala Ser Cys Leu Asn Ile Pro Gly Ser Phe Lys

1380 1385 1390

Cys Ser Cys Arg Glu Gly Trp Ile Gly Asn Gly Ile Lys Cys Ile Asp

1395 1400 1405

Leu Asp Glu Cys Ser Asn Gly Thr His Gln Cys Ser Ile Asn Ala Gln

1410 1415 1420

Cys Val Asn Thr Pro Gly Ser Tyr Arg Cys Ala Cys Ser Glu Gly Phe

1425 1430 1435 1440

Thr Gly Asp Gly Phe Thr Cys Ser Asp Val Asp Glu Cys Ala Glu Asn

1445 1450 1455

Ile Asn Leu Cys Glu Asn Gly Gln Cys Leu Asn Val Pro Gly Ala Tyr

1460 1465 1470

Arg Cys Glu Cys Glu Met Gly Phe Thr Pro Ala Ser Asp Ser Arg Ser

1475 1480 1485

Cys Gln Asp Ile Asp Glu Cys Ser Phe Gln Asn Ile Cys Val Phe Gly

1490 1495 1500

Thr Cys Asn Asn Leu Pro Gly Met Phe His Cys Ile Cys Asp Asp Gly

1505 1510 1515 1520

Tyr Glu Leu Asp Arg Thr Gly Gly Asn Cys Thr Asp Ile Asp Glu Cys

1525 1530 1535

Ala Asp Pro Ile Asn Cys Val Asn Gly Leu Cys Val Asn Thr Pro Gly

1540 1545 1550

Arg Tyr Glu Cys Asn Cys Pro Pro Asp Phe Gln Leu Asn Pro Thr Gly

1555 1560 1565

Val Gly Cys Val Asp Asn Arg Val Gly Asn Cys Tyr Leu Lys Phe Gly

1570 1575 1580

Pro Arg Gly Asp Gly Ser Leu Ser Cys Asn Thr Glu Ile Gly Val Gly

1585 1590 1595 1600

Val Ser Arg Ser Ser Cys Cys Cys Ser Leu Gly Lys Ala Trp Gly Asn

1605 1610 1615

Pro Cys Glu Thr Cys Pro Pro Val Asn Ser Thr Glu Tyr Tyr Thr Leu

1620 1625 1630

Cys Pro Gly Gly Glu Gly Phe Arg Pro Asn Pro Ile Thr Ile Ile Leu

1635 1640 1645

Glu Asp Ile Asp Glu Cys Gln Glu Leu Pro Gly Leu Cys Gln Gly Gly

1650 1655 1660

Asn Cys Ile Asn Thr Phe Gly Ser Phe Gln Cys Glu Cys Pro Gln Gly

1665 1670 1675 1680

Tyr Tyr Leu Ser Glu Asp Thr Arg Ile Cys Glu Asp Ile Asp Glu Cys

1685 1690 1695

Phe Ala His Pro Gly Val Cys Gly Pro Gly Thr Cys Tyr Asn Thr Leu

1700 1705 1710

Gly Asn Tyr Thr Cys Ile Cys Pro Pro Glu Tyr Met Gln Val Asn Gly

1715 1720 1725

Gly His Asn Cys Met Asp Met Arg Lys Ser Phe Cys Tyr Arg Ser Tyr

1730 1735 1740

Asn Gly Thr Thr Cys Glu Asn Glu Leu Pro Phe Asn Val Thr Lys Arg

1745 1750 1755 1760

Met Cys Cys Cys Thr Tyr Asn Val Gly Lys Ala Trp Asn Lys Pro Cys

1765 1770 1775

Glu Pro Cys Pro Thr Pro Gly Thr Ala Asp Phe Lys Thr Ile Cys Gly

1780 1785 1790

Asn Ile Pro Gly Phe Thr Phe Asp Ile His Thr Gly Lys Ala Val Asp

1795 1800 1805

Ile Asp Glu Cys Lys Glu Ile Pro Gly Ile Cys Ala Asn Gly Val Cys

1810 1815 1820

Ile Asn Gln Ile Gly Ser Phe Arg Cys Glu Cys Pro Thr Gly Phe Ser

1825 1830 1835 1840

Tyr Asn Asp Leu Leu Leu Val Cys Glu Asp Ile Asp Glu Cys Ser Asn

1845 1850 1855

Gly Asp Asn Leu Cys Gln Arg Asn Ala Asp Cys Ile Asn Ser Pro Gly

1860 1865 1870

Ser Tyr Arg Cys Glu Cys Ala Ala Gly Phe Lys Leu Ser Pro Asn Gly

1875 1880 1885

Ala Cys Val Asp Arg Asn Glu Cys Leu Glu Ile Pro Asn Val Cys Ser

1890 1895 1900

His Gly Leu Cys Val Asp Leu Gln Gly Ser Tyr Gln Cys Ile Cys His

1905 1910 1915 1920

Asn Gly Phe Lys Ala Ser Gln Asp Gln Thr Met Cys Met Asp Val Asp

1925 1930 1935

Glu Cys Glu Arg His Pro Cys Gly Asn Gly Thr Cys Lys Asn Thr Val

1940 1945 1950

Gly Ser Tyr Asn Cys Leu Cys Tyr Pro Gly Phe Glu Leu Thr His Asn

1955 1960 1965

Asn Asp Cys Leu Asp Ile Asp Glu Cys Ser Ser Phe Phe Gly Gln Val

1970 1975 1980

Cys Arg Asn Gly Arg Cys Phe Asn Glu Ile Gly Ser Phe Lys Cys Leu

1985 1990 1995 2000

Cys Asn Glu Gly Tyr Glu Leu Thr Pro Asp Gly Lys Asn Cys Ile Asp

2005 2010 2015

Thr Asn Glu Cys Val Ala Leu Pro Gly Ser Cys Ser Pro Gly Thr Cys

2020 2025 2030

Gln Asn Leu Glu Gly Ser Phe Arg Cys Ile Cys Pro Pro Gly Tyr Glu

2035 2040 2045

Val Lys Ser Glu Asn Cys Ile Asp Ile Asn Glu Cys Asp Glu Asp Pro

2050 2055 2060

Asn Ile Cys Leu Phe Gly Ser Cys Thr Asn Thr Pro Gly Gly Phe Gln

2065 2070 2075 2080

Cys Leu Cys Pro Pro Gly Phe Val Leu Ser Asp Asn Gly Arg Arg Cys

2085 2090 2095

Phe Asp Thr Arg Gln Ser Phe Cys Phe Thr Asn Phe Glu Asn Gly Lys

2100 2105 2110

Cys Ser Val Pro Lys Ala Phe Asn Thr Thr Lys Ala Lys Cys Cys Cys

2115 2120 2125

Ser Lys Met Pro Gly Glu Gly Trp Gly Asp Pro Cys Glu Leu Cys Pro

2130 2135 2140

Lys Asp Asp Glu Val Ala Phe Gln Asp Leu Cys Pro Tyr Gly His Gly

2145 2150 2155 2160

Thr Val Pro Ser Leu His Asp Thr Arg Glu Asp Val Asn Glu Cys Leu

2165 2170 2175

Glu Ser Pro Gly Ile Cys Ser Asn Gly Gln Cys Ile Asn Thr Asp Gly

2180 2185 2190

Ser Phe Arg Cys Glu Cys Pro Met Gly Tyr Asn Leu Asp Tyr Thr Gly

2195 2200 2205

Val Arg Cys Val Asp Thr Asp Glu Cys Ser Ile Gly Asn Pro Cys Gly

2210 2215 2220

Asn Gly Thr Cys Thr Asn Val Ile Gly Ser Phe Glu Cys Asn Cys Asn

2225 2230 2235 2240

Glu Gly Phe Glu Pro Gly Pro Met Met Asn Cys Glu Asp Ile Asn Glu

2245 2250 2255

Cys Ala Gln Asn Pro Leu Leu Cys Ala Phe Arg Cys Met Asn Thr Phe

2260 2265 2270

Gly Ser Tyr Glu Cys Thr Cys Pro Ile Gly Tyr Ala Leu Arg Glu Asp

2275 2280 2285

Gln Lys Met Cys Lys Asp Leu Asp Glu Cys Ala Glu Gly Leu His Asp

2290 2295 2300

Cys Glu Ser Arg Gly Met Met Cys Lys Asn Leu Ile Gly Thr Phe Met

2305 2310 2315 2320

Cys Ile Cys Pro Pro Gly Met Ala Arg Arg Pro Asp Gly Glu Gly Cys

2325 2330 2335

Val Asp Glu Asn Glu Cys Arg Thr Lys Pro Gly Ile Cys Glu Asn Gly

2340 2345 2350

Arg Cys Val Asn Ile Ile Gly Ser Tyr Arg Cys Glu Cys Asn Glu Gly

2355 2360 2365

Phe Gln Ser Ser Ser Ser Gly Thr Glu Cys Leu Asp Asn Arg Gln Gly

2370 2375 2380

Leu Cys Phe Ala Glu Val Leu Gln Thr Ile Cys Gln Met Ala Ser Ser

2385 2390 2395 2400

Ser Arg Asn Leu Val Thr Lys Ser Glu Cys Cys Cys Asp Gly Gly Arg

2405 2410 2415

Gly Trp Gly His Gln Cys Glu Leu Cys Pro Leu Pro Gly Thr Ala Gln

2420 2425 2430

Tyr Lys Lys Ile Cys Pro His Gly Pro Gly Tyr Thr Thr Asp Gly Arg

2435 2440 2445

Asp Ile Asp Glu Cys Lys Val Met Pro Asn Leu Cys Thr Asn Gly Gln

2450 2455 2460

Cys Ile Asn Thr Met Gly Ser Phe Arg Cys Phe Cys Lys Val Gly Tyr

2465 2470 2475 2480

Thr Thr Asp Ile Ser Gly Thr Ser Cys Ile Asp Leu Asp Glu Cys Ser

2485 2490 2495

Gln Ser Pro Lys Pro Cys Asn Tyr Ile Cys Lys Asn Thr Glu Gly Ser

2500 2505 2510

Tyr Gln Cys Ser Cys Pro Arg Gly Tyr Val Leu Gln Glu Asp Gly Lys

2515 2520 2525

Thr Cys Lys Asp Leu Asp Glu Cys Gln Thr Lys Gln His Asn Cys Gln

2530 2535 2540

Phe Leu Cys Val Asn Thr Leu Gly Gly Phe Thr Cys Lys Cys Pro Pro

2545 2550 2555 2560

Gly Phe Thr Gln His His Thr Ala Cys Ile Asp Asn Asn Glu Cys Gly

2565 2570 2575

Ser Gln Pro Ser Leu Cys Gly Ala Lys Gly Ile Cys Gln Asn Thr Pro

2580 2585 2590

Gly Ser Phe Ser Cys Glu Cys Gln Arg Gly Phe Ser Leu Asp Ala Thr

2595 2600 2605

Gly Leu Asn Cys Glu Asp Val Asp Glu Cys Asp Gly Asn His Arg Cys

2610 2615 2620

Gln His Gly Cys Gln Asn Ile Leu Gly Gly Tyr Arg Cys Gly Cys Pro

2625 2630 2635 2640

Gln Gly Tyr Ile Gln His Tyr Gln Trp Asn Gln Cys Val Asp Glu Asn

2645 2650 2655

Glu Cys Ser Asn Pro Asn Ala Cys Gly Ser Ala Ser Cys Tyr Asn Thr

2660 2665 2670

Leu Gly Ser Tyr Lys Cys Ala Cys Pro Ser Gly Phe Ser Phe Asp Gln

2675 2680 2685

Phe Ser Ser Ala Cys His Asp Val Asn Glu Cys Ser Ser Ser Lys Asn

2690 2695 2700

Pro Cys Asn Tyr Gly Cys Ser Asn Thr Glu Gly Gly Tyr Leu Cys Gly

2705 2710 2715 2720

Cys Pro Pro Gly Tyr Tyr Arg Val Gly Gln Gly His Cys Val Ser Gly

2725 2730 2735

Met Gly Phe Asn Lys Gly Gln Tyr Leu Ser Leu Asp Thr Glu Val Asp

2740 2745 2750

Glu Glu Asn Ala Leu Ser Pro Glu Ala Cys Tyr Glu Cys Lys Ile Asn

2755 2760 2765

Gly Tyr Ser Lys Lys Asp Ser Arg Gln Lys Arg Ser Ile His Glu Pro

2770 2775 2780

Asp Pro Thr Ala Val Glu Gln Ile Ser Leu Glu Ser Val Asp Met Asp

2785 2790 2795 2800

Ser Pro Val Asn Met Lys Phe Asn Leu Ser His Leu Gly Ser Lys Glu

2805 2810 2815

His Ile Leu Glu Leu Arg Pro Ala Ile Gln Pro Leu Asn Asn His Ile

2820 2825 2830

Arg Tyr Val Ile Ser Gln Gly Asn Asp Asp Ser Val Phe Arg Ile His

2835 2840 2845

Gln Arg Asn Gly Leu Ser Tyr Leu His Thr Ala Lys Lys Lys Leu Met

2850 2855 2860

Pro Gly Thr Tyr Thr Leu Glu Ile Thr Ser Ile Pro Leu Tyr Lys Lys

2865 2870 2875 2880

Lys Glu Leu Lys Lys Leu Glu Glu Ser Asn Glu Asp Asp Tyr Leu Leu

2885 2890 2895

Gly Glu Leu Gly Glu Ala Leu Arg Met Arg Leu Gln Ile Gln Leu Tyr

2900 2905 2910

<210> 64

<211> 2809

<212> PRT

<213> 智人(Homo sapiens)

<400> 64

Met Thr Leu Glu Gly Leu Tyr Leu Ala Arg Gly Pro Leu Ala Arg Leu

1 5 10 15

Leu Leu Ala Trp Ser Ala Leu Leu Cys Met Ala Gly Gly Gln Gly Arg

20 25 30

Trp Asp Gly Ala Leu Glu Ala Ala Gly Pro Gly Arg Val Arg Arg Arg

35 40 45

Gly Ser Pro Gly Ile Leu Gln Gly Pro Asn Val Cys Gly Ser Arg Phe

50 55 60

His Ala Tyr Cys Cys Pro Gly Trp Arg Thr Phe Pro Gly Arg Ser Gln

65 70 75 80

Cys Val Val Pro Ile Cys Arg Arg Ala Cys Gly Glu Gly Phe Cys Ser

85 90 95

Gln Pro Asn Leu Cys Thr Cys Ala Asp Gly Thr Leu Ala Pro Ser Cys

100 105 110

Gly Val Ser Arg Gly Ser Gly Cys Ser Val Ser Cys Met Asn Gly Gly

115 120 125

Thr Cys Arg Gly Ala Ser Cys Leu Cys Gln Lys Gly Tyr Thr Gly Thr

130 135 140

Val Cys Gly Gln Pro Ile Cys Asp Arg Gly Cys His Asn Gly Gly Arg

145 150 155 160

Cys Ile Gly Pro Asn Arg Cys Ala Cys Val Tyr Gly Phe Met Gly Pro

165 170 175

Gln Cys Glu Arg Asp Tyr Arg Thr Gly Pro Cys Phe Gly Gln Val Gly

180 185 190

Pro Glu Gly Cys Gln His Gln Leu Thr Gly Leu Val Cys Thr Lys Ala

195 200 205

Leu Cys Cys Ala Thr Val Gly Arg Ala Trp Gly Leu Pro Cys Glu Leu

210 215 220

Cys Pro Ala Gln Pro His Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile

225 230 235 240

His Thr Gly Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Val Pro Gly

245 250 255

Leu Cys Gln Gly Gly Ser Cys Val Asn Met Val Gly Ser Phe His Cys

260 265 270

Arg Cys Pro Val Gly His Arg Leu Ser Asp Ser Ser Ala Ala Cys Glu

275 280 285

Asp Tyr Arg Ala Gly Ala Cys Phe Ser Val Leu Phe Gly Gly Arg Cys

290 295 300

Ala Gly Asp Leu Ala Gly His Tyr Thr Arg Arg Gln Cys Cys Cys Asp

305 310 315 320

Arg Gly Arg Cys Trp Ala Ala Gly Pro Val Pro Glu Leu Cys Pro Pro

325 330 335

Arg Gly Ser Asn Glu Phe Gln Gln Leu Cys Ala Gln Arg Leu Pro Leu

340 345 350

Leu Pro Gly His Pro Gly Leu Phe Pro Gly Leu Leu Gly Phe Gly Ser

355 360 365

Asn Gly Met Gly Pro Pro Leu Gly Pro Ala Arg Leu Asn Pro His Gly

370 375 380

Ser Asp Ala Arg Gly Ile Pro Ser Leu Gly Pro Gly Asn Ser Asn Ile

385 390 395 400

Gly Thr Ala Thr Leu Asn Gln Thr Ile Asp Ile Cys Arg His Phe Thr

405 410 415

Asn Leu Cys Leu Asn Gly Arg Cys Leu Pro Thr Pro Ser Ser Tyr Arg

420 425 430

Cys Glu Cys Asn Val Gly Tyr Thr Gln Asp Val Arg Gly Glu Cys Ile

435 440 445

Asp Val Asp Glu Cys Thr Ser Ser Pro Cys His His Gly Asp Cys Val

450 455 460

Asn Ile Pro Gly Thr Tyr His Cys Arg Cys Tyr Pro Gly Phe Gln Ala

465 470 475 480

Thr Pro Thr Arg Gln Ala Cys Val Asp Val Asp Glu Cys Ile Val Ser

485 490 495

Gly Gly Leu Cys His Leu Gly Arg Cys Val Asn Thr Glu Gly Ser Phe

500 505 510

Gln Cys Val Cys Asn Ala Gly Phe Glu Leu Ser Pro Asp Gly Lys Asn

515 520 525

Cys Val Asp His Asn Glu Cys Ala Thr Ser Thr Met Cys Val Asn Gly

530 535 540

Val Cys Leu Asn Glu Asp Gly Ser Phe Ser Cys Leu Cys Lys Pro Gly

545 550 555 560

Phe Leu Leu Ala Pro Gly Gly His Tyr Cys Met Asp Ile Asp Glu Cys

565 570 575

Gln Thr Pro Gly Ile Cys Val Asn Gly His Cys Thr Asn Thr Glu Gly

580 585 590

Ser Phe Arg Cys Gln Cys Leu Gly Gly Leu Ala Val Gly Thr Asp Gly

595 600 605

Arg Val Cys Val Asp Thr His Val Arg Ser Thr Cys Tyr Gly Ala Ile

610 615 620

Glu Lys Gly Ser Cys Ala Arg Pro Phe Pro Gly Thr Val Thr Lys Ser

625 630 635 640

Glu Cys Cys Cys Ala Asn Pro Asp His Gly Phe Gly Glu Pro Cys Gln

645 650 655

Leu Cys Pro Ala Lys Asp Ser Ala Glu Phe Gln Ala Leu Cys Ser Ser

660 665 670

Gly Leu Gly Ile Thr Thr Asp Gly Arg Asp Ile Asn Glu Cys Ala Leu

675 680 685

Asp Pro Glu Val Cys Ala Asn Gly Val Cys Glu Asn Leu Arg Gly Ser

690 695 700

Tyr Arg Cys Val Cys Asn Leu Gly Tyr Glu Ala Gly Ala Ser Gly Lys

705 710 715 720

Asp Cys Thr Asp Val Asp Glu Cys Ala Leu Asn Ser Leu Leu Cys Asp

725 730 735

Asn Gly Trp Cys Gln Asn Ser Pro Gly Ser Tyr Ser Cys Ser Cys Pro

740 745 750

Pro Gly Phe His Phe Trp Gln Asp Thr Glu Ile Cys Lys Asp Val Asp

755 760 765

Glu Cys Leu Ser Ser Pro Cys Val Ser Gly Val Cys Arg Asn Leu Ala

770 775 780

Gly Ser Tyr Thr Cys Lys Cys Gly Pro Gly Ser Arg Leu Asp Pro Ser

785 790 795 800

Gly Thr Phe Cys Leu Asp Ser Thr Lys Gly Thr Cys Trp Leu Lys Ile

805 810 815

Gln Glu Ser Arg Cys Glu Val Asn Leu Gln Gly Ala Ser Leu Arg Ser

820 825 830

Glu Cys Cys Ala Thr Leu Gly Ala Ala Trp Gly Ser Pro Cys Glu Arg

835 840 845

Cys Glu Ile Asp Pro Ala Cys Ala Arg Gly Phe Ala Arg Met Thr Gly

850 855 860

Val Thr Cys Asp Asp Val Asn Glu Cys Glu Ser Phe Pro Gly Val Cys

865 870 875 880

Pro Asn Gly Arg Cys Val Asn Thr Ala Gly Ser Phe Arg Cys Glu Cys

885 890 895

Pro Glu Gly Leu Met Leu Asp Ala Ser Gly Arg Leu Cys Val Asp Val

900 905 910

Arg Leu Glu Pro Cys Phe Leu Arg Trp Asp Glu Asp Glu Cys Gly Val

915 920 925

Thr Leu Pro Gly Lys Tyr Arg Met Asp Val Cys Cys Cys Ser Ile Gly

930 935 940

Ala Val Trp Gly Val Glu Cys Glu Ala Cys Pro Asp Pro Glu Ser Leu

945 950 955 960

Glu Phe Ala Ser Leu Cys Pro Arg Gly Leu Gly Phe Ala Ser Arg Asp

965 970 975

Phe Leu Ser Gly Arg Pro Phe Tyr Lys Asp Val Asn Glu Cys Lys Val

980 985 990

Phe Pro Gly Leu Cys Thr His Gly Thr Cys Arg Asn Thr Val Gly Ser

995 1000 1005

Phe His Cys Ala Cys Ala Gly Gly Phe Ala Leu Asp Ala Gln Glu Arg

1010 1015 1020

Asn Cys Thr Asp Ile Asp Glu Cys Arg Ile Ser Pro Asp Leu Cys Gly

1025 1030 1035 1040

Gln Gly Thr Cys Val Asn Thr Pro Gly Ser Phe Glu Cys Glu Cys Phe

1045 1050 1055

Pro Gly Tyr Glu Ser Gly Phe Met Leu Met Lys Asn Cys Met Asp Val

1060 1065 1070

Asp Glu Cys Ala Arg Asp Pro Leu Leu Cys Arg Gly Gly Thr Cys Thr

1075 1080 1085

Asn Thr Asp Gly Ser Tyr Lys Cys Gln Cys Pro Pro Gly His Glu Leu

1090 1095 1100

Thr Ala Lys Gly Thr Ala Cys Glu Asp Ile Asp Glu Cys Ser Leu Ser

1105 1110 1115 1120

Asp Gly Leu Cys Pro His Gly Gln Cys Val Asn Val Ile Gly Ala Phe

1125 1130 1135

Gln Cys Ser Cys His Ala Gly Phe Gln Ser Thr Pro Asp Arg Gln Gly

1140 1145 1150

Cys Val Asp Ile Asn Glu Cys Arg Val Gln Asn Gly Gly Cys Asp Val

1155 1160 1165

His Cys Ile Asn Thr Glu Gly Ser Tyr Arg Cys Ser Cys Gly Gln Gly

1170 1175 1180

Tyr Ser Leu Met Pro Asp Gly Arg Ala Cys Ala Asp Val Asp Glu Cys

1185 1190 1195 1200

Glu Glu Asn Pro Arg Val Cys Asp Gln Gly His Cys Thr Asn Met Pro

1205 1210 1215

Gly Gly His Arg Cys Leu Cys Tyr Asp Gly Phe Met Ala Thr Pro Asp

1220 1225 1230

Met Arg Thr Cys Val Asp Val Asp Glu Cys Asp Leu Asn Pro His Ile

1235 1240 1245

Cys Leu His Gly Asp Cys Glu Asn Thr Lys Gly Ser Phe Val Cys His

1250 1255 1260

Cys Gln Leu Gly Tyr Met Val Arg Lys Gly Ala Thr Gly Cys Ser Asp

1265 1270 1275 1280

Val Asp Glu Cys Glu Val Gly Gly His Asn Cys Asp Ser His Ala Ser

1285 1290 1295

Cys Leu Asn Ile Pro Gly Ser Phe Ser Cys Arg Cys Leu Pro Gly Trp

1300 1305 1310

Val Gly Asp Gly Phe Glu Cys His Asp Leu Asp Glu Cys Val Ser Gln

1315 1320 1325

Glu His Arg Cys Ser Pro Arg Gly Asp Cys Leu Asn Val Pro Gly Ser

1330 1335 1340

Tyr Arg Cys Thr Cys Arg Gln Gly Phe Ala Gly Asp Gly Phe Phe Cys

1345 1350 1355 1360

Glu Asp Arg Asp Glu Cys Ala Glu Asn Val Asp Leu Cys Asp Asn Gly

1365 1370 1375

Gln Cys Leu Asn Ala Pro Gly Gly Tyr Arg Cys Glu Cys Glu Met Gly

1380 1385 1390

Phe Asp Pro Thr Glu Asp His Arg Ala Cys Gln Asp Val Asp Glu Cys

1395 1400 1405

Ala Gln Gly Asn Leu Cys Ala Phe Gly Ser Cys Glu Asn Leu Pro Gly

1410 1415 1420

Met Phe Arg Cys Ile Cys Asn Gly Gly Tyr Glu Leu Asp Arg Gly Gly

1425 1430 1435 1440

Gly Asn Cys Thr Asp Ile Asn Glu Cys Ala Asp Pro Val Asn Cys Ile

1445 1450 1455

Asn Gly Val Cys Ile Asn Thr Pro Gly Ser Tyr Leu Cys Ser Cys Pro

1460 1465 1470

Gln Asp Phe Glu Leu Asn Pro Ser Gly Val Gly Cys Val Asp Thr Arg

1475 1480 1485

Ala Gly Asn Cys Phe Leu Glu Thr His Asp Arg Gly Asp Ser Gly Ile

1490 1495 1500

Ser Cys Ser Ala Glu Ile Gly Val Gly Val Thr Arg Ala Ser Cys Cys

1505 1510 1515 1520

Cys Ser Leu Gly Arg Ala Trp Gly Asn Pro Cys Glu Leu Cys Pro Met

1525 1530 1535

Ala Asn Thr Thr Glu Tyr Arg Thr Leu Cys Pro Gly Gly Glu Gly Phe

1540 1545 1550

Gln Pro Asn Arg Ile Thr Val Ile Leu Glu Asp Ile Asp Glu Cys Gln

1555 1560 1565

Glu Leu Pro Gly Leu Cys Gln Gly Gly Asp Cys Val Asn Thr Phe Gly

1570 1575 1580

Ser Phe Gln Cys Glu Cys Pro Pro Gly Tyr His Leu Ser Glu His Thr

1585 1590 1595 1600

Arg Ile Cys Glu Asp Ile Asp Glu Cys Ser Thr His Ser Gly Ile Cys

1605 1610 1615

Gly Pro Gly Thr Cys Tyr Asn Thr Leu Gly Asn Tyr Thr Cys Val Cys

1620 1625 1630

Pro Ala Glu Tyr Leu Gln Val Asn Gly Gly Asn Asn Cys Met Asp Met

1635 1640 1645

Arg Lys Ser Val Cys Phe Arg His Tyr Asn Gly Thr Cys Gln Asn Glu

1650 1655 1660

Leu Ala Phe Asn Val Thr Arg Lys Met Cys Cys Cys Ser Tyr Asn Ile

1665 1670 1675 1680

Gly Gln Ala Trp Asn Arg Pro Cys Glu Ala Cys Pro Thr Pro Ile Ser

1685 1690 1695

Pro Asp Tyr Gln Ile Leu Cys Gly Asn Gln Ala Pro Gly Phe Leu Thr

1700 1705 1710

Asp Ile His Thr Gly Lys Pro Leu Asp Ile Asp Glu Cys Gly Glu Ile

1715 1720 1725

Pro Ala Ile Cys Ala Asn Gly Ile Cys Ile Asn Gln Ile Gly Ser Phe

1730 1735 1740

Arg Cys Glu Cys Pro Ala Gly Phe Asn Tyr Asn Ser Ile Leu Leu Ala

1745 1750 1755 1760

Cys Glu Asp Val Asp Glu Cys Gly Ser Arg Glu Ser Pro Cys Gln Gln

1765 1770 1775

Asn Ala Asp Cys Ile Asn Ile Pro Gly Ser Tyr Arg Cys Lys Cys Thr

1780 1785 1790

Arg Gly Tyr Lys Leu Ser Pro Gly Gly Ala Cys Val Gly Arg Asn Glu

1795 1800 1805

Cys Arg Glu Ile Pro Asn Val Cys Ser His Gly Asp Cys Met Asp Thr

1810 1815 1820

Glu Gly Ser Tyr Met Cys Leu Cys His Arg Gly Phe Gln Ala Ser Ala

1825 1830 1835 1840

Asp Gln Thr Leu Cys Met Asp Ile Asp Glu Cys Asp Arg Gln Pro Cys

1845 1850 1855

Gly Asn Gly Thr Cys Lys Asn Ile Ile Gly Ser Tyr Asn Cys Leu Cys

1860 1865 1870

Phe Pro Gly Phe Val Val Thr His Asn Gly Asp Cys Val Asp Phe Asp

1875 1880 1885

Glu Cys Thr Thr Leu Val Gly Gln Val Cys Arg Phe Gly His Cys Leu

1890 1895 1900

Asn Thr Ala Gly Ser Phe His Cys Leu Cys Gln Asp Gly Phe Glu Leu

1905 1910 1915 1920

Thr Ala Asp Gly Lys Asn Cys Val Asp Thr Asn Glu Cys Leu Ser Leu

1925 1930 1935

Ala Gly Thr Cys Leu Pro Gly Thr Cys Gln Asn Leu Glu Gly Ser Phe

1940 1945 1950

Arg Cys Ile Cys Pro Pro Gly Phe Gln Val Gln Ser Asp His Cys Ile

1955 1960 1965

Asp Ile Asp Glu Cys Ser Glu Glu Pro Asn Leu Cys Leu Phe Gly Thr

1970 1975 1980

Cys Thr Asn Ser Pro Gly Ser Phe Gln Cys Leu Cys Pro Pro Gly Phe

1985 1990 1995 2000

Val Leu Ser Asp Asn Gly His Arg Cys Phe Asp Thr Arg Gln Ser Phe

2005 2010 2015

Cys Phe Thr Arg Phe Glu Ala Gly Lys Cys Ser Val Pro Lys Ala Phe

2020 2025 2030

Asn Thr Thr Lys Thr Arg Cys Cys Cys Ser Lys Arg Pro Gly Glu Gly

2035 2040 2045

Trp Gly Asp Pro Cys Glu Leu Cys Pro Gln Glu Gly Ser Ala Ala Phe

2050 2055 2060

Gln Glu Leu Cys Pro Phe Gly His Gly Ala Val Pro Gly Pro Asp Asp

2065 2070 2075 2080

Ser Arg Glu Asp Val Asn Glu Cys Ala Glu Asn Pro Gly Val Cys Thr

2085 2090 2095

Asn Gly Val Cys Val Asn Thr Asp Gly Ser Phe Arg Cys Glu Cys Pro

2100 2105 2110

Phe Gly Tyr Ser Leu Asp Phe Thr Gly Ile Asn Cys Val Asp Thr Asp

2115 2120 2125

Glu Cys Ser Val Gly His Pro Cys Gly Gln Gly Thr Cys Thr Asn Val

2130 2135 2140

Ile Gly Gly Phe Glu Cys Ala Cys Ala Asp Gly Phe Glu Pro Gly Leu

2145 2150 2155 2160

Met Met Thr Cys Glu Asp Ile Asp Glu Cys Ser Leu Asn Pro Leu Leu

2165 2170 2175

Cys Ala Phe Arg Cys His Asn Thr Glu Gly Ser Tyr Leu Cys Thr Cys

2180 2185 2190

Pro Ala Gly Tyr Thr Leu Arg Glu Asp Gly Ala Met Cys Arg Asp Val

2195 2200 2205

Asp Glu Cys Ala Asp Gly Gln Gln Asp Cys His Ala Arg Gly Met Glu

2210 2215 2220

Cys Lys Asn Leu Ile Gly Thr Phe Ala Cys Val Cys Pro Pro Gly Met

2225 2230 2235 2240

Arg Pro Leu Pro Gly Ser Gly Glu Gly Cys Thr Asp Asp Asn Glu Cys

2245 2250 2255

His Ala Gln Pro Asp Leu Cys Val Asn Gly Arg Cys Val Asn Thr Ala

2260 2265 2270

Gly Ser Phe Arg Cys Asp Cys Asp Glu Gly Phe Gln Pro Ser Pro Thr

2275 2280 2285

Leu Thr Glu Cys His Asp Ile Arg Gln Gly Pro Cys Phe Ala Glu Val

2290 2295 2300

Leu Gln Thr Met Cys Arg Ser Leu Ser Ser Ser Ser Glu Ala Val Thr

2305 2310 2315 2320

Arg Ala Glu Cys Cys Cys Gly Gly Gly Arg Gly Trp Gly Pro Arg Cys

2325 2330 2335

Glu Leu Cys Pro Leu Pro Gly Thr Ser Ala Tyr Arg Lys Leu Cys Pro

2340 2345 2350

His Gly Ser Gly Tyr Thr Ala Glu Gly Arg Asp Val Asp Glu Cys Arg

2355 2360 2365

Met Leu Ala His Leu Cys Ala His Gly Glu Cys Ile Asn Ser Leu Gly

2370 2375 2380

Ser Phe Arg Cys His Cys Gln Ala Gly Tyr Thr Pro Asp Ala Thr Ala

2385 2390 2395 2400

Thr Thr Cys Leu Asp Met Asp Glu Cys Ser Gln Val Pro Lys Pro Cys

2405 2410 2415

Thr Phe Leu Cys Lys Asn Thr Lys Gly Ser Phe Leu Cys Ser Cys Pro

2420 2425 2430

Arg Gly Tyr Leu Leu Glu Glu Asp Gly Arg Thr Cys Lys Asp Leu Asp

2435 2440 2445

Glu Cys Thr Ser Arg Gln His Asn Cys Gln Phe Leu Cys Val Asn Thr

2450 2455 2460

Val Gly Ala Phe Thr Cys Arg Cys Pro Pro Gly Phe Thr Gln His His

2465 2470 2475 2480

Gln Ala Cys Phe Asp Asn Asp Glu Cys Ser Ala Gln Pro Gly Pro Cys

2485 2490 2495

Gly Ala His Gly His Cys His Asn Thr Pro Gly Ser Phe Arg Cys Glu

2500 2505 2510

Cys His Gln Gly Phe Thr Leu Val Ser Ser Gly His Gly Cys Glu Asp

2515 2520 2525

Val Asn Glu Cys Asp Gly Pro His Arg Cys Gln His Gly Cys Gln Asn

2530 2535 2540

Gln Leu Gly Gly Tyr Arg Cys Ser Cys Pro Gln Gly Phe Thr Gln His

2545 2550 2555 2560

Ser Gln Trp Ala Gln Cys Val Asp Glu Asn Glu Cys Ala Leu Ser Pro

2565 2570 2575

Pro Thr Cys Gly Ser Ala Ser Cys Arg Asn Thr Leu Gly Gly Phe Arg

2580 2585 2590

Cys Val Cys Pro Ser Gly Phe Asp Phe Asp Gln Ala Leu Gly Gly Cys

2595 2600 2605

Gln Glu Val Asp Glu Cys Ala Gly Arg Arg Gly Pro Cys Ser Tyr Ser

2610 2615 2620

Cys Ala Asn Thr Pro Gly Gly Phe Leu Cys Gly Cys Pro Gln Gly Tyr

2625 2630 2635 2640

Phe Arg Ala Gly Gln Gly His Cys Val Ser Gly Leu Gly Phe Ser Pro

2645 2650 2655

Gly Pro Gln Asp Thr Pro Asp Lys Glu Glu Leu Leu Ser Ser Glu Ala

2660 2665 2670

Cys Tyr Glu Cys Lys Ile Asn Gly Leu Ser Pro Arg Asp Arg Pro Arg

2675 2680 2685

Arg Ser Ala His Arg Asp His Gln Val Asn Leu Ala Thr Leu Asp Ser

2690 2695 2700

Glu Ala Leu Leu Thr Leu Gly Leu Asn Leu Ser His Leu Gly Arg Ala

2705 2710 2715 2720

Glu Arg Ile Leu Glu Leu Arg Pro Ala Leu Glu Gly Leu Glu Gly Arg

2725 2730 2735

Ile Arg Tyr Val Ile Val Arg Gly Asn Glu Gln Gly Phe Phe Arg Met

2740 2745 2750

His His Leu Arg Gly Val Ser Ser Leu Gln Leu Gly Arg Arg Arg Pro

2755 2760 2765

Gly Pro Gly Thr Tyr Arg Leu Glu Val Val Ser His Met Ala Gly Pro

2770 2775 2780

Trp Gly Val Gln Pro Glu Gly Gln Pro Gly Pro Trp Gly Gln Ala Leu

2785 2790 2795 2800

Arg Leu Lys Val Gln Leu Gln Leu Leu

2805

Claims

1.一种重组疱疹病毒基因组，所述重组疱疹病毒基因组包含编码包含第一美容蛋白的第一多肽的第一多核苷酸。

2.如权利要求1所述的重组疱疹病毒基因组，其中所述重组疱疹病毒基因组包含所述第一多核苷酸的两个或更多个拷贝。

3.如权利要求1或权利要求2所述的重组疱疹病毒基因组，其中所述重组疱疹病毒基因组是有复制能力的。

4.如权利要求1或权利要求2所述的重组疱疹病毒基因组，其中所述重组疱疹病毒基因组是复制缺陷性的。

5.如权利要求1-4中任一项所述的重组疱疹病毒基因组，其中所述重组疱疹病毒基因组选自由以下组成的组：重组单纯疱疹病毒基因组、重组水痘带状疱疹病毒基因组、重组人巨细胞病毒基因组、重组疱疹病毒6A基因组、重组疱疹病毒6B基因组、重组疱疹病毒7基因组、重组卡波西氏肉瘤相关疱疹病毒基因组以及它们的任何衍生物。

6.如权利要求1-5中任一项所述的重组疱疹病毒基因组，其中所述重组疱疹病毒基因组是重组单纯疱疹病毒基因组。

7.如权利要求6所述的重组疱疹病毒基因组，其中所述重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组、重组2型单纯疱疹病毒(HSV-2)基因组或它们的任何衍生物。

8.如权利要求6或权利要求7所述的重组疱疹病毒基因组，其中所述重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组。

9.如权利要求6-8中任一项所述的重组疱疹病毒基因组，其中所述重组单纯疱疹病毒基因组包含失活性突变。

10.如权利要求9所述的重组疱疹病毒基因组，其中所述失活性突变在单纯疱疹病毒基因中。

11.如权利要求10所述的重组疱疹病毒基因组，其中所述失活性突变是所述单纯疱疹病毒基因的编码序列的缺失。

12.如权利要求10或权利要求11所述的重组疱疹病毒基因组，其中所述单纯疱疹病毒基因选自由感染细胞蛋白(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和UL55组成的组。

13.如权利要求12所述的重组疱疹病毒基因组，其中所述重组单纯疱疹病毒基因组在所述ICP4基因的一个或两个拷贝中包含失活性突变。

14.如权利要求12或权利要求13所述的重组疱疹病毒基因组，其中所述重组单纯疱疹病毒基因组在所述ICP22基因中包含失活性突变。

15.如权利要求12-14中任一项所述的重组疱疹病毒基因组，其中所述重组单纯疱疹病毒基因组在所述UL41基因中包含失活性突变。

16.如权利要求12-15中任一项所述的重组疱疹病毒基因组，其中所述重组单纯疱疹病毒基因组在所述ICP0基因的一个或两个拷贝中包含失活性突变。

17.如权利要求12-16中任一项所述的重组疱疹病毒基因组，其中所述重组单纯疱疹病毒基因组在所述ICP27基因中包含失活性突变。

18.如权利要求6-17中任一项所述的重组疱疹病毒基因组，其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或两个内包含所述第一多核苷酸。

19.如权利要求1-18中任一项所述的重组疱疹病毒基因组，其中所述第一美容蛋白选自由以下组成的组：第一胶原蛋白、第一纤连蛋白、第一弹性蛋白、第一光蛋白聚糖蛋白、第一玻连蛋白、第一玻连蛋白受体蛋白、第一层粘连蛋白、第一神经调质蛋白和第一原纤蛋白。

20.如权利要求1-19中任一项所述的重组疱疹病毒基因组，其中所述第一美容蛋白包含与选自由SEQ ID NO:15-21和53-64组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

21.如权利要求1-20中任一项所述的重组疱疹病毒基因组，其中所述第一美容蛋白是结构性细胞外基质蛋白。

22.如权利要求19-21中任一项所述的重组疱疹病毒基因组，其中所述第一胶原蛋白是人胶原蛋白。

23.如权利要求19-22中任一项所述的重组疱疹病毒基因组，其中所述第一胶原蛋白选自由以下组成的组：胶原α-1(I)链多肽(COL1-1)、胶原α-2(I)链多肽(COL1-2)、胶原α-1(II)链多肽(COL2)、胶原α-1(III)链多肽(COL3)、胶原α-1(IV)链多肽(COL4-1)、胶原α-2(IV)链多肽(COL4-2)、胶原α-3(IV)链多肽(COL4-3)、胶原α-4(IV)链多肽(COL4-4)、胶原α-5(IV)链多肽(COL4-5)、胶原α-6(IV)链多肽(COL4-6)、胶原α-1(V)链多肽(COL5-1)、胶原α-2(V)链多肽(COL5-2)、胶原α-3(V)链多肽(COL5-3)、胶原α-1(VI)链多肽(COL6-1)、胶原α-2(VI)链多肽(COL6-2)、胶原α-3(VI)链多肽(COL6-3)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)、胶原α-6(VI)链多肽(COL6-6)、胶原α-1(VIII)链多肽(COL8)、胶原α-1(IX)链多肽(COL9-1)、胶原α-2(IX)链多肽(COL9-2)、胶原α-3(IX)链多肽(COL9-3)、胶原α-1(X)链多肽(COL10)、胶原α-1(XI)链多肽(COL11-1)、胶原α-2(XI)链多肽(COL11-2)、胶原α-1(XII)链多肽(COL12)、胶原α-1(XIII)链多肽(COL13)、胶原α-1(XIV)链多肽(COL14)、胶原α-1(XV)链多肽(COL15)、胶原α-1(XVI)链多肽(COL16)、胶原α-1(XVII)链多肽(COL17)、胶原α-1(XVIII)链多肽(COL18)、胶原α-1(XIX)链多肽(COL19)、胶原α-1(XX)链多肽(COL20)、胶原α-1(XXI)链多肽(COL21)、胶原α-1(XXII)链多肽(COL22)、胶原α-1(XXIII)链多肽(COL23)、胶原α-1(XXIV)链多肽(COL24)、胶原α-1(XXV)链多肽(COL25)、胶原α-1(XXVI)链多肽(COL26)、胶原α-1(XXVII)链多肽(COL27)和胶原α-1(XXVIII)链多肽(COL28)。

24.如权利要求19-23中任一项所述的重组疱疹病毒基因组，其中所述第一胶原蛋白选自由以下组成的组：COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1和COL17。

25.如权利要求19-24中任一项所述的重组疱疹病毒基因组，其中所述第一人胶原蛋白包含与SEQ ID NO:17的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

26.如权利要求1-25中任一项所述的重组疱疹病毒基因组，其中所述第一美容蛋白不是胶原α-1(VII)链多肽(COL7)。

27.如权利要求1-26中任一项所述的重组疱疹病毒基因组，其中所述第一多肽基本上由所述第一美容蛋白组成或由所述第一美容蛋白组成。

28.如权利要求1-26中任一项所述的重组疱疹病毒基因组，其中所述第一多肽包含：(a)所述第一美容蛋白；(b)另一美容蛋白；和(c)使(a)连接于(b)的接头多肽。

29.如权利要求28所述的重组疱疹病毒基因组，其中所述接头多肽是可裂解接头多肽。

30.如权利要求28或权利要求29所述的重组疱疹病毒基因组，其中所述接头多肽包含与选自由SEQ ID NO:28-31组成的组的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的序列。

31.如权利要求28-30中任一项所述的重组疱疹病毒基因组，其中所述第一美容蛋白和所述另一美容蛋白是不同的。

32.如权利要求1-31中任一项所述的重组疱疹病毒基因组，其中所述第一多核苷酸编码多顺反子mRNA，所述多顺反子mRNA包含：(a)编码所述第一多肽的第一开放阅读框(ORF)；(b)编码额外美容蛋白的第二ORF；和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。

33.如权利要求32所述的重组疱疹病毒基因组，其中编码所述IRES的核酸序列与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性。

34.如权利要求32或权利要求33所述的重组疱疹病毒基因组，其中所述第一美容蛋白和所述额外美容蛋白是不同的。

35.如权利要求1-34中任一项所述的重组疱疹病毒基因组，其中所述重组疱疹病毒基因组还包含编码第二美容蛋白的第二多核苷酸。

36.如权利要求35所述的重组疱疹病毒基因组，其中所述第一美容蛋白和所述第二美容蛋白是不同的。

37.如权利要求1-36中任一项所述的重组疱疹病毒基因组，其中相较于相应野生型疱疹病毒基因组，所述重组疱疹病毒基因组当引入靶标细胞中时具有降低的细胞毒性。

38.如权利要求37所述的重组疱疹病毒基因组，其中所述靶标细胞是表皮和/或真皮的细胞。

39.如权利要求37或权利要求38所述的重组疱疹病毒基因组，其中所述靶标细胞是人细胞。

40.如权利要求37-39中任一项所述的重组疱疹病毒基因组，其中所述靶标细胞是纤维母细胞。

41.一种疱疹病毒，所述疱疹病毒包含如权利要求1-40中任一项所述的重组疱疹病毒基因组。

42.如权利要求41所述的疱疹病毒，其中所述疱疹病毒是有复制能力的。

43.如权利要求41所述的疱疹病毒，其中所述疱疹病毒是复制缺陷性的。

44.如权利要求41-43中任一项所述的疱疹病毒，其中相较于相应野生型疱疹病毒，所述疱疹病毒具有降低的细胞毒性。

45.如权利要求41-44中任一项所述的疱疹病毒，其中所述疱疹病毒选自由以下组成的组：单纯疱疹病毒、水痘带状疱疹病毒、人巨细胞病毒、疱疹病毒6A、疱疹病毒6B、疱疹病毒7和卡波西氏肉瘤相关疱疹病毒。

46.如权利要求41-45中任一项所述的疱疹病毒，其中所述疱疹病毒是单纯疱疹病毒。

47.如权利要求46所述的疱疹病毒，其中所述单纯疱疹病毒是1型单纯疱疹病毒(HSV-1)、2型单纯疱疹病毒(HSV-2)或它们的任何衍生物。

48.一种组合物，所述组合物包含：(a)如权利要求1-40中任一项所述的重组疱疹病毒基因组或如权利要求41-47中任一项所述的疱疹病毒；和(b)赋形剂。

49.如权利要求48所述的组合物，其中所述组合物是无菌的。

50.如权利要求48或权利要求49所述的组合物，其中所述组合物适于局部、经皮、皮下、真皮内、口服、鼻内、气管内、舌下、经颊、经直肠、经阴道、经尿道、吸入、静脉内、动脉内、肌肉内、心内、骨内、腹膜内、经粘膜、玻璃体内、视网膜下、关节内、关节周、局部或皮上施用。

51.如权利要求48-50中任一项所述的组合物，其中所述组合物适于真皮内施用。

52.如权利要求48-51中任一项所述的组合物，其中所述组合物适于浅表注射。

53.如权利要求48-52中任一项所述的组合物，其中所述组合物是美容组合物。

54.如权利要求48-53中任一项所述的组合物，其中所述组合物是皮肤护理产品。

55.如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物，所述疱疹病毒或所述组合物用作药剂。

56.如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物，所述疱疹病毒或所述组合物用于疗法中。

57.如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物制造用于治疗皮肤学老化的一种或多种征象或症状的药剂的用途。

58.一种增强、增加、加强和/或补充受试者中一种或多种真皮细胞外基质蛋白的水平的方法，所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。

59.一种增强、增加、加强和/或补充受试者中一种或多种胶原蛋白的水平的方法，所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。

60.一种增强、增加、加强和/或补充受试者的软组织的方法，所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。

61.如权利要求60所述的方法，其中将所述组合物注射至所述受试者的所述软组织中。

62.一种使有需要的受试者的皮肤状况、品质和/或外观改进的方法，所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。

63.如权利要求62所述的方法，其中向一个或多个日光损害或其他UV暴露部位、粗糙纹理部位、皮肤下陷部位、皱纹部位或它们的任何组合施用所述组合物。

64.一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法，所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。

65.如权利要求64所述的方法，其中皮肤中所述一种或多种浅表凹陷选自由以下组成的组：鼻唇皱褶、鱼尾纹、皱眉纹、烦恼纹、疤痕、眉间纹、眉下垂、泪槽、鼻颊纹、兔宝宝纹、面颊/面中部下垂、木偶纹、罂粟陷窝、微笑纹、笑纹、下巴皱痕、颈纹、颈阔肌带以及它们的任何组合。

66.一种使有需要的受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者增加和/或改进的方法，所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。

67.如权利要求62-66中任一项所述的方法，其中所述受试者的皮肤是老化中的皮肤。

68.如权利要求62-67中任一项所述的方法，其中所述受试者的皮肤已由于暴露于紫外光而受损害。

69.如权利要求62-68中任一项所述的方法，其中所述受试者的皮肤是有皱纹的。

70.一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法，所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。

71.如权利要求70所述的方法，其中一种或多种皮肤学老化征象的所述减弱由以下方面指示：(a)细纹和/或皱纹得到治疗、减轻和/或预防；(b)皮肤孔尺寸得到降低；(c)皮肤厚度、饱满度和/或紧固度得到改进；(d)皮肤光滑度、柔韧性和/或柔软度得到改进；(e)皮肤色泽、光亮度和/或透明度得到改进；(f)原胶原和/或胶原产生得到改进；(g)皮肤纹理得到改进和/或再纹理化得到促进；(h)皮肤轮廓的外观得到改进；(i)皮肤光泽和/或亮度得到恢复；(j)由于老化和/或绝经而减退的皮肤外观得到改进；(k)皮肤保湿得到改进；(l)皮肤弹性和/或回弹力得到增加；(m)皮肤下陷得到治疗、减轻和/或预防；(n)皮肤紧致度得到改进；(o)色素斑点、斑点化皮肤和/或疤痕得到减轻；(p)就光衍射或反射来说的皮肤光学性质得到改进；或(q)它们的任何组合。

72.如权利要求58-71中任一项所述的方法，其中所述受试者是人。

73.如权利要求58-72中任一项所述的方法，其中所述疱疹病毒或所述组合物局部、经皮、皮下、皮上、真皮内、口服、舌下、经颊、经直肠、经阴道、尿道内、静脉内、动脉内、肌肉内、骨内、心内、腹膜内、经粘膜、玻璃体内、视网膜下、关节内、关节周、局部、或通过吸入来向所述受试者施用。

74.如权利要求58-73中任一项所述的方法，其中所述疱疹病毒或所述组合物向所述受试者真皮内施用。

75.如权利要求58-74中任一项所述的方法，其中所述疱疹病毒或所述组合物通过浅表注射来施用。