CN112041434A - 用于美容性应用的编码一种或多种美容蛋白的重组核酸 - Google Patents

用于美容性应用的编码一种或多种美容蛋白的重组核酸 Download PDF

Info

Publication number
CN112041434A
CN112041434A CN201980028654.6A CN201980028654A CN112041434A CN 112041434 A CN112041434 A CN 112041434A CN 201980028654 A CN201980028654 A CN 201980028654A CN 112041434 A CN112041434 A CN 112041434A
Authority
CN
China
Prior art keywords
recombinant
human
collagen
genome
chain polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980028654.6A
Other languages
English (en)
Inventor
S·克里希南
T·派里
P·阿加瓦尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Krystal Biotech Inc
Original Assignee
Krystal Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Krystal Biotech Inc filed Critical Krystal Biotech Inc
Publication of CN112041434A publication Critical patent/CN112041434A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K8/00Cosmetics or similar toiletry preparations
    • A61K8/18Cosmetics or similar toiletry preparations characterised by the composition
    • A61K8/30Cosmetics or similar toiletry preparations characterised by the composition containing organic compounds
    • A61K8/64Proteins; Peptides; Derivatives or degradation products thereof
    • A61K8/65Collagen; Gelatin; Keratin; Derivatives or degradation products thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • A61K35/763Herpes virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K8/00Cosmetics or similar toiletry preparations
    • A61K8/18Cosmetics or similar toiletry preparations characterised by the composition
    • A61K8/30Cosmetics or similar toiletry preparations characterised by the composition containing organic compounds
    • A61K8/64Proteins; Peptides; Derivatives or degradation products thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K8/00Cosmetics or similar toiletry preparations
    • A61K8/18Cosmetics or similar toiletry preparations characterised by the composition
    • A61K8/96Cosmetics or similar toiletry preparations characterised by the composition containing materials, or derivatives thereof of undetermined constitution
    • A61K8/99Cosmetics or similar toiletry preparations characterised by the composition containing materials, or derivatives thereof of undetermined constitution from microorganisms other than algae or fungi, e.g. protozoa or bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/04Antipruritics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61QSPECIFIC USE OF COSMETICS OR SIMILAR TOILETRY PREPARATIONS
    • A61Q19/00Preparations for care of the skin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61QSPECIFIC USE OF COSMETICS OR SIMILAR TOILETRY PREPARATIONS
    • A61Q19/00Preparations for care of the skin
    • A61Q19/08Anti-ageing preparations
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2800/00Properties of cosmetic compositions or active ingredients thereof or formulation aids used therein and process related aspects
    • A61K2800/80Process related aspects concerning the preparation of the cosmetic composition or the storage or application thereof
    • A61K2800/86Products or compounds obtained by genetic engineering
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2800/00Properties of cosmetic compositions or active ingredients thereof or formulation aids used therein and process related aspects
    • A61K2800/80Process related aspects concerning the preparation of the cosmetic composition or the storage or application thereof
    • A61K2800/91Injection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16041Use of virus, viral particle or viral elements as a vector
    • C12N2710/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16611Simplexvirus, e.g. human herpesvirus 1, 2
    • C12N2710/16621Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16611Simplexvirus, e.g. human herpesvirus 1, 2
    • C12N2710/16631Uses of virus other than therapeutic or vaccine, e.g. disinfectant

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • Dermatology (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Birds (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Virology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Gerontology & Geriatric Medicine (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Toxicology (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Mycology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Cosmetics (AREA)

Abstract

本公开提供了包含一种或多种编码一种或多种美容蛋白(例如一种或多种人胶原蛋白)的多核苷酸的重组核酸;包含所述重组核酸的病毒;包含所述重组核酸和/或所述病毒的组合物(例如美容制剂);它们的使用方法;以及它们的制品或药盒。

Description

用于美容性应用的编码一种或多种美容蛋白的重组核酸
相关申请的交叉引用
本申请要求2018年4月27日提交的美国临时申请序列号62/663,476的优先权权益,所述美国临时申请以引用的方式整体并入本文。
采用ASCII文本文件的序列表提交
采用ASCII文本文件的以下提交的内容以引用的方式整体并入本文:序列表的计算机可读形式(CRF)(文件名称:761342000640SEQLIST.txt,记录日期:2019年4月26日,大小:437KB)。
技术领域
本公开部分地涉及包含一种或多种编码一种或多种美容蛋白(例如一种或多种人胶原(collagen)蛋白)的多核苷酸的重组核酸;包含所述重组核酸的病毒;包含所述重组核酸和/或所述病毒的组合物(例如美容制剂);它们的使用方法;以及它们的制品或药盒。
背景技术
如同人体中的所有器官一样,皮肤随着时间的推移而经受连续以及经常是累积性的改变。皮肤的老化由于众多因素而发生,包括皮肤内的固有变化,重力的影响和作用于皮肤的面部肌肉,软组织丧失或移位、以及组织弹性的丧失。引起关注的是,皮肤的“老化”表型可由环境因素加速,最特别是长期暴露于紫外线照射(例如来自太阳)。在临床上,皮肤的老化表型可描述为起皱,下陷,和/或相比于它的年轻对应物,通常具有较小弹性和回弹力,但这个表型内的变化存在于天然时序性老化与光老化之间。
真皮细胞外基质(ECM)构成皮肤的主体,并且赋予强度与回弹力两者。胶原,作为对皮肤提供支撑的结缔组织的主要组分,随着个人年龄而降低。在老化皮肤中,胶原原纤维显示高水平的降解和断裂,并且通过真皮纤维母细胞在减弱速率下补充。这些降解和断裂的胶原束变得松散并丧失强度(从而破坏真皮ECM的结构组织),并且无法解脱地导致皮肤的“老化”表现。
已开发用于使人皮肤的外观改进的众多皮肤护理产品。皱纹和皮肤皱褶通常用真皮和真皮下注射美容性面部填充剂治疗;然而,这种浅表方法不解决潜伏在皮肤老化下的结构变化,特别是胶原的损害或丧失。因此,存在对用以在想要抗击或逆转皮肤老化的生理影响的个体中补充、强化或替换真皮ECM组分(例如人胶原)的替代性策略的明确需要。
本文引用的所有参考资料,包括专利申请、专利公布、非专利文献和NCBI/UniProtKB/Swiss-Prot登录号,都以引用的方式整体并入本文,所述引用的程度就好像已特定地和单独地指出将每个单独的参考资料以引用的方式并入一样。
发明内容
为满足这些和其他需要,本文提供了编码一种或多种美容蛋白的重组核酸(例如重组疱疹病毒基因组),所述重组核酸供在用于美容性/美容应用(例如治疗皱纹)的病毒(例如疱疹病毒)、组合物、制剂、药剂和/或方法中使用。本发明者已显示本文所述的重组减毒病毒能够1)有效转导人表皮/真皮细胞,以及2)成功表达所编码外源性人胶原(mRNA和蛋白),其中所述蛋白可接着定位至皮肤等同性器官型培养物中的适当区域(参见例如实施例2)。此外,本发明者已显示本文所述的病毒可在无重大宿主细胞细胞毒性下以局部或真皮内方式成功施用,从而允许在体内施用之后从这些病毒表达的人胶原定位至真皮ECM的适当区域,而无对皮肤的可观察损害(参见例如实施例3和7)。此外,本发明者已显示多种不同HSV骨架可用于构建表达人胶原的病毒(参见例如实施例2),多种策略可用于从单一重组基因组成功表达超过一种人胶原蛋白(参见例如实施例5),并且候选病毒可在时序性或UV诱导的皮肤老化的多个相关体外和体内模型中成功表达人胶原蛋白(参见例如实施例6和7)。此外,本发明者已显示本文所述的病毒可被成功工程化来在体外以及在体内表达其他美容蛋白(例如人层粘连蛋白(laminin)),其中这些蛋白定位至真皮ECM的适当区域(参见例如实施例8)。在不希望受理论束缚下,本文所述的数据提供强力证据表明本公开的重组核酸和/或病毒可构成一种用于递送美容蛋白(例如人胶原蛋白,诸如人胶原1和人胶原3),并且特别是用以在美容性应用中补充或替换天然人真皮ECM蛋白(例如以减少年龄或光诱导的皱纹的出现)的新型手段。
因此,本公开的某些方面涉及一种包含编码第一多肽的第一多核苷酸的重组疱疹病毒基因组,所述第一多肽包含第一美容蛋白。在一些实施方案中,重组疱疹病毒基因组包含第一多核苷酸的两个或更多个拷贝。在一些实施方案中,重组疱疹病毒基因组是有复制能力的。在一些实施方案中,重组疱疹病毒基因组是复制缺陷性的。在可与任何先前实施方案组合的一些实施方案中,重组疱疹病毒基因组选自重组单纯疱疹病毒(herpes simplexvirus)基因组、重组水痘带状疱疹(varicella zoster)病毒基因组、重组人巨细胞病毒基因组、重组疱疹病毒6A基因组、重组疱疹病毒6B基因组、重组疱疹病毒7基因组、重组卡波西氏肉瘤(Kaposi’s sarcoma)相关疱疹病毒基因组以及它们的任何衍生物。在可与任何先前实施方案组合的一些实施方案中,重组疱疹病毒基因组是重组单纯疱疹病毒基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组、重组2型单纯疱疹病毒(HSV-2)基因组或它们的任何衍生物。
在一些实施方案中,重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组包含失活性突变。在可与任何先前实施方案组合的一些实施方案中,失活性突变在单纯疱疹病毒基因中。在一些实施方案中,失活性突变是单纯疱疹病毒基因的编码序列的缺失。在一些实施方案中,单纯疱疹病毒基因选自感染细胞蛋白(Infected Cell Protein,ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(thymidine kinase,tk)、长独特区域(UL)41和UL55。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP4基因的一个或两个拷贝中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在UL41基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因的一个或两个拷贝中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP27基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在UL55基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在接合区域中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组包含接合区域的缺失。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或两个内包含第一多核苷酸。
在可与任何先前实施方案组合的一些实施方案中,第一美容蛋白选自第一胶原蛋白、第一纤连蛋白(fibronectin)、第一弹性蛋白(elastin)、第一光蛋白聚糖(lumican)蛋白、第一玻连蛋白(vitronectin)、第一玻连蛋白受体蛋白、第一层粘连蛋白、第一神经调质(neuromodulator)蛋白和第一原纤蛋白(fibrillin)。在可与任何先前实施方案组合的一些实施方案中,第一美容蛋白包含与选自SEQ ID NO:15-21以及53-64的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,第一美容蛋白是结构性细胞外基质蛋白(例如胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中,第一美容蛋白是胶原蛋白、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原蛋白、人弹性蛋白、人纤连蛋白或人层粘连蛋白)。在可与任何先前实施方案组合的一些实施方案中,第一胶原蛋白是人胶原蛋白。在可与任何先前实施方案组合的一些实施方案中,第一胶原蛋白选自胶原α-1(I)链多肽(COL1-1)、胶原α-2(I)链多肽(COL1-2)、胶原α-1(II)链多肽(COL2)、胶原α-1(III)链多肽(COL3)、胶原α-1(IV)链多肽(COL4-1)、胶原α-2(IV)链多肽(COL4-2)、胶原α-3(IV)链多肽(COL4-3)、胶原α-4(IV)链多肽(COL4-4)、胶原α-5(IV)链多肽(COL4-5)、胶原α-6(IV)链多肽(COL4-6)、胶原α-1(V)链多肽(COL5-1)、胶原α-2(V)链多肽(COL5-2)、胶原α-3(V)链多肽(COL5-3)、胶原α-1(VI)链多肽(COL6-1)、胶原α-2(VI)链多肽(COL6-2)、胶原α-3(VI)链多肽(COL6-3)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)、胶原α-6(VI)链多肽(COL6-6)、胶原α-1(VIII)链多肽(COL8)、胶原α-1(IX)链多肽(COL9-1)、胶原α-2(IX)链多肽(COL9-2)、胶原α-3(IX)链多肽(COL9-3)、胶原α-1(X)链多肽(COL10)、胶原α-1(XI)链多肽(COL11-1)、胶原α-2(XI)链多肽(COL11-2)、胶原α-1(XII)链多肽(COL12)、胶原α-1(XIII)链多肽(COL13)、胶原α-1(XIV)链多肽(COL14)、胶原α-1(XV)链多肽(COL15)、胶原α-1(XVI)链多肽(COL16)、胶原α-1(XVII)链多肽(COL17)、胶原α-1(XVIII)链多肽(COL18)、胶原α-1(XIX)链多肽(COL19)、胶原α-1(XX)链多肽(COL20)、胶原α-1(XXI)链多肽(COL21)、胶原α-1(XXII)链多肽(COL22)、胶原α-1(XXIII)链多肽(COL23)、胶原α-1(XXIV)链多肽(COL24)、胶原α-1(XXV)链多肽(COL25)、胶原α-1(XXVI)链多肽(COL26)、胶原α-1(XXVII)链多肽(COL27)和胶原α-1(XXVIII)链多肽(COL28)。在可与任何先前实施方案组合的一些实施方案中,第一胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1和COL17。在可与任何先前实施方案组合的一些实施方案中,第一胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在可与任何先前实施方案组合的一些实施方案中,第一胶原蛋白是COL3。在可与任何先前实施方案组合的一些实施方案中,第一胶原蛋白是人COL3。在可与任何先前实施方案组合的一些实施方案中,第一胶原蛋白包含与SEQID NO:17的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在可与任何先前实施方案组合的一些实施方案中,第一美容蛋白不是胶原α-1(VII)链多肽(COL7)。
在一些实施方案中,第一多肽基本上由第一美容蛋白组成。在一些实施方案中,第一多肽由第一美容蛋白组成。在一些实施方案中,第一多肽包含:(a)第一美容蛋白;(b)另一美容蛋白;和(c)使(a)连接于(b)的接头多肽。在一些实施方案中,另一美容蛋白选自胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖蛋白、玻连蛋白、玻连蛋白受体蛋白、层粘连蛋白、神经调质蛋白和原纤蛋白。在一些实施方案中,另一美容蛋白是结构性细胞外基质蛋白(例如胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中,另一美容蛋白是胶原蛋白、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原蛋白、人弹性蛋白、人纤连蛋白或人层粘连蛋白)。在一些实施方案中,另一胶原蛋白(例如另一人胶原蛋白)选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中,另一胶原蛋白(例如另一人胶原蛋白)选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7和COL17。在一些实施方案中,第一美容蛋白和另一美容蛋白是不同的。在一些实施方案中,第一美容蛋白是COL1-1(例如人COL1-1),并且另一美容蛋白是COL1-2(例如人COL1-2)。在一些实施方案中,接头多肽是可裂解接头多肽。在一些实施方案中,接头多肽包含与选自SEQ ID NO:28-31的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在可与任何先前实施方案组合的一些实施方案中,第一多核苷酸编码多顺反子mRNA,所述多顺反子mRNA包含:(a)编码第一多肽的第一开放阅读框(ORF);(b)编码额外美容蛋白的第二ORF;和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。在一些实施方案中,额外美容蛋白选自胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖蛋白、玻连蛋白、玻连蛋白受体蛋白、层粘连蛋白、神经调质蛋白和原纤蛋白。在一些实施方案中,额外美容蛋白是结构性细胞外基质蛋白(例如胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中,额外美容蛋白是胶原蛋白、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原蛋白、人弹性蛋白、人纤连蛋白或人层粘连蛋白)。在一些实施方案中,额外胶原蛋白(例如额外人胶原蛋白)选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中,额外胶原蛋白(例如额外人胶原蛋白)选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7和COL17。在一些实施方案中,第一美容蛋白和额外美容蛋白是不同的。在一些实施方案中,第一美容蛋白是COL1-1(例如人COL1-1),并且额外美容蛋白是COL1-2(例如人COL1-2)。在一些实施方案中,编码IRES的核酸序列与选自SEQ IDNO:22或SEQ ID NO:23的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
在可与任何先前实施方案组合的一些实施方案中,重组疱疹病毒基因组还包含编码第二美容蛋白的第二多核苷酸。在一些实施方案中,第二美容蛋白选自胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖蛋白、玻连蛋白、玻连蛋白受体蛋白、层粘连蛋白、神经调质蛋白和原纤蛋白。在一些实施方案中,第二美容蛋白是结构性细胞外基质蛋白(例如胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中,第二美容蛋白是胶原蛋白、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原蛋白、人弹性蛋白、人纤连蛋白或人层粘连蛋白)。在一些实施方案中,第二胶原蛋白(例如第二人胶原蛋白)选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中,第二胶原蛋白(例如第二人胶原蛋白)选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7和COL17。在一些实施方案中,第一美容蛋白和第二美容蛋白是不同的。在一些实施方案中,第一美容蛋白是COL1-1(例如人COL1-1),并且第二美容蛋白是COL1-2(例如人COL1-2)。在一些实施方案中,第一美容蛋白是COL1-1(例如人COL1-1),并且第二美容蛋白是COL3(例如人COL3)。
在可与任何先前实施方案组合的一些实施方案中,相较于相应野生型疱疹病毒基因组,重组疱疹病毒基因组当引入靶标细胞中时具有降低的细胞毒性。在一些实施方案中,靶标细胞是表皮和/或真皮的细胞。在一些实施方案中,靶标细胞是人细胞。在一些实施方案中,靶标细胞是纤维母细胞。
本公开的其他方面涉及一种包含本文所述的任何重组疱疹病毒基因组的疱疹病毒。在一些实施方案中,疱疹病毒是有复制能力的。在一些实施方案中,疱疹病毒是复制缺陷性的。在一些实施方案中,疱疹病毒是减毒的。在可与任何先前实施方案组合的一些实施方案中,相较于相应野生型疱疹病毒,疱疹病毒具有降低的细胞毒性。在可与任何先前实施方案组合的一些实施方案中,疱疹病毒选自单纯疱疹病毒、水痘带状疱疹病毒、人巨细胞病毒、疱疹病毒6A、疱疹病毒6B、疱疹病毒7和卡波西氏肉瘤相关疱疹病毒。在可与任何先前实施方案组合的一些实施方案中,疱疹病毒是单纯疱疹病毒。在一些实施方案中,单纯疱疹病毒是1型单纯疱疹病毒(HSV-1)、2型单纯疱疹病毒(HSV-2)或它们的任何衍生物。在一些实施方案中,单纯疱疹病毒是1型单纯疱疹病毒(HSV-1)。
本公开的其他方面涉及一种组合物,所述组合物包含:(a)本文所述的任何重组疱疹病毒基因组和/或本文所述的任何疱疹病毒;和(b)赋形剂。在一些实施方案中,组合物是无菌的。在可与任何先前实施方案组合的一些实施方案中,组合物适于局部、经皮、皮下、真皮内、口服、鼻内、气管内、舌下、经颊、经直肠、经阴道、吸入、静脉内、动脉内、肌肉内、心内、骨内、腹膜内、经粘膜、玻璃体内、视网膜下、关节内、关节周、局部或皮上施用。在可与任何先前实施方案组合的一些实施方案中,组合物适于真皮内施用。在可与任何先前实施方案组合的一些实施方案中,组合物适于浅表注射。在可与任何先前实施方案组合的一些实施方案中,组合物是美容组合物。在可与任何先前实施方案组合的一些实施方案中,组合物是皮肤护理产品。
本公开的其他方面涉及本文所述的任何重组疱疹病毒基因组和/或本文所述的任何疱疹病毒作为药剂(例如用于美容性适应症)的用途。
本公开的其他方面涉及本文所述的任何重组疱疹病毒基因组和/或本文所述的任何疱疹病毒作为疗法(例如作为美容性或美容疗法)的用途。
本公开的其他方面涉及本文所述的任何重组疱疹病毒基因组和/或本文所述的任何疱疹病毒制造可用于治疗皮肤学老化的一种或多种征象或症状的药剂的用途。
本公开的其他方面涉及一种增强、增加、加强和/或补充受试者中一种或多种真皮细胞外基质蛋白的水平的方法,所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。
本公开的其他方面涉及一种增强、增加、加强和/或补充受试者中一种或多种胶原蛋白的水平的方法,所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中,一种或多种胶原蛋白是胶原3。在一些实施方案中,内源性胶原3的水平由于时序性老化或光老化而降低。
本公开的其他方面涉及一种增强、增加、加强和/或补充受试者的软组织的方法,所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中,将组合物注射至受试者的软组织中。
本公开的其他方面涉及一种使有需要的受试者的皮肤状况、品质和/或外观改进的方法,所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中,向一个或多个日光损害或其他UV暴露部位、粗糙纹理部位、皮肤下陷部位、皱纹部位或它们的任何组合施用组合物。
本公开的其他方面涉及一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法,所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中,皮肤中一种或多种浅表凹陷选自由以下组成的组:鼻唇皱褶、鱼尾纹(crows’feet)、皱眉纹、烦恼纹(worry line)、疤痕、眉间纹、眉下垂、泪槽、鼻颊纹、兔宝宝纹(bunny line)、面颊/面中部下垂、木偶纹(marionette line)、罂粟陷窝(poppy dimpling)、微笑纹(smile line)、笑纹(laugh line)、下巴皱痕、颈纹、颈阔肌带以及它们的任何组合。
本公开的其他方面涉及一种使有需要的受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者增加和/或改进的方法,所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。
在可与任何先前实施方案组合的一些实施方案中,受试者的皮肤是老化中的皮肤。在可与任何先前实施方案组合的一些实施方案中,受试者的皮肤已由于暴露于紫外光而受损害。在可与任何先前实施方案组合的一些实施方案中,受试者的皮肤是有皱纹的。
本公开的其他方面涉及一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法,所述方法包括向所述受试者施用有效量的本文所述的任何疱疹病毒和/或本文所述的任何组合物。在一些实施方案中,一种或多种皮肤学老化征象的减弱由以下方面指示:(a)细纹和/或皱纹得到治疗、减轻和/或预防;(b)皮肤孔尺寸得到降低;(c)皮肤厚度、饱满度和/或紧固度得到改进;(d)皮肤光滑度、柔韧性和/或柔软度得到改进;(e)皮肤色泽、光亮度和/或透明度得到改进;(f)原胶原和/或胶原产生得到改进;(g)皮肤纹理得到改进和/或再纹理化得到促进;(h)皮肤轮廓的外观得到改进;(i)皮肤光泽和/或亮度得到恢复;(j)由于老化和/或绝经而减退的皮肤外观得到改进;(k)皮肤保湿得到改进;(l)皮肤弹性和/或回弹力得到增加;(m)皮肤下陷得到治疗、减轻和/或预防;(n)皮肤紧致度得到改进;(o)色素斑点、斑点化皮肤和/或疤痕(诸如痤疮疤痕)得到减轻;(p)就光衍射或反射来说的皮肤光学性质得到改进;或(q)它们的任何组合。
在可与任何先前实施方案组合的一些实施方案中,受试者是人。在可与任何先前实施方案组合的一些实施方案中,疱疹病毒或组合物局部、经皮方式、皮下方式、皮上方式、真皮内方式、口服方式、舌下方式、经颊方式、经直肠方式、经阴道方式、静脉内方式、动脉内方式、肌肉内方式、骨内方式、心内方式、腹膜内方式、经粘膜方式、玻璃体内方式、视网膜下方式、关节内方式、关节周方式、局部方式、或通过吸入来向受试者施用。在可与任何先前实施方案组合的一些实施方案中,疱疹病毒或组合物以真皮内方式向受试者施用。在可与任何先前实施方案组合的一些实施方案中,疱疹病毒或组合物通过浅表注射来施用。
本公开的其他方面涉及一种组合物,所述组合物包含:包含重组核酸的单纯疱疹病毒(HSV),其中所述重组核酸包含编码第一多肽的第一多核苷酸,所述第一多肽包含第一人胶原蛋白;以及赋形剂。在一些实施方案中,重组核酸包含第一多核苷酸的两个或更多个拷贝。在可与任何先前实施方案组合的一些实施方案中,HSV是复制缺陷性的。在可与任何先前实施方案组合的一些实施方案中,HSV是有复制能力的。在可与任何先前实施方案组合的一些实施方案中,HSV是单纯疱疹1型病毒、单纯疱疹2型病毒或它们的任何衍生物。
在一些实施方案中,重组核酸是单纯疱疹病毒扩增子。在一些实施方案中,单纯疱疹病毒扩增子是HSV-1扩增子或HSV-1杂合扩增子。在一些实施方案中,HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子、以及HSV/EBV/RV杂合扩增子、或HSV/睡美人(Sleeping Beauty)杂合扩增子。
在一些实施方案中,重组核酸是重组单纯疱疹病毒基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在单纯疱疹病毒基因中包含失活性突变。在一些实施方案中,单纯疱疹病毒基因选自由感染细胞蛋白(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和UL55组成的组。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP4基因的一个或两个拷贝中包含失活突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在UL41基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP27基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中,失活性突变是一种或多种基因的编码序列的缺失。
在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在病毒基因座内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP22病毒基因座内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中,相较于野生型单纯疱疹病毒,HSV具有降低的细胞毒性。
在可与任何先前实施方案组合的一些实施方案中,第一人胶原蛋白选自胶原α-1(I)链多肽(COL1-1)、胶原α-2(I)链多肽(COL1-2)、胶原α-1(II)链多肽(COL2)、胶原α-1(III)链多肽(COL3)、胶原α-1(IV)链多肽(COL4-1)、胶原α-2(IV)链多肽(COL4-2)、胶原α-3(IV)链多肽(COL4-3)、胶原α-4(IV)链多肽(COL4-4)、胶原α-5(IV)链多肽(COL4-5)、胶原α-6(IV)链多肽(COL4-6)、胶原α-1(V)链多肽(COL5-1)、胶原α-2(V)链多肽(COL5-2)、胶原α-3(V)链多肽(COL5-3)、胶原α-1(VI)链多肽(COL6-1)、胶原α-2(VI)链多肽(COL6-2)、胶原α-3(VI)链多肽(COL6-3)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)、胶原α-6(VI)链多肽(COL6-6)、胶原α-1(VII)链多肽(COL7)、胶原α-1(VIII)链多肽(COL8)、胶原α-1(IX)链多肽(COL9-1)、胶原α-2(IX)链多肽(COL9-2)、胶原α-3(IX)链多肽(COL9-3)、胶原α-1(X)链多肽(COL10)、胶原α-1(XI)链多肽(COL11-1)、胶原α-2(XI)链多肽(COL11-2)、胶原α-1(XII)链多肽(COL12)、胶原α-1(XIII)链多肽(COL13)、胶原α-1(XIV)链多肽(COL14)、胶原α-1(XV)链多肽(COL15)、胶原α-1(XVI)链多肽(COL16)、胶原α-1(XVII)链多肽(COL17)、胶原α-1(XVIII)链多肽(COL18)、胶原α-1(XIX)链多肽(COL19)、胶原α-1(XX)链多肽(COL20)、胶原α-1(XXI)链多肽(COL21)、胶原α-1(XXII)链多肽(COL22)、胶原α-1(XXIII)链多肽(COL23)、胶原α-1(XXIV)链多肽(COL24)、胶原α-1(XXV)链多肽(COL25)、胶原α-1(XXVI)链多肽(COL26)、胶原α-1(XXVII)链多肽(COL27)和胶原α-1(XXVIII)链多肽(COL28)。在可与任何先前实施方案组合的一些实施方案中,第一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在可与任何先前实施方案组合的一些实施方案中,编码第一人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在可与任何先前实施方案组合的一些实施方案中,第一人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在可与任何先前实施方案组合的一些实施方案中,第一人胶原蛋白不是COL7。
在可与任何先前实施方案组合的一些实施方案中,第一多肽包含:(a)第一人胶原蛋白;(b)另一人胶原蛋白;和(c)使(a)连接于(b)的接头多肽。在一些实施方案中,接头多肽是可裂解接头多肽。在一些实施方案中,接头多肽包含与选自SEQ ID NO:28-31的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,另一人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中,另一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在一些实施方案中,编码另一人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,另一人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,第一人胶原蛋白和另一人胶原蛋白是不同的。
在可与任何先前实施方案组合的一些实施方案中,第一多核苷酸编码多顺反子mRNA,所述多顺反子mRNA包含:(a)编码第一多肽的第一开放阅读框(ORF);(b)编码额外人胶原蛋白的第二ORF;和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。在一些实施方案中,编码IRES的核酸序列与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,额外人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中,额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在一些实施方案中,编码额外人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,额外人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,第一人胶原蛋白和额外人胶原蛋白是不同的。
在可与任何先前实施方案组合的一些实施方案中,重组核酸还包含编码第二人胶原蛋白的第二多核苷酸。在一些实施方案中,重组核酸包含第二多核苷酸的两个或更多个拷贝。在一些实施方案中,第二人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中,第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在一些实施方案中,编码第二人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,第二人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,第一人胶原蛋白和第二人胶原蛋白是不同的。
在可与任何先前实施方案组合的一些实施方案中,重组核酸是重组单纯疱疹病毒基因组,并且其中所述重组单纯疱疹病毒基因组在病毒基因座内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP22病毒基因座内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸,并且在ICP22病毒基因座内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸,并且在UL41病毒基因座内包含第二多核苷酸。
在可与任何先前实施方案组合的一些实施方案中,赋形剂适合于经皮肤(全身性或局部)、经皮、皮下和/或真皮内施用。在可与任何先前实施方案组合的一些实施方案中,赋形剂包括羟丙基甲基纤维素凝胶。在可与任何先前实施方案组合的一些实施方案中,赋形剂适合于真皮内施用。在可与任何先前实施方案组合的一些实施方案中,赋形剂包括磷酸盐缓冲剂。在可与任何先前实施方案组合的一些实施方案中,赋形剂包括甘油。在可与任何先前实施方案组合的一些实施方案中,赋形剂包括脂质载体。在可与任何先前实施方案组合的一些实施方案中,赋形剂包括纳米粒子载体。
在可与任何先前实施方案组合的一些实施方案中,组合物是美容组合物。在一些实施方案中,美容组合物是皮肤护理产品。
本公开的其他方面涉及一种包括本文所述的任何组合物和关于施用组合物的说明书的药盒。
本公开的其他方面涉及一种增强、增加、加强和/或补充受试者中一种或多种人胶原蛋白的水平的方法,所述方法包括向所述受试者施用有效量的本文所述的任何组合物。
本公开的其他方面涉及一种增强、增加、加强和/或补充受试者的软组织的方法,所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中,将组合物注射至受试者的软组织中。
本公开的其他方面涉及一种使有需要的受试者的皮肤品质、状况和/或外观改进的方法,所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中,状况选自日光损害、老化、UV暴露、粗糙纹理、皮肤下陷、皱纹以及它们的任何组合。
本公开的其他方面涉及一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法,所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中,组合物的施用持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来减少受试者的皮肤中一种或多种浅表凹陷的出现。在一些实施方案中,相较于在施用组合物之前受试者的皮肤中一种或多种浅表凹陷的出现,在施用组合物之后,受试者的皮肤中一种或多种浅表凹陷的出现得以减少。
本公开的其他方面涉及一种使有需要的受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者增加和/或改进的方法,所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中,在施用组合物之后,受试者的皮肤持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来维持纹理、光滑度、弹性或张力增加和/或改进中的至少一者。在一些实施方案中,相较于在施用组合物之前受试者的皮肤的纹理、光滑度、弹性或张力,在施用组合物之后,受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者得以增加和/或改进。
在可与任何先前实施方案组合的一些实施方案中,受试者的皮肤是老化中的皮肤。在可与任何先前实施方案组合的一些实施方案中,受试者的皮肤已由于暴露于紫外光而受损害。在可与任何先前实施方案组合的一些实施方案中,受试者的皮肤是有皱纹的。
本公开的其他方面涉及一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法,所述方法包括向所述受试者施用有效量的本文所述的任何组合物。在一些实施方案中,一种或多种皮肤学老化征象的减弱选自:(a)细纹和/或皱纹得到治疗、减轻和/或预防;(b)皮肤孔尺寸得到降低;(c)皮肤厚度、饱满度和/或紧固度得到改进;(d)皮肤光滑度、柔韧性和/或柔软度得到改进;(e)皮肤色泽、光亮度和/或透明度得到改进;(f)原胶原和/或胶原产生得到改进;(g)皮肤纹理得到改进和/或再纹理化得到促进;(h)皮肤轮廓的外观得到改进;(i)皮肤光泽和/或亮度得到恢复;(j)由于老化和/或绝经而减退的皮肤外观得到改进;(k)皮肤保湿得到改进;(l)皮肤弹性和/或回弹力得到增加;(m)皮肤下陷得到治疗、减轻和/或预防;(n)皮肤紧致度得到改进;(o)色素斑点、斑点化皮肤和/或痤疮疤痕得到减轻;(p)就光衍射或反射来说的皮肤光学性质得到改进;和(q)它们的任何组合。在一些实施方案中,相较于在施用组合物之前受试者的一种或多种皮肤学老化征象,在施用组合物之后,受试者的一种或多种皮肤学老化征象得到减弱。
在可与任何先前实施方案组合的一些实施方案中,受试者是人。在可与任何先前实施方案组合的一些实施方案中,组合物以经皮肤(全身性或局部)方式、经皮方式、皮下方式和/或真皮内方式向受试者施用。在一些实施方案中,组合物通过浅表注射来施用。在一些实施方案中,组合物以真皮内方式向受试者施用。在一些实施方案中,向受试者施用组合物一次。在一些实施方案中,向受试者施用组合物至少两次。在一些实施方案中,在施用之间,经过至少约15、至少约30、至少约60、至少约90或至少约120天。在可与任何先前实施方案组合的一些实施方案中,向受试者的一个或多个受影响和/或未受影响区域施用组合物。在可与任何先前实施方案组合的一些实施方案中,在施用之前对皮肤进行磨削。
本公开的其他方面涉及一种包含编码第一多肽的第一多核苷酸的重组核酸,所述第一多肽包含第一人胶原蛋白,其中所述重组核酸是重组单纯疱疹病毒基因组。在一些实施方案中,重组核酸包含第一多核苷酸的两个或更多个拷贝。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。
在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在单纯疱疹病毒基因中包含失活性突变。在一些实施方案中,单纯疱疹病毒基因选自由感染细胞蛋白(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和UL55组成的组。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP4基因的一个或两个拷贝中包含失活突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在UL41基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP27基因中包含失活突变。在可与任何先前实施方案组合的一些实施方案中,失活性突变是一种或多种基因的编码序列的缺失。
在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在病毒基因座内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在ICP22病毒基因座内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含第一多核苷酸。在可与任何先前实施方案组合的一些实施方案中,相较于野生型单纯疱疹病毒,HSV具有降低的细胞毒性。
在可与任何先前实施方案组合的一些实施方案中,第一人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL2。在可与任何先前实施方案组合的一些实施方案中,第一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在可与任何先前实施方案组合的一些实施方案中,编码第一人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在可与任何先前实施方案组合的一些实施方案中,第一人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在可与任何先前实施方案组合的一些实施方案中,第一人胶原蛋白不是COL7。
在可与任何先前实施方案组合的一些实施方案中,第一多肽包含:(a)第一人胶原蛋白;(b)另一人胶原蛋白;和(c)使(a)连接于(b)的接头多肽。在一些实施方案中,接头多肽是可裂解接头多肽。在一些实施方案中,接头多肽包含与选自SEQ ID NO:28-31的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,另一人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中,另一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在一些实施方案中,编码另一人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,另一人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,第一人胶原蛋白和另一人胶原蛋白是不同的。
在可与任何先前实施方案组合的一些实施方案中,第一多核苷酸编码多顺反子mRNA,所述多顺反子mRNA包含:(a)编码第一多肽的第一开放阅读框(ORF);(b)编码额外人胶原蛋白的第二ORF;和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。在一些实施方案中,编码IRES的核酸序列与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,额外人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中,额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在一些实施方案中,编码额外人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,额外人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,第一人胶原蛋白和额外人胶原蛋白是不同的。
在可与任何先前实施方案组合的一些实施方案中,重组核酸还包含编码第二人胶原蛋白的第二多核苷酸。在一些实施方案中,重组核酸包含第二多核苷酸的两个或更多个拷贝。在一些实施方案中,第二人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。在一些实施方案中,第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。在一些实施方案中,编码第二人胶原蛋白的核酸序列与选自SEQ ID NO:1-14的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,第二人胶原蛋白包含与选自SEQ ID NO:15-21的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,第一人胶原蛋白和第二人胶原蛋白是不同的。
在可与任何先前实施方案组合的一些实施方案中,重组单纯疱疹病毒基因组在病毒基因座内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP22病毒基因座内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在UL41病毒基因座内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸,并且在ICP22病毒基因座内包含第二多核苷酸。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含第一多核苷酸,并且在UL41病毒基因座内包含第二多核苷酸。
本公开的其他方面涉及一种包含本文所述的任何重组核酸的宿主细胞。在一些实施方案中,宿主细胞是真核细胞。在一些实施方案中,宿主细胞是哺乳动物细胞。在一些实施方案中,宿主细胞是人细胞或非人灵长类动物细胞。在一些实施方案中,宿主细胞是Vero细胞。在一些实施方案中,宿主细胞是补充性宿主细胞。
本公开的其他方面涉及一种收集单纯疱疹病毒的方法,所述方法包括:(a)使补充性宿主细胞与本文所述的任何重组核酸接触;以及(b)收集通过所述补充性宿主细胞产生的所述单纯疱疹病毒。
本公开的其他方面涉及一种收集单纯疱疹病毒的方法,所述方法包括:(a)培养包含本文所述的任何重组核酸的宿主细胞;以及(b)收集通过所述宿主细胞产生的所述单纯疱疹病毒。
附图说明
本专利或申请文件含有至少一个以彩色制作的附图。具有彩色附图的本专利或专利申请公布的副本将在请求并支付必要费用后由专利局提供。
图1A-图1N显示野生型和经修饰单纯疱疹病毒基因组的示意图。图1A显示野生型单纯疱疹病毒基因组。图1B显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列。图1C显示包含ICP4(两个拷贝)的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列。图1D显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸含有1)可操作地连接于第一异源性启动子的第一人胶原多肽的编码序列,和2)可操作地连接于第二异源性启动子的第二人胶原多肽的编码序列。第一人胶原多肽与第二人胶原多肽两者在相同DNA链上编码。图1E显示包含ICP4(两个拷贝)的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸含有1)可操作地连接于第一异源性启动子的第一人胶原多肽的编码序列,和2)可操作地连接于第二异源性启动子的第二人胶原多肽的编码序列。第一人胶原多肽与第二人胶原多肽两者在相同DNA链上编码。图1F显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸含有1)可操作地连接于第一异源性启动子的第一人胶原多肽的编码序列,和2)可操作地连接于第二异源性启动子的第二人胶原多肽的编码序列。第一人胶原多肽和第二人胶原多肽在相反DNA链上编码。图1G显示包含ICP4(两个拷贝)的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸含有1)可操作地连接于第一异源性启动子的第一人胶原多肽的编码序列,和2)可操作地连接于第二异源性启动子的第二人胶原多肽的编码序列。第一人胶原多肽和第二人胶原多肽在相反DNA链上编码。图1H显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸编码可操作地连接于异源性启动子的多顺反子mRNA。多顺反子mRNA含有由内部核糖体进入位点(IRES)分隔的第一人胶原多肽的编码序列和第二人胶原多肽的编码序列。图1I显示包含ICP4(两个拷贝)的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸编码可操作地连接于异源性启动子的多顺反子mRNA。多顺反子mRNA含有由内部核糖体进入位点(IRES)分隔的第一人胶原多肽的编码序列和第二人胶原多肽的编码序列。图1J显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸含有可操作地连接于异源性启动子的嵌合多肽的编码序列。嵌合多肽包含由可裂解接头分隔的第一人胶原多肽的氨基酸序列和第二人胶原多肽的氨基酸序列。图1K显示包含ICP4(两个拷贝)的编码序列的缺失,具有整合在ICP4基因座中的每一者处的多核苷酸的经修饰单纯疱疹病毒基因组,所述多核苷酸含有可操作地连接于异源性启动子的嵌合多肽的编码序列。嵌合多肽包含由可裂解接头分隔的第一人胶原多肽的氨基酸序列和第二人胶原多肽的氨基酸序列。图1L显示包含ICP4(两个拷贝)和ICP22的编码序列的缺失,具有整合在ICP4基因座中的每一者处的第一多核苷酸和整合在ICP22基因座处的第二多核苷酸的经修饰单纯疱疹病毒基因组,所述第一多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列,所述第二多核苷酸含有可操作地连接于异源性启动子的第二人胶原多肽的编码序列。图1M显示包含ICP4(两个拷贝)、ICP22和UL41的编码序列的缺失,具有整合在ICP4基因座中的每一者处的第一多核苷酸和整合在UL41基因座处的第二多核苷酸的经修饰单纯疱疹病毒基因组,所述第一多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列,所述第二多核苷酸含有可操作地连接于异源性启动子的第二人胶原多肽的编码序列。图1N显示包含ICP4(两个拷贝)和UL41的编码序列的缺失,具有整合在ICP4基因座中的每一者处的第一多核苷酸和整合在UL41基因座处的第二多核苷酸的经修饰单纯疱疹病毒基因组,所述第一多核苷酸含有可操作地连接于异源性启动子的第一人胶原多肽的编码序列,所述第二多核苷酸含有可操作地连接于异源性启动子的第二人胶原多肽的编码序列。
图2A-图2B显示携带人胶原7(COL7)表达盒的复制缺陷性单纯疱疹1型病毒的示意图。图2A显示病毒“KCA211”的示意图。图2B显示病毒“SAR-COL7”的示意图。
图3A-图3B显示用KCA211或SAR-COL7在所指示MOI下感染的HaCaT细胞中的人COL7表达。图3A显示用KCA211或SAR-COL7在所指示MOI下感染的HaCaT细胞中的人COL7表达,如通过qPCR所评估。数据显示为在相对于GAPDH加以归一化之后,相对于SAR-COL7的倍数变化。图3B显示未感染HaCaT细胞或用KCA211或SAR-COL7在所指示MOI下感染的HaCaT细胞中的人COL7表达,如通过蛋白质印迹分析所评估。
图4A-图4B显示模拟感染的从健康患者分离的原代人细胞(正常)以及模拟或SAR-COL7感染的从罹患隐性营养不良性大疱性表皮松解(RDEB)的患者分离的原代人细胞中的人COL7表达的免疫荧光图像。图4A显示模拟感染的野生型和RDEB原代人角质化细胞中或用SAR-COL7在所指示感染复数(MOI)下感染的RDEB原代人角质化细胞中的人COL7表达。图4B显示模拟感染的野生型和RDEB原代人纤维母细胞中或用SAR-COL7在所指示MOI下感染的RDEB原代人纤维母细胞中的人COL7表达。
图5A-图5B显示对模拟感染的从健康患者分离的原代人细胞以及模拟或SAR-COL7感染的从罹患隐性营养不良性大疱性表皮松解(EB)的患者分离的原代人细胞中的人COL7表达的定量PCR分析。图5A显示模拟感染的野生型(N-HDK)和RDEB(EB-HDK)原代人角质化细胞中或用SAR-COL7在所指示MOI下感染的RDEB原代人角质化细胞中的人COL7表达。COL7表达显示为相比于模拟感染的野生型原代人角质化细胞的相对倍数变化。图5B显示模拟感染的野生型(N-HDF)和RDEB(EB-HDF)原代人纤维母细胞中或用SAR-COL7在所指示MOI下感染的RDEB原代人纤维母细胞中的人COL7表达。COL7表达显示为相比于模拟感染的野生型原代人纤维母细胞的相对倍数变化。
图6A-图6B显示未感染(对照)或SAR-COL7感染的RDEB原代人角质化细胞对微孔板的未处理(塑料)或经处理孔的细胞粘附。图6A显示对未处理孔(塑料)或用递增浓度的大鼠尾胶原1处理的孔的细胞粘附。图6B显示对未处理孔(塑料)或用递增浓度的人血浆纤连蛋白处理的孔的细胞粘附。
图7显示在用SAR-COL7感染的RDEB原代人角质化细胞和纤维母细胞构建的器官型培养物中,在第5天时在基底膜区(BMZ)处,人COL7表达和沉积的代表性免疫荧光图像。角质化细胞与纤维母细胞两者均在培养物构建之后在所指示MOI下加以原位感染。
图8A-图8D显示在未感染小鼠皮肤(对照)中或在局部或真皮内递送SAR-COL7之后在小鼠皮肤中观察到的人COL7A1转录物和基因组水平,如通过qPCR所评估。误差棒代表SEM。图8A显示在感染之后第3天,小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图8B显示在感染之后第3天,小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。图8C显示在感染之后第6天,小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图8D显示在感染之后第6天,小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。
图9A-图9B显示在递送SAR-COL7之后,小鼠皮肤中的人COL7表达的代表性免疫荧光图像。图9A显示在真皮内递送SAR-COL7之后,小鼠皮肤中的人COL7表达的代表性免疫荧光图像。图9B显示在局部递送SAR-COL7之后,小鼠皮肤中的人COL7表达的代表性免疫荧光图像。
图10A-图10B显示在真皮内递送媒介物、SAR-COL7或KCA211之后在BALB/c小鼠皮肤中观察到的人COL7A1转录物和基因组水平,如通过qPCR所评估。图10A显示BALB/c小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图10B显示BALB/c小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。
图11A-图11B显示在高剂量真皮内递送HSV-GFP(GFP对照)或SAR-COL7之后,在亚效小鼠皮肤中的每个注射部位处观察到的人COL7A1转录物和基因组水平,如通过qPCR所评估。每个棒条代表在所指示时间点的单一样品。图11A显示亚效小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图11B显示亚效小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。
图12A-图12B显示在高剂量真皮内递送HSV-GFP(GFP对照)或SAR-COL7之后,亚效小鼠皮肤中的人COL7表达的代表性免疫荧光图像。图12A显示由亚效小鼠1(在第3天收集)获得的在10倍和20倍放大下的对照(GFP)和SAR-COL7免疫荧光成像。图12B显示由亚效小鼠2和亚效小鼠3(在第7天收集)获得的SAR-COL7免疫荧光成像。图代表用10倍透镜获得的16个视野的平铺图像,捕获了整个皮肤截面。
图13显示来自亚效小鼠1、2和3(在第3和3天收集)的经H&E染色样品。样品取自未处理亚效小鼠皮肤以及在真皮内递送HSV-GFP或SAR-COL7之后的亚效小鼠皮肤。
图14A-图14B显示在真皮内递送SAR-COL7之后,亚效小鼠皮肤中的人COL7表达的代表性电子显微照片图像。致密层是穿过图像的中央的所指示暗带;黑点是人COL7l的经染色NC结构域,蓝色箭号指示锚定原纤维的形成。图14A显示用对人COL7的NC2结构域具有特异性的抗体(LH24)染色的受感染亚效小鼠皮肤的电子显微照片图像。图14B显示用对人COL7的NC1结构域具有特异性的抗体(NP185)染色的受感染亚效小鼠皮肤的电子显微照片图像。
图15A-图15B显示在低剂量真皮内递送SAR-COL7之后,在亚效小鼠皮肤中的每个注射部位处观察到的人COL7A1转录物和基因组水平,如通过qPCR所评估。每个棒条代表在所指示时间点的单一样品。图15A显示亚效小鼠皮肤中的人COL7A1转录物水平/100ng总RNA。图15B显示亚效小鼠皮肤中的人COL7A1 DNA拷贝数/100ng总DNA。
图16显示在低剂量真皮内递送SAR-COL7之后,亚效小鼠皮肤(来自小鼠1)中的人COL7表达的代表性免疫荧光图像。
图17A-图17C显示在用编码单独COL1A1(插入ICP4基因座中)或COL1A1和COL1A2(分别插入ICP4和ICP22基因座中)的HSV的所指示克隆感染的Vero细胞的情况下的人COL1A1和COL1A2核酸和蛋白质分析。图17A显示在用所指示HSV克隆感染之后5天,存在于Vero细胞中的人COL1A1转录物的水平,如通过qRT-PCR分析所测定。呈现两个平行测定的数据±SEM。图17B显示在用所指示HSV克隆感染之后5天,存在于Vero细胞中的人COL1A2转录物的水平,如通过qRT-PCR分析所测定。呈现两个平行测定的数据±SEM。图17C显示在用如通过qRT-PCR确定的所指示COL1A1/COL1A2阳性克隆感染之后5天,Vero细胞中的人COL1A1和COL1A2蛋白表达的蛋白质印迹分析。未感染(模拟)Vero细胞用作阴性对照;GAPDH用作上样对照。
图18显示在用编码插入ICP4基因座中的COL1A1-IRES-COL1A2序列的HSV分离株(IRES-分离株6)感染之后5天,Vero细胞中的人COL1A1和COL1A2蛋白表达的蛋白质印迹分析。用不含有IRES构建体(无插入)的分离株进行的感染用作阴性对照;GAPDH用作上样对照。
图19A-图19B显示在用C3vec01感染的永生化人角质化细胞(HaCaTs)的情况下的人COL3核酸和蛋白质分析。图19A显示在用C3vec01在所指示MOI下感染之后,存在于永生化人角质化细胞(HK)中的人COL3A1转录物的水平。未感染(模拟)和HSV-mCherry感染(mCherry)细胞用作阴性对照。呈现两个平行测定的数据±SEM。图19B显示在用C3vec01在所指示MOI下感染之后48小时,永生化人角质化细胞中的人COL3蛋白表达的代表性免疫荧光图像。未感染(模拟)细胞用作阴性对照。
图20A-图20B显示在用C3vec01感染的永生化人真皮纤维母细胞(HDF)的情况下的人COL3核酸和蛋白质分析。图20A显示在用C3vec01在所指示MOI下感染之后,存在于永生化人真皮纤维母细胞(HDF)中的人COL3A1转录物的水平。未感染(模拟)和HSV-mCherry感染(mCherry)细胞用作阴性对照。呈现两个平行测定的数据±SEM。图20B显示在用C3vec01在所指示MOI下感染之后48小时,永生化人真皮纤维母细胞中的人COL3蛋白表达的代表性免疫荧光图像。未感染(模拟)细胞用作阴性对照。
图21A-图21D显示在用C3vec01在所指示MOI下感染的来源于两个不同供应商的老化原代人纤维母细胞(HDF)的情况下的人COL3核酸和蛋白质分析。图21A显示在用C3vec01在所指示MOI下感染之后,存在于从65岁女性患者或73岁男性患者收集的原代HDF(供应商1)中的人COL3A1转录物的水平。未感染(模拟)细胞用作阴性对照。呈现两个平行测定的数据±SEM。图21B显示在用C3vec01在所指示MOI下感染之后,从73岁男性患者收集的原代HDF(供应商1)中的人COL3A1蛋白表达的蛋白质印迹分析。未感染(模拟)细胞用作阴性对照;重组人COL3A1(rCOL3A1)用作阳性对照;GAPDH用作上样对照。图21C显示在用C3vec01在所指示MOI下感染之后,存在于从75岁女性患者或73岁男性患者收集的原代HDF(供应商2)中的人COL3A1转录物的水平。未感染(模拟)细胞用作阴性对照。呈现两个平行测定的数据±SEM。图21D显示在用C3vec01在所指示MOI下感染之后,从75岁女性患者收集的原代HDF(供应商2)中的人COL3A1蛋白表达的蛋白质印迹分析。未感染(模拟)细胞用作阴性对照;重组人COL3A1(rCOL3A1)用作阳性对照;GAPDH用作上样对照。
图22A-图22B显示在UV暴露后,在永生化人真皮纤维母细胞(HDF)的情况下的人COL3核酸和蛋白质分析。图22A显示在暴露于各种剂量和时间的UV光之后24小时,分泌至培养的HDF的上清液中的COL3的浓度,如通过ELISA所评估。从并行培养的非UV暴露(-UV)HDF收集的上清液用作对照。图22B显示在用C3vec01在所指示MOI下感染之后,存在于UV暴露的永生化人真皮纤维母细胞(HDF)中的人COL3A1转录物的水平。未感染(模拟)和HSV-mCherry感染(mCherry)细胞用作阴性对照。呈现两个平行测定的数据±SEM。
图23A-图23C显示在真皮内施加之后48小时,取自经对照或C3vec01处理的年轻(6-8周龄)和年老(约13月龄)C57BL/6小鼠的皮肤活检体的COL3核酸和蛋白质分析。图23A显示在真皮内施用C3vec01或媒介物对照之后48小时,存在于取自年轻和年老小鼠的皮肤活检体中的人COL3A1 DNA的水平,如通过qPCR分析所评估。图23B显示在真皮内施用C3vec01或媒介物对照之后48小时,存在于取自年轻和年老小鼠的皮肤活检体中的人COL3A1转录物的水平,如通过qRT-PCR分析所评估。对于qPCR和qRT-PCR分析中的每种条件,数据呈现为四个组织样品(两个平行测定/组织样品)的平均值±SEM。图23C显示在真皮内施用C3vec01之后48小时,取自年轻和年老小鼠的皮肤活检体中的人COL3表达的代表性免疫荧光图像。真皮内施用了单独媒介物的年轻小鼠用作阴性对照。DAPI染色用于使核显现。
图24A-图24B显示用所指示病毒分离株感染的Vero细胞中野生型(WT)人LamB3的表达。图24A显示受感染Vero细胞中野生型人LAMB3的表达,如通过qPCR分析所评估。图24B显示受感染Vero细胞中野生型人LamB3蛋白的表达,如通过蛋白质印迹所评估。
图25显示用所指示病毒分离株感染的Vero细胞中野生型(WT)或密码子优化(CO)人LamB3蛋白的表达,如通过蛋白质印迹所评估。未感染Vero细胞用作阴性对照。
图26显示用所指示病毒分离株感染的原代人角质化细胞中野生型(WT)或密码子优化(CO)人LamB3蛋白的表达,如通过蛋白质印迹所评估。未感染原代角质化细胞用作阴性对照。
图27A-图27C显示用所指示病毒分离株感染的Vero细胞中野生型(WT)和密码子优化(CO)人LamC2的表达。图27A显示受感染Vero细胞中野生型人LAMC2的表达,如通过qPCR分析所评估。图27B显示受感染Vero细胞中密码子优化人LAMC2的表达,如通过qPCR分析所评估。图27C显示受感染Vero细胞中野生型和密码子优化人LamC2蛋白的表达,如通过蛋白质印迹所评估。选择表达密码子优化LamC2的框示病毒分离株“LGA”用于进行额外实验。
图28A-图28C显示在所指示感染复数(MOI)下受感染的永生化原代人角质化细胞中从病毒分离株“LGA”表达的人LAMC2。图28A显示在用病毒分离株“LGA”在所指示MOI下感染之后,原代永生化人角质化细胞中的病毒基因组拷贝数。图28B显示在用病毒分离株“LGA”在所指示MOI下感染之后,原代永生化人角质化细胞中表达的密码子优化LAMC2的转录物水平。图28C显示在用病毒分离株“LGA”在所指示MOI下感染之后,原代永生化人角质化细胞中人LamC2蛋白的表达,如通过蛋白质印迹所评估。
图29A-图29D显示在真皮内施加之后72小时,取自经对照(媒介物)或HSV分离株“LGA”处理小鼠的皮肤活检体的LAMC2核酸和蛋白质分析。图29A显示经处理动物上的真皮内注射部位的示意图。图29B显示在真皮内施用HSV分离株LGA或媒介物对照之后72小时,存在于取自小鼠的皮肤活检体中的人LAMC2 DNA的水平,如通过qPCR分析所评估。图29C显示在真皮内施用HSV分离株LGA或媒介物对照之后72小时,存在于取自小鼠的皮肤活检体中的人LAMC2转录物的水平,如通过qRT-PCR分析所评估。对于qPCR和qRT-PCR分析中的每种条件,数据呈现为两个平行测定的平均值±SEM。图29D显示在真皮内施用HSV分离株LGA之后72小时,取自小鼠的皮肤活检体中的人LAMC2表达的代表性免疫荧光图像。真皮内施用单独媒介物的部位用作阴性对照。DAPI染色用于使核显现;pKal染色用于使小鼠层粘连蛋白-332显现。
具体实施方式
在一些实施方案中,本公开涉及编码一种或多种美容蛋白的重组核酸(例如重组疱疹病毒基因组),以及这些重组核酸在用于将一种或多种美容蛋白递送至皮肤,诸如向皮肤上,向皮肤中和/或穿过皮肤(例如向真皮ECM)进行递送的病毒(例如在疱疹病毒)、组合物、制剂、药剂和/或方法中的用途。在一些实施方案中,本公开涉及编码一种或多种美容蛋白的重组核酸(例如重组疱疹病毒基因组),以及这些重组核酸在用以增加、加强和/或补充一种或多种真皮ECM蛋白(例如一种或多种胶原蛋白)的病毒(例如在疱疹病毒)、组合物、制剂、药剂和/或方法中的用途。在一些实施方案中,本公开涉及编码一种或多种美容蛋白的重组核酸(例如重组疱疹病毒基因组),以及这些重组核酸在处于美容性情形下(例如用以减轻一种或多种皮肤学老化征象)的病毒(例如在疱疹病毒)、组合物、制剂、药剂和/或方法中的用途。在一些实施方案中,本公开涉及包含重组疱疹病毒载体的组合物以及包括向哺乳动物的皮肤上,向哺乳动物的皮肤中和/或穿过哺乳动物的皮肤递送所述重组疱疹病毒载体的方法,其中所述重组疱疹病毒载体包含在哺乳动物细胞中可操作的启动子和被表达来在哺乳动物皮肤中实现美容作用的异源性核酸。异源性核酸可递送至哺乳动物的哺乳动物靶标皮肤细胞,包括使所述哺乳动物的表皮、真皮或皮下组织与包含重组疱疹病毒载体的组合物在向所述表皮、真皮或皮下组织上,向所述表皮、真皮或皮下组织中,和/或穿过所述表皮、真皮或皮下组织运送所述重组疱疹病毒载体,并且引入它在其中表达的所述靶标皮肤细胞中所凭借的条件下接触。在不希望受理论束缚下,据信向个体施用本文所述的重组核酸、病毒和/或制剂中的一者或多者将允许功能性真皮ECM蛋白(例如人胶原)在所述个体中的产生增加。此外,在不希望受理论束缚下,据信通过施用本文所述的重组核酸、病毒和/或制剂中的一者或多者来增加、加强和/或补充个体中美容蛋白的水平将导致以下中的至少一者:1)软组织的增强、加强和/或补充;2)皮肤品质、状况和/或外观的改进;3)皮肤中一种或多种浅表凹陷(例如皱纹)的减少;4)皮肤的纹理、光滑度、弹性和/或张力的改进;和/或5)一种或多种皮肤学老化征象的减轻。最后,在不希望受理论束缚下,据信本文所述的重组核酸、病毒、组合物和方法提供了一种用于在美容性环境中递送功能性美容蛋白的新型策略。
以下描述阐述示例性方法、参数等。然而,应认识到这种描述不意图作为对本公开的范围的限制,而是代之以作为对示例性实施方案的描述而提供。
I.一般性技术
本文中描述或参考的技术和程序通常由本领域技术人员所充分了解,并且通常由本领域技术人员使用常规方法加以采用,所述方法诸如像以下中描述的广泛利用的方法:Sambrook等,Molecular Cloning:A Laboratory Manual第3版(2001)Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.;Current Protocols in MolecularBiology(F.M.Ausubel等人编,(2003));丛书Methods in Enzymology(Academic Press,Inc.);PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor编(1995));Harlow和Lane编(1988);Oligonucleotide Synthesis(M.J.Gait编,1984);Methods in Molecular Biology,Humana Press;Cell Biology:A Laboratory Notebook(J.E.Cellis编,1998)Academic Press;Animal Cell Culture(R.I.Freshney)编,1987);Introduction to Cell and Tissue Culture(J.P.Mather和P.E.Roberts,1998)PlenumPress;Cell and Tissue Culture:Laboratory Procedures(A.Doyle,J.B.Griffiths和D.G.Newell编,1993-8)J.Wiley and Sons;Gene Transfer Vectors for MammalianCells(J.M.Miller和M.P.Calos编,1987);PCR:The Polymerase Chain Reaction,(Mullis等人编,1994);Short Protocols in Molecular Biology(Wiley and Sons,1999)。
II.定义
在详细描述本公开之前,应了解本公开不限于毫无疑问可变化的特定组合物或生物系统。还应了解本文所用的术语仅出于描述特定实施方案的目的,并且不意图具有限制性。
如本文所用,除非内容另外明确规定,否则单数形式“一个(种)(a/an)”和“这个(种)(the)”包括复数个(种)指示物。因此,举例来说,提及“一个(种)分子”任选地包括两个(种)或更多个(种)所述分子的组合,以此类推。
如本文所用,术语“和/或”可包括相关所列条目中的一者或多者的任何和所有组合。举例来说,术语“a和/或b”可指“单独a”、“单独b”、“a或b”或“a和b”;术语“a、b和/或c”可指“单独a”、“单独b”、“单独c”、“a或b”、“a或c”、“b或c”、“a、b或c”、“a和b”、“a和c”、“b和c”、或“a、b和c”;等。
如本文所用,术语“约”是指相应值的易于为本技术领域中的熟练人士所知的通常误差范围。在本文中提及“约”某一值或参数包括(并且描述)有关那个值或参数本身的实施方案。
应了解,本公开的方面和实施方案包括“包含”、“由……组成”以及“基本上由……组成”方面和实施方案。
如本文所用,术语“多核苷酸”“核酸序列”、“核酸”以及它们的变化形式对于以下各物来说将是通用的:多脱氧核糖核苷酸(含有2-脱氧-D-核糖)、多核糖核苷酸(含有D-核糖)、是嘌呤或嘧啶碱基的N-糖苷的任何其他类型的多核苷酸、以及含有非核苷酸骨架的其他聚合物,前提是所述聚合物以允许进行如见于DNA和RNA中的碱基配对和碱基堆积的构型含有核苷碱基。因此,这些术语包括已知类型的核酸序列修饰,例如用类似物对一个或多个天然存在的核苷酸的取代,以及核苷酸间修饰。
如本文所用,当将核酸与另一核酸序列放置成功能性关系时,所述核酸是“操作性地连接的”或“可操作地连接的”。举例来说,如果启动子或增强子影响编码序列的转录,那么所述启动子或增强子可操作地连接于所述序列;或如果使核糖体结合位点定位以便促进翻译,那么所述核糖体结合位点可操作地连接于编码序列。通常,“操作性地连接”或“可操作地连接”意指所连接的DNA序列是邻接的。
如本文所用,术语“载体”是指用于将异源性核酸引入细胞中以达成其表达或复制的离散元件。表达载体包括能够表达与调控序列诸如启动子区域操作性地连接的核酸的载体,所述调控序列能够实现所述核酸的表达。因此,表达载体可指在引入适当宿主细胞中后导致核酸的表达的DNA或RNA构建体,诸如质粒、噬菌体、重组病毒或其他载体。适当表达载体为本领域技术人员所熟知,并且包括可在真核细胞中复制的那些,以及保持游离的那些或整合至宿主细胞基因组中的那些。
如本文所用,“开放阅读框”或“ORF”是指编码蛋白质或多肽的一段连续DNA或RNA核酸。通常,核酸包含翻译起始信号或起始密码子诸如ATG或AUG,以及终止密码子。
如本文所用,“非翻译区”或“UTR”是指在开放阅读框的5’和/或3’末端的非翻译核酸。在多核苷酸中包括一个或多个UTR可影响所述多核苷酸的转录后调控、mRNA稳定性和/或翻译。
如本文所用,术语“转基因”是指在引入细胞中之后能够在适当条件下转录成RNA并翻译和/或表达的多核苷酸。在一些方面,它对它被引入其中的细胞赋予所需性质,或另外导致所需美容、治疗或诊断效果。
如本文所用,术语“多肽”、“蛋白质”和“肽”可互换使用,并且可指两个或更多个氨基酸的聚合物。
如本文所用,“受试者”、“宿主”或“个体”是指分类为哺乳动物的任何动物,包括人、家养动物和农场动物、以及动物园动物、运动动物或玩赏动物,诸如狗、马、猫、母牛,以及研究中使用的动物,诸如小鼠、大鼠、仓鼠、兔和非人灵长类动物等。在一些实施方案中,哺乳动物是人。
如本文所用,术语“药物制剂”或“药物组合物”是指呈容许一种或多种活性成分的生物活性有效的形式,并且不含有对组合物或制剂将施用的受试者具有不可接受毒性的额外组分的制剂。“药学上可接受的”赋形剂(例如媒介物、添加剂)是可合理地向受试者施用以提供所采用的一种或多种活性成分的有效剂量的那些。
如本文所用,“经皮肤施用”或“以经皮肤方式施用”是指通过使包含组合物的制剂直接地或以其他方式与受试者的皮肤的全部(“全身性”)或一部分(“局部”)接触来向受试者递送组合物。所述术语涵盖若干施用途径,包括但不限于局部和经皮。局部施用可用作一种用以将组合物递送至受试者的表皮或真皮或它们的特定层的手段。
如本文所用,“治疗”是指旨在在临床病变的过程期间改变所治疗的个体或细胞的天然过程的临床干预。合乎需要的治疗作用包括降低疾病/病症/缺陷进展的速率,改善或缓和疾病/病症/缺陷状态,以及缓解或改进预后。举例来说,如果一种或多种与皮肤学老化相关的症状得以减轻、缓和或消除,包括减少或消除皱纹,那么个体被成功“治疗”。
如本文所用,术语“延迟疾病/病症/缺陷的进展”是指推迟、阻碍、减缓、延缓、稳定和/或延后所述疾病/病症/缺陷(例如皮肤皱纹)的发展。视疾病/病症/缺陷的历史和/或所治疗的个体而定,这个延迟可具有不同时长或时间。如为本领域普通技术人员所显而易知,充分或显著延迟可实际上涵盖预防,因为个体不显现疾病/病症/缺陷。
III.重组核酸
本公开的某些方面涉及包含一种或多种编码美容蛋白的多核苷酸(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、十种或更多种等)的重组核酸(例如经分离重组核酸)。本文描述或本领域中已知的任何适合美容蛋白都可由本公开的多核苷酸编码,所述美容蛋白包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白、额外真皮ECM蛋白等。在一些实施方案中,美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中,美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。
在一些实施方案中,本公开涉及包含一种或多种编码胶原蛋白的多核苷酸(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、十种或更多种等)的重组核酸(例如经分离重组核酸)。在一些实施方案中,胶原蛋白是人胶原蛋白。在一些实施方案中,本公开涉及包含一种或多种编码同三聚胶原(例如同三聚人胶原,诸如人胶原3(例如包括三个COL3A1(COL3)多肽)或人胶原7(例如包含三个COL7A1(COL7)多肽))的多核苷酸的重组核酸。在一些实施方案中,本公开涉及包含一种或多种编码异三聚胶原(例如异三聚人胶原,诸如人胶原1(例如包含两个COL1A1(COL1-1)多肽和一个COL1A2(COL1-2)多肽)或人胶原4(例如包含两个COL4A1(COL4-1)多肽和一个COL4A2(COL4-2)多肽))的多核苷酸的重组核酸。在一些实施方案中,本公开涉及包含一种或多种编码同三聚胶原和异三聚胶原的多核苷酸的重组核酸(例如包含一种或多种编码人胶原1和人胶原3的多核苷酸的重组核酸)。在一些实施方案中,本公开涉及包含一种或多种编码人胶原1的多核苷酸的重组核酸。在一些实施方案中,本公开涉及包含一种或多种编码人胶原3的多核苷酸的重组核酸。
在一些实施方案中,本公开涉及包含编码第一多肽的第一多核苷酸的重组核酸,所述第一多肽包含第一美容蛋白(例如第一人胶原蛋白)。在一些实施方案中,第一多肽基本上由第一美容蛋白组成或由第一美容蛋白组成(例如基本上由第一人胶原蛋白组成或由第一人胶原蛋白组成)。在一些实施方案中,本公开涉及包含编码第一多肽的第一多核苷酸的重组核酸,所述第一多肽包含:第一美容蛋白(例如第一人胶原蛋白)、接头多肽以及另一美容蛋白(例如另一人胶原蛋白)。在一些实施方案中,第一美容蛋白和另一美容蛋白(例如第一人胶原蛋白和另一人胶原蛋白)是相同的。在一些实施方案中,第一美容蛋白和另一美容蛋白(例如第一人胶原蛋白和另一人胶原蛋白)是不同的。在一些实施方案中,接头多肽是可裂解接头多肽。
在一些实施方案中,本公开涉及包含编码第一多肽的第一多核苷酸的重组核酸,所述第一多肽包含第一美容蛋白(例如第一人胶原蛋白),其中所述第一多核苷酸编码多顺反子mRNA,所述多顺反子mRNA包含:编码所述第一多肽的第一开放阅读框(ORF)、内部核糖体进入位点(IRES)、以及编码额外美容蛋白(例如额外人胶原蛋白)的第二ORF。在一些实施方案中,第一美容蛋白和额外美容蛋白(例如第一人胶原蛋白和额外人胶原蛋白)是相同的。在一些实施方案中,第一美容蛋白和额外美容蛋白(例如第一人胶原蛋白和额外人胶原蛋白)是不同的。
在一些实施方案中,本公开涉及重组核酸,所述重组核酸包含编码第一多肽的第一多核苷酸,所述第一多肽包含第一美容蛋白(例如第一人胶原蛋白);以及编码第二美容蛋白(例如第二人胶原蛋白)的第二多核苷酸。在一些实施方案中,第一美容蛋白和第二美容蛋白(例如第一人胶原蛋白和第二人胶原蛋白)是相同的。在一些实施方案中,第一美容蛋白和第二美容蛋白(例如第一人胶原蛋白和第二人胶原蛋白)是不同的。
在一些实施方案中,重组核酸是载体。在一些实施方案中,重组核酸是病毒载体。在一些实施方案中,重组核酸是疱疹病毒载体。在一些实施方案中,重组核酸是单纯疱疹病毒扩增子。在一些实施方案中,重组核酸是重组疱疹病毒基因组。在一些实施方案中,重组核酸是重组单纯疱疹病毒基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组。
编码美容蛋白的多核苷酸
编码胶原蛋白的多核苷酸
在一些实施方案中,本公开涉及一种包含一种或多种包含胶原基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何胶原基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码,所述胶原基因包括例如人胶原基因(参见例如NCBI基因标识符:1277、1278、1281、1282、1284、1291、1294、1308等)、小鼠胶原基因(参见例如NCBI基因标识符:12842、12843、12825、12826、12827、12833、12836、12821等)、黑猩猩胶原基因(参见例如NCBI基因标识符:104001053、455117、459815、452689、452661、450204、101056895、101058306等)、大鼠胶原基因(参见例如NCBI基因标识符:29393、84352、84032、290905、306628、294337、301012、294027等)、兔胶原基因(参见例如NCBI基因标识符:100347598、100008997、100009177、100358256、100358522、100343947、100356561、100339335等)等。鉴定来自额外物种的胶原基因同源物/直系同源物的方法为本领域普通技术人员所知,包括例如使用核酸序列比对程序诸如
Figure BDA0002744714680000421
blastn套件。在一些实施方案中,本公开的多核苷酸包含与本文描述或本领域中已知的任何胶原基因(和/或其编码序列)的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开的多核苷酸包含本文描述或本领域中已知的任何胶原基因的编码序列的密码子优化变体。在一些实施方案中,相较于相应非密码子优化野生型序列的异源性表达的稳定性和/或产率,胶原基因的编码序列的密码子优化变体的使用使所编码胶原蛋白在靶标细胞(诸如表皮和/或真皮的细胞)中的异源性表达(RNA和/或蛋白质)的稳定性和/或产率增加。可使用本领域中已知的用于针对在一种或多种靶标细胞(例如一种或多种人细胞)中的表达对序列进行密码子优化的任何适合方法,包括例如通过由Fath等人(PLoS One.2011年3月3日;6(3):e17596)描述的方法。
在一些实施方案中,本公开涉及一种或多种包含人胶原基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。本领域中已知的任何适合人胶原基因(包括其任何亚型)都可由本公开的核酸编码,所述人胶原基因包括例如COL1A1基因(参见例如NCBI基因标识符:1277;SEQ ID NO:1)、COL1A2基因(参见例如NCBI基因标识符:1278;SEQ ID NO:3)、COL2A1基因(参见例如NCBI基因标识符:1280)、COL3A1基因(参见例如NCBI基因标识符:1281;SEQ ID NO:5)、COL4A1基因(参见例如NCBI基因标识符:1282;SEQ ID NO:7)、COL4A2基因(参见例如NCBI基因标识符:1284)、COL4A3基因(参见例如NCBI基因标识符:1285)、COL4A4基因(参见例如NCBI基因标识符:1286)、COL4A5基因(参见例如NCBI基因标识符:1287)、COL4A6基因(参见例如NCBI基因标识符:1288)、COL5A1基因(参见例如NCBI基因标识符:1289)、COL5A2基因(参见例如NCBI基因标识符:1290)、COL5A3基因(参见例如NCBI基因标识符:50509)、COL6A1基因(参见例如NCBI基因标识符:1291;SEQID NO:9)、COL6A2基因(参见例如NCBI基因标识符:1292)、COL6A3基因(参见例如NCBI基因标识符:1293)、COL6A4基因(参见例如NCBI基因标识符:344875)、COL6A5基因(参见例如NCBI基因标识符:256076)、COL6A6基因(参见例如NCBI基因标识符:131873)、COL7A1基因(参见例如NCBI基因标识符:1294;SEQ ID NO:10)、COL8A1基因(参见例如NCBI基因标识符:1295)、COL9A1基因(参见例如NCBI基因标识符:1297)、COL9A2基因(参见例如NCBI基因标识符:1298)、COL9A3基因(参见例如NCBI基因标识符:1299)、COL10A1基因(参见例如NCBI基因标识符:1300)、COL11A1基因(参见例如NCBI基因标识符:1301)、COL11A2基因(参见例如NCBI基因标识符:1302)、COL12A1基因(参见例如NCBI基因标识符:1303)、COL13A1基因(参见例如NCBI基因标识符:1305)、COL14A1基因(参见例如NCBI基因标识符:7373)、COL15A1基因(参见例如NCBI基因标识符:1306)、COL16A1基因(参见例如NCBI基因标识符:1307)、COL17A1基因(参见例如NCBI基因标识符:1308;SEQ ID NO:12)、COL18A1基因(参见例如NCBI基因标识符:80781)、COL19A1基因(参见例如NCBI基因标识符:1310)、COL20A1基因(参见例如NCBI基因标识符:57642)、COL21A1基因(参见例如NCBI基因标识符:81578)、COL22A1基因(参见例如NCBI基因标识符:169044)、COL23A1基因(参见例如NCBI基因标识符:91522)、COL24A1基因(参见例如NCBI基因标识符:255631)、COL25A1基因(参见例如NCBI基因标识符:84570)、COL26A1基因(参见例如NCBI基因标识符:136227)、COL27A1基因(参见例如NCBI基因标识符:85301)、COL28A1基因(参见例如NCBI Gene ID:340267)等。在一些实施方案中,本公开的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)包含与本文描述或本领域中已知的任何人胶原基因(和/或其编码序列)的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)包含本文所述的任何人胶原基因的密码子优化变体。在一些实施方案中,相较于相应非密码子优化野生型序列的异源性表达的稳定性和/或产率,人胶原基因的密码子优化变体的使用使人胶原在靶标细胞(诸如人角质化细胞或纤维母细胞)中的异源性表达(RNA和/或蛋白质)的稳定性和/或产率增加。
在一些实施方案中,本公开的多核苷酸包含人COL1A1基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:1或SEQ ID NO:2的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:1或SEQ ID NO:2的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:1或SEQ ID NO:2的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:1或SEQ ID NO:2的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:1或SEQ ID NO:2的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000但少于4395个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:1或SEQ ID NO:2的核酸1-4392的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:1或SEQID NO:2的核酸1-4392的序列。
在一些实施方案中,本公开的多核苷酸包含人COL1A2基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:3或SEQ ID NO:4的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:3或SEQ ID NO:4的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:3或SEQ ID NO:4的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:3或SEQ ID NO:4的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:3或SEQ ID NO:4的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000但少于4101个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:3或SEQ ID NO:4的核酸1-4098的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:3或SEQID NO:4的核酸1-4098的序列。
在一些实施方案中,本公开的多核苷酸包含人COL3A1基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:5或SEQ ID NO:6的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:5或SEQ ID NO:6的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:5或SEQ ID NO:6的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:5或SEQ ID NO:6的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:5或SEQ ID NO:6的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000但少于4401个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:5或SEQ ID NO:6的核酸1-4398的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:5或SEQID NO:6的核酸1-4398的序列。
在一些实施方案中,本公开的多核苷酸包含人COL4A1基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:7或SEQ ID NO:8的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:7或SEQ ID NO:8的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:7或SEQ ID NO:8的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:7或SEQ ID NO:8的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:7或SEQ ID NO:8的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000、至少4500、至少5000但少于5010个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:7或SEQ ID NO:8的核酸1-5007的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQID NO:7或SEQ ID NO:8的核酸1-5007的序列。
在一些实施方案中,本公开的多核苷酸包含人COL6A1基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:9或SEQ ID NO:10的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:9或SEQ ID NO:10的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:9或SEQ ID NO:10的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:9或SEQ ID NO:10的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:9或SEQ ID NO:10的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000但少于3087个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:9或SEQ ID NO:10的核酸1-3084的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:9或SEQ ID NO:10的核酸1-3084的序列。
在一些实施方案中,本公开的多核苷酸包含人COL7A1基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:11或SEQ ID NO:12的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:11或SEQ ID NO:12的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:11或SEQ ID NO:12的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:11或SEQ ID NO:12的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:11或SEQ ID NO:12的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000、至少4500、至少5000、至少5500、至少6000、至少6500、至少7000、至少7500、至少8000、至少8500但少于8835个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:11或SEQ ID NO:12的核酸1-8832的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:11或SEQ ID NO:12的核酸1-8832的序列。
在一些实施方案中,本公开的多核苷酸包含人COL17A1基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:13或SEQ ID NO:14的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:13或SEQ ID NO:14的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:13或SEQ ID NO:14的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:13或SEQ ID NO:14的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:13或SEQ ID NO:14的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000但少于4494个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:13或SEQ ID NO:14的核酸1-4491的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:13或SEQ ID NO:14的核酸1-4491的序列。
在一些实施方案中,本公开的编码一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)的多核苷酸与选自SEQ ID NO:1-14的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,本公开的编码一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)的多核苷酸包含选自SEQ ID NO:1-14的序列。
编码纤连蛋白的多核苷酸
在一些实施方案中,本公开涉及一种包含一种或多种包含纤连蛋白基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何纤连蛋白基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码,所述纤连蛋白基因包括例如人纤连蛋白基因(参见例如NCBI基因标识符:2335)、小鼠纤连蛋白基因(参见例如NCBI基因标识符:14268)、黑猩猩纤连蛋白基因(参见例如NCBI基因标识符:459926)、大鼠纤连蛋白基因(参见例如NCBI基因标识符:25661)、兔纤连蛋白基因(参见例如NCBI基因标识符:100328589)等。鉴定来自额外物种的纤连蛋白基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的多核苷酸包含与本文描述或本领域中已知的任何纤连蛋白基因(和/或其编码序列)的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含本文描述或本领域中已知的任何纤连蛋白基因(和/或其编码序列)的密码子优化变体。
在一些实施方案中,本公开涉及一种或多种包含人纤连蛋白基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。在一些实施方案中,本公开的多核苷酸包含人FN1基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:35或SEQ ID NO:36的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:35或SEQ ID NO:36的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:35或SEQ ID NO:36的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:35或SEQ ID NO:36的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:35或SEQ ID NO:36的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000、至少约4500、至少约5000、至少约5500、至少约6000、至少约6500、至少约7000但少于7434个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:35或SEQ ID NO:36的核酸1-7431的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:35或SEQID NO:36的核酸1-7431的序列。
编码弹性蛋白的多核苷酸
在一些实施方案中,本公开涉及一种包含一种或多种包含弹性蛋白基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何弹性蛋白基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码,所述弹性蛋白基因包括例如人弹性蛋白基因(参见例如NCBI基因标识符:2006)、小鼠弹性蛋白基因(参见例如NCBI基因标识符:13717)、黑猩猩弹性蛋白基因(参见例如NCBI基因标识符:463943)、大鼠弹性蛋白基因(参见例如NCBI基因标识符:25043)、兔弹性蛋白基因(参见例如NCBI基因标识符:100344271)等。鉴定来自额外物种的弹性蛋白基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的多核苷酸包含与本文描述或本领域中已知的任何弹性蛋白基因(和/或其编码序列)的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含本文描述或本领域中已知的任何弹性蛋白基因(和/或其编码序列)的密码子优化变体。
在一些实施方案中,本公开涉及一种或多种包含人弹性蛋白基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。在一些实施方案中,本公开的多核苷酸包含人ELN基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:37或SEQ ID NO:38的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:37或SEQ ID NO:38的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:37或SEQ ID NO:38的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:37或SEQ ID NO:38的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:37或SEQ ID NO:38的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250但少于2361个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:37或SEQ ID NO:38的核酸1-2358的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:37或SEQ ID NO:38的核酸1-2358的序列。
编码光蛋白聚糖蛋白的多核苷酸
在一些实施方案中,本公开涉及一种包含一种或多种包含光蛋白聚糖基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何光蛋白聚糖基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码,所述光蛋白聚糖基因包括例如人光蛋白聚糖基因(参见例如NCBI基因标识符:4060)、小鼠光蛋白聚糖基因(参见例如NCBI基因标识符:17022)、黑猩猩光蛋白聚糖基因(参见例如NCBI基因标识符:452119)、大鼠光蛋白聚糖基因(参见例如NCBI基因标识符:81682)、兔光蛋白聚糖基因(参见例如NCBI基因标识符:100008665)等。鉴定来自额外物种的光蛋白聚糖基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的多核苷酸包含与本文描述或本领域中已知的任何光蛋白聚糖基因(和/或其编码序列)的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含本文描述或本领域中已知的任何光蛋白聚糖基因(和/或其编码序列)的密码子优化变体。
在一些实施方案中,本公开涉及一种或多种包含人光蛋白聚糖基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。在一些实施方案中,本公开的多核苷酸包含人LUM基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:39或SEQ ID NO:40的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:39或SEQ ID NO:40的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:39或SEQ ID NO:40的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:39或SEQ ID NO:40的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:39或SEQ ID NO:40的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000但少于1017个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:39或SEQ ID NO:40的核酸1-1014的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:39或SEQ ID NO:40的核酸1-1014的序列。
编码玻连蛋白和玻连蛋白受体蛋白的多核苷酸
在一些实施方案中,本公开涉及一种包含一种或多种包含玻连蛋白或玻连蛋白受体基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何玻连蛋白或玻连蛋白受体基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码,所述玻连蛋白或玻连蛋白受体基因包括例如人玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符:7448和3685)、小鼠玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符:22370和16410)、黑猩猩玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符:738261和459807)、大鼠玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符:29169和257645)、兔玻连蛋白或玻连蛋白受体基因(参见例如NCBI基因标识符:100009128和100008956)等。鉴定来自额外物种的玻连蛋白或玻连蛋白受体基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的多核苷酸包含与本文描述或本领域中已知的任何玻连蛋白或玻连蛋白受体基因(和/或其编码序列)的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含本文描述或本领域中已知的任何玻连蛋白或玻连蛋白受体基因(和/或其编码序列)的密码子优化变体。
在一些实施方案中,本公开涉及一种或多种包含人玻连蛋白或玻连蛋白受体基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。在一些实施方案中,本公开的多核苷酸包含人VTN基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:41或SEQ ID NO:42的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:41或SEQID NO:42的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:41或SEQ ID NO:42的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:41或SEQ ID NO:42的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:41或SEQ ID NO:42的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少约1250但少于1437个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:41或SEQ ID NO:42的核酸1-1034的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:41或SEQ ID NO:42的核酸1-1034的序列。
编码层粘连蛋白的多核苷酸
在一些实施方案中,本公开涉及一种包含一种或多种包含层粘连蛋白基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何层粘连蛋白基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码,所述层粘连蛋白基因包括例如人层粘连蛋白基因(参见例如NCBI基因标识符:284217、3908、3909、3910、3911、3912、3913、3914、3915、3918和10319)、小鼠层粘连蛋白基因(参见例如NCBI基因标识符:16774、16780和16782)、黑猩猩层粘连蛋白基因(参见例如NCBI基因标识符:455339、469668和457571)、大鼠层粘连蛋白基因(参见例如NCBI基因标识符:307582、305078和192362)、兔层粘连蛋白基因(参见例如NCBI基因标识符:100346886和100342905)等。鉴定来自额外物种的层粘连蛋白基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的多核苷酸包含与本文描述或本领域中已知的任何层粘连蛋白基因(和/或其编码序列)的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含本文描述或本领域中已知的任何层粘连蛋白基因(和/或其编码序列)的密码子优化变体。
在一些实施方案中,本公开涉及一种或多种包含人层粘连蛋白基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸),所述人层粘连蛋白基因诸如是人LAMA1基因(参见例如NCBI基因标识符:284217)、人LAMA2基因(参见例如NCBI基因标识符:3908)、人LAMA3基因(参见例如NCBI基因标识符:3909)、人LAMA4基因(参见例如NCBI基因标识符:3910)、人LAMA5基因(参见例如NCBI基因标识符:3911)、人LAMB1基因(参见例如NCBI基因标识符:3912)、人LAMB2基因(参见例如NCBI基因标识符:3913)、人LAMB3基因(参见例如NCBI基因标识符:3914)、人LAMC1基因(参见例如NCBI基因标识符:3915)、人LAMC2基因(参见例如NCBI基因标识符:3918)、或人LAMC3基因(参见例如NCBI基因标识符:10319)。
在一些实施方案中,本公开的多核苷酸包含人LAMA3基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:43或SEQ ID NO:44的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:43或SEQ ID NO:44的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:43或SEQ ID NO:44的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:43或SEQ ID NO:44的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:43或SEQ ID NO:44的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500、至少4000、至少约4500、至少约5000但少于5175个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:43或SEQ ID NO:44的核酸1-5172的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:43或SEQ ID NO:44的核酸1-5172的序列。
在一些实施方案中,本公开的多核苷酸包含人LAMB3基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:45或SEQ ID NO:46的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:45或SEQ ID NO:46的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:45或SEQ ID NO:46的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:45或SEQ ID NO:46的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:45或SEQ ID NO:46的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500但少于3519个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:45或SEQ ID NO:46的核酸1-3516的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:45或SEQID NO:46的核酸1-3516的序列。
在一些实施方案中,本公开的多核苷酸包含人LAMC2基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:47或SEQ ID NO:48的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ IDNO:47或SEQ ID NO:48的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:47或SEQ ID NO:48的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:47或SEQ ID NO:48的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:47或SEQ ID NO:48的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500但少于3582个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:47或SEQ ID NO:48的核酸1-3579的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:47或SEQID NO:48的核酸1-3579的序列。
编码神经调质蛋白的多核苷酸
在一些实施方案中,本公开涉及一种包含一种或多种包含神经调质基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何神经调质基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码,所述神经调质基因包括例如肉毒梭菌(clostridium botulinum)神经调质基因(参见例如NCBI基因标识符:5185061和39483740)等。鉴定来自额外物种的神经调质基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的多核苷酸包含与本文描述或本领域中已知的任何神经调质基因(和/或其编码序列)的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含本文描述或本领域中已知的任何神经调质基因(和/或其编码序列)的密码子优化变体。
在一些实施方案中,本公开涉及一种或多种包含肉毒梭菌神经调质基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸)。
在一些实施方案中,本公开的多核苷酸包含肉毒梭菌botA基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:49或SEQ IDNO:50的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:49或SEQ ID NO:50的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:49或SEQ ID NO:50的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:49或SEQ ID NO:50的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:49或SEQ ID NO:50的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少约1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500但少于3891个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:49或SEQ ID NO:50的核酸1-3888的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:49或SEQ ID NO:50的核酸1-3888的序列。
在一些实施方案中,本公开的多核苷酸包含肉毒梭菌botB基因的编码序列(或其密码子优化变体)。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:51或SEQ IDNO:52的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:51或SEQ ID NO:52的序列。
在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:51或SEQ ID NO:52的序列的5’截短形式、3’截短形式或片段。在一些实施方案中,SEQ ID NO:51或SEQ ID NO:52的序列的5’截短形式、3’截短形式或片段是具有SEQ ID NO:51或SEQ ID NO:52的至少25、至少50、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、或至少350、至少400、至少450、至少500、至少750、至少1000、至少约1250、至少1500、至少1750、至少2000、至少2500、至少3000、至少3500但少于3876个连续核苷酸的多核苷酸。在一些实施方案中,本公开的多核苷酸包含与SEQ ID NO:51或SEQ ID NO:52的核酸1-3873的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含SEQ ID NO:51或SEQ ID NO:52的核酸1-3873的序列。
编码原纤蛋白的多核苷酸
在一些实施方案中,本公开涉及一种包含一种或多种包含原纤蛋白基因的编码序列的多核苷酸的重组核酸。来自本领域中已知的任何适合物种的任何原纤蛋白基因(包括其任何亚型)的编码序列都可由本公开的多核苷酸编码,所述原纤蛋白基因包括例如人原纤蛋白基因(参见例如NCBI基因标识符:2200、2201和84467)、小鼠原纤蛋白基因(参见例如NCBI基因标识符:14118和14119)、黑猩猩原纤蛋白基因(参见例如NCBI基因标识符:453411、471621和455669)、大鼠原纤蛋白基因(参见例如NCBI基因标识符:83727和689008)、兔原纤蛋白基因(参见例如NCBI基因标识符:100350931、100357126和100359336)等。鉴定来自额外物种的原纤蛋白基因同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的多核苷酸包含与本文描述或本领域中已知的任何原纤蛋白基因(和/或其编码序列)的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,本公开的多核苷酸包含本文描述或本领域中已知的任何原纤蛋白基因(和/或其编码序列)的密码子优化变体。
在一些实施方案中,本公开涉及一种或多种包含人原纤蛋白基因的编码序列的多核苷酸(即一种或多种第一多核苷酸和/或一种或多种第二多核苷酸),所述人原纤蛋白基因诸如是人FBN1基因(参见例如NCBI基因标识符:2200)、人FBN2基因(参见例如NCBI基因标识符:2201)、或人FBN3基因(参见例如NCBI基因标识符:84467)。
示例性多核苷酸
在一些实施方案中,本公开的编码一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)的多核苷酸与选自SEQ ID NO:1-14或35-52的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,本公开的编码一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)的多核苷酸包含选自SEQ ID NO:1-14或35-52的序列。
在一些实施方案中,本公开的编码一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)的多核苷酸与选自SEQ ID NO:1-14、35-38或43-48的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施方案中,本公开的编码一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)的多核苷酸包含选自SEQ ID NO:1-14、35-38或43-48的序列。
本公开的编码美容蛋白(例如人胶原蛋白)的多核苷酸可还编码额外编码序列和非编码序列。额外编码序列和非编码序列的实例可包括但不限于编码额外多肽标签(例如与美容蛋白同框编码以产生融合蛋白)的序列、内含子(例如天然、经修饰或异源性内含子)、5’和/或3’UTR(例如天然、经修饰或异源性5’和/或3’UTR)等。适合多肽标签的实例可包括但不限于纯化标签,诸如his标签、flag标签、麦芽糖结合蛋白和谷胱甘肽-S-转移酶标签;检测标签,诸如可以光度测量方式检测的标签(例如绿色荧光蛋白、红色荧光蛋白等);以及具有可检测酶活性的标签(例如碱性磷酸酶等);含有分泌序列、信号序列、前导序列和/或稳定化序列的标签;蛋白酶裂解位点(例如弗林蛋白酶(furin)裂解位点、TEV裂解位点、凝血酶(Thrombin)裂解位点等)等的任何组合。在一些实施方案中,5’和/或3’UTR使多核苷酸的稳定性、定位和/或翻译效率增加。在一些实施方案中,5’和/或3’UTR使蛋白质表达的水平和/或持续时间改进。在一些实施方案中,5’和/或3’UTR包括可阻断或降低脱靶表达(例如抑制在特定细胞类型(例如神经元细胞)中,在细胞周期中的特定时间,在特定发育阶段等情况下的表达)的元件(例如一个或多个miRNA结合位点等)。在一些实施方案中,5’和/或3’UTR包括可使美容蛋白在特定细胞类型(诸如人角质化细胞和/或纤维母细胞)中的表达增强的元件(例如一个或多个miRNA结合位点等)。
在一些实施方案中,本公开的编码美容蛋白(例如人胶原蛋白)的多核苷酸可操作地连接于一种或多种(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、十种或更多种等)调控序列。术语“调控序列”可包括增强子、绝缘子、启动子和其他表达控制元件(例如多腺苷酸化信号)。可使用本领域中已知的任何一种或多种适合增强子,包括例如来自哺乳动物基因(诸如球蛋白、弹性蛋白酶、白蛋白、α-胎蛋白、胰岛素等)的增强子序列、来自真核细胞病毒的增强子序列(诸如在复制起点的后侧上的SV40增强子(bp100-270)、巨细胞病毒早期启动子增强子、在复制起点的后侧上的多瘤病毒增强子、腺病毒增强子等)以及它们的任何组合。可使用本领域中已知的任何一种或多种适合绝缘子,包括例如HSV染色质边界(CTRL/CTCF结合/绝缘子)元件CTRL1和/或CTRL2、鸡过敏位点4绝缘子(cHS4)、人HNRPA2B1—CBX3遍在性染色质开放元件(UCOE)、来自人干扰素β基因(IFNB1)的骨架/基质附着区(S/MAR)以及它们的任何组合。可使用本领域中已知的任何适合启动子(例如适于在哺乳动物宿主细胞中进行的转录),包括例如从病毒(诸如多瘤病毒、鸡痘病毒、腺病毒(诸如腺病毒2)、牛乳头状瘤病毒、禽肉瘤病毒、巨细胞病毒、逆转录病毒、乙型肝炎病毒、猿猴病毒40(SV40)等)的基因组获得的启动子、来自异源性哺乳动物基因的启动子(诸如肌动蛋白启动子(例如β-肌动蛋白启动子)、泛素启动子(例如泛素C(UbC)启动子)、磷酸甘油酸激酶(PGK)启动子、免疫球蛋白启动子,来自热激启动子等)、来自同源性哺乳动物基因的启动子(例如天然人胶原、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白、层粘连蛋白和/或原纤蛋白启动子)、合成启动子(诸如CAGG启动子)以及它们的任何组合,前提是所述启动子可与宿主细胞相容。调控序列可包括指导核酸的组成型表达的那些,以及组织特异性调控序列和/或诱导型或阻遏型序列。
在一些实施方案中,本公开的编码美容蛋白(例如人胶原蛋白)的多核苷酸可操作地连接于一种或多种异源性启动子。在一些实施方案中,一种或多种异源性启动子是组成型启动子、组织特异性启动子、时间启动子、空间启动子、诱导型启动子和阻遏型启动子中的一者或多者。在一些实施方案中,一种或多种异源性启动子是人巨细胞病毒(HCMV)立即早期启动子、人延伸因子-1(EF1)启动子、人β-肌动蛋白启动子、人UbC启动子、人PGF启动子、合成CAGG启动子以及它们的任何组合中的一者或多者。在一些实施方案中,本公开的编码美容蛋白(例如人胶原蛋白)的多核苷酸可操作地连接于HCMV启动子。
在一些实施方案中,本公开的多核苷酸不包含胶原α-1(VII)链多肽(COL7)(例如编码胶原α-1(VII)链多肽(COL7)的转基因)的编码序列。在一些实施方案中,本公开的多核苷酸不包含赖氨酰基羟化酶3多肽(LH3)(例如编码赖氨酰基羟化酶3多肽(LH3)的转基因)的编码序列。在一些实施方案中,本公开的多核苷酸不包含角蛋白(Keratin)I型细胞骨架17多肽(KRT17)(例如编码角蛋白I型细胞骨架17多肽(KRT17)的转基因)的编码序列。在一些实施方案中,本公开的多核苷酸不包含转谷氨酰胺酶(TGM)多肽(例如人转谷氨酰胺酶多肽,诸如人TGM1多肽)(例如编码转谷氨酰胺酶(TGM)多肽(例如人转谷氨酰胺酶多肽,诸如人TGM1多肽)的转基因)的编码序列。在一些实施方案中,本公开的多核苷酸不包含层粘连蛋白亚单位β-3多肽(LAMB3)(例如编码层粘连蛋白亚单位β-3多肽(LAMB3)的转基因)的编码序列。在一些实施方案中,本公开的多核苷酸不包含胶原α-1(VII)链多肽、赖氨酰基羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的任何嵌合多肽(例如编码胶原α-1(VII)链多肽、赖氨酰基羟化酶3多肽、角蛋白I型细胞骨架17多肽和/或它们的任何嵌合多肽的转基因)的编码序列。在一些实施方案中,本公开的多核苷酸不包含胶原α-1(VII)链多肽、赖氨酰基羟化酶3多肽、角蛋白I型细胞骨架17多肽、转谷氨酰胺酶(TGM)多肽(例如人转谷氨酰胺酶多肽,诸如人TGM1多肽)、层粘连蛋白亚单位β-3(LAMB3)多肽(例如人LamB3多肽)和/或它们的任何嵌合多肽(例如编码胶原α-1(VII)链多肽、赖氨酰基羟化酶3多肽、角蛋白I型细胞骨架17多肽、转谷氨酰胺酶(TGM)多肽(例如人转谷氨酰胺酶多肽,诸如人TGM1多肽)、层粘连蛋白亚单位β-3(LAMB3)多肽(例如人LamB3多肽)和/或它们的任何嵌合多肽的转基因)的编码序列。
美容蛋白
胶原蛋白
在一些实施方案中,本公开涉及一种或多种编码全长胶原蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何胶原蛋白都可由本公开的多核苷酸编码,所述胶原蛋白包括例如人胶原蛋白(参见例如UniProt登录号P02452、P08123、P02461、P02462、P08572、P12109、Q02388、Q9UMD9等)、小鼠胶原蛋白(参见例如UniProt登录号P11087、Q01149、P08121、P02463、P08122、Q04857、Q63870、Q07563等)、黑猩猩胶原蛋白(参见例如UniProt登录号A0A2I3SM98、A0A2J8L483、H2QJ46、K7C8P4、K7C8W0、A0A2J8M8U9、H2QMJ5、H2Q2J4等)、大鼠胶原蛋白(参见例如UniProt登录号P02454、P02466、P13941、P02466、F1M6Q3、D3ZUL3、D3ZE04、D3ZE04等)、兔胶原蛋白(参见例如UniProt登录号G1T4A5、Q28668、G1T8J0、G1U9R7、G1T548、G1T380、G1T548等)等。鉴定来自额外物种的胶原蛋白同源物/直系同源物的方法为本领域普通技术人员所知,包括例如使用氨基酸序列比对程序诸如
Figure BDA0002744714680000671
blastp套件或OrthoDB。在一些实施方案中,本公开的胶原多肽包含与本文描述或本领域中已知的任何胶原多肽的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开涉及一种或多种编码人胶原蛋白的多核苷酸。本领域中已知的任何适合人胶原蛋白都可由本公开的多核苷酸编码,所述人胶原蛋白包括例如胶原α-1(I)链多肽(COL1-1)(参见例如UniProt登录号P02452;SEQ ID NO:15)、胶原α-2(I)链多肽(COL1-2)(参见例如UniProt登录号P08123;SEQ ID NO:16)、胶原α-1(II)链多肽(COL2)(参见例如UniProt登录号P02458)、胶原α-1(III)链多肽(COL3)(参见例如UniProt登录号P2461;SEQ ID NO:17)、胶原α-1(IV)链多肽(COL4-1)(参见例如UniProt登录号P02462;SEQ ID NO:18)、胶原α-2(IV)链多肽(COL4-2)(参见例如UniProt登录号P08572)、胶原α-3(IV)链多肽(COL4-3)(参见例如UniProt登录号Q01955)、胶原α-4(IV)链多肽(COL4-4)(参见例如UniProt登录号P53420)、胶原α-5(IV)链多肽(COL4-5)(参见例如UniProt登录号29400)、胶原α-6(IV)链多肽(COL4-6)(参见例如UniProt登录号Q14031)、胶原α-1(V)链多肽(COL5-1)(参见例如UniProt登录号P20908)、胶原α-2(V)链多肽(COL5-2)(参见例如UniProt登录号P05997)、胶原α-3(V)链多肽(COL5-3)(参见例如UniProt登录号P25940)、胶原α-1(VI)链多肽(COL6-1)(参见例如UniProt登录号P12109;SEQ ID NO:19)、胶原α-2(VI)链多肽(COL6-2)(参见例如UniProt登录号P12110)、胶原α-3(VI)链多肽(COL6-3)(参见例如UniProt登录号P12111)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)(参见例如UniProt登录号A8TX70)、胶原α-6(VI)链多肽(COL6-6)(参见例如UniProt登录号A6NMZ7)、胶原α-1(VII)链多肽(COL7)(参见例如UniProt登录号Q02388;SEQID NO:20)、胶原α-1(VIII)链多肽(COL8)(参见例如UniProt登录号P27658)、胶原α-1(IX)链多肽(COL9-1)(参见例如UniProt登录号P20849)、胶原α-2(IX)链多肽(COL9-2)(参见例如UniProt登录号Q14055)、胶原α-3(IX)链多肽(COL9-3)(参见例如UniProt登录号Q14050)、胶原α-1(X)链多肽(COL10)(参见例如UniProt登录号Q03692)、胶原α-1(XI)链多肽(COL11-1)(参见例如UniProt登录号P12107)、胶原α-2(XI)链多肽(COL11-2)(参见例如UniProt登录号P13942)、胶原α-1(XII)链多肽(COL12)(参见例如UniProt登录号Q99715)、胶原α-1(XIII)链多肽(COL13)(参见例如UniProt登录号Q5TAT6)、胶原α-1(XIV)链多肽(COL14)(参见例如UniProt登录号Q05707)、胶原α-1(XV)链多肽(COL15)(参见例如UniProt登录号P39059)、胶原α-1(XVI)链多肽(COL16)(参见例如UniProt登录号Q07092)、胶原α-1(XVII)链多肽(COL17)(参见例如UniProt登录号Q9UMD9;SEQ ID NO:21)、胶原α-1(XVIII)链多肽(COL18)(参见例如UniProt登录号P39060)、胶原α-1(XIX)链多肽(COL19)(参见例如UniProt登录号Q14993)、胶原α-1(XX)链多肽(COL20)(参见例如UniProt登录号Q9P218)、胶原α-1(XXI)链多肽(COL21)(参见例如UniProt登录号Q96P44)、胶原α-1(XXII)链多肽(COL22)(参见例如UniProt登录号Q8NFW1)、胶原α-1(XXIII)链多肽(COL23)(参见例如UniProt登录号Q86Y22)、胶原α-1(XXIV)链多肽(COL24)(参见例如UniProt登录号Q17RW2)、胶原α-1(XXV)链多肽(COL25)(参见例如UniProt登录号Q9BXS0)、胶原α-1(XXVI)链多肽(COL26)(参见例如UniProt登录号Q96A83)、胶原α-1(XXVII)链多肽(COL27)(参见例如UniProt登录号Q8IZC6)、胶原α-1(XXVIII)链多肽(COL28)(参见例如UniProt登录号Q2UY09)等。在一些实施方案中,本公开的多核苷酸包含与编码本文描述或本领域中已知的任何人胶原多肽的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。鉴定额外人胶原或胶原样多肽同源物/直系同源物的方法为本领域普通技术人员所知,包括例如使用氨基酸序列比对程序诸如
Figure BDA0002744714680000691
blastp套件或OrthoDB。
在一些实施方案中,本公开的多核苷酸编码人COL1-1蛋白。在一些实施方案中,编码COL1-1蛋白的多核苷酸是编码包含与SEQ ID NO:15的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人COL1-1蛋白的多核苷酸是编码包含SEQ ID NO:15的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码COL1-1蛋白的多核苷酸是编码SEQ ID NO:15的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:15的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400但少于1464个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人COL1-2蛋白。在一些实施方案中,编码COL1-2蛋白的多核苷酸是编码包含与SEQ ID NO:16的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人COL1-2蛋白的多核苷酸是编码包含SEQ ID NO:16的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码COL1-2蛋白的多核苷酸是编码SEQ ID NO:16的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:16的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300但少于1366个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人COL3蛋白。在一些实施方案中,编码COL3蛋白的多核苷酸是编码包含与SEQ ID NO:17的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人COL3蛋白的多核苷酸是编码包含SEQID NO:17的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码COL3蛋白的多核苷酸是编码SEQ ID NO:17的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:17的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400但少于1466个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人COL4-1蛋白。在一些实施方案中,编码COL4-1蛋白的多核苷酸是编码包含与SEQ ID NO:18的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人COL4-1蛋白的多核苷酸是编码包含SEQ ID NO:18的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码COL4-1蛋白的多核苷酸是编码SEQ ID NO:18的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:18的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600但少于1669个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人COL6-1蛋白。在一些实施方案中,编码COL6-1蛋白的多核苷酸是编码包含与SEQ ID NO:19的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人COL6-1蛋白的多核苷酸是编码包含SEQ ID NO:19的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码COL6-1蛋白的多核苷酸是编码SEQ ID NO:19的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:19的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000但少于1028个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人COL7蛋白。在一些实施方案中,编码COL7蛋白的多核苷酸是编码包含与SEQ ID NO:20的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人COL7蛋白的多核苷酸是编码包含SEQID NO:20的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码COL7蛋白的多核苷酸是编码SEQ ID NO:20的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:20的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900、至少2000、至少2100、至少2200、至少2300、至少2400、至少2500、至少2600、至少2700、至少2800、至少2900但少于2944个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人COL17蛋白。在一些实施方案中,编码COL17蛋白的多核苷酸是编码包含与SEQ ID NO:21的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人COL17蛋白的多核苷酸是编码包含SEQ ID NO:21的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码COL17蛋白的多核苷酸是编码SEQ ID NO:21的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:21的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400但少于1497个连续氨基酸。
在一些实施方案中,本公开的一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)包含含有与选自SEQ ID NO:15-21的氨基酸序列的至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列。在一些实施方案中,本公开的一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)包含选自SEQ ID NO:15-21的序列。
在一些实施方案中,本公开的一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)包含含有与选自SEQ ID NO:15-17的氨基酸序列的至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列。在一些实施方案中,本公开的一种或多种人胶原蛋白(例如第一人胶原蛋白、另一人胶原蛋白、额外人胶原蛋白和/或第二人胶原蛋白)包含选自SEQ ID NO:15-17的序列。
纤连蛋白
在一些实施方案中,本公开涉及一种或多种编码全长纤连蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何纤连蛋白都可由本公开的多核苷酸编码,所述纤连蛋白包括例如人纤连蛋白(参见例如UniProt登录号P02751)、小鼠纤连蛋白(参见例如UniProt登录号P11276)、黑猩猩纤连蛋白(参见例如UniProt登录号P11276)、大鼠纤连蛋白(参见例如UniProt登录号P04937)、兔纤连蛋白(参见例如UniProt登录号P04937)等。鉴定来自额外物种的纤连蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的纤连蛋白包含与本文描述或本领域中已知的任何纤连蛋白的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开的多核苷酸编码人纤连蛋白。在一些实施方案中,编码人纤连蛋白的多核苷酸是编码包含与SEQ ID NO:53的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人纤连蛋白的多核苷酸是编码包含SEQID NO:53的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码人纤连蛋白的多核苷酸是编码SEQ ID NO:53的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:53的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200、至少1300、至少1400、至少1500、至少1600、至少1700、至少1800、至少1900、至少2000、至少2100、至少2200、至少2300、至少2400但少于2477个连续氨基酸。
弹性蛋白和相关蛋白
细胞外基质中的弹性纤维对组织给与弹性性质。弹性纤维通常含有两种在形态上不同的组分-成熟弹性蛋白纤维和微原纤维,所述微原纤维主要含有原纤蛋白并且与其他蛋白质相关,所述其他蛋白质诸如是微原纤维相关糖蛋白(MAGP)、纤蛋白和弹性蛋白-微原纤维界面定位蛋白(EMILIN)。弹性蛋白和它的可溶性前体原弹性蛋白属于身体的主要结构蛋白。
在一些实施方案中,本公开涉及一种或多种编码弹性蛋白或弹性蛋白相关蛋白的多核苷酸,所述弹性蛋白相关蛋白包括原弹性蛋白、原纤蛋白、微原纤维相关糖蛋白、纤蛋白、或弹性蛋白-微原纤维界面定位蛋白。在一些实施方案中,本公开涉及一种或多种编码全长弹性蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何弹性蛋白都可由本公开的多核苷酸编码,所述弹性蛋白包括例如人弹性蛋白(参见例如UniProt登录号P15502)、小鼠弹性蛋白(参见例如UniProt登录号P15502)、黑猩猩弹性蛋白(参见例如UniProt登录号H2QUQ6)、大鼠弹性蛋白(参见例如UniProt登录号Q99372)等。鉴定来自额外物种的弹性蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的弹性蛋白包含与本文描述或本领域中已知的任何弹性蛋白的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开的多核苷酸编码人弹性蛋白。在一些实施方案中,编码人弹性蛋白的多核苷酸是编码包含与SEQ ID NO:54的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人弹性蛋白的多核苷酸是编码包含SEQID NO:54的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码人弹性蛋白的多核苷酸是编码SEQ ID NO:54的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:54的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700但少于786个连续氨基酸。
光蛋白聚糖蛋白
在一些实施方案中,本公开涉及一种或多种编码全长光蛋白聚糖蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何光蛋白聚糖蛋白都可由本公开的多核苷酸编码,所述光蛋白聚糖蛋白包括例如人光蛋白聚糖蛋白(参见例如UniProt登录号P51884)、小鼠光蛋白聚糖蛋白(参见例如UniProt登录号P51885)、黑猩猩光蛋白聚糖蛋白(参见例如UniProt登录号H2Q6L3)、大鼠光蛋白聚糖蛋白(参见例如UniProt登录号H2Q6L3)、兔光蛋白聚糖蛋白(参见例如UniProt登录号O46379)等。鉴定来自额外物种的光蛋白聚糖蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的光蛋白聚糖蛋白包含与本文描述或本领域中已知的任何光蛋白聚糖蛋白的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开的多核苷酸编码人光蛋白聚糖蛋白。在一些实施方案中,编码人光蛋白聚糖蛋白的多核苷酸是编码包含与SEQ ID NO:55的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人光蛋白聚糖蛋白的多核苷酸是编码包含SEQ ID NO:55的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码人光蛋白聚糖蛋白的多核苷酸是编码SEQ ID NO:55的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:55的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300但少于338个连续氨基酸。
玻连蛋白和玻连蛋白受体蛋白
在一些实施方案中,本公开涉及一种或多种编码全长玻连蛋白或玻连蛋白受体蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何玻连蛋白或玻连蛋白受体蛋白都可由本公开的多核苷酸编码,所述玻连蛋白或玻连蛋白受体蛋白包括例如人玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号P04004和P06756)、小鼠玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号P29788和P43406)、黑猩猩玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号H2QCH3和H2R6C3)、大鼠玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号Q7TQ11)、兔玻连蛋白或玻连蛋白受体蛋白(参见例如UniProt登录号P22458)等。鉴定来自额外物种的玻连蛋白或玻连蛋白受体蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的玻连蛋白或玻连蛋白受体蛋白包含与本文描述或本领域中已知的任何玻连蛋白或玻连蛋白受体蛋白的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开的多核苷酸编码人玻连蛋白。在一些实施方案中,编码人玻连蛋白的多核苷酸是编码包含与SEQ ID NO:56的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人玻连蛋白的多核苷酸是编码包含SEQID NO:56的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码人玻连蛋白的多核苷酸是编码SEQ ID NO:56的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:56的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400但少于478个连续氨基酸。
层粘连蛋白
在一些实施方案中,本公开涉及一种或多种编码全长层粘连蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何层粘连蛋白都可由本公开的多核苷酸编码,所述层粘连蛋白包括例如人层粘连蛋白(参见例如UniProt登录号P25391、P24043、Q16787、Q16363、O15230、P07942、P55268、Q13751、P11047、Q13753和Q9Y6N6)、小鼠层粘连蛋白(参见例如UniProt登录号Q61789、Q61087和Q61092)、黑猩猩层粘连蛋白(参见例如UniProt登录号H2QEC7、H2R041和H2Q0R2)、大鼠层粘连蛋白(参见例如UniProt登录号D3ZN05、F1LPI5和F1LRH4)、兔层粘连蛋白(参见例如UniProt登录号G1SY40和A0A0B5JSH0)等。鉴定来自额外物种的层粘连蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的层粘连蛋白包含与本文描述或本领域中已知的任何层粘连蛋白的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开的多核苷酸编码人层粘连蛋白,诸如人层粘连蛋白亚单位α-1(LamA1)多肽(参见例如UniProt登录号P25391)、人层粘连蛋白亚单位α-2(LamA2)多肽(参见例如UniProt登录号P24043)、人层粘连蛋白亚单位α-3(LamA3)多肽(参见例如UniProt登录号Q16787)、人层粘连蛋白亚单位α-4(LamA4)多肽(参见例如UniProt登录号Q16363)、人层粘连蛋白亚单位α-5(LamA5)多肽(参见例如UniProt登录号O15230)、人层粘连蛋白亚单位β-1(LamB1)多肽(参见例如UniProt登录号P07942)、人层粘连蛋白亚单位β-2(LamB2)多肽(参见例如UniProt登录号P55268)、人层粘连蛋白亚单位β-3(LamB3)多肽(参见例如UniProt登录号Q13751)、人层粘连蛋白亚单位γ-1(LamC1)多肽(参见例如UniProt登录号P11047)、人层粘连蛋白亚单位γ-2(LamC2)多肽(参见例如UniProt登录号Q13753)、人层粘连蛋白亚单位γ-3(LamC3)多肽(参见例如UniProt登录号Q9Y6N6)等。
在一些实施方案中,本公开的多核苷酸编码人LamA3多肽。在一些实施方案中,编码人LamA3多肽的多核苷酸是编码包含与SEQ ID NO:57的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人LamA3多肽的多核苷酸是编码包含SEQ ID NO:57的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码人LamA3多肽的多核苷酸是编码SEQ ID NO:57的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:57的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250、至少2500、至少2750、至少3000、至少3250但少于3333个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人LamB3多肽。在一些实施方案中,编码人LamB3多肽的多核苷酸是编码包含与SEQ ID NO:58的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人LamB3多肽的多核苷酸是编码包含SEQ ID NO:58的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码LamB3多肽的多核苷酸是编码SEQ ID NO:58的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:58的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100但少于1172个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人LamC2多肽。在一些实施方案中,编码人LamC2多肽的多核苷酸是编码包含与SEQ ID NO:59的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人LamC2多肽的多核苷酸是编码包含SEQ ID NO:59的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码LamC2多肽的多核苷酸是编码SEQ ID NO:59的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:59的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100但少于1193个连续氨基酸。
神经调质蛋白
在一些实施方案中,本公开涉及一种或多种编码全长神经调质蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何神经调质蛋白都可由本公开的多核苷酸编码,所述神经调质蛋白包括例如肉毒梭菌蛋白(参见例如UniProt登录号P0DPI0、Q45894、P0DPI1、P10844和B1INP5)等。鉴定来自额外物种的神经调质蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的神经调质蛋白包含与本文描述或本领域中已知的任何神经调质蛋白的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开的多核苷酸编码肉毒梭菌神经调质蛋白。
在一些实施方案中,本公开的多核苷酸编码肉毒梭菌A型神经毒素蛋白。在一些实施方案中,编码肉毒梭菌A型神经毒素蛋白的多核苷酸是编码包含与SEQ ID NO:60的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码肉毒梭菌A型神经毒素蛋白的多核苷酸是编码包含SEQ ID NO:60的氨基酸序列的多肽的多核苷酸。在一些实施方案中,本公开的肉毒梭菌A型神经毒素蛋白在对应于SEQ ID NO:60的位置27的位置处包含丙氨酸至缬氨酸突变。
在一些实施方案中,编码肉毒梭菌A型神经毒素蛋白的多核苷酸是编码SEQ IDNO:60的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:60的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200但少于1296个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码肉毒梭菌B型神经毒素蛋白。在一些实施方案中,编码肉毒梭菌B型神经毒素蛋白的多核苷酸是编码包含与SEQ ID NO:61的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码肉毒梭菌B型神经毒素蛋白的多核苷酸是编码包含SEQ ID NO:61的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码肉毒梭菌B型神经毒素蛋白的多核苷酸是编码SEQ IDNO:61的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:61的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100、至少1200但少于1291个连续氨基酸。
原纤蛋白
在一些实施方案中,本公开涉及一种或多种编码全长原纤蛋白或其任何亚型或部分的多核苷酸。来自本领域中已知的任何适合物种的任何原纤蛋白都可由本公开的多核苷酸编码,所述原纤蛋白包括例如人原纤蛋白(参见例如UniProt登录号P35555、P35556和Q75N90)、小鼠原纤蛋白(参见例如UniProt登录号Q61554和Q61555)、黑猩猩原纤蛋白(参见例如UniProt登录号A0A2I3RTE4和K7CZX0)、大鼠原纤蛋白(参见例如UniProt登录号G3V9M6和F1M5Q4)、兔原纤蛋白(参见例如UniProt登录号G1SKM2、G1SUS5和G1T1H4)等。鉴定来自额外物种的原纤蛋白同源物/直系同源物的方法为本领域普通技术人员所知。在一些实施方案中,本公开的原纤蛋白包含与本文描述或本领域中已知的任何原纤蛋白的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
在一些实施方案中,本公开的多核苷酸编码人原纤蛋白。
在一些实施方案中,本公开的多核苷酸编码人原纤蛋白-1蛋白。在一些实施方案中,编码人原纤蛋白-1蛋白的多核苷酸是编码包含与SEQ ID NO:62的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人原纤蛋白-1蛋白的多核苷酸是编码包含SEQ ID NO:62的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码人原纤蛋白-1蛋白的多核苷酸是编码SEQ ID NO:62的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:62的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250、至少2500、至少2750但少于2871个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人原纤蛋白-2蛋白。在一些实施方案中,编码人原纤蛋白-2蛋白的多核苷酸是编码包含与SEQ ID NO:63的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人原纤蛋白-2蛋白的多核苷酸是编码包含SEQ ID NO:63的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码人原纤蛋白-2蛋白的多核苷酸是编码SEQ ID NO:63的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:63的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250、至少2500、至少2750但少于2912个连续氨基酸。
在一些实施方案中,本公开的多核苷酸编码人原纤蛋白-3蛋白。在一些实施方案中,编码人原纤蛋白-3蛋白的多核苷酸是编码包含与SEQ ID NO:64的序列具有至少75%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽的多核苷酸。在一些实施方案中,编码人原纤蛋白-3蛋白的多核苷酸是编码包含SEQ ID NO:64的氨基酸序列的多肽的多核苷酸。
在一些实施方案中,编码人原纤蛋白-3蛋白的多核苷酸是编码SEQ ID NO:64的氨基酸序列的N末端截短形式、C末端截短形式或片段的多核苷酸。N末端截短形式、C末端截短形式或片段可包含SEQ ID NO:64的至少10、至少12、至少14、至少16、至少18、至少20、至少30、至少40、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少750、至少1000、至少1250、至少1500、至少1750、至少2000、至少2250、至少2500、至少2750但少于2809个连续氨基酸。
示例性美容多肽
在一些实施方案中,本公开的一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)包含含有与选自SEQ ID NO:15-21或53-64的氨基酸序列的至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列。在一些实施方案中,本公开的一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)包含选自SEQ ID NO:15-21或53-64的序列。
在一些实施方案中,本公开的一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)包含含有与选自SEQ ID NO:15-21、53-54或57-59的氨基酸序列的至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的氨基酸序列。在一些实施方案中,本公开的一种或多种美容蛋白(例如第一美容蛋白、另一美容蛋白、额外美容蛋白和/或第二美容蛋白)包含选自SEQ ID NO:15-21、53-54或57-59的序列。
第一多核苷酸
在一些实施方案中,本公开涉及一种包含编码第一多肽的第一多核苷酸的重组核酸,所述第一多肽包含第一美容蛋白。第一美容蛋白可为本文描述或本领域中已知的任何美容蛋白,包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白等。在一些实施方案中,第一美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中,第一美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。
在一些实施方案中,本公开的重组核酸包含第一多核苷酸的一个拷贝。在一些实施方案中,本公开的重组核酸包含第一多核苷酸的两个或更多个(例如两个或更多个、三个或更多个、四个或更多个、五个或更多个、十个或更多个等)拷贝。在一些实施方案中,本公开的重组核酸包含第一多核苷酸的两个拷贝。
在一些实施方案中,第一美容蛋白是第一人胶原蛋白。第一人胶原蛋白可为本文描述或本领域中已知的任何人胶原蛋白。在一些实施方案中,第一人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27或COL28。在一些实施方案中,第一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL1-1。在一些实施方案中,第一人胶原蛋白是COL1-2。在一些实施方案中,第一人胶原蛋白是COL3。在一些实施方案中,第一人胶原蛋白是COL4-1。在一些实施方案中,第一人胶原蛋白是COL4-2。在一些实施方案中,第一人胶原蛋白是COL6-1。在一些实施方案中,第一人胶原蛋白是COL7。在一些实施方案中,第一人胶原蛋白不是COL7。在一些实施方案中,第一人胶原蛋白是COL17。
在一些实施方案中,第一多肽基本上由第一美容蛋白组成。在一些实施方案中,第一多肽由第一美容蛋白组成。在一些实施方案中,第一多肽是第一美容蛋白。
嵌合多肽
在一些实施方案中,第一多肽是包含第一美容蛋白的嵌合多肽。在一些实施方案中,第一多肽是包含第一美容蛋白和另一美容蛋白的嵌合多肽。在一些实施方案中,嵌合多肽包含连接第一美容蛋白和另一美容蛋白的接头多肽。在一些实施方案中,嵌合多肽从n末端至c末端包含第一美容蛋白-接头多肽-另一美容蛋白。第一美容蛋白和/或另一美容蛋白可为本文描述或本领域中已知的任何美容蛋白,包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白等。在一些实施方案中,第一美容蛋白和/或另一美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中,第一美容蛋白和/或另一美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。在一些实施方案中,第一美容蛋白和另一美容蛋白是相同的。在一些实施方案中,第一美容蛋白和另一美容蛋白是不同的。
在一些实施方案中,接头多肽是可裂解接头多肽。可在本公开的嵌合多肽中使用本领域中已知的任何可裂解接头多肽,包括例如T2A接头、P2A接头、E2A接头和F2A接头等。在一些实施方案中,接头多肽是T2A接头多肽。编码T2A接头多肽的一示例性核酸序列以SEQID NO:24提供。T2A接头多肽的一示例性氨基酸序列以SEQ ID NO:28提供。在一些实施方案中,接头多肽是P2A接头多肽。编码P2A接头多肽的一示例性核酸序列以SEQ ID NO:25提供。P2A接头多肽的一示例性氨基酸序列以SEQ ID NO:29提供。在一些实施方案中,接头多肽是E2A接头多肽。编码E2A接头多肽的一示例性核酸序列以SEQ ID NO:26提供。E2A接头多肽的一示例性氨基酸序列以SEQ ID NO:30提供。在一些实施方案中,接头多肽是F2A接头多肽。编码F2A接头多肽的一示例性核酸序列以SEQ ID NO:27提供。F2A接头多肽的一示例性氨基酸序列以SEQ ID NO:31提供。
在一些实施方案中,接头多肽包含与选自SEQ ID NO:28-31的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,接头多肽包含选自SEQ ID NO:28-31的序列。
在一些实施方案中,第一美容蛋白是第一胶原蛋白(例如第一人胶原蛋白),并且另一美容蛋白是另一胶原蛋白(例如另一人胶原蛋白)。编码包含第一人胶原蛋白、接头多肽和另一人胶原蛋白的嵌合多肽的一示例性核酸序列以SEQ ID NO:32提供。
在一些实施方案中,第一美容蛋白是第一人胶原蛋白,并且另一美容蛋白是另一人胶原蛋白。另一人胶原蛋白可为本文描述或本领域中已知的任何人胶原蛋白。在一些实施方案中,另一人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27或COL28。在一些实施方案中,另一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,另一人胶原蛋白是COL1-1。在一些实施方案中,另一人胶原蛋白是COL1-2。在一些实施方案中,另一人胶原蛋白是COL3。在一些实施方案中,另一人胶原蛋白是COL4-1。在一些实施方案中,另一人胶原蛋白是COL4-2。在一些实施方案中,另一人胶原蛋白是COL6-1。在一些实施方案中,另一人胶原蛋白是COL7。在一些实施方案中,另一人胶原蛋白不是COL7。在一些实施方案中,另一人胶原蛋白是COL17。在一些实施方案中,第一人胶原蛋白和另一人胶原蛋白是相同的。在一些实施方案中,第一人胶原蛋白和另一人胶原蛋白是不同的。
在一些实施方案中,第一人胶原蛋白是COL1-1,并且另一人胶原蛋白选自COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL1-1,并且另一人胶原蛋白是COL1-2。在一些实施方案中,第一人胶原蛋白是COL1-1,并且另一人胶原蛋白是COL3。
在一些实施方案中,第一人胶原蛋白是COL1-2,并且另一人胶原蛋白是COL1-1、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL1-2,并且另一人胶原蛋白是COL1-1。
在一些实施方案中,第一人胶原蛋白是COL3,并且另一人胶原蛋白选自COL1-1、COL1-2、COL4-1、COL4-2、COL6-1、COL7或COL17。
在一些实施方案中,第一人胶原蛋白是COL4-1,并且另一人胶原蛋白是COL1-1、COL1-2、COL3、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL4-1,并且另一人胶原蛋白是COL4-2。
在一些实施方案中,第一人胶原蛋白是COL6-1,并且另一人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL7或COL17。
在一些实施方案中,第一人胶原蛋白是COL7,并且另一人胶原蛋白是COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL17。
在一些实施方案中,第一人胶原蛋白是COL17,并且另一人胶原蛋白是COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL7。
在一些实施方案中,第一美容蛋白是第一层粘连蛋白(例如第一人层粘连蛋白),并且另一美容蛋白是另一层粘连蛋白(例如另一人层粘连蛋白)。在一些实施方案中,第一美容蛋白是第一人层粘连蛋白,并且另一美容蛋白是另一人层粘连蛋白。另一人层粘连蛋白可为本文描述或本领域中已知的任何人层粘连蛋白。在一些实施方案中,第一人层粘连蛋白是人LamA3多肽,并且另一人层粘连蛋白是人LamB3多肽。在一些实施方案中,第一人层粘连蛋白是人LamA3多肽,并且另一人层粘连蛋白是人LamC2多肽。在一些实施方案中,第一人层粘连蛋白是人LamB3多肽,并且另一人层粘连蛋白是人LamC2多肽。
在一些实施方案中,第一多核苷酸编码单顺反子mRNA。在一些实施方案中,单顺反子mRNA包含编码第一多肽的开放阅读框(ORF)。
在一些实施方案中,第一多核苷酸编码多顺反子mRNA。在一些实施方案中,多顺反子mRNA包含编码第一多肽的开放阅读框(ORF)。
多顺反子mRNA
在一些实施方案中,第一多核苷酸编码多顺反子mRNA。在一些实施方案中,多顺反子mRNA包含编码第一多肽的开放阅读框(ORF)。在一些实施方案中,第一多核苷酸编码多顺反子mRNA,所述多顺反子mRNA包含:1)编码第一多肽的第一开放阅读框(ORF),和2)编码额外美容蛋白的第二开放阅读框(ORF)。在一些实施方案中,多顺反子mRNA还包含分隔第一ORF和第二ORF的内部核糖体进入位点(IRES)。在一些实施方案中,多顺反子mRNA从5’至3’包含编码第一多肽的第一ORF-IRES-编码额外美容蛋白的第二ORF。第一多肽可为本文所述的任何第一多肽。额外美容蛋白可为本文描述或本领域中已知的任何美容蛋白,包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白等。在一些实施方案中,额外美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中,额外美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。
可在本公开的多顺反子mRNA中使用本领域中已知的任何适合IRES,包括例如病毒源性IRES(例如源于脊髓灰质炎病毒、鼻病毒、脑心肌炎病毒(EMCV)、口蹄疫病毒、丙型肝炎病毒、经典猪瘟病毒、劳斯肉瘤病毒(rous sarcoma virus)、人免疫缺陷病毒、蟋蟀麻痹病毒、卡波西氏肉瘤相关疱疹病毒等的IRES)、细胞mRNA源性IRES(例如源于生长因子mRNA诸如纤维母细胞生长因子2、血小板源性生长因子B和血管内皮生长因子的IRES;源于转录因子mRNA诸如触角足蛋白、超级双胸蛋白(ultrabithorax)和NF-κB阻遏因子的IRES;源于致癌基因mRNA诸如c-myc、pim-1和蛋白质激酶p58PITSLRE等的IRES)、合成IRES(例如CP148IRES)以及其他IRES(参见例如Mokrejs等(2007)A Bioinformatical Approach to theAnalysis of Viral and Cellular Internal Ribosome Entry Sites.Columbus F编.NewMessenger RNA Research Communications.Hauppauge,NY:Nova Science Publishers;第133-166页)。在一些实施方案中,IRES是CP148 IRES。编码CP148IRES的一示例性核酸序列以SEQ ID NO:22提供。在一些实施方案中,IRES是EMCV IRES。编码EMCV IRES的一示例性核酸序列以SEQ ID NO:23提供。
在一些实施方案中,编码IRES的核酸序列包括与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。在一些实施方案中,编码IRES的核酸序列包括SEQ ID NO:22或SEQ ID NO:23的序列。
在一些实施方案中,第一多肽是第一胶原蛋白(例如第一人胶原蛋白),并且额外美容蛋白是额外胶原蛋白(例如额外人胶原蛋白)。编码包含第一ORF、IRES和第二ORF的多顺反子mRNA的一示例性核酸以SEQ ID NO:33或SEQ ID NO:34提供。额外人胶原蛋白可为本文所述的任何人胶原蛋白。在一些实施方案中,额外人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27或COL28。在一些实施方案中,额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,额外人胶原蛋白是COL1-1。在一些实施方案中,额外人胶原蛋白是COL1-2。在一些实施方案中,额外人胶原蛋白是COL3。在一些实施方案中,额外人胶原蛋白是COL4-1。在一些实施方案中,额外人胶原蛋白是COL4-2。在一些实施方案中,额外人胶原蛋白是COL6-1。在一些实施方案中,额外人胶原蛋白是COL7。在一些实施方案中,额外人胶原蛋白不是COL7。在一些实施方案中,额外人胶原蛋白是COL17。在一些实施方案中,第一人胶原蛋白和额外人胶原蛋白是相同的。在一些实施方案中,第一人胶原蛋白和额外人胶原蛋白是不同的。
在一些实施方案中,第一人胶原蛋白是COL1-1,并且额外人胶原蛋白选自COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL1-1,并且额外人胶原蛋白是COL1-2。在一些实施方案中,第一人胶原蛋白是COL1-1,并且额外人胶原蛋白是COL3。
在一些实施方案中,第一人胶原蛋白是COL1-2,并且额外人胶原蛋白选自COL1-1、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL1-2,并且额外人胶原蛋白是COL1-1。
在一些实施方案中,第一人胶原蛋白是COL3,并且额外人胶原蛋白选自COL1-1、COL1-2、COL4-1、COL4-2、COL6-1、COL7或COL17。
在一些实施方案中,第一人胶原蛋白是COL4-1,并且额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL4-1,并且额外人胶原蛋白是COL4-2。
在一些实施方案中,第一人胶原蛋白是COL6-1,并且额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL7或COL17。
在一些实施方案中,第一人胶原蛋白是COL7,并且额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL17。
在一些实施方案中,第一人胶原蛋白是COL17,并且额外人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL7。
在一些实施方案中,第一多肽是第一胶原蛋白(例如第一人胶原蛋白),并且额外美容蛋白是额外胶原蛋白(例如额外人胶原蛋白)。
在一些实施方案中,第一多肽是第一层粘连蛋白(例如第一人层粘连蛋白),并且额外美容蛋白是额外层粘连蛋白(例如额外人层粘连蛋白)。在一些实施方案中,第一多肽是第一人层粘连蛋白,并且额外美容蛋白是额外人层粘连蛋白。额外人层粘连蛋白可为本文描述或本领域中已知的任何人层粘连蛋白。在一些实施方案中,第一人层粘连蛋白是人LamA3多肽,并且额外人层粘连蛋白是人LamB3多肽。在一些实施方案中,第一人层粘连蛋白是人LamA3多肽,并且额外人层粘连蛋白是人LamC2多肽。在一些实施方案中,第一人层粘连蛋白是人LamB3多肽,并且额外人层粘连蛋白是人LamC2多肽。
第二多核苷酸
在一些实施方案中,本公开涉及一种还包含编码第二美容蛋白的第二多核苷酸的重组核酸。第二美容蛋白可为本文描述或本领域中已知的任何美容蛋白,包括例如胶原蛋白、纤连蛋白、弹性蛋白、光蛋白聚糖、玻连蛋白/玻连蛋白受体、层粘连蛋白、神经调质、原纤蛋白等。在一些实施方案中,第二美容蛋白是结构性细胞外基质蛋白(例如胶原、弹性蛋白、纤连蛋白、层粘连蛋白、原纤蛋白等)。在一些实施方案中,第二美容蛋白是胶原、弹性蛋白、纤连蛋白或层粘连蛋白(例如人胶原、弹性蛋白、纤连蛋白或层粘连蛋白)。在一些实施方案中,第一美容蛋白和第二美容蛋白是相同的。在一些实施方案中,第一美容蛋白和第二美容蛋白是不同的。在一些实施方案中,重组核酸包含第二多核苷酸的一个拷贝。在一些实施方案中,重组核酸包含第二多核苷酸的两个或更多个(例如两个或更多个、三个或更多个、四个或更多个、五个或更多个、十个或更多个等)拷贝。在一些实施方案中,重组核酸包含第二多核苷酸的两个拷贝。
在一些实施方案中,第二美容蛋白是胶原蛋白。在一些实施方案中,第二美容蛋白是第二人胶原蛋白。第二人胶原蛋白可为本文所述的任何人胶原蛋白。在一些实施方案中,第二人胶原蛋白选自COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27或COL28。在一些实施方案中,第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7或COL17。在一些实施方案中,第二人胶原蛋白是COL1-1。在一些实施方案中,第二人胶原蛋白是COL1-2。在一些实施方案中,第二人胶原蛋白是COL3。在一些实施方案中,第二人胶原蛋白是COL4-1。在一些实施方案中,第二人胶原蛋白是COL4-2。在一些实施方案中,第二人胶原蛋白是COL6-1。在一些实施方案中,第二人胶原蛋白是COL7。在一些实施方案中,第二人胶原蛋白不是COL7。在一些实施方案中,第二人胶原蛋白是COL17。
在一些实施方案中,第一多核苷酸编码第一胶原蛋白,并且第二多核苷酸编码第二胶原蛋白。在一些实施方案中,第一多核苷酸编码第一人胶原蛋白,并且第二多核苷酸编码第二人胶原蛋白。在一些实施方案中,第一人胶原蛋白(由第一多核苷酸编码)和第二人胶原蛋白(由第二多核苷酸编码)是相同的。在一些实施方案中,第一人胶原蛋白(由第一多核苷酸编码)和第二人胶原蛋白(由第二多核苷酸编码)是不同的。
在一些实施方案中,第一人胶原蛋白是COL1-1,并且第二人胶原蛋白选自COL1-2、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL1-1,并且第二人胶原蛋白是COL1-2。在一些实施方案中,第一人胶原蛋白是COL1-1,并且第二人胶原蛋白是COL3。
在一些实施方案中,第一人胶原蛋白是COL1-2,并且第二人胶原蛋白选自COL1-1、COL3、COL4-1、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL1-2,并且第二人胶原蛋白是COL1-1。
在一些实施方案中,第一人胶原蛋白是COL3,并且第二人胶原蛋白选自COL1-1、COL1-2、COL4-1、COL4-2、COL6-1、COL7或COL17。
在一些实施方案中,第一人胶原蛋白是COL4-1,并且第二人胶原蛋白选自COL1-2、COL1-2、COL3、COL4-2、COL6-1、COL7或COL17。在一些实施方案中,第一人胶原蛋白是COL4-1,并且第二人胶原蛋白是COL4-2。
在一些实施方案中,第一人胶原蛋白是COL6-1,并且第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL7或COL17。
在一些实施方案中,第一人胶原蛋白是COL7,并且第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL17。
在一些实施方案中,第一人胶原蛋白是COL17,并且第二人胶原蛋白选自COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1或COL7。
在一些实施方案中,第一多核苷酸编码第一层粘连蛋白(例如第一人层粘连蛋白),并且第二多核苷酸编码第二层粘连蛋白(例如第二人层粘连蛋白)。在一些实施方案中,第一多核苷酸编码第一人层粘连蛋白多肽,并且第二多核苷酸编码第二人层粘连蛋白。第二人层粘连蛋白可为本文描述或本领域中已知的任何人层粘连蛋白。在一些实施方案中,第一人层粘连蛋白是人LamA3多肽,并且第二人层粘连蛋白是人LamB3多肽。在一些实施方案中,第一人层粘连蛋白是人LamA3多肽,并且第二人层粘连蛋白是人LamC2多肽。在一些实施方案中,第一人层粘连蛋白是人LamB3多肽,并且第二人层粘连蛋白是人LamC2多肽。
重组核酸
在一些实施方案中,本公开涉及包含本文所述的多核苷酸中的任何一者或多者的重组核酸。在一些实施方案中,重组核酸包含第一多核苷酸的一个拷贝。在一些实施方案中,重组核酸包含第一多核苷酸的两个拷贝。在一些实施方案中,重组核酸包含第一多核苷酸的一个拷贝和第二多核苷酸的一个拷贝。在一些实施方案中,重组核酸包含第一多核苷酸的一个拷贝和第二多核苷酸的两个拷贝。在一些实施方案中,重组核酸包含第一多核苷酸的两个拷贝和第二多核苷酸的一个拷贝。在一些实施方案中,重组核酸包含第一多核苷酸的两个拷贝和第二多核苷酸的两个拷贝。
在一些实施方案中,重组核酸是载体(例如表达载体、展示载体等)。在一些实施方案中,载体是DNA载体或RNA载体。通常,可使用适于在受试者中维持、繁殖和/或表达多核苷酸以产生一种或多种多肽的载体。适合载体的实例可包括例如质粒、粘粒、游离体、转座子和病毒载体(例如腺病毒载体、腺相关病毒载体、痘苗病毒载体、辛德毕斯(Sindbis)病毒载体、麻疹载体、疱疹病毒载体、慢病毒载体、逆转录病毒载体等)。在一些实施方案中,载体是疱疹病毒载体。在一些实施方案中,载体能够在宿主细胞中自主复制。在一些实施方案中,载体不能在宿主细胞中自主复制。在一些实施方案中,载体可整合至宿主DNA中。在一些实施方案中,载体不能整合至宿主DNA中(例如是游离型的)。制备含有一种或多种目标多核苷酸的载体的方法为本领域普通技术人员所熟知,包括例如通过化学合成,或通过人工操控核酸的经分离区段(例如通过遗传工程化技术)。
在一些实施方案中,本公开的重组核酸是单纯疱疹病毒(HSV)扩增子。疱疹病毒扩增子,包括结构特征和制备所述疱疹病毒扩增子的方法,通常为本领域普通技术人员所知(参见例如de Silva S.和Bowers W.“Herpes Virus Amplicon Vectors”.Viruses 2009,1,594-629)。在一些实施方案中,单纯疱疹病毒扩增子是HSV-1扩增子。在一些实施方案中,单纯疱疹病毒扩增子是HSV-1杂合扩增子。HSV-1杂合扩增子的实例可包括但不限于HSV/AAV杂合扩增子、HSV/EBV杂合扩增子、HSV/EBV/RV杂合扩增子、和/或HSV/睡美人杂合扩增子。在一些实施方案中,扩增子是HSV/AAV杂合扩增子。在一些实施方案中,扩增子是HSV/睡美人杂合扩增子。
在一些实施方案中,本公开的重组核酸是重组疱疹病毒基因组。重组疱疹病毒基因组可为来自本领域中已知的DNA病毒的疱疹病毒科的任何成员的重组基因组,包括例如重组单纯疱疹病毒基因组、重组水痘带状疱疹病毒基因组、重组人巨细胞病毒基因组、重组疱疹病毒6A基因组、重组疱疹病毒6B基因组、重组疱疹病毒7基因组、重组卡波西氏肉瘤相关疱疹病毒基因组、以及它们的任何组合或任何衍生物。在一些实施方案中,重组疱疹病毒基因组包含一个或多个(例如一个或多个、两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个、十个或更多个等)失活性突变。在一些实施方案中,一个或多个失活性突变在一种或多种(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种、十种或更多种等)疱疹病毒基因中。在一些实施方案中,重组疱疹病毒基因组是减毒的(例如相较于相应野生型疱疹病毒基因组)。在一些实施方案中,重组疱疹病毒基因组是有复制能力的。在一些实施方案中,重组疱疹病毒基因组是复制缺陷性的。
在一些实施方案中,重组核酸是重组单纯疱疹病毒(HSV)基因组。在一些实施方案中,重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组、重组2型单纯疱疹病毒(HSV-2)基因组或它们的任何衍生物。在一些实施方案中,重组单纯疱疹病毒基因组是重组HSV-1基因组。在一些实施方案中,重组单纯疱疹病毒基因组是有复制能力的。在一些实施方案中,重组单纯疱疹病毒基因组是复制缺陷性的。在一些实施方案中,重组单纯疱疹病毒基因组包含一个或多个(例如一个或多个、两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个、十个或更多个等)失活性突变。在一些实施方案中,一个或多个失活性突变在一种或多种(例如一种或多种、两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种、八种或更多种、九种或更多种、十种或更多种等)单纯疱疹病毒基因中。如本文所用,“失活性突变”可指导致基因或调节子产物(RNA或蛋白质)具有降低、不可检测或消除的数量和/或功能(例如相较于缺乏失活性突变的相应序列)的任何突变。失活性突变的实例可包括但不限于在给定基因或调节子的转录控制序列(启动子、增强子、绝缘子等)和/或编码序列中的缺失、插入、点突变和重排。可使用本领域中已知的测量基因或调节子产物的数量的任何适合方法,包括例如qPCR、Northern印迹、RNA测序、蛋白质印迹、ELISA等。
在一些实施方案中,重组单纯疱疹病毒基因组在感染细胞蛋白(或感染细胞多肽)(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和/或UL55单纯疱疹病毒基因中的至少一者、至少两者、至少三者、至少四者、至少五者、至少六者、至少七者或全部八者中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP34.5和/或ICP47单纯疱疹病毒基因中不包含失活性突变(例如以避免产生免疫刺激性病毒)。在一些实施方案中,重组单纯疱疹病毒基因组在ICP34.5单纯疱疹病毒基因(一个或两个拷贝)中不包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP47单纯疱疹病毒基因中不包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP34.5(一个或两个拷贝)和ICP47单纯疱疹病毒基因中不包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组不是溶瘤性的。
在一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变,并且还在ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47、UL41和/或UL55基因中包含引发性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变,并且在ICP4基因(一个或两个拷贝)中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变,并且在ICP22基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变,并且在UL41基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变,在ICP4基因(一个或两个拷贝)中包含失活性突变,并且在ICP22基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变,在ICP4基因(一个或两个拷贝)中包含失活性突变,并且在UL41基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变,在ICP22基因中包含失活性突变,并且在UL41基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0基因(一个或两个拷贝)中包含失活性突变,在ICP4基因(一个或两个拷贝)中包含失活性突变,在ICP22基因中包含失活性突变,并且在UL41基因中包含失活性突变。在一些实施方案中,失活性突变是ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22和/或UL41基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还在ICP27、ICP47和/或UL55基因中包含失活性突变。
在一些实施方案中,重组单纯疱疹病毒基因组在ICP4基因(一个或两个拷贝)中包含失活性突变。在一些实施方案中,重组复合疱疹(herpes complex)病毒基因组在ICP4(一个或两个拷贝)中包含失活性突变,并且还在ICP0(一个或两个拷贝)、ICP22、ICP27、ICP47、UL41和/或UL55基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4基因(一个或两个拷贝)中包含失活性突变,并且在ICP22基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4基因(一个或两个拷贝)中包含失活性突变,并且在UL41基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4基因(一个或两个拷贝)中包含失活性突变,在ICP22基因中包含失活性突变,并且在UL41基因中包含失活性突变。在一些实施方案中,失活性突变是ICP4(一个或两个拷贝)、ICP22和/或UL41基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还在ICP0、ICP27、ICP47和/或UL55基因中包含失活性突变。
在一些实施方案中,重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变,并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP27、ICP47、UL41和/或UL55基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP22基因中包含失活性突变,并且在UL41基因中包含失活性突变。在一些实施方案中,失活性突变是ICP22和/或UL41基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP27、ICP47和/或UL55基因中包含失活性突变。
在一些实施方案中,重组单纯疱疹病毒基因组在ICP27基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP27基因中包含失活性突变,并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP47、UL41和/或UL55基因中包含失活性突变。在一些实施方案中,失活性突变是ICP27基因的编码序列的缺失。
在一些实施方案中,重组单纯疱疹病毒基因组在ICP47基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP47基因中包含失活性突变,并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27、UL41和/或UL55基因中包含失活性突变。在一些实施方案中,失活性突变是ICP47基因的编码序列的缺失。
在一些实施方案中,重组单纯疱疹病毒基因组在UL41基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在UL41基因中包含失活性突变,并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47和/或UL55基因中包含失活性突变。在一些实施方案中,失活性突变是UL41基因的编码序列的缺失。
在一些实施方案中,重组单纯疱疹病毒基因组在UL55基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在UL55基因中包含失活性突变,并且还在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47和/或UL41基因中包含失活性突变。在一些实施方案中,失活性突变是UL55基因的编码序列的缺失。
在一些实施方案中,重组单纯疱疹病毒基因组在包含内部重复长(IRL)区域和内部重复短(IRS)区域的内部重复(接合)区域中包含失活性突变(例如所述内部重复(接合)区域的缺失)。在一些实施方案中,接合区域的失活(例如缺失)消除ICP4基因和ICP0基因各自一个拷贝。在一些实施方案中,接合区域的失活(例如缺失)进一步使ICP22和ICP47基因的启动子失活(例如缺失)。如果需要,那么这些基因中的一者或两者的表达可通过将立即早期启动子插入重组单纯疱疹病毒基因组中来恢复(参见例如Hill等(1995).Nature 375(6530):411-415;Goldsmith等(1998).J Exp Med 187(3):341-348)。在不希望受理论束缚下,据信使接合区域失活(例如缺失)可促进重组单纯疱疹病毒基因组的稳定性和/或允许重组单纯疱疹病毒基因组容纳更多和/或更大转基因。
在一些实施方案中,重组单纯疱疹病毒基因组在ICP4(一个或两个拷贝)、ICP22和ICP27基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4(一个或两个拷贝)、ICP27和UL55基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47和UL55基因中包含失活性突变。在一些实施方案中,ICP4(一个或两个拷贝)、ICP27和/或UL55基因中的失活性突变是ICP4(一个或两个拷贝)、ICP27和/或UL55基因的编码序列的缺失。在一些实施方案中,ICP22和ICP47基因中的失活性突变是ICP22和ICP47基因的启动子区域中的缺失(例如ICP22和ICP47编码序列是完整的,但不具有转录活性)。在一些实施方案中,重组单纯疱疹病毒基因组在ICP4(一个或两个拷贝)、ICP27和UL55基因的编码序列中包含缺失,并且在ICP22和ICP47基因的启动子区域中包含缺失。在一些实施方案中,重组单纯疱疹病毒基因组还在ICP0和/或UL41基因中包含失活性突变。
在一些实施方案中,重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)和ICP4(一个或两个拷贝)基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)和ICP22基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22和ICP27基因中包含失活性突变。在一些实施方案中,重组单纯疱疹病毒基因组在ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27和UL55基因中包含失活性突变。在一些实施方案中,ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27和/或UL55基因中的失活性突变包括ICP0、ICP4(一个或两个拷贝)、ICP22、ICP27和/或UL55基因的编码序列的缺失。在一些实施方案中,重组单纯疱疹病毒基因组还在ICP47和/或UL41基因中包含失活性突变。
在一些实施方案中,重组单纯疱疹病毒基因组在一个、两个、三个、四个、五个、六个、七个或更多个病毒基因座内包含本公开的一种或多种多核苷酸。适合病毒基因座的实例可包括不限于ICP0(一个或两个拷贝)、ICP4(一个或两个拷贝)、ICP22、ICP27、ICP47、tk、UL41和UL55单纯疱疹病毒基因座。在一些实施方案中,重组单纯疱疹病毒基因组在病毒ICP4基因座中的一个或两个内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP4基因座中的一个或两个中携带编码第一人胶原蛋白的第一多核苷酸;重组病毒在ICP4基因座中的一个或两个中携带编码第二人胶原蛋白的第二多核苷酸;等)。在一些实施方案中,重组单纯疱疹病毒基因组在病毒ICP22基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP22基因座中携带编码第一人胶原蛋白的第一多核苷酸;重组病毒在ICP22基因座中携带编码第二人胶原蛋白的第二多核苷酸;等)。在一些实施方案中,重组单纯疱疹病毒基因组在病毒UL41基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在UL41基因座中携带编码第一人胶原蛋白的第一多核苷酸;重组病毒在UL41基因座中携带编码第二人胶原蛋白的第二多核苷酸;等)。在一些实施方案中,重组单纯疱疹病毒基因组在病毒ICP4基因座中的一个或两个内包含本公开的一种或多种多核苷酸,并且在病毒ICP22基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP4基因座中的一个或两个中携带编码第一人胶原蛋白的第一多核苷酸,并且在ICP22基因座中携带编码第二人胶原蛋白的第二多核苷酸;重组病毒在ICP4基因座中的一个或两个中携带编码第二人胶原蛋白的第二多核苷酸,并且在ICP22基因座中携带编码第一人胶原蛋白的第一多核苷酸;等)。在一些实施方案中,重组单纯疱疹病毒基因组在病毒ICP4基因座中的一个或两个内包含本公开的一种或多种多核苷酸,并且在病毒UL41基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP4基因座中的一个或两个中携带编码第一人胶原蛋白的第一多核苷酸,并且在UL41基因座中携带编码第二人胶原蛋白的第二多核苷酸;重组病毒在ICP4基因座中的一个或两个中携带编码第二人胶原蛋白的第二多核苷酸,并且在UL41基因座中携带编码第一人胶原蛋白的第一多核苷酸;等)。在一些实施方案中,重组单纯疱疹病毒基因组在病毒ICP4基因座中的一个或两个内包含本公开的一种或多种多核苷酸,在病毒ICP22基因座内包含本公开的一种或多种多核苷酸,并且在病毒UL41基因座内包含本公开的一种或多种多核苷酸(例如重组病毒在ICP4基因座中的一个或两个中携带编码第一人胶原蛋白的第一多核苷酸,并且在ICP22和UL41基因座中携带编码第二人胶原蛋白的第二多核苷酸;重组病毒在ICP4基因座中的一个或两个中携带编码第二人胶原蛋白的第二多核苷酸,并且在ICP22和UL41基因座中携带编码第一人胶原蛋白的第一多核苷酸;等)。
在一些实施方案中,重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)已被工程化来使一种或多种毒性单纯疱疹基因(诸如HSV ICP0基因的一个或两个拷贝、HSV ICP4基因的一个或两个拷贝、ICP22基因和/或UL41基因)的表达降低或消除。在一些实施方案中,相较于相应野生型疱疹病毒基因组(例如野生型单纯疱疹病毒基因组),重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)已被工程化来使重组基因组(例如当引入靶标细胞中时)的细胞毒性降低。在一些实施方案中,相较于相应野生型疱疹病毒基因组,重组病毒基因组(例如重组单纯疱疹病毒基因组)的细胞毒性(例如在人角质化细胞和/或纤维母细胞中)降低至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或至少约99%(例如测量重组ΔICP4(一个或两个拷贝)单纯疱疹病毒基因组相对于野生型单纯疱疹病毒基因组的在人角质化细胞或纤维母细胞(原代细胞或细胞系)中的相对细胞毒性;测量重组ΔICP4(一个或两个拷贝)/ΔICP22单纯疱疹病毒基因组相对于野生型单纯疱疹病毒基因组的在人角质化细胞或纤维母细胞(原代细胞或细胞系)中的相对细胞毒性;等)。在一些实施方案中,相较于相应野生型疱疹病毒基因组,重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)的细胞毒性(例如在人角质化细胞和/或纤维母细胞中)降低至至少约1/1.5、至少约1/2、至少约1/3、至少约1/4、至少约1/5、至少约1/6、至少约1/7、至少约1/8、至少约1/9、至少约1/10、至少约1/15、至少约1/20、至少约1/25、至少约1/50、至少约1/75、至少约1/100、至少约1/250、至少约1/500、至少约1/750、至少约1/1000,或降低更多(例如测量重组ΔICP4(一个或两个拷贝)单纯疱疹病毒基因组相对于野生型单纯疱疹病毒基因组的在人角质化细胞或纤维母细胞(原代细胞或细胞系)中的相对细胞毒性;测量重组ΔICP4(一个或两个拷贝)/ΔICP22单纯疱疹病毒基因组相对于野生型单纯疱疹病毒基因组的在人角质化细胞或纤维母细胞(原代细胞或细胞系)中的相对细胞毒性;等)。测量细胞毒性的方法为本领域普通技术人员所知,包括例如通过使用活体染料(甲臜染料)、蛋白酶生物标志物、MTT测定(或使用相关四唑嗡盐诸如XTT、MTS、水溶性四唑嗡盐等的测定),测量ATP含量等。
在一些实施方案中,相较于相应野生型疱疹病毒基因组(例如野生型单纯疱疹病毒基因组),重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)已被工程化来使在靶标细胞暴露于重组基因组之后,重组疱疹病毒基因组对宿主细胞增殖的影响降低。在一些实施方案中,靶标细胞是人细胞。在一些实施方案中,靶标细胞是表皮和/或真皮的细胞。在一些实施方案中,靶标细胞是角质化细胞和/或纤维母细胞。在一些实施方案中,相较于在暴露于相应野生型疱疹病毒基因组之后的宿主细胞增殖,在暴露于重组基因组之后的宿主细胞增殖(例如人角质化细胞和/或纤维母细胞)加快至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或至少约99%(例如在人角质化细胞或纤维母细胞(原代细胞或细胞系)的情况下,相对于在暴露于野生型单纯疱疹病毒基因组之后的细胞增殖,测量在暴露于重组ΔICP4(一个或两个拷贝)单纯疱疹病毒基因组之后的相对细胞增殖;在人角质化细胞或纤维母细胞(原代细胞或细胞系)的情况下,相对于在暴露于野生型单纯疱疹病毒基因组之后的细胞增殖,测量在暴露于重组ΔICP4(一个或两个拷贝)/ΔICP22单纯疱疹病毒基因组之后的相对细胞增殖;等)。在一些实施方案中,相较于在暴露于相应野生型疱疹病毒基因组之后的宿主细胞增殖,在暴露于重组基因组之后的宿主细胞增殖(例如人角质化细胞和/或纤维母细胞)加快至至少约1.5倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约50倍、至少约75倍、至少约100倍、至少约250倍、至少约500倍、至少约750倍或至少约1000倍(例如在人角质化细胞或纤维母细胞(原代细胞或细胞系)的情况下,相对于在暴露于野生型单纯疱疹病毒基因组之后的细胞增殖,测量在暴露于重组ΔICP4(一个或两个拷贝)单纯疱疹病毒基因组之后的相对细胞增殖;在人角质化细胞或纤维母细胞(原代细胞或细胞系)的情况下,相对于在暴露于野生型单纯疱疹病毒基因组之后的细胞增殖,测量在暴露于重组ΔICP4(一个或两个拷贝)/ΔICP22单纯疱疹病毒基因组之后的相对细胞增殖;等)。测量细胞增殖的方法为本领域普通技术人员所知,包括例如通过使用Ki67细胞增殖测定、BrdU细胞增殖测定等。
载体(例如疱疹病毒载体)可包括本公开的一种或多种呈适于在宿主细胞中表达多核苷酸的形式的多核苷酸。载体可包括一种或多种操作性地连接于待表达的多核苷酸的调控序列(例如如上所述)。
在一些实施方案中,本公开的重组核酸(例如重组单纯疱疹病毒基因组)包含本文所述的多核苷酸中的一者或多者,所述一者或多者以任何定向插入所述重组核酸中。如果重组核酸包含本文所述的两种或更多种多核苷酸(例如两种或更多种、三种或更多种等),那么多核苷酸可以彼此相同定向或相反定向加以插入。在不希望受理论束缚下,以反义定向将两种多核苷酸(例如两种转基因)并入重组核酸(例如载体)中可有助于避免通读,并且确保每种多核苷酸的适当表达。
IV.病毒
本公开的某些方面涉及包含本文所述的多核苷酸和/或重组核酸中的任一者的病毒。在一些实施方案中,病毒能够感染受试者(例如人)的一种或多种靶标细胞。在一些实施方案中,病毒适于将多核苷酸和/或重组核酸递送至受试者(例如人受试者)的一种或多种靶标细胞中。在一些实施方案中,一种或多种靶标细胞是一种或多种人细胞。在一些实施方案中,一种或多种靶标细胞是皮肤的一种或多种细胞(例如表皮、真皮和/或皮下组织的一种或多种细胞)。在一些实施方案中,一种或多种细胞选自角质化细胞、黑素细胞、朗格汉斯细胞(Langerhans cell)、梅克尔细胞(Merkel cell)、肥大细胞、纤维母细胞和/或脂肪细胞。在一些实施方案中,一种或多种细胞是角质化细胞。在一些实施方案中,一种或多种细胞存在于角质层、颗粒层、棘层、基底层和/或基底膜中。在一些实施方案中,一种或多种靶标细胞是一种或多种表皮细胞。
可使用本领域中已知的任何适合病毒,包括例如腺病毒、腺相关病毒、逆转录病毒、慢病毒、仙台病毒、疱疹病毒(例如单纯疱疹病毒)、痘苗病毒和/或它们的任何杂合病毒。在一些实施方案中,病毒是减毒的。在一些实施方案中,病毒是复制缺陷性的。在一些实施方案中,病毒是有复制能力的。在一些实施方案中,相对于未修饰野生型病毒的组织趋性,病毒已被修饰来改变它的组织趋性。在一些实施方案中,相较于相应野生型病毒,病毒具有降低的细胞毒性。用于产生包含重组核酸的病毒的方法为本领域普通技术人员所熟知。
在一些实施方案中,病毒是DNA病毒的疱疹病毒科的成员,包括例如单纯疱疹病毒、水痘带状疱疹病毒、人巨细胞病毒、疱疹病毒6A、疱疹病毒6B、疱疹病毒7和卡波西氏肉瘤相关疱疹病毒等。在一些实施方案中,疱疹病毒是减毒的。在一些实施方案中,疱疹病毒是复制缺陷性的。在一些实施方案中,疱疹病毒是有复制能力的。在一些实施方案中,相较于相应野生型疱疹病毒,疱疹病毒具有降低的细胞毒性。在一些实施方案中,疱疹病毒不是溶瘤性的。
在一些实施方案中,病毒是单纯疱疹病毒。包含重组核酸的单纯疱疹病毒可通过例如在WO2015/009952和/或WO2017/176336中公开的方法产生。在一些实施方案中,单纯疱疹病毒是减毒的。在一些实施方案中,单纯疱疹病毒是有复制能力的。在一些实施方案中,单纯疱疹病毒是复制缺陷性的。在一些实施方案中,单纯疱疹病毒是单纯疱疹1型病毒(HSV-1)、单纯疱疹2型病毒(HSV-2)或它们的任何衍生物。在一些实施方案中,单纯疱疹病毒是单纯疱疹1型病毒(HSV-1)。在一些实施方案中,HSV-1是减毒的。在一些实施方案中,相较于相应野生型HSV-1,HSV-1具有降低的细胞毒性。在一些实施方案中,HSV-1不是溶瘤性的。
在一些实施方案中,相对于未修饰野生型单纯疱疹病毒的组织趋性,单纯疱疹病毒已被修饰来改变它的组织趋性。在一些实施方案中,单纯疱疹病毒包含经修饰包膜。在一些实施方案中,经修饰包膜包含一种或多种(例如一种或多种、两种或更多种、三种或更多种、四种或更多种等)突变单纯疱疹病毒糖蛋白。单纯疱疹病毒糖蛋白的实例可包括但不限于糖蛋白gB、gC、gD、gH和gL。在一些实施方案中,相对于野生型单纯疱疹病毒,经修饰包膜改变单纯疱疹病毒组织趋性。
在一些实施方案中,本公开的病毒(例如疱疹病毒)对一种或多种靶标细胞(例如一种或多种人角质化细胞和/或纤维母细胞)的转导效率(体外和/或体内)是至少约25%。举例来说,病毒对一种或多种靶标细胞的转导效率可为至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约99%、至少约99.5%或更高。在一些实施方案中,病毒是单纯疱疹病毒,并且病毒对一种或多种靶标细胞(例如一种或多种人角质化细胞和/或纤维母细胞)的转导效率是约85%至约100%。在一些实施方案中,病毒是单纯疱疹病毒,并且病毒对一种或多种靶标细胞(例如一种或多种人角质化细胞和/或纤维母细胞)的转导效率是至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%。在体外或在体内测量病毒转导效率的方法为本领域普通技术人员所熟知,包括例如qPCR分析、深度测序、蛋白质印迹、荧光分析(诸如荧光原位杂交(FISH)、荧光报告基因表达、免疫荧光、FACS)等。
V.组合物和制剂
本公开的某些方面涉及包含重组核酸(例如重组疱疹病毒基因组)和/或病毒(例如包含本文所述的重组基因组的疱疹病毒,诸如包含重组单纯疱疹病毒基因组的单纯疱疹病毒)中的任一者以及赋形剂或载体(例如药学上可接受的赋形剂或载体)的组合物和制剂(例如药物组合物和制剂)。在一些实施方案中,组合物或制剂是美容组合物或制剂(例如皮肤护理产品)。
在一些实施方案中,组合物或制剂包含本文所述的病毒(例如疱疹病毒)中的任何一者或多者。在一些实施方案中,组合物或制剂包含约104至约1012个空斑形成单位(PFU)/mL的病毒。举例来说,组合物或制剂可包含约104至约1012、约105至约1012、约106至约1012、约107至约1012、约108至约1012、约109至约1012、约1010至约1012、约1011至约1012、约104至约1011、约105至约1011、约106至约1011、约107至约1011、约108至约1011、约109至约1011、约1010至约1011、约104至约1010、约105至约1010、约106至约1010、约107至约1010、约108至约1010、约109至约1010、约104至约109、约105至约109、约106至约109、约107至约109、约108至约109、约104至约108、约105至约108、约106至约108、约107至约108、约104至约107、约105至约107、约106至约107、约104至约106、约105至约106、或约104至约105PFU/mL的病毒。在一些实施方案中,组合物或制剂包含约104、约105、约106、约107、约108、约109、约1010、约1011或约1012PFU/mL的病毒。
如本文所述的组合物和制剂(例如药物组合物和制剂)可通过使一种或多种具有所需纯度的活性成分(诸如重组核酸或病毒)与一种或多种可接受的载体或赋形剂混合来制备。可接受的载体或赋形剂(例如药学上可接受的载体或赋形剂)在所用剂量和浓度下通常对接受者无毒,并且可包括但不限于:缓冲剂(诸如磷酸盐、柠檬酸盐、乙酸盐和其他有机酸);抗氧化剂(诸如抗坏血酸和甲硫氨酸);防腐剂(诸如十八烷基二甲基苯甲基氯化铵、苯扎氯铵、苄索氯铵、苯酚、丁醇或苯甲醇、对羟基苯甲酸烷基酯、儿茶酚、间苯二酚、环己醇、3-戊醇和间甲酚);氨基酸(诸如甘氨酸、谷氨酰胺、天冬酰胺、组氨酸、精氨酸或赖氨酸);低分子量(小于约10个残基)多肽;蛋白质(诸如血清白蛋白、明胶或免疫球蛋白);多元醇(诸如甘油,例如包括10%甘油的制剂);亲水性聚合物(诸如聚乙烯吡咯烷酮);单糖、二糖和其他碳水化合物(包括葡萄糖、甘露糖或糊精);螯合剂(诸如EDTA);糖(诸如蔗糖、甘露糖醇、海藻糖或山梨糖醇);成盐反离子(诸如钠);金属络合物(诸如Zn-蛋白质络合物);脂质体(例如阳离子脂质);纳米粒子载体;和/或非离子表面活性剂(诸如聚乙二醇(PEG))。对载体的彻底讨论可在REMINGTON’S PHARMACEUTICAL SCIENCES(Mack Pub.Co.,N.J.1991)中获得。
在一些实施方案中,组合物或制剂包含一种或多种脂质(例如阳离子脂质)载体。在一些实施方案中,组合物或制剂包含一种或多种纳米粒子载体。纳米粒子是可携带囊封化药物以达成快速或控制释放的亚微米(小于约1000nm)大小的药物递送载体,所述药物诸如是合成小分子、蛋白质、肽、细胞、病毒和基于核酸的生物治疗剂。多种分子(例如蛋白质、肽、重组核酸等)可使用本领域中熟知的方法来高效囊封在纳米粒子中。在一些实施方案中,“囊封”在纳米粒子中的分子可指含于所述纳米粒子内或连接于所述纳米粒子的表面和/或与所述纳米粒子的表面联合或呈它们的任何组合的形式的分子(诸如病毒)。用于本文所述的组合物或制剂中的纳米粒子可为本领域中已知的任何类型的生物可相容纳米粒子,包括例如包含聚(乳酸)、聚(乙醇酸)、PLGA、PLA、PGA以及它们的任何组合的纳米粒子(参见例如Vauthier等Adv Drug Del Rev.(2003)55:519-48;US2007/0148074;US2007/0092575;US2006/0246139;US5753234;US7081483;以及WO2006/052285)。
在一些实施方案中,载体或赋形剂(例如药学上可接受的载体或赋形剂)可适合于或适于本领域中已知的任何施用途径,包括例如静脉内、肌肉内、皮下、经皮肤、鼻内、气管内、舌下、经颊、局部、口服、经皮、真皮内、腹膜内、眶内、玻璃体内、视网膜下、经粘膜、关节内、通过浅表注射、通过植入、通过吸入、鞘内、室内和/或鼻内施用。在一些实施方案中,载体或赋形剂(例如药学上可接受的载体或赋形剂)适合于或适于局部、经皮、皮下和/或真皮内施用。在一些实施方案中,载体或赋形剂适合于或适于局部、经皮和/或真皮内施用。在一些实施方案中,载体或赋形剂适合于或适于浅表注射。
适合于或适于在局部、经皮、皮下、浅表和/或真皮内施加/施用中使用的载体或赋形剂的实例可包括但不限于软膏、油、糊、乳膏、气雾、混悬液、乳液、脂肪软膏、凝胶、粉末、液体、洗液、溶液、喷雾、贴片(例如经皮贴片或微针贴片)、粘合带、微针或微针阵列、以及吸入物。在一些实施方案中,载体或赋形剂(例如药学上可接受的载体或赋形剂)包括软膏、油、糊、乳膏、气雾、混悬液、乳液、脂肪软膏、凝胶、粉末、液体、洗液、溶液、喷雾、粘合带和吸入物中的一者或多者(例如一者或多者、两者或更多者、三者或更多者、四者或更多者、五者或更多者等)。在一些实施方案中,载体包括贴片(例如粘着于皮肤的贴片),诸如经皮贴片或微针贴片。在一些实施方案中,载体包括微针或微针阵列。用于制备和使用适于组合物递送的微针阵列的方法通常在本领域中是已知的(Kim Y.等“Microneedles for drug andvaccine delivery”.Advanced Drug Delivery Reviews 2012,64(14):1547-68)。
在一些实施方案中,组合物或制剂(例如药物组合物或制剂)适合于或适于本领域中已知的任何施用途径,包括例如静脉内、肌肉内、皮下、经皮肤、口服、鼻内、气管内、舌下、经颊、局部、经皮、真皮内、腹膜内、眶内、玻璃体内、视网膜下、经粘膜、关节内、通过浅表注射、通过植入、通过吸入、鞘内、室内和/或鼻内施用。在一些实施方案中,组合物或制剂适合于或适于经皮肤、局部、经皮、皮下和/或真皮内施用。在一些实施方案中,药物组合物或制剂适合于或适于局部、经皮和/或真皮内施用。在一些实施方案中,组合物或制剂适合于或适于真皮内施用。在一些实施方案中,组合物或制剂适合于或适于浅表注射。
在一些实施方案中,组合物或制剂(例如药物组合物或制剂)还包含一种或多种额外组分。额外组分的实例可包括但不限于粘合剂(例如预凝胶化玉米淀粉、聚乙烯吡咯烷酮或羟丙基甲基纤维素等);填充剂(例如乳糖和其他糖、微晶纤维素、果胶、明胶、硫酸钙、乙基纤维素、聚丙烯酸盐或磷酸氢钙等);润滑剂(例如硬脂酸镁、滑石、二氧化硅、胶体二氧化硅、硬脂酸、金属硬脂酸盐、氢化植物油、玉米淀粉、聚乙二醇、苯甲酸钠、乙酸钠等);崩解剂(例如淀粉、淀粉乙醇酸钠等);湿润剂(例如月桂基硫酸钠等);盐溶液;醇;聚乙二醇;明胶;乳糖;淀粉酶;硬脂酸镁;滑石;硅酸;粘性石蜡;羟甲基纤维素;聚乙烯吡咯烷酮;甜味剂;调味剂;芳香剂;着色剂;保湿剂;遮光剂;抗细菌剂;能够使多核苷酸稳定或防止它们的降解的试剂等。在一些实施方案中,组合物或制剂包含羟丙基甲基纤维素凝胶。在一些实施方案中,组合物或制剂包含磷酸盐缓冲剂。在一些实施方案中,组合物或制剂包含甘油(例如以约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约15%等)。
待用于体内施用的组合物和制剂(例如药物组合物和制剂)通常是无菌的。无菌性可易于例如通过经无菌过滤膜过滤来实现。
在一些实施方案中,本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于将一种或多种编码胶原蛋白(例如人胶原蛋白诸如胶原3)的多核苷酸递送至受试者的一种或多种细胞(例如一种或多种胶原缺乏性细胞)中。在一些实施方案中,本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于疗法中。在一些实施方案中,本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于治疗将受益于胶原多肽的表达的美容或美容性状况(例如与胶原缺乏相关的美容或美容性状况(诸如老化和/或UV损害的皮肤))。在一些实施方案中,本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于治疗皮肤学老化(例如如下所述)。
在一些实施方案中,本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于制备或制造药剂。在一些实施方案中,本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于制备或制造可用于将一种或多种编码胶原蛋白(例如人胶原蛋白诸如胶原3)的多核苷酸递送至受试者的一种或多种细胞(例如一种或多种胶原缺乏性细胞)中的药剂。在一些实施方案中,本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于制备或制造可用于治疗将受益于胶原多肽的表达的美容或美容性状况(例如与胶原缺乏相关的美容或美容性状况(诸如老化和/或UV损害的皮肤))的药剂。在一些实施方案中,本文所述的重组核酸、病毒和/或组合物或制剂中的任一者都可用于制备或制造可用于治疗皮肤学老化(例如如下所述)的药剂。
VI.方法
本公开的某些方面涉及一种增强、增加、加强和/或补充受试者中(例如受试者的一种或多种细胞中)一种或多种真皮细胞外基质蛋白的水平的方法,所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中,受试者是人。
本公开的其他方面涉及使受试者中真皮细胞外基质的结构和/或组织稳定或改进的方法,所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中,受试者是人。
本公开的其他方面涉及一种增强、增加、加强和/或补充受试者中(例如受试者的一种或多种细胞中)一种或多种人胶原蛋白的水平的方法,所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中,受试者是人。
在一些实施方案中,相较于受试者的一种或多种相应未治疗细胞(例如在治疗之前的一种或多种细胞、在治疗期间的一种或多种未感染细胞等)中一种或多种胶原的内源性水平,重组核酸、病毒、药剂和/或组合物向受试者的施用使受试者的一种或多种细胞中的胶原(例如COL1-1;COL1-2;COL3;COL1-1和COL1-2;COL1-1和COL3;等)水平(转录物或蛋白质水平)增加至少约10%。举例来说,相较于受试者的一种或多种相应未治疗细胞中一种或多种胶原的内源性水平,重组核酸、病毒、药剂和/或组合物的施用可使受试者的一种或多种细胞中的胶原水平(转录物或蛋白质水平)增加至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约99%或更多。在一些实施方案中,相较于受试者的一种或多种相应未治疗细胞(例如在治疗之前的一种或多种细胞、在治疗期间的一种或多种未感染细胞等)中一种或多种胶原的内源性水平,重组核酸、病毒、药剂和/或组合物向受试者的施用使受试者的一种或多种细胞中的胶原水平(转录物或蛋白质水平)增加至至少约2倍。举例来说,相较于受试者的一种或多种相应未治疗细胞中一种或多种胶原的内源性水平,重组核酸、病毒、药剂和/或组合物的施用可使受试者的一种或多种细胞中的胶原水平(转录物或蛋白质水平)增加至至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约15倍、至少约20倍、至少约25倍、至少约50倍、至少约75倍、至少约100倍、至少约250倍、至少约500倍、至少约750倍、至少约1000倍或更多倍。从样品测量转录物或蛋白质水平的方法为本领域普通技术人员所熟知,包括例如通过qPCR、RNA测序、ELISA、蛋白质印迹、质谱测定法等。
本公开的其他方面涉及一种增强、增加、加强和/或补充受试者的软组织的方法,所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中,受试者是人。在一些实施方案中,将重组核酸、病毒、药剂和/或组合物注射至受试者的软组织中。在一些实施方案中,受试者的皮肤是老化中的皮肤。在一些实施方案中,受试者的皮肤已由于暴露于紫外光(例如来自太阳,来自晒黑床等)而受损害。在一些实施方案中,受试者的皮肤是有皱纹的。
在一些实施方案中,重组核酸、病毒、药剂和/或组合物可用于用以修复和/或加强受试者的软组织的方法中。在一些实施方案中,“组织修复”是指恢复组织构造和/或功能,并且涵盖组织再生和置换。在一些实施方案中,修复或加强软组织是指用于恢复皮肤的年轻外观(例如相较于外观归因于由时序性老化或其他物理、化学或UV损害所致的缺陷的“老化”皮肤)的程序。在一些实施方案中,重组核酸、病毒、药剂和/或组合物可用于美容软组织应用中,诸如以填充皱纹、纹路、皱褶、疤痕,以及使真皮组织增强(例如使薄唇饱满,填充凹眼和/或浅面颊等)。
本公开的其他方面涉及一种使有需要的受试者的皮肤品质、状况和/或外观改进的方法,所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中,受试者是人。在一些实施方案中,皮肤状况是日光损害、老化、UV暴露、粗糙纹理、皮肤下陷和/或皱纹中的一者或多者。皮肤品质、状况和/或外观的改进(例如相较于在治疗之前)可使用包括例如FACE Q、GAIS等的本领域中已知的任何适当方法或量表来评估。在一些实施方案中,受试者的皮肤是老化中的皮肤。在一些实施方案中,受试者的皮肤已由于暴露于紫外光(例如来自太阳,来自晒黑床等)而受损害。在一些实施方案中,受试者的皮肤是有皱纹的。
本公开的其他方面涉及一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法,所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中,受试者是人。在一些实施方案中,重组核酸、病毒、药剂和/或组合物的施用持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来减少受试者的皮肤中一种或多种浅表凹陷的出现。在一些实施方案中,相较于在施用组合物之前受试者的皮肤中一种或多种浅表凹陷的出现,在施用组合物之后,受试者的皮肤中一种或多种浅表凹陷的出现得以减少。在一些实施方案中,皮肤中一种或多种浅表凹陷是细纹和皱纹(例如前额皱纹、“鱼尾纹”、在眼或口的边缘的皱纹等)中的一者或多者。在一些实施方案中,对一种或多种浅表皮肤凹陷的治疗通过相较于非治疗皮肤,在皮肤纹理或皮肤品质诸如光滑度、水化和弹性方面的改进来度量。在一些实施方案中,对一种或多种浅表皮肤凹陷的治疗通过浅表凹陷的严重性(例如深度)的减轻和/或皮肤的给定区域中细纹或皱纹的数目的降低来度量。在一些实施方案中,受试者的皮肤是老化中的皮肤。在一些实施方案中,受试者的皮肤已由于暴露于紫外光(例如来自太阳,来自晒黑床等)而受损害。在一些实施方案中,受试者的皮肤是有皱纹的。
本公开的其他方面涉及一种使受试者的皮肤的纹理、光滑度、弹性和/或张力中的至少一者增加和/或改进的方法,所述方法包括向所述受试者施用本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中,受试者是人。在一些实施方案中,在施用组合物之后,受试者的皮肤持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来维持纹理、光滑度、弹性或张力增加和/或改进中的至少一者。在一些实施方案中,相较于在施用组合物之前受试者的皮肤的纹理、光滑度、弹性或张力,在施用组合物之后,受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者得以增加和/或改进。测量皮肤的纹理、光滑度、弹性和/或张力的方法为本领域技术人员所知。在一些实施方案中,受试者的皮肤是老化中的皮肤。在一些实施方案中,受试者的皮肤已由于暴露于紫外光(例如来自太阳,来自晒黑床等)而受损害。在一些实施方案中,受试者的皮肤是有皱纹的。
本公开的其他方面涉及一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法,所述方法包括向所述受试者施用有效量的本文所述的重组核酸、病毒、药剂和/或组合物中的任一者。在一些实施方案中,受试者是人。在一些实施方案中,减弱一种或多种皮肤学老化征象包括以下中的任何一者或多者:治疗、减轻和/或预防细纹和/或皱纹;降低皮肤孔尺寸;改进皮肤厚度、饱满度和/或紧固度;改进皮肤光滑度、柔韧性和/或柔软度;改进皮肤色泽、光亮度和/或透明度;改进原胶原和/或胶原产生;改进皮肤纹理和/或促进再纹理化;改进皮肤轮廓的外观;恢复皮肤光泽和/或亮度;改进由于老化和/或绝经而减退的皮肤外观;改进皮肤保湿;增加皮肤弹性和/或回弹力;治疗、减轻和/或预防皮肤下陷;改进皮肤紧致度;减轻色素斑点、斑点化皮肤和/或疤痕(诸如痤疮疤痕);和/或改进就光衍射或反射来说的皮肤光学性质。在一些实施方案中,相较于在施用组合物之前受试者的一种或多种皮肤学老化征象,在施用组合物之后,受试者的一种或多种皮肤学老化征象得到减弱。可使用本领域中已知的用于测量一种或多种皮肤学老化征象的任何适合方法。
在一些实施方案中,在用有效量的本文所述的重组核酸、病毒、药剂和/或组合物中的任一者治疗之前,对受试者的皮肤的一个或多个部分进行磨削,或使得所述一个或多个部分更加可穿透。可使用本领域中已知的磨削皮肤或使皮肤可穿透性增加的任何适合方法,包括例如使用皮肤滚轮,重复使用粘合带来移除皮肤细胞层(胶带剥落),用解剖刀或刀片刮削,使用砂纸,使用化学穿透增强剂或电能,使用声波或超声波能,使用光(例如激光)能,使用长度适于刺穿但不完全穿过表皮的微米大小的针或刀片等。
在一些实施方案中,本公开的方法用于美容应用,诸如减少或消除皮肤中一种或多种浅表凹陷,减少或消除一种或多种皱纹,和/或预防一种或多种皱纹的出现或再现。在一些实施方案中,皮肤中一种或多种浅表凹陷或皱纹选自鼻唇皱褶、鱼尾纹、皱眉纹、烦恼纹、疤痕、眉间纹、眉下垂、泪槽、鼻颊纹、兔宝宝纹、面颊/面中部下垂、木偶纹、罂粟陷窝、微笑纹、笑纹、下巴皱痕、颈纹、颈阔肌带以及它们的任何组合。
在一些实施方案中,“有效量”是为影响特定状况(例如美容状况诸如皮肤老化)的一种或多种征象或症状的可测量改进或预防所述一种或多种征象或症状所需的至少最小量。“有效量”可根据诸如患者的年龄、性别和重量的因素而变化。有效量还是其中有益作用胜过治疗的任何毒性或有害作用的量。有效量可以一次或多次施用加以施用。出于本公开的目的,重组核酸、病毒、药剂和/或组合物的有效量是足以直接或间接实现可测量改进的量。如在临床情形下所了解,重组核酸、病毒、药剂和/或组合物的有效量可或可不与另一药物、化合物或组合物联合实现。因此,可在施用一种或多种药剂的情形下考虑“有效量”,并且如果在与一种或多种其他药剂联合的情况下可实现或实现了合乎需要的结果,那么单一药剂可被视为以有效量给与。
在一些实施方案中,向受试者施用重组核酸、病毒、药剂和/或组合物一次。在一些实施方案中,向受试者施用重组核酸、病毒、药剂和/或组合物至少两次(例如至少2次、至少3次、至少4次、至少5次、至少10次等)。在一些实施方案中,在施用之间(例如在第一施用与第二施用之间,在第二施用与第三施用之间,等),经过至少约15天(例如至少约15天、至少约20天、至少约30天、至少约40天、至少约50天、至少约60天、至少约70天、至少约80天、至少约90天、至少约100天、至少约120天等)。
本文所述的重组核酸、病毒、药剂和/或组合物或制剂可通过本领域中已知的任何适合方法或途径施用,包括不限于通过口服施用、舌下施用、经颊施用、局部施用、经直肠施用、通过吸入、经皮施用、皮下注射、真皮内注射、浅表注射、静脉内(IV)注射、动脉内注射、肌肉内注射、心内注射、骨内注射、腹膜内注射、经粘膜施用、经阴道施用、尿道内施用、玻璃体内施用、眶内施用、视网膜下施用、关节内施用、关节周施用、局部施用、皮上施用或它们的任何组合。因此,本公开涵盖将本文所述的重组核酸、病毒、药剂和/或组合物或制剂中的任一者递送至个体的方法。
在一些实施方案中,重组核酸、病毒、药剂和/或组合物或制剂以经皮肤方式、局部、经皮方式、皮下方式和/或真皮内方式向受试者施用。在一些实施方案中,重组核酸、病毒、药剂和/或组合物或制剂以真皮内方式和/或皮下方式施用。在一些实施方案中,重组核酸、病毒、药剂和/或组合物或制剂通过浅表注射来施用。在一些实施方案中,重组核酸、病毒、药剂和/或组合物或制剂局部和/或经皮方式施用。在一些实施方案中,每天一次、两次、三次、四次、五次或更多次施用重组核酸、病毒、药剂和/或组合物或制剂。在一些实施方案中,向个体的一个或多个受影响(例如有皱纹)区域施用重组核酸、病毒、药剂和/或组合物或制剂。在一些实施方案中,向个体的一个或多个未受影响区域施用组合物。
在一些实施方案中,在皮肤中在浅表深度下施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,在约2000微米或更小的深度下将重组核酸、病毒、药剂和/或组合物引入皮肤中。举例来说,可在约2000微米或更小,约1750微米或更小,约1500微米或更小,约1250微米或更小,约1000微米或更小,约900微米或更小,约800微米或更小,约700微米或更小,约600微米或更小,或约500微米或更小的深度下向皮肤中施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,在约0.5mm与5.0mm之间的注射深度下引入重组核酸、病毒、药剂和/或组合物。举例来说,可在约0.5mm与5.0mm,约0.5mm与4.5mm,约0.5mm与4.0mm,约0.5mm与3.5mm,约0.5mm与3.0mm,约0.5mm与2.5mm,约0.5mm与2.0mm,约0.5mm与1.5mm,约0.5mm与1.0mm,1.0mm与5.0mm,约1.0mm与4.5mm,约1.0mm与4.0mm,约1.0mm与3.5mm,约1.0mm与3.0mm,约1.0mm与2.5mm,约1.0mm与2.0mm,约1.0mm与1.5mm,1.5mm与5.0mm,约1.5mm与4.5mm,约1.5mm与4.0mm,约1.5mm与3.5mm,约1.5mm与3.0mm,约1.5mm与2.5mm,约1.5mm与2.0mm等之间的注射深度下引入重组核酸、病毒、药剂和/或组合物。
在一些实施方案中,重组核酸、病毒、药剂和/或组合物通过以约1mm至约30mm之间的距离加以间隔开的注射来施用。举例来说,重组核酸、病毒、药剂和/或组合物可通过以约1mm与30mm,2mm与30mm,5mm与30mm,10mm与30mm,15mm与30mm,1mm与20mm,2mm与20mm,5mm与20mm,10mm与20mm,15mm与20mm,1mm与15mm,2mm与15mm,5mm与15mm,10mm与15mm,1mm与10mm,2mm与10mm,5mm与10mm,1mm与5mm,2mm与5mm等之间的距离加以间隔开的注射来施用。在一些实施方案中,注射以至少约1mm、至少约2mm、至少约5mm、至少约10mm、至少约15mm、至少约20mm、至少约30mm或更大的距离加以间隔开。
身体的众多区域可用本文所述的重组核酸、病毒、药剂和/或组合物治疗,包括例如面部、前额、唇、头皮、颈、臂、手、腿、膝、足、胸、背、腹股沟、臀部、大腿等。在一些实施方案中,向面部施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个鼻唇皱褶施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,在一只或两只眼的周围施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个鱼尾纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个皱眉纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个疤痕(例如痤疮疤痕)施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个眉间纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个眉下垂施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个深度泪槽施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个鼻颊纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个兔宝宝纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个面颊/面中部下垂施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个木偶纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个罂粟陷窝部位施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个下巴皱痕施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个颈纹施用重组核酸、病毒、药剂和/或组合物。在一些实施方案中,向一个或多个颈阔肌带施用重组核酸、病毒、药剂和/或组合物。
在一些实施方案中,当将重组核酸递送至受试者的一种或多种靶标细胞中时,重组核酸表达一种或多种美容蛋白(例如人胶原)。在一些实施方案中,一种或多种美容蛋白(例如人胶原)的表达增强、增加、加强和/或补充一种或多种靶标细胞中人胶原的水平。在一些实施方案中,一种或多种美容蛋白(例如人胶原)的表达增强、增加、加强和/或补充由一种或多种靶标细胞分泌的人胶原的水平。在一些实施方案中,一种或多种美容蛋白(例如人胶原)的表达增强、增加、加强和/或补充细胞外基质中人胶原的水平。在一些实施方案中,一种或多种美容蛋白(例如人胶原)的表达增强、增加、加强和/或补充受试者中细胞外基质的稳定性。在一些实施方案中,一种或多种美容蛋白(例如人胶原)的表达增强、加强和/或补充受试者的软组织。在一些实施方案中,一种或多种美容蛋白(例如人胶原)的表达使个体的皮肤品质、状况和/或外观改进。在一些实施方案中,一种或多种美容蛋白(例如人胶原)的表达使受试者的皮肤中的一种或多种浅表凹陷(例如皱纹)减少。在一些实施方案中,一种或多种美容蛋白(例如人胶原)的表达使受试者的皮肤的纹理、光滑度、弹性和/或张力改进。在一些实施方案中,一种或多种美容蛋白(例如人胶原)的表达使受试者的一种或多种皮肤学老化征象减轻。
VII.宿主细胞
本公开的某些方面涉及一种或多种包含本文所述的任何重组核酸的宿主细胞。可使用本领域中已知的任何适合宿主细胞(原核或真核),包括例如:原核细胞,包括真细菌,诸如革兰氏阴性或革兰氏阳性生物体,例如肠杆菌科(Enterobacteriaceae)诸如埃希氏菌属(Escherichia)(例如大肠杆菌(E.coli))、肠杆菌属(Enterobacter)、欧文氏菌属(Erminia)、克雷伯氏菌属(Klebsiella)、变形杆菌属(Proteus)、沙门氏菌属(Salmonella)(例如鼠伤寒沙门氏菌(S.typhimurium))、沙雷氏菌属(Serratia)(例如粘质沙雷氏菌(S.marcescans))和志贺氏菌属(Shigella),以及杆菌(Bacilli)诸如枯草芽孢杆菌(B.subtilis)和地衣芽孢杆菌(B.licheniformis);真菌细胞(例如酿酒酵母(S.cerevisiae));昆虫细胞(例如S2细胞等);以及哺乳动物细胞,包括由SV40转化的猴肾CV1株系(COS-7,ATCC CRL 1651)、人胚肾株系(293细胞或被亚克隆来达成悬浮培养生长的293细胞)、幼小仓鼠肾细胞(BHK,ATCC CCL 10)、小鼠塞尔托利细胞(Sertoli cell)(TM4)、猴肾细胞(CV1 ATCC CCL 70)、非洲绿猴肾细胞(VERO-76,ATCC CRL-1587)、人宫颈癌细胞(HELA,ATCC CCL 2)、犬肾细胞(MDCK,ATCC CCL 34)、水牛大鼠肝细胞(BRL 3A,ATCC CRL1442)、人肺细胞(W138,ATCC CCL 75)、人肝细胞(Hep G2,HB 8065)、小鼠乳腺肿瘤(MMT060562,ATCC CCL51)、TRI细胞、MRC 5细胞、FS4细胞、人肝细胞瘤株系(Hep G2)、中国仓鼠卵巢(CHO)细胞,包括DHFR"CHO细胞,以及骨髓瘤细胞系,诸如NS0和Sp2/0。在一些实施方案中,宿主细胞是人或非人灵长类动物细胞。在一些实施方案中,宿主细胞是Vero细胞。在一些实施方案中,宿主细胞是补充性宿主细胞。在一些实施方案中,宿主细胞(例如Vero细胞)表达一种或多种单纯疱疹病毒基因(例如ICP4基因)。在一些实施方案中,宿主细胞是来自细胞系的细胞。适合宿主细胞或细胞系的实例可包括但不限于293、HeLa、SH-Sy5y、Hep G2、CACO-2、A549、L929、3T3、K562、CHO-K1、MDCK、HUVEC、Vero、N20、COS-7、PSN1、VCaP、CHO细胞等。
在一些实施方案中,重组核酸是单纯疱疹病毒载体。在一些实施方案中,重组核酸是单纯疱疹病毒扩增子。在一些实施方案中,重组核酸是HSV-1扩增子或HSV-1杂合扩增子。在一些实施方案中,使包含辅助病毒的宿主细胞与本文所述的HSV-1扩增子或HSV-1杂合扩增子接触,从而导致产生包含本文所述的一种或多种重组核酸的病毒。在一些实施方案中,从经接触宿主细胞的上清液收集病毒。通过使包含辅助病毒的宿主细胞与HSV-1扩增子或HSV-1/杂合扩增子接触来产生病毒的方法在本领域中是已知的。
在一些实施方案中,宿主细胞是补充性宿主细胞。在一些实施方案中,补充性宿主细胞表达一种或多种在本文所述的任何病毒载体中失活的基因。在一些实施方案中,使补充性宿主细胞与本文所述的重组疱疹病毒基因组(例如重组单纯疱疹病毒基因组)接触。在一些实施方案中,使补充性宿主细胞与重组疱疹病毒基因组接触导致产生包含本文所述的一种或多种重组核酸的疱疹病毒。在一些实施方案中,从经接触宿主细胞的上清液收集病毒。通过使补充性宿主细胞与重组单纯疱疹病毒接触来产生病毒的方法一般地描述于WO2015 009952和/或WO2017/176336中。
VIII.制品或药盒
本公开的某些方面涉及一种包括本文所述的重组核酸、病毒、药剂和/或组合物或制剂(例如药物组合物或制剂)中的任一者的制品或药盒。在一些实施方案中,制品或药盒包括包含关于施用重组核酸、病毒、药剂和/或组合物或制剂(例如以治疗真皮细胞外基质蛋白(例如胶原)缺乏和/或矫正一种或多种皮肤学老化征象)的说明的包装插页。
适于重组核酸、病毒、药剂和/或组合物或制剂的容器可包括例如瓶、小瓶、袋、管和注射器。容器可由多种材料诸如玻璃、塑料(诸如聚氯乙烯或聚烯烃)或金属合金(诸如不锈钢或哈斯特合金(hastelloy))形成。在一些实施方案中,容器包括在容器上或与容器相伴的标签,其中所述标签指示使用说明。制品或药盒可还包括从商业和使用者观点来看可合乎需要的其他材料,包括其他缓冲剂、稀释剂、过滤器、针、注射器、包装插页等。
IX.列举的实施方案
实施方案1:一种组合物,所述组合物包含:(a)包含重组核酸的单纯疱疹病毒(HSV),其中所述重组核酸包含编码第一多肽的第一多核苷酸,所述第一多肽包含第一人胶原蛋白,和(b)赋形剂。
实施方案2:如实施方案1所述的组合物,其中所述重组核酸包含所述第一多核苷酸的两个或更多个拷贝。
实施方案3:如实施方案1或2所述的组合物,其中所述HSV是复制缺陷性的。
实施方案4:如实施方案1或2所述的组合物,其中所述HSV是有复制能力的。
实施方案5:如实施方案1-4中的任一者所述的组合物,其中所述HSV是单纯疱疹1型病毒、单纯疱疹2型病毒或它们的任何衍生物。
实施方案6:如实施方案1-5中的任一者所述的组合物,其中所述重组核酸是单纯疱疹病毒扩增子。
实施方案7:如实施方案6所述的组合物,其中所述单纯疱疹病毒扩增子是HSV-1扩增子或HSV-1杂合扩增子。
实施方案8:如实施方案7所述的组合物,其中所述HSV-1杂合扩增子是HSV/AAV杂合扩增子、HSV/EBV杂合扩增子、以及HSV/EBV/RV杂合扩增子、或HSV/睡美人杂合扩增子。
实施方案9:如实施方案1-5中的任一者所述的组合物,其中所述重组核酸是重组单纯疱疹病毒基因组。
实施方案10:如实施方案9所述的组合物,其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。
实施方案11:如实施方案9或10所述的组合物,其中所述重组单纯疱疹病毒基因组在单纯疱疹病毒基因中包含失活性突变。
实施方案12:如实施方案11所述的组合物,其中所述单纯疱疹病毒基因选自由感染细胞蛋白(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和UL55组成的组。
实施方案13:如实施方案12所述的组合物,其中所述重组单纯疱疹病毒基因组在所述ICP4基因的一个或两个拷贝中包含失活突变。
实施方案14:如实施方案12或13所述的组合物,其中所述重组单纯疱疹病毒基因组在所述ICP22基因中包含失活性突变。
实施方案15:如实施方案12-14中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在所述UL41基因中包含失活突变。
实施方案16:如实施方案12-15中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在所述ICP0基因中包含失活突变。
实施方案17:如实施方案12-16中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在所述ICP27基因中包含失活突变。
实施方案18:如实施方案11-17中的任一者所述的组合物,其中所述失活性突变是所述一种或多种基因的编码序列的缺失。
实施方案19:如实施方案9-18中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在病毒基因座内包含所述第一多核苷酸。
实施方案20:如实施方案9-19中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸。
实施方案21:如实施方案9-20中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在ICP22病毒基因座内包含所述第一多核苷酸。
实施方案22:如实施方案9-21中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述第一多核苷酸。
实施方案23:如实施方案1-22中的任一者所述的组合物,其中相较于野生型单纯疱疹病毒,所述HSV具有降低的细胞毒性。
实施方案24:如实施方案1-23中的任一者所述的组合物,其中所述第一人胶原蛋白选自由以下组成的组:胶原α-1(I)链多肽(COL1-1)、胶原α-2(I)链多肽(COL1-2)、胶原α-1(II)链多肽(COL2)、胶原α-1(III)链多肽(COL3)、胶原α-1(IV)链多肽(COL4-1)、胶原α-2(IV)链多肽(COL4-2)、胶原α-3(IV)链多肽(COL4-3)、胶原α-4(IV)链多肽(COL4-4)、胶原α-5(IV)链多肽(COL4-5)、胶原α-6(IV)链多肽(COL4-6)、胶原α-1(V)链多肽(COL5-1)、胶原α-2(V)链多肽(COL5-2)、胶原α-3(V)链多肽(COL5-3)、胶原α-1(VI)链多肽(COL6-1)、胶原α-2(VI)链多肽(COL6-2)、胶原α-3(VI)链多肽(COL6-3)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)、胶原α-6(VI)链多肽(COL6-6)、胶原α-1(VII)链多肽(COL7)、胶原α-1(VIII)链多肽(COL8)、胶原α-1(IX)链多肽(COL9-1)、胶原α-2(IX)链多肽(COL9-2)、胶原α-3(IX)链多肽(COL9-3)、胶原α-1(X)链多肽(COL10)、胶原α-1(XI)链多肽(COL11-1)、胶原α-2(XI)链多肽(COL11-2)、胶原α-1(XII)链多肽(COL12)、胶原α-1(XIII)链多肽(COL13)、胶原α-1(XIV)链多肽(COL14)、胶原α-1(XV)链多肽(COL15)、胶原α-1(XVI)链多肽(COL16)、胶原α-1(XVII)链多肽(COL17)、胶原α-1(XVIII)链多肽(COL18)、胶原α-1(XIX)链多肽(COL19)、胶原α-1(XX)链多肽(COL20)、胶原α-1(XXI)链多肽(COL21)、胶原α-1(XXII)链多肽(COL22)、胶原α-1(XXIII)链多肽(COL23)、胶原α-1(XXIV)链多肽(COL24)、胶原α-1(XXV)链多肽(COL25)、胶原α-1(XXVI)链多肽(COL26)、胶原α-1(XXVII)链多肽(COL27)和胶原α-1(XXVIII)链多肽(COL28)。
实施方案25:如实施方案1-24中的任一者所述的组合物,其中所述第一人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。
实施方案26:如实施方案1-25中的任一者所述的组合物,其中编码所述第一人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案27:如实施方案1-26中的任一者所述的组合物,其中所述第一人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案28:如实施方案1-27中的任一者所述的组合物,其中所述第一人胶原蛋白不是COL7。
实施方案29:如实施方案1-28中的任一者所述的组合物,其中所述第一多肽包含:(a)所述第一人胶原蛋白;(b)另一人胶原蛋白;和(c)使(a)连接于(b)的接头多肽。
实施方案30:如实施方案29所述的组合物,其中所述接头多肽是可裂解接头多肽。
实施方案31:如实施方案29或30所述的组合物,其中所述接头多肽包含与选自由SEQ ID NO:28-31组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案32:如实施方案29-31中的任一者所述的组合物,其中所述另一人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。
实施方案33:如实施方案29-32中的任一者所述的组合物,其中所述另一人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。
实施方案34:如实施方案29-33中的任一者所述的组合物,其中编码所述另一人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案35:如实施方案29-34中的任一者所述的组合物,其中所述另一人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案36:如实施方案29-35中的任一者所述的组合物,其中所述第一人胶原蛋白和所述另一人胶原蛋白是不同的。
实施方案37:如实施方案1-36中的任一者所述的组合物,其中所述第一多核苷酸编码多顺反子mRNA,所述多顺反子mRNA包含:(a)编码所述第一多肽的第一开放阅读框(ORF);(b)编码额外人胶原蛋白的第二ORF;和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。
实施方案38:如实施方案37所述的组合物,其中编码所述IRES的核酸序列与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案39:如实施方案37或38所述的组合物,其中所述额外人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。
实施方案40:如实施方案37-39中的任一者所述的组合物,其中所述额外人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。
实施方案41:如实施方案37-40中的任一者所述的组合物,其中编码所述额外人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案42:如实施方案37-41中的任一者所述的组合物,其中所述额外人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案43:如实施方案37-42中的任一者所述的组合物,其中所述第一人胶原蛋白和所述额外人胶原蛋白是不同的。
实施方案44:如实施方案1-43中的任一者所述的组合物,其中所述重组核酸还包含编码第二人胶原蛋白的第二多核苷酸。
实施方案45:如实施方案44所述的组合物,其中所述重组核酸包含所述第二多核苷酸的两个或更多个拷贝。
实施方案46,如实施方案44或45所述的组合物,其中所述第二人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。
实施方案47:如实施方案44-46中的任一者所述的组合物,其中所述第二人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。
实施方案48:如实施方案44-48中的任一者所述的组合物,其中编码所述第二人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案49:如实施方案44-48中的任一者所述的组合物,其中所述第二人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案50:如实施方案44-49中的任一者所述的组合物,其中所述第一人胶原蛋白和所述第二人胶原蛋白是不同的。
实施方案51:如实施方案44-50中的任一者所述的组合物,其中所述重组核酸是重组单纯疱疹病毒基因组,并且其中所述重组单纯疱疹病毒基因组在病毒基因座内包含所述第二多核苷酸。
实施方案52:如实施方案51所述的组合物,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第二多核苷酸。
实施方案53:如实施方案51或52所述的组合物,其中所述重组单纯疱疹病毒基因组在ICP22病毒基因座内包含所述第二多核苷酸。
实施方案54:如实施方案51-53中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述第二多核苷酸。
实施方案55:如实施方案51-54中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸,并且在ICP22病毒基因座内包含所述第二多核苷酸。
实施方案56:如实施方案51-54中的任一者所述的组合物,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸,并且在UL41病毒基因座内包含所述第二多核苷酸。
实施方案57:如实施方案1-56中的任一者所述的组合物,其中所述赋形剂适合于经皮肤(全身性或局部)、经皮、皮下和/或真皮内施用。
实施方案58:如实施方案1-57中的任一者所述的组合物,其中所述赋形剂包括羟丙基甲基纤维素凝胶。
实施方案59:如实施方案1-58中的任一者所述的组合物,其中所述赋形剂适合于真皮内施用。
实施方案60:如实施方案1-59中的任一者所述的组合物,其中所述赋形剂包括磷酸盐缓冲剂。
实施方案61:如实施方案1-60中的任一者所述的组合物,其中所述赋形剂包括甘油。
实施方案62:如实施方案1-61中的任一者所述的组合物,其中所述赋形剂包括脂质载体。
实施方案63:如实施方案1-62中的任一者所述的组合物,其中所述赋形剂包括纳米粒子载体。
实施方案64:如实施方案1-63中的任一者所述的组合物,其中所述组合物是美容组合物。
实施方案65:如实施方案64所述的组合物,其中所述美容组合物是皮肤护理产品。
实施方案66:一种药盒,所述药盒包括:(a)如实施方案1-65中的任一者所述的组合物;和(b)关于施用所述组合物的说明书。
实施方案67:一种增强、增加、加强和/或补充受试者中一种或多种人胶原蛋白的水平的方法,所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。
实施方案68:一种增强、增加、加强和/或补充受试者的软组织的方法,所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。
实施方案69:如实施方案68所述的方法,其中将所述组合物注射至所述受试者的软组织中。
实施方案70:一种使有需要的受试者的皮肤品质、状况和/或外观改进的方法,所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。
实施方案71:如实施方案70所述的方法,其中所述状况选自由日光损害、老化、UV暴露、粗糙纹理、皮肤下陷、皱纹以及它们的任何组合组成的组。
实施方案72:一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法,所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。
实施方案73:如实施方案72所述的方法,其中所述组合物的施用持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来减少所述受试者的皮肤中所述一种或多种浅表凹陷的出现。
实施方案74:如实施方案72或73所述的方法,其中相较于在施用所述组合物之前所述受试者的皮肤中所述一种或多种浅表凹陷的出现,在施用所述组合物之后,所述受试者的皮肤中所述一种或多种浅表凹陷的出现得以减少。
实施方案75:一种使有需要的受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者增加和/或改进的方法,所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。
实施方案76:如实施方案75所述的方法,其中在施用所述组合物之后,所述受试者的皮肤持续至少约三个月、至少约六个月、至少约九个月或至少约12个月来维持纹理、光滑度、弹性或张力增加和/或改进中的至少一者。
实施方案77:如实施方案75或76所述的方法,其中相较于在施用所述组合物之前所述受试者的皮肤的所述纹理、光滑度、弹性或张力,在施用所述组合物之后,所述受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者得以增加和/或改进。
实施方案78:如实施方案70-77中的任一者所述的方法,其中所述受试者的皮肤是老化中的皮肤。
实施方案79:如实施方案70-78中的任一者所述的方法,其中所述受试者的皮肤已由于暴露于紫外光而受损害。
实施方案80:如实施方案70-79中的任一者所述的方法,其中所述受试者的皮肤是有皱纹的。
实施方案81:一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法,所述方法包括向所述受试者施用有效量的如实施方案1-65中的任一者所述的组合物。
实施方案82:如实施方案81所述的方法,其中一种或多种皮肤学老化征象的所述减弱选自由以下组成的组:(a)细纹和/或皱纹得到治疗、减轻和/或预防;(b)皮肤孔尺寸得到降低;(c)皮肤厚度、饱满度和/或紧固度得到改进;(d)皮肤光滑度、柔韧性和/或柔软度得到改进;(e)皮肤色泽、光亮度和/或透明度得到改进;(f)原胶原和/或胶原产生得到改进;(g)皮肤纹理得到改进和/或再纹理化得到促进;(h)皮肤轮廓的外观得到改进;(i)皮肤光泽和/或亮度得到恢复;(j)由于老化和/或绝经而减退的皮肤外观得到改进;(k)皮肤保湿得到改进;(l)皮肤弹性和/或回弹力得到增加;(m)皮肤下陷得到治疗、减轻和/或预防;(n)皮肤紧致度得到改进;(o)色素斑点、斑点化皮肤和/或痤疮疤痕得到减轻;(p)就光衍射或反射来说的皮肤光学性质得到改进;和(q)它们的任何组合。
实施方案83:如实施方案81或82所述的方法,其中相较于在施用所述组合物之前所述受试者的所述一种或多种皮肤学老化征象,在施用所述组合物之后,所述受试者的所述一种或多种皮肤学老化征象得到减弱。
实施方案84:如实施方案67-83中的任一者所述的方法,其中所述受试者是人。
实施方案85:如实施方案67-84中的任一者所述的方法,其中所述组合物以经皮肤(全身性或局部)方式、经皮方式、皮下方式和/或真皮内方式向所述受试者施用。
实施方案86:如实施方案67-85中的任一者所述的方法,其中所述组合物通过浅表注射来施用。
实施方案87:如实施方案67-85中的任一者所述的方法,其中所述组合物以真皮内方式向所述受试者施用。
实施方案88:如实施方案67-87中的任一者所述的方法,其中向所述受试者施用所述组合物一次。
实施方案89:如实施方案67-87中的任一者所述的方法,其中向所述受试者施用所述组合物至少两次。
实施方案90:如实施方案89所述的方法,其中在施用之间,经过至少约15、至少约30、至少约60、至少约90或至少约120天。
实施方案91:如实施方案67-90中的任一者所述的方法,其中向所述受试者的一个或多个受影响和/或未受影响区域施用所述组合物。
实施方案92:如实施方案67-91中的任一者所述的方法,其中在施用之前对所述受试者的皮肤进行磨削。
实施方案93:一种包含编码第一多肽的第一多核苷酸的重组核酸,所述第一多肽包含第一人胶原蛋白,其中所述重组核酸是重组单纯疱疹病毒基因组。
实施方案94:如实施方案93所述的重组核酸,其中所述重组核酸包含所述第一多核苷酸的两个或更多个拷贝。
实施方案95:如实施方案93或94所述的重组核酸,其中所述重组单纯疱疹病毒基因组是重组HSV-1基因组、重组HSV-2基因组或它们的任何衍生物。
实施方案96:如实施方案93-95中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在单纯疱疹病毒基因中包含失活性突变。
实施方案97:如实施方案96所述的重组核酸,其中所述单纯疱疹病毒基因选自由ICP0、ICP4、ICP22、ICP27、ICP47、tk、UL41和UL55组成的组。
实施方案98:如实施方案97所述的重组核酸,其中所述重组单纯疱疹病毒基因组在所述ICP4基因的一个或两个拷贝中包含失活突变。
实施方案99:如实施方案97或98所述的重组核酸,其中所述重组单纯疱疹病毒基因组在所述ICP22基因中包含失活性突变。
实施方案100:如实施方案97-99中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在所述UL41基因中包含失活突变。
实施方案101:如实施方案97-100中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在所述ICP0基因中包含失活突变。
实施方案102:如实施方案97-101中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在所述ICP27基因中包含失活突变。
实施方案103:如实施方案96-102中的任一者所述的重组核酸,其中所述失活性突变是所述一种或多种基因的编码序列的缺失。
实施方案104:如实施方案93-103中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在病毒基因座内包含所述第一多核苷酸。
实施方案105:如实施方案93-104中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸。
实施方案106:如实施方案93-105中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在ICP22病毒基因座内包含所述第一多核苷酸。
实施方案107:如93-106中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述第一多核苷酸。
实施方案108:如实施方案93-107中的任一者所述的重组核酸,其中所述第一人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。
实施方案109:如实施方案93-108中的任一者所述的重组核酸,其中所述第一人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。
实施方案110:如实施方案93-109中的任一者所述的重组核酸,其中编码所述第一人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案111:如实施方案93-110中的任一者所述的重组核酸,其中所述第一人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案112:如实施方案93-111中的任一者所述的重组核酸,其中所述第一人胶原蛋白不是COL7。
实施方案113:如实施方案93-112中的任一者所述的重组核酸,其中所述第一多肽包含:(a)所述第一人胶原蛋白;(b)另一人胶原蛋白;和(c)使(a)连接于(b)的接头多肽。
实施方案114:如实施方案113所述的重组核酸,其中所述接头多肽是可裂解接头多肽。
实施方案115:如实施方案113或114所述的重组核酸,其中所述接头多肽包含与选自由SEQ ID NO:28-31组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案116:如实施方案113-115中的任一者所述的重组核酸,其中所述另一人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。
实施方案117:如实施方案113-116中的任一者所述的重组核酸,其中所述另一人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。
实施方案118:如实施方案113-117中的任一者所述的重组核酸,其中编码所述另一人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案119:如实施方案113-118中的任一者所述的重组核酸,其中所述另一人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案120:如实施方案113-119中的任一者所述的重组核酸,其中所述第一人胶原蛋白和所述另一人胶原蛋白是不同的。
实施方案121:如实施方案93-120中的任一者所述的重组核酸,其中所述第一多核苷酸编码多顺反子mRNA,所述多顺反子mRNA包含:(a)编码所述第一多肽的第一开放阅读框(ORF);(b)编码额外人胶原蛋白的第二ORF;和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。
实施方案122:如实施方案121所述的重组核酸,其中编码所述IRES的核酸序列与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案123:如实施方案121或122所述的重组核酸,其中所述额外人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。
实施方案124:如实施方案121-123中的任一者所述的重组核酸,其中所述额外人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。
实施方案125:如实施方案121-124中的任一者所述的重组核酸,其中编码所述额外人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案126:如实施方案121-125中的任一者所述的重组核酸,其中所述额外人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案127:如实施方案121-126中的任一者所述的重组核酸,其中所述第一人胶原蛋白和所述额外人胶原蛋白是不同的。
实施方案128:如实施方案93-127中的任一者所述的重组核酸,其中所述重组核酸还包含编码第二人胶原蛋白的第二多核苷酸。
实施方案129:如实施方案128所述的重组核酸,其中所述重组核酸包含所述第二多核苷酸的两个或更多个拷贝。
实施方案130:如实施方案128或129所述的重组核酸,其中所述第二人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL2、COL3、COL4-1、COL4-2、COL4-3、COL4-4、COL4-5、COL4-6、COL5-1、COL5-2、COL5-3、COL6-1、COL6-2、COL6-3、COL6-4、COL6-5、COL6-6、COL7、COL8、COL9-1、COL9-2、COL9-3、COL10、COL11-1、COL11-2、COL12、COL13、COL14、COL15、COL16、COL17、COL18、COL19、COL20、COL21、COL22、COL23、COL24、COL25、COL26、COL27和COL28。
实施方案131:如实施方案128-130中的任一者所述的重组核酸,其中所述第二人胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL3、COL4-1、COL6-1、COL7和COL17。
实施方案132:如实施方案128-131中的任一者所述的重组核酸,其中编码所述第二人胶原蛋白的核酸序列与选自由SEQ ID NO:1-14组成的组的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
实施方案133:如实施方案128-132中的任一者所述的重组核酸,其中所述第二人胶原蛋白包含与选自由SEQ ID NO:15-21组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
实施方案134:如实施方案128-133中的任一者所述的重组核酸,其中所述第一人胶原蛋白和所述第二人胶原蛋白是不同的。
实施方案135:如实施方案128-134中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在病毒基因座内包含所述第二多核苷酸。
实施方案136:如实施方案135所述的重组核酸,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第二多核苷酸。
实施方案137:如实施方案135或136所述的重组核酸,其中所述重组单纯疱疹病毒基因组在ICP22病毒基因座内包含所述第二多核苷酸。
实施方案138:如实施方案135-137中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在UL41病毒基因座内包含所述第二多核苷酸。
实施方案139:如实施方案135-138中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸,并且在ICP22病毒基因座内包含所述第二多核苷酸。
实施方案140:如实施方案135-138中的任一者所述的重组核酸,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座的一个或两个拷贝内包含所述第一多核苷酸,并且在UL41病毒基因座内包含所述第二多核苷酸。
实施方案141:一种宿主细胞,所述宿主细胞包含如实施方案93-140中的任一者所述的重组核酸。
实施方案142:如实施方案141所述的宿主细胞,其中所述宿主细胞是真核细胞。
实施方案143:如实施方案141或142所述的宿主细胞,其中所述宿主细胞是哺乳动物细胞。
实施方案144:如实施方案141-143中的任一者所述的宿主细胞,其中所述宿主细胞是人细胞或非人灵长类动物细胞。
实施方案145:如实施方案141-144中的任一者所述的宿主细胞,其中所述宿主细胞是Vero细胞。
实施方案146:如实施方案141-145中的任一者所述的宿主细胞,其中所述宿主细胞是补充性宿主细胞。
实施方案147:一种收集单纯疱疹病毒的方法,所述方法包括:(a)使补充性宿主细胞与如实施方案93-140中的任一者所述的重组核酸接触;以及(b)收集通过所述补充性宿主细胞产生的所述单纯疱疹病毒。
实施方案148:一种收集单纯疱疹病毒的方法,所述方法包括:(a)培养如实施方案141-146中的任一者所述的宿主细胞;以及(b)收集通过所述宿主细胞产生的所述单纯疱疹病毒。
说明书被认为足以使得本领域技术人员能够实施本公开。除本文显示和描述的那些修改之外,本公开的各种修改也将根据先前描述而变得为本领域技术人员显而易知,并且落在随附权利要求的范围内。
实施例
通过参考以下实施例,本公开将得以更充分了解。然而,它不应解释为限制本公开的范围。应了解本文所述的实施例和实施方案仅出于说明目的,并且根据所述实施例和实施方案的各种修改或变化将为本领域技术人员所想起,并将包括在本申请的精神和界限以及随附权利要求的范围内。
实施例1:编码一种或多种人胶原蛋白的经修饰的单纯疱疹病毒载体
为制备能够在靶标哺乳动物细胞(诸如人角质化细胞或纤维母细胞)中表达一种或多种人胶原蛋白的经修饰的单纯疱疹病毒基因组载体,首先修饰单纯疱疹病毒基因组(图1A)以使一种或多种单纯疱疹病毒基因失活。所述修饰可使基因组在哺乳动物细胞中的毒性降低。接着,产生这些经修饰/减毒重组病毒构建体的变体以使它们携带一种或多种编码一种或多种人胶原蛋白的多核苷酸。这些变体包括:1)包含整合在每个ICP4基因座处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组(图1B);2)包含整合在每个ICP4基因座处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒的重组经ΔICP4修饰HSV-1基因组(图1C);3)包含整合在每个ICP4基因座处的含有在相同DNA链上的在第一异源性启动子的控制下的第一人胶原蛋白的编码序列和在第二异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组(图1D);4)包含整合在每个ICP4基因座处的含有在相同DNA链上的在第一异源性启动子的控制下的第一人胶原蛋白的编码序列和在第二异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4修饰HSV-1基因组(图1E);5)包含整合在每个ICP4基因座处的含有在相反DNA链上的在第一异源性启动子的控制下的第一人胶原蛋白的编码序列和在第二异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组(图1F);6)包含整合在每个ICP4基因座处的含有在相反DNA链上的在第一异源性启动子的控制下的第一人胶原蛋白的编码序列和在第二异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4修饰HSV-1基因组(图1G);7)包含整合在ICP4基因座中的每一者处的编码在异源性启动子的控制下的多顺反子mRNA的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组,其中所述多顺反子mRNA含有由内部核糖体进入位点(IRES)分隔的第一人胶原蛋白的编码序列和第二人胶原蛋白的编码序列(图1H);8)包含整合在ICP4基因座中的每一者处的编码在异源性启动子的控制下的多顺反子mRNA的表达盒的重组经ΔICP4修饰HSV-1基因组,其中所述多顺反子mRNA含有由内部核糖体进入位点(IRES)分隔的第一人胶原蛋白的编码序列和第二人胶原蛋白的编码序列(图1I);9)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的嵌合蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组,其中所述嵌合蛋白含有由接头多肽的氨基酸序列分隔的第一人胶原蛋白的氨基酸序列和第二人胶原蛋白的氨基酸序列(图1J);10)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的嵌合蛋白的编码序列的表达盒的重组经ΔICP4修饰HSV-1基因组,其中所述嵌合蛋白含有由接头多肽的氨基酸序列分隔的第一人胶原蛋白的氨基酸序列和第二人胶原蛋白的氨基酸序列(图1K);11)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒,以及整合在ICP22基因座处的含有在异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22修饰HSV-1基因组(图1L);12)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒,以及整合在UL41基因座处的含有在异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔICP22/ΔUL41修饰的HSV-1基因组(图1M);和13)包含整合在ICP4基因座中的每一者处的含有在异源性启动子的控制下的第一人胶原蛋白的编码序列的表达盒,以及整合在UL41基因座处的含有在异源性启动子的控制下的第二人胶原蛋白的编码序列的表达盒的重组经ΔICP4/ΔUL41修饰的HSV-1基因组(图1N)。
将这些经修饰的单纯疱疹病毒基因组载体转染至被修饰来表达一种或多种疱疹病毒基因的经工程化的Vero细胞中。这些经工程化的Vero细胞将在其中包装有经修饰的基因组的复制缺陷性单纯疱疹病毒分泌至上清液中。接着对上清液进行收集,浓缩,并且经5μm过滤器进行无菌过滤。
实施例2:编码人COL7的HSV候选物的构建和体外分析
胶原α-1(VII)链蛋白(COL7)起使皮肤强化和稳定的作用。简要来说,使COL7A1转录物翻译,所得COL7肽通过羟基化和糖基化加以翻译后修饰,并且糖基化COL7三肽形成从细胞分泌的被称为原胶原的三螺旋。原胶原在分泌后缔合成更高级结构,从而形成锚定原纤维,所述锚定原纤维接着可用于帮助组织上皮基底膜,使上皮基底膜稳定,并且有助于上皮基底膜的粘着。上皮基底膜负责使上皮锚定于下伏的疏松结缔组织,并且为达成真皮-表皮稳定性所必需(真皮-表皮接合完整性)。营养不良性大疱性表皮松解是一种由COL7A1基因中的突变引起的遗传性遗传病状;这个基因中的突变使营养不良性大疱性表皮松解患者中COL7使表皮适当地连接于真皮的能力受损,从而导致皮肤脆弱。作为大疱性表皮松解的最重度形式的隐性营养不良性大疱性表皮松解(RDEB)的特征最经常在于皮肤和粘膜广泛起疱和结疤。
以下实施例描述被修饰来表达人胶原α-1(VII)链多肽(COL7)的重组单纯疱疹1型病毒的构建,并且还提供了显示重组HSV能够在体外在来自健康者和RDEB患者的原代人角质化细胞和纤维母细胞中表达功能性人胶原的实验。
材料和方法
病毒构建
如下产生“KCA211”病毒载体(图2A):首先通过使病毒ICP4基因的两个拷贝的编码序列缺失(ΔICP4)来修饰野生型单纯疱疹病毒基因组。经ΔICP4修饰的病毒基因组还被工程化来在ICP4基因座中的每一者中含有mCherry表达盒。病毒基因组接着被进一步修饰来编码野生型人COL7。简要来说,将含有由ICP4的上游(US)和下游(DS)区域侧接的野生型COL7的编码序列(在hCMV启动子的控制下)的质粒转染至被修饰来表达疱疹病毒ICP4基因的Vero细胞中。这些经转染的细胞接着用以上所述的经修饰的ΔICP4 mCherry表达性病毒感染。侧接于COL7的US和DS ICP4区域允许进行双交换,以及替换mCherry基因座中的每一者。关于不存在mCherry荧光进行的目视筛选接着用于鉴定含有重组病毒的细胞。
如下产生“SAR-COL7”病毒载体(图2B):首先通过使病毒ICP4基因的两个拷贝以及单一拷贝ICP22基因的编码序列缺失(ΔICP4/ΔICP22)来修饰野生型单纯疱疹病毒基因组。经ΔICP4/ΔICP22修饰是病毒基因组还被工程化来在ICP4基因座中的每一者中含有mCherry表达盒。病毒基因组接着被进一步修饰来编码野生型人COL7。简要来说,将含有由ICP4的上游(US)和下游(DS)区域侧接的野生型COL7的编码序列(在hCMV启动子的控制下)的质粒转染至被修饰来表达疱疹病毒ICP4基因的Vero细胞中。这些经转染细胞接着用以上所述的经修饰的ΔICP4/ΔICP22 mCherry表达性病毒感染。侧接于COL7的US和DS ICP4区域允许进行双交换,以及替换mCherry基因座中的每一者。关于不存在mCherry荧光进行的目视筛选接着用于鉴定含有重组病毒的细胞。
细胞培养
先前从作为常规手术或诊断程序的一部分获取的皮肤活检体分离细胞。从每名患者或在儿童的情况下从父母或法定监护人获得知情书面同意。这个研究根据赫尔辛基宣言(Helsinki declaration)进行。所有细胞都在37℃下在5%CO2中培养。使人纤维母细胞在补充以10%胎牛血清(
Figure BDA0002744714680001491
血清,目录号PS-FB1)的杜贝卡氏改良必需培养基(Dulbecco’s modified essential medium)中生长。在补充以10%FBS、10ng/mL表皮生长因子、10-10霍乱毒素、0.4μg/mL氢化可的松(hydrocortisone)、5μg/mL转铁蛋白(transferrin)、5μg/mL胰岛素和5μg/mL碘塞罗宁(liothyronine)的DMEM/汉姆氏F12培养基(Ham’s F12medium)(3:1)中培养RDEB和正常角质化细胞。所有培养基都含有抗坏血酸(150μM)。使角质化细胞在有丝分裂活化的3T3细胞滋养层存在下以及在10μM Rho激酶抑制剂Y-27632存在下生长。
病毒感染
将病毒等分试样储存在-80℃下,并且在使用之前使其在组织培养层流通风橱下除霜。在感染之前在使细胞从组织培养塑料制品脱离以及在血球计上计数之后测定靶标细胞数目。感染复数(MOI)由病毒效价和靶标细胞数目计算,并且在含有10%血清的DMEM中稀释适当体积的病毒储备物并与靶标细胞一起在37℃下孵育2小时。接着移除病毒,并且在用预先温热的培养基洗涤两次之后向靶标细胞供给新鲜培养基。
蛋白质印迹
将角质化细胞在8x105下铺于100mm培养皿中以在次日实现70-80%汇合。在感染之后48小时,用放射免疫沉淀测定缓冲液使细胞裂解。将裂解物放置在离心机中,在4℃下持续5分钟,并且使上清液与6x拉姆利(Laemmli)上样缓冲液混合。在上样于SDS-PAGE上之前,将样品在95℃下煮沸5分钟。对于COL7检测,将5-30μg蛋白质上样于6%丙烯酰胺凝胶上。用于COL7检测的初级抗体是兔抗体(Sigma,目录号HPA042420)。将经解析的蛋白质转移于硝化纤维素膜上,根据初级抗体的要求在具有5%奶或5%BSA的PBS-0.1%吐温中封闭,并且与初级抗体一起孵育过夜。在与IgG-HRP缀合二级抗体(Santa Cruz Biotechnology)一起孵育之后,使膜与蛋白质印迹底物(ThermoFisher,目录号32106)一起孵育,并且暴露于胶片(ThermoFisher Scientific,目录号34090)。
qRT-PCR
根据制造商方案使用
Figure BDA0002744714680001501
小型试剂盒(Qiagen)分离RNA。使用NanoDropTM分光光度计(Fisher Scientific)定量RNA提取物,并且1.5μg RNA用于使用SuperScript III第一链合成系统(Invitrogen)进行cDNA合成。对于qPCR,使用SYBR精选主混合物(LifeTechnologies),并且以1:25稀释cDNA样品以充当模板。一式三份进行实验。
粘附测定
使96孔板未包被,或用10、20或50μg/mL大鼠尾胶原1(BD Biosciences)或人纤连蛋白(Millipore)以100μL反应体积在4℃下包被过夜,接着用PBS洗涤,并且用PBS+0.1%BSA在37℃下封闭1小时。将模拟物(对照)或经SAR-COL7感染的RDEB角质化细胞(2.4x104个细胞于100μL DMEM/HamF12+0.1%BSA中)添加至板中,并且在37℃下孵育90分钟。将孔用PBS洗涤三次以移除任何未结合的细胞,并且将粘附细胞用PFE固定20分钟。固定细胞接着用70%乙醇处理,用结晶紫染色,在100%乙醇中拆解,并且通过用Flex Station 3板读取器(Molecular Devices)在630nM下测量吸光度来定量。
器官型皮肤等同物
将牛纤维蛋白原(90%可凝结,MP Biomedicals)在37℃下在1.1%NaCl中溶解4小时,接着用0.45μm尼龙膜过滤器过滤。在使用胰蛋白酶和离心的情况下收集纤维母细胞,并且再混悬于培养基中以达到2x106个细胞/毫升的最终浓度。使150μL细胞混悬液与1mL凝血酶(thrombin)(3IU–Sigma Aldrich)混合,并且将细胞/凝血酶混合物在1:1的比率下添加至纤维蛋白原中。将混合物在1mL/孔下快速但温和地分配至12孔板中,并且在37℃下孵育。在20分钟之后,添加补充以抗坏血酸和在10μg/mL的最终浓度下的抑肽酶(aprotinin)(Sigma)的培养基。使基质成熟5-7天,同时每隔一天更换培养基。将角质化细胞在2x106个细胞/孔下铺于上部上,并且在次日,使培养物在金属格网上升高至空气-液体界面,并且开始用氨来呫诺(amlexanox)处理。每隔一天用新鲜药物、抗坏血酸和抑肽酶更换培养基。在处理的一周或两周时收集培养物,并且与OCT一起冷冻在液氮冷却的异戊烷中。使用低温恒温器(Avantik QS11)切割8μm切片,并且用多克隆抗COL7抗体在1:800的稀释度下进行免疫染色。用DAPI(Invitrogen)对核进行复染。
结果
首先,通过qPCR和蛋白质印迹分析评估了在HaCaT人角质化细胞细胞系中从经修饰HSV进行的COL7表达以确定经修饰HSV是否能够表达它们的运载物。用SAR-COL7或KCA211在0.3-10的范围内的MOI下转导HaCaT细胞。在感染之后48小时,收集并处理细胞以进行qPCR(图3A)或蛋白质印迹(图3B)分析。结果证明全长COL7以剂量依赖性方式从用任一经修饰HSV感染的人角质化细胞表达。
接着,进行免疫荧光实验以显现COL7在用SAR-COL7在各种MOI(在0.1至10的范围内)下感染24-48小时的原代RDEB角质化细胞或RDEB纤维母细胞中的表达。相较于未感染正常角质化细胞和纤维母细胞以及RDEB角质化细胞和纤维母细胞,对于角质化细胞(图4A)与纤维母细胞(图4B)两者,在SAR-COL7的所有测试剂量下都观察到强烈COL7信号。SAR-COL7在0.1-1的MOI下在纤维母细胞中的感染效率在16-36%的范围内。SAR-COL7在3.0以及以上的MOI下在纤维母细胞中的感染效率是≥90%。
用SAR-COL7在不同MOI下感染RDEB患者源性人真皮角质化细胞(HDK)和纤维母细胞(HDF)以评价COL7A1 RNA表达。正常HDK和HDF以及模拟感染的RDEB HDK和HDF用作阴性对照。观察到在用SAR-COL7感染的HDK(图5A)与HDF(图5B)两者中,COL7A1转录物以剂量依赖性方式增加。还计算了在感染之后相对于未感染健康HDK(表1A)或未感染健康HDF(表1B)的相对COL7A1转录物表达倍数变化。在是3的MOI下,相对于健康HDK和HDF中的野生型COL7A1转录物水平,使用COL7A1编码性HSV能够使COL7A1转录物表达增加约26倍(在RDEB HDK中)和60倍(在RDEB HDF中)。
表1A:在HDK中的COL7A1表达
细胞类型: MOI: 相比于N-HDK的倍数变化:
正常HDK(N-HDK) 0 1.00
RDEB HDK(EB-HDK) 0 0.79
RDEB HDK(EB-HDK) 0.3 7.00
RDEB HDK(EB-HDK) 1.0 13.73
RDEB HDK(EB-HDK) 3.0 26.25
表1B:在HDF中的COL7A1表达
细胞类型: MOI: 相比于N-HDF的倍数变化:
正常HDF(N-HDF) 0 1.000
RDEB HDF(EB-HDF) 0 0.340
RDEB HDF(EB-HDF) 0.1 1.805
RDEB HDF(EB-HDF) 0.3 5.134
RDEB HDF(EB-HDF) 1.0 30.788
RDEB HDF(EB-HDF) 3.0 60.571
接着,通过细胞粘附测定来测试从SAR-COL7表达的人COL7的功能性。研究了未感染的RDEB角质化细胞以及用SAR-COL7在不同MOI下感染的RDEB角质化细胞粘附于用胶原1或纤连蛋白处理的孔的能力。引起关注的是,使用基于板的粘附测定,用SAR-COL7感染的RDEB角质化细胞以剂量依赖性方式显示对胶原1(图6A)和纤连蛋白(图6B)的粘附增加。
最后,由RDEB纤维母细胞和角质化细胞组成的皮肤等同性(SE)器官型培养物用于评价在基底膜区(BMZ)处,COL7从SAR-COL7的表达。用RDEB或正常纤维母细胞和角质化细胞构建器官培养物。在器官培养物构建之前用SAR-COL7感染RDEB细胞(数据未显示),或在于空气-液体界面处升高之前将SAR-COL7逐滴添加于培养物上(图7)。对所得皮肤等同物(SE)进行分离,切片,并且染色以获得免疫荧光来检测COL7蛋白表达。在由用SAR-COL7感染的细胞获得的这些器官型培养物中检测到COL7,并且观察到COL7蛋白开始沉积在BMZ处。这个数据表明SAR-COL7不仅可高效递送COL7A1以及表达COL7蛋白,而且COL7蛋白开始在器官型培养物中进行组织,类似于在体内对COL7蛋白所预期的组织样式。
总之,本文提供的数据指示复制缺陷性HSV可作为载体用于在2D或3D培养系统中在野生型原代人细胞以及从罹患胶原缺乏症的患者分离的原代人细胞中有效递送和表达高水平的功能性人胶原,而无任何明显毒性。
实施例3:在野生型动物中对编码人COL7的HSV候选物的体内分析
以下实施例描述显示构建并在体外在人细胞中验证的重组病毒(参见以上实施例2)能够在体内在野生型动物中表达所编码的人胶原的实验。研究的目的部分地在于评价HSV介导的胶原表达在健康的有免疫能力的动物中的皮肤生物分布。
材料和方法
测试物品
向小鼠施用的制剂中的活性成分是在PBS+10%甘油中配制的在4.8x108个空斑形成单位(PFU)/mL的效价下的经修饰的单纯疱疹病毒SAR-COL7或KCA211(参见以上实施例2)。用于真皮内施用的媒介物是杜贝卡氏磷酸盐缓冲盐水(DPBS)+10%甘油。用于局部施用的媒介物是在无菌双蒸水中配制的3%羟丙基甲基纤维素(HPMC)凝胶。
动物
使用在6与10周龄之间的健康雄性BALB/c小鼠。方案中使用的所有程序都依照适用的动物福利法案,并且由当地机构动物护理和使用委员会(IACUC)核准。
真皮内注射
在测试物品施用之前以及期间,使用得麻效(Dexdomitor)(30μL0.05mg/mL)和舒泰(Telzol)(50μL 10mg/mL)的混合物使小鼠麻醉。用安醒顺(Antisedan)(50μL 0.5mg/mL)逆转镇静剂。使用电动宠物剪将背部和侧腹区域剃毛,并且用酒精湿巾擦拭所述区域。使用芒图(Mantoux)技术用注射器和27G针(VWR,目录号BD305620)进行真皮内注射,从而确保在每个部位处创建浅表“泡”。将病毒保持在干冰上,在室温下解冻,并且在解冻后30分钟内施用。向每只小鼠的背部施用两处真皮内注射,并且“泡”的边缘用永久性标记加以标记。
局部施加
对开放伤口或经磨削或划痕皮肤进行局部施用。使用电动剪将背部和侧腹区域剃毛。划痕通过用机械琢美(Dremel)打磨机温和磨削皮肤,继之以用22G针进行浅表穿孔来进行。对于创建伤口,使用锋利剪刀移除皮肤的5-6mm直径活检体。为将局部制剂限于经磨削或受伤部位,从1.5mL微量离心管的经切割和热压处理顶端创建孔。保留盖子,并且切割一侧用透明粘性敷料覆盖。使用手术胶水使“孔”粘附于经磨削/受伤区域,其中盖子一侧向下。使100μL SAR-COL7与20μL局部媒介物混合,并且通过注射穿过透明粘性敷料以使局部凝胶限制在伤口上以及防止渗漏来施加于伤口。
组织收集
在SAR-COL7施用之后的所指示时间点,使小鼠安乐死,并且使用8mm活检穿孔器移除注射部位。活检体的一半使用液氮快速冷冻,而另一半包埋在OCT中并低温保存以进行免疫荧光染色。
实时定量PCR
快速冷冻的一半活检体在-80℃下储存直至分析。对于处理和分析,遵循制造商方案(Qiagen),将样品再混悬于用新鲜DTT制备的350μL RLT缓冲液中。在25%幅度下对样品进行3次超声处理,伴有在冰上间歇性孵育1分钟,并且根据制造商方案(Qiagen AllPrepDNA和RNA提取试剂盒)进行DNA和RNA提取。将RNA样品与DNA样品两者再混悬于蒸馏去离子无RNA酶水中,并且在Take3微板读取器(BioRad)上以分光光度方式定量。
使用跨越人COL7A1开放阅读框的3’末端和3’UTR,从而特异性检测COL7A1转基因的定制引物/探针测定,通过Taqman实时PCR分析对COL7A1 DNA拷贝和RNA转录物进行绝对定量。100ng的DNA和RNA分别用于qPCR和qRT-PCR测定,并且在100ng小鼠基因组或RNA基质中制备含有待扩增的区域的质粒标准物。GAPDH用作两种分析的对照。
免疫荧光染色
将OCT冷冻组织在5-8μm下切片,并且使其风干多达1小时。将载片在-20℃下于100%甲醇中浸渍10分钟,并且使其风干。通过在室温下在PBS中洗涤3次(每次5分钟)来使甲醇固定切片再水化。使切片与由10%血清(混合物种)组成的封闭溶液一起在潮湿腔室中在室温下孵育1小时。移除过量封闭溶液,并且在每个切片上施加一滴在5%封闭溶液中制备的初级抗体(抗人胶原7抗体,Sigma,目录号HPA042420;抗整合素α6抗体(克隆goH3),BDBiosciences,目录号555734)溶液(30-50μL/切片)。使切片与初级抗体一起在4℃下孵育16小时,在室温下在PBS中洗涤3次,每次5分钟,并且在以1:400在PBS中稀释下施加二级抗体(抗兔AF 647,Invitrogen,目录号A21244;抗大鼠抗体AF-594,Invitrogen,目录号A11007),在潮湿腔室中在室温下持续1小时。重复3次PBS洗涤,接着将载片在室温下于赫希斯特(Hoechst)溶液(1:1000)中浸渍5分钟。重复3次PBS洗涤,并且将经染色的切片用封固介质(Fluorometer G,Southern Biotech,目录号0100-01)封固并用盖片覆盖。在脱水之后(约24小时)使用广视野荧光显微镜使切片成像。
结果
分成6组的总计30只雄性BALB/c小鼠用于这个研究。在第1天通过真皮内注射或局部施加来施用SAR-COL7,并且在第3天收集一个子组的小鼠,而其余小鼠在第6天加以收集。第2组中的动物通过真皮内注射来接受处于相同体积下的低剂量的SAR-COL7(4.8x106pfu/部位),并且第1组充当真皮内群组的对照。在第4、5和6组中,以120μL的总体积向受伤(第4和6组)或经磨削(第5组)区域施加局部媒介物(第4组)或呈局部凝胶剂形式的SAR-COL7(第5和6组)。收集组织,并且处理以进行如上所述的qPCR和免疫荧光分析。
进行处死后qPCR分析。在通过真皮内或局部施加来接受SAR-COL7的所有群组中都检测到COL7A1转录物和DNA水平(图8A-图8D),并且观察到明确剂量响应。在真皮内群组与局部群组(SAR-COL7高剂量真皮内群组、高剂量伤口群组和高剂量经磨削群组)之间,转录物和DNA水平是类似的,从而表明局部施加在递送COL7A1方面与真皮内注射同样高效。总之,相比于第3天样品(图8A-图8B),在第6天样品(图8C-图8D)中,DNA和RNA水平是较低的,此不是出乎意料的,因为SAR-COL7是一种保持游离的非整合载体(其将被预期随时间而清除)。
接着,进行免疫荧光实验以显现在体内SAR-COL7感染之后的COL7表达。如在提供于图9A-图9B中的代表性图像中所观察,在考查的两个时间点,在大多数动物群组中检测到COL7。许多样品显示COL7正确定位在BMZ处以及毛囊周围。在一些情况下,特别地在真皮内施加的情况下,在皮肤的靠近于下伏筋膜的深层中观察到强烈COL7表达,此可能由于注射是在皮下而非在真皮内。类似地,在其中BMZ可能在磨削期间被移除(如由缺乏代表性goH3染色所暗示)的许多经磨削皮肤样品中,强烈COL7染色限于皮肤表面。总之,在免疫荧光样品中存在COL7强烈支持了经修饰的HSV SAR-COL7的稳健功效。
此外,在体内测试了KCA211表达人COL7的能力,并且与SAR-COL7施用进行比较。发现KCA211也在体内在有免疫能力的小鼠中表达COL7转基因(图10A-图10B)。
总之,数据指示经修饰HSV能够在局部或真皮内施用之后在体内在健康的有免疫能力的动物中递送和表达人胶原蛋白,并且此外,从局部施用至受损害皮肤或开放伤口中的病毒进行的胶原表达与向完整皮肤中进行的真皮内施用类似。
实施例4:在亚效动物中对低剂量和高剂量的编码人COL7的HSV候选物的体内分析
以下实施例描述显示构建并在体外在人细胞中(参见以上实施例2)以及在体内在野生型小鼠中(参见以上实施例3)验证的重组病毒能够在体内在COL7亚效小鼠中表达功能性人胶原的实验。研究的目的部分地在于评价HSV介导的胶原表达在缺乏COL7的有免疫能力的动物中的皮肤生物分布。
材料和方法
除非相反指示,否则如以上实施例3中所述进行实验。
亚效小鼠
COL7亚效小鼠模型(Fritsch等J Clin Invest.2008年5月;118(5):1669-79)用于这个研究中。这个亚效小鼠模型是营养不良性大疱性表皮松解(DEB)的有免疫能力的动物模型,其中小鼠表达正常水平的约10%的COL7。它们的表型紧密类似于重度人DEB的特征,包括粘膜与皮肤起疱、甲营养不良以及肢端的连指手套样畸形。
小鼠通过flp/frt介导的对小鼠COL7A1的外显子2的移除来产生。缺乏COL7A1的两个功能性拷贝的动物(Col7a1flNew/flNeo),被称为COL7亚效小鼠,表达正常水平的约10%的COL7。从总计15个交配对,获得了58只幼仔,其中同窝仔在2-7只小鼠/窝的范围内。在这58个幼仔之中,6个幼仔被基因分型为亚效幼仔。用从耳穿孔组织样品提取的DNA对小鼠进行基因分型。PCR分析检测到在COL7A1的外显子2的上游存在loxP位点。野生型(WT)小鼠显示在269个碱基对(bp)下的条带,亚效小鼠显示在435bp下的条带,而杂合性小鼠显示两种条带。所有程序都依照适用的动物福利法案,并且由当地机构动物护理和使用委员会(IACUC)核准。
真皮内注射
在测试物品施用之前以及期间,使用2%异氟烷,在吸入麻醉下维持小鼠。在眼上施加眼用软膏(
Figure BDA0002744714680001581
兽用)以防止干燥。使用芒图技术用31G针进行真皮内注射。在指定剂量下向每只小鼠的背部施用多达四处真皮内注射。
组织收集
在组织收集之前,通过CO2吸入继之以颈脱位来使动物安乐死。使用锋利剪刀对注射部位进行活检。
苏木精和伊红(H&E)染色
将低温保存的组织在5-8μm的厚度下切片,并且使其风干多达一小时。将载片在-20℃下于100%甲醇中浸渍十分钟,并且使其风干。使甲醇固定切片在室温下在PBS中再水化5分钟。将切片在室温下在苏木精(魏格特氏改良苏木精(Weigert’s modifiedhematoxylin))中孵育5-10分钟,继之以在室温下在PBS中洗涤15分钟。接着将切片在伊红(伊红Y溶液,目录号HT110116)中冲洗3次,随后在水中冲洗一次。
通过在70%乙醇中浸渍10次,在95%乙醇中浸渍十次,以及在100%乙醇中浸渍十次来用乙醇使切片逐渐脱水。将切片放置以进行干燥,用封固介质(Fischer Scientific,目录号SPF15-100)封固并用盖片覆盖。在脱水之后(约24小时)使用亮视野显微镜使切片成像。
电子显微术
通过以下方式来制备用于电子显微术的皮肤:在含1.5%戊二醛/1.5%多聚甲醛的含有0.05%丹宁酸的杜贝卡氏无血清培养基(SFM)中浸渍至少一小时,随后在SFM中进行充分冲洗,并且在1%OsO4中持续60分钟进行固定后步骤。在SFM中洗涤样品,接着在直至100%的一系列分级乙醇中脱水,在氧化丙烯中冲洗,并且历经两小时的总时间在斯珀尔氏环氧树脂(Spurr’s epoxy)中浸润,通过微波能来加速。使样品在70℃下历经18小时加以聚合。通过以下方式来制备额外样品:在SFM中充分冲洗,接着在4℃下在以1:5在SFM中稀释的小鼠IgM LH24抗体或小鼠IgG NP185抗体中浸渍过夜。接着将样品在SFM中充分冲洗,在冰上暴露于金增强溶液(Nanoprobes)15分钟,接着快速升温至25℃,并且再孵育5分钟。将样品用冰冷SFM冲洗,固定,并且包埋。
结果
三只亚效小鼠用于高剂量SAR-COL7研究。在第1天,所有小鼠都通过真皮内注射来接受4.6x107 PFU/50μL/注射部位的剂量(表2)。将每个动物剃毛,并且在背部上在4个部位处加以注射,包括1处对照注射和3处SAR-COL7注射。一个动物(小鼠3)在第3天在相同的4个部位处接受第二注射。一只小鼠(小鼠1)在第3天被处死,而小鼠2和小鼠3在第7天被处死。
表2:关于真皮内注射高剂量SAR-COL7的研究设计
Figure BDA0002744714680001601
进行处死后qPCR分析。在所有三只小鼠中,在每个病毒注射部位处都检测到COL7A1转录物(图11A)和DNA水平(图11B)。在测定中,所有对照样品(PBS或HSV-GFP)中的转录物水平都处于或低于检测水平,因此在图中仅包括1个对照(第3天,样品1,HSV-GFP)用于比较。观察到在单次施用SAR-COL7之后截至第7天,DNA和转录物水平存在一定降低(小鼠2);然而,在再施用SAR-COL7后,DNA和转录物水平增加(小鼠3)。
接着,进行免疫荧光(IF)实验以显现在体内SAR-COL7感染之后,COL7在亚效小鼠中的表达(图12A-图12B)。IF实验证明在第3天时间点和第7天时间点,在BMZ中以及在毛囊(HF)周围观察到稳健和广布的COL7蛋白表达。未观察到对皮肤形态的负性影响(即使在重复施用之后),因为经SAR-COL7治疗样品显示正常皮肤形态,不具有纤维化或急性炎症的明显征象(图13)。总之,在免疫荧光样品中存在COL7强烈支持了SAR-COL7在递送能够在下伏皮肤子结构中分泌以及适当组织的人胶原方面的稳健功效。
还通过电子显微术评价了第3天活检体的锚定原纤维形成。在以适当方式结构化的锚定原纤维中,COL7的NC1结构域(其用NP158抗体染色)朝向致密层排列,而COL7的NC2结构域(其用LH24抗体染色)远离致密层排列。来自经SAR-COL7注射的小鼠的活检体显示了用LH24(图14A)抗体与NP185(图14B)抗体两者达成的COL7染色,并且重要的是,电子显微术(EM)图像揭示了锚定原纤维的形成。致密层作为穿过EM图像的中央的暗带被观察到。外源性人COL7的NC2结构域远离致密层加以定位,而外源性人COL7的NC1结构域沿致密层加以定位,如将在以适当方式形成的锚定原纤维中所预期。这个数据指示SAR-COL7不仅可表达能够在BMZ处分泌和适当组织的所编码的人COL7,但是所分泌的COL7具有功能性,并且在所得锚定原纤维中适当定位,从而支撑亚效小鼠的皮肤组织。
三只额外亚效小鼠用于低剂量SAR-COL7研究。在第1天,所有小鼠都通过真皮内注射来在3(小鼠1)或2(小鼠2和3)个部位中接受6.4x106 PFU/50μL/注射部位的剂量的SAR-COL7(表3)。
表3:关于真皮内注射低剂量SAR-COL7的研究设计
小鼠: 治疗日: 注射部位的数目: 终止日:
1 1 3 3
2 1 2 3
3 1 2 7
进行处死后qPCR分析。在所有三只小鼠中,在每个病毒注射部位处都检测到COL7A1转录物(图15A)和DNA水平(图15B)。观察到剂量响应。尽管相对于在高剂量研究中观察到的那些DNA和转录物水平,在这些低剂量样品中的COL7A1的DNA水平与转录物水平两者均较低,但COL7A1表达仍然是可检测的。尽管DNA或RNA水平存在约2个对数降低,但在经低剂量SAR-COL7注射的动物的皮肤中,COL7蛋白仍然是可检测的(图16)。在BMZ中以及在毛囊周围均观察到COL7蛋白。数据指示即使在较低剂量下,经修饰的HSV仍然有效递送和表达所编码的人胶原蛋白,所述所编码的人胶原蛋白接着分泌并定位至皮肤的适当区域。
总之,实施例中提供的数据指示本文所述的经修饰的HSV能够:1)在体外以及在器官型培养中转导皮肤细胞以产生功能性人胶原(参见实施例2);2)在局部施加和真皮内施加之后,在体内在健康的有免疫能力的动物中转导皮肤以及递送人胶原(参见实施例3);以及3)在体内在胶原缺乏性动物中转导皮肤,递送人胶原,并且引发锚定原纤维的形成(参见实施例4)。在不希望受理论束缚下,据信本文所述的重组载体提供了一种用于将功能性人胶原递送至皮肤的合乎需要的策略,从而允许达成用以在美容环境中支撑真皮和/或表皮的新型方法。
实施例5:编码人胶原1的多种经工程化HSV的构建和验证
以下实施例描述用于对重组HSV-1进行工程化以成功表达人胶原1的两种不同方法。因为人胶原1是一种包含COL1A1多肽的两个拷贝和COL1A2多肽的一个拷贝的异三聚大分子,所以进行两种不同策略以产生编码人COL1A1与COL1A2两者的单一HSV基因组;这两种方法一般地描绘于图1H-图1I和图1L中,并且在以下详细描述。
作为第一方法,重组HSV-1初始被工程化来将含有异源性启动子和多腺苷酸序列的人COL1A1表达盒并入ICP4基因座中的每一者中,如以上实施例2中所述。挑选推定含有人COL1A1盒的多个病毒空斑,并且通过在Vero细胞中感染以测试COL1A1表达来筛选(数据未显示)。至少三个分离株(克隆1A1、2A1和3A1)关于人COL1A1转基因表达呈阳性。然后,人COL1A1阳性克隆1A1和2A1接着被工程化来并入含有与COL1A1盒不同的异源性启动子以及它自身的多腺苷酸序列且插入ICP22基因座中的人COL1A2表达盒。接着筛选七个分离株(克隆1A2-1A1、1B2-1A1、1C1-1A1、1B3-2A1、3B1-1A1和3B1-2A1)以鉴定能够表达人COL1A1与COL1A2两者,并因此能够表达全长人胶原1的减毒HSV-1病毒。
用七个推定COL1A1-COL1A2阳性分离株中的一者或三个单独COL1A1分离株中的一者(作为COL1A2表达的阴性对照)感染Vero细胞以鉴定能够表达两种转基因的重组HSV-1克隆。使对Vero细胞的感染进行五天,通过温和刮削来收集细胞,并且通过在6000xg下离心五分钟来收集细胞集结块。收集每个集结块的一半用于qRT-PCR分析,而对另一半进行处理以进行蛋白质印迹。使用跨越人COL1A1或COL1A2开放阅读框(ORF)的3’末端和3’非翻译区(UTR),并且对转基因具有特异性的定制引物/探针测定,通过Taqman实时PCR分析对COL1A1或COL1A2 RNA拷贝进行绝对定量。从用所有三种单独COL1A1病毒感染的细胞以及用6/7的COL1A1-COL1A2病毒感染的细胞提取的RNA对于人COL1A1转基因表达呈阳性(图17A)。引起关注的是,仅3/7的COL1A1-COL1A2病毒(克隆1B2-1A1、1C1-1A1和1B3-2A1)还表达可检测水平的人COL1A2(图17B)。对在用这三个分离株感染的细胞溶解产物中的COL1A1和COL1A2蛋白表达进行蛋白质印迹以确保转基因在核酸水平与蛋白质水平两者上均表达。简要来说,将细胞集结块再混悬于含有Halt蛋白酶抑制剂混合物的RIPA缓冲液中,在4℃下孵育十分钟,并且接着在室温下用全能核酸酶处理10分钟。接着用含有5%2-巯基乙醇的4x LDS样品缓冲液稀释样品,并且在Tris-甘氨酸凝胶上解析。将模拟感染的Vero细胞裂解物作为阴性对照上样于凝胶上。将蛋白质转移至PVDF,封闭,接着用初级抗体(抗人COL1A1,ThermoFisher目录号PA5-29569;抗人COL1A2,Abcam目录号ab96723;或抗GAPDH,Abcam目录号ab9485)染色过夜。接着洗涤经染色的膜,与二级抗体一起孵育,然后显色。与qRT-PCR分析一致,所有三个克隆都能够在可检测水平下表达人COL1A1蛋白与COL1A2蛋白两者(图17C)。
并行探求第二方法以产生COL1A1-COL1A2阳性重组减毒HSV载体。在此处,产生了从5’至3’编码人COL1A1 ORF、合成IRES和人COL1A2 ORF的多核苷酸构建体。接着将这个基于IRES的构建体(在还含有异源性启动子和多腺苷酸序列的表达盒中编码)插入ICP4基因座中的每一者中,如以上实施例2中所述。挑选多个空斑,并且筛选以鉴定具有正确插入的IRES构建体的载体。简要来说,用推定IRES病毒分离株感染Vero细胞,使感染进行五天,并且收集细胞并处理以进行qPCR和qRT-PCR分析。使用识别合成IRES的定制引物/探针测定,通过Taqman实时PCR分析对插入DNA和RNA拷贝进行绝对定量。通过qPCR和qRT-PCR分析筛选了13个病毒分离株;关于IRES DNA和包含IRES序列的RNA转录物,这些分离株中仅一者(分离株6)测试呈阳性(数据未显示)。为确认这个分离株能够在蛋白质水平上表达人COL1A1与COL1A2两者,处理受感染的Vero细胞以进行如上所述的蛋白质印迹。根据qPCR显示无表达盒并入,并且根据qRT-PCR显示无转基因表达的病毒分离株(分离株1)用作阴性对照。与qPCR/qRT-PCR数据相应,病毒分离株6能够在感染之后表达人COL1A1蛋白与COL1A2蛋白两者(图18)。
总之,在这个样品的情况下呈现的数据指示:(1)成功构建了在感染所靶向细胞之后自如表达人COL1A1与COL1A2两者的多种重组HSV-1载体;(2)载体可被工程化来表达异三聚人胶原蛋白;以及(3)可采用多种不同方法来从单一重组基因组表达多种蛋白质。在不希望受理论束缚下,据信人胶原1从重组HSV-1基因组的成功表达提供了对使用经工程化的HSV来表达任何异三聚胶原蛋白(例如人胶原4)的支持。
实施例6:编码人胶原3的经工程化的HSV的构建、验证和体外表征
以下实施例描述成功表达人胶原3的重组HSV-1(被称为C3vec01)的工程化。此外,以下实施例描述建立适于表征C3vec01的功效的多种相关2D细胞培养模型系统的体外实验,包括在剂量探索研究中使用永生化人角质化细胞和纤维母细胞,使用从多名年老人患者活检获得的原代人真皮纤维母细胞作为在年长患者中进行C3vec01介导的胶原3挽救的模型,以及使用体外经UV照射永生化人纤维母细胞作为日光暴露/皮肤老化的模型。
人皮肤主要由通过真皮纤维母细胞来产生、组织和维持的富含胶原的结缔组织组成。真皮胶原占人皮肤的>90%(干重),并且主要由COL1和COL3原纤维在约85:15的典型比率下组成。这些原纤维对皮肤提供强度,并且对于维持皮肤组织构造至关重要。
皮肤老化特征主要归因于异常胶原体内平衡,从而导致净胶原缺乏;胶原的生物合成降低,胶原原纤维断裂增加,以及存在进行性真皮胶原丧失,所述事项全都促进老化表型。皮肤老化受内部因素与外部因素两者的组合的影响:内在因素-时间的推移、遗传、细胞代谢、激素等;以及外在因素–长期光照暴露、污染、电离辐射等。这些因素共同导致对皮肤的累积性结构和生理改变,从而最终导致皮肤皱纹的出现和恶化。
皮肤活力恢复,即逆转或修复皮肤中的不规整(诸如皱纹)的过程,部分地通过新胶原的合成(胶原新生)来实现。在皮肤中,胶原新生受胶原1和胶原3的沉积以及胶原1与胶原3之间的复杂相互作用的影响。COL3出现在胶原原纤维生成期间的早期,并且由COL1对这个COL3的后续替换是胶原原纤维成熟和细胞外基质重新组织的关键步骤(Wang等,2018,Journal of the Chinese Medical Association,81(2),第94-101页)。此外,COL3调控COL1纤维的尺寸(Liu等,1997,Proc Natl Acad Sci U S A,94(5),第1853-6页),并且使COL1弹性增强(Asgari等,2017,Sci Rep,7(1),第1392页)。因此,早期COL3表达的出现以及随后被COL1替换已用作可注射面部填充剂在人中具有功效的标志(Yutskovskaya等,2014,J Drugs Dermatol,13(9),第1047-52页)。
除非另外指示,否则所有实验都如上所述来进行。
为开始研究,重组HSV-1被工程化来将含有异源性启动子和多腺苷酸序列的人COL3A1表达盒并入ICP4基因座中的每一者中。挑选推定含有人COL3A1盒的多个病毒空斑,并且通过在Vero细胞中感染以测试COL3A1表达来筛选(数据未显示)。高表达性克隆中的一者,被称为C3vec01,随后被选择用于额外体外(以下描述)和体内(实施例7)分析。
首先,进行剂量探索研究以测定在永生化人角质化细胞(图19)与永生化人真皮纤维母细胞(图20)两者中,C3vec01介导的对它的所编码人运载物的递送的功效。在0.3至3的范围内的各种感染复数(MOI)下感染永生化细胞48小时,并且通过多种测定来定量和定性测量人胶原3表达。观察到在永生化HK和HDF(分别是图19A和图20A)中,根据qPCR分析在效应DNA方面(数据未显示),以及根据qRT-PCR分析在效应转录物水平方面均存在剂量依赖性增加。模拟感染的细胞以及用含有与C3vec01相同的HSV-1骨架但代之以编码mCherry效应物的病毒感染的细胞用作阴性对照。与这些结果相应,观察到在永生化HK(图19B)和HDF(图20B)中,根据免疫荧光,在C3vec01感染之后在COL3蛋白表达方面存在剂量依赖性增加。尽管永生化HDF在感染之前表达内源性人COL3(如所预期),但在用C3vec01感染之后观察到COL3表达显著增加,即使在低剂量下也是这样(初级抗COL3抗体,Abcam目录号ab7778)。在未感染的永生化角质化细胞中观察到少许至无可检测内源性COL3。重要的是,在用C3vec01感染的永生化角质化细胞或纤维母细胞的情况下,未观察到对细胞形态或活力的显著影响,即使在高剂量下也是这样。
随着皮肤老化,驻留真皮纤维母细胞产生较少胶原3,并且皮肤中COL1:COL3的比率朝向胶原1进行偏移。为通过新胶原3的合成来提供皮肤活力恢复,重要的是了解C3vec01是否将能够有效感染老化真皮纤维母细胞以及稳健表达它的所编码人胶原3。因此,在来源于两个不同供应商的细胞的情况下测试C3vec01在多种MOI下感染老化原代真皮纤维母细胞以及表达外源性胶原3的能力。下表4提供这个研究中使用的四个原代HDF样品的供者信息。
表4:原代人真皮纤维母细胞供者
年龄 性别 种族 组织 目录号 批号 公司
73 白种人 皮肤/眼睑 C-12302 435Z009.2 PromoCell
65 白种人 皮肤/眼睑 C-12302 417Z010.2 PromoCell
73 白种人 左下背部 CC-2511 0000633428 Lonza
75 白种人 背部 CC-2511 18TL057585 Lonza
相较于永生化HDF,在C3vec01感染来自供应商1(图21A)和供应商2(图21C)的原代HDF之后,观察到类似剂量依赖性增加,伴有相当或更高COL3转录物水平。还通过蛋白质印迹分析(初级抗COL3抗体,Abcam目录号ab7778)测试了来自每个供应商的代表性原代细胞的样品的COL3表达。C3vec01能够在从73岁男性患者(图21B)和75岁女性患者(图21D)活检获得的原代HDF中挽救高水平的人胶原3表达,即使在测试的最低MOI下也是这样。
最后,测试了C3vec01在UV暴露的永生化人纤维母细胞中诱导稳健胶原3表达的能力。日光暴露和相应UV损害已知是老化皮肤表型的单一最大外在促进因素,并且多个团体已采用体外皮肤纤维母细胞UV暴露系统来对光老化的某些方面建模(参见例如Qin等2018,Cell Physiol Biochem 46(5):1849-1860)。为确认UV暴露导致人真皮纤维母细胞分泌较少胶原3(如将鉴于光老化皮肤的表型所预期),通过ELISA来测量在三种不同水平的UV暴露之前和之后,COL3向培养的永生化人真皮纤维母细胞的上清液中的分泌(图22A)。实际上,UV照射培养的纤维母细胞使内源性COL3表达显著降低。COL1表达在这个实验中被并行监测,并且不受UV照射显著影响,从而指示与对蛋白质合成的整体抑制不同,UV暴露诱导对COL3的特异性阻遏。接着,测试了C3vec01感染经UV照射永生化HDF以及表达外源性COL3的能力。在此处,使永生化HDF暴露于UV照射,接着使其恢复24小时,随后用C3vec01在0.3或1的MOI下感染。在感染之后48小时,通过qRT-PCR分析来评估外源性人COL3。在两种测试MOI下均检测到受C3vec01感染的经UV照射HDF中的强烈COL3表达(图22B),从而指示C3vec01高效转导了光损害细胞以及递送了它的所编码运载物。模拟感染的细胞以及用含有与C3vec01相同的HSV-1骨架但代之以编码mCherry效应物的病毒感染的细胞用作阴性对照以确保转基因检测的特异性。
总之,这个实施例中呈现的数据指示重组HSV-1载体C3vec01高效转导多种人皮肤细胞类型,能够挽救胶原3在从年老患者收集的老化原代纤维母细胞中的表达,并且能够补救胶原3从UV损害的HDF进行的表达。在不希望受理论束缚下,据信数据支持使用编码人胶原3的重组HSV来矫正老化皮肤的胶原缺陷。
实施例7:真皮内施用的C3vec01的体内表征
以下实施例描述建立在年轻的和年老的健康的有免疫能力的动物中真皮内施用C3vec01的方法的体内实验。
除非另外指示,否则所有实验都如上所述来进行。
这个实施例中进行的所有程序都依照适用的动物福利法案,并且由当地机构动物护理和使用委员会(IACUC)核准。
在进一步操作之前,将小鼠的背部剃毛。接着将C3vec01(或媒介物对照)在真皮内注射至小鼠的背部中的四个部位。在感染以及后续恢复时期之后,使动物安乐死,并且使用8mm穿孔活检移除处理部位。将每个活检体的一半快速冷冻在液氮中以进行qPCR/qRT-PCR分析,而对另一半进行处理以进行免疫荧光分析。
处理组织样品以进行如上所述的核酸和蛋白质分析。对于COL3免疫荧光染色,使用兔抗人胶原3初级抗体(Abcam,目录号ab7778)和Alexa
Figure BDA0002744714680001691
488缀合的二级抗体。在含有DAPI的封固介质中封固组织样品以使核显现。
在年轻(6-8周龄)和年老(约13月龄)C57BL/6小鼠中进行体内药理学研究以评价在真皮内施用载体后,在有免疫能力的动物中,C3vec01介导的人COL3表达。总计10只动物用于这项研究。首先将每只小鼠的背部剃毛,接着在每个动物4个部位处用2x108 PFU/部位的C3vec01(或媒介物对照)在真皮内注射。在给药后48小时或1周对经注射部位进行活检,并且通过qPCR和免疫荧光来评价人COL3表达。下表5提供实验设计的概要。
表5:研究设计和测试物品施用
Figure BDA0002744714680001692
真皮内递送C3vec01导致在注射后48小时收集的皮肤活检体中检测到高水平的经转导载体基因组(图23A),以及在年轻小鼠与年老小鼠两者中均产生高水平的人胶原3转录物(图23B)。基于免疫荧光的检测还显示相对于经媒介物处理的皮肤,在经C3vec01处理的皮肤中的整个真皮中,人COL3的水平都明显增加(图23C),从而与转录物水平相关联。
总之,这个实施例中提供的数据指示在体内在真皮内注射之后可高效转导皮肤以及表达人胶原3。在不希望受理论束缚下,据信此处呈现的体内研究为在美容性环境中使用HSV-1作为用以递送人胶原3的新型基因疗法提供进一步支持。
实施例8:编码人层粘连蛋白的经修饰的单纯疱疹病毒载体的产生和验证
为开始研究,重组疱疹病毒载体被工程化来并入两种人层粘连蛋白即LAMB3或LAMC2的野生型或密码子优化变体,如以上实施例3中所述。对于每种类型的病毒,挑选许多分离株。为测试某些分离株是否能够表达所编码的野生型人LAMB3蛋白,将ICP4补充性Vero细胞铺于6孔板中,并且用野生型LamB3编码病毒的12个未滴定病毒分离株感染直至完成感染。在感染之后,收集RNA,产生cDNA,并且通过qPCR来测定野生型LamB3从每个分离株的表达(图24A)。所有12个分离株都能够在不同水平下在经转导的Vero细胞中表达野生型人LamB3。还通过蛋白质印迹来测试了这些分离株中的10者表达人LamB3的能力。将ICP4补充性Vero细胞铺于6孔板中,并且用野生型LamB3表达性病毒的10个未滴定病毒分离株感染直至完成感染。用LamB3表达质粒转染一孔的Vero细胞,作为阳性对照。在感染之后,将细胞通过温和刮削来收集,离心以收集细胞集结块,吸出培养基,并且用PBS洗涤细胞集结块一次。在洗涤之后,将每个细胞集结块再混悬于含有蛋白酶抑制剂的200μL RIPA缓冲液中,并且在4℃下孵育再混悬液20分钟,其中每5分钟进行温和搅拌。在孵育之后,在17,000x g下离心样品5分钟,移除上清液,并且将含有5%2-巯基甲醇的4x LDS还原样品缓冲液添加至每个澄清上清液中。接着将样品煮沸10分钟,随后上样于4-20%Tris-甘氨酸聚丙烯酰胺凝胶上。在电泳之后,将蛋白质转移至PVDF膜,并且将膜在5%奶/TBS中封闭30分钟。接着将初级兔抗LamB3抗体(Abcam,目录号ab128864)在以1:1000在5%奶/TBS中稀释下添加至PVDF膜,并且在室温下孵育过夜(约16小时)。印迹接着用TBS洗涤3次,每次5分钟,接着用处于5%奶/TBS中的AP缀合山羊抗兔IgG抗体(Sigma,目录号A3687)在室温下染色1小时。接着将膜用TBS洗涤3次,每次5分钟,添加BCIP/NBT,并且在室温下使印迹显色约10分钟。与qPCR数据一致,所有10个病毒分离株都能够在不同水平下表达所编码野生型人LamB3(图24B)。
还通过蛋白质印迹分析来测试了编码人LamB3的密码子优化变体的病毒在Vero细胞中表达它们的运载物的能力。简要来说,密码子优化(CO)LamB3编码病毒的10个未滴定病毒分离株用于感染Vero细胞,收集细胞集结块,将每个集结块再混悬于含有蛋白酶抑制剂的RIPA缓冲液中,并且使用这些细胞溶解产物进行蛋白质印迹,如上所描述。所有10个病毒分离株都能够在Vero细胞中表达所编码的密码子优化人LamB3(图25)。
接着,测试编码野生型或密码子优化的LAMB3的四个病毒分离株转导原代人细胞以及表达它们的运载物的能力。在1.0的感染复数(MOI)下感染永生化原代正常角质化细胞48小时。未感染的细胞用作阴性对照。接着通过蛋白质印迹来考查LamB3在受感染人角质化细胞中的表达。使用初级兔抗LamB3抗体(Abcam,目录号ab 128864),如上所述来进行蛋白质印迹。与使用Vero细胞产生的数据一致,确认了表达野生型和密码子优化LamB3的病毒分离株有效转导原代人角质化细胞以及在适合水平下表达它们的所编码的构建体(图26)。
为测试含有LamC2的分离株是否能够表达所编码的野生型或密码子优化的人LAMC2,将ICP4补充性Vero细胞铺于6孔板中,并且用许多未滴定的野生型或密码子优化的LamC2表达性病毒分离株感染直至完成感染。在感染之后,收集RNA,产生cDNA,并且通过qPCR来测定野生型LamC2(图27A)或密码子优化LamC2(图27B)从每个分离株的表达。8/12分离株能够在不同水平下在经转导的Vero细胞中表达野生型人LamC2,而3/7分离株能够表达密码子优化的人LamC2。接着通过蛋白质印迹来测试了某些野生型和密码子优化分离株表达人LamC2的能力。将ICP4补充性Vero细胞铺于6孔板中,并且用未滴定病毒分离株感染直至完成感染。使一孔Vero细胞未受感染,作为阴性对照。在感染之后,细胞通过温和刮削来收集,离心以收集细胞集结块,吸出培养基,并且用PBS洗涤细胞集结块一次。在洗涤之后,将每个细胞集结块再混悬于含有蛋白酶抑制剂的200μL RIPA缓冲液中,并且在4℃下孵育再混悬液20分钟,其中每5分钟进行温和搅拌。在孵育之后,在17,000x g下离心样品5分钟,移除上清液,并且将含有5%2-巯基甲醇的4x LDS还原样品缓冲液添加至每个澄清的上清液中。接着将样品煮沸10分钟,随后上样于4-20%Tris-甘氨酸聚丙烯酰胺凝胶上。在电泳之后,将蛋白质转移至PVDF膜,并且将膜在5%奶/TBS中封闭30分钟。接着将初级兔抗LamC2抗体(Abcam,目录号ab96327)在以1:1000在5%奶/TBS中稀释下添加至PVDF膜中,并且在室温下孵育过夜(约16小时)。印迹接着用TBS洗涤3次,每次5分钟,接着用处于5%奶/TBS中的AP缀合的山羊抗兔IgG抗体(Sigma,目录号A3687)在室温下染色1小时。接着将膜用TBS洗涤3次,每次5分钟,添加BCIP/NBT,并且在室温下使印迹显色约10分钟。与qPCR数据一致,测试病毒分离株中的全部9者都也能够表达所编码的人LamC2(图27C)。
选择密码子优化的LamC2表达性病毒分离株“LGA”用于在人细胞中进一步测试。用LGA分离株在0.3、1.0或3.0的感染复数(MOI)下感染永生化原代正常角质化细胞48小时。未感染(对照)和mCherry表达性病毒感染的细胞用作阴性对照。在感染48小时之后,从永生化角质化细胞提取DNA和RNA,并且进行qPCR/qRT-PCR(图28A-图28B)。在永生化角质化细胞的情况下,对于LGA分离株,观察到良好剂量-响应,如通过每50ng DNA所检测到的病毒基因组拷贝数所评估(图28A)。引起关注的是,尽管当使MOI从0.3增加至1.0时在转录物水平上观察到剂量响应,但当使MOI从1.0增加至3.0时未观察到转录物水平的额外增加(图28B)。还通过蛋白质印迹来考查LamC2在受感染人角质化细胞中的表达。如上所述来进行蛋白质印迹(使用初级兔抗LamC2抗体(Abcam,目录号ab96327))。与转录物分析一致,当使MOI从0.3增加至1.0,而非从1.0增加至3.0时,在蛋白质水平上观察到剂量响应(图28C)。
最后,为测试分离株“LGA”是否能够在体内递送时表达它的人层粘连蛋白,在动物中在真皮内注射之后,通过qPCR、qRT-PCR和免疫荧光来评估人LAMC2表达。将在PBS+10%甘油(媒介物)中配制的1x108 PFU的LGA在真皮内注射至两只小鼠的背侧皮肤和足垫中。以真皮内方式向一只小鼠的背侧皮肤施用相等体积的单独媒介物以充当阴性对照。在这个研究中处理的两个动物的注射部位的示意图提供于图29A中。
在施用后72小时,从每个处理部位获取完全厚度8mm活检体,并且一分为二。将每个节段的一半快速冷冻在液氮中,并且随后处理以进行qPCR和qRT-PCR分析来定量背侧皮肤中的LAMC2 DNA拷贝数(图29B)和转录物水平(图29C)。将每个活检体的剩余一半包埋在OCT中以测定免疫荧光(IF)。低温切片中的LAMC2表达通过使用抗人LAMC2抗体(Abcam,目录号ab96327)进行免疫荧光分析来测定。为确认从LGA表达的人LAMC2正确定位至皮肤的在其中得见天然层粘连蛋白-332的区域,还关于小鼠层粘连蛋白-332对背侧皮肤样品进行复染(pKal)。真皮内施用LGA导致对小鼠皮肤的成功转导,其中所编码的人转基因在表皮的正确层中稳健表达。组织学评价显示在经处理的部位处无炎症性浸润,从而证明这个疗法具有安全性。
总之,这个实施例中呈现的数据证明(1)HSV载体可被成功工程化来稳健表达人层粘连蛋白(尤其是人层粘连蛋白-332的β或γ亚单位),(2)基于HSV的载体(LGA)可在体内成功递送人层粘连蛋白-332,以及(3)重组人层粘连蛋白-332亚单位在经处理的动物的表皮的适当区域中表达以及定位至经处理的动物的表皮的适当区域。
序列表
<110> 克里斯托生物技术股份有限公司(Krystal Biotech, Inc.)
克里希南•苏马(KRISHNAN, Suma)
帕里•特雷弗(PARRY, Trevor)
阿加瓦尔•普嘉(AGARWAL, Pooja)
<120> 用于美容性应用的编码一种或多种美容蛋白的重组核酸
<130> 761342000640
<140> 尚未分配
<141> 同时随同提交
<150> US 62/663,476
<151> 2018-04-27
<160> 64
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 4395
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
atgttcagct ttgtggacct ccggctcctg ctcctcttag cggccaccgc cctcctgacg 60
cacggccaag aggaaggcca agtcgagggc caagacgaag acatcccacc aatcacctgc 120
gtacagaacg gcctcaggta ccatgaccga gacgtgtgga aacccgagcc ctgccggatc 180
tgcgtctgcg acaacggcaa ggtgttgtgc gatgacgtga tctgtgacga gaccaagaac 240
tgccccggcg ccgaagtccc cgagggcgag tgctgtcccg tctgccccga cggctcagag 300
tcacccaccg accaagaaac caccggcgtc gagggaccca agggagacac tggcccccga 360
ggcccaaggg gacccgcagg cccccctggc cgagatggca tccctggaca gcctggactt 420
cccggacccc ccggaccccc cggacctccc ggaccccctg gcctcggagg aaactttgct 480
ccccagctgt cttatggcta tgatgagaaa tcaaccggag gaatttccgt gcctggcccc 540
atgggtccct ctggtcctcg tggtctccct ggcccccctg gtgcacctgg tccccaaggc 600
ttccaaggtc cccctggtga gcctggcgag cctggagctt caggtcccat gggtccccga 660
ggtcccccag gtccccctgg aaagaatgga gatgatgggg aagctggaaa acctggtcgt 720
cctggtgagc gtgggcctcc tgggcctcag ggtgctcgag gattgcccgg aacagctggc 780
ctccctggaa tgaagggaca cagaggtttc agtggtttgg atggtgccaa gggagatgct 840
ggtcctgctg gtcctaaggg tgagcctggc agccctggtg aaaatggagc tcctggtcag 900
atgggccccc gtggcctgcc tggtgagaga ggtcgccctg gagcccctgg ccctgctggt 960
gctcgtggaa atgatggtgc tactggtgct gccgggcccc ctggtcccac cggccccgct 1020
ggtcctcctg gcttccctgg tgctgttggt gctaagggtg aagctggtcc ccaagggccc 1080
cgaggctctg aaggtcccca gggtgtgcgt ggtgagcctg gcccccctgg ccctgctggt 1140
gctgctggcc ctgctggaaa ccctggtgct gatggacagc ctggtgctaa aggtgccaat 1200
ggtgctcctg gtattgctgg tgctcctggc ttccctggtg cccgaggccc ctctggaccc 1260
cagggccccg gcggccctcc tggtcccaag ggtaacagcg gtgaacctgg tgctcctggc 1320
agcaaaggag acactggtgc taagggagag cctggccctg ttggtgttca aggaccccct 1380
ggccctgctg gagaggaagg aaagcgagga gctcgaggtg aacccggacc cactggcctg 1440
cccggacccc ctggcgagcg tggtggacct ggtagccgtg gtttccctgg cgcagatggt 1500
gttgctggtc ccaagggtcc cgctggtgaa cgtggttctc ctggccctgc tggccccaaa 1560
ggatctcctg gtgaagctgg tcgtcccggt gaagctggtc tgcctggtgc caagggtctg 1620
actggaagcc ctggcagccc tggtcctgat ggcaaaactg gcccccctgg tcccgccggt 1680
caagatggtc gccccggacc cccaggccca cctggtgccc gtggtcaggc tggtgtgatg 1740
ggattccctg gacctaaagg tgctgctgga gagcccggca aggctggaga gcgaggtgtt 1800
cccggacccc ctggcgctgt cggtcctgct ggcaaagatg gagaggctgg agctcaggga 1860
ccccctggcc ctgctggtcc cgctggcgag agaggtgaac aaggccctgc tggctccccc 1920
ggattccagg gtctccctgg tcctgctggt cctccaggtg aagcaggcaa acctggtgaa 1980
cagggtgttc ctggagacct tggcgcccct ggcccctctg gagcaagagg cgagagaggt 2040
ttccctggcg agcgtggtgt gcaaggtccc cctggtcctg ctggtccccg aggggccaac 2100
ggtgctcccg gcaacgatgg tgctaagggt gatgctggtg cccctggagc tcccggtagc 2160
cagggcgccc ctggccttca gggaatgcct ggtgaacgtg gtgcagctgg tcttccaggg 2220
cctaagggtg acagaggtga tgctggtccc aaaggtgctg atggctctcc tggcaaagat 2280
ggcgtccgtg gtctgactgg ccccattggt cctcctggcc ctgctggtgc ccctggtgac 2340
aagggtgaaa gtggtcccag cggccctgct ggtcccactg gagctcgtgg tgcccccgga 2400
gaccgtggtg agcctggtcc ccccggccct gctggctttg ctggcccccc tggtgctgac 2460
ggccaacctg gtgctaaagg cgaacctggt gatgctggtg ctaaaggcga tgctggtccc 2520
cctggccctg ccggacccgc tggaccccct ggccccattg gtaatgttgg tgctcctgga 2580
gccaaaggtg ctcgcggcag cgctggtccc cctggtgcta ctggtttccc tggtgctgct 2640
ggccgagtcg gtcctcctgg cccctctgga aatgctggac cccctggccc tcctggtcct 2700
gctggcaaag aaggcggcaa aggtccccgt ggtgagactg gccctgctgg acgtcctggt 2760
gaagttggtc cccctggtcc ccctggccct gctggcgaga aaggatcccc tggtgctgat 2820
ggtcctgctg gtgctcctgg tactcccggg cctcaaggta ttgctggaca gcgtggtgtg 2880
gtcggcctgc ctggtcagag aggagagaga ggcttccctg gtcttcctgg cccctctggt 2940
gaacctggca aacaaggtcc ctctggagca agtggtgaac gtggtccccc tggtcccatg 3000
ggcccccctg gattggctgg accccctggt gaatctggac gtgagggggc tcctggtgcc 3060
gaaggttccc ctggacgaga cggttctcct ggcgccaagg gtgaccgtgg tgagaccggc 3120
cccgctggac cccctggtgc tcctggtgct cctggtgccc ctggccccgt tggccctgct 3180
ggcaagagtg gtgatcgtgg tgagactggt cctgctggtc ccgccggtcc tgtcggccct 3240
gttggcgccc gtggccccgc cggaccccaa ggcccccgtg gtgacaaggg tgagacaggc 3300
gaacagggcg acagaggcat aaagggtcac cgtggcttct ctggcctcca gggtccccct 3360
ggccctcctg gctctcctgg tgaacaaggt ccctctggag cctctggtcc tgctggtccc 3420
cgaggtcccc ctggctctgc tggtgctcct ggcaaagatg gactcaacgg tctccctggc 3480
cccattgggc cccctggtcc tcgcggtcgc actggtgatg ctggtcctgt tggtcccccc 3540
ggccctcctg gacctcctgg tccccctggt cctcccagcg ctggtttcga cttcagcttc 3600
ctgccccagc cacctcaaga gaaggctcac gatggtggcc gctactaccg ggctgatgat 3660
gccaatgtgg ttcgtgaccg tgacctcgag gtggacacca ccctcaagag cctgagccag 3720
cagatcgaga acatccggag cccagagggc agccgcaaga accccgcccg cacctgccgt 3780
gacctcaaga tgtgccactc tgactggaag agtggagagt actggattga ccccaaccaa 3840
ggctgcaacc tggatgccat caaagtcttc tgcaacatgg agactggtga gacctgcgtg 3900
taccccactc agcccagtgt ggcccagaag aactggtaca tcagcaagaa ccccaaggac 3960
aagaggcatg tctggttcgg cgagagcatg accgatggat tccagttcga gtatggcggc 4020
cagggctccg accctgccga tgtggccatc cagctgacct tcctgcgcct gatgtccacc 4080
gaggcctccc agaacatcac ctaccactgc aagaacagcg tggcctacat ggaccagcag 4140
actggcaacc tcaagaaggc cctgctcctc cagggctcca acgagatcga gatccgcgcc 4200
gagggcaaca gccgcttcac ctacagcgtc actgtcgatg gctgcacgag tcacaccgga 4260
gcctggggca agacagtgat tgaatacaaa accaccaaga cctcccgcct gcccatcatc 4320
gatgtggccc ccttggacgt tggtgcccca gaccaggaat tcggcttcga cgttggccct 4380
gtctgcttcc tgtaa 4395
<210> 2
<211> 4395
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 2
atgttcagct tcgtggacct gagactgctg ctgctcctgg ctgctacagc cctgctgaca 60
cacggacaag aggaaggcca ggtcgaagga caggacgagg acatccctcc tatcacctgt 120
gtgcagaacg gcctgagata ccacgaccgg gatgtgtgga agcccgagcc ttgcagaatc 180
tgcgtgtgcg acaatggcaa ggtgctgtgc gacgacgtga tctgcgacga gacaaagaat 240
tgccctggcg ccgaagtgcc tgagggcgaa tgttgtcctg tgtgccctga tggcagcgag 300
agccccacag atcaagagac aacaggcgtg gaaggcccca agggcgatac aggacctaga 360
ggtcctagag gacctgccgg acctcctggc agagatggaa ttcctggaca gcctggactg 420
cccggaccac ctggacctcc agggcctcca ggtccaccag gactcggagg aaattttgcc 480
ccacagctga gctacggcta cgacgagaaa agcacaggcg gcatctctgt gcctggacct 540
atgggacctt ctggcccaag aggacttcct ggtcctcctg gtgctccagg acctcaggga 600
tttcaaggac caccaggcga acctggcgaa ccaggcgcta gtggtccaat gggaccaaga 660
ggccctcctg ggccaccagg caaaaatggc gacgatggcg aagccggaaa gcctggaagg 720
cctggcgaaa gaggcccgcc aggaccgcaa ggcgctagag ggttgcctgg aactgcagga 780
ctgcctggca tgaagggcca cagaggcttt tctggactgg atggcgctaa gggcgacgct 840
ggaccagcag gacctaaagg cgagcctgga tctcctggcg agaatggtgc acctggacag 900
atgggtccca gaggattgcc aggcgagaga ggtagacctg gcgctccggg accagccggt 960
gctagaggaa atgatggcgc aacaggtgct gctgggcctc ctggaccaac cggaccagct 1020
ggcccacctg gatttccagg cgctgttgga gcaaagggcg aagcaggccc acaaggacct 1080
aggggatctg aaggtcctca gggcgttaga ggcgagccag ggccacctgg gcctgccggt 1140
gcagctggac ctgctggaaa ccctggtgct gatggacagc caggtgccaa aggtgctaat 1200
ggcgcccctg gaattgccgg cgctccaggt tttcccggcg caagagggcc atctggacct 1260
caaggcccag gcggacctcc gggtcctaag ggaaatagcg gagagccagg cgctcctggg 1320
agtaaaggcg atactggcgc aaaaggcgaa cccggacctg tgggagttca aggacctcct 1380
ggaccagctg gcgaggaagg caaaagaggc gctaggggag aaccaggacc aacagggctc 1440
cctggtccac ctggcgagcg cggaggacct ggatctagag gattccctgg cgcagatggc 1500
gtggccggac caaaaggacc tgcaggcgaa aggggatcac caggtcctgc aggccctaag 1560
ggttctccag gcgaggctgg cagacccggc gaagctggac tcccaggtgc taagggactg 1620
acaggctcac caggatctcc cggaccagac ggaaaaacag gacctccagg accggcagga 1680
caggatggta gacccggtcc tcctggaccg cctggtgcaa gaggacaagc tggcgtgatg 1740
ggctttcctg gaccaaaagg tgcagccggc gaacctggaa aagcaggcga gaggggagtt 1800
cccggacctc caggtgctgt tggacctgcc ggaaaagatg gcgaagctgg tgcacaaggt 1860
cctccagggc cagccggacc agccggcgag agaggcgaac aaggaccagc cggatctcca 1920
ggatttcagg gactgccagg gcctgctggc ccgcctggcg aggcagggaa gccaggcgaa 1980
cagggtgttc ctggcgatct tggagcccct ggtcctagcg gagctagagg cgaaagagga 2040
tttcctggcg aaaggggcgt tcagggtcca ccgggaccag ctggaccaag gggtgcaaat 2100
ggtgccccag gcaatgacgg tgctaaaggc gacgcaggcg ccccaggtgc tcctggatct 2160
caaggcgcac ctggacttca gggaatgcct ggcgaacggg gagctgctgg acttcccggt 2220
ccaaaaggcg ataggggaga tgctggtcct aagggcgctg atggctctcc tggaaaggat 2280
ggcgtcagag gcctgacagg cccaattggc cctccgggac ctgctggcgc tccaggcgat 2340
aagggcgaat ctggacctag tggacccgct ggtcctacag gtgctagggg agccccaggc 2400
gaccggggag agcctggtcc accaggacct gctggatttg ctggacctcc tggcgctgat 2460
ggtcaacctg gtgctaaggg cgagccaggc gacgctggtg caaaaggcga cgctggtcca 2520
cctggaccgg ccggacctgc tgggccgcca ggacctattg gaaatgttgg tgcccctggc 2580
gccaaaggcg caagaggatc tgctggccca ccaggcgcta caggattccc aggtgccgct 2640
ggaagagttg gaccaccggg gccaagtgga aatgctggac caccgggacc gccaggacca 2700
gccggcaaag aaggtggaaa aggccctagg ggcgaaactg gccctgcagg caggccaggc 2760
gaagtgggcc ctccaggacc tccggggcct gccggcgaaa aaggatctcc aggcgcagat 2820
ggacccgcag gcgctcccgg aacaccaggt ccacagggaa ttgctggaca aaggggagtt 2880
gtcggcctgc caggacagag gggagagaga ggttttccag gactccctgg gccaagcgga 2940
gaacctggca aacagggacc atctggtgcc agcggagaga gagggccacc aggaccaatg 3000
ggtcctccag gattggcagg gcctcctggc gaatctggta gagaaggtgc tccaggcgcc 3060
gagggatctc ctggacgtga tggttctcct ggcgccaagg gcgatagagg cgaaacaggc 3120
ccagctggac ctccaggcgc acccggcgct ccaggcgcac caggacctgt tggccctgct 3180
ggaaaatctg gcgacagagg cgaaactgga cccgcaggac cagccggacc tgttggacct 3240
gtgggtgcta gaggacccgc tggaccacaa ggtcctagag gcgacaaggg cgaaacaggc 3300
gagcaaggcg acagaggcat caagggacac agaggattca gcggactgca gggaccacca 3360
gggccgcctg gaagtcccgg cgagcaggga ccaagcggag ctagtggtcc cgccggacct 3420
agaggaccac ctggttctgc tggtgcaccc ggaaaggacg gactgaatgg gctccccgga 3480
cctattgggc cacctggacc tagaggaaga acaggcgacg caggaccagt tggaccacct 3540
gggccacctg gaccgcctgg tcctcctgga cctccttctg ccggattcga cttcagcttc 3600
ctgcctcagc ctcctcaaga gaaggcccat gacggcggca gatattacag agccgacgac 3660
gccaacgtcg tgcgggacag agatctggaa gtggacacca cactgaagtc cctgtctcag 3720
cagatcgaga acatcagaag ccccgagggc agcagaaaga accctgccag aacctgtcgg 3780
gacctgaaga tgtgccacag cgattggaag tctggcgagt actggatcga ccccaaccag 3840
ggctgcaacc tggatgccat caaggtgttc tgcaacatgg aaaccggcga gacatgcgtg 3900
taccccacac agccatctgt ggctcagaag aactggtaca tcagcaagaa ccccaaggac 3960
aagcggcacg tttggttcgg cgagagcatg accgatggct tccagtttga gtatggcggc 4020
cagggctctg accctgccga tgttgctatc cagctgacct tcctgcggct gatgtctaca 4080
gaggccagcc agaacatcac ctaccactgc aagaacagcg tggcctacat ggatcagcag 4140
accggcaacc tgaagaaggc actgctgctt cagggcagca acgagatcga gatcagagcc 4200
gagggcaaca gccggttcac ctacagcgtg acagtggatg gctgcaccag ccatacaggc 4260
gcttggggca agaccgtgat cgagtacaag accaccaaga ccagcagact gcccatcatc 4320
gatgtggccc ctctggatgt tggggcaccc gatcaagagt tcggcttcga tgtgggccca 4380
gtgtgcttcc tgtaa 4395
<210> 3
<211> 4101
<212> DNA
<213> 智人(Homo sapiens)
<400> 3
atgctcagct ttgtggatac gcggactttg ttgctgcttg cagtaacctt atgcctagca 60
acatgccaat ctttacaaga ggaaactgta agaaagggcc cagccggaga tagaggacca 120
cgtggagaaa ggggtccacc aggcccccca ggcagagatg gtgaagatgg tcccacaggc 180
cctcctggtc cacctggtcc tcctggcccc cctggtctcg gtgggaactt tgctgctcag 240
tatgatggaa aaggagttgg acttggccct ggaccaatgg gcttaatggg acctagaggc 300
ccacctggtg cagctggagc cccaggccct caaggtttcc aaggacctgc tggtgagcct 360
ggtgaacctg gtcaaactgg tcctgcaggt gctcgtggtc cagctggccc tcctggcaag 420
gctggtgaag atggtcaccc tggaaaaccc ggacgacctg gtgagagagg agttgttgga 480
ccacagggtg ctcgtggttt ccctggaact cctggacttc ctggcttcaa aggcattagg 540
ggacacaatg gtctggatgg attgaaggga cagcccggtg ctcctggtgt gaagggtgaa 600
cctggtgccc ctggtgaaaa tggaactcca ggtcaaacag gagcccgtgg gcttcctggt 660
gagagaggac gtgttggtgc ccctggccca gctggtgccc gtggcagtga tggaagtgtg 720
ggtcccgtgg gtcctgctgg tcccattggg tctgctggcc ctccaggctt cccaggtgcc 780
cctggcccca agggtgaaat tggagctgtt ggtaacgctg gtcctgctgg tcccgccggt 840
ccccgtggtg aagtgggtct tccaggcctc tccggccccg ttggacctcc tggtaatcct 900
ggagcaaacg gccttactgg tgccaagggt gctgctggcc ttcccggcgt tgctggggct 960
cccggcctcc ctggaccccg cggtattcct ggccctgttg gtgctgccgg tgctactggt 1020
gccagaggac ttgttggtga gcctggtcca gctggctcca aaggagagag cggtaacaag 1080
ggtgagcccg gctctgctgg gccccaaggt cctcctggtc ccagtggtga agaaggaaag 1140
agaggcccta atggggaagc tggatctgcc ggccctccag gacctcctgg gctgagaggt 1200
agtcctggtt ctcgtggtct tcctggagct gatggcagag ctggcgtcat gggccctcct 1260
ggtagtcgtg gtgcaagtgg ccctgctgga gtccgaggac ctaatggaga tgctggtcgc 1320
cctggggagc ctggtctcat gggacccaga ggtcttcctg gttcccctgg aaatatcggc 1380
cccgctggaa aagaaggtcc tgtcggcctc cctggcatcg acggcaggcc tggcccaatt 1440
ggcccagctg gagcaagagg agagcctggc aacattggat tccctggacc caaaggcccc 1500
actggtgatc ctggcaaaaa cggtgataaa ggtcatgctg gtcttgctgg tgctcggggt 1560
gctccaggtc ctgatggaaa caatggtgct cagggacctc ctggaccaca gggtgttcaa 1620
ggtggaaaag gtgaacaggg tccccctggt cctccaggct tccagggtct gcctggcccc 1680
tcaggtcccg ctggtgaagt tggcaaacca ggagaaaggg gtctccatgg tgagtttggt 1740
ctccctggtc ctgctggtcc aagaggggaa cgcggtcccc caggtgagag tggtgctgcc 1800
ggtcctactg gtcctattgg aagccgaggt ccttctggac ccccagggcc tgatggaaac 1860
aagggtgaac ctggtgtggt tggtgctgtg ggcactgctg gtccatctgg tcctagtgga 1920
ctcccaggag agaggggtgc tgctggcata cctggaggca agggagaaaa gggtgaacct 1980
ggtctcagag gtgaaattgg taaccctggc agagatggtg ctcgtggtgc tcctggtgct 2040
gtaggtgccc ctggtcctgc tggagccaca ggtgaccggg gcgaagctgg ggctgctggt 2100
cctgctggtc ctgctggtcc tcggggaagc cctggtgaac gtggtgaggt cggtcctgct 2160
ggccccaatg gatttgctgg tcctgctggt gctgctggtc aacctggtgc taaaggagaa 2220
agaggagcca aagggcctaa gggtgaaaac ggtgttgttg gtcccacagg ccccgttgga 2280
gctgctggcc cagctggtcc aaatggtccc cccggtcctg ctggaagtcg tggtgatgga 2340
ggcccccctg gtatgactgg tttccctggt gctgctggac ggactggtcc cccaggaccc 2400
tctggtattt ctggccctcc tggtccccct ggtcctgctg ggaaagaagg gcttcgtggt 2460
cctcgtggtg accaaggtcc agttggccga actggagaag taggtgcagt tggtccccct 2520
ggcttcgctg gtgagaaggg tccctctgga gaggctggta ctgctggacc tcctggcact 2580
ccaggtcctc agggtcttct tggtgctcct ggtattctgg gtctccctgg ctcgagaggt 2640
gaacgtggtc taccaggtgt tgctggtgct gtgggtgaac ctggtcctct tggcattgcc 2700
ggccctcctg gggcccgtgg tcctcctggt gctgtgggta gtcctggagt caacggtgct 2760
cctggtgaag ctggtcgtga tggcaaccct gggaacgatg gtcccccagg tcgcgatggt 2820
caacccggac acaagggaga gcgcggttac cctggcaata ttggtcccgt tggtgctgca 2880
ggtgcacctg gtcctcatgg ccccgtgggt cctgctggca aacatggaaa ccgtggtgaa 2940
actggtcctt ctggtcctgt tggtcctgct ggtgctgttg gcccaagagg tcctagtggc 3000
ccacaaggca ttcgtggcga taagggagag cccggtgaaa aggggcccag aggtcttcct 3060
ggcttaaagg gacacaatgg attgcaaggt ctgcctggta tcgctggtca ccatggtgat 3120
caaggtgctc ctggctccgt gggtcctgct ggtcctaggg gccctgctgg tccttctggc 3180
cctgctggaa aagatggtcg cactggacat cctggtacag ttggacctgc tggcattcga 3240
ggccctcagg gtcaccaagg ccctgctggc ccccctggtc cccctggccc tcctggacct 3300
ccaggtgtaa gcggtggtgg ttatgacttt ggttacgatg gagacttcta cagggctgac 3360
cagcctcgct cagcaccttc tctcagaccc aaggactatg aagttgatgc tactctgaag 3420
tctctcaaca accagattga gacccttctt actcctgaag gctctagaaa gaacccagct 3480
cgcacatgcc gtgacttgag actcagccac ccagagtgga gcagtggtta ctactggatt 3540
gaccctaacc aaggatgcac tatggatgct atcaaagtat actgtgattt ctctactggc 3600
gaaacctgta tccgggccca acctgaaaac atcccagcca agaactggta taggagctcc 3660
aaggacaaga aacacgtctg gctaggagaa actatcaatg ctggcagcca gtttgaatat 3720
aatgtagaag gagtgacttc caaggaaatg gctacccaac ttgccttcat gcgcctgctg 3780
gccaactatg cctctcagaa catcacctac cactgcaaga acagcattgc atacatggat 3840
gaggagactg gcaacctgaa aaaggctgtc attctacagg gctctaatga tgttgaactt 3900
gttgctgagg gcaacagcag gttcacttac actgttcttg tagatggctg ctctaaaaag 3960
acaaatgaat ggggaaagac aatcattgaa tacaaaacaa ataagccatc acgcctgccc 4020
ttccttgata ttgcaccttt ggacatcggt ggtgctgacc aggaattctt tgtggacatt 4080
ggcccagtct gtttcaaata a 4101
<210> 4
<211> 4101
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 4
atgctgagct tcgtggacac cagaacactg ctgctgctgg ccgtgacact gtgtctggcc 60
acttgtcaga gcctgcaaga ggaaacagtg cggaaaggac ctgccggcga tagaggacct 120
agaggcgaaa gaggtcctcc tggacctcct ggtagagatg gcgaggatgg acctacagga 180
ccacctggtc caccaggacc tccagggcct cctggccttg gaggaaattt tgccgctcag 240
tacgatggca aaggcgtcgg acttggccct ggacctatgg gacttatggg cccaagagga 300
ccaccaggtg ctgcaggcgc tccaggacca caaggatttc aaggaccagc tggcgagcct 360
ggcgaacctg gacaaacagg tcctgctggt gctagaggac cagccgggcc acctggaaaa 420
gctggcgaag atgggcaccc tggaaagcct ggtagacccg gcgaaagggg tgttgttgga 480
cctcaaggcg ccagaggctt tcctggaaca cctggactgc ctggcttcaa gggcatcaga 540
ggccacaatg gcctggacgg actgaaagga caacctggtg ctcctggcgt gaaaggcgaa 600
ccaggcgcac ctggcgaaaa tggcacacca ggacaaaccg gcgcaagagg acttcctggc 660
gagagaggaa gagttggagc cccaggtcca gcaggcgcac gaggatctga tggatctgtg 720
ggacctgttg gccctgccgg acctattgga agtgctggcc ctcctggatt tcctggcgca 780
cccggaccaa agggcgaaat tggagctgtg ggaaacgccg gacctgcagg cccagctgga 840
ccaaggggag aagttggatt gcctggactg agcggaccag ttgggccacc agggaatcct 900
ggtgccaatg gactgacagg cgctaaaggt gcagctggcc ttccaggcgt tgccggtgca 960
ccaggactgc caggaccaag aggtatccct ggtcctgttg gagctgctgg cgctacgggt 1020
gccagaggac ttgttggaga acctgggcca gccggatcta agggcgagtc tggaaacaag 1080
ggcgagccag gatctgctgg tccacaaggc ccgcctggac catcaggcga agaaggcaaa 1140
cgaggcccta atggcgaagc cggtagtgcc gggcctcctg gaccaccagg ccttagagga 1200
tctcctggct ctagaggatt gccaggcgct gatggtagag caggcgttat gggtccacct 1260
ggatcaagag gcgcttctgg ccctgctggc gttagaggtc caaatggcga cgctggcaga 1320
ccaggcgagc ccggtcttat ggggcctaga gggttgcctg gaagccctgg caatatcggc 1380
ccagccggaa aagaaggccc tgttggactc cctggcatcg acggtagacc tggaccaatc 1440
ggacccgcag gcgctagggg agagcctgga aatattggct tccctgggcc taaaggcccc 1500
acaggcgatc ctggaaagaa cggcgataag ggccatgctg gactcgctgg tgcaagggga 1560
gcacctggac ctgacggaaa caatggtgct caagggccgc ctgggccaca aggtgttcaa 1620
ggtggaaaag gcgagcaggg cccacctggg cctccaggct tccaaggact tcccggacca 1680
tctgggccag caggcgaagt tggaaagcct ggcgaaagag gactgcacgg cgagtttggc 1740
ttgccgggtc ctgccggtcc acggggagag agaggccctc caggcgaatc tggcgccgca 1800
ggacctactg gccctatcgg aagcagagga cctagtggac ctccaggacc tgatggcaac 1860
aaaggcgaac ctggtgttgt gggcgctgtg ggaacagctg gaccttctgg tccttctgga 1920
ttgcccggcg agcgcggagc agctggtatt cctggtggca aaggcgaaaa gggcgagcct 1980
ggactcagag gcgagatcgg caatcccgga cgagatggcg ctagaggcgc cccaggtgca 2040
gttggtgccc cgggacctgc tggcgcaaca ggcgacagag gcgaggctgg tgccgctggt 2100
cctgccgggc cagccggtcc tagaggaagt ccaggcgaga ggggcgaagt gggacccgct 2160
ggacccaatg gatttgctgg gcccgctggc gctgctggtc aacctggcgc caaaggcgag 2220
cggggagcta aaggtcctaa aggcgagaat ggcgtcgtgg gccctactgg accagtggga 2280
gcagcaggcc ccgcaggtcc taacggacca cctggaccag ctgggtctag aggcgacggc 2340
ggaccgcctg gaatgacagg ttttccaggc gccgctggaa gaacaggtcc tccaggacca 2400
tctggcatct ctggtccacc agggccacct ggtcctgctg gaaaagaagg actgagaggc 2460
cctaggggcg atcagggtcc agttggaaga accggcgaag tcggagctgt cggcccacca 2520
ggttttgccg gcgaaaaagg ccctagcgga gaagctggaa ctgcaggacc gccgggaact 2580
cccggtcctc aaggattgct tggcgcccct ggaattctgg gactgcccgg tagtcgcgga 2640
gaacgtggac tcccaggtgt tgctggcgcc gtcggagaac cgggaccact tggaattgct 2700
ggaccacctg gtgcaagagg tccacctggt gcagttggaa gtcctggcgt taacggtgct 2760
ccaggcgaag ccggcagaga tggaaatccc ggcaatgatg gcccgcctgg gagagatgga 2820
cagcctggac ataagggcga gcgaggctac ccaggcaata ttggacctgt cggcgcagcc 2880
ggtgctcccg gacctcatgg tccagtcggt ccagccggga agcacggaaa taggggagaa 2940
acaggaccct ccggtcctgt tggcccagct ggcgcagttg gaccaagagg cccatccgga 3000
cctcagggaa tccgcggaga taagggcgaa cctggcgaga agggacctag aggactgcct 3060
gggctgaaag gccataacgg actgcaaggc ctgccaggca ttgctggcca tcatggcgat 3120
caaggtgcac ccggtagtgt gggtcccgcc ggaccgaggg gtcccgctgg tccatctgga 3180
cccgccggaa aagatggcag aacaggacat cctggcacag tggggcctgc cggaattaga 3240
ggcccacagg gacatcaagg ccccgctggg ccgccaggac ctccgggacc gccagggcca 3300
ccaggcgtta gtggcggagg atacgatttc ggctacgacg gcgacttcta cagagccgac 3360
cagcctagat ctgcccctag cctgaggcct aaggactacg aagtggacgc cacactgaag 3420
tccctgaaca accagatcga gacactgctg acccctgagg gcagcagaaa gaaccctgcc 3480
agaacctgca gggacctgag actgtctcac cccgaatggt cctccggcta ctactggatc 3540
gaccccaatc agggctgcac catggacgcc atcaaggtgt actgcgactt cagcaccggc 3600
gagacatgca tcagagccca gcctgagaac atccccgcca agaactggta cagaagcagc 3660
aaggacaaga aacacgtgtg gctgggcgag acaatcaacg ccggcagcca gttcgagtac 3720
aacgtggaag gcgtgaccag caaagagatg gccacacagc tggctttcat gagactgctg 3780
gccaattacg ccagccagaa catcacctac cactgcaaga acagcattgc ctacatggac 3840
gaggaaaccg gcaacctgaa gaaagccgtg atcctgcagg gctctaacga cgtggaactg 3900
gtggccgagg gcaacagcag attcacctac accgtgctgg tggacggctg cagcaaaaag 3960
accaacgagt ggggcaagac catcatcgag tataagacca acaagcccag cagactgccc 4020
ttcctggata tcgccccact ggatattgga ggcgccgacc aagagttctt tgtggacatc 4080
ggccccgtgt gcttcaagtg a 4101
<210> 5
<211> 4401
<212> DNA
<213> 智人(Homo sapiens)
<400> 5
atgatgagct ttgtgcaaaa ggggagctgg ctacttctcg ctctgcttca tcccactatt 60
attttggcac aacaggaagc tgttgaagga ggatgttccc atcttggtca gtcctatgcg 120
gatagagatg tctggaagcc agaaccatgc caaatatgtg tctgtgactc aggatccgtt 180
ctctgcgatg acataatatg tgacgatcaa gaattagact gccccaaccc agaaattcca 240
tttggagaat gttgtgcagt ttgcccacag cctccaactg ctcctactcg ccctcctaat 300
ggtcaaggac ctcaaggccc caagggagat ccaggccctc ctggtattcc tgggagaaat 360
ggtgaccctg gtattccagg acaaccaggg tcccctggtt ctcctggccc ccctggaatc 420
tgtgaatcat gccctactgg tcctcagaac tattctcccc agtatgattc atatgatgtc 480
aagtctggag tagcagtagg aggactcgca ggctatcctg gaccagctgg ccccccaggc 540
cctcccggtc cccctggtac atctggtcat cctggttccc ctggatctcc aggataccaa 600
ggaccccctg gtgaacctgg gcaagctggt ccttcaggcc ctccaggacc tcctggtgct 660
ataggtccat ctggtcctgc tggaaaagat ggagaatcag gtagacccgg acgacctgga 720
gagcgaggat tgcctggacc tccaggtatc aaaggtccag ctgggatacc tggattccct 780
ggtatgaaag gacacagagg cttcgatgga cgaaatggag aaaagggtga aacaggtgct 840
cctggattaa agggtgaaaa tggtcttcca ggcgaaaatg gagctcctgg acccatgggt 900
ccaagagggg ctcctggtga gcgaggacgg ccaggacttc ctggggctgc aggtgctcgg 960
ggtaatgacg gtgctcgagg cagtgatggt caaccaggcc ctcctggtcc tcctggaact 1020
gccggattcc ctggatcccc tggtgctaag ggtgaagttg gacctgcagg gtctcctggt 1080
tcaaatggtg cccctggaca aagaggagaa cctggacctc agggacacgc tggtgctcaa 1140
ggtcctcctg gccctcctgg gattaatggt agtcctggtg gtaaaggcga aatgggtccc 1200
gctggcattc ctggagctcc tggactgatg ggagcccggg gtcctccagg accagccggt 1260
gctaatggtg ctcctggact gcgaggtggt gcaggtgagc ctggtaagaa tggtgccaaa 1320
ggagagcccg gaccacgtgg tgaacgcggt gaggctggta ttccaggtgt tccaggagct 1380
aaaggcgaag atggcaagga tggatcacct ggagaacctg gtgcaaatgg gcttccagga 1440
gctgcaggag aaaggggtgc ccctgggttc cgaggacctg ctggaccaaa tggcatccca 1500
ggagaaaagg gtcctgctgg agagcgtggt gctccaggcc ctgcagggcc cagaggagct 1560
gctggagaac ctggcagaga tggcgtccct ggaggtccag gaatgagggg catgcccgga 1620
agtccaggag gaccaggaag tgatgggaaa ccagggcctc ccggaagtca aggagaaagt 1680
ggtcgaccag gtcctcctgg gccatctggt ccccgaggtc agcctggtgt catgggcttc 1740
cccggtccta aaggaaatga tggtgctcct ggtaagaatg gagaacgagg tggccctgga 1800
ggacctggcc ctcagggtcc tcctggaaag aatggtgaaa ctggacctca gggaccccca 1860
gggcctactg ggcctggtgg tgacaaagga gacacaggac cccctggtcc acaaggatta 1920
caaggcttgc ctggtacagg tggtcctcca ggagaaaatg gaaaacctgg ggaaccaggt 1980
ccaaagggtg atgccggtgc acctggagct ccaggaggca agggtgatgc tggtgcccct 2040
ggtgaacgtg gacctcctgg attggcaggg gccccaggac ttagaggtgg agctggtccc 2100
cctggtcccg aaggaggaaa gggtgctgct ggtcctcctg ggccacctgg tgctgctggt 2160
actcctggtc tgcaaggaat gcctggagaa agaggaggtc ttggaagtcc tggtccaaag 2220
ggtgacaagg gtgaaccagg cggtccaggt gctgatggtg tcccagggaa agatggccca 2280
aggggtccta ctggtcctat tggtcctcct ggcccagctg gccagcctgg agataagggt 2340
gaaggtggtg cccccggact tccaggtata gctggacctc gtggtagccc tggtgagaga 2400
ggtgaaactg gccctccagg acctgctggt ttccctggtg ctcctggaca gaatggtgaa 2460
cctggtggta aaggagaaag aggggctccg ggtgagaaag gtgaaggagg ccctcctgga 2520
gttgcaggac cccctggagg ttctggacct gctggtcctc ctggtcccca aggtgtcaaa 2580
ggtgaacgtg gcagtcctgg tggacctggt gctgctggct tccctggtgc tcgtggtctt 2640
cctggtcctc ctggtagtaa tggtaaccca ggacccccag gtcccagcgg ttctccaggc 2700
aaggatgggc ccccaggtcc tgcgggtaac actggtgctc ctggcagccc tggagtgtct 2760
ggaccaaaag gtgatgctgg ccaaccagga gagaagggat cgcctggtgc ccagggccca 2820
ccaggagctc caggcccact tgggattgct gggatcactg gagcacgggg tcttgcagga 2880
ccaccaggca tgccaggtcc taggggaagc cctggccctc agggtgtcaa gggtgaaagt 2940
gggaaaccag gagctaacgg tctcagtgga gaacgtggtc cccctggacc ccagggtctt 3000
cctggtctgg ctggtacagc tggtgaacct ggaagagatg gaaaccctgg atcagatggt 3060
cttccaggcc gagatggatc tcctggtggc aagggtgatc gtggtgaaaa tggctctcct 3120
ggtgcccctg gcgctcctgg tcatccaggc ccacctggtc ctgtcggtcc agctggaaag 3180
agtggtgaca gaggagaaag tggccctgct ggccctgctg gtgctcccgg tcctgctggt 3240
tcccgaggtg ctcctggtcc tcaaggccca cgtggtgaca aaggtgaaac aggtgaacgt 3300
ggagctgctg gcatcaaagg acatcgagga ttccctggta atccaggtgc cccaggttct 3360
ccaggccctg ctggtcagca gggtgcaatc ggcagtccag gacctgcagg ccccagagga 3420
cctgttggac ccagtggacc tcctggcaaa gatggaacca gtggacatcc aggtcccatt 3480
ggaccaccag ggcctcgagg taacagaggt gaaagaggat ctgagggctc cccaggccac 3540
ccagggcaac caggccctcc tggacctcct ggtgcccctg gtccttgctg tggtggtgtt 3600
ggagccgctg ccattgctgg gattggaggt gaaaaagctg gcggttttgc cccgtattat 3660
ggagatgaac caatggattt caaaatcaac accgatgaga ttatgacttc actcaagtct 3720
gttaatggac aaatagaaag cctcattagt cctgatggtt ctcgtaaaaa ccccgctaga 3780
aactgcagag acctgaaatt ctgccatcct gaactcaaga gtggagaata ctgggttgac 3840
cctaaccaag gatgcaaatt ggatgctatc aaggtattct gtaatatgga aactggggaa 3900
acatgcataa gtgccaatcc tttgaatgtt ccacggaaac actggtggac agattctagt 3960
gctgagaaga aacacgtttg gtttggagag tccatggatg gtggttttca gtttagctac 4020
ggcaatcctg aacttcctga agatgtcctt gatgtgcagc tggcattcct tcgacttctc 4080
tccagccgag cttcccagaa catcacatat cactgcaaaa atagcattgc atacatggat 4140
caggccagtg gaaatgtaaa gaaggccctg aagctgatgg ggtcaaatga aggtgaattc 4200
aaggctgaag gaaatagcaa attcacctac acagttctgg aggatggttg cacgaaacac 4260
actggggaat ggagcaaaac agtctttgaa tatcgaacac gcaaggctgt gagactacct 4320
attgtagata ttgcacccta tgacattggt ggtcctgatc aagaatttgg tgtggacgtt 4380
ggccctgttt gctttttata a 4401
<210> 6
<211> 4401
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 6
atgatgagct tcgtgcagaa aggcagctgg ctgctgctgg cactgctgca ccctacaatc 60
attctggccc agcaagaggc cgtggaaggc ggatgttctc acctgggaca gagctacgcc 120
gacagggatg tgtggaagcc tgagccttgc cagatctgcg tgtgtgatag cggcagcgtg 180
ctgtgcgacg acatcatctg cgacgaccaa gagctggact gccccaatcc tgagatccct 240
ttcggcgagt gctgtgccgt ttgtccccaa cctcctaccg ctcctaccag acctcctaat 300
ggacagggac ctcagggccc taaaggcgat cctggacctc ctggaatccc cggcagaaat 360
ggcgatccag gcattcctgg acagcctggc tctcctggaa gtccaggtcc acctggcatc 420
tgcgagagct gtcctacagg ccctcagaac tacagcccac agtacgacag ctacgacgtg 480
aagtctggcg tggccgttgg aggactggct ggttatccag gacctgctgg accaccaggg 540
cctccaggac cgcctggaac aagtggacat ccaggatctc ccggcagtcc cggttatcag 600
ggaccacctg gcgaacctgg acaggcagga cctagtggtc ctcctggtcc accaggtgcc 660
attggaccat ctggacctgc cggaaaggat ggcgaatctg gcagaccagg cagacctggc 720
gagagaggat tgcctggtcc tccgggtatt aagggcccag ccggcattcc aggattcccc 780
ggaatgaagg gccacagagg cttcgatgga cggaatggcg agaagggcga aacaggtgcc 840
cctggactga aaggcgaaaa tggactgcca ggcgagaatg gcgcacccgg acctatggga 900
cctagaggtg ctccaggcga aagaggaagg ccaggacttc ctggtgctgc aggcgctaga 960
ggcaatgatg gcgccagagg atctgatggc caacctgggc cgccaggacc tccaggcaca 1020
gctggctttc ccggatctcc tggtgcaaag ggcgaagtgg gaccagctgg aagccctgga 1080
tctaatggtg ccccaggaca gaggggagaa ccaggaccac aaggacatgc tggtgctcaa 1140
ggccctccgg gtcctccagg gatcaatgga tctccaggcg gcaaaggcga gatgggccct 1200
gctggaattc ctggcgctcc aggtcttatg ggagccagag ggccacctgg accagcaggc 1260
gcaaatggcg ctcctggact tagaggcgga gcaggcgagc ctggaaaaaa tggcgcaaaa 1320
ggcgagcccg gaccaagggg agaaagaggc gaagctggta ttccaggtgt ccctggtgcc 1380
aaaggcgagg acggcaaaga tggtagtcct ggcgagccag gcgccaatgg actccctggc 1440
gcagctggcg aaaggggagc acctggtttt agaggacccg ccggacctaa tggcattccc 1500
ggcgaaaaag gtccagccgg cgagcgtggt gctcccggac ctgcaggccc aagaggtgct 1560
gctggcgaac caggcagaga tggtgtccca ggcggaccag ggatgagagg catgccaggc 1620
tcacccggcg gacctggttc tgatggaaaa cccgggcctc ctggtagcca gggcgaatcc 1680
ggtagacccg gacctccggg accatcagga ccaagaggac aacctggcgt gatgggcttc 1740
cctggaccta agggaaatga cggcgctccc ggaaagaacg gcgaacgcgg tggccctggc 1800
ggtcccggtc ctcaagggcc accaggcaaa aacggcgaaa ccggtccaca aggaccacct 1860
ggacctacag gacctggcgg agataagggc gatacaggtc caccaggacc tcagggactg 1920
caaggactgc ctggaactgg cggacctcct ggcgagaatg gaaaaccagg cgaaccagga 1980
cctaagggcg acgctggtgc acctggcgca ccaggcggaa agggcgacgc aggcgctcca 2040
ggcgagaggg gacctccagg attggctggt gctccaggct tgagaggcgg agctggtcct 2100
ccaggacctg aaggtggaaa aggtgctgca ggacctcctg ggccacctgg cgctgctgga 2160
actccaggac ttcaagggat gcctggcgaa cgaggtggac ttggaagccc aggaccaaaa 2220
ggcgataagg gcgaacctgg cggaccgggt gcagatggtg ttcccggaaa agatggacca 2280
cggggcccaa caggacctat aggccctcca gggccagcag gacagccggg cgacaaaggc 2340
gaaggtggcg cccctggctt gcctggaatt gctggtccta gaggttcacc tggcgagcgg 2400
ggagaaacag gccctcctgg accggccgga tttcccggtg ctcctggcca aaatggcgag 2460
cctggcggaa aaggcgaaag aggtgcaccg ggcgaaaaag gcgaaggcgg acctcctggt 2520
gttgctggac ctcctggcgg atctggacca gctgggcctc ctggtcctca aggtgttaag 2580
ggcgaaagag gctctccagg cggacccggt gctgctggat ttcccggcgc aagaggattg 2640
cccggaccac caggctctaa tggcaatcca ggtcctcctg gacctagcgg ctctcctggc 2700
aaagatggcc caccaggacc agccggaaat actggtgctc ctggatcacc tggcgtgtcc 2760
ggaccgaaag gcgacgccgg acaaccaggc gaaaaaggat ctcctggcgc tcaagggcct 2820
cctggcgcac ctggtccatt gggaattgcc ggaattacag gtgccagagg cctggctggc 2880
ccacctggaa tgcctgggcc aagaggtagc ccgggacctc aaggcgtgaa aggcgaatct 2940
ggaaagcctg gcgccaacgg actgagcgga gaaagaggac ctccaggtcc acaaggcctg 3000
cctggattgg ctggaacagc tggcgaacct ggaagagatg gcaatcctgg ctctgatggc 3060
ttgccgggga gagatggctc cccaggtggc aagggcgatc gcggagaaaa tggtagccca 3120
ggcgctcccg gcgctccagg acacccagga ccacctggtc cagtcggacc tgctggaaag 3180
tctggcgata gaggcgagtc tggacccgca ggtcccgctg gcgccccagg gcctgccgga 3240
tctaggggag cccctggacc gcaaggacct aggggagaca aaggcgagac tggcgaacgc 3300
ggagccgctg gaatcaaagg ccatagagga ttcccaggca accctggtgc acccggatca 3360
ccaggaccgg caggacaaca aggcgctatt ggcagtccgg ggcctgctgg gccgagagga 3420
ccagttggac ctagtggacc accgggcaaa gatggaacaa gcggacaccc tggacctatc 3480
ggaccaccag gacctagagg caatagaggc gagagaggca gcgagggatc tcccggacat 3540
cctggacaac ccggtccacc ggggccacca ggcgcaccag ggccatgttg tggcggagtt 3600
ggagctgctg ccattgctgg aatcggcgga gagaaagccg gcggatttgc cccttattac 3660
ggcgacgagc ccatggattt caagatcaac accgacgaga tcatgaccag cctgaagtcc 3720
gtgaacggcc agatcgagag cctgatcagc cctgacggca gcagaaagaa ccccgccaga 3780
aactgccgcg acctgaagtt ctgtcacccc gagctgaaaa gcggcgagta ctgggttgac 3840
cccaaccagg gctgtaaact ggacgccatt aaggtgttct gcaacatgga aaccggcgag 3900
acatgcatca gcgccaatcc tctgaacgtg cccagaaagc actggtggac agatagcagc 3960
gccgagaaga agcacgtttg gttcggcgag agcatggacg gcggcttcca gttctcttac 4020
ggcaatcccg agctgcccga ggacgtgctg gatgtgcaac tggcctttct gagactgctg 4080
agcagccgcg ccagccagaa tatcacctac cactgcaaga acagcattgc ctacatggat 4140
caggccagcg gcaacgtgaa gaaagccctg aagctgatgg gcagcaacga gggcgagttt 4200
aaggccgagg gcaacagcaa gttcacctac accgtgctgg aagatggctg caccaagcac 4260
acaggcgagt ggtccaagac cgtgttcgag taccggacaa gaaaggccgt gcggctgcct 4320
atcgtggata tcgcccctta cgatatcgga ggccccgatc aagagttcgg cgttgacgtg 4380
ggccctgtgt gtttcctgta a 4401
<210> 7
<211> 5010
<212> DNA
<213> 智人(Homo sapiens)
<400> 7
atggggcccc ggctcagcgt ctggctgctg ctgctgcccg ccgcccttct gctccacgag 60
gagcacagcc gggccgctgc gaagggtggc tgtgctggct ctggctgtgg caaatgtgac 120
tgccatggag tgaagggaca aaagggtgaa agaggcctcc cggggttaca aggtgtcatt 180
gggtttcctg gaatgcaagg acctgagggg ccacagggac caccaggaca aaagggtgat 240
actggagaac caggactacc tggaacaaaa gggacaagag gacctccggg agcatctggc 300
taccctggaa acccaggact tcccggaatt cctggccaag acggcccgcc aggcccccca 360
ggtattccag gatgcaatgg cacaaagggg gagagagggc cgctcgggcc tcctggcttg 420
cctggtttcg ctggaaatcc cggaccacca ggcttaccag ggatgaaggg tgatccaggt 480
gagatacttg gccatgtgcc cgggatgctg ttgaaaggtg aaagaggatt tcccggaatc 540
ccagggactc caggcccacc aggactgcca gggcttcaag gtcctgttgg gcctccagga 600
tttaccggac caccaggtcc cccaggccct cccggccctc caggtgaaaa gggacaaatg 660
ggcttaagtt ttcaaggacc aaaaggtgac aagggtgacc aaggggtcag tgggcctcca 720
ggagtaccag gacaagctca agttcaagaa aaaggagact tcgccaccaa gggagaaaag 780
ggccaaaaag gtgaacctgg atttcagggg atgccagggg tcggagagaa aggtgaaccc 840
ggaaaaccag gacccagagg caaacccgga aaagatggtg acaaagggga aaaagggagt 900
cccggttttc ctggtgaacc cgggtaccca ggactcatag gccgccaggg cccgcaggga 960
gaaaagggtg aagcaggtcc tcctggccca cctggaattg ttataggcac aggacctttg 1020
ggagaaaaag gagagagggg ctaccctgga actccggggc caagaggaga gccaggccca 1080
aaaggtttcc caggactacc aggccaaccc ggacctccag gcctccctgt acctgggcag 1140
gctggtgccc ctggcttccc tggtgaaaga ggagaaaaag gtgaccgagg atttcctggt 1200
acatctctgc caggaccaag tggaagagat gggctcccgg gtcctcctgg ttcccctggg 1260
ccccctgggc agcctggcta cacaaatgga attgtggaat gtcagcccgg acctccaggt 1320
gaccagggtc ctcctggaat tccagggcag ccaggattta taggcgaaat tggagagaaa 1380
ggtcaaaaag gagagagttg cctcatctgt gatatagacg gatatcgggg gcctcccggg 1440
ccacagggac ccccgggaga aataggtttc ccagggcagc caggggccaa gggcgacaga 1500
ggtttgcctg gcagagatgg tgttgcagga gtgccaggcc ctcaaggtac accagggctg 1560
ataggccagc caggagccaa gggggagcct ggtgagtttt atttcgactt gcggctcaaa 1620
ggtgacaaag gagacccagg ctttccagga cagcccggca tgccagggag agcgggttct 1680
cctggaagag atggccatcc gggtcttcct ggccccaagg gctcgccggg ttctgtagga 1740
ttgaaaggag agcgtggccc ccctggagga gttggattcc caggcagtcg tggtgacacc 1800
ggcccccctg ggcctccagg atatggtcct gctggtccca ttggtgacaa aggacaagca 1860
ggctttcctg gaggccctgg atccccaggc ctgccaggtc caaagggtga accaggaaaa 1920
attgttcctt taccaggccc ccctggagca gaaggactgc cggggtcccc aggcttccca 1980
ggtccccaag gagaccgagg ctttcccgga accccaggaa ggccaggcct gccaggagag 2040
aagggcgctg tgggccagcc aggcattgga tttccagggc cccccggccc caaaggtgtt 2100
gacggcttac ctggagacat ggggccaccg gggactccag gtcgcccggg atttaatggc 2160
ttacctggga acccaggtgt gcagggccag aagggagagc ctggagttgg tctaccggga 2220
ctcaaaggtt tgccaggtct tcccggcatt cctggcacac ccggggagaa ggggagcatt 2280
ggggtaccag gcgttcctgg agaacatgga gcgatcggac cccctgggct tcaggggatc 2340
agaggtgaac cgggacctcc tggattgcca ggctccgtgg ggtctccagg agttccagga 2400
ataggccccc ctggagctag gggtccccct ggaggacagg gaccaccggg gttgtcaggc 2460
cctcctggaa taaaaggaga gaagggtttc cccggattcc ctggactgga catgccgggc 2520
cctaaaggag ataaaggggc tcaaggactc cctggcataa cgggacagtc ggggctccct 2580
ggccttcctg gacagcaggg ggctcctggg attcctgggt ttccaggttc caagggagaa 2640
atgggcgtca tggggacccc cgggcagccg ggctcaccag gaccagtggg tgctcctgga 2700
ttaccgggtg aaaaagggga ccatggcttt ccgggctcct caggacccag gggagaccct 2760
ggcttgaaag gtgataaggg ggatgtcggt ctccctggca agcctggctc catggataag 2820
gtggacatgg gcagcatgaa gggccagaaa ggagaccaag gagagaaagg acaaattgga 2880
ccaattggtg agaagggatc ccgaggagac cctgggaccc caggagtgcc tggaaaggac 2940
gggcaggcag gacagcctgg gcagccagga cctaaaggtg atccaggtat aagtggaacc 3000
ccaggtgctc caggacttcc gggaccaaaa ggatctgttg gtggaatggg cttgccagga 3060
acacctggag agaaaggtgt gcctggcatc cctggcccac aaggttcacc tggcttacct 3120
ggagacaaag gtgcaaaagg agagaaaggg caggcaggcc cacctggcat aggcatccca 3180
gggctgcgag gtgaaaaggg agatcaaggg atagcgggtt tcccaggaag ccctggagag 3240
aagggagaaa aaggaagcat tgggatccca ggaatgccag ggtccccagg ccttaaaggg 3300
tctcccggga gtgttggcta tccaggaagt cctgggctac ctggagaaaa aggtgacaaa 3360
ggcctcccag gattggatgg catccctggt gtcaaaggag aagcaggtct tcctgggact 3420
cctggcccca caggcccagc tggccagaaa ggggagccag gcagtgatgg aatcccgggg 3480
tcagcaggag agaagggtga accaggtcta ccaggaagag gattcccagg gtttccaggg 3540
gccaaaggag acaaaggttc aaagggtgag gtgggtttcc caggattagc cgggagccca 3600
ggaattcctg gatccaaagg agagcaagga ttcatgggtc ctccggggcc ccagggacag 3660
ccggggttac cgggatcccc aggccatgcc acggaggggc ccaaaggaga ccgcggacct 3720
cagggccagc ctggcctgcc aggacttccg ggacccatgg ggcctccagg gcttcctggg 3780
attgatggag ttaaaggtga caaaggaaat ccaggctggc caggagcacc cggtgtccca 3840
gggcccaagg gagaccctgg attccagggc atgcctggta ttggtggctc tccaggaatc 3900
acaggctcta agggtgatat ggggcctcca ggagttccag gatttcaagg tccaaaaggt 3960
cttcctggcc tccagggaat taaaggtgat caaggcgatc aaggcgtccc gggagctaaa 4020
ggtctcccgg gtcctcctgg ccccccaggt ccttacgaca tcatcaaagg ggagcccggg 4080
ctccctggtc ctgagggccc cccagggctg aaagggcttc agggactgcc aggcccgaaa 4140
ggccagcaag gtgttacagg attggtgggt atacctggac ctccaggtat tcctgggttt 4200
gacggtgccc ctggccagaa aggagagatg ggacctgccg ggcctactgg tccaagagga 4260
tttccaggtc caccaggccc cgatgggttg ccaggatcca tggggccccc aggcacccca 4320
tctgttgatc acggcttcct tgtgaccagg catagtcaaa caatagatga cccacagtgt 4380
ccttctggga ccaaaattct ttaccacggg tactctttgc tctacgtgca aggcaatgaa 4440
cgggcccatg gccaggactt gggcacggcc ggcagctgcc tgcgcaagtt cagcacaatg 4500
cccttcctgt tctgcaatat taacaacgtg tgcaactttg catcacgaaa tgactactcg 4560
tactggctgt ccacccctga gcccatgccc atgtcaatgg cacccatcac gggggaaaac 4620
ataagaccat ttattagtag gtgtgctgtg tgtgaggcgc ctgccatggt gatggccgtg 4680
cacagccaga ccattcagat cccaccgtgc cccagcgggt ggtcctcgct gtggatcggc 4740
tactcttttg tgatgcacac cagcgctggt gcagaaggct ctggccaagc cctggcgtcc 4800
cccggctcct gcctggagga gtttagaagt gcgccattca tcgagtgtca cggccgtggg 4860
acctgcaatt actacgcaaa cgcttacagc ttttggctcg ccaccataga gaggagcgag 4920
atgttcaaga agcctacgcc gtccaccttg aaggcagggg agctgcgcac gcacgtcagc 4980
cgctgccaag tctgtatgag aagaacataa 5010
<210> 8
<211> 5010
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 8
atgggcccta gactgtctgt gtggctgctg cttcttcctg ccgctctgct gctgcacgag 60
gaacattcta gagccgccgc taaaggcgga tgtgccggat ctggatgcgg caagtgtgat 120
tgtcacggcg tgaagggcca gaagggcgaa agaggacttc ctggactgca gggcgtgatc 180
ggatttcctg gaatgcaagg acctgaggga ccacagggac ctccaggaca aaaaggcgat 240
acaggcgaac ctggcctgcc tggcacaaag ggaacaagag gaccacctgg cgcctctggc 300
tatcctggaa atccaggact gcctggaatc ccaggacagg atggacctcc tggtcctcct 360
ggcattcctg gctgtaatgg caccaaaggc gagagaggtc cactcggacc accaggactc 420
ccaggatttg ctggaaaccc tgggccacct ggattgcctg gcatgaaggg cgatcctggc 480
gaaattctgg gacacgttcc cggcatgctg ctgaaaggcg aaaggggctt tcccggaatt 540
cctggcacac ctggtccacc aggcttgcca ggacttcaag gaccagttgg cccacctggc 600
tttacaggtc ctccaggtcc accggggcct ccagggccgc caggcgaaaa aggacaaatg 660
ggactgagct ttcagggccc caagggcgac aaaggcgatc aaggtgttag tggccctcca 720
ggtgttcctg gacaggccca ggttcaagag aaaggcgatt tcgccaccaa gggcgagaag 780
ggacagaaag gcgaaccagg ctttcaggga atgcctggcg tgggagaaaa gggcgaaccc 840
ggaaaacctg gacctagagg caaacccggc aaggatggcg ataagggcga gaaaggatct 900
cctggattcc ctggcgaacc tggatatcct ggactgatcg gtagacaggg ccctcaaggc 960
gagaagggcg aagctggacc gcctggacca ccgggaatag tgattggaac aggccctctc 1020
ggagaaaaag gcgagcgagg ataccctgga actcccggac ctaggggaga accaggacct 1080
aaaggttttc ccggactgcc aggacaacca gggcctcctg ggcttcctgt gcctggacaa 1140
gctggtgctc caggatttcc cggcgaacgt ggcgaaaagg gcgatagagg ttttcctggc 1200
acaagcctgc ctgggccttc tggaagagat ggacttcccg ggccaccagg ttctcccgga 1260
ccacctggac agcctggcta taccaatggc atcgtcgagt gtcaacccgg tccacctggc 1320
gatcaaggac ctcctggaat accaggccag cctggcttta tcggcgagat tggagagaaa 1380
gggcaaaaag gggagagctg cctgatctgc gacatcgatg gatacagagg ccctcctgga 1440
cctcaaggcc caccaggcga gataggtttt ccagggcaac ctggcgcaaa aggcgaccgt 1500
ggactccctg gtagagatgg tgttgctggc gttccaggac cacaaggcac ccctggactt 1560
attggacagc caggtgcaaa gggcgagcca ggcgagttct acttcgacct gagacttaaa 1620
ggcgacaagg gcgaccctgg ctttcctgga caacctggaa tgcccggtag agctggatca 1680
ccaggccgtg atggacatcc agggttgccc ggaccaaaag gctctccagg atctgtgggc 1740
ctcaaaggcg aaagaggccc tccaggcgga gttggatttc ctggctctag aggcgatact 1800
ggcccaccag gtccacctgg atatggacct gctggcccta ttggagataa gggccaagca 1860
ggattcccag gcggacccgg ttctccaggc cttccgggtc ctaaaggcga gcctggaaaa 1920
atcgttccac tgcctggacc tccaggcgct gaaggattgc ctggatctcc cggttttcct 1980
ggaccgcaag gcgatagagg attccccgga acacccggta gaccaggcct tcctggcgag 2040
aaaggtgctg tgggtcaacc tggaatcggc tttcctgggc ctcctggtcc aaaaggtgtt 2100
gatggactgc ccggcgatat gggcccaccg ggaacaccag gcagacccgg ctttaatgga 2160
ttgcccggaa atcccggcgt ccaaggccag aaaggcgagc ccggtgttgg ccttcctgga 2220
cttaaaggac ttccaggcct gccaggcata cctgggacac ctggcgaaaa gggatctatc 2280
ggagttcctg gcgtgccagg cgaacatggt gcaattggtc cacctgggct gcaaggcatt 2340
agaggcgaac ccgggcctcc aggactccct ggctctgttg gaagtccagg cgtccccgga 2400
attggaccac caggtgctag gggacctcct ggcggacaag gtccaccagg attgtctgga 2460
ccacctggga tcaaaggcga gaaaggcttc cccggctttc ccggccttga tatgcctgga 2520
cctaaaggcg ataagggtgc ccagggcctg cctggaatta ctggacaaag cggcttgccc 2580
gggcttcccg gacaacaggg tgctccgggt attcctgggt ttcccggatc taagggcgaa 2640
atgggcgtga tgggtacacc tgggcaacca ggatcaccgg gacctgttgg agcaccgggg 2700
ttgcccggcg aaaaaggcga ccacggattc ccaggatcaa gcggaccaag aggcgatccg 2760
ggattgaaag gcgataaggg cgacgtggga cttcctggca aaccaggctc tatggacaag 2820
gtggacatgg gctccatgaa gggacaaaag ggcgatcagg gcgaaaaggg ccagatcgga 2880
cctatcggcg aaaagggtag tagaggcgat cctggaacac ccggcgttcc cggaaaagat 2940
ggacaagcag gccaaccggg gcagccaggg ccaaaaggcg atcctggtat ttctggaaca 3000
ccaggtgcac caggactgcc cggacctaaa ggatctgttg gaggaatggg attgccaggg 3060
acacccggcg agaaaggtgt tcctggaata cctggacctc agggctctcc tggactgcca 3120
ggcgacaaag gtgctaaagg cgaaaaggga caagccggac ctcctggcat tggcatacct 3180
ggacttaggg gagagaaggg cgaccaggga attgctggtt ttcctgggag cccaggcgag 3240
aaaggcgaaa aaggctctat cggcatcccc ggcatgcccg gatctccagg tcttaaaggt 3300
tcacctggca gcgtgggcta tccgggatca cctggccttc caggcgaaaa gggcgacaaa 3360
ggactgcctg gccttgatgg catacctggc gtgaaaggcg aagcaggact tcccggtaca 3420
cctggaccta caggaccagc tggccaaaaa ggcgaaccgg gatctgatgg aattcccggc 3480
tctgctggcg aaaaaggcga gccaggcctt cctggaagag gcttcccagg atttcctggc 3540
gcaaagggcg ataagggctc taagggcgaa gtcggctttc caggacttgc cggttctcct 3600
ggcatcccag gttccaaggg cgaacaagga ttcatgggtc ctccgggtcc tcagggtcaa 3660
ccagggttgc ctggaagccc tggacatgcc acagaaggac caaaaggcga cagaggacct 3720
cagggacaac ctgggcttcc cggccttcca ggaccaatgg gtcctcctgg actccccggt 3780
attgatggcg tcaagggcga caagggaaat ccaggatggc caggtgctcc aggcgttccc 3840
ggtccaaagg gcgatcccgg gtttcaaggg atgcctggta tcggaggaag ccccggcatt 3900
actggaagca aaggcgacat gggaccacca ggcgtgcccg gttttcaggg acctaaaggg 3960
ttgccaggcc tgcagggaat caaaggcgac cagggcgatc aaggcgttcc aggtgccaag 4020
ggattgcctg ggccaccagg accgccagga ccttacgata tcattaaggg cgagcccgga 4080
ctgcctggtc ctgagggtcc tccaggattg aaaggacttc aggggctccc tggaccaaaa 4140
ggacagcagg gtgttacagg cctcgtcggt attcctggac ctccggggat acctggattt 4200
gatggtgctc ctgggcagaa aggcgaaatg ggtccagcag gaccaacagg cccaagaggt 4260
ttccccggac ctccagggcc tgatggcctg ccaggatcta tgggtccacc agggacacca 4320
tccgtggatc acggctttct ggtcaccaga cacagccaga ccatcgacga tcctcagtgt 4380
cctagcggca ccaagatcct gtatcacggc tacagcctgc tgtacgtgca gggcaatgag 4440
agagcacacg gacaggatct gggcacagcc ggcagctgtc tgcggaagtt tagcaccatg 4500
ccttttctgt tctgcaacat caacaacgtg tgcaacttcg ccagccggaa cgactacagc 4560
tactggctgt ctacccctga gcctatgcct atgagcatgg cccctatcac cggggagaac 4620
atcagaccct tcatcagcag atgtgccgtg tgcgaagccc ctgccatggt tatggctgtg 4680
cactcccaga ccattcagat ccctccatgt ccaagcggct ggtctagcct gtggatcggc 4740
tactcctttg tgatgcacac atctgccggc gcagaaggat caggacaagc ccttgctagc 4800
cccggctcct gtctggaaga attcagaagc gcccctttca tcgagtgcca cggcagaggc 4860
acctgtaact actacgccaa cgcctacagc ttttggctgg ccaccatcga gcggagcgag 4920
atgttcaaga agcccacacc ttctacactg aaggccggcg agctgagaac acacgtgtcc 4980
agatgtcaag tgtgcatgcg gcggacctga 5010
<210> 9
<211> 3087
<212> DNA
<213> 智人(Homo sapiens)
<400> 9
atgagggcgg cccgtgctct gctgcccctg ctgctgcagg cctgctggac agccgcgcag 60
gatgagccgg agaccccgag ggccgtggcc ttccaggact gccccgtgga cctgttcttt 120
gtgctggaca cctctgagag cgtggccctg aggctgaagc cctacggggc cctcgtggac 180
aaagtcaagt ccttcaccaa gcgcttcatc gacaacctga gggacaggta ctaccgctgt 240
gaccgaaacc tggtgtggaa cgcaggcgcg ctgcactaca gtgacgaggt ggagatcatc 300
caaggcctca cgcgcatgcc tggcggccgc gacgcactca aaagcagcgt ggacgcggtc 360
aagtactttg ggaagggcac ctacaccgac tgcgctatca agaaggggct ggagcagctc 420
ctcgtggggg gctcccacct gaaggagaat aagtacctga ttgtggtgac cgacgggcac 480
cccctggagg gctacaagga accctgtggg gggctggagg atgctgtgaa cgaggccaag 540
cacctgggcg tcaaagtctt ctcggtggcc atcacacccg accacctgga gccgcgtctg 600
agcatcatcg ccacggacca cacgtaccgg cgcaacttca cggcggctga ctggggccag 660
agccgcgacg cagaggaggc catcagccag accatcgaca ccatcgtgga catgatcaaa 720
aataacgtgg agcaagtgtg ctgctccttc gaatgccagc ctgcaagagg acctccgggg 780
ctccggggcg accccggctt tgagggagaa cgaggcaagc cggggctccc aggagagaag 840
ggagaagccg gagatcctgg aagacccggg gacctcggac ctgttgggta ccagggaatg 900
aagggagaaa aagggagccg tggggagaag ggctccaggg gacccaaggg ctacaaggga 960
gagaagggca agcgtggcat cgacggggtg gacggcgtga agggggagat ggggtaccca 1020
ggcctgccag gctgcaaggg ctcgcccggg tttgacggca ttcaaggacc ccctggcccc 1080
aagggagacc ccggtgcctt tggactgaaa ggagaaaagg gcgagcctgg agctgacggg 1140
gaggcgggga gaccagggag ctcgggacca tctggagacg agggccagcc gggagagcct 1200
gggccccccg gagagaaagg agaggcgggc gacgagggga acccaggacc tgacggtgcc 1260
cccggggagc ggggtggccc tggagagaga ggaccacggg ggaccccagg cacgcgggga 1320
ccaagaggag accctggtga agctggcccg cagggtgatc agggaagaga aggccccgtt 1380
ggtgtccctg gagacccggg cgaggctggc cctatcggac ctaaaggcta ccgaggcgat 1440
gagggtcccc cagggtccga gggtgccaga ggagccccag gacctgccgg accccctgga 1500
gacccggggc tgatgggtga aaggggagaa gacggccccg ctggaaatgg caccgagggc 1560
ttccccggct tccccgggta tccgggcaac aggggcgctc ccgggataaa cggcacgaag 1620
ggctaccccg gcctcaaggg ggacgaggga gaagccgggg accccggaga cgataacaac 1680
gacattgcac cccgaggagt caaaggagca aaggggtacc ggggtcccga gggcccccag 1740
ggacccccag gacaccaagg accgcctggg ccggacgaat gcgagatttt ggacatcatc 1800
atgaaaatgt gctcttgctg tgaatgcaag tgcggcccca tcgacctcct gttcgtgctg 1860
gacagctcag agagcattgg cctgcagaac ttcgagattg ccaaggactt cgtcgtcaag 1920
gtcatcgacc ggctgagccg ggacgagctg gtcaagttcg agccagggca gtcgtacgcg 1980
ggtgtggtgc agtacagcca cagccagatg caggagcacg tgagcctgcg cagccccagc 2040
atccggaacg tgcaggagct caaggaagcc atcaagagcc tgcagtggat ggcgggcggc 2100
accttcacgg gggaggccct gcagtacacg cgggaccagc tgctgccgcc cagcccgaac 2160
aaccgcatcg ccctggtcat cactgacggg cgctcagaca ctcagaggga caccacaccg 2220
ctcaacgtgc tctgcagccc cggcatccag gtggtctccg tgggcatcaa agacgtgttt 2280
gacttcatcc caggctcaga ccagctcaat gtcatttctt gccaaggcct ggcaccatcc 2340
cagggccggc ccggcctctc gctggtcaag gagaactatg cagagctgct ggaggatgcc 2400
ttcctgaaga atgtcaccgc ccagatctgc atagacaaga agtgtccaga ttacacctgc 2460
cccatcacgt tctcctcccc ggctgacatc accatcctgc tggacggctc cgccagcgtg 2520
ggcagccaca actttgacac caccaagcgc ttcgccaagc gcctggccga gcgcttcctc 2580
acagcgggca ggacggaccc cgcccacgac gtgcgggtgg cggtggtgca gtacagcggc 2640
acgggccagc agcgcccaga gcgggcgtcg ctgcagttcc tgcagaacta cacggccctg 2700
gccagtgccg tcgatgccat ggactttatc aacgacgcca ccgacgtcaa cgatgccctg 2760
ggctatgtga cccgcttcta ccgcgaggcc tcgtccggcg ctgccaagaa gaggctgctg 2820
ctcttctcag atggcaactc gcagggcgcc acgcccgctg ccatcgagaa ggccgtgcag 2880
gaagcccagc gggcaggcat cgagatcttc gtggtggtcg tgggccgcca ggtgaatgag 2940
ccccacatcc gcgtcctggt caccggcaag acggccgagt acgacgtggc ctacggcgag 3000
agccacctgt tccgtgtccc cagctaccag gccctgctcc gcggtgtctt ccaccagaca 3060
gtctccagga aggtggcgct gggctag 3087
<210> 10
<211> 3087
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 10
atgagagccg ctagagccct tctgcctctg ctgctgcaag cctgttggac agccgctcag 60
gatgagcccg aaacacctag agccgtggca ttccaggact gccccgtgga tctgttcttc 120
gtgctggata ccagcgagag cgtggccctg agactgaaac cttatggcgc cctggtggac 180
aaagtgaagt ccttcaccaa gcggttcatc gacaacctgc gcgaccggta ctacagatgc 240
gacagaaacc tcgtgtggaa cgcaggcgcc ctgcactact ctgacgaggt ggaaatcatc 300
cagggcctga ccagaatgcc tggcggaaga gatgccctga agtctagcgt ggacgccgtg 360
aagtactttg gcaagggcac ctacaccgac tgcgccatca agaaaggcct ggaacagctg 420
ctcgtcggcg gcagccatct gaaagagaac aagtacctga tcgtggttac cgacggacac 480
cctctggaag gctacaaaga accttgtggc ggactggaag atgccgtgaa cgaggccaaa 540
cacctgggcg tgaaggtgtt cagcgtggcc atcacacccg accacctgga acctcggctg 600
agcatcattg ccaccgacca cacctaccgg cggaatttca cagccgctga ttggggccag 660
agcagggatg ccgaagaggc catcagccag accatcgaca ccatcgtgga catgatcaag 720
aacaacgtgg aacaagtgtg ctgcagcttc gagtgccagc ctgctagagg acctcctgga 780
cttagaggcg accctggctt tgagggcgag agaggaaaac ctggactgcc cggcgaaaaa 840
ggcgaagctg gcgatcctgg tagacctggc gatctgggac ctgtgggcta tcagggaatg 900
aagggcgaga aaggctcccg gggagagaag ggatctagag gccctaaggg ctacaagggc 960
gaaaaaggca agaggggcat cgatggcgtg gacggcgtca aaggcgagat gggatatcct 1020
ggactccctg gctgtaaagg cagccctggc ttcgatggaa tccagggacc tccaggacct 1080
aagggcgatc caggcgcctt tggactgaaa ggcgaaaagg gcgaaccagg tgccgatggc 1140
gaagcaggca gacctggatc ttctggccct agcggagatg aaggacagcc tggcgaacct 1200
ggaccacctg gcgagaaggg cgaagccggc gacgagggaa atccaggacc agatggtgct 1260
cctggcgaaa gaggtggacc aggcgaaagg ggacctagag gaacaccagg cacaagaggc 1320
ccaagaggcg atcccggcga ggctggacct caaggcgatc agggaagaga aggaccagtg 1380
ggagttcctg gcgacccagg cgaagcagga cctatcggcc ctaagggata tagaggcgac 1440
gaaggccctc ctggatctga aggtgctaga ggcgcaccag gtccagcagg ccctccaggc 1500
gaccccggac ttatgggaga acgcggagaa gatggccctg ccggcaatgg cacagagggc 1560
tttccaggct ttcctggcta ccccggaaat agaggcgctc ctggaatcaa cggcaccaag 1620
ggatatccag ggctcaaagg cgacgaaggc gaggcaggcg atccagggga tgacaacaac 1680
gatatcgccc ctagaggcgt gaaaggcgcc aaaggctata gaggaccaga gggaccacaa 1740
ggcccacctg gtcatcaagg gccaccagga cctgacgagt gcgagatcct ggacatcatt 1800
atgaagatgt gcagctgctg cgagtgcaag tgcggcccta tcgatctgct gtttgtgctg 1860
gacagctccg agagcatcgg cctgcagaat ttcgagatcg ccaaggactt cgtggtcaaa 1920
gtgatcgaca gactgagccg ggacgagctg gtcaagtttg agcctggcca gtcttatgcc 1980
ggcgtggtgc agtacagcca cagccagatg caagagcacg tgtccctgag aagccccagc 2040
atcagaaacg tgcaagagct gaaagaagcc atcaagtccc tgcagtggat ggctggcgga 2100
acctttactg gcgaggccct gcagtacacc agagatcaac tgctgcctcc ttctcctaac 2160
aaccggattg ccctcgtgat caccgacggc agaagcgaca cccagagaga caccacacct 2220
ctgaacgtgc tgtgcagccc cggcattcag gtggtgtctg tgggcatcaa ggacgtgttc 2280
gacttcatcc ccggcagcga ccagctgaac gtgatctctt gtcaaggact ggcccctagc 2340
caaggcagac caggactgtc tctggtcaaa gagaactacg ccgagctgct cgaggacgcc 2400
ttcctgaaga atgtgacagc ccagatctgc atcgacaaga agtgccccga ctacacatgc 2460
cccatcacct ttagcagccc tgccgacatc accatcctgc tggatggctc tgctagcgtg 2520
ggcagccaca acttcgacac caccaagaga ttcgccaagc ggctggccga gagatttctg 2580
acagccggca gaaccgatcc tgctcacgat gtgcgagtgg ccgtggtcca gtattctggc 2640
acaggccagc aaagacccga gagagcctct ctgcagttcc tgcagaacta cactgccctg 2700
gcctctgccg tggatgccat ggactttatc aacgacgcca ccgacgtgaa cgacgccctg 2760
ggctatgtga cccggtttta cagagaagcc tctagcggag ccgccaagaa gagactgctg 2820
ctgttcagcg acggcaactc ccaaggtgct acaccagccg ccattgagaa ggccgtgcaa 2880
gaagctcaga gagccggcat cgagatcttc gtggtggtcg tgggcagaca agtgaacgag 2940
cctcacatca gagtgctggt caccggcaag accgccgagt acgatgtggc ttatggcgag 3000
agccacctgt tcagagtgcc cagctatcag gctctgctga gaggcgtgtt ccaccagacc 3060
gtgtctagaa aggtggccct gggatga 3087
<210> 11
<211> 8835
<212> DNA
<213> 智人(Homo sapiens)
<400> 11
atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60
gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120
ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180
ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240
acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300
ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360
gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420
cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480
caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540
gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600
ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660
ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720
tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780
ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840
caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900
accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960
gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020
cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080
cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140
ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200
cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260
ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320
gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380
gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440
cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500
cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560
gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620
gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680
gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740
ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800
gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860
gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920
cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980
taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040
gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100
tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160
tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220
gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280
gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340
aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400
ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460
atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520
tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580
actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640
cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700
caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760
ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820
ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880
gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940
agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000
gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060
ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120
tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180
gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240
ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300
cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360
atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420
gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480
atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540
caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600
cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660
agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720
cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780
gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840
ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900
cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960
gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020
ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080
cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140
ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200
gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260
ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320
cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380
cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440
gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500
ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560
gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620
gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680
cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740
cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800
ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860
cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920
gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980
ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040
gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100
cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160
cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220
gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280
ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340
agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400
aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460
ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520
aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580
gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640
ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700
ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760
aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820
aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880
gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940
aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000
gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060
cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120
attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180
ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240
cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300
cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360
agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420
ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480
gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540
ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600
ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660
ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720
caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780
cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840
ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900
gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960
gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020
aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080
gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140
cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200
ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260
agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320
ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380
ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440
ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500
aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560
gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620
cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680
gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740
ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800
ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860
ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920
ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980
atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040
cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100
ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160
gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220
cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280
gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340
ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400
cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460
gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520
gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580
gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640
gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700
acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760
acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820
actgcccagg actga 8835
<210> 12
<211> 8835
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 12
atgaccctga gactgctggt ggctgccctg tgtgctggaa ttctggctga ggctcctaga 60
gtgcgggccc agcatagaga aagagtgacc tgtacacggc tgtacgccgc cgatatcgtg 120
tttctgctgg atggcagcag cagcatcggc cggtccaatt tcagagaagt gcggagcttt 180
ctggaaggcc tggtgctgcc tttttctggc gctgcttctg cccagggcgt cagatttgcc 240
accgtgcagt acagcgacga ccctagaaca gagtttggcc tggatgctct cggcagcggc 300
ggagatgtga tcagagccat cagagagctg agctacaaag gcggcaatac cagaacaggc 360
gccgctattc tgcacgtggc cgaccatgtt tttctgcccc aactggctag acccggcgtg 420
ccaaaagtgt gcatcctgat cacagacggc aagagccagg acctggtgga tacagccgct 480
cagagactga aaggacaggg cgtgaaactg ttcgccgtgg gcatcaagaa cgccgatcct 540
gaggaactga agagagtggc cagccagcct accagcgatt tcttcttctt cgtgaacgac 600
ttcagcatcc tgcggaccct gctgcctctg gtgtctagaa gagtgtgtac aacagccggc 660
ggagtgcctg tgaccagacc tcctgatgat agcacaagcg cccctagaga tctggtgctg 720
tctgagccaa gcagccagag tctgagagtg cagtggacag ctgctagcgg ccctgtgaca 780
ggctacaagg tgcagtatac acctctgaca ggcctgggcc agcctctgcc ttctgagaga 840
caagaagtga acgtcccagc cggcgaaaca tctgtcagac tgagaggact gaggcccctg 900
accgagtacc aagtgacagt gatcgccctg tacgccaatt ctatcggcga ggccgtgtct 960
ggcacagcca gaacaacagc tctggaagga ccagagctga ccatccagaa cacaacagcc 1020
cattctctgc tggttgcttg gagatctgtg cctggcgcca ccggctatag agtgacttgg 1080
agagttctga gcggaggccc cacacagcag caagaacttg gacctggaca gggctccgtg 1140
ctgctgagag atctcgagcc tggcaccgat tacgaagtga ccgtgtctac cctgttcggc 1200
agatctgtgg gacctgccac aagcctgatg gccagaacag atgccagcgt ggaacagacc 1260
ctgaggcctg tgattctggg ccctacatct atcctgctga gctggaatct ggtgcccgag 1320
gccagaggct atagactgga atggcggaga gaaaccggcc tggaacctcc tcagaaagtg 1380
gtcctgccta gcgacgtgac aagataccag ctggatggac tgcagcccgg caccgagtac 1440
agactgacac tgtatacact gctcgagggc cacgaagtgg ccacaccagc tacagttgtg 1500
ccaacaggac ctgagctgcc tgtgtctcct gtgactgatc tgcaggccac agaactgcct 1560
ggccagagag tcagagttag ctggtcacct gttccaggcg ccacacagta cagaatcatc 1620
gtgcggtcta cacagggcgt cgagagaaca ctggttctgc ctggaagcca gaccgccttc 1680
gatctggatg atgtgcaggc cggactgtcc tacacagtca gagtgtctgc cagagtgggc 1740
cctagagaag gatctgcctc tgtgctgacc gtgcggagag agcctgaaac accactggca 1800
gtgcctggac tgagagtggt ggtgtcagat gccaccagag ttagagtggc ttggggacca 1860
gttcctggcg cctctggctt tagaatcagc tggtctacag gctctggccc cgaaagctct 1920
cagacactgc ctccagatag caccgccacc gatattacag gcctgcagcc tggaactacc 1980
taccaggtgg ccgttagcgt gctgagagga agagaagaag gccctgccgc cgtcatcgtg 2040
gctagaactg atcctctggg acctgtgcgg acagtgcacg tgacacaagc ctctagcagc 2100
agcgtgacca tcacctggac aagagtgcca ggcgctacag gatacagagt gtcctggcat 2160
tctgctcacg gccctgagaa gtctcagctg gtgtctggcg aagccacagt ggctgaactc 2220
gacggactgg aacctgacac agagtatact gtgcacgtgc gggctcatgt ggctggtgtt 2280
gatggacctc ctgcttctgt ggtcgtcaga acagcccctg aacctgtggg aagagtgtcc 2340
agactgcaga tcctgaatgc cagcagcgac gtgctgagga tcacatgggt tggagtgacc 2400
ggcgccacag cttatagact cgcctggggt agaagcgaag gcggccctat gagacatcag 2460
atcctgcctg gcaataccga ctccgccgag attagaggcc ttgaaggcgg agtgtcttac 2520
agcgttagag tgacagccct cgtgggcgat agagaaggca cacctgtgtc catcgtggtc 2580
accacacctc cagaagctcc tccagctctg ggaacactgc atgtggtgca gagaggcgag 2640
cactctctga gactgagatg ggaacctgtg ccacgcgctc agggatttct gctgcattgg 2700
caaccagaag gcggacaaga gcagagcaga gtgctgggac cagaactgag cagctaccac 2760
ctcgatggac ttgagcctgc cactcagtat agagtcagac tgtcagtgct ggggcctgcc 2820
ggcgaaggac cttctgctga agtgacagct agaaccgagt ctcccagagt gcccagcatc 2880
gagctgagag tcgtggatac ctccatcgat agcgtgacac tggcctggac acccgtgtct 2940
agagccagct cttacatcct gtcttggcgg cctctcagag gaccaggcca agaagttcct 3000
ggatctccac agacactccc aggcatcagt agctcccaga gagtgactgg acttgaacca 3060
ggcgtgtcct acatcttcag cctgacacct gtgctggacg gcgttagagg acctgaagcc 3120
tctgtgaccc agactccagt gtgtcctaga ggactggccg atgtggtgtt cctgcctcac 3180
gctacacagg acaatgccca tagagccgag gccacaagac gcgtgctgga aagactggtt 3240
cttgcccttg gaccactggg acctcaggct gttcaagtgg gcctgctgtc ctactctcac 3300
agaccctctc cactgttccc tctgaacggc tctcacgacc tgggcatcat cctgcagaga 3360
atccgggaca tgccctacat ggacccctct ggcaacaatc tgggcacagc cgttgtgact 3420
gcccacagat atatgctggc cccagatgct cctggcagac gacaacatgt ccctggcgtt 3480
atggtgctgc tggtcgatga acccctgcgg ggcgatatct ttagccctat tagagaagcc 3540
caggccagcg gcctgaatgt ggttatgctt ggaatggctg gcgccgatcc agagcagctt 3600
agaaggcttg cccctggcat ggatagcgtg cagaccttct ttgccgtgga cgatggacct 3660
tctctggatc aggctgtgtc tggactggct acagcactgt gccaggcaag cttcaccaca 3720
cagcctagac ctgagccttg tccagtgtac tgccctaagg gacagaaggg cgaacctggc 3780
gaaatgggac ttagaggcca agtgggacca cctggcgatc ctggacttcc tggaagaact 3840
ggtgctcctg gacctcaagg tcctcctgga agtgccacag ccaagggcga aagaggattc 3900
cctggcgctg atggcagacc aggatctcct ggtagagccg gcaatcctgg aacacctggc 3960
gcaccaggac tcaaaggatc tccaggactg cctggaccta gaggcgatcc aggcgagaga 4020
ggaccaagag gtccaaaagg cgaacccggt gctccaggac aagtgattgg cggagaagga 4080
cccggattgc ccggaagaaa aggcgaccct ggaccaagtg gacctccagg acctagggga 4140
cctttgggag atcccggtcc aagaggccct cctggattgc ctggtacagc catgaagggc 4200
gacaaaggcg ataggggaga aagaggacca ccaggaccag gcgaaggtgg aattgctcct 4260
ggcgaaccag ggttgcctgg actccctggc tcacctggac cacaaggacc tgttggccca 4320
cctggaaaga aaggcgaaaa gggcgattct gaggatggcg ccccagggct tcctggacaa 4380
ccaggctctc caggcgaaca aggacccaga gggcctccag gtgctattgg ccctaaaggc 4440
gacagagggt ttcccggacc acttggagaa gctggcgaaa aaggcgaacg aggacctcct 4500
ggacctgccg gatctagagg acttccaggt gttgctggca gacctggcgc taaaggtcct 4560
gaaggcccac cagggcctac aggcagacaa ggcgagaaag gcgagccagg cagacccggc 4620
gatcctgctg ttgttggacc agctgttgca ggcccaaagg gcgagaaggg cgacgttgga 4680
cctgctggac caaggggagc tacaggcgtt caaggcgaaa ggggtccacc tggacttgtt 4740
ttgccgggcg atcccggacc taagggcgac cccggcgaca ggggaccaat tggattgaca 4800
ggcagagctg ggccaccagg cgatagtggg cctccaggcg aaaaaggcga tcctggtaga 4860
cctggacctc ctgggccagt tggaccaaga ggaagagatg gcgaagtcgg agagaaaggc 4920
gacgaaggtc ctccaggcga cccaggactc cctggaaaag caggcgaaag aggtcttaga 4980
ggcgctcctg gtgttagagg ccctgttgga gaaaagggcg accaaggcga ccctggcgag 5040
gatggaagaa atggctcccc tggatctagc ggcccaaaag gcgatcgcgg cgagcccggt 5100
ccaccgggtc caccaggcag gcttgttgat actggacccg gcgctcgtga aaaaggcgag 5160
cccggcgatc gtggacaaga aggcccaaga ggacccaagg gcgatccggg actgccaggt 5220
gcaccaggcg agcgaggtat tgaaggattc agaggccctc caggaccaca aggcgatccc 5280
ggtgtcagag gacctgctgg cgagaagggc gatagaggtc ctccaggact ggatggcaga 5340
tccggacttg atggaaaacc cggcgcagct ggcccttctg gacctaatgg tgcagccgga 5400
aaagctggcg acccaggcag agatggattg ccaggattga ggggagaaca gggactcccc 5460
ggaccttctg ggccgcctgg gttgcccgga aagcctggcg aagatggcaa acctggcctg 5520
aacggcaaaa acggcgaacc gggcgatcca ggcgaagatg gcagaaaggg cgaaaaaggc 5580
gacagcggag cctctggccg agagggtaga gatggaccta aaggcgagag gggcgctcct 5640
ggaattttgg gaccccaagg accgcctggg ctgccaggtc cagttgggcc tcctggtcaa 5700
ggttttcctg gtgtcccagg cggaactgga ccaaaaggcg atagaggcga aacaggctct 5760
aagggcgagc aaggacttcc tggcgaacgt ggactgagag gcgaacctgg aagcgtgccc 5820
aatgtggaca gactcctgga aaccgccgga atcaaagcca gcgctctgcg ggaaatcgtg 5880
gaaacctggg atgagagcag cggctctttt ctgcctgtgc ctgaaagaag aaggggaccg 5940
aaaggcgatt ctggcgaaca aggtccacct ggcaaagagg gccctatcgg atttcccggc 6000
gagcggggtc ttaaaggcga ccggggagat ccgggacctc aagggccacc aggacttgct 6060
cttggagaaa gaggtcctcc ggggccatct ggacttgctg gcgagcctgg aaaacctgga 6120
ataccaggac ttcccggcag agcaggcgga gttggagagg ccggacgacc tggcgaacgc 6180
ggagaaaggg gagagaaggg cgagcgaggc gaacagggac gagatggacc accggggctc 6240
cctggaactc ctggaccgcc aggaccacct ggtcctaaag tgtcagtgga tgagcctgga 6300
ccaggtctta gcggagaaca aggacctcca ggcctgaaag gcgctaaggg cgaaccaggt 6360
tcaaatggcg atcagggacc caaaggcgat cggggcgttc caggcattaa gggcgaccgt 6420
ggcgaaccag gacctagagg acaagatggc aatcccggac tgcctggcga aagaggaatg 6480
gccggacctg agggaaagcc agggctgcaa gggcctcgcg ggccacctgg gcctgtcgga 6540
ggacatggcg accccggacc accaggtgct cccggacttg ctggaccagc aggacctcaa 6600
ggaccatctg gacttaaagg cgaaccaggc gaaacagggc caccaggcag aggacttaca 6660
ggacctacag gtgctgttgg gttgcctggt ccaccagggc caagtggact tgttggtcct 6720
caaggttcac ctggactgcc cggacaagtg ggagaaactg gcaaaccagg cgcacctggg 6780
cgagatggcg catctggaaa agacggcgat cgaggtagcc ctggtgttcc cggttctcct 6840
gggctcccag gacctgtggg ccccaagggc gaacccggac caactggcgc acctggtcaa 6900
gcagttgttg gattgcctgg cgcaaagggc gagaaaggtg ctccaggcgg attggctggc 6960
gatcttgttg gagaaccagg tgccaaaggc gacaggggct tgccaggtcc taggggagag 7020
aaaggcgaag ctggtagagc aggcgagcct ggcgatcccg gcgaggacgg acaaaaaggt 7080
gcccctgggc ctaaaggctt taagggcgat cctggtgtcg gcgtcccagg ttctcctgga 7140
ccacctgggc cgccaggcgt taagggcgat ttgggacttc ctgggctgcc tggcgctcct 7200
ggcgttgtgg gatttccagg acaaactggc cctcggggag aaatgggtca acctgggcct 7260
agcggagaaa gaggccttgc cggacctcct ggaagagagg gaatacctgg accacttgga 7320
ccgcctggac ctccaggttc tgttggacct cctggcgctt caggattgaa gggcgataag 7380
ggcgaccctg gtgttggact tcccggtcct cgtggcgaaa ggggagaacc aggcattaga 7440
ggcgaagatg gacggcctgg acaagaggga cctagaggtc ttacaggccc accaggctct 7500
agaggcgaaa ggggcgagaa aggcgacgtg ggttctgcag gacttaaggg cgacaagggc 7560
gattccgctg tgattttggg accaccggga ccaagaggcg ctaaaggcga tatgggcgag 7620
agaggcccta gaggcctgga tggcgataag gggccaagag gcgacaacgg cgacccaggc 7680
gataagggat ctaaaggcga acccggcgat aagggctctg ctggactgcc aggacttcga 7740
ggacttctgg gtccacaagg ccaacctggc gccgcaggca ttcccggcga tccgggttct 7800
cctggcaaag atggtgttcc tggcatcagg ggcgaaaagg gcgacgtcgg ttttatgggc 7860
cctcgcggat tgaaaggcga gagaggtgtt aagggcgcct gtggacttga cggcgaaaaa 7920
ggcgataagg gcgaagctgg acctcctggc agacctggat tggctggaca caagggcgag 7980
atgggagagc ccggtgttcc tggacaaagt ggcgcccctg gaaaagaagg actgatcggt 8040
ccaaagggcg accgcggatt tgatggccaa ccgggtccta aaggcgatca gggcgagaaa 8100
ggcgaaagag gcactcctgg catcggaggc tttccaggac caagcggcaa tgatggatct 8160
gctggcccgc cagggcctcc tggatctgtt ggtccaagag gaccagaagg cctgcaggga 8220
caaaaaggcg agcgcggacc accaggcgaa agagttgttg gagcacccgg cgttcccggt 8280
gctcccggcg aaagaggcga acaaggcaga cctggaccag ctggccctag aggcgaaaaa 8340
ggggaagccg ctctgaccga ggacgatatc agaggctttg tgcggcaaga gatgagccag 8400
cattgtgcct gtcaggggca gtttatcgcc agcggttcta gacctctgcc tagctatgcc 8460
gctgataccg ccggatctca gctgcatgct gtgcctgtgc ttagagtgtc tcacgccgag 8520
gaagaggaaa gagtccctcc agaggacgac gagtactccg agtatagcga gtactctgtg 8580
gaagagtatc aggaccccga ggctccttgg gatagcgacg atccatgttc tctgccactg 8640
gatgagggca gctgtaccgc ctacacactg aggtggtatc acagagccgt gaccggaagc 8700
accgaggcct gccatccttt tgtttatggc ggctgcggcg gcaacgccaa tagatttgga 8760
acaagagagg cctgcgagcg gagatgccct ccaagagtgg ttcagtctca aggcaccggc 8820
actgcccagg actaa 8835
<210> 13
<211> 4494
<212> DNA
<213> 智人(Homo sapiens)
<400> 13
atggatgtaa ccaagaaaaa caaacgagat ggaactgaag tcactgagag aattgtcact 60
gaaacagtaa ccacaagact tacatcctta ccaccaaaag gcgggaccag caatggctat 120
gctaaaacag cctctcttgg tggagggagc cggctggaga aacaaagcct gactcatggc 180
agcagcggct acataaactc aactggaagc acacgaggcc atgcctccac ctctagttac 240
aggagggctc actcacctgc ctccactctg cccaactccc caggctcaac ctttgaaagg 300
aaaactcacg ttacccgcca tgcgtatgaa gggagctcca gtggcaactc ttctccggag 360
taccctcgga aggaatttgc atcttcttca accagaggac ggagtcaaac acgagagagt 420
gaaattcgag ttcgactgca gagtgcgtcc ccatccaccc gatggacaga attggatgat 480
gttaagcgtt tgctcaaggg gagtcgatcg gcaagtgtga gccccacccg gaattcctcc 540
aacacactcc ccatccccaa gaaaggcact gtggagacca aaattgtgac agcgagctcc 600
cagtcggtgt caggcaccta cgatgcaacg atcctggatg ccaaccttcc ctcccatgtg 660
tggtcctcca ccctgcccgc ggggtcctcc atggggacct atcacaacaa catgacaacc 720
cagagctcat ccctcctcaa caccaatgcc tactctgcgg gatcagtctt cggagttcca 780
aacaacatgg cgtcctgctc acccactttg caccctggac tcagcacatc ctcctcagtg 840
tttggcatgc agaacaatct ggcccccagc ttgaccaccc tgtcccatgg caccaccacc 900
acttccacag catatggggt gaagaaaaac atgccccaga gtcctgcggc tgtgaacact 960
ggcgtttcca cctccgccgc ctgcaccaca agtgtgcaga gcgatgacct tttgcacaag 1020
gactgcaagt tcctgatcct agagaaagac aacacacctg ccaagaagga gatggagctg 1080
ctcatcatga ccaaggacag cgggaaggtc tttacagcct cccctgccag catcgctgca 1140
acttcttttt cagaagacac cctaaaaaaa gaaaagcaag ctgcctacaa tgctgactca 1200
ggcctaaaag ccgaagctaa tggagacctg aagactgtgt ccacaaaggg caagaccacc 1260
actgcagata tccacagcta cggcagcagt ggtggtggtg gcagtggagg aggtggcggt 1320
gttggtggcg ctggcggcgg cccttgggga ccagcgccag cctggtgccc ctgcggctcc 1380
tgctgcagct ggtggaagtg gctgctgggc ctgctgctca cctggctgct actcctgggg 1440
ctgctcttcg gcctcattgc tctggcggag gaggtgagga agctgaaggc gcgtgtggat 1500
gagctggaga ggatcaggag gagcatactg ccctatgggg acagcatgga tagaatagaa 1560
aaggaccgcc tccagggcat ggcacccgcg gcgggagcag acctggacaa aattgggctg 1620
cacagtgaca gccaggagga gctctggatg ttcgtgagga agaagctaat gatggaacag 1680
gaaaatggaa atctccgagg aagccctggc cctaaaggtg acatgggaag tccaggccct 1740
aaaggagatc gagggttccc tgggactcca ggtatccctg ggcccttggg ccacccaggt 1800
ccacaaggac caaagggtca aaaaggcagc gtgggagatc ctggcatgga aggccccatg 1860
ggccagagag ggcgagaagg ccccatggga cctcgtggtg aggcagggcc tcctggatct 1920
ggagagaaag gggaaagagg ggctgctggt gaaccaggtc ctcatggccc acctggtgtc 1980
ccaggttctg tgggtcccaa aggttccagc ggctctcctg gcccacaggg ccctccaggt 2040
cctgtaggtc tccaagggct ccgaggtgaa gtaggacttc ctggtgtcaa aggtgacaaa 2100
ggaccaatgg gaccaccagg acccaaaggt gaccagggtg agaaaggacc tcgaggcctc 2160
acaggcgagc ctggcatgag aggtttgcct ggtgctgttg gtgagcccgg ggctaaagga 2220
gcaatgggtc ctgctggccc agacggacac caaggcccaa gaggtgaaca aggtcttact 2280
gggatgcctg gaatccgtgg cccaccagga ccttctggag acccaggaaa gccaggtctc 2340
acaggacccc agggacctca gggacttccc ggtacccctg gccgaccagg aataaaaggt 2400
gaaccaggag ctccaggcaa gatcgtgact tcggaggggt catcgatgct cactgtccca 2460
ggccccccag gacctcctgg agccatggga cccccaggac ctccaggtgc cccaggccct 2520
gccggcccag ctggtctccc aggacatcaa gaagttctta atttacaagg tcccccaggc 2580
ccacccggcc cacgcgggcc accagggcct tccattccag gcccaccagg accccgaggc 2640
ccaccagggg agggtttgcc aggcccacca ggcccaccag gatcgttcct gtccaactca 2700
gaaaccttcc tctccggccc cccaggccca cctggccccc caggtcccaa gggagaccaa 2760
ggtcccccag gccccagagg acaccaaggc gagcaaggcc tcccaggttt ctcaacctca 2820
gggtccagtt ctttcggact caaccttcag ggaccaccag gcccacctgg cccccaggga 2880
cccaaaggtg acaaaggtga tccaggtgtt ccaggggctc ttggcattcc tagtggtcct 2940
tctgaagggg gatcatcaag taccatgtac gtgtcaggcc cgccagggcc ccctgggccc 3000
cctgggcctc cgggctctat cagcagctct ggccaggaga ttcagcagta catctctgag 3060
tacatgcaga gtgacagtat tagatcttac ctatccggag ttcagggtcc cccaggccca 3120
cctggtcccc caggacctgt caccaccatc acaggcgaga ctttcgacta ctcagagctg 3180
gcaagccacg ttgtgagcta cttacggact tcggggtacg gtgtcagctt gttctcgtcc 3240
tccatctctt ctgaagacat tctggctgtg ctgcagcggg atgacgtgcg tcagtaccta 3300
cgtcagtact tgatgggccc tcggggtccg ccagggccac caggagccag tggagatggg 3360
tccctcctgt ctttggacta tgcagagctg agtagtcgca ttctcagcta catgtcgagt 3420
tctgggatca gcattgggct tcctggtccc ccggggcccc ctggcttgcc gggaacctcc 3480
tatgaggagc tcctctcctt gctgcgaggg tctgaattca gaggcatcgt tggaccccca 3540
ggtcccccgg gtccaccagg gatcccaggc aatgtgtggt ccagcatcag cgtggaggac 3600
ctctcgtctt acttacatac tgccggcttg tcattcatcc caggccctcc aggacctcct 3660
ggtcccccag ggcctcgagg gcccccgggt gtctcaggag ccctggcaac ctatgcagct 3720
gaaaacagcg acagcttccg gagcgagctg atcagctacc tcacaagtcc tgatgtgcgc 3780
agcttcattg ttggcccccc aggccctcct gggccgcagg gaccccctgg ggacagccgc 3840
ctcctgtcca cggatgcctc ccacagtcgg ggtagcagct cctcctcaca cagctcatct 3900
gtcaggcggg gcagctccta cagctcttcc atgagcacag gaggaggtgg tgcaggctcc 3960
ctgggtgcag gcggtgcctt tggtgaagct gcaggagaca ggggtcccta tggcactgac 4020
atcggcccag gcggaggcta tggggcagca gcagaaggcg gcatgtatgc tggcaatggc 4080
ggactattgg gagctgactt tgctggagat ctggattaca atgagctggc tgtgagggtg 4140
tcagagagca tgcagcgtca gggcctactg caagggatgg cctacactgt ccagggccca 4200
ccaggccagc ctgggccaca ggggccaccc ggcatcagca aggtcttctc tgcctacagc 4260
aacgtgactg cggacctcat ggacttcttc caaacttatg gagccattca aggaccccct 4320
gggcaaaaag gagagatggg cactccagga cccaaaggtg acaggggccc tgctgggcca 4380
ccaggtcatc ctgggccacc tggccctcga ggacacaagg gagaaaaagg agacaaaggt 4440
gaccaagtct atgctgggcg gagaaggaga agaagtattg ctgtcaagcc gtga 4494
<210> 14
<211> 4494
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 14
atggacgtga ccaagaagaa caagcgcgac ggcaccgaag tgaccgagag aatcgtgacc 60
gaaaccgtga ccaccagact gaccagcctg cctcctaaag gcggcacctc taatggctac 120
gccaagacag cttctctcgg cggaggcagc agactggaaa agcagtctct gacacacggc 180
agcagcggct acatcaatag caccggctct acaagaggcc acgccagcac aagcagctac 240
agaagggctc acagccctgc cagcacactg cctaatagcc caggcagcac cttcgagaga 300
aagacccacg tgaccagaca cgcctacgag ggctctagca gcggcaatag cagccctgag 360
taccccagaa aagagttcgc cagcagcagc accagaggca gaagccagac acgggaaagc 420
gagatcagag tgcggctgca gtctgctagc cctagcacca gatggaccga gctggacgac 480
gtgaagaggc tgctgaaggg aagcagatcc gccagcgtgt cccctaccag aaacagcagc 540
aacaccctgc ctattcctaa gaaaggcacc gtcgagacta agatcgtgac agccagcagc 600
cagagcgtgt ccggcacata cgatgccaca atcctggacg ccaacctgcc tagccatgtg 660
tggtcctcta cactgcctgc cggaagcagc atgggcacct accacaacaa catgaccaca 720
cagagcagca gcctgctgaa caccaatgcc tactctgccg gctccgtgtt cggcgtgcca 780
aacaatatgg ccagctgcag ccctacactg caccctggcc tgagcacaag ctcctccgtg 840
tttggaatgc agaacaatct ggcccctagc ctgacaaccc tgagccacgg aacaaccacc 900
accagcacag cctacggcgt gaagaaaaac atgcctcagt ctccagccgc cgtgaacaca 960
ggcgttagca catctgccgc ctgtaccaca agcgtgcaga gcgacgatct gctgcacaag 1020
gactgcaagt ttctgatcct ggaaaaggac aacacgcccg ccaagaaaga gatggaactg 1080
ctgatcatga ccaaggacag cggcaaggtg ttcaccgcct ctccagcctc tatcgccgcc 1140
acaagcttta gcgaggacac cctgaagaaa gaaaagcagg ccgcctacaa cgccgactct 1200
ggactgaaag ccgaggccaa cggcgacctg aaaaccgtgt ctaccaaggg caagaccacc 1260
accgccgaca tccacagcta tggatctagc ggaggcggag gatctggtgg tggcggcgga 1320
gttggaggtg ctggcggagg accttgggga cctgctcctg cttggtgtcc ttgtggctcc 1380
tgttgcagct ggtggaagtg gctgcttggc ctgctgctga cttggctgct tcttctgggc 1440
ctgctgtttg gcctgattgc cctggctgag gaagtgcgga agctgaaggc cagagtggat 1500
gagctggaac ggatcaggcg gagcatcctg ccttacggcg acagcatgga ccggatcgag 1560
aaggacagac tgcaaggcat ggctccagca gctggcgccg atctggataa gatcggactg 1620
cacagcgaca gccaagagga actctggatg ttcgtgcgga agaaactgat gatggaacaa 1680
gagaacggca acctgagagg cagccctgga cctaagggcg atatgggaag cccaggacca 1740
aaaggcgaca gaggctttcc tggcacacct ggcattccag gacctctggg acatcctggt 1800
cctcagggcc ctaaaggcca gaaaggctct gtgggagatc ccggcatgga aggccctatg 1860
ggacagagag gtagagaagg accaatgggc cctagaggcg aagctggacc tcctggatct 1920
ggcgagaaag gcgaaagggg agctgcaggc gaaccaggac cacatggacc tccaggtgtt 1980
cccggatctg tgggccctaa gggatcttct ggttcccctg gaccacaagg cccacctgga 2040
cctgttggac tccaaggact gaggggcgaa gttggactgc caggcgtcaa gggcgacaag 2100
ggtccaatgg gaccacctgg tccaaagggc gatcagggcg aaaagggacc tagaggactg 2160
acaggcgagc ccggaatgag aggacttcct ggtgctgttg gagagcctgg cgctaaaggt 2220
gctatgggac ctgcaggccc cgacggacat caaggaccta ggggagaaca gggcctgacc 2280
ggcatgcctg gaattagagg tcctcctgga ccttccggcg atcctggcaa accaggattg 2340
actggacctc agggaccaca gggactgcct ggaacaccag gcagacctgg aatcaaaggc 2400
gaacctggcg ctcccggcaa gattgtgaca tctgagggca gctccatgct gaccgtgcct 2460
ggtccacctg ggcctccagg cgccatgggt cctccgggtc caccaggtgc tccaggacca 2520
gccggaccag caggacttcc aggccatcaa gaagtgctga acctgcaggg gcctcctggg 2580
ccgcctggac caagagggcc accagggcca tctattccag gaccaccagg tcctagaggc 2640
cctccaggcg aaggattgcc aggtcctcca gggccacctg gcagctttct gagcaacagc 2700
gagacattcc tgagcggccc tccaggacct cctggaccac caggacctaa aggcgatcaa 2760
ggacctccag gaccgagagg acatcagggc gaacaaggac tgcctggctt tagcacaagc 2820
ggcagctcta gcttcggcct caatctgcag ggtccaccag ggccaccagg acctcaaggt 2880
cctaaaggcg ataagggcga tccaggcgtt ccaggcgctc tgggtattcc ttctggacca 2940
tctgaaggcg gctcctccag cactatgtac gtgtcaggtc caccgggtcc acctggaccg 3000
ccaggaccac ctggatctat ctctagctcc ggccaagaga tccagcagta catcagcgag 3060
tacatgcagt ctgacagcat ccggtcctac ctgtctggcg ttcaaggtcc accgggacct 3120
ccggggcctc ctggacctgt tacaacaatc accggcgaga ctttcgacta cagcgagctg 3180
gcctctcacg tggtgtccta tctgagaacc agcggctatg gcgtgtccct gttcagctcc 3240
agcatcagct ccgaggacat tctggcagtg ctgcagaggg atgacgtgcg gcagtacctg 3300
agacagtatc tgatggggcc cagagggcca cctggtccac caggcgctag cggagatgga 3360
tctctgctga gcctggatta cgccgagctg agcagcagaa tcctgagcta catgagcagc 3420
tccggcatct ccattgggtt gcctggacct ccaggtccac caggattgcc tggcacaagc 3480
tacgaggaac tgctgtccct gctgaggggc agcgagttta gaggaatcgt tggaccacct 3540
gggccaccag gtccacctgg tatccctgga aatgtgtggt ctagcatcag cgtggaagat 3600
ctgagcagct acctgcacac agccggcctg agctttattc caggacctcc agggccgcca 3660
gggcctcctg gtcctcgggg accgcctggc gttagcggag cacttgcaac atatgccgcc 3720
gagaacagcg actccttcag aagcgagctg atctcctacc tgactagccc cgatgtgcgg 3780
agctttatcg ttggcccgcc tggtcctcca ggacctcaag gacctcctgg cgattctaga 3840
ctgctgagca cagatgccag ccacagcaga ggcagctcct ctagctctca ctccagttct 3900
gtgcggagag gctccagcta cagcagctct atgtcaacag gtggcggagg cgctggaagt 3960
cttggagctg gtggcgcttt tggagaagcc gctggcgatc gtggcccata cggaacagat 4020
attggacccg gcggtggata tggcgctgcc gctgaaggcg ggatgtatgc cggaaatggt 4080
ggactgctgg gcgccgattt tgctggcgac ctggactata atgagctggc cgtcagagtg 4140
tccgagagca tgcaaagaca ggggctgctt caaggcatgg cctacacagt tcaaggccca 4200
ccaggacagc ctggtccaca gggaccaccg ggaatcagca aagtgttctc tgcctacagc 4260
aacgtgaccg ccgacctgat ggacttcttc cagacctacg gcgccattca gggacctcca 4320
ggccaaaagg gcgaaatggg tacacctggg ccgaaaggcg accgaggacc tgctgggcca 4380
cctggacatc ccgggcctcc agggcctaga ggacacaaag gcgaaaaagg cgacaaaggg 4440
gaccaagtct acgccggcag acggcggaga agatccattg ccgtgaagcc ctaa 4494
<210> 15
<211> 1464
<212> PRT
<213> 智人(Homo sapiens)
<400> 15
Met Phe Ser Phe Val Asp Leu Arg Leu Leu Leu Leu Leu Ala Ala Thr
1 5 10 15
Ala Leu Leu Thr His Gly Gln Glu Glu Gly Gln Val Glu Gly Gln Asp
20 25 30
Glu Asp Ile Pro Pro Ile Thr Cys Val Gln Asn Gly Leu Arg Tyr His
35 40 45
Asp Arg Asp Val Trp Lys Pro Glu Pro Cys Arg Ile Cys Val Cys Asp
50 55 60
Asn Gly Lys Val Leu Cys Asp Asp Val Ile Cys Asp Glu Thr Lys Asn
65 70 75 80
Cys Pro Gly Ala Glu Val Pro Glu Gly Glu Cys Cys Pro Val Cys Pro
85 90 95
Asp Gly Ser Glu Ser Pro Thr Asp Gln Glu Thr Thr Gly Val Glu Gly
100 105 110
Pro Lys Gly Asp Thr Gly Pro Arg Gly Pro Arg Gly Pro Ala Gly Pro
115 120 125
Pro Gly Arg Asp Gly Ile Pro Gly Gln Pro Gly Leu Pro Gly Pro Pro
130 135 140
Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Leu Gly Gly Asn Phe Ala
145 150 155 160
Pro Gln Leu Ser Tyr Gly Tyr Asp Glu Lys Ser Thr Gly Gly Ile Ser
165 170 175
Val Pro Gly Pro Met Gly Pro Ser Gly Pro Arg Gly Leu Pro Gly Pro
180 185 190
Pro Gly Ala Pro Gly Pro Gln Gly Phe Gln Gly Pro Pro Gly Glu Pro
195 200 205
Gly Glu Pro Gly Ala Ser Gly Pro Met Gly Pro Arg Gly Pro Pro Gly
210 215 220
Pro Pro Gly Lys Asn Gly Asp Asp Gly Glu Ala Gly Lys Pro Gly Arg
225 230 235 240
Pro Gly Glu Arg Gly Pro Pro Gly Pro Gln Gly Ala Arg Gly Leu Pro
245 250 255
Gly Thr Ala Gly Leu Pro Gly Met Lys Gly His Arg Gly Phe Ser Gly
260 265 270
Leu Asp Gly Ala Lys Gly Asp Ala Gly Pro Ala Gly Pro Lys Gly Glu
275 280 285
Pro Gly Ser Pro Gly Glu Asn Gly Ala Pro Gly Gln Met Gly Pro Arg
290 295 300
Gly Leu Pro Gly Glu Arg Gly Arg Pro Gly Ala Pro Gly Pro Ala Gly
305 310 315 320
Ala Arg Gly Asn Asp Gly Ala Thr Gly Ala Ala Gly Pro Pro Gly Pro
325 330 335
Thr Gly Pro Ala Gly Pro Pro Gly Phe Pro Gly Ala Val Gly Ala Lys
340 345 350
Gly Glu Ala Gly Pro Gln Gly Pro Arg Gly Ser Glu Gly Pro Gln Gly
355 360 365
Val Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Ala Ala Gly Pro
370 375 380
Ala Gly Asn Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Ala Asn
385 390 395 400
Gly Ala Pro Gly Ile Ala Gly Ala Pro Gly Phe Pro Gly Ala Arg Gly
405 410 415
Pro Ser Gly Pro Gln Gly Pro Gly Gly Pro Pro Gly Pro Lys Gly Asn
420 425 430
Ser Gly Glu Pro Gly Ala Pro Gly Ser Lys Gly Asp Thr Gly Ala Lys
435 440 445
Gly Glu Pro Gly Pro Val Gly Val Gln Gly Pro Pro Gly Pro Ala Gly
450 455 460
Glu Glu Gly Lys Arg Gly Ala Arg Gly Glu Pro Gly Pro Thr Gly Leu
465 470 475 480
Pro Gly Pro Pro Gly Glu Arg Gly Gly Pro Gly Ser Arg Gly Phe Pro
485 490 495
Gly Ala Asp Gly Val Ala Gly Pro Lys Gly Pro Ala Gly Glu Arg Gly
500 505 510
Ser Pro Gly Pro Ala Gly Pro Lys Gly Ser Pro Gly Glu Ala Gly Arg
515 520 525
Pro Gly Glu Ala Gly Leu Pro Gly Ala Lys Gly Leu Thr Gly Ser Pro
530 535 540
Gly Ser Pro Gly Pro Asp Gly Lys Thr Gly Pro Pro Gly Pro Ala Gly
545 550 555 560
Gln Asp Gly Arg Pro Gly Pro Pro Gly Pro Pro Gly Ala Arg Gly Gln
565 570 575
Ala Gly Val Met Gly Phe Pro Gly Pro Lys Gly Ala Ala Gly Glu Pro
580 585 590
Gly Lys Ala Gly Glu Arg Gly Val Pro Gly Pro Pro Gly Ala Val Gly
595 600 605
Pro Ala Gly Lys Asp Gly Glu Ala Gly Ala Gln Gly Pro Pro Gly Pro
610 615 620
Ala Gly Pro Ala Gly Glu Arg Gly Glu Gln Gly Pro Ala Gly Ser Pro
625 630 635 640
Gly Phe Gln Gly Leu Pro Gly Pro Ala Gly Pro Pro Gly Glu Ala Gly
645 650 655
Lys Pro Gly Glu Gln Gly Val Pro Gly Asp Leu Gly Ala Pro Gly Pro
660 665 670
Ser Gly Ala Arg Gly Glu Arg Gly Phe Pro Gly Glu Arg Gly Val Gln
675 680 685
Gly Pro Pro Gly Pro Ala Gly Pro Arg Gly Ala Asn Gly Ala Pro Gly
690 695 700
Asn Asp Gly Ala Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Ser
705 710 715 720
Gln Gly Ala Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Ala Ala
725 730 735
Gly Leu Pro Gly Pro Lys Gly Asp Arg Gly Asp Ala Gly Pro Lys Gly
740 745 750
Ala Asp Gly Ser Pro Gly Lys Asp Gly Val Arg Gly Leu Thr Gly Pro
755 760 765
Ile Gly Pro Pro Gly Pro Ala Gly Ala Pro Gly Asp Lys Gly Glu Ser
770 775 780
Gly Pro Ser Gly Pro Ala Gly Pro Thr Gly Ala Arg Gly Ala Pro Gly
785 790 795 800
Asp Arg Gly Glu Pro Gly Pro Pro Gly Pro Ala Gly Phe Ala Gly Pro
805 810 815
Pro Gly Ala Asp Gly Gln Pro Gly Ala Lys Gly Glu Pro Gly Asp Ala
820 825 830
Gly Ala Lys Gly Asp Ala Gly Pro Pro Gly Pro Ala Gly Pro Ala Gly
835 840 845
Pro Pro Gly Pro Ile Gly Asn Val Gly Ala Pro Gly Ala Lys Gly Ala
850 855 860
Arg Gly Ser Ala Gly Pro Pro Gly Ala Thr Gly Phe Pro Gly Ala Ala
865 870 875 880
Gly Arg Val Gly Pro Pro Gly Pro Ser Gly Asn Ala Gly Pro Pro Gly
885 890 895
Pro Pro Gly Pro Ala Gly Lys Glu Gly Gly Lys Gly Pro Arg Gly Glu
900 905 910
Thr Gly Pro Ala Gly Arg Pro Gly Glu Val Gly Pro Pro Gly Pro Pro
915 920 925
Gly Pro Ala Gly Glu Lys Gly Ser Pro Gly Ala Asp Gly Pro Ala Gly
930 935 940
Ala Pro Gly Thr Pro Gly Pro Gln Gly Ile Ala Gly Gln Arg Gly Val
945 950 955 960
Val Gly Leu Pro Gly Gln Arg Gly Glu Arg Gly Phe Pro Gly Leu Pro
965 970 975
Gly Pro Ser Gly Glu Pro Gly Lys Gln Gly Pro Ser Gly Ala Ser Gly
980 985 990
Glu Arg Gly Pro Pro Gly Pro Met Gly Pro Pro Gly Leu Ala Gly Pro
995 1000 1005
Pro Gly Glu Ser Gly Arg Glu Gly Ala Pro Gly Ala Glu Gly Ser Pro
1010 1015 1020
Gly Arg Asp Gly Ser Pro Gly Ala Lys Gly Asp Arg Gly Glu Thr Gly
1025 1030 1035 1040
Pro Ala Gly Pro Pro Gly Ala Pro Gly Ala Pro Gly Ala Pro Gly Pro
1045 1050 1055
Val Gly Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Thr Gly Pro Ala
1060 1065 1070
Gly Pro Ala Gly Pro Val Gly Pro Val Gly Ala Arg Gly Pro Ala Gly
1075 1080 1085
Pro Gln Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Gln Gly Asp
1090 1095 1100
Arg Gly Ile Lys Gly His Arg Gly Phe Ser Gly Leu Gln Gly Pro Pro
1105 1110 1115 1120
Gly Pro Pro Gly Ser Pro Gly Glu Gln Gly Pro Ser Gly Ala Ser Gly
1125 1130 1135
Pro Ala Gly Pro Arg Gly Pro Pro Gly Ser Ala Gly Ala Pro Gly Lys
1140 1145 1150
Asp Gly Leu Asn Gly Leu Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg
1155 1160 1165
Gly Arg Thr Gly Asp Ala Gly Pro Val Gly Pro Pro Gly Pro Pro Gly
1170 1175 1180
Pro Pro Gly Pro Pro Gly Pro Pro Ser Ala Gly Phe Asp Phe Ser Phe
1185 1190 1195 1200
Leu Pro Gln Pro Pro Gln Glu Lys Ala His Asp Gly Gly Arg Tyr Tyr
1205 1210 1215
Arg Ala Asp Asp Ala Asn Val Val Arg Asp Arg Asp Leu Glu Val Asp
1220 1225 1230
Thr Thr Leu Lys Ser Leu Ser Gln Gln Ile Glu Asn Ile Arg Ser Pro
1235 1240 1245
Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp Leu Lys Met
1250 1255 1260
Cys His Ser Asp Trp Lys Ser Gly Glu Tyr Trp Ile Asp Pro Asn Gln
1265 1270 1275 1280
Gly Cys Asn Leu Asp Ala Ile Lys Val Phe Cys Asn Met Glu Thr Gly
1285 1290 1295
Glu Thr Cys Val Tyr Pro Thr Gln Pro Ser Val Ala Gln Lys Asn Trp
1300 1305 1310
Tyr Ile Ser Lys Asn Pro Lys Asp Lys Arg His Val Trp Phe Gly Glu
1315 1320 1325
Ser Met Thr Asp Gly Phe Gln Phe Glu Tyr Gly Gly Gln Gly Ser Asp
1330 1335 1340
Pro Ala Asp Val Ala Ile Gln Leu Thr Phe Leu Arg Leu Met Ser Thr
1345 1350 1355 1360
Glu Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Val Ala Tyr
1365 1370 1375
Met Asp Gln Gln Thr Gly Asn Leu Lys Lys Ala Leu Leu Leu Gln Gly
1380 1385 1390
Ser Asn Glu Ile Glu Ile Arg Ala Glu Gly Asn Ser Arg Phe Thr Tyr
1395 1400 1405
Ser Val Thr Val Asp Gly Cys Thr Ser His Thr Gly Ala Trp Gly Lys
1410 1415 1420
Thr Val Ile Glu Tyr Lys Thr Thr Lys Thr Ser Arg Leu Pro Ile Ile
1425 1430 1435 1440
Asp Val Ala Pro Leu Asp Val Gly Ala Pro Asp Gln Glu Phe Gly Phe
1445 1450 1455
Asp Val Gly Pro Val Cys Phe Leu
1460
<210> 16
<211> 1366
<212> PRT
<213> 智人(Homo sapiens)
<400> 16
Met Leu Ser Phe Val Asp Thr Arg Thr Leu Leu Leu Leu Ala Val Thr
1 5 10 15
Leu Cys Leu Ala Thr Cys Gln Ser Leu Gln Glu Glu Thr Val Arg Lys
20 25 30
Gly Pro Ala Gly Asp Arg Gly Pro Arg Gly Glu Arg Gly Pro Pro Gly
35 40 45
Pro Pro Gly Arg Asp Gly Glu Asp Gly Pro Thr Gly Pro Pro Gly Pro
50 55 60
Pro Gly Pro Pro Gly Pro Pro Gly Leu Gly Gly Asn Phe Ala Ala Gln
65 70 75 80
Tyr Asp Gly Lys Gly Val Gly Leu Gly Pro Gly Pro Met Gly Leu Met
85 90 95
Gly Pro Arg Gly Pro Pro Gly Ala Ala Gly Ala Pro Gly Pro Gln Gly
100 105 110
Phe Gln Gly Pro Ala Gly Glu Pro Gly Glu Pro Gly Gln Thr Gly Pro
115 120 125
Ala Gly Ala Arg Gly Pro Ala Gly Pro Pro Gly Lys Ala Gly Glu Asp
130 135 140
Gly His Pro Gly Lys Pro Gly Arg Pro Gly Glu Arg Gly Val Val Gly
145 150 155 160
Pro Gln Gly Ala Arg Gly Phe Pro Gly Thr Pro Gly Leu Pro Gly Phe
165 170 175
Lys Gly Ile Arg Gly His Asn Gly Leu Asp Gly Leu Lys Gly Gln Pro
180 185 190
Gly Ala Pro Gly Val Lys Gly Glu Pro Gly Ala Pro Gly Glu Asn Gly
195 200 205
Thr Pro Gly Gln Thr Gly Ala Arg Gly Leu Pro Gly Glu Arg Gly Arg
210 215 220
Val Gly Ala Pro Gly Pro Ala Gly Ala Arg Gly Ser Asp Gly Ser Val
225 230 235 240
Gly Pro Val Gly Pro Ala Gly Pro Ile Gly Ser Ala Gly Pro Pro Gly
245 250 255
Phe Pro Gly Ala Pro Gly Pro Lys Gly Glu Ile Gly Ala Val Gly Asn
260 265 270
Ala Gly Pro Ala Gly Pro Ala Gly Pro Arg Gly Glu Val Gly Leu Pro
275 280 285
Gly Leu Ser Gly Pro Val Gly Pro Pro Gly Asn Pro Gly Ala Asn Gly
290 295 300
Leu Thr Gly Ala Lys Gly Ala Ala Gly Leu Pro Gly Val Ala Gly Ala
305 310 315 320
Pro Gly Leu Pro Gly Pro Arg Gly Ile Pro Gly Pro Val Gly Ala Ala
325 330 335
Gly Ala Thr Gly Ala Arg Gly Leu Val Gly Glu Pro Gly Pro Ala Gly
340 345 350
Ser Lys Gly Glu Ser Gly Asn Lys Gly Glu Pro Gly Ser Ala Gly Pro
355 360 365
Gln Gly Pro Pro Gly Pro Ser Gly Glu Glu Gly Lys Arg Gly Pro Asn
370 375 380
Gly Glu Ala Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly Leu Arg Gly
385 390 395 400
Ser Pro Gly Ser Arg Gly Leu Pro Gly Ala Asp Gly Arg Ala Gly Val
405 410 415
Met Gly Pro Pro Gly Ser Arg Gly Ala Ser Gly Pro Ala Gly Val Arg
420 425 430
Gly Pro Asn Gly Asp Ala Gly Arg Pro Gly Glu Pro Gly Leu Met Gly
435 440 445
Pro Arg Gly Leu Pro Gly Ser Pro Gly Asn Ile Gly Pro Ala Gly Lys
450 455 460
Glu Gly Pro Val Gly Leu Pro Gly Ile Asp Gly Arg Pro Gly Pro Ile
465 470 475 480
Gly Pro Ala Gly Ala Arg Gly Glu Pro Gly Asn Ile Gly Phe Pro Gly
485 490 495
Pro Lys Gly Pro Thr Gly Asp Pro Gly Lys Asn Gly Asp Lys Gly His
500 505 510
Ala Gly Leu Ala Gly Ala Arg Gly Ala Pro Gly Pro Asp Gly Asn Asn
515 520 525
Gly Ala Gln Gly Pro Pro Gly Pro Gln Gly Val Gln Gly Gly Lys Gly
530 535 540
Glu Gln Gly Pro Pro Gly Pro Pro Gly Phe Gln Gly Leu Pro Gly Pro
545 550 555 560
Ser Gly Pro Ala Gly Glu Val Gly Lys Pro Gly Glu Arg Gly Leu His
565 570 575
Gly Glu Phe Gly Leu Pro Gly Pro Ala Gly Pro Arg Gly Glu Arg Gly
580 585 590
Pro Pro Gly Glu Ser Gly Ala Ala Gly Pro Thr Gly Pro Ile Gly Ser
595 600 605
Arg Gly Pro Ser Gly Pro Pro Gly Pro Asp Gly Asn Lys Gly Glu Pro
610 615 620
Gly Val Val Gly Ala Val Gly Thr Ala Gly Pro Ser Gly Pro Ser Gly
625 630 635 640
Leu Pro Gly Glu Arg Gly Ala Ala Gly Ile Pro Gly Gly Lys Gly Glu
645 650 655
Lys Gly Glu Pro Gly Leu Arg Gly Glu Ile Gly Asn Pro Gly Arg Asp
660 665 670
Gly Ala Arg Gly Ala Pro Gly Ala Val Gly Ala Pro Gly Pro Ala Gly
675 680 685
Ala Thr Gly Asp Arg Gly Glu Ala Gly Ala Ala Gly Pro Ala Gly Pro
690 695 700
Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg Gly Glu Val Gly Pro Ala
705 710 715 720
Gly Pro Asn Gly Phe Ala Gly Pro Ala Gly Ala Ala Gly Gln Pro Gly
725 730 735
Ala Lys Gly Glu Arg Gly Ala Lys Gly Pro Lys Gly Glu Asn Gly Val
740 745 750
Val Gly Pro Thr Gly Pro Val Gly Ala Ala Gly Pro Ala Gly Pro Asn
755 760 765
Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Asp Gly Gly Pro Pro Gly
770 775 780
Met Thr Gly Phe Pro Gly Ala Ala Gly Arg Thr Gly Pro Pro Gly Pro
785 790 795 800
Ser Gly Ile Ser Gly Pro Pro Gly Pro Pro Gly Pro Ala Gly Lys Glu
805 810 815
Gly Leu Arg Gly Pro Arg Gly Asp Gln Gly Pro Val Gly Arg Thr Gly
820 825 830
Glu Val Gly Ala Val Gly Pro Pro Gly Phe Ala Gly Glu Lys Gly Pro
835 840 845
Ser Gly Glu Ala Gly Thr Ala Gly Pro Pro Gly Thr Pro Gly Pro Gln
850 855 860
Gly Leu Leu Gly Ala Pro Gly Ile Leu Gly Leu Pro Gly Ser Arg Gly
865 870 875 880
Glu Arg Gly Leu Pro Gly Val Ala Gly Ala Val Gly Glu Pro Gly Pro
885 890 895
Leu Gly Ile Ala Gly Pro Pro Gly Ala Arg Gly Pro Pro Gly Ala Val
900 905 910
Gly Ser Pro Gly Val Asn Gly Ala Pro Gly Glu Ala Gly Arg Asp Gly
915 920 925
Asn Pro Gly Asn Asp Gly Pro Pro Gly Arg Asp Gly Gln Pro Gly His
930 935 940
Lys Gly Glu Arg Gly Tyr Pro Gly Asn Ile Gly Pro Val Gly Ala Ala
945 950 955 960
Gly Ala Pro Gly Pro His Gly Pro Val Gly Pro Ala Gly Lys His Gly
965 970 975
Asn Arg Gly Glu Thr Gly Pro Ser Gly Pro Val Gly Pro Ala Gly Ala
980 985 990
Val Gly Pro Arg Gly Pro Ser Gly Pro Gln Gly Ile Arg Gly Asp Lys
995 1000 1005
Gly Glu Pro Gly Glu Lys Gly Pro Arg Gly Leu Pro Gly Leu Lys Gly
1010 1015 1020
His Asn Gly Leu Gln Gly Leu Pro Gly Ile Ala Gly His His Gly Asp
1025 1030 1035 1040
Gln Gly Ala Pro Gly Ser Val Gly Pro Ala Gly Pro Arg Gly Pro Ala
1045 1050 1055
Gly Pro Ser Gly Pro Ala Gly Lys Asp Gly Arg Thr Gly His Pro Gly
1060 1065 1070
Thr Val Gly Pro Ala Gly Ile Arg Gly Pro Gln Gly His Gln Gly Pro
1075 1080 1085
Ala Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Val Ser
1090 1095 1100
Gly Gly Gly Tyr Asp Phe Gly Tyr Asp Gly Asp Phe Tyr Arg Ala Asp
1105 1110 1115 1120
Gln Pro Arg Ser Ala Pro Ser Leu Arg Pro Lys Asp Tyr Glu Val Asp
1125 1130 1135
Ala Thr Leu Lys Ser Leu Asn Asn Gln Ile Glu Thr Leu Leu Thr Pro
1140 1145 1150
Glu Gly Ser Arg Lys Asn Pro Ala Arg Thr Cys Arg Asp Leu Arg Leu
1155 1160 1165
Ser His Pro Glu Trp Ser Ser Gly Tyr Tyr Trp Ile Asp Pro Asn Gln
1170 1175 1180
Gly Cys Thr Met Asp Ala Ile Lys Val Tyr Cys Asp Phe Ser Thr Gly
1185 1190 1195 1200
Glu Thr Cys Ile Arg Ala Gln Pro Glu Asn Ile Pro Ala Lys Asn Trp
1205 1210 1215
Tyr Arg Ser Ser Lys Asp Lys Lys His Val Trp Leu Gly Glu Thr Ile
1220 1225 1230
Asn Ala Gly Ser Gln Phe Glu Tyr Asn Val Glu Gly Val Thr Ser Lys
1235 1240 1245
Glu Met Ala Thr Gln Leu Ala Phe Met Arg Leu Leu Ala Asn Tyr Ala
1250 1255 1260
Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Ile Ala Tyr Met Asp
1265 1270 1275 1280
Glu Glu Thr Gly Asn Leu Lys Lys Ala Val Ile Leu Gln Gly Ser Asn
1285 1290 1295
Asp Val Glu Leu Val Ala Glu Gly Asn Ser Arg Phe Thr Tyr Thr Val
1300 1305 1310
Leu Val Asp Gly Cys Ser Lys Lys Thr Asn Glu Trp Gly Lys Thr Ile
1315 1320 1325
Ile Glu Tyr Lys Thr Asn Lys Pro Ser Arg Leu Pro Phe Leu Asp Ile
1330 1335 1340
Ala Pro Leu Asp Ile Gly Gly Ala Asp Gln Glu Phe Phe Val Asp Ile
1345 1350 1355 1360
Gly Pro Val Cys Phe Lys
1365
<210> 17
<211> 1466
<212> PRT
<213> 智人(Homo sapiens)
<400> 17
Met Met Ser Phe Val Gln Lys Gly Ser Trp Leu Leu Leu Ala Leu Leu
1 5 10 15
His Pro Thr Ile Ile Leu Ala Gln Gln Glu Ala Val Glu Gly Gly Cys
20 25 30
Ser His Leu Gly Gln Ser Tyr Ala Asp Arg Asp Val Trp Lys Pro Glu
35 40 45
Pro Cys Gln Ile Cys Val Cys Asp Ser Gly Ser Val Leu Cys Asp Asp
50 55 60
Ile Ile Cys Asp Asp Gln Glu Leu Asp Cys Pro Asn Pro Glu Ile Pro
65 70 75 80
Phe Gly Glu Cys Cys Ala Val Cys Pro Gln Pro Pro Thr Ala Pro Thr
85 90 95
Arg Pro Pro Asn Gly Gln Gly Pro Gln Gly Pro Lys Gly Asp Pro Gly
100 105 110
Pro Pro Gly Ile Pro Gly Arg Asn Gly Asp Pro Gly Ile Pro Gly Gln
115 120 125
Pro Gly Ser Pro Gly Ser Pro Gly Pro Pro Gly Ile Cys Glu Ser Cys
130 135 140
Pro Thr Gly Pro Gln Asn Tyr Ser Pro Gln Tyr Asp Ser Tyr Asp Val
145 150 155 160
Lys Ser Gly Val Ala Val Gly Gly Leu Ala Gly Tyr Pro Gly Pro Ala
165 170 175
Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Thr Ser Gly His Pro Gly
180 185 190
Ser Pro Gly Ser Pro Gly Tyr Gln Gly Pro Pro Gly Glu Pro Gly Gln
195 200 205
Ala Gly Pro Ser Gly Pro Pro Gly Pro Pro Gly Ala Ile Gly Pro Ser
210 215 220
Gly Pro Ala Gly Lys Asp Gly Glu Ser Gly Arg Pro Gly Arg Pro Gly
225 230 235 240
Glu Arg Gly Leu Pro Gly Pro Pro Gly Ile Lys Gly Pro Ala Gly Ile
245 250 255
Pro Gly Phe Pro Gly Met Lys Gly His Arg Gly Phe Asp Gly Arg Asn
260 265 270
Gly Glu Lys Gly Glu Thr Gly Ala Pro Gly Leu Lys Gly Glu Asn Gly
275 280 285
Leu Pro Gly Glu Asn Gly Ala Pro Gly Pro Met Gly Pro Arg Gly Ala
290 295 300
Pro Gly Glu Arg Gly Arg Pro Gly Leu Pro Gly Ala Ala Gly Ala Arg
305 310 315 320
Gly Asn Asp Gly Ala Arg Gly Ser Asp Gly Gln Pro Gly Pro Pro Gly
325 330 335
Pro Pro Gly Thr Ala Gly Phe Pro Gly Ser Pro Gly Ala Lys Gly Glu
340 345 350
Val Gly Pro Ala Gly Ser Pro Gly Ser Asn Gly Ala Pro Gly Gln Arg
355 360 365
Gly Glu Pro Gly Pro Gln Gly His Ala Gly Ala Gln Gly Pro Pro Gly
370 375 380
Pro Pro Gly Ile Asn Gly Ser Pro Gly Gly Lys Gly Glu Met Gly Pro
385 390 395 400
Ala Gly Ile Pro Gly Ala Pro Gly Leu Met Gly Ala Arg Gly Pro Pro
405 410 415
Gly Pro Ala Gly Ala Asn Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly
420 425 430
Glu Pro Gly Lys Asn Gly Ala Lys Gly Glu Pro Gly Pro Arg Gly Glu
435 440 445
Arg Gly Glu Ala Gly Ile Pro Gly Val Pro Gly Ala Lys Gly Glu Asp
450 455 460
Gly Lys Asp Gly Ser Pro Gly Glu Pro Gly Ala Asn Gly Leu Pro Gly
465 470 475 480
Ala Ala Gly Glu Arg Gly Ala Pro Gly Phe Arg Gly Pro Ala Gly Pro
485 490 495
Asn Gly Ile Pro Gly Glu Lys Gly Pro Ala Gly Glu Arg Gly Ala Pro
500 505 510
Gly Pro Ala Gly Pro Arg Gly Ala Ala Gly Glu Pro Gly Arg Asp Gly
515 520 525
Val Pro Gly Gly Pro Gly Met Arg Gly Met Pro Gly Ser Pro Gly Gly
530 535 540
Pro Gly Ser Asp Gly Lys Pro Gly Pro Pro Gly Ser Gln Gly Glu Ser
545 550 555 560
Gly Arg Pro Gly Pro Pro Gly Pro Ser Gly Pro Arg Gly Gln Pro Gly
565 570 575
Val Met Gly Phe Pro Gly Pro Lys Gly Asn Asp Gly Ala Pro Gly Lys
580 585 590
Asn Gly Glu Arg Gly Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Pro
595 600 605
Gly Lys Asn Gly Glu Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly
610 615 620
Pro Gly Gly Asp Lys Gly Asp Thr Gly Pro Pro Gly Pro Gln Gly Leu
625 630 635 640
Gln Gly Leu Pro Gly Thr Gly Gly Pro Pro Gly Glu Asn Gly Lys Pro
645 650 655
Gly Glu Pro Gly Pro Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly
660 665 670
Gly Lys Gly Asp Ala Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Leu
675 680 685
Ala Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu
690 695 700
Gly Gly Lys Gly Ala Ala Gly Pro Pro Gly Pro Pro Gly Ala Ala Gly
705 710 715 720
Thr Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Gly Leu Gly Ser
725 730 735
Pro Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly Ala Asp
740 745 750
Gly Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro Ile Gly
755 760 765
Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly Gly Ala
770 775 780
Pro Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg
785 790 795 800
Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala Pro Gly
805 810 815
Gln Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro Gly Glu
820 825 830
Lys Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly Gly Ser
835 840 845
Gly Pro Ala Gly Pro Pro Gly Pro Gln Gly Val Lys Gly Glu Arg Gly
850 855 860
Ser Pro Gly Gly Pro Gly Ala Ala Gly Phe Pro Gly Ala Arg Gly Leu
865 870 875 880
Pro Gly Pro Pro Gly Ser Asn Gly Asn Pro Gly Pro Pro Gly Pro Ser
885 890 895
Gly Ser Pro Gly Lys Asp Gly Pro Pro Gly Pro Ala Gly Asn Thr Gly
900 905 910
Ala Pro Gly Ser Pro Gly Val Ser Gly Pro Lys Gly Asp Ala Gly Gln
915 920 925
Pro Gly Glu Lys Gly Ser Pro Gly Ala Gln Gly Pro Pro Gly Ala Pro
930 935 940
Gly Pro Leu Gly Ile Ala Gly Ile Thr Gly Ala Arg Gly Leu Ala Gly
945 950 955 960
Pro Pro Gly Met Pro Gly Pro Arg Gly Ser Pro Gly Pro Gln Gly Val
965 970 975
Lys Gly Glu Ser Gly Lys Pro Gly Ala Asn Gly Leu Ser Gly Glu Arg
980 985 990
Gly Pro Pro Gly Pro Gln Gly Leu Pro Gly Leu Ala Gly Thr Ala Gly
995 1000 1005
Glu Pro Gly Arg Asp Gly Asn Pro Gly Ser Asp Gly Leu Pro Gly Arg
1010 1015 1020
Asp Gly Ser Pro Gly Gly Lys Gly Asp Arg Gly Glu Asn Gly Ser Pro
1025 1030 1035 1040
Gly Ala Pro Gly Ala Pro Gly His Pro Gly Pro Pro Gly Pro Val Gly
1045 1050 1055
Pro Ala Gly Lys Ser Gly Asp Arg Gly Glu Ser Gly Pro Ala Gly Pro
1060 1065 1070
Ala Gly Ala Pro Gly Pro Ala Gly Ser Arg Gly Ala Pro Gly Pro Gln
1075 1080 1085
Gly Pro Arg Gly Asp Lys Gly Glu Thr Gly Glu Arg Gly Ala Ala Gly
1090 1095 1100
Ile Lys Gly His Arg Gly Phe Pro Gly Asn Pro Gly Ala Pro Gly Ser
1105 1110 1115 1120
Pro Gly Pro Ala Gly Gln Gln Gly Ala Ile Gly Ser Pro Gly Pro Ala
1125 1130 1135
Gly Pro Arg Gly Pro Val Gly Pro Ser Gly Pro Pro Gly Lys Asp Gly
1140 1145 1150
Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn
1155 1160 1165
Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro Gly Gln Pro
1170 1175 1180
Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys Gly Gly Val
1185 1190 1195 1200
Gly Ala Ala Ala Ile Ala Gly Ile Gly Gly Glu Lys Ala Gly Gly Phe
1205 1210 1215
Ala Pro Tyr Tyr Gly Asp Glu Pro Met Asp Phe Lys Ile Asn Thr Asp
1220 1225 1230
Glu Ile Met Thr Ser Leu Lys Ser Val Asn Gly Gln Ile Glu Ser Leu
1235 1240 1245
Ile Ser Pro Asp Gly Ser Arg Lys Asn Pro Ala Arg Asn Cys Arg Asp
1250 1255 1260
Leu Lys Phe Cys His Pro Glu Leu Lys Ser Gly Glu Tyr Trp Val Asp
1265 1270 1275 1280
Pro Asn Gln Gly Cys Lys Leu Asp Ala Ile Lys Val Phe Cys Asn Met
1285 1290 1295
Glu Thr Gly Glu Thr Cys Ile Ser Ala Asn Pro Leu Asn Val Pro Arg
1300 1305 1310
Lys His Trp Trp Thr Asp Ser Ser Ala Glu Lys Lys His Val Trp Phe
1315 1320 1325
Gly Glu Ser Met Asp Gly Gly Phe Gln Phe Ser Tyr Gly Asn Pro Glu
1330 1335 1340
Leu Pro Glu Asp Val Leu Asp Val Gln Leu Ala Phe Leu Arg Leu Leu
1345 1350 1355 1360
Ser Ser Arg Ala Ser Gln Asn Ile Thr Tyr His Cys Lys Asn Ser Ile
1365 1370 1375
Ala Tyr Met Asp Gln Ala Ser Gly Asn Val Lys Lys Ala Leu Lys Leu
1380 1385 1390
Met Gly Ser Asn Glu Gly Glu Phe Lys Ala Glu Gly Asn Ser Lys Phe
1395 1400 1405
Thr Tyr Thr Val Leu Glu Asp Gly Cys Thr Lys His Thr Gly Glu Trp
1410 1415 1420
Ser Lys Thr Val Phe Glu Tyr Arg Thr Arg Lys Ala Val Arg Leu Pro
1425 1430 1435 1440
Ile Val Asp Ile Ala Pro Tyr Asp Ile Gly Gly Pro Asp Gln Glu Phe
1445 1450 1455
Gly Val Asp Val Gly Pro Val Cys Phe Leu
1460 1465
<210> 18
<211> 1669
<212> PRT
<213> 智人(Homo sapiens)
<400> 18
Met Gly Pro Arg Leu Ser Val Trp Leu Leu Leu Leu Pro Ala Ala Leu
1 5 10 15
Leu Leu His Glu Glu His Ser Arg Ala Ala Ala Lys Gly Gly Cys Ala
20 25 30
Gly Ser Gly Cys Gly Lys Cys Asp Cys His Gly Val Lys Gly Gln Lys
35 40 45
Gly Glu Arg Gly Leu Pro Gly Leu Gln Gly Val Ile Gly Phe Pro Gly
50 55 60
Met Gln Gly Pro Glu Gly Pro Gln Gly Pro Pro Gly Gln Lys Gly Asp
65 70 75 80
Thr Gly Glu Pro Gly Leu Pro Gly Thr Lys Gly Thr Arg Gly Pro Pro
85 90 95
Gly Ala Ser Gly Tyr Pro Gly Asn Pro Gly Leu Pro Gly Ile Pro Gly
100 105 110
Gln Asp Gly Pro Pro Gly Pro Pro Gly Ile Pro Gly Cys Asn Gly Thr
115 120 125
Lys Gly Glu Arg Gly Pro Leu Gly Pro Pro Gly Leu Pro Gly Phe Ala
130 135 140
Gly Asn Pro Gly Pro Pro Gly Leu Pro Gly Met Lys Gly Asp Pro Gly
145 150 155 160
Glu Ile Leu Gly His Val Pro Gly Met Leu Leu Lys Gly Glu Arg Gly
165 170 175
Phe Pro Gly Ile Pro Gly Thr Pro Gly Pro Pro Gly Leu Pro Gly Leu
180 185 190
Gln Gly Pro Val Gly Pro Pro Gly Phe Thr Gly Pro Pro Gly Pro Pro
195 200 205
Gly Pro Pro Gly Pro Pro Gly Glu Lys Gly Gln Met Gly Leu Ser Phe
210 215 220
Gln Gly Pro Lys Gly Asp Lys Gly Asp Gln Gly Val Ser Gly Pro Pro
225 230 235 240
Gly Val Pro Gly Gln Ala Gln Val Gln Glu Lys Gly Asp Phe Ala Thr
245 250 255
Lys Gly Glu Lys Gly Gln Lys Gly Glu Pro Gly Phe Gln Gly Met Pro
260 265 270
Gly Val Gly Glu Lys Gly Glu Pro Gly Lys Pro Gly Pro Arg Gly Lys
275 280 285
Pro Gly Lys Asp Gly Asp Lys Gly Glu Lys Gly Ser Pro Gly Phe Pro
290 295 300
Gly Glu Pro Gly Tyr Pro Gly Leu Ile Gly Arg Gln Gly Pro Gln Gly
305 310 315 320
Glu Lys Gly Glu Ala Gly Pro Pro Gly Pro Pro Gly Ile Val Ile Gly
325 330 335
Thr Gly Pro Leu Gly Glu Lys Gly Glu Arg Gly Tyr Pro Gly Thr Pro
340 345 350
Gly Pro Arg Gly Glu Pro Gly Pro Lys Gly Phe Pro Gly Leu Pro Gly
355 360 365
Gln Pro Gly Pro Pro Gly Leu Pro Val Pro Gly Gln Ala Gly Ala Pro
370 375 380
Gly Phe Pro Gly Glu Arg Gly Glu Lys Gly Asp Arg Gly Phe Pro Gly
385 390 395 400
Thr Ser Leu Pro Gly Pro Ser Gly Arg Asp Gly Leu Pro Gly Pro Pro
405 410 415
Gly Ser Pro Gly Pro Pro Gly Gln Pro Gly Tyr Thr Asn Gly Ile Val
420 425 430
Glu Cys Gln Pro Gly Pro Pro Gly Asp Gln Gly Pro Pro Gly Ile Pro
435 440 445
Gly Gln Pro Gly Phe Ile Gly Glu Ile Gly Glu Lys Gly Gln Lys Gly
450 455 460
Glu Ser Cys Leu Ile Cys Asp Ile Asp Gly Tyr Arg Gly Pro Pro Gly
465 470 475 480
Pro Gln Gly Pro Pro Gly Glu Ile Gly Phe Pro Gly Gln Pro Gly Ala
485 490 495
Lys Gly Asp Arg Gly Leu Pro Gly Arg Asp Gly Val Ala Gly Val Pro
500 505 510
Gly Pro Gln Gly Thr Pro Gly Leu Ile Gly Gln Pro Gly Ala Lys Gly
515 520 525
Glu Pro Gly Glu Phe Tyr Phe Asp Leu Arg Leu Lys Gly Asp Lys Gly
530 535 540
Asp Pro Gly Phe Pro Gly Gln Pro Gly Met Pro Gly Arg Ala Gly Ser
545 550 555 560
Pro Gly Arg Asp Gly His Pro Gly Leu Pro Gly Pro Lys Gly Ser Pro
565 570 575
Gly Ser Val Gly Leu Lys Gly Glu Arg Gly Pro Pro Gly Gly Val Gly
580 585 590
Phe Pro Gly Ser Arg Gly Asp Thr Gly Pro Pro Gly Pro Pro Gly Tyr
595 600 605
Gly Pro Ala Gly Pro Ile Gly Asp Lys Gly Gln Ala Gly Phe Pro Gly
610 615 620
Gly Pro Gly Ser Pro Gly Leu Pro Gly Pro Lys Gly Glu Pro Gly Lys
625 630 635 640
Ile Val Pro Leu Pro Gly Pro Pro Gly Ala Glu Gly Leu Pro Gly Ser
645 650 655
Pro Gly Phe Pro Gly Pro Gln Gly Asp Arg Gly Phe Pro Gly Thr Pro
660 665 670
Gly Arg Pro Gly Leu Pro Gly Glu Lys Gly Ala Val Gly Gln Pro Gly
675 680 685
Ile Gly Phe Pro Gly Pro Pro Gly Pro Lys Gly Val Asp Gly Leu Pro
690 695 700
Gly Asp Met Gly Pro Pro Gly Thr Pro Gly Arg Pro Gly Phe Asn Gly
705 710 715 720
Leu Pro Gly Asn Pro Gly Val Gln Gly Gln Lys Gly Glu Pro Gly Val
725 730 735
Gly Leu Pro Gly Leu Lys Gly Leu Pro Gly Leu Pro Gly Ile Pro Gly
740 745 750
Thr Pro Gly Glu Lys Gly Ser Ile Gly Val Pro Gly Val Pro Gly Glu
755 760 765
His Gly Ala Ile Gly Pro Pro Gly Leu Gln Gly Ile Arg Gly Glu Pro
770 775 780
Gly Pro Pro Gly Leu Pro Gly Ser Val Gly Ser Pro Gly Val Pro Gly
785 790 795 800
Ile Gly Pro Pro Gly Ala Arg Gly Pro Pro Gly Gly Gln Gly Pro Pro
805 810 815
Gly Leu Ser Gly Pro Pro Gly Ile Lys Gly Glu Lys Gly Phe Pro Gly
820 825 830
Phe Pro Gly Leu Asp Met Pro Gly Pro Lys Gly Asp Lys Gly Ala Gln
835 840 845
Gly Leu Pro Gly Ile Thr Gly Gln Ser Gly Leu Pro Gly Leu Pro Gly
850 855 860
Gln Gln Gly Ala Pro Gly Ile Pro Gly Phe Pro Gly Ser Lys Gly Glu
865 870 875 880
Met Gly Val Met Gly Thr Pro Gly Gln Pro Gly Ser Pro Gly Pro Val
885 890 895
Gly Ala Pro Gly Leu Pro Gly Glu Lys Gly Asp His Gly Phe Pro Gly
900 905 910
Ser Ser Gly Pro Arg Gly Asp Pro Gly Leu Lys Gly Asp Lys Gly Asp
915 920 925
Val Gly Leu Pro Gly Lys Pro Gly Ser Met Asp Lys Val Asp Met Gly
930 935 940
Ser Met Lys Gly Gln Lys Gly Asp Gln Gly Glu Lys Gly Gln Ile Gly
945 950 955 960
Pro Ile Gly Glu Lys Gly Ser Arg Gly Asp Pro Gly Thr Pro Gly Val
965 970 975
Pro Gly Lys Asp Gly Gln Ala Gly Gln Pro Gly Gln Pro Gly Pro Lys
980 985 990
Gly Asp Pro Gly Ile Ser Gly Thr Pro Gly Ala Pro Gly Leu Pro Gly
995 1000 1005
Pro Lys Gly Ser Val Gly Gly Met Gly Leu Pro Gly Thr Pro Gly Glu
1010 1015 1020
Lys Gly Val Pro Gly Ile Pro Gly Pro Gln Gly Ser Pro Gly Leu Pro
1025 1030 1035 1040
Gly Asp Lys Gly Ala Lys Gly Glu Lys Gly Gln Ala Gly Pro Pro Gly
1045 1050 1055
Ile Gly Ile Pro Gly Leu Arg Gly Glu Lys Gly Asp Gln Gly Ile Ala
1060 1065 1070
Gly Phe Pro Gly Ser Pro Gly Glu Lys Gly Glu Lys Gly Ser Ile Gly
1075 1080 1085
Ile Pro Gly Met Pro Gly Ser Pro Gly Leu Lys Gly Ser Pro Gly Ser
1090 1095 1100
Val Gly Tyr Pro Gly Ser Pro Gly Leu Pro Gly Glu Lys Gly Asp Lys
1105 1110 1115 1120
Gly Leu Pro Gly Leu Asp Gly Ile Pro Gly Val Lys Gly Glu Ala Gly
1125 1130 1135
Leu Pro Gly Thr Pro Gly Pro Thr Gly Pro Ala Gly Gln Lys Gly Glu
1140 1145 1150
Pro Gly Ser Asp Gly Ile Pro Gly Ser Ala Gly Glu Lys Gly Glu Pro
1155 1160 1165
Gly Leu Pro Gly Arg Gly Phe Pro Gly Phe Pro Gly Ala Lys Gly Asp
1170 1175 1180
Lys Gly Ser Lys Gly Glu Val Gly Phe Pro Gly Leu Ala Gly Ser Pro
1185 1190 1195 1200
Gly Ile Pro Gly Ser Lys Gly Glu Gln Gly Phe Met Gly Pro Pro Gly
1205 1210 1215
Pro Gln Gly Gln Pro Gly Leu Pro Gly Ser Pro Gly His Ala Thr Glu
1220 1225 1230
Gly Pro Lys Gly Asp Arg Gly Pro Gln Gly Gln Pro Gly Leu Pro Gly
1235 1240 1245
Leu Pro Gly Pro Met Gly Pro Pro Gly Leu Pro Gly Ile Asp Gly Val
1250 1255 1260
Lys Gly Asp Lys Gly Asn Pro Gly Trp Pro Gly Ala Pro Gly Val Pro
1265 1270 1275 1280
Gly Pro Lys Gly Asp Pro Gly Phe Gln Gly Met Pro Gly Ile Gly Gly
1285 1290 1295
Ser Pro Gly Ile Thr Gly Ser Lys Gly Asp Met Gly Pro Pro Gly Val
1300 1305 1310
Pro Gly Phe Gln Gly Pro Lys Gly Leu Pro Gly Leu Gln Gly Ile Lys
1315 1320 1325
Gly Asp Gln Gly Asp Gln Gly Val Pro Gly Ala Lys Gly Leu Pro Gly
1330 1335 1340
Pro Pro Gly Pro Pro Gly Pro Tyr Asp Ile Ile Lys Gly Glu Pro Gly
1345 1350 1355 1360
Leu Pro Gly Pro Glu Gly Pro Pro Gly Leu Lys Gly Leu Gln Gly Leu
1365 1370 1375
Pro Gly Pro Lys Gly Gln Gln Gly Val Thr Gly Leu Val Gly Ile Pro
1380 1385 1390
Gly Pro Pro Gly Ile Pro Gly Phe Asp Gly Ala Pro Gly Gln Lys Gly
1395 1400 1405
Glu Met Gly Pro Ala Gly Pro Thr Gly Pro Arg Gly Phe Pro Gly Pro
1410 1415 1420
Pro Gly Pro Asp Gly Leu Pro Gly Ser Met Gly Pro Pro Gly Thr Pro
1425 1430 1435 1440
Ser Val Asp His Gly Phe Leu Val Thr Arg His Ser Gln Thr Ile Asp
1445 1450 1455
Asp Pro Gln Cys Pro Ser Gly Thr Lys Ile Leu Tyr His Gly Tyr Ser
1460 1465 1470
Leu Leu Tyr Val Gln Gly Asn Glu Arg Ala His Gly Gln Asp Leu Gly
1475 1480 1485
Thr Ala Gly Ser Cys Leu Arg Lys Phe Ser Thr Met Pro Phe Leu Phe
1490 1495 1500
Cys Asn Ile Asn Asn Val Cys Asn Phe Ala Ser Arg Asn Asp Tyr Ser
1505 1510 1515 1520
Tyr Trp Leu Ser Thr Pro Glu Pro Met Pro Met Ser Met Ala Pro Ile
1525 1530 1535
Thr Gly Glu Asn Ile Arg Pro Phe Ile Ser Arg Cys Ala Val Cys Glu
1540 1545 1550
Ala Pro Ala Met Val Met Ala Val His Ser Gln Thr Ile Gln Ile Pro
1555 1560 1565
Pro Cys Pro Ser Gly Trp Ser Ser Leu Trp Ile Gly Tyr Ser Phe Val
1570 1575 1580
Met His Thr Ser Ala Gly Ala Glu Gly Ser Gly Gln Ala Leu Ala Ser
1585 1590 1595 1600
Pro Gly Ser Cys Leu Glu Glu Phe Arg Ser Ala Pro Phe Ile Glu Cys
1605 1610 1615
His Gly Arg Gly Thr Cys Asn Tyr Tyr Ala Asn Ala Tyr Ser Phe Trp
1620 1625 1630
Leu Ala Thr Ile Glu Arg Ser Glu Met Phe Lys Lys Pro Thr Pro Ser
1635 1640 1645
Thr Leu Lys Ala Gly Glu Leu Arg Thr His Val Ser Arg Cys Gln Val
1650 1655 1660
Cys Met Arg Arg Thr
1665
<210> 19
<211> 1028
<212> PRT
<213> 智人(Homo sapiens)
<400> 19
Met Arg Ala Ala Arg Ala Leu Leu Pro Leu Leu Leu Gln Ala Cys Trp
1 5 10 15
Thr Ala Ala Gln Asp Glu Pro Glu Thr Pro Arg Ala Val Ala Phe Gln
20 25 30
Asp Cys Pro Val Asp Leu Phe Phe Val Leu Asp Thr Ser Glu Ser Val
35 40 45
Ala Leu Arg Leu Lys Pro Tyr Gly Ala Leu Val Asp Lys Val Lys Ser
50 55 60
Phe Thr Lys Arg Phe Ile Asp Asn Leu Arg Asp Arg Tyr Tyr Arg Cys
65 70 75 80
Asp Arg Asn Leu Val Trp Asn Ala Gly Ala Leu His Tyr Ser Asp Glu
85 90 95
Val Glu Ile Ile Gln Gly Leu Thr Arg Met Pro Gly Gly Arg Asp Ala
100 105 110
Leu Lys Ser Ser Val Asp Ala Val Lys Tyr Phe Gly Lys Gly Thr Tyr
115 120 125
Thr Asp Cys Ala Ile Lys Lys Gly Leu Glu Gln Leu Leu Val Gly Gly
130 135 140
Ser His Leu Lys Glu Asn Lys Tyr Leu Ile Val Val Thr Asp Gly His
145 150 155 160
Pro Leu Glu Gly Tyr Lys Glu Pro Cys Gly Gly Leu Glu Asp Ala Val
165 170 175
Asn Glu Ala Lys His Leu Gly Val Lys Val Phe Ser Val Ala Ile Thr
180 185 190
Pro Asp His Leu Glu Pro Arg Leu Ser Ile Ile Ala Thr Asp His Thr
195 200 205
Tyr Arg Arg Asn Phe Thr Ala Ala Asp Trp Gly Gln Ser Arg Asp Ala
210 215 220
Glu Glu Ala Ile Ser Gln Thr Ile Asp Thr Ile Val Asp Met Ile Lys
225 230 235 240
Asn Asn Val Glu Gln Val Cys Cys Ser Phe Glu Cys Gln Pro Ala Arg
245 250 255
Gly Pro Pro Gly Leu Arg Gly Asp Pro Gly Phe Glu Gly Glu Arg Gly
260 265 270
Lys Pro Gly Leu Pro Gly Glu Lys Gly Glu Ala Gly Asp Pro Gly Arg
275 280 285
Pro Gly Asp Leu Gly Pro Val Gly Tyr Gln Gly Met Lys Gly Glu Lys
290 295 300
Gly Ser Arg Gly Glu Lys Gly Ser Arg Gly Pro Lys Gly Tyr Lys Gly
305 310 315 320
Glu Lys Gly Lys Arg Gly Ile Asp Gly Val Asp Gly Val Lys Gly Glu
325 330 335
Met Gly Tyr Pro Gly Leu Pro Gly Cys Lys Gly Ser Pro Gly Phe Asp
340 345 350
Gly Ile Gln Gly Pro Pro Gly Pro Lys Gly Asp Pro Gly Ala Phe Gly
355 360 365
Leu Lys Gly Glu Lys Gly Glu Pro Gly Ala Asp Gly Glu Ala Gly Arg
370 375 380
Pro Gly Ser Ser Gly Pro Ser Gly Asp Glu Gly Gln Pro Gly Glu Pro
385 390 395 400
Gly Pro Pro Gly Glu Lys Gly Glu Ala Gly Asp Glu Gly Asn Pro Gly
405 410 415
Pro Asp Gly Ala Pro Gly Glu Arg Gly Gly Pro Gly Glu Arg Gly Pro
420 425 430
Arg Gly Thr Pro Gly Thr Arg Gly Pro Arg Gly Asp Pro Gly Glu Ala
435 440 445
Gly Pro Gln Gly Asp Gln Gly Arg Glu Gly Pro Val Gly Val Pro Gly
450 455 460
Asp Pro Gly Glu Ala Gly Pro Ile Gly Pro Lys Gly Tyr Arg Gly Asp
465 470 475 480
Glu Gly Pro Pro Gly Ser Glu Gly Ala Arg Gly Ala Pro Gly Pro Ala
485 490 495
Gly Pro Pro Gly Asp Pro Gly Leu Met Gly Glu Arg Gly Glu Asp Gly
500 505 510
Pro Ala Gly Asn Gly Thr Glu Gly Phe Pro Gly Phe Pro Gly Tyr Pro
515 520 525
Gly Asn Arg Gly Ala Pro Gly Ile Asn Gly Thr Lys Gly Tyr Pro Gly
530 535 540
Leu Lys Gly Asp Glu Gly Glu Ala Gly Asp Pro Gly Asp Asp Asn Asn
545 550 555 560
Asp Ile Ala Pro Arg Gly Val Lys Gly Ala Lys Gly Tyr Arg Gly Pro
565 570 575
Glu Gly Pro Gln Gly Pro Pro Gly His Gln Gly Pro Pro Gly Pro Asp
580 585 590
Glu Cys Glu Ile Leu Asp Ile Ile Met Lys Met Cys Ser Cys Cys Glu
595 600 605
Cys Lys Cys Gly Pro Ile Asp Leu Leu Phe Val Leu Asp Ser Ser Glu
610 615 620
Ser Ile Gly Leu Gln Asn Phe Glu Ile Ala Lys Asp Phe Val Val Lys
625 630 635 640
Val Ile Asp Arg Leu Ser Arg Asp Glu Leu Val Lys Phe Glu Pro Gly
645 650 655
Gln Ser Tyr Ala Gly Val Val Gln Tyr Ser His Ser Gln Met Gln Glu
660 665 670
His Val Ser Leu Arg Ser Pro Ser Ile Arg Asn Val Gln Glu Leu Lys
675 680 685
Glu Ala Ile Lys Ser Leu Gln Trp Met Ala Gly Gly Thr Phe Thr Gly
690 695 700
Glu Ala Leu Gln Tyr Thr Arg Asp Gln Leu Leu Pro Pro Ser Pro Asn
705 710 715 720
Asn Arg Ile Ala Leu Val Ile Thr Asp Gly Arg Ser Asp Thr Gln Arg
725 730 735
Asp Thr Thr Pro Leu Asn Val Leu Cys Ser Pro Gly Ile Gln Val Val
740 745 750
Ser Val Gly Ile Lys Asp Val Phe Asp Phe Ile Pro Gly Ser Asp Gln
755 760 765
Leu Asn Val Ile Ser Cys Gln Gly Leu Ala Pro Ser Gln Gly Arg Pro
770 775 780
Gly Leu Ser Leu Val Lys Glu Asn Tyr Ala Glu Leu Leu Glu Asp Ala
785 790 795 800
Phe Leu Lys Asn Val Thr Ala Gln Ile Cys Ile Asp Lys Lys Cys Pro
805 810 815
Asp Tyr Thr Cys Pro Ile Thr Phe Ser Ser Pro Ala Asp Ile Thr Ile
820 825 830
Leu Leu Asp Gly Ser Ala Ser Val Gly Ser His Asn Phe Asp Thr Thr
835 840 845
Lys Arg Phe Ala Lys Arg Leu Ala Glu Arg Phe Leu Thr Ala Gly Arg
850 855 860
Thr Asp Pro Ala His Asp Val Arg Val Ala Val Val Gln Tyr Ser Gly
865 870 875 880
Thr Gly Gln Gln Arg Pro Glu Arg Ala Ser Leu Gln Phe Leu Gln Asn
885 890 895
Tyr Thr Ala Leu Ala Ser Ala Val Asp Ala Met Asp Phe Ile Asn Asp
900 905 910
Ala Thr Asp Val Asn Asp Ala Leu Gly Tyr Val Thr Arg Phe Tyr Arg
915 920 925
Glu Ala Ser Ser Gly Ala Ala Lys Lys Arg Leu Leu Leu Phe Ser Asp
930 935 940
Gly Asn Ser Gln Gly Ala Thr Pro Ala Ala Ile Glu Lys Ala Val Gln
945 950 955 960
Glu Ala Gln Arg Ala Gly Ile Glu Ile Phe Val Val Val Val Gly Arg
965 970 975
Gln Val Asn Glu Pro His Ile Arg Val Leu Val Thr Gly Lys Thr Ala
980 985 990
Glu Tyr Asp Val Ala Tyr Gly Glu Ser His Leu Phe Arg Val Pro Ser
995 1000 1005
Tyr Gln Ala Leu Leu Arg Gly Val Phe His Gln Thr Val Ser Arg Lys
1010 1015 1020
Val Ala Leu Gly
1025
<210> 20
<211> 2944
<212> PRT
<213> 智人(Homo sapiens)
<400> 20
Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala
1 5 10 15
Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr
20 25 30
Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser
35 40 45
Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu
50 55 60
Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala
65 70 75 80
Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala
85 90 95
Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr
100 105 110
Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp
115 120 125
His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys
130 135 140
Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala
145 150 155 160
Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys
165 170 175
Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser
180 185 190
Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu
195 200 205
Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val
210 215 220
Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu
225 230 235 240
Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser
245 250 255
Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu
260 265 270
Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly
275 280 285
Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln
290 295 300
Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser
305 310 315 320
Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln
325 330 335
Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly
340 345 350
Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr
355 360 365
Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp
370 375 380
Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly
385 390 395 400
Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser
405 410 415
Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu
420 425 430
Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp
435 440 445
Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser
450 455 460
Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr
465 470 475 480
Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro
485 490 495
Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr
500 505 510
Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp
515 520 525
Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr
530 535 540
Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe
545 550 555 560
Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser
565 570 575
Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg
580 585 590
Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val
595 600 605
Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala
610 615 620
Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser
625 630 635 640
Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln
645 650 655
Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu
660 665 670
Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro
675 680 685
Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile
690 695 700
Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His
705 710 715 720
Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr
725 730 735
Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His
740 745 750
Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val
755 760 765
Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile
770 775 780
Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr
785 790 795 800
Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro
805 810 815
Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg
820 825 830
Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val
835 840 845
Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro
850 855 860
Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu
865 870 875 880
His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe
885 890 895
Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu
900 905 910
Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr
915 920 925
Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro
930 935 940
Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile
945 950 955 960
Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp
965 970 975
Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu
980 985 990
Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly
995 1000 1005
Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr
1010 1015 1020
Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala
1025 1030 1035 1040
Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val
1045 1050 1055
Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr
1060 1065 1070
Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro
1075 1080 1085
Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro
1090 1095 1100
Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg
1105 1110 1115 1120
Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr
1125 1130 1135
Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly
1140 1145 1150
Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro
1155 1160 1165
Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly
1170 1175 1180
Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu
1185 1190 1195 1200
Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val
1205 1210 1215
Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala
1220 1225 1230
Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro
1235 1240 1245
Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu
1250 1255 1260
Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr
1265 1270 1275 1280
Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly
1285 1290 1295
Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg
1300 1305 1310
Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro
1315 1320 1325
Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly
1330 1335 1340
Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly
1345 1350 1355 1360
Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro
1365 1370 1375
Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly
1380 1385 1390
Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg
1395 1400 1405
Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly
1410 1415 1420
Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro
1425 1430 1435 1440
Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly
1445 1450 1455
Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro
1460 1465 1470
Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu
1475 1480 1485
Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly
1490 1495 1500
Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro
1505 1510 1515 1520
Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro
1525 1530 1535
Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro
1540 1545 1550
Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr
1555 1560 1565
Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp
1570 1575 1580
Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr
1585 1590 1595 1600
Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly
1605 1610 1615
Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg
1620 1625 1630
Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro
1635 1640 1645
Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly
1650 1655 1660
Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu
1665 1670 1675 1680
Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg
1685 1690 1695
Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly
1700 1705 1710
Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly
1715 1720 1725
Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu
1730 1735 1740
Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro
1745 1750 1755 1760
Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly
1765 1770 1775
Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro
1780 1785 1790
Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp
1795 1800 1805
Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly
1810 1815 1820
Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu
1825 1830 1835 1840
Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys
1845 1850 1855
Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly
1860 1865 1870
Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro
1875 1880 1885
Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly
1890 1895 1900
Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser
1905 1910 1915 1920
Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro
1925 1930 1935
Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys
1940 1945 1950
Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly
1955 1960 1965
Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser
1970 1975 1980
Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly
1985 1990 1995 2000
Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro
2005 2010 2015
Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu
2020 2025 2030
Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala
2035 2040 2045
Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly
2050 2055 2060
Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu
2065 2070 2075 2080
Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val
2085 2090 2095
Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu
2100 2105 2110
Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys
2115 2120 2125
Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly
2130 2135 2140
Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met
2145 2150 2155 2160
Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro
2165 2170 2175
Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly
2180 2185 2190
Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu
2195 2200 2205
Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly
2210 2215 2220
Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro
2225 2230 2235 2240
Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro
2245 2250 2255
Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly
2260 2265 2270
Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro
2275 2280 2285
Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly
2290 2295 2300
Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly
2305 2310 2315 2320
Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly
2325 2330 2335
Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp
2340 2345 2350
Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys
2355 2360 2365
Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro
2370 2375 2380
Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro
2385 2390 2395 2400
Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly
2405 2410 2415
Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg
2420 2425 2430
Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val
2435 2440 2445
Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly
2450 2455 2460
Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg
2465 2470 2475 2480
Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly
2485 2490 2495
Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser
2500 2505 2510
Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro
2515 2520 2525
Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg
2530 2535 2540
Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly
2545 2550 2555 2560
Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu
2565 2570 2575
Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala
2580 2585 2590
Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly
2595 2600 2605
Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu
2610 2615 2620
Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys
2625 2630 2635 2640
Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly
2645 2650 2655
His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala
2660 2665 2670
Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp
2675 2680 2685
Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly
2690 2695 2700
Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser
2705 2710 2715 2720
Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu
2725 2730 2735
Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val
2740 2745 2750
Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln
2755 2760 2765
Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala
2770 2775 2780
Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln
2785 2790 2795 2800
His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu
2805 2810 2815
Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro
2820 2825 2830
Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu
2835 2840 2845
Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln
2850 2855 2860
Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu
2865 2870 2875 2880
Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala
2885 2890 2895
Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys
2900 2905 2910
Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg
2915 2920 2925
Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp
2930 2935 2940
<210> 21
<211> 1497
<212> PRT
<213> 智人(Homo sapiens)
<400> 21
Met Asp Val Thr Lys Lys Asn Lys Arg Asp Gly Thr Glu Val Thr Glu
1 5 10 15
Arg Ile Val Thr Glu Thr Val Thr Thr Arg Leu Thr Ser Leu Pro Pro
20 25 30
Lys Gly Gly Thr Ser Asn Gly Tyr Ala Lys Thr Ala Ser Leu Gly Gly
35 40 45
Gly Ser Arg Leu Glu Lys Gln Ser Leu Thr His Gly Ser Ser Gly Tyr
50 55 60
Ile Asn Ser Thr Gly Ser Thr Arg Gly His Ala Ser Thr Ser Ser Tyr
65 70 75 80
Arg Arg Ala His Ser Pro Ala Ser Thr Leu Pro Asn Ser Pro Gly Ser
85 90 95
Thr Phe Glu Arg Lys Thr His Val Thr Arg His Ala Tyr Glu Gly Ser
100 105 110
Ser Ser Gly Asn Ser Ser Pro Glu Tyr Pro Arg Lys Glu Phe Ala Ser
115 120 125
Ser Ser Thr Arg Gly Arg Ser Gln Thr Arg Glu Ser Glu Ile Arg Val
130 135 140
Arg Leu Gln Ser Ala Ser Pro Ser Thr Arg Trp Thr Glu Leu Asp Asp
145 150 155 160
Val Lys Arg Leu Leu Lys Gly Ser Arg Ser Ala Ser Val Ser Pro Thr
165 170 175
Arg Asn Ser Ser Asn Thr Leu Pro Ile Pro Lys Lys Gly Thr Val Glu
180 185 190
Thr Lys Ile Val Thr Ala Ser Ser Gln Ser Val Ser Gly Thr Tyr Asp
195 200 205
Ala Thr Ile Leu Asp Ala Asn Leu Pro Ser His Val Trp Ser Ser Thr
210 215 220
Leu Pro Ala Gly Ser Ser Met Gly Thr Tyr His Asn Asn Met Thr Thr
225 230 235 240
Gln Ser Ser Ser Leu Leu Asn Thr Asn Ala Tyr Ser Ala Gly Ser Val
245 250 255
Phe Gly Val Pro Asn Asn Met Ala Ser Cys Ser Pro Thr Leu His Pro
260 265 270
Gly Leu Ser Thr Ser Ser Ser Val Phe Gly Met Gln Asn Asn Leu Ala
275 280 285
Pro Ser Leu Thr Thr Leu Ser His Gly Thr Thr Thr Thr Ser Thr Ala
290 295 300
Tyr Gly Val Lys Lys Asn Met Pro Gln Ser Pro Ala Ala Val Asn Thr
305 310 315 320
Gly Val Ser Thr Ser Ala Ala Cys Thr Thr Ser Val Gln Ser Asp Asp
325 330 335
Leu Leu His Lys Asp Cys Lys Phe Leu Ile Leu Glu Lys Asp Asn Thr
340 345 350
Pro Ala Lys Lys Glu Met Glu Leu Leu Ile Met Thr Lys Asp Ser Gly
355 360 365
Lys Val Phe Thr Ala Ser Pro Ala Ser Ile Ala Ala Thr Ser Phe Ser
370 375 380
Glu Asp Thr Leu Lys Lys Glu Lys Gln Ala Ala Tyr Asn Ala Asp Ser
385 390 395 400
Gly Leu Lys Ala Glu Ala Asn Gly Asp Leu Lys Thr Val Ser Thr Lys
405 410 415
Gly Lys Thr Thr Thr Ala Asp Ile His Ser Tyr Gly Ser Ser Gly Gly
420 425 430
Gly Gly Ser Gly Gly Gly Gly Gly Val Gly Gly Ala Gly Gly Gly Pro
435 440 445
Trp Gly Pro Ala Pro Ala Trp Cys Pro Cys Gly Ser Cys Cys Ser Trp
450 455 460
Trp Lys Trp Leu Leu Gly Leu Leu Leu Thr Trp Leu Leu Leu Leu Gly
465 470 475 480
Leu Leu Phe Gly Leu Ile Ala Leu Ala Glu Glu Val Arg Lys Leu Lys
485 490 495
Ala Arg Val Asp Glu Leu Glu Arg Ile Arg Arg Ser Ile Leu Pro Tyr
500 505 510
Gly Asp Ser Met Asp Arg Ile Glu Lys Asp Arg Leu Gln Gly Met Ala
515 520 525
Pro Ala Ala Gly Ala Asp Leu Asp Lys Ile Gly Leu His Ser Asp Ser
530 535 540
Gln Glu Glu Leu Trp Met Phe Val Arg Lys Lys Leu Met Met Glu Gln
545 550 555 560
Glu Asn Gly Asn Leu Arg Gly Ser Pro Gly Pro Lys Gly Asp Met Gly
565 570 575
Ser Pro Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Thr Pro Gly Ile
580 585 590
Pro Gly Pro Leu Gly His Pro Gly Pro Gln Gly Pro Lys Gly Gln Lys
595 600 605
Gly Ser Val Gly Asp Pro Gly Met Glu Gly Pro Met Gly Gln Arg Gly
610 615 620
Arg Glu Gly Pro Met Gly Pro Arg Gly Glu Ala Gly Pro Pro Gly Ser
625 630 635 640
Gly Glu Lys Gly Glu Arg Gly Ala Ala Gly Glu Pro Gly Pro His Gly
645 650 655
Pro Pro Gly Val Pro Gly Ser Val Gly Pro Lys Gly Ser Ser Gly Ser
660 665 670
Pro Gly Pro Gln Gly Pro Pro Gly Pro Val Gly Leu Gln Gly Leu Arg
675 680 685
Gly Glu Val Gly Leu Pro Gly Val Lys Gly Asp Lys Gly Pro Met Gly
690 695 700
Pro Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Pro Arg Gly Leu
705 710 715 720
Thr Gly Glu Pro Gly Met Arg Gly Leu Pro Gly Ala Val Gly Glu Pro
725 730 735
Gly Ala Lys Gly Ala Met Gly Pro Ala Gly Pro Asp Gly His Gln Gly
740 745 750
Pro Arg Gly Glu Gln Gly Leu Thr Gly Met Pro Gly Ile Arg Gly Pro
755 760 765
Pro Gly Pro Ser Gly Asp Pro Gly Lys Pro Gly Leu Thr Gly Pro Gln
770 775 780
Gly Pro Gln Gly Leu Pro Gly Thr Pro Gly Arg Pro Gly Ile Lys Gly
785 790 795 800
Glu Pro Gly Ala Pro Gly Lys Ile Val Thr Ser Glu Gly Ser Ser Met
805 810 815
Leu Thr Val Pro Gly Pro Pro Gly Pro Pro Gly Ala Met Gly Pro Pro
820 825 830
Gly Pro Pro Gly Ala Pro Gly Pro Ala Gly Pro Ala Gly Leu Pro Gly
835 840 845
His Gln Glu Val Leu Asn Leu Gln Gly Pro Pro Gly Pro Pro Gly Pro
850 855 860
Arg Gly Pro Pro Gly Pro Ser Ile Pro Gly Pro Pro Gly Pro Arg Gly
865 870 875 880
Pro Pro Gly Glu Gly Leu Pro Gly Pro Pro Gly Pro Pro Gly Ser Phe
885 890 895
Leu Ser Asn Ser Glu Thr Phe Leu Ser Gly Pro Pro Gly Pro Pro Gly
900 905 910
Pro Pro Gly Pro Lys Gly Asp Gln Gly Pro Pro Gly Pro Arg Gly His
915 920 925
Gln Gly Glu Gln Gly Leu Pro Gly Phe Ser Thr Ser Gly Ser Ser Ser
930 935 940
Phe Gly Leu Asn Leu Gln Gly Pro Pro Gly Pro Pro Gly Pro Gln Gly
945 950 955 960
Pro Lys Gly Asp Lys Gly Asp Pro Gly Val Pro Gly Ala Leu Gly Ile
965 970 975
Pro Ser Gly Pro Ser Glu Gly Gly Ser Ser Ser Thr Met Tyr Val Ser
980 985 990
Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Ser Ile Ser
995 1000 1005
Ser Ser Gly Gln Glu Ile Gln Gln Tyr Ile Ser Glu Tyr Met Gln Ser
1010 1015 1020
Asp Ser Ile Arg Ser Tyr Leu Ser Gly Val Gln Gly Pro Pro Gly Pro
1025 1030 1035 1040
Pro Gly Pro Pro Gly Pro Val Thr Thr Ile Thr Gly Glu Thr Phe Asp
1045 1050 1055
Tyr Ser Glu Leu Ala Ser His Val Val Ser Tyr Leu Arg Thr Ser Gly
1060 1065 1070
Tyr Gly Val Ser Leu Phe Ser Ser Ser Ile Ser Ser Glu Asp Ile Leu
1075 1080 1085
Ala Val Leu Gln Arg Asp Asp Val Arg Gln Tyr Leu Arg Gln Tyr Leu
1090 1095 1100
Met Gly Pro Arg Gly Pro Pro Gly Pro Pro Gly Ala Ser Gly Asp Gly
1105 1110 1115 1120
Ser Leu Leu Ser Leu Asp Tyr Ala Glu Leu Ser Ser Arg Ile Leu Ser
1125 1130 1135
Tyr Met Ser Ser Ser Gly Ile Ser Ile Gly Leu Pro Gly Pro Pro Gly
1140 1145 1150
Pro Pro Gly Leu Pro Gly Thr Ser Tyr Glu Glu Leu Leu Ser Leu Leu
1155 1160 1165
Arg Gly Ser Glu Phe Arg Gly Ile Val Gly Pro Pro Gly Pro Pro Gly
1170 1175 1180
Pro Pro Gly Ile Pro Gly Asn Val Trp Ser Ser Ile Ser Val Glu Asp
1185 1190 1195 1200
Leu Ser Ser Tyr Leu His Thr Ala Gly Leu Ser Phe Ile Pro Gly Pro
1205 1210 1215
Pro Gly Pro Pro Gly Pro Pro Gly Pro Arg Gly Pro Pro Gly Val Ser
1220 1225 1230
Gly Ala Leu Ala Thr Tyr Ala Ala Glu Asn Ser Asp Ser Phe Arg Ser
1235 1240 1245
Glu Leu Ile Ser Tyr Leu Thr Ser Pro Asp Val Arg Ser Phe Ile Val
1250 1255 1260
Gly Pro Pro Gly Pro Pro Gly Pro Gln Gly Pro Pro Gly Asp Ser Arg
1265 1270 1275 1280
Leu Leu Ser Thr Asp Ala Ser His Ser Arg Gly Ser Ser Ser Ser Ser
1285 1290 1295
His Ser Ser Ser Val Arg Arg Gly Ser Ser Tyr Ser Ser Ser Met Ser
1300 1305 1310
Thr Gly Gly Gly Gly Ala Gly Ser Leu Gly Ala Gly Gly Ala Phe Gly
1315 1320 1325
Glu Ala Ala Gly Asp Arg Gly Pro Tyr Gly Thr Asp Ile Gly Pro Gly
1330 1335 1340
Gly Gly Tyr Gly Ala Ala Ala Glu Gly Gly Met Tyr Ala Gly Asn Gly
1345 1350 1355 1360
Gly Leu Leu Gly Ala Asp Phe Ala Gly Asp Leu Asp Tyr Asn Glu Leu
1365 1370 1375
Ala Val Arg Val Ser Glu Ser Met Gln Arg Gln Gly Leu Leu Gln Gly
1380 1385 1390
Met Ala Tyr Thr Val Gln Gly Pro Pro Gly Gln Pro Gly Pro Gln Gly
1395 1400 1405
Pro Pro Gly Ile Ser Lys Val Phe Ser Ala Tyr Ser Asn Val Thr Ala
1410 1415 1420
Asp Leu Met Asp Phe Phe Gln Thr Tyr Gly Ala Ile Gln Gly Pro Pro
1425 1430 1435 1440
Gly Gln Lys Gly Glu Met Gly Thr Pro Gly Pro Lys Gly Asp Arg Gly
1445 1450 1455
Pro Ala Gly Pro Pro Gly His Pro Gly Pro Pro Gly Pro Arg Gly His
1460 1465 1470
Lys Gly Glu Lys Gly Asp Lys Gly Asp Gln Val Tyr Ala Gly Arg Arg
1475 1480 1485
Arg Arg Arg Ser Ile Ala Val Lys Pro
1490 1495
<210> 22
<211> 148
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 22
gaattcgtcg attcggttgc agcatttaaa gcggttgaca actttaaaag aaggaaaaag 60
aaggttgaag aaaagggtgt agtaagtaag tataagtaca gaccggagaa gtacgccggt 120
cctgattcgt ttaatttgaa agaagaaa 148
<210> 23
<211> 491
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 23
gttattttcc accatattgc cgtcttttgg caatgtgagg gcccggaaac ctggccctgt 60
cttcttgacg agcattccta ggggtctttc ccctctcgcc aaaggaatgc aaggtctgtt 120
gaatgtcgtg aaggaagcag ttcctctgga agcttcttga agacaaacaa cgtctgtagc 180
gaccctttgc aggcagcgga accccccacc tggcgacagg tgcctctgcg gccaaaagcc 240
acgtgtataa gatacacctg caaaggcggc acaaccccag tgccacgttg tgagttggat 300
agttgtggaa agagtcaaat ggctcacctc aagcgtattc aacaaggggc tgaaggatgc 360
ccagaaggta ccccattgta tgggatctga tctggggcct cggtgcacat gctttacatg 420
tgtttagtcg aggttaaaaa gcgtctaggc cccccgaacc acggggacgt ggttttcctt 480
tgaaaaacac g 491
<210> 24
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 24
agggccaaga ggggcagcgg cgagggcagg ggcagcctgc tgacctgcgg cgacgtggag 60
gagaaccccg gcccc 75
<210> 25
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 25
ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60
ggacct 66
<210> 26
<211> 69
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 26
ggaagcggac agtgtactaa ttatgctctc ttgaaattgg ctggagatgt tgagagcaac 60
cctggacct 69
<210> 27
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 27
ggaagcggag tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60
tccaaccctg gacct 75
<210> 28
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 28
Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
1 5 10 15
Gly Asp Val Glu Glu Asn Pro Gly Pro
20 25
<210> 29
<211> 22
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 29
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 30
<211> 23
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 30
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 31
<211> 25
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 31
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 32
<211> 8565
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 32
atgttcagct tcgtggacct gagactgctg ctgctcctgg ctgctacagc cctgctgaca 60
cacggacaag aggaaggcca ggtcgaagga caggacgagg acatccctcc tatcacctgt 120
gtgcagaacg gcctgagata ccacgaccgg gatgtgtgga agcccgagcc ttgcagaatc 180
tgcgtgtgcg acaatggcaa ggtgctgtgc gacgacgtga tctgcgacga gacaaagaat 240
tgccctggcg ccgaagtgcc tgagggcgaa tgttgtcctg tgtgccctga tggcagcgag 300
agccccacag atcaagagac aacaggcgtg gaaggcccca agggcgatac aggacctaga 360
ggtcctagag gacctgccgg acctcctggc agagatggaa ttcctggaca gcctggactg 420
cccggaccac ctggacctcc agggcctcca ggtccaccag gactcggagg aaattttgcc 480
ccacagctga gctacggcta cgacgagaaa agcacaggcg gcatctctgt gcctggacct 540
atgggacctt ctggcccaag aggacttcct ggtcctcctg gtgctccagg acctcaggga 600
tttcaaggac caccaggcga acctggcgaa ccaggcgcta gtggtccaat gggaccaaga 660
ggccctcctg ggccaccagg caaaaatggc gacgatggcg aagccggaaa gcctggaagg 720
cctggcgaaa gaggcccgcc aggaccgcaa ggcgctagag ggttgcctgg aactgcagga 780
ctgcctggca tgaagggcca cagaggcttt tctggactgg atggcgctaa gggcgacgct 840
ggaccagcag gacctaaagg cgagcctgga tctcctggcg agaatggtgc acctggacag 900
atgggtccca gaggattgcc aggcgagaga ggtagacctg gcgctccggg accagccggt 960
gctagaggaa atgatggcgc aacaggtgct gctgggcctc ctggaccaac cggaccagct 1020
ggcccacctg gatttccagg cgctgttgga gcaaagggcg aagcaggccc acaaggacct 1080
aggggatctg aaggtcctca gggcgttaga ggcgagccag ggccacctgg gcctgccggt 1140
gcagctggac ctgctggaaa ccctggtgct gatggacagc caggtgccaa aggtgctaat 1200
ggcgcccctg gaattgccgg cgctccaggt tttcccggcg caagagggcc atctggacct 1260
caaggcccag gcggacctcc gggtcctaag ggaaatagcg gagagccagg cgctcctggg 1320
agtaaaggcg atactggcgc aaaaggcgaa cccggacctg tgggagttca aggacctcct 1380
ggaccagctg gcgaggaagg caaaagaggc gctaggggag aaccaggacc aacagggctc 1440
cctggtccac ctggcgagcg cggaggacct ggatctagag gattccctgg cgcagatggc 1500
gtggccggac caaaaggacc tgcaggcgaa aggggatcac caggtcctgc aggccctaag 1560
ggttctccag gcgaggctgg cagacccggc gaagctggac tcccaggtgc taagggactg 1620
acaggctcac caggatctcc cggaccagac ggaaaaacag gacctccagg accggcagga 1680
caggatggta gacccggtcc tcctggaccg cctggtgcaa gaggacaagc tggcgtgatg 1740
ggctttcctg gaccaaaagg tgcagccggc gaacctggaa aagcaggcga gaggggagtt 1800
cccggacctc caggtgctgt tggacctgcc ggaaaagatg gcgaagctgg tgcacaaggt 1860
cctccagggc cagccggacc agccggcgag agaggcgaac aaggaccagc cggatctcca 1920
ggatttcagg gactgccagg gcctgctggc ccgcctggcg aggcagggaa gccaggcgaa 1980
cagggtgttc ctggcgatct tggagcccct ggtcctagcg gagctagagg cgaaagagga 2040
tttcctggcg aaaggggcgt tcagggtcca ccgggaccag ctggaccaag gggtgcaaat 2100
ggtgccccag gcaatgacgg tgctaaaggc gacgcaggcg ccccaggtgc tcctggatct 2160
caaggcgcac ctggacttca gggaatgcct ggcgaacggg gagctgctgg acttcccggt 2220
ccaaaaggcg ataggggaga tgctggtcct aagggcgctg atggctctcc tggaaaggat 2280
ggcgtcagag gcctgacagg cccaattggc cctccgggac ctgctggcgc tccaggcgat 2340
aagggcgaat ctggacctag tggacccgct ggtcctacag gtgctagggg agccccaggc 2400
gaccggggag agcctggtcc accaggacct gctggatttg ctggacctcc tggcgctgat 2460
ggtcaacctg gtgctaaggg cgagccaggc gacgctggtg caaaaggcga cgctggtcca 2520
cctggaccgg ccggacctgc tgggccgcca ggacctattg gaaatgttgg tgcccctggc 2580
gccaaaggcg caagaggatc tgctggccca ccaggcgcta caggattccc aggtgccgct 2640
ggaagagttg gaccaccggg gccaagtgga aatgctggac caccgggacc gccaggacca 2700
gccggcaaag aaggtggaaa aggccctagg ggcgaaactg gccctgcagg caggccaggc 2760
gaagtgggcc ctccaggacc tccggggcct gccggcgaaa aaggatctcc aggcgcagat 2820
ggacccgcag gcgctcccgg aacaccaggt ccacagggaa ttgctggaca aaggggagtt 2880
gtcggcctgc caggacagag gggagagaga ggttttccag gactccctgg gccaagcgga 2940
gaacctggca aacagggacc atctggtgcc agcggagaga gagggccacc aggaccaatg 3000
ggtcctccag gattggcagg gcctcctggc gaatctggta gagaaggtgc tccaggcgcc 3060
gagggatctc ctggacgtga tggttctcct ggcgccaagg gcgatagagg cgaaacaggc 3120
ccagctggac ctccaggcgc acccggcgct ccaggcgcac caggacctgt tggccctgct 3180
ggaaaatctg gcgacagagg cgaaactgga cccgcaggac cagccggacc tgttggacct 3240
gtgggtgcta gaggacccgc tggaccacaa ggtcctagag gcgacaaggg cgaaacaggc 3300
gagcaaggcg acagaggcat caagggacac agaggattca gcggactgca gggaccacca 3360
gggccgcctg gaagtcccgg cgagcaggga ccaagcggag ctagtggtcc cgccggacct 3420
agaggaccac ctggttctgc tggtgcaccc ggaaaggacg gactgaatgg gctccccgga 3480
cctattgggc cacctggacc tagaggaaga acaggcgacg caggaccagt tggaccacct 3540
gggccacctg gaccgcctgg tcctcctgga cctccttctg ccggattcga cttcagcttc 3600
ctgcctcagc ctcctcaaga gaaggcccat gacggcggca gatattacag agccgacgac 3660
gccaacgtcg tgcgggacag agatctggaa gtggacacca cactgaagtc cctgtctcag 3720
cagatcgaga acatcagaag ccccgagggc agcagaaaga accctgccag aacctgtcgg 3780
gacctgaaga tgtgccacag cgattggaag tctggcgagt actggatcga ccccaaccag 3840
ggctgcaacc tggatgccat caaggtgttc tgcaacatgg aaaccggcga gacatgcgtg 3900
taccccacac agccatctgt ggctcagaag aactggtaca tcagcaagaa ccccaaggac 3960
aagcggcacg tttggttcgg cgagagcatg accgatggct tccagtttga gtatggcggc 4020
cagggctctg accctgccga tgttgctatc cagctgacct tcctgcggct gatgtctaca 4080
gaggccagcc agaacatcac ctaccactgc aagaacagcg tggcctacat ggatcagcag 4140
accggcaacc tgaagaaggc actgctgctt cagggcagca acgagatcga gatcagagcc 4200
gagggcaaca gccggttcac ctacagcgtg acagtggatg gctgcaccag ccatacaggc 4260
gcttggggca agaccgtgat cgagtacaag accaccaaga ccagcagact gcccatcatc 4320
gatgtggccc ctctggatgt tggggcaccc gatcaagagt tcggcttcga tgtgggccca 4380
gtgtgcttcc tgagggccaa gaggggcagc ggcgagggca ggggcagcct gctgacctgc 4440
ggcgacgtgg aggagaaccc cggccccctg agcttcgtgg acaccagaac actgctgctg 4500
ctggccgtga cactgtgtct ggccacttgt cagagcctgc aagaggaaac agtgcggaaa 4560
ggacctgccg gcgatagagg acctagaggc gaaagaggtc ctcctggacc tcctggtaga 4620
gatggcgagg atggacctac aggaccacct ggtccaccag gacctccagg gcctcctggc 4680
cttggaggaa attttgccgc tcagtacgat ggcaaaggcg tcggacttgg ccctggacct 4740
atgggactta tgggcccaag aggaccacca ggtgctgcag gcgctccagg accacaagga 4800
tttcaaggac cagctggcga gcctggcgaa cctggacaaa caggtcctgc tggtgctaga 4860
ggaccagccg ggccacctgg aaaagctggc gaagatgggc accctggaaa gcctggtaga 4920
cccggcgaaa ggggtgttgt tggacctcaa ggcgccagag gctttcctgg aacacctgga 4980
ctgcctggct tcaagggcat cagaggccac aatggcctgg acggactgaa aggacaacct 5040
ggtgctcctg gcgtgaaagg cgaaccaggc gcacctggcg aaaatggcac accaggacaa 5100
accggcgcaa gaggacttcc tggcgagaga ggaagagttg gagccccagg tccagcaggc 5160
gcacgaggat ctgatggatc tgtgggacct gttggccctg ccggacctat tggaagtgct 5220
ggccctcctg gatttcctgg cgcacccgga ccaaagggcg aaattggagc tgtgggaaac 5280
gccggacctg caggcccagc tggaccaagg ggagaagttg gattgcctgg actgagcgga 5340
ccagttgggc caccagggaa tcctggtgcc aatggactga caggcgctaa aggtgcagct 5400
ggccttccag gcgttgccgg tgcaccagga ctgccaggac caagaggtat ccctggtcct 5460
gttggagctg ctggcgctac gggtgccaga ggacttgttg gagaacctgg gccagccgga 5520
tctaagggcg agtctggaaa caagggcgag ccaggatctg ctggtccaca aggcccgcct 5580
ggaccatcag gcgaagaagg caaacgaggc cctaatggcg aagccggtag tgccgggcct 5640
cctggaccac caggccttag aggatctcct ggctctagag gattgccagg cgctgatggt 5700
agagcaggcg ttatgggtcc acctggatca agaggcgctt ctggccctgc tggcgttaga 5760
ggtccaaatg gcgacgctgg cagaccaggc gagcccggtc ttatggggcc tagagggttg 5820
cctggaagcc ctggcaatat cggcccagcc ggaaaagaag gccctgttgg actccctggc 5880
atcgacggta gacctggacc aatcggaccc gcaggcgcta ggggagagcc tggaaatatt 5940
ggcttccctg ggcctaaagg ccccacaggc gatcctggaa agaacggcga taagggccat 6000
gctggactcg ctggtgcaag gggagcacct ggacctgacg gaaacaatgg tgctcaaggg 6060
ccgcctgggc cacaaggtgt tcaaggtgga aaaggcgagc agggcccacc tgggcctcca 6120
ggcttccaag gacttcccgg accatctggg ccagcaggcg aagttggaaa gcctggcgaa 6180
agaggactgc acggcgagtt tggcttgccg ggtcctgccg gtccacgggg agagagaggc 6240
cctccaggcg aatctggcgc cgcaggacct actggcccta tcggaagcag aggacctagt 6300
ggacctccag gacctgatgg caacaaaggc gaacctggtg ttgtgggcgc tgtgggaaca 6360
gctggacctt ctggtccttc tggattgccc ggcgagcgcg gagcagctgg tattcctggt 6420
ggcaaaggcg aaaagggcga gcctggactc agaggcgaga tcggcaatcc cggacgagat 6480
ggcgctagag gcgccccagg tgcagttggt gccccgggac ctgctggcgc aacaggcgac 6540
agaggcgagg ctggtgccgc tggtcctgcc gggccagccg gtcctagagg aagtccaggc 6600
gagaggggcg aagtgggacc cgctggaccc aatggatttg ctgggcccgc tggcgctgct 6660
ggtcaacctg gcgccaaagg cgagcgggga gctaaaggtc ctaaaggcga gaatggcgtc 6720
gtgggcccta ctggaccagt gggagcagca ggccccgcag gtcctaacgg accacctgga 6780
ccagctgggt ctagaggcga cggcggaccg cctggaatga caggttttcc aggcgccgct 6840
ggaagaacag gtcctccagg accatctggc atctctggtc caccagggcc acctggtcct 6900
gctggaaaag aaggactgag aggccctagg ggcgatcagg gtccagttgg aagaaccggc 6960
gaagtcggag ctgtcggccc accaggtttt gccggcgaaa aaggccctag cggagaagct 7020
ggaactgcag gaccgccggg aactcccggt cctcaaggat tgcttggcgc ccctggaatt 7080
ctgggactgc ccggtagtcg cggagaacgt ggactcccag gtgttgctgg cgccgtcgga 7140
gaaccgggac cacttggaat tgctggacca cctggtgcaa gaggtccacc tggtgcagtt 7200
ggaagtcctg gcgttaacgg tgctccaggc gaagccggca gagatggaaa tcccggcaat 7260
gatggcccgc ctgggagaga tggacagcct ggacataagg gcgagcgagg ctacccaggc 7320
aatattggac ctgtcggcgc agccggtgct cccggacctc atggtccagt cggtccagcc 7380
gggaagcacg gaaatagggg agaaacagga ccctccggtc ctgttggccc agctggcgca 7440
gttggaccaa gaggcccatc cggacctcag ggaatccgcg gagataaggg cgaacctggc 7500
gagaagggac ctagaggact gcctgggctg aaaggccata acggactgca aggcctgcca 7560
ggcattgctg gccatcatgg cgatcaaggt gcacccggta gtgtgggtcc cgccggaccg 7620
aggggtcccg ctggtccatc tggacccgcc ggaaaagatg gcagaacagg acatcctggc 7680
acagtggggc ctgccggaat tagaggccca cagggacatc aaggccccgc tgggccgcca 7740
ggacctccgg gaccgccagg gccaccaggc gttagtggcg gaggatacga tttcggctac 7800
gacggcgact tctacagagc cgaccagcct agatctgccc ctagcctgag gcctaaggac 7860
tacgaagtgg acgccacact gaagtccctg aacaaccaga tcgagacact gctgacccct 7920
gagggcagca gaaagaaccc tgccagaacc tgcagggacc tgagactgtc tcaccccgaa 7980
tggtcctccg gctactactg gatcgacccc aatcagggct gcaccatgga cgccatcaag 8040
gtgtactgcg acttcagcac cggcgagaca tgcatcagag cccagcctga gaacatcccc 8100
gccaagaact ggtacagaag cagcaaggac aagaaacacg tgtggctggg cgagacaatc 8160
aacgccggca gccagttcga gtacaacgtg gaaggcgtga ccagcaaaga gatggccaca 8220
cagctggctt tcatgagact gctggccaat tacgccagcc agaacatcac ctaccactgc 8280
aagaacagca ttgcctacat ggacgaggaa accggcaacc tgaagaaagc cgtgatcctg 8340
cagggctcta acgacgtgga actggtggcc gagggcaaca gcagattcac ctacaccgtg 8400
ctggtggacg gctgcagcaa aaagaccaac gagtggggca agaccatcat cgagtataag 8460
accaacaagc ccagcagact gcccttcctg gatatcgccc cactggatat tggaggcgcc 8520
gaccaagagt tctttgtgga catcggcccc gtgtgcttca agtga 8565
<210> 33
<211> 8644
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 33
atgttcagct tcgtggacct gagactgctg ctgctcctgg ctgctacagc cctgctgaca 60
cacggacaag aggaaggcca ggtcgaagga caggacgagg acatccctcc tatcacctgt 120
gtgcagaacg gcctgagata ccacgaccgg gatgtgtgga agcccgagcc ttgcagaatc 180
tgcgtgtgcg acaatggcaa ggtgctgtgc gacgacgtga tctgcgacga gacaaagaat 240
tgccctggcg ccgaagtgcc tgagggcgaa tgttgtcctg tgtgccctga tggcagcgag 300
agccccacag atcaagagac aacaggcgtg gaaggcccca agggcgatac aggacctaga 360
ggtcctagag gacctgccgg acctcctggc agagatggaa ttcctggaca gcctggactg 420
cccggaccac ctggacctcc agggcctcca ggtccaccag gactcggagg aaattttgcc 480
ccacagctga gctacggcta cgacgagaaa agcacaggcg gcatctctgt gcctggacct 540
atgggacctt ctggcccaag aggacttcct ggtcctcctg gtgctccagg acctcaggga 600
tttcaaggac caccaggcga acctggcgaa ccaggcgcta gtggtccaat gggaccaaga 660
ggccctcctg ggccaccagg caaaaatggc gacgatggcg aagccggaaa gcctggaagg 720
cctggcgaaa gaggcccgcc aggaccgcaa ggcgctagag ggttgcctgg aactgcagga 780
ctgcctggca tgaagggcca cagaggcttt tctggactgg atggcgctaa gggcgacgct 840
ggaccagcag gacctaaagg cgagcctgga tctcctggcg agaatggtgc acctggacag 900
atgggtccca gaggattgcc aggcgagaga ggtagacctg gcgctccggg accagccggt 960
gctagaggaa atgatggcgc aacaggtgct gctgggcctc ctggaccaac cggaccagct 1020
ggcccacctg gatttccagg cgctgttgga gcaaagggcg aagcaggccc acaaggacct 1080
aggggatctg aaggtcctca gggcgttaga ggcgagccag ggccacctgg gcctgccggt 1140
gcagctggac ctgctggaaa ccctggtgct gatggacagc caggtgccaa aggtgctaat 1200
ggcgcccctg gaattgccgg cgctccaggt tttcccggcg caagagggcc atctggacct 1260
caaggcccag gcggacctcc gggtcctaag ggaaatagcg gagagccagg cgctcctggg 1320
agtaaaggcg atactggcgc aaaaggcgaa cccggacctg tgggagttca aggacctcct 1380
ggaccagctg gcgaggaagg caaaagaggc gctaggggag aaccaggacc aacagggctc 1440
cctggtccac ctggcgagcg cggaggacct ggatctagag gattccctgg cgcagatggc 1500
gtggccggac caaaaggacc tgcaggcgaa aggggatcac caggtcctgc aggccctaag 1560
ggttctccag gcgaggctgg cagacccggc gaagctggac tcccaggtgc taagggactg 1620
acaggctcac caggatctcc cggaccagac ggaaaaacag gacctccagg accggcagga 1680
caggatggta gacccggtcc tcctggaccg cctggtgcaa gaggacaagc tggcgtgatg 1740
ggctttcctg gaccaaaagg tgcagccggc gaacctggaa aagcaggcga gaggggagtt 1800
cccggacctc caggtgctgt tggacctgcc ggaaaagatg gcgaagctgg tgcacaaggt 1860
cctccagggc cagccggacc agccggcgag agaggcgaac aaggaccagc cggatctcca 1920
ggatttcagg gactgccagg gcctgctggc ccgcctggcg aggcagggaa gccaggcgaa 1980
cagggtgttc ctggcgatct tggagcccct ggtcctagcg gagctagagg cgaaagagga 2040
tttcctggcg aaaggggcgt tcagggtcca ccgggaccag ctggaccaag gggtgcaaat 2100
ggtgccccag gcaatgacgg tgctaaaggc gacgcaggcg ccccaggtgc tcctggatct 2160
caaggcgcac ctggacttca gggaatgcct ggcgaacggg gagctgctgg acttcccggt 2220
ccaaaaggcg ataggggaga tgctggtcct aagggcgctg atggctctcc tggaaaggat 2280
ggcgtcagag gcctgacagg cccaattggc cctccgggac ctgctggcgc tccaggcgat 2340
aagggcgaat ctggacctag tggacccgct ggtcctacag gtgctagggg agccccaggc 2400
gaccggggag agcctggtcc accaggacct gctggatttg ctggacctcc tggcgctgat 2460
ggtcaacctg gtgctaaggg cgagccaggc gacgctggtg caaaaggcga cgctggtcca 2520
cctggaccgg ccggacctgc tgggccgcca ggacctattg gaaatgttgg tgcccctggc 2580
gccaaaggcg caagaggatc tgctggccca ccaggcgcta caggattccc aggtgccgct 2640
ggaagagttg gaccaccggg gccaagtgga aatgctggac caccgggacc gccaggacca 2700
gccggcaaag aaggtggaaa aggccctagg ggcgaaactg gccctgcagg caggccaggc 2760
gaagtgggcc ctccaggacc tccggggcct gccggcgaaa aaggatctcc aggcgcagat 2820
ggacccgcag gcgctcccgg aacaccaggt ccacagggaa ttgctggaca aaggggagtt 2880
gtcggcctgc caggacagag gggagagaga ggttttccag gactccctgg gccaagcgga 2940
gaacctggca aacagggacc atctggtgcc agcggagaga gagggccacc aggaccaatg 3000
ggtcctccag gattggcagg gcctcctggc gaatctggta gagaaggtgc tccaggcgcc 3060
gagggatctc ctggacgtga tggttctcct ggcgccaagg gcgatagagg cgaaacaggc 3120
ccagctggac ctccaggcgc acccggcgct ccaggcgcac caggacctgt tggccctgct 3180
ggaaaatctg gcgacagagg cgaaactgga cccgcaggac cagccggacc tgttggacct 3240
gtgggtgcta gaggacccgc tggaccacaa ggtcctagag gcgacaaggg cgaaacaggc 3300
gagcaaggcg acagaggcat caagggacac agaggattca gcggactgca gggaccacca 3360
gggccgcctg gaagtcccgg cgagcaggga ccaagcggag ctagtggtcc cgccggacct 3420
agaggaccac ctggttctgc tggtgcaccc ggaaaggacg gactgaatgg gctccccgga 3480
cctattgggc cacctggacc tagaggaaga acaggcgacg caggaccagt tggaccacct 3540
gggccacctg gaccgcctgg tcctcctgga cctccttctg ccggattcga cttcagcttc 3600
ctgcctcagc ctcctcaaga gaaggcccat gacggcggca gatattacag agccgacgac 3660
gccaacgtcg tgcgggacag agatctggaa gtggacacca cactgaagtc cctgtctcag 3720
cagatcgaga acatcagaag ccccgagggc agcagaaaga accctgccag aacctgtcgg 3780
gacctgaaga tgtgccacag cgattggaag tctggcgagt actggatcga ccccaaccag 3840
ggctgcaacc tggatgccat caaggtgttc tgcaacatgg aaaccggcga gacatgcgtg 3900
taccccacac agccatctgt ggctcagaag aactggtaca tcagcaagaa ccccaaggac 3960
aagcggcacg tttggttcgg cgagagcatg accgatggct tccagtttga gtatggcggc 4020
cagggctctg accctgccga tgttgctatc cagctgacct tcctgcggct gatgtctaca 4080
gaggccagcc agaacatcac ctaccactgc aagaacagcg tggcctacat ggatcagcag 4140
accggcaacc tgaagaaggc actgctgctt cagggcagca acgagatcga gatcagagcc 4200
gagggcaaca gccggttcac ctacagcgtg acagtggatg gctgcaccag ccatacaggc 4260
gcttggggca agaccgtgat cgagtacaag accaccaaga ccagcagact gcccatcatc 4320
gatgtggccc ctctggatgt tggggcaccc gatcaagagt tcggcttcga tgtgggccca 4380
gtgtgcttcc tgtaagaatt cgtcgattcg gttgcagcat ttaaagcggt tgacaacttt 4440
aaaagaagga aaaagaaggt tgaagaaaag ggtgtagtaa gtaagtataa gtacagaccg 4500
gagaagtacg ccggtcctga ttcgtttaat ttgaaagaag aaaatgctga gcttcgtgga 4560
caccagaaca ctgctgctgc tggccgtgac actgtgtctg gccacttgtc agagcctgca 4620
agaggaaaca gtgcggaaag gacctgccgg cgatagagga cctagaggcg aaagaggtcc 4680
tcctggacct cctggtagag atggcgagga tggacctaca ggaccacctg gtccaccagg 4740
acctccaggg cctcctggcc ttggaggaaa ttttgccgct cagtacgatg gcaaaggcgt 4800
cggacttggc cctggaccta tgggacttat gggcccaaga ggaccaccag gtgctgcagg 4860
cgctccagga ccacaaggat ttcaaggacc agctggcgag cctggcgaac ctggacaaac 4920
aggtcctgct ggtgctagag gaccagccgg gccacctgga aaagctggcg aagatgggca 4980
ccctggaaag cctggtagac ccggcgaaag gggtgttgtt ggacctcaag gcgccagagg 5040
ctttcctgga acacctggac tgcctggctt caagggcatc agaggccaca atggcctgga 5100
cggactgaaa ggacaacctg gtgctcctgg cgtgaaaggc gaaccaggcg cacctggcga 5160
aaatggcaca ccaggacaaa ccggcgcaag aggacttcct ggcgagagag gaagagttgg 5220
agccccaggt ccagcaggcg cacgaggatc tgatggatct gtgggacctg ttggccctgc 5280
cggacctatt ggaagtgctg gccctcctgg atttcctggc gcacccggac caaagggcga 5340
aattggagct gtgggaaacg ccggacctgc aggcccagct ggaccaaggg gagaagttgg 5400
attgcctgga ctgagcggac cagttgggcc accagggaat cctggtgcca atggactgac 5460
aggcgctaaa ggtgcagctg gccttccagg cgttgccggt gcaccaggac tgccaggacc 5520
aagaggtatc cctggtcctg ttggagctgc tggcgctacg ggtgccagag gacttgttgg 5580
agaacctggg ccagccggat ctaagggcga gtctggaaac aagggcgagc caggatctgc 5640
tggtccacaa ggcccgcctg gaccatcagg cgaagaaggc aaacgaggcc ctaatggcga 5700
agccggtagt gccgggcctc ctggaccacc aggccttaga ggatctcctg gctctagagg 5760
attgccaggc gctgatggta gagcaggcgt tatgggtcca cctggatcaa gaggcgcttc 5820
tggccctgct ggcgttagag gtccaaatgg cgacgctggc agaccaggcg agcccggtct 5880
tatggggcct agagggttgc ctggaagccc tggcaatatc ggcccagccg gaaaagaagg 5940
ccctgttgga ctccctggca tcgacggtag acctggacca atcggacccg caggcgctag 6000
gggagagcct ggaaatattg gcttccctgg gcctaaaggc cccacaggcg atcctggaaa 6060
gaacggcgat aagggccatg ctggactcgc tggtgcaagg ggagcacctg gacctgacgg 6120
aaacaatggt gctcaagggc cgcctgggcc acaaggtgtt caaggtggaa aaggcgagca 6180
gggcccacct gggcctccag gcttccaagg acttcccgga ccatctgggc cagcaggcga 6240
agttggaaag cctggcgaaa gaggactgca cggcgagttt ggcttgccgg gtcctgccgg 6300
tccacgggga gagagaggcc ctccaggcga atctggcgcc gcaggaccta ctggccctat 6360
cggaagcaga ggacctagtg gacctccagg acctgatggc aacaaaggcg aacctggtgt 6420
tgtgggcgct gtgggaacag ctggaccttc tggtccttct ggattgcccg gcgagcgcgg 6480
agcagctggt attcctggtg gcaaaggcga aaagggcgag cctggactca gaggcgagat 6540
cggcaatccc ggacgagatg gcgctagagg cgccccaggt gcagttggtg ccccgggacc 6600
tgctggcgca acaggcgaca gaggcgaggc tggtgccgct ggtcctgccg ggccagccgg 6660
tcctagagga agtccaggcg agaggggcga agtgggaccc gctggaccca atggatttgc 6720
tgggcccgct ggcgctgctg gtcaacctgg cgccaaaggc gagcggggag ctaaaggtcc 6780
taaaggcgag aatggcgtcg tgggccctac tggaccagtg ggagcagcag gccccgcagg 6840
tcctaacgga ccacctggac cagctgggtc tagaggcgac ggcggaccgc ctggaatgac 6900
aggttttcca ggcgccgctg gaagaacagg tcctccagga ccatctggca tctctggtcc 6960
accagggcca cctggtcctg ctggaaaaga aggactgaga ggccctaggg gcgatcaggg 7020
tccagttgga agaaccggcg aagtcggagc tgtcggccca ccaggttttg ccggcgaaaa 7080
aggccctagc ggagaagctg gaactgcagg accgccggga actcccggtc ctcaaggatt 7140
gcttggcgcc cctggaattc tgggactgcc cggtagtcgc ggagaacgtg gactcccagg 7200
tgttgctggc gccgtcggag aaccgggacc acttggaatt gctggaccac ctggtgcaag 7260
aggtccacct ggtgcagttg gaagtcctgg cgttaacggt gctccaggcg aagccggcag 7320
agatggaaat cccggcaatg atggcccgcc tgggagagat ggacagcctg gacataaggg 7380
cgagcgaggc tacccaggca atattggacc tgtcggcgca gccggtgctc ccggacctca 7440
tggtccagtc ggtccagccg ggaagcacgg aaatagggga gaaacaggac cctccggtcc 7500
tgttggccca gctggcgcag ttggaccaag aggcccatcc ggacctcagg gaatccgcgg 7560
agataagggc gaacctggcg agaagggacc tagaggactg cctgggctga aaggccataa 7620
cggactgcaa ggcctgccag gcattgctgg ccatcatggc gatcaaggtg cacccggtag 7680
tgtgggtccc gccggaccga ggggtcccgc tggtccatct ggacccgccg gaaaagatgg 7740
cagaacagga catcctggca cagtggggcc tgccggaatt agaggcccac agggacatca 7800
aggccccgct gggccgccag gacctccggg accgccaggg ccaccaggcg ttagtggcgg 7860
aggatacgat ttcggctacg acggcgactt ctacagagcc gaccagccta gatctgcccc 7920
tagcctgagg cctaaggact acgaagtgga cgccacactg aagtccctga acaaccagat 7980
cgagacactg ctgacccctg agggcagcag aaagaaccct gccagaacct gcagggacct 8040
gagactgtct caccccgaat ggtcctccgg ctactactgg atcgacccca atcagggctg 8100
caccatggac gccatcaagg tgtactgcga cttcagcacc ggcgagacat gcatcagagc 8160
ccagcctgag aacatccccg ccaagaactg gtacagaagc agcaaggaca agaaacacgt 8220
gtggctgggc gagacaatca acgccggcag ccagttcgag tacaacgtgg aaggcgtgac 8280
cagcaaagag atggccacac agctggcttt catgagactg ctggccaatt acgccagcca 8340
gaacatcacc taccactgca agaacagcat tgcctacatg gacgaggaaa ccggcaacct 8400
gaagaaagcc gtgatcctgc agggctctaa cgacgtggaa ctggtggccg agggcaacag 8460
cagattcacc tacaccgtgc tggtggacgg ctgcagcaaa aagaccaacg agtggggcaa 8520
gaccatcatc gagtataaga ccaacaagcc cagcagactg cccttcctgg atatcgcccc 8580
actggatatt ggaggcgccg accaagagtt ctttgtggac atcggccccg tgtgcttcaa 8640
gtga 8644
<210> 34
<211> 8987
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 34
atgttcagct tcgtggacct gagactgctg ctgctcctgg ctgctacagc cctgctgaca 60
cacggacaag aggaaggcca ggtcgaagga caggacgagg acatccctcc tatcacctgt 120
gtgcagaacg gcctgagata ccacgaccgg gatgtgtgga agcccgagcc ttgcagaatc 180
tgcgtgtgcg acaatggcaa ggtgctgtgc gacgacgtga tctgcgacga gacaaagaat 240
tgccctggcg ccgaagtgcc tgagggcgaa tgttgtcctg tgtgccctga tggcagcgag 300
agccccacag atcaagagac aacaggcgtg gaaggcccca agggcgatac aggacctaga 360
ggtcctagag gacctgccgg acctcctggc agagatggaa ttcctggaca gcctggactg 420
cccggaccac ctggacctcc agggcctcca ggtccaccag gactcggagg aaattttgcc 480
ccacagctga gctacggcta cgacgagaaa agcacaggcg gcatctctgt gcctggacct 540
atgggacctt ctggcccaag aggacttcct ggtcctcctg gtgctccagg acctcaggga 600
tttcaaggac caccaggcga acctggcgaa ccaggcgcta gtggtccaat gggaccaaga 660
ggccctcctg ggccaccagg caaaaatggc gacgatggcg aagccggaaa gcctggaagg 720
cctggcgaaa gaggcccgcc aggaccgcaa ggcgctagag ggttgcctgg aactgcagga 780
ctgcctggca tgaagggcca cagaggcttt tctggactgg atggcgctaa gggcgacgct 840
ggaccagcag gacctaaagg cgagcctgga tctcctggcg agaatggtgc acctggacag 900
atgggtccca gaggattgcc aggcgagaga ggtagacctg gcgctccggg accagccggt 960
gctagaggaa atgatggcgc aacaggtgct gctgggcctc ctggaccaac cggaccagct 1020
ggcccacctg gatttccagg cgctgttgga gcaaagggcg aagcaggccc acaaggacct 1080
aggggatctg aaggtcctca gggcgttaga ggcgagccag ggccacctgg gcctgccggt 1140
gcagctggac ctgctggaaa ccctggtgct gatggacagc caggtgccaa aggtgctaat 1200
ggcgcccctg gaattgccgg cgctccaggt tttcccggcg caagagggcc atctggacct 1260
caaggcccag gcggacctcc gggtcctaag ggaaatagcg gagagccagg cgctcctggg 1320
agtaaaggcg atactggcgc aaaaggcgaa cccggacctg tgggagttca aggacctcct 1380
ggaccagctg gcgaggaagg caaaagaggc gctaggggag aaccaggacc aacagggctc 1440
cctggtccac ctggcgagcg cggaggacct ggatctagag gattccctgg cgcagatggc 1500
gtggccggac caaaaggacc tgcaggcgaa aggggatcac caggtcctgc aggccctaag 1560
ggttctccag gcgaggctgg cagacccggc gaagctggac tcccaggtgc taagggactg 1620
acaggctcac caggatctcc cggaccagac ggaaaaacag gacctccagg accggcagga 1680
caggatggta gacccggtcc tcctggaccg cctggtgcaa gaggacaagc tggcgtgatg 1740
ggctttcctg gaccaaaagg tgcagccggc gaacctggaa aagcaggcga gaggggagtt 1800
cccggacctc caggtgctgt tggacctgcc ggaaaagatg gcgaagctgg tgcacaaggt 1860
cctccagggc cagccggacc agccggcgag agaggcgaac aaggaccagc cggatctcca 1920
ggatttcagg gactgccagg gcctgctggc ccgcctggcg aggcagggaa gccaggcgaa 1980
cagggtgttc ctggcgatct tggagcccct ggtcctagcg gagctagagg cgaaagagga 2040
tttcctggcg aaaggggcgt tcagggtcca ccgggaccag ctggaccaag gggtgcaaat 2100
ggtgccccag gcaatgacgg tgctaaaggc gacgcaggcg ccccaggtgc tcctggatct 2160
caaggcgcac ctggacttca gggaatgcct ggcgaacggg gagctgctgg acttcccggt 2220
ccaaaaggcg ataggggaga tgctggtcct aagggcgctg atggctctcc tggaaaggat 2280
ggcgtcagag gcctgacagg cccaattggc cctccgggac ctgctggcgc tccaggcgat 2340
aagggcgaat ctggacctag tggacccgct ggtcctacag gtgctagggg agccccaggc 2400
gaccggggag agcctggtcc accaggacct gctggatttg ctggacctcc tggcgctgat 2460
ggtcaacctg gtgctaaggg cgagccaggc gacgctggtg caaaaggcga cgctggtcca 2520
cctggaccgg ccggacctgc tgggccgcca ggacctattg gaaatgttgg tgcccctggc 2580
gccaaaggcg caagaggatc tgctggccca ccaggcgcta caggattccc aggtgccgct 2640
ggaagagttg gaccaccggg gccaagtgga aatgctggac caccgggacc gccaggacca 2700
gccggcaaag aaggtggaaa aggccctagg ggcgaaactg gccctgcagg caggccaggc 2760
gaagtgggcc ctccaggacc tccggggcct gccggcgaaa aaggatctcc aggcgcagat 2820
ggacccgcag gcgctcccgg aacaccaggt ccacagggaa ttgctggaca aaggggagtt 2880
gtcggcctgc caggacagag gggagagaga ggttttccag gactccctgg gccaagcgga 2940
gaacctggca aacagggacc atctggtgcc agcggagaga gagggccacc aggaccaatg 3000
ggtcctccag gattggcagg gcctcctggc gaatctggta gagaaggtgc tccaggcgcc 3060
gagggatctc ctggacgtga tggttctcct ggcgccaagg gcgatagagg cgaaacaggc 3120
ccagctggac ctccaggcgc acccggcgct ccaggcgcac caggacctgt tggccctgct 3180
ggaaaatctg gcgacagagg cgaaactgga cccgcaggac cagccggacc tgttggacct 3240
gtgggtgcta gaggacccgc tggaccacaa ggtcctagag gcgacaaggg cgaaacaggc 3300
gagcaaggcg acagaggcat caagggacac agaggattca gcggactgca gggaccacca 3360
gggccgcctg gaagtcccgg cgagcaggga ccaagcggag ctagtggtcc cgccggacct 3420
agaggaccac ctggttctgc tggtgcaccc ggaaaggacg gactgaatgg gctccccgga 3480
cctattgggc cacctggacc tagaggaaga acaggcgacg caggaccagt tggaccacct 3540
gggccacctg gaccgcctgg tcctcctgga cctccttctg ccggattcga cttcagcttc 3600
ctgcctcagc ctcctcaaga gaaggcccat gacggcggca gatattacag agccgacgac 3660
gccaacgtcg tgcgggacag agatctggaa gtggacacca cactgaagtc cctgtctcag 3720
cagatcgaga acatcagaag ccccgagggc agcagaaaga accctgccag aacctgtcgg 3780
gacctgaaga tgtgccacag cgattggaag tctggcgagt actggatcga ccccaaccag 3840
ggctgcaacc tggatgccat caaggtgttc tgcaacatgg aaaccggcga gacatgcgtg 3900
taccccacac agccatctgt ggctcagaag aactggtaca tcagcaagaa ccccaaggac 3960
aagcggcacg tttggttcgg cgagagcatg accgatggct tccagtttga gtatggcggc 4020
cagggctctg accctgccga tgttgctatc cagctgacct tcctgcggct gatgtctaca 4080
gaggccagcc agaacatcac ctaccactgc aagaacagcg tggcctacat ggatcagcag 4140
accggcaacc tgaagaaggc actgctgctt cagggcagca acgagatcga gatcagagcc 4200
gagggcaaca gccggttcac ctacagcgtg acagtggatg gctgcaccag ccatacaggc 4260
gcttggggca agaccgtgat cgagtacaag accaccaaga ccagcagact gcccatcatc 4320
gatgtggccc ctctggatgt tggggcaccc gatcaagagt tcggcttcga tgtgggccca 4380
gtgtgcttcc tgtaagttat tttccaccat attgccgtct tttggcaatg tgagggcccg 4440
gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc tcgccaaagg 4500
aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt cttgaagaca 4560
aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggcg acaggtgcct 4620
ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac cccagtgcca 4680
cgttgtgagt tggatagttg tggaaagagt caaatggctc acctcaagcg tattcaacaa 4740
ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg ggcctcggtg 4800
cacatgcttt acatgtgttt agtcgaggtt aaaaagcgtc taggcccccc gaaccacggg 4860
gacgtggttt tcctttgaaa aacacgatgc tgagcttcgt ggacaccaga acactgctgc 4920
tgctggccgt gacactgtgt ctggccactt gtcagagcct gcaagaggaa acagtgcgga 4980
aaggacctgc cggcgataga ggacctagag gcgaaagagg tcctcctgga cctcctggta 5040
gagatggcga ggatggacct acaggaccac ctggtccacc aggacctcca gggcctcctg 5100
gccttggagg aaattttgcc gctcagtacg atggcaaagg cgtcggactt ggccctggac 5160
ctatgggact tatgggccca agaggaccac caggtgctgc aggcgctcca ggaccacaag 5220
gatttcaagg accagctggc gagcctggcg aacctggaca aacaggtcct gctggtgcta 5280
gaggaccagc cgggccacct ggaaaagctg gcgaagatgg gcaccctgga aagcctggta 5340
gacccggcga aaggggtgtt gttggacctc aaggcgccag aggctttcct ggaacacctg 5400
gactgcctgg cttcaagggc atcagaggcc acaatggcct ggacggactg aaaggacaac 5460
ctggtgctcc tggcgtgaaa ggcgaaccag gcgcacctgg cgaaaatggc acaccaggac 5520
aaaccggcgc aagaggactt cctggcgaga gaggaagagt tggagcccca ggtccagcag 5580
gcgcacgagg atctgatgga tctgtgggac ctgttggccc tgccggacct attggaagtg 5640
ctggccctcc tggatttcct ggcgcacccg gaccaaaggg cgaaattgga gctgtgggaa 5700
acgccggacc tgcaggccca gctggaccaa ggggagaagt tggattgcct ggactgagcg 5760
gaccagttgg gccaccaggg aatcctggtg ccaatggact gacaggcgct aaaggtgcag 5820
ctggccttcc aggcgttgcc ggtgcaccag gactgccagg accaagaggt atccctggtc 5880
ctgttggagc tgctggcgct acgggtgcca gaggacttgt tggagaacct gggccagccg 5940
gatctaaggg cgagtctgga aacaagggcg agccaggatc tgctggtcca caaggcccgc 6000
ctggaccatc aggcgaagaa ggcaaacgag gccctaatgg cgaagccggt agtgccgggc 6060
ctcctggacc accaggcctt agaggatctc ctggctctag aggattgcca ggcgctgatg 6120
gtagagcagg cgttatgggt ccacctggat caagaggcgc ttctggccct gctggcgtta 6180
gaggtccaaa tggcgacgct ggcagaccag gcgagcccgg tcttatgggg cctagagggt 6240
tgcctggaag ccctggcaat atcggcccag ccggaaaaga aggccctgtt ggactccctg 6300
gcatcgacgg tagacctgga ccaatcggac ccgcaggcgc taggggagag cctggaaata 6360
ttggcttccc tgggcctaaa ggccccacag gcgatcctgg aaagaacggc gataagggcc 6420
atgctggact cgctggtgca aggggagcac ctggacctga cggaaacaat ggtgctcaag 6480
ggccgcctgg gccacaaggt gttcaaggtg gaaaaggcga gcagggccca cctgggcctc 6540
caggcttcca aggacttccc ggaccatctg ggccagcagg cgaagttgga aagcctggcg 6600
aaagaggact gcacggcgag tttggcttgc cgggtcctgc cggtccacgg ggagagagag 6660
gccctccagg cgaatctggc gccgcaggac ctactggccc tatcggaagc agaggaccta 6720
gtggacctcc aggacctgat ggcaacaaag gcgaacctgg tgttgtgggc gctgtgggaa 6780
cagctggacc ttctggtcct tctggattgc ccggcgagcg cggagcagct ggtattcctg 6840
gtggcaaagg cgaaaagggc gagcctggac tcagaggcga gatcggcaat cccggacgag 6900
atggcgctag aggcgcccca ggtgcagttg gtgccccggg acctgctggc gcaacaggcg 6960
acagaggcga ggctggtgcc gctggtcctg ccgggccagc cggtcctaga ggaagtccag 7020
gcgagagggg cgaagtggga cccgctggac ccaatggatt tgctgggccc gctggcgctg 7080
ctggtcaacc tggcgccaaa ggcgagcggg gagctaaagg tcctaaaggc gagaatggcg 7140
tcgtgggccc tactggacca gtgggagcag caggccccgc aggtcctaac ggaccacctg 7200
gaccagctgg gtctagaggc gacggcggac cgcctggaat gacaggtttt ccaggcgccg 7260
ctggaagaac aggtcctcca ggaccatctg gcatctctgg tccaccaggg ccacctggtc 7320
ctgctggaaa agaaggactg agaggcccta ggggcgatca gggtccagtt ggaagaaccg 7380
gcgaagtcgg agctgtcggc ccaccaggtt ttgccggcga aaaaggccct agcggagaag 7440
ctggaactgc aggaccgccg ggaactcccg gtcctcaagg attgcttggc gcccctggaa 7500
ttctgggact gcccggtagt cgcggagaac gtggactccc aggtgttgct ggcgccgtcg 7560
gagaaccggg accacttgga attgctggac cacctggtgc aagaggtcca cctggtgcag 7620
ttggaagtcc tggcgttaac ggtgctccag gcgaagccgg cagagatgga aatcccggca 7680
atgatggccc gcctgggaga gatggacagc ctggacataa gggcgagcga ggctacccag 7740
gcaatattgg acctgtcggc gcagccggtg ctcccggacc tcatggtcca gtcggtccag 7800
ccgggaagca cggaaatagg ggagaaacag gaccctccgg tcctgttggc ccagctggcg 7860
cagttggacc aagaggccca tccggacctc agggaatccg cggagataag ggcgaacctg 7920
gcgagaaggg acctagagga ctgcctgggc tgaaaggcca taacggactg caaggcctgc 7980
caggcattgc tggccatcat ggcgatcaag gtgcacccgg tagtgtgggt cccgccggac 8040
cgaggggtcc cgctggtcca tctggacccg ccggaaaaga tggcagaaca ggacatcctg 8100
gcacagtggg gcctgccgga attagaggcc cacagggaca tcaaggcccc gctgggccgc 8160
caggacctcc gggaccgcca gggccaccag gcgttagtgg cggaggatac gatttcggct 8220
acgacggcga cttctacaga gccgaccagc ctagatctgc ccctagcctg aggcctaagg 8280
actacgaagt ggacgccaca ctgaagtccc tgaacaacca gatcgagaca ctgctgaccc 8340
ctgagggcag cagaaagaac cctgccagaa cctgcaggga cctgagactg tctcaccccg 8400
aatggtcctc cggctactac tggatcgacc ccaatcaggg ctgcaccatg gacgccatca 8460
aggtgtactg cgacttcagc accggcgaga catgcatcag agcccagcct gagaacatcc 8520
ccgccaagaa ctggtacaga agcagcaagg acaagaaaca cgtgtggctg ggcgagacaa 8580
tcaacgccgg cagccagttc gagtacaacg tggaaggcgt gaccagcaaa gagatggcca 8640
cacagctggc tttcatgaga ctgctggcca attacgccag ccagaacatc acctaccact 8700
gcaagaacag cattgcctac atggacgagg aaaccggcaa cctgaagaaa gccgtgatcc 8760
tgcagggctc taacgacgtg gaactggtgg ccgagggcaa cagcagattc acctacaccg 8820
tgctggtgga cggctgcagc aaaaagacca acgagtgggg caagaccatc atcgagtata 8880
agaccaacaa gcccagcaga ctgcccttcc tggatatcgc cccactggat attggaggcg 8940
ccgaccaaga gttctttgtg gacatcggcc ccgtgtgctt caagtga 8987
<210> 35
<211> 7434
<212> DNA
<213> 智人(Homo sapiens)
<400> 35
atgcttaggg gtccggggcc cgggctgctg ctgctggccg tccagtgcct ggggacagcg 60
gtgccctcca cgggagcctc gaagagcaag aggcaggctc agcaaatggt tcagccccag 120
tccccggtgg ctgtcagtca aagcaagccc ggttgttatg acaatggaaa acactatcag 180
ataaatcaac agtgggagcg gacctaccta ggcaatgcgt tggtttgtac ttgttatgga 240
ggaagccgag gttttaactg cgagagtaaa cctgaagctg aagagacttg ctttgacaag 300
tacactggga acacttaccg agtgggtgac acttatgagc gtcctaaaga ctccatgatc 360
tgggactgta cctgcatcgg ggctgggcga gggagaataa gctgtaccat cgcaaaccgc 420
tgccatgaag ggggtcagtc ctacaagatt ggtgacacct ggaggagacc acatgagact 480
ggtggttaca tgttagagtg tgtgtgtctt ggtaatggaa aaggagaatg gacctgcaag 540
cccatagctg agaagtgttt tgatcatgct gctgggactt cctatgtggt cggagaaacg 600
tgggagaagc cctaccaagg ctggatgatg gtagattgta cttgcctggg agaaggcagc 660
ggacgcatca cttgcacttc tagaaataga tgcaacgatc aggacacaag gacatcctat 720
agaattggag acacctggag caagaaggat aatcgaggaa acctgctcca gtgcatctgc 780
acaggcaacg gccgaggaga gtggaagtgt gagaggcaca cctctgtgca gaccacatcg 840
agcggatctg gccccttcac cgatgttcgt gcagctgttt accaaccgca gcctcacccc 900
cagcctcctc cctatggcca ctgtgtcaca gacagtggtg tggtctactc tgtggggatg 960
cagtggctga agacacaagg aaataagcaa atgctttgca cgtgcctggg caacggagtc 1020
agctgccaag agacagctgt aacccagact tacggtggca actcaaatgg agagccatgt 1080
gtcttaccat tcacctacaa tggcaggacg ttctactcct gcaccacaga agggcgacag 1140
gacggacatc tttggtgcag cacaacttcg aattatgagc aggaccagaa atactctttc 1200
tgcacagacc acactgtttt ggttcagact cgaggaggaa attccaatgg tgccttgtgc 1260
cacttcccct tcctatacaa caaccacaat tacactgatt gcacttctga gggcagaaga 1320
gacaacatga agtggtgtgg gaccacacag aactatgatg ccgaccagaa gtttgggttc 1380
tgccccatgg ctgcccacga ggaaatctgc acaaccaatg aaggggtcat gtaccgcatt 1440
ggagatcagt gggataagca gcatgacatg ggtcacatga tgaggtgcac gtgtgttggg 1500
aatggtcgtg gggaatggac atgcattgcc tactcgcagc ttcgagatca gtgcattgtt 1560
gatgacatca cttacaatgt gaacgacaca ttccacaagc gtcatgaaga ggggcacatg 1620
ctgaactgta catgcttcgg tcagggtcgg ggcaggtgga agtgtgatcc cgtcgaccaa 1680
tgccaggatt cagagactgg gacgttttat caaattggag attcatggga gaagtatgtg 1740
catggtgtca gataccagtg ctactgctat ggccgtggca ttggggagtg gcattgccaa 1800
cctttacaga cctatccaag ctcaagtggt cctgtcgaag tatttatcac tgagactccg 1860
agtcagccca actcccaccc catccagtgg aatgcaccac agccatctca catttccaag 1920
tacattctca ggtggagacc taaaaattct gtaggccgtt ggaaggaagc taccatacca 1980
ggccacttaa actcctacac catcaaaggc ctgaagcctg gtgtggtata cgagggccag 2040
ctcatcagca tccagcagta cggccaccaa gaagtgactc gctttgactt caccaccacc 2100
agcaccagca cacctgtgac cagcaacacc gtgacaggag agacgactcc cttttctcct 2160
cttgtggcca cttctgaatc tgtgaccgaa atcacagcca gtagctttgt ggtctcctgg 2220
gtctcagctt ccgacaccgt gtcgggattc cgggtggaat atgagctgag tgaggaggga 2280
gatgagccac agtacctgga tcttccaagc acagccactt ctgtgaacat ccctgacctg 2340
cttcctggcc gaaaatacat tgtaaatgtc tatcagatat ctgaggatgg ggagcagagt 2400
ttgatcctgt ctacttcaca aacaacagcg cctgatgccc ctcctgaccc gactgtggac 2460
caagttgatg acacctcaat tgttgttcgc tggagcagac cccaggctcc catcacaggg 2520
tacagaatag tctattcgcc atcagtagaa ggtagcagca cagaactcaa ccttcctgaa 2580
actgcaaact ccgtcaccct cagtgacttg caacctggtg ttcagtataa catcactatc 2640
tatgctgtgg aagaaaatca agaaagtaca cctgttgtca ttcaacaaga aaccactggc 2700
accccacgct cagatacagt gccctctccc agggacctgc agtttgtgga agtgacagac 2760
gtgaaggtca ccatcatgtg gacaccgcct gagagtgcag tgaccggcta ccgtgtggat 2820
gtgatccccg tcaacctgcc tggcgagcac gggcagaggc tgcccatcag caggaacacc 2880
tttgcagaag tcaccgggct gtcccctggg gtcacctatt acttcaaagt ctttgcagtg 2940
agccatggga gggagagcaa gcctctgact gctcaacaga caaccaaact ggatgctccc 3000
actaacctcc agtttgtcaa tgaaactgat tctactgtcc tggtgagatg gactccacct 3060
cgggcccaga taacaggata ccgactgacc gtgggcctta cccgaagagg acagcccagg 3120
cagtacaatg tgggtccctc tgtctccaag tacccactga ggaatctgca gcctgcatct 3180
gagtacaccg tatccctcgt ggccataaag ggcaaccaag agagccccaa agccactgga 3240
gtctttacca cactgcagcc tgggagctct attccacctt acaacaccga ggtgactgag 3300
accaccattg tgatcacatg gacgcctgct ccaagaattg gttttaagct gggtgtacga 3360
ccaagccagg gaggagaggc accacgagaa gtgacttcag actcaggaag catcgttgtg 3420
tccggcttga ctccaggagt agaatacgtc tacaccatcc aagtcctgag agatggacag 3480
gaaagagatg cgccaattgt aaacaaagtg gtgacaccat tgtctccacc aacaaacttg 3540
catctggagg caaaccctga cactggagtg ctcacagtct cctgggagag gagcaccacc 3600
ccagacatta ctggttatag aattaccaca acccctacaa acggccagca gggaaattct 3660
ttggaagaag tggtccatgc tgatcagagc tcctgcactt ttgataacct gagtcccggc 3720
ctggagtaca atgtcagtgt ttacactgtc aaggatgaca aggaaagtgt ccctatctct 3780
gataccatca tcccagaggt gccccaactc actgacctaa gctttgttga tataaccgat 3840
tcaagcatcg gcctgaggtg gaccccgcta aactcttcca ccattattgg gtaccgcatc 3900
acagtagttg cggcaggaga aggtatccct atttttgaag attttgtgga ctcctcagta 3960
ggatactaca cagtcacagg gctggagccg ggcattgact atgatatcag cgttatcact 4020
ctcattaatg gcggcgagag tgcccctact acactgacac aacaaacggc tgttcctcct 4080
cccactgacc tgcgattcac caacattggt ccagacacca tgcgtgtcac ctgggctcca 4140
cccccatcca ttgatttaac caacttcctg gtgcgttact cacctgtgaa aaatgaggaa 4200
gatgttgcag agttgtcaat ttctccttca gacaatgcag tggtcttaac aaatctcctg 4260
cctggtacag aatatgtagt gagtgtctcc agtgtctacg aacaacatga gagcacacct 4320
cttagaggaa gacagaaaac aggtcttgat tccccaactg gcattgactt ttctgatatt 4380
actgccaact cttttactgt gcactggatt gctcctcgag ccaccatcac tggctacagg 4440
atccgccatc atcccgagca cttcagtggg agacctcgag aagatcgggt gccccactct 4500
cggaattcca tcaccctcac caacctcact ccaggcacag agtatgtggt cagcatcgtt 4560
gctcttaatg gcagagagga aagtccctta ttgattggcc aacaatcaac agtttctgat 4620
gttccgaggg acctggaagt tgttgctgcg acccccacca gcctactgat cagctgggat 4680
gctcctgctg tcacagtgag atattacagg atcacttacg gagagacagg aggaaatagc 4740
cctgtccagg agttcactgt gcctgggagc aagtctacag ctaccatcag cggccttaaa 4800
cctggagttg attataccat cactgtgtat gctgtcactg gccgtggaga cagccccgca 4860
agcagcaagc caatttccat taattaccga acagaaattg acaaaccatc ccagatgcaa 4920
gtgaccgatg ttcaggacaa cagcattagt gtcaagtggc tgccttcaag ttcccctgtt 4980
actggttaca gagtaaccac cactcccaaa aatggaccag gaccaacaaa aactaaaact 5040
gcaggtccag atcaaacaga aatgactatt gaaggcttgc agcccacagt ggagtatgtg 5100
gttagtgtct atgctcagaa tccaagcgga gagagtcagc ctctggttca gactgcagta 5160
accaacattg atcgccctaa aggactggca ttcactgatg tggatgtcga ttccatcaaa 5220
attgcttggg aaagcccaca ggggcaagtt tccaggtaca gggtgaccta ctcgagccct 5280
gaggatggaa tccatgagct attccctgca cctgatggtg aagaagacac tgcagagctg 5340
caaggcctca gaccgggttc tgagtacaca gtcagtgtgg ttgccttgca cgatgatatg 5400
gagagccagc ccctgattgg aacccagtcc acagctattc ctgcaccaac tgacctgaag 5460
ttcactcagg tcacacccac aagcctgagc gcccagtgga caccacccaa tgttcagctc 5520
actggatatc gagtgcgggt gacccccaag gagaagaccg gaccaatgaa agaaatcaac 5580
cttgctcctg acagctcatc cgtggttgta tcaggactta tggtggccac caaatatgaa 5640
gtgagtgtct atgctcttaa ggacactttg acaagcagac cagctcaggg agttgtcacc 5700
actctggaga atgtcagccc accaagaagg gctcgtgtga cagatgctac tgagaccacc 5760
atcaccatta gctggagaac caagactgag acgatcactg gcttccaagt tgatgccgtt 5820
ccagccaatg gccagactcc aatccagaga accatcaagc cagatgtcag aagctacacc 5880
atcacaggtt tacaaccagg cactgactac aagatctacc tgtacacctt gaatgacaat 5940
gctcggagct cccctgtggt catcgacgcc tccactgcca ttgatgcacc atccaacctg 6000
cgtttcctgg ccaccacacc caattccttg ctggtatcat ggcagccgcc acgtgccagg 6060
attaccggct acatcatcaa gtatgagaag cctgggtctc ctcccagaga agtggtccct 6120
cggccccgcc ctggtgtcac agaggctact attactggcc tggaaccggg aaccgaatat 6180
acaatttatg tcattgccct gaagaataat cagaagagcg agcccctgat tggaaggaaa 6240
aagacagacg agcttcccca actggtaacc cttccacacc ccaatcttca tggaccagag 6300
atcttggatg ttccttccac agttcaaaag acccctttcg tcacccaccc tgggtatgac 6360
actggaaatg gtattcagct tcctggcact tctggtcagc aacccagtgt tgggcaacaa 6420
atgatctttg aggaacatgg ttttaggcgg accacaccgc ccacaacggc cacccccata 6480
aggcataggc caagaccata cccgccgaat gtaggtgagg aaatccaaat tggtcacatc 6540
cccagggaag atgtagacta tcacctgtac ccacacggtc cgggactcaa tccaaatgcc 6600
tctacaggac aagaagctct ctctcagaca accatctcat gggccccatt ccaggacact 6660
tctgagtaca tcatttcatg tcatcctgtt ggcactgatg aagaaccctt acagttcagg 6720
gttcctggaa cttctaccag tgccactctg acaggcctca ccagaggtgc cacctacaac 6780
atcatagtgg aggcactgaa agaccagcag aggcataagg ttcgggaaga ggttgttacc 6840
gtgggcaact ctgtcaacga aggcttgaac caacctacgg atgactcgtg ctttgacccc 6900
tacacagttt cccattatgc cgttggagat gagtgggaac gaatgtctga atcaggcttt 6960
aaactgttgt gccagtgctt aggctttgga agtggtcatt tcagatgtga ttcatctaga 7020
tggtgccatg acaatggtgt gaactacaag attggagaga agtgggaccg tcagggagaa 7080
aatggccaga tgatgagctg cacatgtctt gggaacggaa aaggagaatt caagtgtgac 7140
cctcatgagg caacgtgtta tgatgatggg aagacatacc acgtaggaga acagtggcag 7200
aaggaatatc tcggtgccat ttgctcctgc acatgctttg gaggccagcg gggctggcgc 7260
tgtgacaact gccgcagacc tgggggtgaa cccagtcccg aaggcactac tggccagtcc 7320
tacaaccagt attctcagag ataccatcag agaacaaaca ctaatgttaa ttgcccaatt 7380
gagtgcttca tgcctttaga tgtacaggct gacagagaag attcccgaga gtaa 7434
<210> 36
<211> 7434
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 36
atgctgagag gacctggacc aggactgctg ctgctggctg ttcagtgtct gggaacagcc 60
gtgcctagca caggcgccag caagtctaaa agacaggccc agcagatggt gcagcctcag 120
tctcctgtgg ccgtgtctca gtctaagccc ggctgctacg acaacggcaa gcactaccag 180
atcaaccagc agtgggagag aacctacctg ggcaacgccc tcgtgtgtac atgttacggc 240
ggcagcagag gcttcaactg cgagtctaaa cccgaggccg aggaaacctg cttcgacaag 300
tacaccggca acacctacag agtgggcgac acctacgaga ggcccaagga cagcatgatc 360
tgggactgca catgtatcgg agccggcaga ggcagaatca gctgcacaat cgccaaccgg 420
tgtcacgaag gcggccagag ctataagatc ggcgacactt ggagaaggcc ccacgagaca 480
ggcggctaca tgctggaatg cgtgtgtctc ggcaacggca aaggcgagtg gacctgcaag 540
cctatcgccg agaagtgctt cgatcatgcc gccggaacaa gctacgtcgt gggcgagaca 600
tgggagaagc cttaccaagg ctggatgatg gtggactgta cctgcctcgg cgaaggcagc 660
ggaagaatca cctgtaccag ccggaaccgg tgcaacgacc aggataccag aaccagctac 720
cggatcggcg atacctggtc caagaaggac aaccggggca acctgctgca gtgcatctgt 780
accggaaatg gaagaggcga atggaagtgc gagcggcaca caagcgtgca gacaacatct 840
tctggcagcg gcccctttac cgatgtgcgg gctgctgttt atcagcccca gcctcatcct 900
cagcctccac cttatggcca ctgcgtgaca gatagcggcg tggtgtatag cgtgggcatg 960
cagtggctga aaacccaggg caacaagcag atgctgtgca catgcctcgg caatggcgtg 1020
tcctgccaag agacagccgt gacacagacc tatggcggca atagcaatgg cgagccttgc 1080
gtgctgccct tcacctacaa tggccggacc ttctacagct gcaccaccga gggtagacag 1140
gacggacacc tgtggtgtag caccaccagc aactacgagc aggaccagaa gtacagcttc 1200
tgcaccgacc acaccgtgct ggtgcaaacc agaggcggca attctaacgg cgccctgtgt 1260
cacttcccct ttctgtacaa caaccacaac tacaccgact gcacctccga aggcagacgg 1320
gacaacatga agtggtgcgg cacaacccag aactacgacg ccgatcagaa gttcggcttc 1380
tgtcccatgg ccgctcacga ggaaatctgt accaccaacg aaggcgtgat gtacagaatc 1440
ggcgaccagt gggacaagca gcacgacatg ggccacatga tgcggtgtac ctgcgttggc 1500
aatggtcgcg gagagtggac atgcattgcc tacagccagc tgcgggacca gtgcatcgtg 1560
gacgacatca catacaacgt gaacgacacc ttccacaagc ggcacgaaga gggacacatg 1620
ctgaactgca cctgtttcgg ccaaggcaga ggccggtgga agtgtgatcc tgtggatcag 1680
tgccaggaca gcgaaaccgg caccttttac cagatcggag actcctggga gaaatacgtg 1740
cacggcgtgc gctaccagtg ctactgttac ggcagaggaa ttggcgagtg gcactgtcag 1800
cccctgcaga cataccctag ctctagcgga cctgtcgagg tgttcatcac cgagacaccc 1860
agccagccta actctcaccc catccagtgg aatgcccctc agcctagcca catcagcaag 1920
tacatcctga gatggcggcc caagaactcc gtcggcagat ggaaagaggc caccattcct 1980
ggccacctga acagctacac catcaaggga ctgaagcccg gcgtggtcta tgagggccag 2040
ctgatctcta tccagcagta cggccaccaa gaagtgacca gattcgactt caccaccacc 2100
tccaccagca cacccgtgac cagcaatacc gtgaccggcg agacaacccc tttctctcca 2160
ctggtggcca caagcgagag cgtgaccgag attaccgcca gcagctttgt ggtgtcttgg 2220
gtgtccgcca gcgatacagt gtccggcttc agagtggaat acgagctgag cgaggaaggc 2280
gacgagcccc agtatctgga tctgccaagc accgccacca gcgtgaacat ccctgatctg 2340
ctgcccggca gaaagtacat cgtgaacgtg taccagatct ccgaggacgg cgagcagagc 2400
ctgatcctga gcacaagcca gacaacagcc cctgacgctc ctcctgatcc taccgttgat 2460
caggtggacg ataccagcat cgtcgtgcgg tggtcaagac cccaggctcc tatcaccggc 2520
tacaggatcg tgtacagccc tagcgtggaa ggcagcagca ccgagctgaa tctgcccgag 2580
acagccaata gcgtgaccct gtctgatctg cagcctggcg tgcagtacaa tatcaccatc 2640
tacgccgtgg aagagaatca agagtctacc cctgtggtca tccagcaaga gacaaccggc 2700
actcccagat ccgacaccgt tccatctcca cgggatctgc agttcgtgga agtgaccgac 2760
gtgaaagtga caatcatgtg gaccccacct gagagcgccg tgacaggcta tagagtggac 2820
gtgatccccg tgaacctgcc aggcgaacat ggacagagac tgcccatcag cagaaacacc 2880
tttgccgaag tgacaggact gtcccctggc gtgacctact acttcaaggt gttcgctgtg 2940
tcccacggca gagagagcaa acctctgaca gctcagcaga ccaccaagct ggacgcccct 3000
accaacctgc agtttgtgaa cgagacagac agcacagtgc ttgtgcggtg gacccctcca 3060
agagcacaga tcacaggata ccggctgacc gtgggcctga ccagaagagg acagcccaga 3120
cagtacaacg tgggccccag cgtgtccaag tatcccctga gaaatctcca gcctgccagc 3180
gagtacaccg tgtctctggt ggctatcaag ggcaatcaag agagccctaa ggccaccggc 3240
gtgttcacta cactgcagcc cggaagcagc atccctccat acaacacaga agtgactgaa 3300
accaccatcg tgatcacctg gacacccgct cctcggatcg gctttaagct gggcgtcaga 3360
ccttctcaag gcggcgaagc tcccagagaa gtgacaagcg atagcggcag catcgtggtg 3420
tctggactga caccaggcgt ggaatatgtg tacaccatcc aggtgctgcg cgacggccaa 3480
gaaagggatg cccctatcgt gaacaaggtg gtcacccctc tgagcccacc aacaaacctg 3540
cacctggaag ccaatcctga taccggcgtg ctgactgtgt cctgggaaag aagcaccaca 3600
cctgacatta ccggctatcg gatcaccaca acacccacca atggccagca gggcaactcc 3660
ctggaagagg tggtgcatgc cgatcagtcc agctgtacct tcgacaatct gagccctggc 3720
ctcgagtaca atgtgtccgt gtacacagtg aaggacgaca aagaaagcgt gcccatctcc 3780
gacacaatca tccctgaggt gccccagctg accgacctga gcttcgtgga tatcaccgac 3840
agcagcatcg gcctgaggtg gacacctctg aactcctcta ccatcatcgg atacagaatc 3900
accgtggtgg ccgctggcga gggcatccca atcttcgagg actttgtgga cagcagcgtg 3960
ggctactaca ccgtgactgg actggaaccc ggcatcgact acgacatcag cgtcatcacc 4020
ctgatcaatg gcggcgagag cgcccctaca acactgacac aacagactgc cgtgcctcct 4080
cctaccgatc tgcggttcac aaatatcggc cccgacacca tgagagtgac ttgggctcct 4140
ccaccaagta tcgacctgac caacttcctc gtgcggtaca gccccgtgaa gaacgaggaa 4200
gatgtggccg agctgtccat ctctcccagc gataatgccg tggtgctgac caatctgctc 4260
cccggaacag agtacgtggt gtccgttagc agcgtgtacg aacagcacga gagcacaccc 4320
ctgcggggca gacaaaaaac aggcctggat agccccaccg gaatcgactt cagcgatatc 4380
acagccaaca gcttcaccgt gcattggatc gcccctagag ccaccatcac cgggtataga 4440
atccggcatc accccgagca cttcagcggc agacctagag aagatagagt gccccactcc 4500
agaaacagca tcaccctcac caatctgaca cccggcaccg aatatgtggt gtccatcgtg 4560
gccctgaacg gcagggaaga gtctcctctg ctgatcggcc agcagagcac agtgtctgac 4620
gtgcccagag atctggaagt ggtggctgcc acacctacca gcctgctgat tagctgggat 4680
gctcctgctg tgacagtgcg gtattaccgg atcacctacg gcgagactgg cggcaactct 4740
cccgtgcaag agtttacagt gcctggcagc aagagcaccg ctaccatctc tggactcaag 4800
ccaggcgtcg actacaccat taccgtgtac gctgtgaccg gcaggggcga ttctcctgcc 4860
tcttctaagc ctatcagcat caactaccgg accgagatcg acaagccaag ccagatgcaa 4920
gtgacagatg tgcaggacaa cagcatctcc gtgaagtggc tgcctagcag ctctccagtg 4980
accgggtaca gagtgaccac cacaccaaag aacggccctg gacctaccaa gaccaagacc 5040
gctggacctg atcagaccga gatgaccatt gagggcctgc agcctaccgt cgagtatgtc 5100
gtgtctgtgt acgcccagaa tcctagcggc gagtctcagc ctcttgtgca gaccgccgtg 5160
accaacatcg acagacctaa aggcctggcc ttcaccgacg tggacgtgga ctctatcaag 5220
atcgcctggg agtcccctca gggccaagtg tccagatata gagtgaccta cagctcccct 5280
gaggacggca tccacgagct gtttccagca ccagacggcg aagaggatac cgccgaactg 5340
caaggactga ggcctggctc cgagtataca gtctcagtgg tggccctgca cgacgacatg 5400
gaaagccagc ctctgatcgg aacccagtcc accgctattc ccgctcctac agacctgaag 5460
ttcacccaag tgaccccaac cagcctgagc gcacaatgga ctcctccaaa cgtccagctg 5520
actggttata gagtgcgcgt gacacccaaa gaaaagactg gccccatgaa ggaaatcaat 5580
ctggcccctg actccagctc cgtggttgtg tctggtctta tggtggctac caaatacgag 5640
gtttccgtgt atgccctgaa ggacaccctg acctccagac ctgcacaggg cgttgtgacc 5700
acactggaaa acgtgtcccc acctcggaga gccagagtga cagacgccac cgaaaccaca 5760
atcaccattt cttggcggac caagacagag acaatcaccg gattccaggt cgacgccgtg 5820
cctgccaatg gacagacacc tatccagcgg accatcaagc ctgacgtgcg gagctacaca 5880
atcacaggcc tgcaacctgg caccgactac aagatctacc tgtacaccct gaacgacaac 5940
gcccgctcta gccccgtggt tatcgatgcc tctaccgcca tcgacgcccc aagcaatctg 6000
agatttctgg ccacaactcc caacagtctg ctcgtgtctt ggcagcctcc tcgggccaga 6060
atcactggct acatcattaa gtacgagaag ccaggcagcc ctcctagaga ggtggtccct 6120
agacctagac ctggcgtcac agaggccaca attaccggac tcgagcccgg cactgagtac 6180
acaatctacg tgatcgccct gaagaacaac cagaagtccg agccactgat tggccggaag 6240
aaaaccgacg agctgcctca gctggtcacc ctgcctcatc caaatctgca cggccccgag 6300
atcctggatg tgccatctac cgtgcagaaa accccatttg tgacacaccc cggctacgac 6360
accggaaacg gaattcagct gcctggaacc tctgggcagc agccttctgt gggacagcag 6420
atgatctttg aggaacacgg cttccggcgg accacacctc ctacaacagc cacaccaatc 6480
aggcacagac cccggcctta tcctcctaac gtgggcgaag agattcagat cggacacatc 6540
cccagagagg atgtcgacta ccacctgtat cctcacggcc caggactgaa ccctaatgcc 6600
agcacaggac aagaggccct gagccagacc actatcagct gggctccatt ccaggacacc 6660
tccgagtaca tcatctcttg tcaccccgtg ggcaccgacg aggaaccact gcaattcaga 6720
gtgcccggca cctctaccag cgccacactt acaggactga ctagaggcgc cacctataac 6780
atcatcgtgg aagccctgaa agaccagcag cggcacaaag tgcgcgaaga ggttgtgact 6840
gtgggcaatt ccgtgaacga gggcctgaat cagcccaccg acgacagctg ctttgacccc 6900
tacacagtgt cccactatgc cgtgggagat gagtgggaac gcatgtccga gagcggcttc 6960
aagctgctct gtcagtgcct cggctttggc tccggccact tcagatgcga tagctccagg 7020
tggtgccacg ataacggcgt gaactacaaa atcggagaga agtgggacag acagggcgag 7080
aacggccaga tgatgagctg cacttgtctc ggaaatggaa agggcgagtt caagtgcgac 7140
cctcacgagg ccacctgtta cgacgatggc aagacctacc acgtgggaga gcagtggcag 7200
aaagagtacc tgggcgccat ctgtagctgc acatgctttg gcgggcagcg cggctggcgc 7260
tgtgataatt gccgtagacc aggcggcgag ccatctcctg agggaacaac aggccagtcc 7320
tacaaccagt acagccagag ataccaccag cgcaccaaca ccaatgtgaa ctgccccatc 7380
gagtgcttca tgcccctgga cgtgcaggcc gacagggaag attctagaga gtga 7434
<210> 37
<211> 2361
<212> DNA
<213> 智人(Homo sapiens)
<400> 37
atggcgggtc tgacggcggc ggccccgcgg cccggagtcc tcctgctcct gctgtccatc 60
ctccacccct ctcggcctgg aggggtccct ggggccattc ctggtggagt tcctggagga 120
gtcttttatc caggggctgg tctcggagcc cttggaggag gagcgctggg gcctggaggc 180
aaacctctta agccagttcc cggagggctt gcgggtgctg gccttggggc agggctcggc 240
gccttccccg cagttacctt tccgggggct ctggtgcctg gtggagtggc tgacgctgct 300
gcagcctata aagctgctaa ggctggcgct gggcttggtg gtgtcccagg agttggtggc 360
ttaggagtgt ctgcaggtgc ggtggttcct cagcctggag ccggagtgaa gcctgggaaa 420
gtgccgggtg tggggctgcc aggtgtatac ccaggtggcg tgctcccagg agctcggttc 480
cccggtgtgg gggtgctccc tggagttccc actggagcag gagttaagcc caaggctcca 540
ggtgtaggtg gagcttttgc tggaatccca ggagttggac cctttggggg accgcaacct 600
ggagtcccac tggggtatcc catcaaggcc cccaagctgc ctggtggcta tggactgccc 660
tacaccacag ggaaactgcc ctatggctat gggcccggag gagtggctgg tgcagcgggc 720
aaggctggtt acccaacagg gacaggggtt ggcccccagg cagcagcagc agcggcagct 780
aaagcagcag caaagttcgg tgctggagca gccggagtcc tccctggtgt tggaggggct 840
ggtgttcctg gcgtgcctgg ggcaattcct ggaattggag gcatcgcagg cgttgggact 900
ccagctgcag ctgcagctgc agcagcagcc gctaaggcag ccaagtatgg agctgctgca 960
ggcttagtgc ctggtgggcc aggctttggc ccgggagtag ttggtgtccc aggagctggc 1020
gttccaggtg ttggtgtccc aggagctggg attccagttg tcccaggtgc tgggatccca 1080
ggtgctgcgg ttccaggggt tgtgtcacca gaagcagctg ctaaggcagc tgcaaaggca 1140
gccaaatacg gggccaggcc cggagtcgga gttggaggca ttcctactta cggggttgga 1200
gctgggggct ttcccggctt tggtgtcgga gtcggaggta tccctggagt cgcaggtgtc 1260
cctggtgtcg gaggtgttcc cggagtcgga ggtgtcccgg gagttggcat ttcccccgaa 1320
gctcaggcag cagctgccgc caaggctgcc aagtacggtg ctgcaggagc aggagtgctg 1380
ggtgggctag tgccaggtgc cccaggcgca gtcccaggtg tgccgggcac gggaggagtg 1440
ccaggagtgg ggaccccagc agctgcagct gctaaagcag ccgccaaagc cgcccagttt 1500
gggttagttc ctggtgtcgg cgtggctcct ggagttggcg tggctcctgg tgtcggtgtg 1560
gctcctggag ttggcttggc tcctggagtt ggcgtggctc ctggagttgg tgtggctcct 1620
ggcgttggcg tggctcccgg cattggccct ggtggagttg cagctgcagc aaaatccgct 1680
gccaaggtgg ctgccaaagc ccagctccga gctgcagctg ggcttggtgc tggcatccct 1740
ggacttggag ttggtgtcgg cgtccctgga cttggagttg gtgctggtgt tcctggactt 1800
ggagttggtg ctggtgttcc tggcttcggg gcaggtgcag atgagggagt taggcggagc 1860
ctgtcccctg agctcaggga aggagatccc tcctcctctc agcacctccc cagcaccccc 1920
tcatcaccca gggtacctgg agccctggct gccgctaaag cagccaaata tggagcagca 1980
gtgcctgggg tccttggagg gctcggggct ctcggtggag taggcatccc aggcggtgtg 2040
gtgggagccg gacccgccgc cgccgctgcc gcagccaaag ctgctgccaa agccgcccag 2100
tttggcctag tgggagccgc tgggctcgga ggactcggag tcggagggct tggagttcca 2160
ggtgttgggg gccttggagg tatacctcca gctgcagccg ctaaagcagc taaatacggt 2220
gctgctggcc ttggaggtgt cctagggggt gccgggcagt tcccacttgg aggagtggca 2280
gcaagacctg gcttcggatt gtctcccatt ttcccaggtg gggcctgcct ggggaaagct 2340
tgtggccgga agagaaaatg a 2361
<210> 38
<211> 2361
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 38
atggctggac tgacagccgc tgctcctaga cctggtgttc tgctgctgct cctgagcatt 60
ctgcaccctt ctagaccagg cggagtgcct ggtgctattc ctggcggagt tcccggcgga 120
gtgttttatc ctggtgctgg actgggagcc cttggcggag gtgctcttgg acctggtgga 180
aagcctctga aacctgtgcc tggcggactt gctggtgcag gtcttggagc cggacttgga 240
gcttttcccg ccgtgacatt tcctggcgct cttgtgccag gtggcgtggc agatgctgcc 300
gctgcttata aggctgccaa agccggcgct ggactcggag gtgttcctgg tgttggaggc 360
ctgggagttt ctgctggtgc tgtggttcct caacctggcg ctggtgttaa gcctggcaaa 420
gttccaggcg ttggactgcc tggtgtttac cctggtggtg ttctccctgg cgctagattc 480
cctggcgttg gagttcttcc tggcgtgcca acaggtgccg gcgtgaaacc taaagctcct 540
ggtgtcggcg gagccttcgc tggaatacct ggcgtgggac cttttggcgg acctcaacca 600
ggtgtccctc tgggctatcc tatcaaggcc cctaaactgc caggcggcta cggcctgcct 660
tacacaactg gcaagctgcc ctatggctat ggacctggcg gtgttgctgg cgccgctgga 720
aaagctggat accctactgg aacaggcgtg ggccctcaag cagcagctgc cgcagcagct 780
aaagccgccg ctaaatttgg agctggcgct gcaggcgttt tgcccggcgt tggcggagca 840
ggcgtcccag gtgttccagg ggcaatacct ggaatcggag gaattgccgg cgtcggaact 900
ccagctgcag cagccgcagc cgccgctgcc gcaaaagctg ctaaatatgg cgcagctgca 960
ggcttggtcc caggcggacc tggatttgga ccaggtgttg ttggagtgcc aggcgctggc 1020
gtccccggcg tgggagttcc tggtgccgga attcctgttg ttcctggcgc tggtattcct 1080
ggcgctgctg ttccaggtgt tgtgtctcct gaagccgctg ccaaggccgc tgctaaggca 1140
gctaaatacg gtgcccgacc aggcgtcgga gttggcggaa ttccaacata tggtgtcgga 1200
gccggcggat tcccaggatt tggagttgga gtcggaggca tcccgggtgt tgcaggcgtt 1260
ccaggcgtcg gcggagttcc tggcgttggt ggtgttccag gcgtgggaat ttctcctgaa 1320
gctcaggccg ctgccgctgc caaagcagcc aaatatggcg ctgccggtgc tggcgttctc 1380
ggaggattgg ttccgggtgc tccaggtgct gttccgggcg ttcccggaac tggcggtgtc 1440
cctggtgtcg gaacaccagc cgctgcagca gcaaaggctg ctgctaaagc cgctcagttt 1500
ggactggttc ctggcgtcgg agtggcacca ggtgttggag ttgcacctgg cgttggcgtg 1560
gcccctggcg tgggtcttgc tcctggtgtt ggtgttgccc caggtgtcgg agtcgctccc 1620
ggtgtcggtg tcgcacctgg tattggtcct ggtggcgttg ccgcagctgc caaatctgct 1680
gcaaaggtgg ccgccaaagc acagctgaga gctgctgccg gtcttggcgc tggaatccca 1740
ggactcggtg ttggagtggg agtgccaggt cttggtgttg gagcaggcgt gcccggactc 1800
ggagtcggag ctggtgtccc aggttttgga gctggtgcag atgaaggcgt gcggagatct 1860
ctgagccctg agctgagaga gggcgatcct agctctagcc agcatctccc tagcacacct 1920
agcagcccta gagtccctgg ggctcttgct gcagccaaag ccgctaagta tggggctgct 1980
gtccctggtg ttcttggagg acttggagca ctcggcggag tgggaattcc aggcggtgtc 2040
gttggtgcag gacctgctgc tgccgccgca gctgcaaaag cagcagctaa ggcagcccag 2100
tttggccttg ttggagccgc tggacttggt ggcctcggag ttggtggtct tggtgtcccc 2160
ggtgttggcg gacttggagg aattccacca gccgcagcag ccaaggctgc taaatacggc 2220
gctgcaggac ttggcggtgt tcttggcgga gctggacagt ttccacttgg aggcgttgca 2280
gccagacctg gctttggcct gtctcctatt tttcctggcg gcgcttgtct gggcaaagcc 2340
tgcggcagaa agcggaagta a 2361
<210> 39
<211> 1017
<212> DNA
<213> 智人(Homo sapiens)
<400> 39
atgagtctaa gtgcatttac tctcttcctg gcattgattg gtggtaccag tggccagtac 60
tatgattatg attttcccct atcaatttat gggcaatcat caccaaactg tgcaccagaa 120
tgtaactgcc ctgaaagcta cccaagtgcc atgtactgtg atgagctgaa attgaaaagt 180
gtaccaatgg tgcctcctgg aatcaagtat ctttacctta ggaataacca gattgaccat 240
attgatgaaa aggcctttga gaatgtaact gatctgcagt ggctcattct agatcacaac 300
cttctagaaa actccaagat aaaagggaga gttttctcta aattgaaaca actgaagaag 360
ctgcatataa accacaacaa cctgacagag tctgtgggcc cacttcccaa atctctggag 420
gatctgcagc ttactcataa caagatcaca aagctgggct cttttgaagg attggtaaac 480
ctgaccttca tccatctcca gcacaatcgg ctgaaagagg atgctgtttc agctgctttt 540
aaaggtctta aatcactcga ataccttgac ttgagcttca atcagatagc cagactgcct 600
tctggtctcc ctgtctctct tctaactctc tacttagaca acaataagat cagcaacatc 660
cctgatgagt atttcaagcg ttttaatgca ttgcagtatc tgcgtttatc tcacaacgaa 720
ctggctgata gtggaatacc tggaaattct ttcaatgtgt catccctggt tgagctggat 780
ctgtcctata acaagcttaa aaacatacca actgtcaatg aaaaccttga aaactattac 840
ctggaggtca atcaacttga gaagtttgac ataaagagct tctgcaagat cctggggcca 900
ttatcctact ccaagatcaa gcatttgcgt ttggatggca atcgcatctc agaaaccagt 960
cttccaccgg atatgtatga atgtctacgt gttgctaacg aagtcactct taattaa 1017
<210> 40
<211> 1017
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 40
atgagcctga gcgccttcac actgtttctg gccctgatcg gcggcacaag cggccagtac 60
tacgactacg atttcccact gagcatctac ggccagagca gccctaattg cgcccctgag 120
tgcaattgcc ccgagagcta tcctagcgcc atgtactgcg acgagctgaa gctgaagtcc 180
gtgcctatgg tgcctcctgg catcaagtac ctgtacctgc ggaacaacca gatcgaccac 240
atcgacgaga aggcctttga gaacgtgacc gacctgcagt ggctgatcct ggaccacaac 300
ctgctggaaa acagcaagat caagggccgc gtgttcagca agctgaagca gctgaagaaa 360
ctgcacatca accacaacaa cctgaccgag agcgtgggcc ctctgcctaa gtctctggaa 420
gatctgcagc tgacccacaa caagatcacc aagctgggca gcttcgaggg cctcgtgaac 480
ctgaccttca tccatctgca gcacaaccgg ctgaaagagg atgccgttag cgccgccttc 540
aagggcctga agagtctgga atacctggac ctgagcttca atcagatcgc cagactgcct 600
agcggcctgc ctgtttctct gctgacactg tacctggaca acaacaaaat cagcaacatc 660
cccgacgagt acttcaagcg gttcaacgcc ctgcagtacc tgagactgag ccacaacgag 720
ctggccgatt ctggcatccc cggcaacagc ttcaatgtgt ccagcctggt ggaactggac 780
ctgtcctaca acaagctgaa aaacatcccc accgtgaacg agaacctcga gaactactac 840
ctggaagtga accagctcga gaagttcgat atcaagagct tctgcaagat cctggggcct 900
ctgagctact ccaagattaa gcacctgagg ctggacggca accggatcag cgaaacaagc 960
ctgcctcctg atatgtacga gtgcctgaga gtggccaacg aagtgaccct gaactga 1017
<210> 41
<211> 1437
<212> DNA
<213> 智人(Homo sapiens)
<400> 41
atggcacccc tgagacccct tctcatactg gccctgctgg catgggttgc tctggctgac 60
caagagtcat gcaagggccg ctgcactgag ggcttcaacg tggacaagaa gtgccagtgt 120
gacgagctct gctcttacta ccagagctgc tgcacagact atacggctga gtgcaagccc 180
caagtgactc gcggggatgt gttcactatg ccggaggatg agtacacggt ctatgacgat 240
ggcgaggaga aaaacaatgc cactgtccat gaacaggtgg ggggcccctc cctgacctct 300
gacctccagg cccagtccaa agggaatcct gagcagacac ctgttctgaa acctgaggaa 360
gaggcccctg cgcctgaggt gggcgcctct aagcctgagg ggatagactc aaggcctgag 420
acccttcatc cagggagacc tcagccccca gcagaggagg agctgtgcag tgggaagccc 480
ttcgacgcct tcaccgacct caagaacggt tccctctttg ccttccgagg gcagtactgc 540
tatgaactgg acgaaaaggc agtgaggcct gggtacccca agctcatccg agatgtctgg 600
ggcatcgagg gccccatcga tgccgccttc acccgcatca actgtcaggg gaagacctac 660
ctcttcaagg gtagtcagta ctggcgcttt gaggatggtg tcctggaccc tgattacccc 720
cgaaatatct ctgacggctt cgatggcatc ccggacaacg tggatgcagc cttggccctc 780
cctgcccata gctacagtgg ccgggagcgg gtctacttct tcaaggggaa acagtactgg 840
gagtaccagt tccagcacca gcccagtcag gaggagtgtg aaggcagctc cctgtcggct 900
gtgtttgaac actttgccat gatgcagcgg gacagctggg aggacatctt cgagcttctc 960
ttctggggca gaacctctgc tggtaccaga cagccccagt tcattagccg ggactggcac 1020
ggtgtgccag ggcaagtgga cgcagccatg gctggccgca tctacatctc aggcatggca 1080
ccccgcccct ccttggccaa gaaacaaagg tttaggcatc gcaaccgcaa aggctaccgt 1140
tcacaacgag gccacagccg tggccgcaac cagaactccc gccggccatc ccgcgccacg 1200
tggctgtcct tgttctccag tgaggagagc aacttgggag ccaacaacta tgatgactac 1260
aggatggact ggcttgtgcc tgccacctgt gaacccatcc agagtgtctt cttcttctct 1320
ggagacaagt actaccgagt caatcttcgc acacggcgag tggacactgt ggaccctccc 1380
tacccacgct ccatcgctca gtactggctg ggctgcccag ctcctggcca tctgtag 1437
<210> 42
<211> 1437
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 42
atggcccctc ttagacccct gctgattctg gctctgctgg cttgggttgc cctggccgat 60
caagagtctt gcaagggcag atgcaccgag ggcttcaacg tggacaagaa atgccagtgc 120
gacgagctgt gcagctacta ccagagctgc tgcaccgatt acaccgccga gtgcaagccc 180
caagtgacaa gaggcgacgt gttcaccatg cctgaggacg agtacaccgt gtacgacgac 240
ggcgaggaaa agaacaacgc caccgtgcac gagcaagttg gcggaccttc tctgaccagc 300
gatctgcagg ctcagagcaa gggcaatcct gagcagaccc ctgtgctgaa gcctgaggaa 360
gaagcccctg ctcctgaagt gggagcctct aagcctgaag gcatcgacag cagacccgag 420
acactgcatc caggcagacc tcagcctcct gccgaagagg aactgtgtag cggcaagcct 480
ttcgacgcct tcaccgacct gaagaacggc agcctgttcg cctttagagg ccagtactgc 540
tacgagctgg acgagaaggc cgtgcggcct ggatatccta agctgatcag agatgtgtgg 600
ggcatcgagg gccccatcga cgccgctttc accagaatca actgtcaggg caagacctac 660
ctgttcaagg gcagccagta ttggagattc gaggacggcg tgctggaccc tgactacccc 720
agaaatatca gcgacggctt cgacggcatc cccgacaatg ttgatgctgc tctggccctg 780
cctgctcaca gctactctgg cagagaacgg gtgtacttct ttaagggcaa acagtactgg 840
gagtaccagt tccagcacca gcctagccaa gaggaatgcg agggcagctc tctgagcgcc 900
gtgtttgagc acttcgccat gatgcagaga gacagctggg aagatatttt cgagctgctg 960
ttctggggca gaaccagcgc cggaacaaga cagcctcagt tcatcagcag agactggcat 1020
ggcgtgccag gacaagtgga tgctgccatg gccggcagaa tctacatcag cggaatggcc 1080
cctagaccta gcctggccaa gaagcagcgg ttccggcaca gaaaccggaa gggctacaga 1140
agccagagag gccactccag aggccggaac cagaatagca gaaggccctc tagagccacc 1200
tggctgagcc tgtttagcag cgaggaaagc aacctgggcg ccaacaacta cgacgactac 1260
cggatggatt ggctggtgcc tgccacatgc gagcctatcc agagcgtgtt cttcttcagc 1320
ggcgacaaat attaccgcgt gaacctgcgg actcggagag tggatacagt ggaccctcct 1380
tatcctcggt ctatcgctca gtattggctg ggctgtccag ctcctggaca cctgtaa 1437
<210> 43
<211> 5175
<212> DNA
<213> 智人(Homo sapiens)
<400> 43
atgcctccag cagtgaggcg gtcagcctgc agcatgggat ggctgtggat ctttggggca 60
gccctggggc agtgtctggg ctacagttca cagcagcaaa gggtgccatt tcttcagcct 120
cccggtcaaa gtcaactgca agcgagttat gtggagttta gacccagcca gggttgtagc 180
cctggatact atcgggatca taaaggcttg tataccggac ggtgtgttcc ctgcaattgc 240
aacggacatt caaatcaatg ccaggatggc tcaggcatat gtgttaactg tcagcacaac 300
accgcgggag agcactgtga acgctgccag gagggctact atggcaacgc cgtccacgga 360
tcctgcaggg cctgcccatg tcctcacact aacagctttg ccactggctg tgtggtgaat 420
gggggagacg tgcggtgctc ctgcaaagct gggtacacag gaacacagtg tgaaaggtgt 480
gcaccgggat atttcgggaa tccccagaaa ttcggaggta gctgccaacc atgcagttgt 540
aacagcaatg gccagctggg cagctgtcat cccctgactg gagactgcat aaaccaagaa 600
cccaaagata gcagccctgc agaagaatgt gatgattgcg acagctgtgt gatgaccctc 660
ctgaacgacc tggccaccat gggcgagcag ctccgcctgg tcaagtctca gctgcagggc 720
ctgagtgcca gcgcagggct tctggagcag atgaggcaca tggagaccca ggccaaggac 780
ctgaggaatc agttgctcaa ctaccgttct gccatttcaa atcatggatc aaaaatagaa 840
ggcctggaaa gagaactgac tgatttgaat caagaatttg agactttgca agaaaaggct 900
caagtaaatt ccagaaaagc acaaacatta aacaacaatg ttaatcgggc aacacaaagc 960
gcaaaagaac tggatgtgaa gattaaaaat gtcatccgga atgtgcacat tcttttaaag 1020
cagatctctg ggacagatgg agagggaaac aacgtgcctt caggtgactt ttccagagag 1080
tgggctgaag cccagcgcat gatgagggaa ctgcggaaca ggaactttgg aaagcacctc 1140
agagaagcag aagctgataa aagggagtcg cagctcttgc tgaaccggat aaggacctgg 1200
cagaaaaccc accaggggga gaacaatggg cttgctaaca gtatccggga ttctttaaat 1260
gaatacgaag ccaaactcag tgaccttcgt gctcggctgc aggaggcagc tgcccaagcc 1320
aagcaggcaa atggcttgaa ccaagaaaac gagagagctt tgggagccat tcagagacaa 1380
gtgaaagaaa taaattccct gcagagtgat ttcaccaagt atctaaccac tgcagactca 1440
tctttgttgc aaaccaacat tgcgctgcag ctgatggaga aaagccagaa ggaatatgaa 1500
aaattagctg ccagtttaaa tgaagcaaga caagaactaa gtgacaaagt aagagaactt 1560
tccagatctg ctggcaaaac atcccttgtg gaggaggcag aaaagcacgc gcggtcctta 1620
caagagctgg caaagcagct ggaagagatc aagagaaacg ccagcgggga tgagctggtg 1680
cgctgtgctg tggatgccgc caccgcctac gagaacatcc tcaatgccat caaagcggcc 1740
gaggacgcag ccaacagggc tgccagtgca tctgaatctg ccctccagac agtgataaag 1800
gaagatctgc caagaaaagc taaaaccctg agttccaaca gtgataaact gttaaatgaa 1860
gccaagatga cacaaaagaa gctaaagcaa gaagtcagtc cagctctcaa caacctacag 1920
caaaccctga atattgtgac agttcagaaa gaagtgatag acaccaatct cacaactctc 1980
cgagatggtc ttcatgggat acagagaggt gatattgatg ctatgatcag tagtgcaaag 2040
agcatggtca gaaaggccaa cgacatcaca gatgaggttc tggatgggct caaccccatc 2100
cagacagatg tggaaagaat taaggacacc tatgggagga cacagaacga agacttcaaa 2160
aaggctctga ctgatgcaga taactcggtg aataagttaa ccaacaaact acctgatctt 2220
tggcgcaaga ttgaaagtat caaccaacag ctgttgccct tgggaaacat ctctgacaac 2280
atggacagaa tacgagaact aattcagcag gccagagatg ctgccagtaa ggttgctgtc 2340
cccatgaggt tcaatggtaa atctggagtc gaagtccgac tgccaaatga cctggaagat 2400
ttgaaaggat atacatctct gtccttgttt ctccaaaggc ccaactcaag agaaaatggg 2460
ggtactgaga atatgtttgt gatgtacctt ggaaataaag atgcctcccg ggactacatc 2520
ggcatggcag ttgtggatgg ccagctcacc tgtgtctaca acctggggga ccgtgaggct 2580
gaactccaag tggaccagat cttgaccaag agtgagacta aggaggcagt tatggatcgg 2640
gtgaaatttc agagaattta tcagtttgca aggcttaatt acaccaaagg agccacatcc 2700
agtaaaccag aaacacccgg agtctatgac atggatggta gaaatagcaa tacactcctt 2760
aatttggatc ctgaaaatgt tgtattttat gttggaggtt acccacctga ttttaaactt 2820
cccagtcgac taagtttccc tccatacaaa ggttgtattg aattagatga cctcaatgaa 2880
aatgttctga gcttgtacaa cttcaaaaaa acattcaatc tcaacacaac tgaagtggag 2940
ccttgtagaa ggaggaagga agagtcagac aaaaattatt ttgaaggtac gggctatgct 3000
cgagttccaa ctcaaccaca tgctcccatc ccaacctttg gacagacaat tcagaccacc 3060
gtggatagag gcttgctgtt ctttgcagaa aacggggatc gcttcatatc tctaaatata 3120
gaagatggca agctcatggt gagatacaaa ctgaattcag agctaccaaa agagagagga 3180
gttggagacg ccataaacaa cggcagagac cattcgattc agatcaaaat tggaaaactc 3240
caaaagcgta tgtggataaa tgtggacgtt caaaacacta taattgatgg tgaagtattt 3300
gatttcagca catattatct gggaggaatt ccaattgcaa tcagggaaag atttaacatt 3360
tctacgcctg ctttccgagg ctgcatgaaa aatttgaaga aaaccagtgg tgtcgttaga 3420
ttgaatgata ctgtgggagt aaccaaaaag tgctcggaag actggaagct tgtgcgatct 3480
gcctcattct ccagaggagg acaattgagt ttcactgatt tgggcttacc acctactgac 3540
cacctccagg cctcatttgg atttcagacc tttcaaccca gtggcatatt attagatcat 3600
cagacatgga caaggaacct gcaggtcact ctggaagatg gttacattga attgagcacc 3660
agcgatagcg gcggcccaat ttttaaatct ccacagacgt atatggatgg tttactgcat 3720
tatgtatctg taataagcga caactctgga ctacggcttc tcatcgatga ccagcttctg 3780
agaaatagca aaaggctaaa acacatttca agttcccggc agtctctgcg tctgggcggg 3840
agcaattttg agggttgtat tagcaatgtt tttgtccaga ggttatcact gagtcctgaa 3900
gtcctagatt tgaccagtaa ctctctcaag agagatgtgt ccctgggagg ctgcagttta 3960
aacaaaccac cttttctaat gttgcttaaa ggttctacca ggtttaacaa gaccaagact 4020
tttcgtatca accagctgtt gcaggacaca ccagtggcct ccccaaggag cgtgaaggtg 4080
tggcaagatg cttgctcacc acttcccaag acccaggcca atcatggagc cctccagttt 4140
ggggacattc ccaccagcca cttgctattc aagcttcctc aggagctgct gaaacccagg 4200
tcacagtttg ctgtggacat gcagacaaca tcctccagag gactggtgtt tcacacgggc 4260
actaagaact cctttatggc tctttatctt tcaaaaggac gtctggtctt tgcactgggg 4320
acagatggga aaaaattgag gatcaaaagc aaggagaaat gcaatgatgg gaaatggcac 4380
acggtggtgt ttggccatga tggggaaaag gggcgcttgg ttgtggatgg actgagggcc 4440
cgggagggaa gtttgcctgg aaactccacc atcagcatca gagcgccagt ttacctggga 4500
tcacctccat cagggaaacc aaagagcctc cccacaaaca gctttgtggg atgcctgaag 4560
aactttcagc tggattcaaa acccttgtat accccttctt caagcttcgg ggtgtcttcc 4620
tgcttgggtg gtcctttgga gaaaggcatt tatttctctg aagaaggagg tcatgtcgtc 4680
ttggctcact ctgtattgtt ggggccagaa tttaagcttg ttttcagcat ccgcccaaga 4740
agtctcactg ggatcctaat acacatcgga agtcagcccg ggaagcactt atgtgtttac 4800
ctggaggcag gaaaggtcac ggcctctatg gacagtgggg caggtgggac ctcaacgtcg 4860
gtcacaccaa agcagtctct gtgtgatgga cagtggcact cggtggcagt caccataaaa 4920
caacacatcc tgcacctgga actggacaca gacagtagct acacagctgg acagatcccc 4980
ttcccacctg ccagcactca agagccacta caccttggag gtgctccagc caatttgacg 5040
acactgagga tccctgtgtg gaaatcattc tttggctgtc tgaggaatat tcatgtcaat 5100
cacatccctg tccctgtcac tgaagccttg gaagtccagg ggcctgtcag tctgaatggt 5160
tgtcctgacc agtaa 5175
<210> 44
<211> 5175
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 44
atgcctcctg ctgtgcggag aagcgcctgt tctatgggat ggctgtggat ctttggcgcc 60
gctctgggac agtgtctggg ctactcttct cagcagcagc gggtgccatt tctgcagcca 120
cctggacagt ctcagctgca ggccagctac gtggaattca gacctagcca gggctgtagc 180
cccggctact acagagatca caagggcctg tacaccggca gatgcgtgcc ctgcaactgt 240
aacggccaca gcaaccagtg tcaggacggc tctggcatct gcgtgaactg ccagcataat 300
actgccggcg agcactgcga gagatgccaa gagggctact acggcaatgc cgtgcatggc 360
agctgtcggg cttgtccttg tcctcacacc aacagctttg ccaccggctg cgttgtgaac 420
ggcggagatg ttcggtgttc ttgcaaggcc ggctacacag gcacacagtg cgaaagatgt 480
gcccctggct actttggcaa ccctcagaag tttggcggct cctgccagcc ttgctcctgc 540
aattctaatg gccagctggg ctcttgtcac cctctgaccg gcgactgcat caatcaagag 600
cctaaggaca gcagccctgc cgaggaatgc gacgattgcg atagctgcgt gatgaccctg 660
ctgaacgacc tggccacaat gggagaacag ctgcggctgg ttaagagcca gctccaggga 720
ctgtctgcct ctgctggact gctggaacag atgcggcaca tggaaaccca ggccaaggac 780
ctgagaaacc agctgctgaa ctacagaagc gccatctcca accacggcag caagatcgaa 840
ggcctggaaa gagagctgac cgacctgaat caagagttcg agacactgca agagaaggcc 900
caagtgaaca gccggaaggc ccagactctg aacaacaacg tgaaccgggc cacacagtcc 960
gccaaagaac tggacgtgaa gatcaagaac gtgatccgga acgtgcacat cctgctgaag 1020
cagatcagcg gcacagatgg cgagggcaac aatgtgccta gcggcgactt tagcagagag 1080
tgggccgaag ctcagcggat gatgagagag ctgcggaacc ggaacttcgg caagcacctg 1140
agagaagccg aggccgacaa gagagagagc caactgctgc tcaaccggat cagaacctgg 1200
cagaaaaccc accagggcga gaacaacggc ctggccaaca gcatcagaga cagcctgaat 1260
gagtacgagg ccaagctgag cgatctgcgg gccagacttc aagaagctgc cgctcaggcc 1320
aagcaggcca acggccttaa tcaagagaac gagagagccc tgggcgccat ccagagacaa 1380
gtgaaagaga tcaacagcct gcagagcgac ttcaccaagt acctgaccac cgccgatagc 1440
agcctgctgc agacaaatat cgccctgcag ctcatggaaa agagccagaa agagtacgaa 1500
aagctggccg ccagcctgaa cgaggccagg caagaactgt ctgacaaagt gcgcgagctg 1560
agcagatccg ccggcaagac atctctggtg gaagaggccg agaagcacgc cagatctctg 1620
caagagctgg ccaaacagct ggaagagatt aagcggaacg ccagcggcga cgaactcgtc 1680
agatgtgcag tggatgccgc caccgcctac gagaacatcc tgaatgccat caaggccgcc 1740
gaggacgccg ctaatagagc cgcttctgct tctgagtctg ccctgcagac cgtgatcaaa 1800
gaggacctgc ctagaaaggc caagacactg agcagcaaca gcgacaaact gctgaatgag 1860
gccaagatga cccagaagaa actgaagcaa gaggtgtccc ctgcactgaa caacctgcag 1920
cagaccctga acatcgtgac cgtgcagaaa gaagtgatcg acaccaacct gacaaccctg 1980
agagatggcc tgcacggaat ccagagaggc gacatcgacg ccatgatcag cagcgccaag 2040
agcatggttc gaaaagccaa cgacatcacc gacgaggtgc tggacggcct gaatcctatc 2100
cagaccgacg tggaacggat caaggacacc tacggcagaa cccagaacga ggatttcaag 2160
aaggccctga ccgacgccga caactccgtg aacaagctga ccaacaagct gcccgatctg 2220
tggcggaaga tcgagagcat caaccagcaa ctgctccctc tgggcaacat cagcgacaac 2280
atggacagaa tccgggaact gatccagcag gccagagatg ccgcctccaa agtggctgtg 2340
cccatgagat tcaacggcaa gagcggagtg gaagtgcggc tgcccaacga tctggaagat 2400
ctgaagggct ataccagcct gagcctgttc ctgcagaggc ccaacagcag agagaatggc 2460
ggcaccgaga atatgttcgt gatgtacctg ggaaacaagg acgccagccg ggactatatc 2520
ggaatggccg ttgtggacgg ccagctgacc tgcgtgtaca acctgggaga cagagaagct 2580
gaactgcagg tcgaccagat cctgaccaag agcgagacaa aagaggccgt gatggacaga 2640
gtgaagttcc agcggatcta ccagttcgcc cggctgaatt acaccaaggg cgccacaagc 2700
agcaagcccg aaacacctgg cgtgtacgac atggacggcc ggaactctaa cactctgctg 2760
aatctggacc ccgagaacgt ggtgttttac gtcggcggct accctcctga cttcaagctg 2820
cctagcagac tgagcttccc accttacaag ggctgcatcg agctggatga cctgaacgaa 2880
aacgtgctgt ccctgtacaa cttcaaaaag accttcaacc tgaacaccac cgaggtggaa 2940
ccctgcaggc gcagaaaaga ggaatccgac aagaactact tcgaaggcac cggctacgcc 3000
agagtgccta cacaacctca cgctcccatt cctaccttcg gccagaccat ccagacaacc 3060
gtggatagag gcctgctgtt cttcgccgag aacggcgaca gattcatctc cctgaatatc 3120
gaggatggca agctgatggt ccgatacaag ctgaatagcg agctgcccaa agaaagaggc 3180
gtgggcgacg ccatcaacaa cggcagggat cacagcatcc agatcaagat cggcaaactg 3240
cagaaacgga tgtggatcaa cgtggacgtg cagaacacca tcatcgacgg cgaggtgttc 3300
gacttcagca cctactatct cggcggaatc cctatcgcca tcagagagcg gttcaatatc 3360
agcacccctg ccttccgggg ctgcatgaag aacctgaaaa agaccagcgg cgtcgtgcgg 3420
ctgaatgata cagtgggcgt gaccaagaag tgcagcgagg actggaagct tgtgcggagc 3480
gccagttttt ctagaggcgg acagctgagc tttaccgacc tgggactgcc tcctaccgat 3540
catctgcagg caagcttcgg attccagacc ttccagccaa gcggaatcct gctggaccac 3600
cagacctgga ccagaaacct gcaagtgacc ctggaagatg gctacatcga actgagcacc 3660
agcgactctg gcggccctat ctttaagagc cctcagacct acatggatgg gctgctgcac 3720
tacgtgtccg tgatcagcga taacagcggc ctgagactgc tgatcgacga ccagctcctg 3780
cggaacagca agcggctgaa gcacatctcc agcagcagac agagtctgag actcggcggc 3840
agcaatttcg agggctgtat cagcaacgtg ttcgtgcagc gcctgagtct gtctccagaa 3900
gtgctggacc tgaccagcaa tagcctgaag agggatgtgt ctctcggcgg ctgctccctg 3960
aacaaacctc ctttcctgat gctgctgaag ggcagcaccc ggttcaacaa gaccaagacc 4020
tttcggatca atcagctgct ccaggacacc cctgtggcta gccctagaag cgtgaaagtg 4080
tggcaggacg cctgcagtcc cctgcctaaa acacaggcca atcacggggc tctgcagttc 4140
ggcgatatcc ccacaagcca tctgctgttt aagctgcccc aagagctgct caagcctcgg 4200
agccagttcg ctgtggatat gcagaccacc tcctccagag gactggtgtt tcacaccggc 4260
accaagaaca gcttcatggc cctgtacctg agcaaaggca ggctggtgtt tgccctgggc 4320
accgacggaa agaaactgcg gatcaagagc aaagagaagt gcaacgacgg caagtggcac 4380
accgtggtgt tcggacacga tggcgagaaa ggcagactcg tggtggatgg cctgagagcc 4440
agagagggat ctctgcctgg caactccacc atctccatca gagcccctgt gtatctgggc 4500
agccctccta gcggaaagcc taagagcctg cctaccaact ccttcgtggg ctgtctgaag 4560
aactttcagc tggacagcaa gcctctgtac acccctagca gcagctttgg cgtgtcctcc 4620
tgtctcggag gccctctgga aaagggcatc tacttctctg aggaaggcgg ccacgttgtc 4680
ctggctcatt ctgttctgct gggccccgag ttcaagctgg tgttctctat ccggcctaga 4740
agcctgaccg gcatcctgat tcacatcggc agccagcctg ggaagcacct gtgtgtgtat 4800
ctcgaggccg gcaaagtgac cgccagcatg gattctggtg ctggcggcac aagcacctcc 4860
gtgacaccta agcagagcct gtgtgatggc cagtggcaca gtgtggccgt gacaatcaag 4920
cagcacattc tgcacctgga actggacacc gacagcagct ataccgccgg acagatccca 4980
tttcctccag ccagcacaca agagcctctg caccttggag gcgcccctgc caatctgacc 5040
acactgagaa tccccgtgtg gaagtccttc ttcggctgcc tgcggaatat ccatgtgaac 5100
cacattccag tgcctgtgac agaggccctg gaagtgcagg gacccgtgtc tctgaatgga 5160
tgccccgatc agtga 5175
<210> 45
<211> 3519
<212> DNA
<213> 智人(Homo sapiens)
<400> 45
atgagaccat tcttcctctt gtgttttgcc ctgcctggcc tcctgcatgc ccaacaagcc 60
tgctcccgtg gggcctgcta tccacctgtt ggggacctgc ttgttgggag gacccggttt 120
ctccgagctt catctacctg tggactgacc aagcctgaga cctactgcac ccagtatggc 180
gagtggcaga tgaaatgctg caagtgtgac tccaggcagc ctcacaacta ctacagtcac 240
cgagtagaga atgtggcttc atcctccggc cccatgcgct ggtggcagtc acagaatgat 300
gtgaaccctg tctctctgca gctggacctg gacaggagat tccagcttca agaagtcatg 360
atggagttcc aggggcccat gcccgccggc atgctgattg agcgctcctc agacttcggt 420
aagacctggc gagtgtacca gtacctggct gccgactgca cctccacctt ccctcgggtc 480
cgccagggtc ggcctcagag ctggcaggat gttcggtgcc agtccctgcc tcagaggcct 540
aatgcacgcc taaatggggg gaaggtccaa cttaacctta tggatttagt gtctgggatt 600
ccagcaactc aaagtcaaaa aattcaagag gtgggggaga tcacaaactt gagagtcaat 660
ttcaccaggc tggcccctgt gccccaaagg ggctaccacc ctcccagcgc ctactatgct 720
gtgtcccagc tccgtctgca ggggagctgc ttctgtcacg gccatgctga tcgctgcgca 780
cccaagcctg gggcctctgc aggcccctcc accgctgtgc aggtccacga tgtctgtgtc 840
tgccagcaca acactgccgg cccaaattgt gagcgctgtg cacccttcta caacaaccgg 900
ccctggagac cggcggaggg ccaggacgcc catgaatgcc aaaggtgcga ctgcaatggg 960
cactcagaga catgtcactt tgaccccgct gtgtttgccg ccagccaggg ggcatatgga 1020
ggtgtgtgtg acaattgccg ggaccacacc gaaggcaaga actgtgagcg gtgtcagctg 1080
cactatttcc ggaaccggcg cccgggagct tccattcagg agacctgcat ctcctgcgag 1140
tgtgatccgg atggggcagt gccaggggct ccctgtgacc cagtgaccgg gcagtgtgtg 1200
tgcaaggagc atgtgcaggg agagcgctgt gacctatgca agccgggctt cactggactc 1260
acctacgcca acccgcaggg ctgccaccgc tgtgactgca acatcctggg gtcccggagg 1320
gacatgccgt gtgacgagga gagtgggcgc tgcctttgtc tgcccaacgt ggtgggtccc 1380
aaatgtgacc agtgtgctcc ctaccactgg aagctggcca gtggccaggg ctgtgaaccg 1440
tgtgcctgcg acccgcacaa ctccctcagc ccacagtgca accagttcac agggcagtgc 1500
ccctgtcggg aaggctttgg tggcctgatg tgcagcgctg cagccatccg ccagtgtcca 1560
gaccggacct atggagacgt ggccacagga tgccgagcct gtgactgtga tttccgggga 1620
acagagggcc cgggctgcga caaggcatca ggccgctgcc tctgccgccc tggcttgacc 1680
gggccccgct gtgaccagtg ccagcgaggc tactgtaatc gctacccggt gtgcgtggcc 1740
tgccaccctt gcttccagac ctatgatgcg gacctccggg agcaggccct gcgctttggt 1800
agactccgca atgccaccgc cagcctgtgg tcagggcctg ggctggagga ccgtggcctg 1860
gcctcccgga tcctagatgc aaagagtaag attgagcaga tccgagcagt tctcagcagc 1920
cccgcagtca cagagcagga ggtggctcag gtggccagtg ccatcctctc cctcaggcga 1980
actctccagg gcctgcagct ggatctgccc ctggaggagg agacgttgtc ccttccgaga 2040
gacctggaga gtcttgacag aagcttcaat ggtctcctta ctatgtatca gaggaagagg 2100
gagcagtttg aaaaaataag cagtgctgat ccttcaggag ccttccggat gctgagcaca 2160
gcctacgagc agtcagccca ggctgctcag caggtctccg acagctcgcg ccttttggac 2220
cagctcaggg acagccggag agaggcagag aggctggtgc ggcaggcggg aggaggagga 2280
ggcaccggca gccccaagct tgtggccctg aggctggaga tgtcttcgtt gcctgacctg 2340
acacccacct tcaacaagct ctgtggcaac tccaggcaga tggcttgcac cccaatatca 2400
tgccctggtg agctatgtcc ccaagacaat ggcacagcct gtggctcccg ctgcaggggt 2460
gtccttccca gggccggtgg ggccttcttg atggcggggc aggtggctga gcagctgcgg 2520
ggcttcaatg cccagctcca gcggaccagg cagatgatta gggcagccga ggaatctgcc 2580
tcacagattc aatccagtgc ccagcgcttg gagacccagg tgagcgccag ccgctcccag 2640
atggaggaag atgtcagacg cacacggctc ctaatccagc aggtccggga cttcctaaca 2700
gaccccgaca ctgatgcagc cactatccag gaggtcagcg aggccgtgct ggccctgtgg 2760
ctgcccacag actcagctac tgttctgcag aagatgaatg agatccaggc cattgcagcc 2820
aggctcccca acgtggactt ggtgctgtcc cagaccaagc aggacattgc gcgtgcccgc 2880
cggttgcagg ctgaggctga ggaagccagg agccgagccc atgcagtgga gggccaggtg 2940
gaagatgtgg ttgggaacct gcggcagggg acagtggcac tgcaggaagc tcaggacacc 3000
atgcaaggca ccagccgctc ccttcggctt atccaggaca gggttgctga ggttcagcag 3060
gtactgcggc cagcagaaaa gctggtgaca agcatgacca agcagctggg tgacttctgg 3120
acacggatgg aggagctccg ccaccaagcc cggcagcagg gggcagaggc agtccaggcc 3180
cagcagcttg cggaaggtgc cagcgagcag gcattgagtg cccaagaggg atttgagaga 3240
ataaaacaaa agtatgctga gttgaaggac cggttgggtc agagttccat gctgggtgag 3300
cagggtgccc ggatccagag tgtgaagaca gaggcagagg agctgtttgg ggagaccatg 3360
gagatgatgg acaggatgaa agacatggag ttggagctgc tgcggggcag ccaggccatc 3420
atgctgcgct cagcggacct gacaggactg gagaagcgtg tggagcagat ccgtgaccac 3480
atcaatgggc gcgtgctcta ctatgccacc tgcaagtga 3519
<210> 46
<211> 3519
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 46
atgaggccct tcttcctgct gtgctttgcc ctgcctggac tgctgcatgc tcagcaggct 60
tgtagcagag gcgcctgcta tcctcctgtg ggcgatctgc ttgtgggcag aaccagattc 120
ctgcgggcca gctctacatg cggcctgaca aagcctgaga catactgcac ccagtacggc 180
gagtggcaga tgaagtgctg caagtgcgac agcagacagc cccacaacta ctacagccac 240
agagtggaaa acgtggccag cagcagcggc cctatgagat ggtggcagag ccagaacgac 300
gtgaaccccg ttagcctgca gctggacctg gacagacggt ttcagctgca agaagtgatg 360
atggaatttc agggccccat gcctgccggc atgctgatcg agagaagcag cgatttcggc 420
aagacctggc gggtgtacca gtatctggcc gccgattgca ccagcacatt ccccagagtt 480
agacagggca gaccccagag ctggcaggat gttcgttgtc agtctctgcc ccagcggcct 540
aacgctagac tgaatggcgg aaaggtgcag ctcaacctga tggacctggt gtctggcatc 600
cctgccacac agtcccagaa aatccaagaa gtgggcgaga tcaccaacct gagagtgaac 660
ttcacccggc tggctcccgt tcctcagaga ggatatcatc ctcctagcgc ctactacgcc 720
gtgtctcagc ttagactgca gggcagctgc ttctgtcacg gccacgctga tagatgcgcc 780
cctaaacctg gtgcctctgc cggaccttct acagccgtgc aagtgcacga tgtgtgcgtg 840
tgccagcaca ataccgccgg acctaactgc gagagatgtg cccctttcta caacaaccgg 900
ccttggaggc ctgccgaagg acaggatgct cacgagtgcc agagatgcga ctgcaacggc 960
cacagcgaga catgccactt tgaccctgcc gtgtttgccg cttctcaggg cgcttatggc 1020
ggcgtgtgtg acaactgcag agatcacacc gagggcaaga actgcgagcg ctgtcagctg 1080
cactacttcc ggaatagaag gccaggcgcc agcatccaag agacatgcat cagctgcgag 1140
tgcgatcccg atggtgctgt tcctggcgct ccttgtgatc ctgtgacagg ccagtgcgtg 1200
tgtaaagaac acgtgcaggg cgaaagatgc gacctgtgca agcctggctt taccggcctg 1260
acctacgcca atcctcaggg ctgccacaga tgtgattgca acatcctggg cagcagacgg 1320
gacatgccct gtgatgaaga gtctggcaga tgcctgtgcc tgcctaatgt cgtgggcccc 1380
aagtgcgatc agtgtgcccc atatcactgg aagctggcct ctggccaggg atgcgaacct 1440
tgtgcctgcg atccccacaa cagcctgtct ccacagtgca accagttcac cggccagtgt 1500
ccttgcagag aaggctttgg cggcctgatg tgttctgccg ccgctatcag acagtgcccc 1560
gatagaacat atggcgacgt ggccacaggc tgcagagcct gcgattgtga cttccgggga 1620
acagaaggac ccggctgcga taaggccagc ggaagatgtc tgtgtcggcc tggactcaca 1680
ggccccagat gtgaccagtg tcagcggggc tactgcaaca gataccctgt gtgtgtggcc 1740
tgccatcctt gcttccagac ctacgacgcc gacctgagag aacaggccct gagattcggc 1800
agactgagaa atgccaccgc cagcctttgg agcggacctg gccttgaaga tagaggcctg 1860
gcctccagaa tcctggacgc caagtctaag atcgagcaga tcagagccgt gctgtctagc 1920
ccagccgtga ccgaacaaga ggtggcccaa gtggctagcg ccatcctgag cctgagaaga 1980
actctgcagg gactgcagct cgatctgccc ctggaagagg aaacactgag cctgcctaga 2040
gatctggaaa gcctggatcg gagcttcaac ggcctgctga caatgtacca gagaaagaga 2100
gagcagttcg agaagatcag cagcgccgat cctagcggcg ccttcagaat gctgagcaca 2160
gcctatgagc agagcgccca ggctgctcag caagtgtccg atagcagcag actgctggac 2220
cagctgcggg actctagaag agaagccgaa agacttgtgc ggcaggcagg cggcggaggt 2280
ggaacaggat ctcctaaact ggtggccctg cggctggaaa tgtcctctct gcctgatctg 2340
acccctacct tcaacaagct gtgcggcaac agccggcaga tggcctgcac acctattagc 2400
tgtcctggcg agctgtgccc tcaggataat ggaaccgcct gcggctccag atgtagaggc 2460
gttttgccaa gagccggcgg agcctttctg atggctggac aagttgccga gcagctgaga 2520
ggcttcaacg ctcagctgca gcggaccaga cagatgatta gagccgccga ggaaagcgcc 2580
agccagattc aatctagcgc ccagagactg gaaacccagg tgtccgccag cagatcccag 2640
atggaagaag atgtgcggcg gacaagactg ctgatccagc aagtgcggga cttcctgacc 2700
gatcctgata ccgatgccgc cacaatccaa gaggtgtccg aagctgttct ggcactgtgg 2760
ctgcctaccg atagcgctac agtgctgcag aagatgaacg agatccaggc aatcgccgcc 2820
agactgccca atgtggatct ggtgctgagc cagaccaagc aggatatcgc cagagctaga 2880
aggctgcagg ccgaggccga agaggcaaga tctagagccc atgccgtgga aggccaagtc 2940
gaggacgttg tgggcaatct gagacaggga accgtggctc tgcaagaggc ccaggataca 3000
atgcagggca ccagcagaag cctgcgcctg atccaggata gagtggccga agtgcagcag 3060
gtcctgaggc cagccgaaaa gctggtcacc agcatgacca aacagctggg cgatttctgg 3120
acgcgcatgg aagaactgag gcatcaggca agacagcagg gcgctgaagc agtgcaggct 3180
caacaacttg ccgagggcgc ttctgaacag gctctgtctg cccaagaggg cttcgagcgg 3240
atcaagcaga agtacgccga gctgaaggac agactgggcc agagttctat gctgggcgaa 3300
cagggcgcca gaattcagag cgtgaaaaca gaggccgagg aactgttcgg cgagacaatg 3360
gaaatgatgg accggatgaa ggacatggaa ctggaactgc tgaggggcag ccaggccatc 3420
atgctgagaa gtgccgatct gacaggcctg gaaaagagag tggaacagat ccgggaccac 3480
atcaacggcc gggtgctgta ctacgccaca tgcaagtaa 3519
<210> 47
<211> 3582
<212> DNA
<213> 智人(Homo sapiens)
<400> 47
atgcctgcgc tctggctggg ctgctgcctc tgcttctcgc tcctcctgcc cgcagcccgg 60
gccacctcca ggagggaagt ctgtgattgc aatgggaagt ccaggcagtg tatctttgat 120
cgggaacttc acagacaaac tggtaatgga ttccgctgcc tcaactgcaa tgacaacact 180
gatggcattc actgcgagaa gtgcaagaat ggcttttacc ggcacagaga aagggaccgc 240
tgtttgccct gcaattgtaa ctccaaaggt tctcttagtg ctcgatgtga caactccgga 300
cggtgcagct gtaaaccagg tgtgacagga gccagatgcg accgatgtct gccaggcttc 360
cacatgctca cggatgcggg gtgcacccaa gaccagagac tgctagactc caagtgtgac 420
tgtgacccag ctggcatcgc agggccctgt gacgcgggcc gctgtgtctg caagccagct 480
gtcactggag aacgctgtga taggtgtcga tcaggttact ataatctgga tggggggaac 540
cctgagggct gtacccagtg tttctgctat gggcattcag ccagctgccg cagctctgca 600
gaatacagtg tccataagat cacctctacc tttcatcaag atgttgatgg ctggaaggct 660
gtccaacgaa atgggtctcc tgcaaagctc caatggtcac agcgccatca agatgtgttt 720
agctcagccc aacgactaga ccctgtctat tttgtggctc ctgccaaatt tcttgggaat 780
caacaggtga gctatggtca aagcctgtcc tttgactacc gtgtggacag aggaggcaga 840
cacccatctg cccatgatgt gattctggaa ggtgctggtc tacggatcac agctcccttg 900
atgccacttg gcaagacact gccttgtggg ctcaccaaga cttacacatt caggttaaat 960
gagcatccaa gcaataattg gagcccccag ctgagttact ttgagtatcg aaggttactg 1020
cggaatctca cagccctccg catccgagct acatatggag aatacagtac tgggtacatt 1080
gacaatgtga ccctgatttc agcccgccct gtctctggag ccccagcacc ctgggttgaa 1140
cagtgtatat gtcctgttgg gtacaagggg caattctgcc aggattgtgc ttctggctac 1200
aagagagatt cagcgagact ggggcctttt ggcacctgta ttccttgtaa ctgtcaaggg 1260
ggaggggcct gtgatccaga cacaggagat tgttattcag gggatgagaa tcctgacatt 1320
gagtgtgctg actgcccaat tggtttctac aacgatccgc acgacccccg cagctgcaag 1380
ccatgtccct gtcataacgg gttcagctgc tcagtgatgc cggagacgga ggaggtggtg 1440
tgcaataact gccctcccgg ggtcaccggt gcccgctgtg agctctgtgc tgatggctac 1500
tttggggacc cctttggtga acatggccca gtgaggcctt gtcagccctg tcaatgcaac 1560
aacaatgtgg accccagtgc ctctgggaat tgtgaccggc tgacaggcag gtgtttgaag 1620
tgtatccaca acacagccgg catctactgc gaccagtgca aagcaggcta cttcggggac 1680
ccattggctc ccaacccagc agacaagtgt cgagcttgca actgtaaccc catgggctca 1740
gagcctgtag gatgtcgaag tgatggcacc tgtgtttgca agccaggatt tggtggcccc 1800
aactgtgagc atggagcatt cagctgtcca gcttgctata atcaagtgaa gattcagatg 1860
gatcagttta tgcagcagct tcagagaatg gaggccctga tttcaaaggc tcagggtggt 1920
gatggagtag tacctgatac agagctggaa ggcaggatgc agcaggctga gcaggccctt 1980
caggacattc tgagagatgc ccagatttca gaaggtgcta gcagatccct tggtctccag 2040
ttggccaagg tgaggagcca agagaacagc taccagagcc gcctggatga cctcaagatg 2100
actgtggaaa gagttcgggc tctgggaagt cagtaccaga accgagttcg ggatactcac 2160
aggctcatca ctcagatgca gctgagcctg gcagaaagtg aagcttcctt gggaaacact 2220
aacattcctg cctcagacca ctacgtgggg ccaaatggct ttaaaagtct ggctcaggag 2280
gccacaagat tagcagaaag ccacgttgag tcagccagta acatggagca actgacaagg 2340
gaaactgagg actattccaa acaagccctc tcactggtgc gcaaggccct gcatgaagga 2400
gtcggaagcg gaagcggtag cccggacggt gctgtggtgc aagggcttgt ggaaaaattg 2460
gagaaaacca agtccctggc ccagcagttg acaagggagg ccactcaagc ggaaattgaa 2520
gcagataggt cttatcagca cagtctccgc ctcctggatt cagtgtctcg gcttcaggga 2580
gtcagtgatc agtcctttca ggtggaagaa gcaaagagga tcaaacaaaa agcggattca 2640
ctctcaagcc tggtaaccag gcatatggat gagttcaagc gtacacagaa gaatctggga 2700
aactggaaag aagaagcaca gcagctctta cagaatggaa aaagtgggag agagaaatca 2760
gatcagctgc tttcccgtgc caatcttgct aaaagcagag cacaagaagc actgagtatg 2820
ggcaatgcca ctttttatga agttgagagc atccttaaaa acctcagaga gtttgacctg 2880
caggtggaca acagaaaagc agaagctgaa gaagccatga agagactctc ctacatcagc 2940
cagaaggttt cagatgccag tgacaagacc cagcaagcag aaagagccct ggggagcgct 3000
gctgctgatg cacagagggc aaagaatggg gccggggagg ccctggaaat ctccagtgag 3060
attgaacagg agattgggag tctgaacttg gaagccaatg tgacagcaga tggagccttg 3120
gccatggaaa agggactggc ctctctgaag agtgagatga gggaagtgga aggagagctg 3180
gaaaggaagg agctggagtt tgacacgaat atggatgcag tacagatggt gattacagaa 3240
gcccagaagg ttgataccag agccaagaac gctggggtta caatccaaga cacactcaac 3300
acattagacg gcctcctgca tctgatggac cagcctctca gtgtagatga agaggggctg 3360
gtcttactgg agcagaagct ttcccgagcc aagacccaga tcaacagcca actgcggccc 3420
atgatgtcag agctggaaga gagggcacgt cagcagaggg gccacctcca tttgctggag 3480
acaagcatag atgggattct ggctgatgtg aagaacttgg agaacattag ggacaacctg 3540
cccccaggct gctacaatac ccaggctctt gagcaacagt ga 3582
<210> 48
<211> 3582
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 48
atgcctgctc tgtggctggg ctgctgcctg tgttttagtc tgctgctgcc agccgccaga 60
gccacatcta gaagagaagt gtgcgactgc aacggcaaga gccggcagtg catcttcgac 120
agagagctgc acagacagac cggcaacggc ttcagatgcc tgaactgcaa cgacaacacc 180
gacggcatcc actgcgagaa gtgcaagaac ggcttctacc ggcaccgcga gagggataga 240
tgcctgcctt gcaactgcaa ctccaagggc agcctgagcg ccagatgcga caatagcggc 300
agatgtagct gcaagcctgg cgtgacaggc gctagatgcg atagatgtct ccccggcttc 360
cacatgctga ccgatgccgg atgtacccag gaccagagac tgctggacag caagtgcgat 420
tgcgaccctg ccggaattgc cggaccttgt gatgccggaa gatgcgtgtg taaacctgcc 480
gtgaccggcg agagatgtga cagatgtaga agcggctact acaacctgga cggcggcaat 540
cctgaaggct gcacccagtg cttttgctac ggccacagcg ccagctgtag aagcagcgcc 600
gaatactccg tgcacaagat caccagcacc ttccaccagg atgtggacgg atggaaggcc 660
gtgcagagaa atggctctcc tgccaagctg cagtggtccc agagacacca ggacgtgttc 720
agcagcgctc agagactgga ccccgtgtac tttgtggccc ctgccaagtt cctgggcaac 780
cagcaagtgt cttacggcca gagcctgagc ttcgactaca gagtggatag aggcggcaga 840
caccccagcg ctcacgatgt gattcttgaa ggcgccggac tgcggatcac agcccctctt 900
atgcctctgg gcaagaccct gccttgtggc ctgaccaaga cctacacctt ccggctgaat 960
gagcacccca gcaacaactg gtccccacag ctgagctact tcgagtacag acggctgctg 1020
cggaacctga cagccctgag aatcagagcc acctacggcg agtacagcac cggctacatc 1080
gacaacgtga ccctgatcag cgccagacct gtttctggtg ctcctgctcc ttgggtcgag 1140
cagtgtatct gtcccgtggg ctacaagggc cagttctgcc aggattgtgc cagcggctac 1200
aagagagact ctgccagact gggccccttc ggcacatgca tcccttgtaa ttgtcaaggc 1260
ggcggagcct gcgatcccga tacaggcgat tgctacagcg gcgacgagaa ccccgatatc 1320
gagtgcgccg attgtcccat cggcttttac aacgaccctc acgaccccag atcctgcaag 1380
ccatgtcctt gccacaatgg cttcagctgc agcgtgatgc ccgaaaccga agaggtcgtg 1440
tgcaacaatt gcccaccagg cgttacaggg gccagatgtg aactgtgtgc cgacggctac 1500
ttcggcgatc cttttggaga acacggaccc gtgcgacctt gccagccttg tcagtgcaac 1560
aacaacgtgg acccaagcgc cagcggcaac tgcgatagac tgacaggcag atgtctgaag 1620
tgcatccaca ataccgccgg gatctactgt gaccagtgca aggccggcta ttttggcgac 1680
cctctggctc ccaatcctgc cgataagtgc agagcctgca actgtaaccc tatgggctct 1740
gagcctgtgg gctgcagatc tgatggaacc tgcgtgtgca agccaggctt tggcggacct 1800
aattgtgaac acggcgcctt tagctgcccc gcctgctaca atcaagtgaa gatccagatg 1860
gaccagttca tgcagcagct gcagaggatg gaagccctga tctctaaagc ccaaggcgga 1920
gatggcgtgg tgcctgatac agagctggaa ggcagaatgc agcaggccga acaggccctg 1980
caggacattc tgagagatgc ccagattagc gagggcgcct ctagaagtct gggactgcag 2040
ctggctaaag tgcggagcca agagaacagc taccagagca gactggacga cctgaagatg 2100
accgtggaaa gagtcagagc cctgggcagc cagtaccaga acagagtgcg ggatacccac 2160
cggctgatca cccagatgca actgtctctg gccgagagcg aagccagcct gggcaatacc 2220
aatattcccg ccagcgacca ctacgtgggc cccaacggtt ttaagagcct ggctcaagag 2280
gccaccagac tggccgaaag ccatgtggaa agcgcctcca acatggaaca gctgacccgg 2340
gaaaccgagg actactctaa gcaggccctg agcctcgtca gaaaagccct gcatgaaggc 2400
gtcggcagcg gctctggatc tcctgatggt gctgtggtgc agggactcgt ggaaaagctg 2460
gaaaagacca aatctctggc ccagcagctg accagagaag ccacacaggc cgagatcgag 2520
gccgacagaa gctaccagca ctcactgagg ctgctggact ccgtgtctag actgcagggc 2580
gtgtccgacc agagcttcca ggtggaagag gccaagcgga tcaagcagaa ggccgatagc 2640
ctgagcagcc tggtcaccag acacatggac gagttcaagc ggacccagaa gaacctcggc 2700
aactggaaag aggaagccca gcaactgctg cagaacggca agtctggaag agagaagtct 2760
gaccagctgc tgagcagagc caacctggcc aagtctagag cccaagaggc cctgtctatg 2820
ggcaacgcca ccttctacga ggtggaatcc atcctgaaga acctgcgcga gttcgacctg 2880
caagtggaca acagaaaggc cgaggccgag gaagccatga agagactgag ctacatcagc 2940
cagaaagtgt ccgacgcctc cgacaagaca cagcaggcag aaagagcact gggatctgcc 3000
gcagccgatg ctcagagagc taaaaacggc gctggcgagg ccctggaaat cagctctgag 3060
atcgagcaag agatcggctc cctgaatctg gaagccaatg tgacagccga tggcgccctg 3120
gccatggaaa aaggactggc ctctctgaag tccgagatga gagaggtgga aggcgagctg 3180
gaacggaaag aactggaatt cgacaccaat atggacgctg tgcagatggt catcacagag 3240
gcccagaagg tggacaccag agccaaaaat gccggcgtga ccatccagga caccctgaat 3300
actctggacg gactgctgca cctgatggat cagcctctga gcgtggacga ggaaggactg 3360
gttctgctgg aacagaagct gagccgggcc aagactcaga tcaacagcca gctgaggccc 3420
atgatgagcg aactggaaga acgggccaga cagcagaggg gccatctgca tctgctcgaa 3480
accagcatcg atggcatcct ggccgacgtg aagaatctcg agaacatccg ggacaacctg 3540
ccacctggct gctacaacac acaggcactg gaacagcagt ga 3582
<210> 49
<211> 3891
<212> DNA
<213> 肉毒梭菌(Clostridium botulinum)
<400> 49
atgccatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct 60
tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat 120
aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat 180
ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca 240
gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca 300
actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga 360
agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca 420
gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt 480
atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat 540
ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt 600
gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca 660
ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat 720
agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt 780
gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac 840
gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct 900
aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa 960
tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag 1020
ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta 1080
cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct 1140
aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac 1200
tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact 1260
ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa 1320
tcattagata aaggatacaa taaggcatta aatgatttat gtatcaaagt taataattgg 1380
gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa 1440
attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa 1500
caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt 1560
tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga 1620
aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa 1680
catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt 1740
cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca 1800
gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa 1860
gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct 1920
ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga 1980
gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca 2040
cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt 2100
aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag 2160
gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca 2220
gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat 2280
aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct 2340
atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg 2400
atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta 2460
aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa 2520
gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa 2580
agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat 2640
ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt 2700
ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa 2760
agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat 2820
tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat 2880
gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat 2940
ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa 3000
tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact 3060
aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca 3120
atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt 3180
agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat 3240
gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtatttt aaaagacttt 3300
tggggtgatt atttacaata tgataaacca tactatatgt taaatttata tgatccaaat 3360
aaatatgtcg atgtaaataa tgtaggtatt agaggttata tgtatcttaa agggcctaga 3420
ggtagcgtaa tgactacaaa catttattta aattcaagtt tgtatagggg gacaaaattt 3480
attataaaaa aatatgcttc tggaaataaa gataatattg ttagaaataa tgatcgtgta 3540
tatattaatg tagtagttaa aaataaagaa tataggttag ctactaatgc atcacaggca 3600
ggcgtagaaa aaatactaag tgcattagaa atacctgatg taggaaatct aagtcaagta 3660
gtagtaatga agtcaaaaaa tgatcaagga ataacaaata aatgcaaaat gaatttacaa 3720
gataataatg ggaatgatat aggctttata ggatttcatc agtttaataa tatagctaaa 3780
ctagtagcaa gtaattggta taatagacaa atagaaagat ctagtaggac tttgggttgc 3840
tcatgggaat ttattcctgt agatgatgga tggggagaaa ggccactgta a 3891
<210> 50
<211> 3891
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 50
atgcccttcg tgaacaagca gttcaactac aaggaccccg tgaacggcgt ggacattgcc 60
tacatcaaga tccccaacgc cggccagatg cagcccgtga aggcctttaa gatccacaac 120
aagatctggg tcatccccga gcgggacacc ttcacaaatc ccgaggaagg cgacctgaat 180
cctccacctg aagccaaaca ggtgcccgtg tcctactacg acagcaccta cctgagcacc 240
gacaacgaga aggacaacta cctgaagggc gtgaccaagc tgttcgagcg gatctacagc 300
accgatctgg gcagaatgct gctgacctct atcgtgcggg gcatcccatt ttggggcggc 360
agcacaatcg acaccgagct gaaagtgatc gacaccaact gcatcaacgt gatccagcct 420
gacggcagct acagaagcga ggaactgaac ctggtcatca tcggccccag cgccgacatc 480
atccagttcg agtgcaagag cttcggccac gaggtgctga acctgaccag aaatggctac 540
ggcagcaccc agtacatccg gttcagcccc gatttcacct tcggcttcga ggaatccctg 600
gaagtggaca ccaatcctct gctcggagcc ggcaagtttg ccaccgatcc tgctgtgaca 660
ctggcccacg aactgattca cgccggacac agactgtacg gaatcgccat caatcccaac 720
cgggtgttca aagtgaacac caacgcctac tatgagatga gcggactgga agtgtccttt 780
gaggaactgc ggaccttcgg cggacacgac gccaagttta tcgacagcct gcaagagaac 840
gagttccggc tgtactacta caacaagttc aaggatatcg ccagcacgct gaacaaggcc 900
aagagcatcg tgggcacaac agccagcctg cagtacatga agaacgtttt caaagagaag 960
tacctgctga gcgaggacac cagcggcaag ttctccgtgg acaagctgaa gttcgacaag 1020
ctgtacaaga tgctgaccga gatctacacc gaggacaact tcgtgaagtt cttcaaggtg 1080
ctcaaccgca agacctacct caacttcgac aaggccgtgt tcaagatcaa catcgtgccc 1140
aaagtcaact acaccatcta cgacggcttc aacctgcgca acaccaacct ggccgccaac 1200
ttcaacggcc agaacaccga gatcaacaac atgaacttca ccaagctgaa aaacttcacc 1260
ggcctgttcg agttctataa gctgctgtgc gtgcgcggca tcatcaccag caagaccaag 1320
agcctggaca agggctataa caaggccctg aacgacctgt gcatcaaagt taacaactgg 1380
gacctgttct tcagccccag cgaggataat ttcaccaacg acctgaacaa aggcgaggaa 1440
atcaccagcg acaccaatat cgaggccgcc gaggaaaaca tcagcctgga cctgatccag 1500
cagtactacc tgaccttcaa tttcgataac gagcccgaga acatcagcat cgagaacctg 1560
agcagcgata tcatcggaca gctggaactg atgcccaaca tcgagagatt ccccaacggc 1620
aagaagtacg agctggacaa gtacaccatg ttccactacc tgcgggccca agagttcgag 1680
cacggcaagt ctagaatcgc cctgaccaac agcgtgaacg aggccctgct gaaccccagc 1740
agagtgtaca ccttcttcag cagcgactac gtgaagaaag tcaacaaggc tacagaggcc 1800
gccatgttcc tcggctgggt tgagcagctg gtgtacgact tcaccgacga gacaagcgag 1860
gtgtccacca ccgacaagat cgccgatatc accatcatca tcccttacat cggccctgct 1920
ctgaacatcg gcaacatgct gtataaggac gatttcgtgg gcgccctgat cttctctggc 1980
gccgtgattc tgctcgagtt catccctgag atcgctatcc ccgtgctggg cacatttgct 2040
ctggtgtctt atatcgccaa caaggtgctg acagtgcaga ccatcgacaa cgccctgagc 2100
aagcggaacg agaagtggga cgaagtgtac aagtacatcg tgaccaactg gctggccaaa 2160
gtgaataccc agatcgacct gattcggaag aagatgaagg aagccctcga gaaccaggcc 2220
gaggccacaa aggccatcat caactaccag tacaatcagt acacagagga agagaagaac 2280
aacatcaatt tcaacatcga cgacctgtcc tccaagctca acgagagcat caacaaagcc 2340
atgatcaata tcaacaagtt tctgaaccag tgcagcgtca gctacctgat gaacagcatg 2400
atcccctacg gcgtgaagcg gctggaagat ttcgatgcca gcctgaagga cgctctgctg 2460
aagtacatct acgataaccg gggcaccctg atcggccagg tggacagact gaaggacaaa 2520
gtgaacaata ccctgtccac cgacattccg tttcagctga gcaaatacgt ggacaaccag 2580
agactgctga gcacattcac cgagtatatc aagaatatca tcaacacctc catcctgaac 2640
ctccgctacg agagcaacca cctgatcgat ctgagcagat acgccagcaa gatcaatatt 2700
ggctctaaag tgaacttcga cccgatcgac aagaaccaga tccagctgtt caatctcgag 2760
tctagcaaga tcgaagtgat cctgaagaac gccatcgtgt acaactctat gtacgagaac 2820
ttctccacca gcttttggat cagaatcccc aagtacttca acagcatctc cctgaacaac 2880
gagtacacga tcatcaattg catggaaaac aactccggct ggaaagtgtc cctgaactac 2940
ggcgagatca tctggacact gcaggacacc caagagatca agcagagagt ggtgttcaag 3000
tactctcaga tgatcaacat tagcgactac atcaaccggt ggatcttcgt gaccatcacc 3060
aacaaccggc tgaacaactc caagatctac atcaatggcc ggctcatcga ccagaagcct 3120
atcagcaacc tgggaaacat ccacgcctcc aacaatatca tgttcaagct ggacggctgc 3180
cgggacaccc accggtatat ctggatcaag tactttaacc tgttcgacaa agagctgaac 3240
gagaaagaga ttaaggacct gtacgacaac cagtccaaca gcggcatcct gaaggatttc 3300
tggggcgact acctgcagta tgacaagccc tactacatgc tgaatctgta cgaccccaac 3360
aaatatgtgg acgtgaacaa cgtggggatc agaggctaca tgtacctgaa aggccccaga 3420
ggcagcgtga tgaccaccaa catctacctg aactccagcc tgtacagagg caccaagttc 3480
atcatcaaga agtatgcctc cggcaacaag gacaacattg tgcggaacaa cgaccgggtg 3540
tacattaacg tggtggtcaa gaacaaagag taccggctgg ccaccaatgc ctctcaggca 3600
ggcgtggaaa agatcctgag cgccctggaa atccccgacg tgggcaatct gtctcaggtg 3660
gtcgtgatga agtccaagaa cgaccagggc atcacaaaca agtgcaagat gaacctccag 3720
gacaacaacg gcaacgacat cggctttatc ggcttccacc agtttaacaa cattgccaag 3780
ctggtcgcca gcaactggta caaccggcag atcgagagaa gcagcagaac cctgggctgc 3840
agctgggagt ttatccctgt ggatgatggc tggggcgaaa gacccctgta a 3891
<210> 51
<211> 3876
<212> DNA
<213> 肉毒梭菌(Clostridium botulinum)
<400> 51
atgccagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt 60
atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca 120
gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat 180
aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat 240
actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa 300
tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga 360
gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa 420
ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata 480
tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat 540
tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta 600
agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat 660
ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat 720
ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct 780
acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata 840
actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt 900
gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat 960
aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata 1020
gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat 1080
atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca 1140
gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata 1200
tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct 1260
tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtgtt 1320
aaagctccag gaatatgtat tgatgttgat aatgaagatt tgttctttat agctgataaa 1380
aatagttttt cagatgattt atctaaaaac gaaagaatag aatataatac acagagtaat 1440
tatatagaaa atgacttccc tataaatgaa ttaattttag atactgattt aataagtaaa 1500
atagaattac caagtgaaaa tacagaatca cttactgatt ttaatgtaga tgttccagta 1560
tatgaaaaac aacccgctat aaaaaaaatt tttacagatg aaaataccat ctttcaatat 1620
ttatactctc agacatttcc tctagatata agagatataa gtttaacatc ttcatttgat 1680
gatgcattat tattttctaa caaagtttat tcattttttt ctatggatta tattaaaact 1740
gctaataaag tggtagaagc aggattattt gcaggttggg tgaaacagat agtaaatgat 1800
tttgtaatcg aagctaataa aagcaatact atggataaaa ttgcagatat atctctaatt 1860
gttccttata taggattagc tttaaatgta ggaaatgaaa cagctaaagg aaattttgaa 1920
aatgcttttg agattgcagg agccagtatt ctactagaat ttataccaga acttttaata 1980
cctgtagttg gagccttttt attagaatca tatattgaca ataaaaataa aattattaaa 2040
acaatagata atgctttaac taaaagaaat gaaaaatgga gtgatatgta cggattaata 2100
gtagcgcaat ggctctcaac agttaatact caattttata caataaaaga gggaatgtat 2160
aaggctttaa attatcaagc acaagcattg gaagaaataa taaaatacag atataatata 2220
tattctgaaa aagaaaagtc aaatattaac atcgatttta atgatataaa ttctaaactt 2280
aatgagggta ttaaccaagc tatagataat ataaataatt ttataaatgg atgttctgta 2340
tcatatttaa tgaaaaaaat gattccatta gctgtagaaa aattactaga ctttgataat 2400
actctcaaaa aaaatttgtt aaattatata gatgaaaata aattatattt gattggaagt 2460
gcagaatatg aaaaatcaaa agtaaataaa tacttgaaaa ccattatgcc gtttgatctt 2520
tcaatatata ccaatgatac aatactaata gaaatgttta ataaatataa tagcgaaatt 2580
ttaaataata ttatcttaaa tttaagatat aaggataata atttaataga tttatcagga 2640
tatggggcaa aggtagaggt atatgatgga gtcgagctta atgataaaaa tcaatttaaa 2700
ttaactagtt cagcaaatag taagattaga gtgactcaaa atcagaatat catatttaat 2760
agtgtgttcc ttgattttag cgttagcttt tggataagaa tacctaaata taagaatgat 2820
ggtatacaaa attatattca taatgaatat acaataatta attgtatgaa aaataattcg 2880
ggctggaaaa tatctattag gggtaatagg ataatatgga ctttaattga tataaatgga 2940
aaaaccaaat cggtattttt tgaatataac ataagagaag atatatcaga gtatataaat 3000
agatggtttt ttgtaactat tactaataat ttgaataacg ctaaaattta tattaatggt 3060
aagctagaat caaatacaga tattaaagat ataagagaag ttattgctaa tggtgaaata 3120
atatttaaat tagatggtga tatagataga acacaattta tttggatgaa atatttcagt 3180
atttttaata cggaattaag tcaatcaaat attgaagaaa gatataaaat tcaatcatat 3240
agcgaatatt taaaagattt ttggggaaat cctttaatgt acaataaaga atattatatg 3300
tttaatgcgg ggaataaaaa ttcatatatt aaactaaaga aagattcacc tgtaggtgaa 3360
attttaacac gtagcaaata taatcaaaat tctaaatata taaattatag agatttatat 3420
attggagaaa aatttattat aagaagaaag tcaaattctc aatctataaa tgatgatata 3480
gttagaaaag aagattatat atatctagat ttttttaatt taaatcaaga gtggagagta 3540
tatacctata aatattttaa gaaagaggaa gaaaaattgt ttttagctcc tataagtgat 3600
tctgatgagt tttacaatac tatacaaata aaagaatatg atgaacagcc aacatatagt 3660
tgtcagttgc tttttaaaaa agatgaagaa agtactgatg agataggatt gattggtatt 3720
catcgtttct acgaatctgg aattgtattt gaagagtata aagattattt ttgtataagt 3780
aaatggtact taaaagaggt aaaaaggaaa ccatataatt taaaattggg atgtaattgg 3840
cagtttattc ctaaagatga agggtggact gaataa 3876
<210> 52
<211> 3876
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成构建体
<400> 52
atgcccgtga ccatcaacaa cttcaactac aacgacccca tcgacaacaa caacatcatt 60
atgatggaac cgcctttcgc cagaggcaca ggccggtact acaaggcctt caagatcacc 120
gaccggatct ggatcatccc cgagagatac accttcggct acaagcccga ggacttcaac 180
aagagcagcg gcatcttcaa ccgggacgtg tgcgagtact acgaccccga ctacctgaac 240
accaacgaca agaagaacat cttcctgcag accatgatca agctgttcaa ccggatcaag 300
agcaagcccc tgggcgagaa gctgctggaa atgatcatca acggcatccc ttacctgggc 360
gacagaagag tgcccctgga agagttcaac accaatatcg ccagcgtgac cgtgaacaag 420
ctgatctcta accccggcga ggtggaacgg aagaagggca tcttcgccaa cctgatcatc 480
ttcggccctg gacctgtgct gaacgagaac gagacaatcg acatcggcat ccagaaccac 540
ttcgccagca gagaaggctt cggcggcatc atgcagatga agttctgccc cgagtacgtg 600
tccgtgttca acaacgtgca agagaacaag ggcgccagca tctttaacag acggggctac 660
ttcagcgacc ccgctctgat tctgatgcac gagctgatcc acgtgctgca cggcctgtat 720
ggcatcaagg tggacgacct gcctatcgtg cccaacgaga agaaattctt catgcagtcc 780
accgacgcca tccaggccga ggaactgtac acatttggcg gacaggaccc cagcatcatc 840
acccctagca ccgacaagag catctacgac aaggtgctgc agaatttccg gggcatcgtg 900
gaccggctga acaaagtgct cgtgtgcatc agcgatccca acatcaatat caacatctac 960
aagaacaagt tcaaggataa gtacaagttc gtcgaggaca gcgagggcaa gtacagcatc 1020
gacgtggaaa gcttcgacaa gctgtacaag agcctgatgt tcggcttcac cgagacaaat 1080
atcgccgaga actacaagat caagacccgg gccagctact tctccgactc tctgcctcct 1140
gtgaagatta agaacctgct ggacaacgag atctacacca tcgaggaagg cttcaacatc 1200
agcgacaagg acatggaaaa agagtaccgg ggccagaaca aggccattaa caagcaggcc 1260
tacgaggaaa tcagcaaaga acacctggcc gtgtacaaga ttcagatgtg caagagcgtg 1320
aaggcccctg gcatctgcat tgacgtggac aatgaggacc tgttctttat cgccgacaag 1380
aacagcttta gcgacgacct gagcaagaac gagcggatcg agtacaacac ccagagcaac 1440
tacatcgaga acgacttccc catcaacgaa ctgatcctgg acaccgacct gatcagcaag 1500
atcgagctgc ccagcgagaa caccgagagc ctgaccgact tcaatgtgga cgtgcccgtg 1560
tacgagaagc agcccgccat caagaagatc tttaccgacg agaataccat cttccagtac 1620
ctgtacagcc agacctttcc tctggacatc cgggacatca gcctgacctc cagcttcgat 1680
gatgccctgc tgttcagcaa caaggtctac agcttcttca gcatggacta catcaagacc 1740
gccaacaagg tggtggaagc cggcctgttt gccggctggg ttaagcagat cgtgaacgat 1800
ttcgtgatcg aggccaacaa gtccaacacc atggacaaga tcgccgatat ctccctgatc 1860
gtgccctaca tcggactggc cctgaacgtg ggaaacgaga cagccaaggg caacttcgag 1920
aatgccttcg agattgccgg cgctagcatc ctgctcgagt tcatccctga gctgctgatc 1980
cctgtcgtgg gcgcttttct gctggaatcc tacatcgata acaaaaacaa gatcatcaag 2040
acgatcgaca acgccctgac caagcggaac gagaagtgga gcgatatgta cggactgatc 2100
gtggcccagt ggctgagcac cgtgaatacc cagttttaca ccatcaaaga agggatgtac 2160
aaggccctga attaccaggc tcaggctctg gaagagatca ttaagtaccg ctacaatatc 2220
tacagcgaga aagagaagtc taacatcaac atcgacttca acgacatcaa cagcaagctc 2280
aacgagggca tcaaccaggc cattgacaac attaacaact ttatcaacgg ctgcagcgtg 2340
tcctacctga tgaagaagat gattcctctg gccgtggaaa agctgctcga cttcgacaat 2400
accctgaaga agaacctcct gaactacatt gacgagaaca agctctacct gatcggcagc 2460
gccgagtacg agaaaagcaa agtgaacaag tacctcaaga ccatcatgcc cttcgacctg 2520
tccatctaca caaacgacac catcctgatc gagatgttta acaagtacaa cagcgagatc 2580
ctgaacaata tcatcctgaa cctgcggtac aaggacaaca atctgatcga tctgagcggc 2640
tacggcgcca aggtggaagt gtatgatggc gtggaactga acgataagaa tcagttcaag 2700
ctgaccagca gcgccaactc caagatcaga gtgacccaga accagaacat tatcttcaac 2760
agcgtgttcc tggacttctc cgtgtccttc tggatcagaa tccccaagta caagaacgac 2820
ggcattcaga actacatcca caacgagtac acaatcatca actgtatgaa gaacaacagc 2880
ggctggaaga tcagcatccg gggcaacaga atcatctgga ccctgatcga catcaatggc 2940
aagacaaaga gcgtgttctt cgagtataac atccgcgagg acatctccga gtacatcaac 3000
cggtggttct tcgtgacaat caccaacaac ctgaacaacg ccaagatcta catcaacggg 3060
aagctcgaga gcaacaccga catcaaggat atccgggaag tgatcgccaa cggcgagatc 3120
atctttaagc tggacggcga catcgaccgg acacagttca tctggatgaa gtacttttcc 3180
atcttcaata ccgagctgag ccagagcaat atcgaagaga ggtacaagat ccagtcttac 3240
agcgagtacc tgaaggactt ctggggcaac cctctgatgt acaacaaaga atattacatg 3300
ttcaacgccg gcaacaagaa ctcttacatc aagctgaaga aagacagccc cgtgggagaa 3360
atcctgacca ggtctaagta caaccagaac tccaagtata tcaactaccg ggacctgtac 3420
atcggcgaga agttcatcat ccggcgcaag agcaacagcc agtccatcaa tgacgacatc 3480
gtgcggaaag aggactatat ctacctcgac ttcttcaacc tcaatcaaga gtggcgcgtg 3540
tacacctaca agtactttaa gaaagaggaa gagaagctgt tcctggctcc tatcagcgac 3600
tccgacgagt tctacaatac catccagatc aaagagtacg acgagcagcc cacctacagc 3660
tgccagctgc tgtttaagaa ggacgaggaa tccaccgatg agatcggcct gattggcatc 3720
caccggttct acgagagcgg catcgtgttc gaagagtaca aggattactt ctgcatcagc 3780
aagtggtatc tgaaagaagt gaagcggaag ccctacaatc tgaagctggg ctgcaactgg 3840
cagtttatcc ccaaggacga aggctggacc gagtga 3876
<210> 53
<211> 2477
<212> PRT
<213> 智人(Homo sapiens)
<400> 53
Met Leu Arg Gly Pro Gly Pro Gly Leu Leu Leu Leu Ala Val Gln Cys
1 5 10 15
Leu Gly Thr Ala Val Pro Ser Thr Gly Ala Ser Lys Ser Lys Arg Gln
20 25 30
Ala Gln Gln Met Val Gln Pro Gln Ser Pro Val Ala Val Ser Gln Ser
35 40 45
Lys Pro Gly Cys Tyr Asp Asn Gly Lys His Tyr Gln Ile Asn Gln Gln
50 55 60
Trp Glu Arg Thr Tyr Leu Gly Asn Ala Leu Val Cys Thr Cys Tyr Gly
65 70 75 80
Gly Ser Arg Gly Phe Asn Cys Glu Ser Lys Pro Glu Ala Glu Glu Thr
85 90 95
Cys Phe Asp Lys Tyr Thr Gly Asn Thr Tyr Arg Val Gly Asp Thr Tyr
100 105 110
Glu Arg Pro Lys Asp Ser Met Ile Trp Asp Cys Thr Cys Ile Gly Ala
115 120 125
Gly Arg Gly Arg Ile Ser Cys Thr Ile Ala Asn Arg Cys His Glu Gly
130 135 140
Gly Gln Ser Tyr Lys Ile Gly Asp Thr Trp Arg Arg Pro His Glu Thr
145 150 155 160
Gly Gly Tyr Met Leu Glu Cys Val Cys Leu Gly Asn Gly Lys Gly Glu
165 170 175
Trp Thr Cys Lys Pro Ile Ala Glu Lys Cys Phe Asp His Ala Ala Gly
180 185 190
Thr Ser Tyr Val Val Gly Glu Thr Trp Glu Lys Pro Tyr Gln Gly Trp
195 200 205
Met Met Val Asp Cys Thr Cys Leu Gly Glu Gly Ser Gly Arg Ile Thr
210 215 220
Cys Thr Ser Arg Asn Arg Cys Asn Asp Gln Asp Thr Arg Thr Ser Tyr
225 230 235 240
Arg Ile Gly Asp Thr Trp Ser Lys Lys Asp Asn Arg Gly Asn Leu Leu
245 250 255
Gln Cys Ile Cys Thr Gly Asn Gly Arg Gly Glu Trp Lys Cys Glu Arg
260 265 270
His Thr Ser Val Gln Thr Thr Ser Ser Gly Ser Gly Pro Phe Thr Asp
275 280 285
Val Arg Ala Ala Val Tyr Gln Pro Gln Pro His Pro Gln Pro Pro Pro
290 295 300
Tyr Gly His Cys Val Thr Asp Ser Gly Val Val Tyr Ser Val Gly Met
305 310 315 320
Gln Trp Leu Lys Thr Gln Gly Asn Lys Gln Met Leu Cys Thr Cys Leu
325 330 335
Gly Asn Gly Val Ser Cys Gln Glu Thr Ala Val Thr Gln Thr Tyr Gly
340 345 350
Gly Asn Ser Asn Gly Glu Pro Cys Val Leu Pro Phe Thr Tyr Asn Gly
355 360 365
Arg Thr Phe Tyr Ser Cys Thr Thr Glu Gly Arg Gln Asp Gly His Leu
370 375 380
Trp Cys Ser Thr Thr Ser Asn Tyr Glu Gln Asp Gln Lys Tyr Ser Phe
385 390 395 400
Cys Thr Asp His Thr Val Leu Val Gln Thr Arg Gly Gly Asn Ser Asn
405 410 415
Gly Ala Leu Cys His Phe Pro Phe Leu Tyr Asn Asn His Asn Tyr Thr
420 425 430
Asp Cys Thr Ser Glu Gly Arg Arg Asp Asn Met Lys Trp Cys Gly Thr
435 440 445
Thr Gln Asn Tyr Asp Ala Asp Gln Lys Phe Gly Phe Cys Pro Met Ala
450 455 460
Ala His Glu Glu Ile Cys Thr Thr Asn Glu Gly Val Met Tyr Arg Ile
465 470 475 480
Gly Asp Gln Trp Asp Lys Gln His Asp Met Gly His Met Met Arg Cys
485 490 495
Thr Cys Val Gly Asn Gly Arg Gly Glu Trp Thr Cys Ile Ala Tyr Ser
500 505 510
Gln Leu Arg Asp Gln Cys Ile Val Asp Asp Ile Thr Tyr Asn Val Asn
515 520 525
Asp Thr Phe His Lys Arg His Glu Glu Gly His Met Leu Asn Cys Thr
530 535 540
Cys Phe Gly Gln Gly Arg Gly Arg Trp Lys Cys Asp Pro Val Asp Gln
545 550 555 560
Cys Gln Asp Ser Glu Thr Gly Thr Phe Tyr Gln Ile Gly Asp Ser Trp
565 570 575
Glu Lys Tyr Val His Gly Val Arg Tyr Gln Cys Tyr Cys Tyr Gly Arg
580 585 590
Gly Ile Gly Glu Trp His Cys Gln Pro Leu Gln Thr Tyr Pro Ser Ser
595 600 605
Ser Gly Pro Val Glu Val Phe Ile Thr Glu Thr Pro Ser Gln Pro Asn
610 615 620
Ser His Pro Ile Gln Trp Asn Ala Pro Gln Pro Ser His Ile Ser Lys
625 630 635 640
Tyr Ile Leu Arg Trp Arg Pro Lys Asn Ser Val Gly Arg Trp Lys Glu
645 650 655
Ala Thr Ile Pro Gly His Leu Asn Ser Tyr Thr Ile Lys Gly Leu Lys
660 665 670
Pro Gly Val Val Tyr Glu Gly Gln Leu Ile Ser Ile Gln Gln Tyr Gly
675 680 685
His Gln Glu Val Thr Arg Phe Asp Phe Thr Thr Thr Ser Thr Ser Thr
690 695 700
Pro Val Thr Ser Asn Thr Val Thr Gly Glu Thr Thr Pro Phe Ser Pro
705 710 715 720
Leu Val Ala Thr Ser Glu Ser Val Thr Glu Ile Thr Ala Ser Ser Phe
725 730 735
Val Val Ser Trp Val Ser Ala Ser Asp Thr Val Ser Gly Phe Arg Val
740 745 750
Glu Tyr Glu Leu Ser Glu Glu Gly Asp Glu Pro Gln Tyr Leu Asp Leu
755 760 765
Pro Ser Thr Ala Thr Ser Val Asn Ile Pro Asp Leu Leu Pro Gly Arg
770 775 780
Lys Tyr Ile Val Asn Val Tyr Gln Ile Ser Glu Asp Gly Glu Gln Ser
785 790 795 800
Leu Ile Leu Ser Thr Ser Gln Thr Thr Ala Pro Asp Ala Pro Pro Asp
805 810 815
Pro Thr Val Asp Gln Val Asp Asp Thr Ser Ile Val Val Arg Trp Ser
820 825 830
Arg Pro Gln Ala Pro Ile Thr Gly Tyr Arg Ile Val Tyr Ser Pro Ser
835 840 845
Val Glu Gly Ser Ser Thr Glu Leu Asn Leu Pro Glu Thr Ala Asn Ser
850 855 860
Val Thr Leu Ser Asp Leu Gln Pro Gly Val Gln Tyr Asn Ile Thr Ile
865 870 875 880
Tyr Ala Val Glu Glu Asn Gln Glu Ser Thr Pro Val Val Ile Gln Gln
885 890 895
Glu Thr Thr Gly Thr Pro Arg Ser Asp Thr Val Pro Ser Pro Arg Asp
900 905 910
Leu Gln Phe Val Glu Val Thr Asp Val Lys Val Thr Ile Met Trp Thr
915 920 925
Pro Pro Glu Ser Ala Val Thr Gly Tyr Arg Val Asp Val Ile Pro Val
930 935 940
Asn Leu Pro Gly Glu His Gly Gln Arg Leu Pro Ile Ser Arg Asn Thr
945 950 955 960
Phe Ala Glu Val Thr Gly Leu Ser Pro Gly Val Thr Tyr Tyr Phe Lys
965 970 975
Val Phe Ala Val Ser His Gly Arg Glu Ser Lys Pro Leu Thr Ala Gln
980 985 990
Gln Thr Thr Lys Leu Asp Ala Pro Thr Asn Leu Gln Phe Val Asn Glu
995 1000 1005
Thr Asp Ser Thr Val Leu Val Arg Trp Thr Pro Pro Arg Ala Gln Ile
1010 1015 1020
Thr Gly Tyr Arg Leu Thr Val Gly Leu Thr Arg Arg Gly Gln Pro Arg
1025 1030 1035 1040
Gln Tyr Asn Val Gly Pro Ser Val Ser Lys Tyr Pro Leu Arg Asn Leu
1045 1050 1055
Gln Pro Ala Ser Glu Tyr Thr Val Ser Leu Val Ala Ile Lys Gly Asn
1060 1065 1070
Gln Glu Ser Pro Lys Ala Thr Gly Val Phe Thr Thr Leu Gln Pro Gly
1075 1080 1085
Ser Ser Ile Pro Pro Tyr Asn Thr Glu Val Thr Glu Thr Thr Ile Val
1090 1095 1100
Ile Thr Trp Thr Pro Ala Pro Arg Ile Gly Phe Lys Leu Gly Val Arg
1105 1110 1115 1120
Pro Ser Gln Gly Gly Glu Ala Pro Arg Glu Val Thr Ser Asp Ser Gly
1125 1130 1135
Ser Ile Val Val Ser Gly Leu Thr Pro Gly Val Glu Tyr Val Tyr Thr
1140 1145 1150
Ile Gln Val Leu Arg Asp Gly Gln Glu Arg Asp Ala Pro Ile Val Asn
1155 1160 1165
Lys Val Val Thr Pro Leu Ser Pro Pro Thr Asn Leu His Leu Glu Ala
1170 1175 1180
Asn Pro Asp Thr Gly Val Leu Thr Val Ser Trp Glu Arg Ser Thr Thr
1185 1190 1195 1200
Pro Asp Ile Thr Gly Tyr Arg Ile Thr Thr Thr Pro Thr Asn Gly Gln
1205 1210 1215
Gln Gly Asn Ser Leu Glu Glu Val Val His Ala Asp Gln Ser Ser Cys
1220 1225 1230
Thr Phe Asp Asn Leu Ser Pro Gly Leu Glu Tyr Asn Val Ser Val Tyr
1235 1240 1245
Thr Val Lys Asp Asp Lys Glu Ser Val Pro Ile Ser Asp Thr Ile Ile
1250 1255 1260
Pro Glu Val Pro Gln Leu Thr Asp Leu Ser Phe Val Asp Ile Thr Asp
1265 1270 1275 1280
Ser Ser Ile Gly Leu Arg Trp Thr Pro Leu Asn Ser Ser Thr Ile Ile
1285 1290 1295
Gly Tyr Arg Ile Thr Val Val Ala Ala Gly Glu Gly Ile Pro Ile Phe
1300 1305 1310
Glu Asp Phe Val Asp Ser Ser Val Gly Tyr Tyr Thr Val Thr Gly Leu
1315 1320 1325
Glu Pro Gly Ile Asp Tyr Asp Ile Ser Val Ile Thr Leu Ile Asn Gly
1330 1335 1340
Gly Glu Ser Ala Pro Thr Thr Leu Thr Gln Gln Thr Ala Val Pro Pro
1345 1350 1355 1360
Pro Thr Asp Leu Arg Phe Thr Asn Ile Gly Pro Asp Thr Met Arg Val
1365 1370 1375
Thr Trp Ala Pro Pro Pro Ser Ile Asp Leu Thr Asn Phe Leu Val Arg
1380 1385 1390
Tyr Ser Pro Val Lys Asn Glu Glu Asp Val Ala Glu Leu Ser Ile Ser
1395 1400 1405
Pro Ser Asp Asn Ala Val Val Leu Thr Asn Leu Leu Pro Gly Thr Glu
1410 1415 1420
Tyr Val Val Ser Val Ser Ser Val Tyr Glu Gln His Glu Ser Thr Pro
1425 1430 1435 1440
Leu Arg Gly Arg Gln Lys Thr Gly Leu Asp Ser Pro Thr Gly Ile Asp
1445 1450 1455
Phe Ser Asp Ile Thr Ala Asn Ser Phe Thr Val His Trp Ile Ala Pro
1460 1465 1470
Arg Ala Thr Ile Thr Gly Tyr Arg Ile Arg His His Pro Glu His Phe
1475 1480 1485
Ser Gly Arg Pro Arg Glu Asp Arg Val Pro His Ser Arg Asn Ser Ile
1490 1495 1500
Thr Leu Thr Asn Leu Thr Pro Gly Thr Glu Tyr Val Val Ser Ile Val
1505 1510 1515 1520
Ala Leu Asn Gly Arg Glu Glu Ser Pro Leu Leu Ile Gly Gln Gln Ser
1525 1530 1535
Thr Val Ser Asp Val Pro Arg Asp Leu Glu Val Val Ala Ala Thr Pro
1540 1545 1550
Thr Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Arg Tyr
1555 1560 1565
Tyr Arg Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Glu
1570 1575 1580
Phe Thr Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys
1585 1590 1595 1600
Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Val Thr Gly Arg Gly
1605 1610 1615
Asp Ser Pro Ala Ser Ser Lys Pro Ile Ser Ile Asn Tyr Arg Thr Glu
1620 1625 1630
Ile Asp Lys Pro Ser Gln Met Gln Val Thr Asp Val Gln Asp Asn Ser
1635 1640 1645
Ile Ser Val Lys Trp Leu Pro Ser Ser Ser Pro Val Thr Gly Tyr Arg
1650 1655 1660
Val Thr Thr Thr Pro Lys Asn Gly Pro Gly Pro Thr Lys Thr Lys Thr
1665 1670 1675 1680
Ala Gly Pro Asp Gln Thr Glu Met Thr Ile Glu Gly Leu Gln Pro Thr
1685 1690 1695
Val Glu Tyr Val Val Ser Val Tyr Ala Gln Asn Pro Ser Gly Glu Ser
1700 1705 1710
Gln Pro Leu Val Gln Thr Ala Val Thr Asn Ile Asp Arg Pro Lys Gly
1715 1720 1725
Leu Ala Phe Thr Asp Val Asp Val Asp Ser Ile Lys Ile Ala Trp Glu
1730 1735 1740
Ser Pro Gln Gly Gln Val Ser Arg Tyr Arg Val Thr Tyr Ser Ser Pro
1745 1750 1755 1760
Glu Asp Gly Ile His Glu Leu Phe Pro Ala Pro Asp Gly Glu Glu Asp
1765 1770 1775
Thr Ala Glu Leu Gln Gly Leu Arg Pro Gly Ser Glu Tyr Thr Val Ser
1780 1785 1790
Val Val Ala Leu His Asp Asp Met Glu Ser Gln Pro Leu Ile Gly Thr
1795 1800 1805
Gln Ser Thr Ala Ile Pro Ala Pro Thr Asp Leu Lys Phe Thr Gln Val
1810 1815 1820
Thr Pro Thr Ser Leu Ser Ala Gln Trp Thr Pro Pro Asn Val Gln Leu
1825 1830 1835 1840
Thr Gly Tyr Arg Val Arg Val Thr Pro Lys Glu Lys Thr Gly Pro Met
1845 1850 1855
Lys Glu Ile Asn Leu Ala Pro Asp Ser Ser Ser Val Val Val Ser Gly
1860 1865 1870
Leu Met Val Ala Thr Lys Tyr Glu Val Ser Val Tyr Ala Leu Lys Asp
1875 1880 1885
Thr Leu Thr Ser Arg Pro Ala Gln Gly Val Val Thr Thr Leu Glu Asn
1890 1895 1900
Val Ser Pro Pro Arg Arg Ala Arg Val Thr Asp Ala Thr Glu Thr Thr
1905 1910 1915 1920
Ile Thr Ile Ser Trp Arg Thr Lys Thr Glu Thr Ile Thr Gly Phe Gln
1925 1930 1935
Val Asp Ala Val Pro Ala Asn Gly Gln Thr Pro Ile Gln Arg Thr Ile
1940 1945 1950
Lys Pro Asp Val Arg Ser Tyr Thr Ile Thr Gly Leu Gln Pro Gly Thr
1955 1960 1965
Asp Tyr Lys Ile Tyr Leu Tyr Thr Leu Asn Asp Asn Ala Arg Ser Ser
1970 1975 1980
Pro Val Val Ile Asp Ala Ser Thr Ala Ile Asp Ala Pro Ser Asn Leu
1985 1990 1995 2000
Arg Phe Leu Ala Thr Thr Pro Asn Ser Leu Leu Val Ser Trp Gln Pro
2005 2010 2015
Pro Arg Ala Arg Ile Thr Gly Tyr Ile Ile Lys Tyr Glu Lys Pro Gly
2020 2025 2030
Ser Pro Pro Arg Glu Val Val Pro Arg Pro Arg Pro Gly Val Thr Glu
2035 2040 2045
Ala Thr Ile Thr Gly Leu Glu Pro Gly Thr Glu Tyr Thr Ile Tyr Val
2050 2055 2060
Ile Ala Leu Lys Asn Asn Gln Lys Ser Glu Pro Leu Ile Gly Arg Lys
2065 2070 2075 2080
Lys Thr Asp Glu Leu Pro Gln Leu Val Thr Leu Pro His Pro Asn Leu
2085 2090 2095
His Gly Pro Glu Ile Leu Asp Val Pro Ser Thr Val Gln Lys Thr Pro
2100 2105 2110
Phe Val Thr His Pro Gly Tyr Asp Thr Gly Asn Gly Ile Gln Leu Pro
2115 2120 2125
Gly Thr Ser Gly Gln Gln Pro Ser Val Gly Gln Gln Met Ile Phe Glu
2130 2135 2140
Glu His Gly Phe Arg Arg Thr Thr Pro Pro Thr Thr Ala Thr Pro Ile
2145 2150 2155 2160
Arg His Arg Pro Arg Pro Tyr Pro Pro Asn Val Gly Glu Glu Ile Gln
2165 2170 2175
Ile Gly His Ile Pro Arg Glu Asp Val Asp Tyr His Leu Tyr Pro His
2180 2185 2190
Gly Pro Gly Leu Asn Pro Asn Ala Ser Thr Gly Gln Glu Ala Leu Ser
2195 2200 2205
Gln Thr Thr Ile Ser Trp Ala Pro Phe Gln Asp Thr Ser Glu Tyr Ile
2210 2215 2220
Ile Ser Cys His Pro Val Gly Thr Asp Glu Glu Pro Leu Gln Phe Arg
2225 2230 2235 2240
Val Pro Gly Thr Ser Thr Ser Ala Thr Leu Thr Gly Leu Thr Arg Gly
2245 2250 2255
Ala Thr Tyr Asn Ile Ile Val Glu Ala Leu Lys Asp Gln Gln Arg His
2260 2265 2270
Lys Val Arg Glu Glu Val Val Thr Val Gly Asn Ser Val Asn Glu Gly
2275 2280 2285
Leu Asn Gln Pro Thr Asp Asp Ser Cys Phe Asp Pro Tyr Thr Val Ser
2290 2295 2300
His Tyr Ala Val Gly Asp Glu Trp Glu Arg Met Ser Glu Ser Gly Phe
2305 2310 2315 2320
Lys Leu Leu Cys Gln Cys Leu Gly Phe Gly Ser Gly His Phe Arg Cys
2325 2330 2335
Asp Ser Ser Arg Trp Cys His Asp Asn Gly Val Asn Tyr Lys Ile Gly
2340 2345 2350
Glu Lys Trp Asp Arg Gln Gly Glu Asn Gly Gln Met Met Ser Cys Thr
2355 2360 2365
Cys Leu Gly Asn Gly Lys Gly Glu Phe Lys Cys Asp Pro His Glu Ala
2370 2375 2380
Thr Cys Tyr Asp Asp Gly Lys Thr Tyr His Val Gly Glu Gln Trp Gln
2385 2390 2395 2400
Lys Glu Tyr Leu Gly Ala Ile Cys Ser Cys Thr Cys Phe Gly Gly Gln
2405 2410 2415
Arg Gly Trp Arg Cys Asp Asn Cys Arg Arg Pro Gly Gly Glu Pro Ser
2420 2425 2430
Pro Glu Gly Thr Thr Gly Gln Ser Tyr Asn Gln Tyr Ser Gln Arg Tyr
2435 2440 2445
His Gln Arg Thr Asn Thr Asn Val Asn Cys Pro Ile Glu Cys Phe Met
2450 2455 2460
Pro Leu Asp Val Gln Ala Asp Arg Glu Asp Ser Arg Glu
2465 2470 2475
<210> 54
<211> 786
<212> PRT
<213> 智人(Homo sapiens)
<400> 54
Met Ala Gly Leu Thr Ala Ala Ala Pro Arg Pro Gly Val Leu Leu Leu
1 5 10 15
Leu Leu Ser Ile Leu His Pro Ser Arg Pro Gly Gly Val Pro Gly Ala
20 25 30
Ile Pro Gly Gly Val Pro Gly Gly Val Phe Tyr Pro Gly Ala Gly Leu
35 40 45
Gly Ala Leu Gly Gly Gly Ala Leu Gly Pro Gly Gly Lys Pro Leu Lys
50 55 60
Pro Val Pro Gly Gly Leu Ala Gly Ala Gly Leu Gly Ala Gly Leu Gly
65 70 75 80
Ala Phe Pro Ala Val Thr Phe Pro Gly Ala Leu Val Pro Gly Gly Val
85 90 95
Ala Asp Ala Ala Ala Ala Tyr Lys Ala Ala Lys Ala Gly Ala Gly Leu
100 105 110
Gly Gly Val Pro Gly Val Gly Gly Leu Gly Val Ser Ala Gly Ala Val
115 120 125
Val Pro Gln Pro Gly Ala Gly Val Lys Pro Gly Lys Val Pro Gly Val
130 135 140
Gly Leu Pro Gly Val Tyr Pro Gly Gly Val Leu Pro Gly Ala Arg Phe
145 150 155 160
Pro Gly Val Gly Val Leu Pro Gly Val Pro Thr Gly Ala Gly Val Lys
165 170 175
Pro Lys Ala Pro Gly Val Gly Gly Ala Phe Ala Gly Ile Pro Gly Val
180 185 190
Gly Pro Phe Gly Gly Pro Gln Pro Gly Val Pro Leu Gly Tyr Pro Ile
195 200 205
Lys Ala Pro Lys Leu Pro Gly Gly Tyr Gly Leu Pro Tyr Thr Thr Gly
210 215 220
Lys Leu Pro Tyr Gly Tyr Gly Pro Gly Gly Val Ala Gly Ala Ala Gly
225 230 235 240
Lys Ala Gly Tyr Pro Thr Gly Thr Gly Val Gly Pro Gln Ala Ala Ala
245 250 255
Ala Ala Ala Ala Lys Ala Ala Ala Lys Phe Gly Ala Gly Ala Ala Gly
260 265 270
Val Leu Pro Gly Val Gly Gly Ala Gly Val Pro Gly Val Pro Gly Ala
275 280 285
Ile Pro Gly Ile Gly Gly Ile Ala Gly Val Gly Thr Pro Ala Ala Ala
290 295 300
Ala Ala Ala Ala Ala Ala Ala Lys Ala Ala Lys Tyr Gly Ala Ala Ala
305 310 315 320
Gly Leu Val Pro Gly Gly Pro Gly Phe Gly Pro Gly Val Val Gly Val
325 330 335
Pro Gly Ala Gly Val Pro Gly Val Gly Val Pro Gly Ala Gly Ile Pro
340 345 350
Val Val Pro Gly Ala Gly Ile Pro Gly Ala Ala Val Pro Gly Val Val
355 360 365
Ser Pro Glu Ala Ala Ala Lys Ala Ala Ala Lys Ala Ala Lys Tyr Gly
370 375 380
Ala Arg Pro Gly Val Gly Val Gly Gly Ile Pro Thr Tyr Gly Val Gly
385 390 395 400
Ala Gly Gly Phe Pro Gly Phe Gly Val Gly Val Gly Gly Ile Pro Gly
405 410 415
Val Ala Gly Val Pro Gly Val Gly Gly Val Pro Gly Val Gly Gly Val
420 425 430
Pro Gly Val Gly Ile Ser Pro Glu Ala Gln Ala Ala Ala Ala Ala Lys
435 440 445
Ala Ala Lys Tyr Gly Ala Ala Gly Ala Gly Val Leu Gly Gly Leu Val
450 455 460
Pro Gly Ala Pro Gly Ala Val Pro Gly Val Pro Gly Thr Gly Gly Val
465 470 475 480
Pro Gly Val Gly Thr Pro Ala Ala Ala Ala Ala Lys Ala Ala Ala Lys
485 490 495
Ala Ala Gln Phe Gly Leu Val Pro Gly Val Gly Val Ala Pro Gly Val
500 505 510
Gly Val Ala Pro Gly Val Gly Val Ala Pro Gly Val Gly Leu Ala Pro
515 520 525
Gly Val Gly Val Ala Pro Gly Val Gly Val Ala Pro Gly Val Gly Val
530 535 540
Ala Pro Gly Ile Gly Pro Gly Gly Val Ala Ala Ala Ala Lys Ser Ala
545 550 555 560
Ala Lys Val Ala Ala Lys Ala Gln Leu Arg Ala Ala Ala Gly Leu Gly
565 570 575
Ala Gly Ile Pro Gly Leu Gly Val Gly Val Gly Val Pro Gly Leu Gly
580 585 590
Val Gly Ala Gly Val Pro Gly Leu Gly Val Gly Ala Gly Val Pro Gly
595 600 605
Phe Gly Ala Gly Ala Asp Glu Gly Val Arg Arg Ser Leu Ser Pro Glu
610 615 620
Leu Arg Glu Gly Asp Pro Ser Ser Ser Gln His Leu Pro Ser Thr Pro
625 630 635 640
Ser Ser Pro Arg Val Pro Gly Ala Leu Ala Ala Ala Lys Ala Ala Lys
645 650 655
Tyr Gly Ala Ala Val Pro Gly Val Leu Gly Gly Leu Gly Ala Leu Gly
660 665 670
Gly Val Gly Ile Pro Gly Gly Val Val Gly Ala Gly Pro Ala Ala Ala
675 680 685
Ala Ala Ala Ala Lys Ala Ala Ala Lys Ala Ala Gln Phe Gly Leu Val
690 695 700
Gly Ala Ala Gly Leu Gly Gly Leu Gly Val Gly Gly Leu Gly Val Pro
705 710 715 720
Gly Val Gly Gly Leu Gly Gly Ile Pro Pro Ala Ala Ala Ala Lys Ala
725 730 735
Ala Lys Tyr Gly Ala Ala Gly Leu Gly Gly Val Leu Gly Gly Ala Gly
740 745 750
Gln Phe Pro Leu Gly Gly Val Ala Ala Arg Pro Gly Phe Gly Leu Ser
755 760 765
Pro Ile Phe Pro Gly Gly Ala Cys Leu Gly Lys Ala Cys Gly Arg Lys
770 775 780
Arg Lys
785
<210> 55
<211> 338
<212> PRT
<213> 智人(Homo sapiens)
<400> 55
Met Ser Leu Ser Ala Phe Thr Leu Phe Leu Ala Leu Ile Gly Gly Thr
1 5 10 15
Ser Gly Gln Tyr Tyr Asp Tyr Asp Phe Pro Leu Ser Ile Tyr Gly Gln
20 25 30
Ser Ser Pro Asn Cys Ala Pro Glu Cys Asn Cys Pro Glu Ser Tyr Pro
35 40 45
Ser Ala Met Tyr Cys Asp Glu Leu Lys Leu Lys Ser Val Pro Met Val
50 55 60
Pro Pro Gly Ile Lys Tyr Leu Tyr Leu Arg Asn Asn Gln Ile Asp His
65 70 75 80
Ile Asp Glu Lys Ala Phe Glu Asn Val Thr Asp Leu Gln Trp Leu Ile
85 90 95
Leu Asp His Asn Leu Leu Glu Asn Ser Lys Ile Lys Gly Arg Val Phe
100 105 110
Ser Lys Leu Lys Gln Leu Lys Lys Leu His Ile Asn His Asn Asn Leu
115 120 125
Thr Glu Ser Val Gly Pro Leu Pro Lys Ser Leu Glu Asp Leu Gln Leu
130 135 140
Thr His Asn Lys Ile Thr Lys Leu Gly Ser Phe Glu Gly Leu Val Asn
145 150 155 160
Leu Thr Phe Ile His Leu Gln His Asn Arg Leu Lys Glu Asp Ala Val
165 170 175
Ser Ala Ala Phe Lys Gly Leu Lys Ser Leu Glu Tyr Leu Asp Leu Ser
180 185 190
Phe Asn Gln Ile Ala Arg Leu Pro Ser Gly Leu Pro Val Ser Leu Leu
195 200 205
Thr Leu Tyr Leu Asp Asn Asn Lys Ile Ser Asn Ile Pro Asp Glu Tyr
210 215 220
Phe Lys Arg Phe Asn Ala Leu Gln Tyr Leu Arg Leu Ser His Asn Glu
225 230 235 240
Leu Ala Asp Ser Gly Ile Pro Gly Asn Ser Phe Asn Val Ser Ser Leu
245 250 255
Val Glu Leu Asp Leu Ser Tyr Asn Lys Leu Lys Asn Ile Pro Thr Val
260 265 270
Asn Glu Asn Leu Glu Asn Tyr Tyr Leu Glu Val Asn Gln Leu Glu Lys
275 280 285
Phe Asp Ile Lys Ser Phe Cys Lys Ile Leu Gly Pro Leu Ser Tyr Ser
290 295 300
Lys Ile Lys His Leu Arg Leu Asp Gly Asn Arg Ile Ser Glu Thr Ser
305 310 315 320
Leu Pro Pro Asp Met Tyr Glu Cys Leu Arg Val Ala Asn Glu Val Thr
325 330 335
Leu Asn
<210> 56
<211> 478
<212> PRT
<213> 智人(Homo sapiens)
<400> 56
Met Ala Pro Leu Arg Pro Leu Leu Ile Leu Ala Leu Leu Ala Trp Val
1 5 10 15
Ala Leu Ala Asp Gln Glu Ser Cys Lys Gly Arg Cys Thr Glu Gly Phe
20 25 30
Asn Val Asp Lys Lys Cys Gln Cys Asp Glu Leu Cys Ser Tyr Tyr Gln
35 40 45
Ser Cys Cys Thr Asp Tyr Thr Ala Glu Cys Lys Pro Gln Val Thr Arg
50 55 60
Gly Asp Val Phe Thr Met Pro Glu Asp Glu Tyr Thr Val Tyr Asp Asp
65 70 75 80
Gly Glu Glu Lys Asn Asn Ala Thr Val His Glu Gln Val Gly Gly Pro
85 90 95
Ser Leu Thr Ser Asp Leu Gln Ala Gln Ser Lys Gly Asn Pro Glu Gln
100 105 110
Thr Pro Val Leu Lys Pro Glu Glu Glu Ala Pro Ala Pro Glu Val Gly
115 120 125
Ala Ser Lys Pro Glu Gly Ile Asp Ser Arg Pro Glu Thr Leu His Pro
130 135 140
Gly Arg Pro Gln Pro Pro Ala Glu Glu Glu Leu Cys Ser Gly Lys Pro
145 150 155 160
Phe Asp Ala Phe Thr Asp Leu Lys Asn Gly Ser Leu Phe Ala Phe Arg
165 170 175
Gly Gln Tyr Cys Tyr Glu Leu Asp Glu Lys Ala Val Arg Pro Gly Tyr
180 185 190
Pro Lys Leu Ile Arg Asp Val Trp Gly Ile Glu Gly Pro Ile Asp Ala
195 200 205
Ala Phe Thr Arg Ile Asn Cys Gln Gly Lys Thr Tyr Leu Phe Lys Gly
210 215 220
Ser Gln Tyr Trp Arg Phe Glu Asp Gly Val Leu Asp Pro Asp Tyr Pro
225 230 235 240
Arg Asn Ile Ser Asp Gly Phe Asp Gly Ile Pro Asp Asn Val Asp Ala
245 250 255
Ala Leu Ala Leu Pro Ala His Ser Tyr Ser Gly Arg Glu Arg Val Tyr
260 265 270
Phe Phe Lys Gly Lys Gln Tyr Trp Glu Tyr Gln Phe Gln His Gln Pro
275 280 285
Ser Gln Glu Glu Cys Glu Gly Ser Ser Leu Ser Ala Val Phe Glu His
290 295 300
Phe Ala Met Met Gln Arg Asp Ser Trp Glu Asp Ile Phe Glu Leu Leu
305 310 315 320
Phe Trp Gly Arg Thr Ser Ala Gly Thr Arg Gln Pro Gln Phe Ile Ser
325 330 335
Arg Asp Trp His Gly Val Pro Gly Gln Val Asp Ala Ala Met Ala Gly
340 345 350
Arg Ile Tyr Ile Ser Gly Met Ala Pro Arg Pro Ser Leu Ala Lys Lys
355 360 365
Gln Arg Phe Arg His Arg Asn Arg Lys Gly Tyr Arg Ser Gln Arg Gly
370 375 380
His Ser Arg Gly Arg Asn Gln Asn Ser Arg Arg Pro Ser Arg Ala Thr
385 390 395 400
Trp Leu Ser Leu Phe Ser Ser Glu Glu Ser Asn Leu Gly Ala Asn Asn
405 410 415
Tyr Asp Asp Tyr Arg Met Asp Trp Leu Val Pro Ala Thr Cys Glu Pro
420 425 430
Ile Gln Ser Val Phe Phe Phe Ser Gly Asp Lys Tyr Tyr Arg Val Asn
435 440 445
Leu Arg Thr Arg Arg Val Asp Thr Val Asp Pro Pro Tyr Pro Arg Ser
450 455 460
Ile Ala Gln Tyr Trp Leu Gly Cys Pro Ala Pro Gly His Leu
465 470 475
<210> 57
<211> 1724
<212> PRT
<213> 智人(Homo sapiens)
<400> 57
Met Pro Pro Ala Val Arg Arg Ser Ala Cys Ser Met Gly Trp Leu Trp
1 5 10 15
Ile Phe Gly Ala Ala Leu Gly Gln Cys Leu Gly Tyr Ser Ser Gln Gln
20 25 30
Gln Arg Val Pro Phe Leu Gln Pro Pro Gly Gln Ser Gln Leu Gln Ala
35 40 45
Ser Tyr Val Glu Phe Arg Pro Ser Gln Gly Cys Ser Pro Gly Tyr Tyr
50 55 60
Arg Asp His Lys Gly Leu Tyr Thr Gly Arg Cys Val Pro Cys Asn Cys
65 70 75 80
Asn Gly His Ser Asn Gln Cys Gln Asp Gly Ser Gly Ile Cys Val Asn
85 90 95
Cys Gln His Asn Thr Ala Gly Glu His Cys Glu Arg Cys Gln Glu Gly
100 105 110
Tyr Tyr Gly Asn Ala Val His Gly Ser Cys Arg Ala Cys Pro Cys Pro
115 120 125
His Thr Asn Ser Phe Ala Thr Gly Cys Val Val Asn Gly Gly Asp Val
130 135 140
Arg Cys Ser Cys Lys Ala Gly Tyr Thr Gly Thr Gln Cys Glu Arg Cys
145 150 155 160
Ala Pro Gly Tyr Phe Gly Asn Pro Gln Lys Phe Gly Gly Ser Cys Gln
165 170 175
Pro Cys Ser Cys Asn Ser Asn Gly Gln Leu Gly Ser Cys His Pro Leu
180 185 190
Thr Gly Asp Cys Ile Asn Gln Glu Pro Lys Asp Ser Ser Pro Ala Glu
195 200 205
Glu Cys Asp Asp Cys Asp Ser Cys Val Met Thr Leu Leu Asn Asp Leu
210 215 220
Ala Thr Met Gly Glu Gln Leu Arg Leu Val Lys Ser Gln Leu Gln Gly
225 230 235 240
Leu Ser Ala Ser Ala Gly Leu Leu Glu Gln Met Arg His Met Glu Thr
245 250 255
Gln Ala Lys Asp Leu Arg Asn Gln Leu Leu Asn Tyr Arg Ser Ala Ile
260 265 270
Ser Asn His Gly Ser Lys Ile Glu Gly Leu Glu Arg Glu Leu Thr Asp
275 280 285
Leu Asn Gln Glu Phe Glu Thr Leu Gln Glu Lys Ala Gln Val Asn Ser
290 295 300
Arg Lys Ala Gln Thr Leu Asn Asn Asn Val Asn Arg Ala Thr Gln Ser
305 310 315 320
Ala Lys Glu Leu Asp Val Lys Ile Lys Asn Val Ile Arg Asn Val His
325 330 335
Ile Leu Leu Lys Gln Ile Ser Gly Thr Asp Gly Glu Gly Asn Asn Val
340 345 350
Pro Ser Gly Asp Phe Ser Arg Glu Trp Ala Glu Ala Gln Arg Met Met
355 360 365
Arg Glu Leu Arg Asn Arg Asn Phe Gly Lys His Leu Arg Glu Ala Glu
370 375 380
Ala Asp Lys Arg Glu Ser Gln Leu Leu Leu Asn Arg Ile Arg Thr Trp
385 390 395 400
Gln Lys Thr His Gln Gly Glu Asn Asn Gly Leu Ala Asn Ser Ile Arg
405 410 415
Asp Ser Leu Asn Glu Tyr Glu Ala Lys Leu Ser Asp Leu Arg Ala Arg
420 425 430
Leu Gln Glu Ala Ala Ala Gln Ala Lys Gln Ala Asn Gly Leu Asn Gln
435 440 445
Glu Asn Glu Arg Ala Leu Gly Ala Ile Gln Arg Gln Val Lys Glu Ile
450 455 460
Asn Ser Leu Gln Ser Asp Phe Thr Lys Tyr Leu Thr Thr Ala Asp Ser
465 470 475 480
Ser Leu Leu Gln Thr Asn Ile Ala Leu Gln Leu Met Glu Lys Ser Gln
485 490 495
Lys Glu Tyr Glu Lys Leu Ala Ala Ser Leu Asn Glu Ala Arg Gln Glu
500 505 510
Leu Ser Asp Lys Val Arg Glu Leu Ser Arg Ser Ala Gly Lys Thr Ser
515 520 525
Leu Val Glu Glu Ala Glu Lys His Ala Arg Ser Leu Gln Glu Leu Ala
530 535 540
Lys Gln Leu Glu Glu Ile Lys Arg Asn Ala Ser Gly Asp Glu Leu Val
545 550 555 560
Arg Cys Ala Val Asp Ala Ala Thr Ala Tyr Glu Asn Ile Leu Asn Ala
565 570 575
Ile Lys Ala Ala Glu Asp Ala Ala Asn Arg Ala Ala Ser Ala Ser Glu
580 585 590
Ser Ala Leu Gln Thr Val Ile Lys Glu Asp Leu Pro Arg Lys Ala Lys
595 600 605
Thr Leu Ser Ser Asn Ser Asp Lys Leu Leu Asn Glu Ala Lys Met Thr
610 615 620
Gln Lys Lys Leu Lys Gln Glu Val Ser Pro Ala Leu Asn Asn Leu Gln
625 630 635 640
Gln Thr Leu Asn Ile Val Thr Val Gln Lys Glu Val Ile Asp Thr Asn
645 650 655
Leu Thr Thr Leu Arg Asp Gly Leu His Gly Ile Gln Arg Gly Asp Ile
660 665 670
Asp Ala Met Ile Ser Ser Ala Lys Ser Met Val Arg Lys Ala Asn Asp
675 680 685
Ile Thr Asp Glu Val Leu Asp Gly Leu Asn Pro Ile Gln Thr Asp Val
690 695 700
Glu Arg Ile Lys Asp Thr Tyr Gly Arg Thr Gln Asn Glu Asp Phe Lys
705 710 715 720
Lys Ala Leu Thr Asp Ala Asp Asn Ser Val Asn Lys Leu Thr Asn Lys
725 730 735
Leu Pro Asp Leu Trp Arg Lys Ile Glu Ser Ile Asn Gln Gln Leu Leu
740 745 750
Pro Leu Gly Asn Ile Ser Asp Asn Met Asp Arg Ile Arg Glu Leu Ile
755 760 765
Gln Gln Ala Arg Asp Ala Ala Ser Lys Val Ala Val Pro Met Arg Phe
770 775 780
Asn Gly Lys Ser Gly Val Glu Val Arg Leu Pro Asn Asp Leu Glu Asp
785 790 795 800
Leu Lys Gly Tyr Thr Ser Leu Ser Leu Phe Leu Gln Arg Pro Asn Ser
805 810 815
Arg Glu Asn Gly Gly Thr Glu Asn Met Phe Val Met Tyr Leu Gly Asn
820 825 830
Lys Asp Ala Ser Arg Asp Tyr Ile Gly Met Ala Val Val Asp Gly Gln
835 840 845
Leu Thr Cys Val Tyr Asn Leu Gly Asp Arg Glu Ala Glu Leu Gln Val
850 855 860
Asp Gln Ile Leu Thr Lys Ser Glu Thr Lys Glu Ala Val Met Asp Arg
865 870 875 880
Val Lys Phe Gln Arg Ile Tyr Gln Phe Ala Arg Leu Asn Tyr Thr Lys
885 890 895
Gly Ala Thr Ser Ser Lys Pro Glu Thr Pro Gly Val Tyr Asp Met Asp
900 905 910
Gly Arg Asn Ser Asn Thr Leu Leu Asn Leu Asp Pro Glu Asn Val Val
915 920 925
Phe Tyr Val Gly Gly Tyr Pro Pro Asp Phe Lys Leu Pro Ser Arg Leu
930 935 940
Ser Phe Pro Pro Tyr Lys Gly Cys Ile Glu Leu Asp Asp Leu Asn Glu
945 950 955 960
Asn Val Leu Ser Leu Tyr Asn Phe Lys Lys Thr Phe Asn Leu Asn Thr
965 970 975
Thr Glu Val Glu Pro Cys Arg Arg Arg Lys Glu Glu Ser Asp Lys Asn
980 985 990
Tyr Phe Glu Gly Thr Gly Tyr Ala Arg Val Pro Thr Gln Pro His Ala
995 1000 1005
Pro Ile Pro Thr Phe Gly Gln Thr Ile Gln Thr Thr Val Asp Arg Gly
1010 1015 1020
Leu Leu Phe Phe Ala Glu Asn Gly Asp Arg Phe Ile Ser Leu Asn Ile
1025 1030 1035 1040
Glu Asp Gly Lys Leu Met Val Arg Tyr Lys Leu Asn Ser Glu Leu Pro
1045 1050 1055
Lys Glu Arg Gly Val Gly Asp Ala Ile Asn Asn Gly Arg Asp His Ser
1060 1065 1070
Ile Gln Ile Lys Ile Gly Lys Leu Gln Lys Arg Met Trp Ile Asn Val
1075 1080 1085
Asp Val Gln Asn Thr Ile Ile Asp Gly Glu Val Phe Asp Phe Ser Thr
1090 1095 1100
Tyr Tyr Leu Gly Gly Ile Pro Ile Ala Ile Arg Glu Arg Phe Asn Ile
1105 1110 1115 1120
Ser Thr Pro Ala Phe Arg Gly Cys Met Lys Asn Leu Lys Lys Thr Ser
1125 1130 1135
Gly Val Val Arg Leu Asn Asp Thr Val Gly Val Thr Lys Lys Cys Ser
1140 1145 1150
Glu Asp Trp Lys Leu Val Arg Ser Ala Ser Phe Ser Arg Gly Gly Gln
1155 1160 1165
Leu Ser Phe Thr Asp Leu Gly Leu Pro Pro Thr Asp His Leu Gln Ala
1170 1175 1180
Ser Phe Gly Phe Gln Thr Phe Gln Pro Ser Gly Ile Leu Leu Asp His
1185 1190 1195 1200
Gln Thr Trp Thr Arg Asn Leu Gln Val Thr Leu Glu Asp Gly Tyr Ile
1205 1210 1215
Glu Leu Ser Thr Ser Asp Ser Gly Gly Pro Ile Phe Lys Ser Pro Gln
1220 1225 1230
Thr Tyr Met Asp Gly Leu Leu His Tyr Val Ser Val Ile Ser Asp Asn
1235 1240 1245
Ser Gly Leu Arg Leu Leu Ile Asp Asp Gln Leu Leu Arg Asn Ser Lys
1250 1255 1260
Arg Leu Lys His Ile Ser Ser Ser Arg Gln Ser Leu Arg Leu Gly Gly
1265 1270 1275 1280
Ser Asn Phe Glu Gly Cys Ile Ser Asn Val Phe Val Gln Arg Leu Ser
1285 1290 1295
Leu Ser Pro Glu Val Leu Asp Leu Thr Ser Asn Ser Leu Lys Arg Asp
1300 1305 1310
Val Ser Leu Gly Gly Cys Ser Leu Asn Lys Pro Pro Phe Leu Met Leu
1315 1320 1325
Leu Lys Gly Ser Thr Arg Phe Asn Lys Thr Lys Thr Phe Arg Ile Asn
1330 1335 1340
Gln Leu Leu Gln Asp Thr Pro Val Ala Ser Pro Arg Ser Val Lys Val
1345 1350 1355 1360
Trp Gln Asp Ala Cys Ser Pro Leu Pro Lys Thr Gln Ala Asn His Gly
1365 1370 1375
Ala Leu Gln Phe Gly Asp Ile Pro Thr Ser His Leu Leu Phe Lys Leu
1380 1385 1390
Pro Gln Glu Leu Leu Lys Pro Arg Ser Gln Phe Ala Val Asp Met Gln
1395 1400 1405
Thr Thr Ser Ser Arg Gly Leu Val Phe His Thr Gly Thr Lys Asn Ser
1410 1415 1420
Phe Met Ala Leu Tyr Leu Ser Lys Gly Arg Leu Val Phe Ala Leu Gly
1425 1430 1435 1440
Thr Asp Gly Lys Lys Leu Arg Ile Lys Ser Lys Glu Lys Cys Asn Asp
1445 1450 1455
Gly Lys Trp His Thr Val Val Phe Gly His Asp Gly Glu Lys Gly Arg
1460 1465 1470
Leu Val Val Asp Gly Leu Arg Ala Arg Glu Gly Ser Leu Pro Gly Asn
1475 1480 1485
Ser Thr Ile Ser Ile Arg Ala Pro Val Tyr Leu Gly Ser Pro Pro Ser
1490 1495 1500
Gly Lys Pro Lys Ser Leu Pro Thr Asn Ser Phe Val Gly Cys Leu Lys
1505 1510 1515 1520
Asn Phe Gln Leu Asp Ser Lys Pro Leu Tyr Thr Pro Ser Ser Ser Phe
1525 1530 1535
Gly Val Ser Ser Cys Leu Gly Gly Pro Leu Glu Lys Gly Ile Tyr Phe
1540 1545 1550
Ser Glu Glu Gly Gly His Val Val Leu Ala His Ser Val Leu Leu Gly
1555 1560 1565
Pro Glu Phe Lys Leu Val Phe Ser Ile Arg Pro Arg Ser Leu Thr Gly
1570 1575 1580
Ile Leu Ile His Ile Gly Ser Gln Pro Gly Lys His Leu Cys Val Tyr
1585 1590 1595 1600
Leu Glu Ala Gly Lys Val Thr Ala Ser Met Asp Ser Gly Ala Gly Gly
1605 1610 1615
Thr Ser Thr Ser Val Thr Pro Lys Gln Ser Leu Cys Asp Gly Gln Trp
1620 1625 1630
His Ser Val Ala Val Thr Ile Lys Gln His Ile Leu His Leu Glu Leu
1635 1640 1645
Asp Thr Asp Ser Ser Tyr Thr Ala Gly Gln Ile Pro Phe Pro Pro Ala
1650 1655 1660
Ser Thr Gln Glu Pro Leu His Leu Gly Gly Ala Pro Ala Asn Leu Thr
1665 1670 1675 1680
Thr Leu Arg Ile Pro Val Trp Lys Ser Phe Phe Gly Cys Leu Arg Asn
1685 1690 1695
Ile His Val Asn His Ile Pro Val Pro Val Thr Glu Ala Leu Glu Val
1700 1705 1710
Gln Gly Pro Val Ser Leu Asn Gly Cys Pro Asp Gln
1715 1720
<210> 58
<211> 1172
<212> PRT
<213> 智人(Homo sapiens)
<400> 58
Met Arg Pro Phe Phe Leu Leu Cys Phe Ala Leu Pro Gly Leu Leu His
1 5 10 15
Ala Gln Gln Ala Cys Ser Arg Gly Ala Cys Tyr Pro Pro Val Gly Asp
20 25 30
Leu Leu Val Gly Arg Thr Arg Phe Leu Arg Ala Ser Ser Thr Cys Gly
35 40 45
Leu Thr Lys Pro Glu Thr Tyr Cys Thr Gln Tyr Gly Glu Trp Gln Met
50 55 60
Lys Cys Cys Lys Cys Asp Ser Arg Gln Pro His Asn Tyr Tyr Ser His
65 70 75 80
Arg Val Glu Asn Val Ala Ser Ser Ser Gly Pro Met Arg Trp Trp Gln
85 90 95
Ser Gln Asn Asp Val Asn Pro Val Ser Leu Gln Leu Asp Leu Asp Arg
100 105 110
Arg Phe Gln Leu Gln Glu Val Met Met Glu Phe Gln Gly Pro Met Pro
115 120 125
Ala Gly Met Leu Ile Glu Arg Ser Ser Asp Phe Gly Lys Thr Trp Arg
130 135 140
Val Tyr Gln Tyr Leu Ala Ala Asp Cys Thr Ser Thr Phe Pro Arg Val
145 150 155 160
Arg Gln Gly Arg Pro Gln Ser Trp Gln Asp Val Arg Cys Gln Ser Leu
165 170 175
Pro Gln Arg Pro Asn Ala Arg Leu Asn Gly Gly Lys Val Gln Leu Asn
180 185 190
Leu Met Asp Leu Val Ser Gly Ile Pro Ala Thr Gln Ser Gln Lys Ile
195 200 205
Gln Glu Val Gly Glu Ile Thr Asn Leu Arg Val Asn Phe Thr Arg Leu
210 215 220
Ala Pro Val Pro Gln Arg Gly Tyr His Pro Pro Ser Ala Tyr Tyr Ala
225 230 235 240
Val Ser Gln Leu Arg Leu Gln Gly Ser Cys Phe Cys His Gly His Ala
245 250 255
Asp Arg Cys Ala Pro Lys Pro Gly Ala Ser Ala Gly Pro Ser Thr Ala
260 265 270
Val Gln Val His Asp Val Cys Val Cys Gln His Asn Thr Ala Gly Pro
275 280 285
Asn Cys Glu Arg Cys Ala Pro Phe Tyr Asn Asn Arg Pro Trp Arg Pro
290 295 300
Ala Glu Gly Gln Asp Ala His Glu Cys Gln Arg Cys Asp Cys Asn Gly
305 310 315 320
His Ser Glu Thr Cys His Phe Asp Pro Ala Val Phe Ala Ala Ser Gln
325 330 335
Gly Ala Tyr Gly Gly Val Cys Asp Asn Cys Arg Asp His Thr Glu Gly
340 345 350
Lys Asn Cys Glu Arg Cys Gln Leu His Tyr Phe Arg Asn Arg Arg Pro
355 360 365
Gly Ala Ser Ile Gln Glu Thr Cys Ile Ser Cys Glu Cys Asp Pro Asp
370 375 380
Gly Ala Val Pro Gly Ala Pro Cys Asp Pro Val Thr Gly Gln Cys Val
385 390 395 400
Cys Lys Glu His Val Gln Gly Glu Arg Cys Asp Leu Cys Lys Pro Gly
405 410 415
Phe Thr Gly Leu Thr Tyr Ala Asn Pro Gln Gly Cys His Arg Cys Asp
420 425 430
Cys Asn Ile Leu Gly Ser Arg Arg Asp Met Pro Cys Asp Glu Glu Ser
435 440 445
Gly Arg Cys Leu Cys Leu Pro Asn Val Val Gly Pro Lys Cys Asp Gln
450 455 460
Cys Ala Pro Tyr His Trp Lys Leu Ala Ser Gly Gln Gly Cys Glu Pro
465 470 475 480
Cys Ala Cys Asp Pro His Asn Ser Leu Ser Pro Gln Cys Asn Gln Phe
485 490 495
Thr Gly Gln Cys Pro Cys Arg Glu Gly Phe Gly Gly Leu Met Cys Ser
500 505 510
Ala Ala Ala Ile Arg Gln Cys Pro Asp Arg Thr Tyr Gly Asp Val Ala
515 520 525
Thr Gly Cys Arg Ala Cys Asp Cys Asp Phe Arg Gly Thr Glu Gly Pro
530 535 540
Gly Cys Asp Lys Ala Ser Gly Arg Cys Leu Cys Arg Pro Gly Leu Thr
545 550 555 560
Gly Pro Arg Cys Asp Gln Cys Gln Arg Gly Tyr Cys Asn Arg Tyr Pro
565 570 575
Val Cys Val Ala Cys His Pro Cys Phe Gln Thr Tyr Asp Ala Asp Leu
580 585 590
Arg Glu Gln Ala Leu Arg Phe Gly Arg Leu Arg Asn Ala Thr Ala Ser
595 600 605
Leu Trp Ser Gly Pro Gly Leu Glu Asp Arg Gly Leu Ala Ser Arg Ile
610 615 620
Leu Asp Ala Lys Ser Lys Ile Glu Gln Ile Arg Ala Val Leu Ser Ser
625 630 635 640
Pro Ala Val Thr Glu Gln Glu Val Ala Gln Val Ala Ser Ala Ile Leu
645 650 655
Ser Leu Arg Arg Thr Leu Gln Gly Leu Gln Leu Asp Leu Pro Leu Glu
660 665 670
Glu Glu Thr Leu Ser Leu Pro Arg Asp Leu Glu Ser Leu Asp Arg Ser
675 680 685
Phe Asn Gly Leu Leu Thr Met Tyr Gln Arg Lys Arg Glu Gln Phe Glu
690 695 700
Lys Ile Ser Ser Ala Asp Pro Ser Gly Ala Phe Arg Met Leu Ser Thr
705 710 715 720
Ala Tyr Glu Gln Ser Ala Gln Ala Ala Gln Gln Val Ser Asp Ser Ser
725 730 735
Arg Leu Leu Asp Gln Leu Arg Asp Ser Arg Arg Glu Ala Glu Arg Leu
740 745 750
Val Arg Gln Ala Gly Gly Gly Gly Gly Thr Gly Ser Pro Lys Leu Val
755 760 765
Ala Leu Arg Leu Glu Met Ser Ser Leu Pro Asp Leu Thr Pro Thr Phe
770 775 780
Asn Lys Leu Cys Gly Asn Ser Arg Gln Met Ala Cys Thr Pro Ile Ser
785 790 795 800
Cys Pro Gly Glu Leu Cys Pro Gln Asp Asn Gly Thr Ala Cys Gly Ser
805 810 815
Arg Cys Arg Gly Val Leu Pro Arg Ala Gly Gly Ala Phe Leu Met Ala
820 825 830
Gly Gln Val Ala Glu Gln Leu Arg Gly Phe Asn Ala Gln Leu Gln Arg
835 840 845
Thr Arg Gln Met Ile Arg Ala Ala Glu Glu Ser Ala Ser Gln Ile Gln
850 855 860
Ser Ser Ala Gln Arg Leu Glu Thr Gln Val Ser Ala Ser Arg Ser Gln
865 870 875 880
Met Glu Glu Asp Val Arg Arg Thr Arg Leu Leu Ile Gln Gln Val Arg
885 890 895
Asp Phe Leu Thr Asp Pro Asp Thr Asp Ala Ala Thr Ile Gln Glu Val
900 905 910
Ser Glu Ala Val Leu Ala Leu Trp Leu Pro Thr Asp Ser Ala Thr Val
915 920 925
Leu Gln Lys Met Asn Glu Ile Gln Ala Ile Ala Ala Arg Leu Pro Asn
930 935 940
Val Asp Leu Val Leu Ser Gln Thr Lys Gln Asp Ile Ala Arg Ala Arg
945 950 955 960
Arg Leu Gln Ala Glu Ala Glu Glu Ala Arg Ser Arg Ala His Ala Val
965 970 975
Glu Gly Gln Val Glu Asp Val Val Gly Asn Leu Arg Gln Gly Thr Val
980 985 990
Ala Leu Gln Glu Ala Gln Asp Thr Met Gln Gly Thr Ser Arg Ser Leu
995 1000 1005
Arg Leu Ile Gln Asp Arg Val Ala Glu Val Gln Gln Val Leu Arg Pro
1010 1015 1020
Ala Glu Lys Leu Val Thr Ser Met Thr Lys Gln Leu Gly Asp Phe Trp
1025 1030 1035 1040
Thr Arg Met Glu Glu Leu Arg His Gln Ala Arg Gln Gln Gly Ala Glu
1045 1050 1055
Ala Val Gln Ala Gln Gln Leu Ala Glu Gly Ala Ser Glu Gln Ala Leu
1060 1065 1070
Ser Ala Gln Glu Gly Phe Glu Arg Ile Lys Gln Lys Tyr Ala Glu Leu
1075 1080 1085
Lys Asp Arg Leu Gly Gln Ser Ser Met Leu Gly Glu Gln Gly Ala Arg
1090 1095 1100
Ile Gln Ser Val Lys Thr Glu Ala Glu Glu Leu Phe Gly Glu Thr Met
1105 1110 1115 1120
Glu Met Met Asp Arg Met Lys Asp Met Glu Leu Glu Leu Leu Arg Gly
1125 1130 1135
Ser Gln Ala Ile Met Leu Arg Ser Ala Asp Leu Thr Gly Leu Glu Lys
1140 1145 1150
Arg Val Glu Gln Ile Arg Asp His Ile Asn Gly Arg Val Leu Tyr Tyr
1155 1160 1165
Ala Thr Cys Lys
1170
<210> 59
<211> 1193
<212> PRT
<213> 智人(Homo sapiens)
<400> 59
Met Pro Ala Leu Trp Leu Gly Cys Cys Leu Cys Phe Ser Leu Leu Leu
1 5 10 15
Pro Ala Ala Arg Ala Thr Ser Arg Arg Glu Val Cys Asp Cys Asn Gly
20 25 30
Lys Ser Arg Gln Cys Ile Phe Asp Arg Glu Leu His Arg Gln Thr Gly
35 40 45
Asn Gly Phe Arg Cys Leu Asn Cys Asn Asp Asn Thr Asp Gly Ile His
50 55 60
Cys Glu Lys Cys Lys Asn Gly Phe Tyr Arg His Arg Glu Arg Asp Arg
65 70 75 80
Cys Leu Pro Cys Asn Cys Asn Ser Lys Gly Ser Leu Ser Ala Arg Cys
85 90 95
Asp Asn Ser Gly Arg Cys Ser Cys Lys Pro Gly Val Thr Gly Ala Arg
100 105 110
Cys Asp Arg Cys Leu Pro Gly Phe His Met Leu Thr Asp Ala Gly Cys
115 120 125
Thr Gln Asp Gln Arg Leu Leu Asp Ser Lys Cys Asp Cys Asp Pro Ala
130 135 140
Gly Ile Ala Gly Pro Cys Asp Ala Gly Arg Cys Val Cys Lys Pro Ala
145 150 155 160
Val Thr Gly Glu Arg Cys Asp Arg Cys Arg Ser Gly Tyr Tyr Asn Leu
165 170 175
Asp Gly Gly Asn Pro Glu Gly Cys Thr Gln Cys Phe Cys Tyr Gly His
180 185 190
Ser Ala Ser Cys Arg Ser Ser Ala Glu Tyr Ser Val His Lys Ile Thr
195 200 205
Ser Thr Phe His Gln Asp Val Asp Gly Trp Lys Ala Val Gln Arg Asn
210 215 220
Gly Ser Pro Ala Lys Leu Gln Trp Ser Gln Arg His Gln Asp Val Phe
225 230 235 240
Ser Ser Ala Gln Arg Leu Asp Pro Val Tyr Phe Val Ala Pro Ala Lys
245 250 255
Phe Leu Gly Asn Gln Gln Val Ser Tyr Gly Gln Ser Leu Ser Phe Asp
260 265 270
Tyr Arg Val Asp Arg Gly Gly Arg His Pro Ser Ala His Asp Val Ile
275 280 285
Leu Glu Gly Ala Gly Leu Arg Ile Thr Ala Pro Leu Met Pro Leu Gly
290 295 300
Lys Thr Leu Pro Cys Gly Leu Thr Lys Thr Tyr Thr Phe Arg Leu Asn
305 310 315 320
Glu His Pro Ser Asn Asn Trp Ser Pro Gln Leu Ser Tyr Phe Glu Tyr
325 330 335
Arg Arg Leu Leu Arg Asn Leu Thr Ala Leu Arg Ile Arg Ala Thr Tyr
340 345 350
Gly Glu Tyr Ser Thr Gly Tyr Ile Asp Asn Val Thr Leu Ile Ser Ala
355 360 365
Arg Pro Val Ser Gly Ala Pro Ala Pro Trp Val Glu Gln Cys Ile Cys
370 375 380
Pro Val Gly Tyr Lys Gly Gln Phe Cys Gln Asp Cys Ala Ser Gly Tyr
385 390 395 400
Lys Arg Asp Ser Ala Arg Leu Gly Pro Phe Gly Thr Cys Ile Pro Cys
405 410 415
Asn Cys Gln Gly Gly Gly Ala Cys Asp Pro Asp Thr Gly Asp Cys Tyr
420 425 430
Ser Gly Asp Glu Asn Pro Asp Ile Glu Cys Ala Asp Cys Pro Ile Gly
435 440 445
Phe Tyr Asn Asp Pro His Asp Pro Arg Ser Cys Lys Pro Cys Pro Cys
450 455 460
His Asn Gly Phe Ser Cys Ser Val Met Pro Glu Thr Glu Glu Val Val
465 470 475 480
Cys Asn Asn Cys Pro Pro Gly Val Thr Gly Ala Arg Cys Glu Leu Cys
485 490 495
Ala Asp Gly Tyr Phe Gly Asp Pro Phe Gly Glu His Gly Pro Val Arg
500 505 510
Pro Cys Gln Pro Cys Gln Cys Asn Asn Asn Val Asp Pro Ser Ala Ser
515 520 525
Gly Asn Cys Asp Arg Leu Thr Gly Arg Cys Leu Lys Cys Ile His Asn
530 535 540
Thr Ala Gly Ile Tyr Cys Asp Gln Cys Lys Ala Gly Tyr Phe Gly Asp
545 550 555 560
Pro Leu Ala Pro Asn Pro Ala Asp Lys Cys Arg Ala Cys Asn Cys Asn
565 570 575
Pro Met Gly Ser Glu Pro Val Gly Cys Arg Ser Asp Gly Thr Cys Val
580 585 590
Cys Lys Pro Gly Phe Gly Gly Pro Asn Cys Glu His Gly Ala Phe Ser
595 600 605
Cys Pro Ala Cys Tyr Asn Gln Val Lys Ile Gln Met Asp Gln Phe Met
610 615 620
Gln Gln Leu Gln Arg Met Glu Ala Leu Ile Ser Lys Ala Gln Gly Gly
625 630 635 640
Asp Gly Val Val Pro Asp Thr Glu Leu Glu Gly Arg Met Gln Gln Ala
645 650 655
Glu Gln Ala Leu Gln Asp Ile Leu Arg Asp Ala Gln Ile Ser Glu Gly
660 665 670
Ala Ser Arg Ser Leu Gly Leu Gln Leu Ala Lys Val Arg Ser Gln Glu
675 680 685
Asn Ser Tyr Gln Ser Arg Leu Asp Asp Leu Lys Met Thr Val Glu Arg
690 695 700
Val Arg Ala Leu Gly Ser Gln Tyr Gln Asn Arg Val Arg Asp Thr His
705 710 715 720
Arg Leu Ile Thr Gln Met Gln Leu Ser Leu Ala Glu Ser Glu Ala Ser
725 730 735
Leu Gly Asn Thr Asn Ile Pro Ala Ser Asp His Tyr Val Gly Pro Asn
740 745 750
Gly Phe Lys Ser Leu Ala Gln Glu Ala Thr Arg Leu Ala Glu Ser His
755 760 765
Val Glu Ser Ala Ser Asn Met Glu Gln Leu Thr Arg Glu Thr Glu Asp
770 775 780
Tyr Ser Lys Gln Ala Leu Ser Leu Val Arg Lys Ala Leu His Glu Gly
785 790 795 800
Val Gly Ser Gly Ser Gly Ser Pro Asp Gly Ala Val Val Gln Gly Leu
805 810 815
Val Glu Lys Leu Glu Lys Thr Lys Ser Leu Ala Gln Gln Leu Thr Arg
820 825 830
Glu Ala Thr Gln Ala Glu Ile Glu Ala Asp Arg Ser Tyr Gln His Ser
835 840 845
Leu Arg Leu Leu Asp Ser Val Ser Arg Leu Gln Gly Val Ser Asp Gln
850 855 860
Ser Phe Gln Val Glu Glu Ala Lys Arg Ile Lys Gln Lys Ala Asp Ser
865 870 875 880
Leu Ser Ser Leu Val Thr Arg His Met Asp Glu Phe Lys Arg Thr Gln
885 890 895
Lys Asn Leu Gly Asn Trp Lys Glu Glu Ala Gln Gln Leu Leu Gln Asn
900 905 910
Gly Lys Ser Gly Arg Glu Lys Ser Asp Gln Leu Leu Ser Arg Ala Asn
915 920 925
Leu Ala Lys Ser Arg Ala Gln Glu Ala Leu Ser Met Gly Asn Ala Thr
930 935 940
Phe Tyr Glu Val Glu Ser Ile Leu Lys Asn Leu Arg Glu Phe Asp Leu
945 950 955 960
Gln Val Asp Asn Arg Lys Ala Glu Ala Glu Glu Ala Met Lys Arg Leu
965 970 975
Ser Tyr Ile Ser Gln Lys Val Ser Asp Ala Ser Asp Lys Thr Gln Gln
980 985 990
Ala Glu Arg Ala Leu Gly Ser Ala Ala Ala Asp Ala Gln Arg Ala Lys
995 1000 1005
Asn Gly Ala Gly Glu Ala Leu Glu Ile Ser Ser Glu Ile Glu Gln Glu
1010 1015 1020
Ile Gly Ser Leu Asn Leu Glu Ala Asn Val Thr Ala Asp Gly Ala Leu
1025 1030 1035 1040
Ala Met Glu Lys Gly Leu Ala Ser Leu Lys Ser Glu Met Arg Glu Val
1045 1050 1055
Glu Gly Glu Leu Glu Arg Lys Glu Leu Glu Phe Asp Thr Asn Met Asp
1060 1065 1070
Ala Val Gln Met Val Ile Thr Glu Ala Gln Lys Val Asp Thr Arg Ala
1075 1080 1085
Lys Asn Ala Gly Val Thr Ile Gln Asp Thr Leu Asn Thr Leu Asp Gly
1090 1095 1100
Leu Leu His Leu Met Asp Gln Pro Leu Ser Val Asp Glu Glu Gly Leu
1105 1110 1115 1120
Val Leu Leu Glu Gln Lys Leu Ser Arg Ala Lys Thr Gln Ile Asn Ser
1125 1130 1135
Gln Leu Arg Pro Met Met Ser Glu Leu Glu Glu Arg Ala Arg Gln Gln
1140 1145 1150
Arg Gly His Leu His Leu Leu Glu Thr Ser Ile Asp Gly Ile Leu Ala
1155 1160 1165
Asp Val Lys Asn Leu Glu Asn Ile Arg Asp Asn Leu Pro Pro Gly Cys
1170 1175 1180
Tyr Asn Thr Gln Ala Leu Glu Gln Gln
1185 1190
<210> 60
<211> 1296
<212> PRT
<213> 肉毒梭菌(Clostridium botulinum)
<400> 60
Met Pro Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly
1 5 10 15
Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Ala Gly Gln Met Gln Pro
20 25 30
Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg
35 40 45
Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu
50 55 60
Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr
65 70 75 80
Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu
85 90 95
Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val
100 105 110
Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys
115 120 125
Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr
130 135 140
Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile
145 150 155 160
Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr
165 170 175
Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe
180 185 190
Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu
195 200 205
Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu
210 215 220
Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn
225 230 235 240
Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu
245 250 255
Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys
260 265 270
Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn
275 280 285
Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val
290 295 300
Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys
305 310 315 320
Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu
325 330 335
Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp
340 345 350
Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn
355 360 365
Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr
370 375 380
Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn
385 390 395 400
Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu
405 410 415
Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg
420 425 430
Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Asp Lys Gly Tyr Asn Lys
435 440 445
Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe
450 455 460
Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu
465 470 475 480
Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu
485 490 495
Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro
500 505 510
Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu
515 520 525
Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu
530 535 540
Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu
545 550 555 560
His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu
565 570 575
Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys
580 585 590
Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu
595 600 605
Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr
610 615 620
Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala
625 630 635 640
Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu
645 650 655
Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala
660 665 670
Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys
675 680 685
Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu
690 695 700
Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys
705 710 715 720
Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu
725 730 735
Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn
740 745 750
Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp
755 760 765
Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile
770 775 780
Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met
785 790 795 800
Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys
805 810 815
Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly
820 825 830
Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp
835 840 845
Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser
850 855 860
Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn
865 870 875 880
Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser
885 890 895
Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn
900 905 910
Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu
915 920 925
Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser
930 935 940
Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn
945 950 955 960
Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val
965 970 975
Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu
980 985 990
Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser
995 1000 1005
Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg Leu
1010 1015 1020
Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln Lys Pro
1025 1030 1035 1040
Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile Met Phe Lys
1045 1050 1055
Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp Ile Lys Tyr Phe
1060 1065 1070
Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu Ile Lys Asp Leu Tyr
1075 1080 1085
Asp Asn Gln Ser Asn Ser Gly Ile Leu Lys Asp Phe Trp Gly Asp Tyr
1090 1095 1100
Leu Gln Tyr Asp Lys Pro Tyr Tyr Met Leu Asn Leu Tyr Asp Pro Asn
1105 1110 1115 1120
Lys Tyr Val Asp Val Asn Asn Val Gly Ile Arg Gly Tyr Met Tyr Leu
1125 1130 1135
Lys Gly Pro Arg Gly Ser Val Met Thr Thr Asn Ile Tyr Leu Asn Ser
1140 1145 1150
Ser Leu Tyr Arg Gly Thr Lys Phe Ile Ile Lys Lys Tyr Ala Ser Gly
1155 1160 1165
Asn Lys Asp Asn Ile Val Arg Asn Asn Asp Arg Val Tyr Ile Asn Val
1170 1175 1180
Val Val Lys Asn Lys Glu Tyr Arg Leu Ala Thr Asn Ala Ser Gln Ala
1185 1190 1195 1200
Gly Val Glu Lys Ile Leu Ser Ala Leu Glu Ile Pro Asp Val Gly Asn
1205 1210 1215
Leu Ser Gln Val Val Val Met Lys Ser Lys Asn Asp Gln Gly Ile Thr
1220 1225 1230
Asn Lys Cys Lys Met Asn Leu Gln Asp Asn Asn Gly Asn Asp Ile Gly
1235 1240 1245
Phe Ile Gly Phe His Gln Phe Asn Asn Ile Ala Lys Leu Val Ala Ser
1250 1255 1260
Asn Trp Tyr Asn Arg Gln Ile Glu Arg Ser Ser Arg Thr Leu Gly Cys
1265 1270 1275 1280
Ser Trp Glu Phe Ile Pro Val Asp Asp Gly Trp Gly Glu Arg Pro Leu
1285 1290 1295
<210> 61
<211> 1291
<212> PRT
<213> 肉毒梭菌(Clostridium botulinum)
<400> 61
Met Pro Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn
1 5 10 15
Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg
20 25 30
Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu
35 40 45
Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly
50 55 60
Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn
65 70 75 80
Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe
85 90 95
Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile
100 105 110
Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu
115 120 125
Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn
130 135 140
Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile
145 150 155 160
Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly
165 170 175
Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln
180 185 190
Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu
195 200 205
Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro
210 215 220
Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr
225 230 235 240
Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe
245 250 255
Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe
260 265 270
Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile
275 280 285
Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn
290 295 300
Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr
305 310 315 320
Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly
325 330 335
Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu
340 345 350
Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys
355 360 365
Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys
370 375 380
Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile
385 390 395 400
Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile
405 410 415
Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr
420 425 430
Lys Ile Gln Met Cys Lys Ser Val Lys Ala Pro Gly Ile Cys Ile Asp
435 440 445
Val Asp Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser
450 455 460
Asp Asp Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn
465 470 475 480
Tyr Ile Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp
485 490 495
Leu Ile Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr
500 505 510
Asp Phe Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys
515 520 525
Lys Ile Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln
530 535 540
Thr Phe Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp
545 550 555 560
Asp Ala Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp
565 570 575
Tyr Ile Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly
580 585 590
Trp Val Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser
595 600 605
Asn Thr Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile
610 615 620
Gly Leu Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu
625 630 635 640
Asn Ala Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro
645 650 655
Glu Leu Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile
660 665 670
Asp Asn Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys
675 680 685
Arg Asn Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp
690 695 700
Leu Ser Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr
705 710 715 720
Lys Ala Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr
725 730 735
Arg Tyr Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp
740 745 750
Phe Asn Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile
755 760 765
Asp Asn Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met
770 775 780
Lys Lys Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn
785 790 795 800
Thr Leu Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr
805 810 815
Leu Ile Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu
820 825 830
Lys Thr Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile
835 840 845
Leu Ile Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Asn Asn Ile
850 855 860
Ile Leu Asn Leu Arg Tyr Lys Asp Asn Asn Leu Ile Asp Leu Ser Gly
865 870 875 880
Tyr Gly Ala Lys Val Glu Val Tyr Asp Gly Val Glu Leu Asn Asp Lys
885 890 895
Asn Gln Phe Lys Leu Thr Ser Ser Ala Asn Ser Lys Ile Arg Val Thr
900 905 910
Gln Asn Gln Asn Ile Ile Phe Asn Ser Val Phe Leu Asp Phe Ser Val
915 920 925
Ser Phe Trp Ile Arg Ile Pro Lys Tyr Lys Asn Asp Gly Ile Gln Asn
930 935 940
Tyr Ile His Asn Glu Tyr Thr Ile Ile Asn Cys Met Lys Asn Asn Ser
945 950 955 960
Gly Trp Lys Ile Ser Ile Arg Gly Asn Arg Ile Ile Trp Thr Leu Ile
965 970 975
Asp Ile Asn Gly Lys Thr Lys Ser Val Phe Phe Glu Tyr Asn Ile Arg
980 985 990
Glu Asp Ile Ser Glu Tyr Ile Asn Arg Trp Phe Phe Val Thr Ile Thr
995 1000 1005
Asn Asn Leu Asn Asn Ala Lys Ile Tyr Ile Asn Gly Lys Leu Glu Ser
1010 1015 1020
Asn Thr Asp Ile Lys Asp Ile Arg Glu Val Ile Ala Asn Gly Glu Ile
1025 1030 1035 1040
Ile Phe Lys Leu Asp Gly Asp Ile Asp Arg Thr Gln Phe Ile Trp Met
1045 1050 1055
Lys Tyr Phe Ser Ile Phe Asn Thr Glu Leu Ser Gln Ser Asn Ile Glu
1060 1065 1070
Glu Arg Tyr Lys Ile Gln Ser Tyr Ser Glu Tyr Leu Lys Asp Phe Trp
1075 1080 1085
Gly Asn Pro Leu Met Tyr Asn Lys Glu Tyr Tyr Met Phe Asn Ala Gly
1090 1095 1100
Asn Lys Asn Ser Tyr Ile Lys Leu Lys Lys Asp Ser Pro Val Gly Glu
1105 1110 1115 1120
Ile Leu Thr Arg Ser Lys Tyr Asn Gln Asn Ser Lys Tyr Ile Asn Tyr
1125 1130 1135
Arg Asp Leu Tyr Ile Gly Glu Lys Phe Ile Ile Arg Arg Lys Ser Asn
1140 1145 1150
Ser Gln Ser Ile Asn Asp Asp Ile Val Arg Lys Glu Asp Tyr Ile Tyr
1155 1160 1165
Leu Asp Phe Phe Asn Leu Asn Gln Glu Trp Arg Val Tyr Thr Tyr Lys
1170 1175 1180
Tyr Phe Lys Lys Glu Glu Glu Lys Leu Phe Leu Ala Pro Ile Ser Asp
1185 1190 1195 1200
Ser Asp Glu Phe Tyr Asn Thr Ile Gln Ile Lys Glu Tyr Asp Glu Gln
1205 1210 1215
Pro Thr Tyr Ser Cys Gln Leu Leu Phe Lys Lys Asp Glu Glu Ser Thr
1220 1225 1230
Asp Glu Ile Gly Leu Ile Gly Ile His Arg Phe Tyr Glu Ser Gly Ile
1235 1240 1245
Val Phe Glu Glu Tyr Lys Asp Tyr Phe Cys Ile Ser Lys Trp Tyr Leu
1250 1255 1260
Lys Glu Val Lys Arg Lys Pro Tyr Asn Leu Lys Leu Gly Cys Asn Trp
1265 1270 1275 1280
Gln Phe Ile Pro Lys Asp Glu Gly Trp Thr Glu
1285 1290
<210> 62
<211> 2871
<212> PRT
<213> 智人(Homo sapiens)
<400> 62
Met Arg Arg Gly Arg Leu Leu Glu Ile Ala Leu Gly Phe Thr Val Leu
1 5 10 15
Leu Ala Ser Tyr Thr Ser His Gly Ala Asp Ala Asn Leu Glu Ala Gly
20 25 30
Asn Val Lys Glu Thr Arg Ala Ser Arg Ala Lys Arg Arg Gly Gly Gly
35 40 45
Gly His Asp Ala Leu Lys Gly Pro Asn Val Cys Gly Ser Arg Tyr Asn
50 55 60
Ala Tyr Cys Cys Pro Gly Trp Lys Thr Leu Pro Gly Gly Asn Gln Cys
65 70 75 80
Ile Val Pro Ile Cys Arg His Ser Cys Gly Asp Gly Phe Cys Ser Arg
85 90 95
Pro Asn Met Cys Thr Cys Pro Ser Gly Gln Ile Ala Pro Ser Cys Gly
100 105 110
Ser Arg Ser Ile Gln His Cys Asn Ile Arg Cys Met Asn Gly Gly Ser
115 120 125
Cys Ser Asp Asp His Cys Leu Cys Gln Lys Gly Tyr Ile Gly Thr His
130 135 140
Cys Gly Gln Pro Val Cys Glu Ser Gly Cys Leu Asn Gly Gly Arg Cys
145 150 155 160
Val Ala Pro Asn Arg Cys Ala Cys Thr Tyr Gly Phe Thr Gly Pro Gln
165 170 175
Cys Glu Arg Asp Tyr Arg Thr Gly Pro Cys Phe Thr Val Ile Ser Asn
180 185 190
Gln Met Cys Gln Gly Gln Leu Ser Gly Ile Val Cys Thr Lys Thr Leu
195 200 205
Cys Cys Ala Thr Val Gly Arg Ala Trp Gly His Pro Cys Glu Met Cys
210 215 220
Pro Ala Gln Pro His Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile Arg
225 230 235 240
Thr Gly Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Ile Pro Gly Leu
245 250 255
Cys Gln Gly Gly Asn Cys Ile Asn Thr Val Gly Ser Phe Glu Cys Lys
260 265 270
Cys Pro Ala Gly His Lys Leu Asn Glu Val Ser Gln Lys Cys Glu Asp
275 280 285
Ile Asp Glu Cys Ser Thr Ile Pro Gly Ile Cys Glu Gly Gly Glu Cys
290 295 300
Thr Asn Thr Val Ser Ser Tyr Phe Cys Lys Cys Pro Pro Gly Phe Tyr
305 310 315 320
Thr Ser Pro Asp Gly Thr Arg Cys Ile Asp Val Arg Pro Gly Tyr Cys
325 330 335
Tyr Thr Ala Leu Thr Asn Gly Arg Cys Ser Asn Gln Leu Pro Gln Ser
340 345 350
Ile Thr Lys Met Gln Cys Cys Cys Asp Ala Gly Arg Cys Trp Ser Pro
355 360 365
Gly Val Thr Val Ala Pro Glu Met Cys Pro Ile Arg Ala Thr Glu Asp
370 375 380
Phe Asn Lys Leu Cys Ser Val Pro Met Val Ile Pro Gly Arg Pro Glu
385 390 395 400
Tyr Pro Pro Pro Pro Leu Gly Pro Ile Pro Pro Val Leu Pro Val Pro
405 410 415
Pro Gly Phe Pro Pro Gly Pro Gln Ile Pro Val Pro Arg Pro Pro Val
420 425 430
Glu Tyr Leu Tyr Pro Ser Arg Glu Pro Pro Arg Val Leu Pro Val Asn
435 440 445
Val Thr Asp Tyr Cys Gln Leu Val Arg Tyr Leu Cys Gln Asn Gly Arg
450 455 460
Cys Ile Pro Thr Pro Gly Ser Tyr Arg Cys Glu Cys Asn Lys Gly Phe
465 470 475 480
Gln Leu Asp Leu Arg Gly Glu Cys Ile Asp Val Asp Glu Cys Glu Lys
485 490 495
Asn Pro Cys Ala Gly Gly Glu Cys Ile Asn Asn Gln Gly Ser Tyr Thr
500 505 510
Cys Gln Cys Arg Ala Gly Tyr Gln Ser Thr Leu Thr Arg Thr Glu Cys
515 520 525
Arg Asp Ile Asp Glu Cys Leu Gln Asn Gly Arg Ile Cys Asn Asn Gly
530 535 540
Arg Cys Ile Asn Thr Asp Gly Ser Phe His Cys Val Cys Asn Ala Gly
545 550 555 560
Phe His Val Thr Arg Asp Gly Lys Asn Cys Glu Asp Met Asp Glu Cys
565 570 575
Ser Ile Arg Asn Met Cys Leu Asn Gly Met Cys Ile Asn Glu Asp Gly
580 585 590
Ser Phe Lys Cys Ile Cys Lys Pro Gly Phe Gln Leu Ala Ser Asp Gly
595 600 605
Arg Tyr Cys Lys Asp Ile Asn Glu Cys Glu Thr Pro Gly Ile Cys Met
610 615 620
Asn Gly Arg Cys Val Asn Thr Asp Gly Ser Tyr Arg Cys Glu Cys Phe
625 630 635 640
Pro Gly Leu Ala Val Gly Leu Asp Gly Arg Val Cys Val Asp Thr His
645 650 655
Met Arg Ser Thr Cys Tyr Gly Gly Tyr Lys Arg Gly Gln Cys Ile Lys
660 665 670
Pro Leu Phe Gly Ala Val Thr Lys Ser Glu Cys Cys Cys Ala Ser Thr
675 680 685
Glu Tyr Ala Phe Gly Glu Pro Cys Gln Pro Cys Pro Ala Gln Asn Ser
690 695 700
Ala Glu Tyr Gln Ala Leu Cys Ser Ser Gly Pro Gly Met Thr Ser Ala
705 710 715 720
Gly Ser Asp Ile Asn Glu Cys Ala Leu Asp Pro Asp Ile Cys Pro Asn
725 730 735
Gly Ile Cys Glu Asn Leu Arg Gly Thr Tyr Lys Cys Ile Cys Asn Ser
740 745 750
Gly Tyr Glu Val Asp Ser Thr Gly Lys Asn Cys Val Asp Ile Asn Glu
755 760 765
Cys Val Leu Asn Ser Leu Leu Cys Asp Asn Gly Gln Cys Arg Asn Thr
770 775 780
Pro Gly Ser Phe Val Cys Thr Cys Pro Lys Gly Phe Ile Tyr Lys Pro
785 790 795 800
Asp Leu Lys Thr Cys Glu Asp Ile Asp Glu Cys Glu Ser Ser Pro Cys
805 810 815
Ile Asn Gly Val Cys Lys Asn Ser Pro Gly Ser Phe Ile Cys Glu Cys
820 825 830
Ser Ser Glu Ser Thr Leu Asp Pro Thr Lys Thr Ile Cys Ile Glu Thr
835 840 845
Ile Lys Gly Thr Cys Trp Gln Thr Val Ile Asp Gly Arg Cys Glu Ile
850 855 860
Asn Ile Asn Gly Ala Thr Leu Lys Ser Gln Cys Cys Ser Ser Leu Gly
865 870 875 880
Ala Ala Trp Gly Ser Pro Cys Thr Leu Cys Gln Val Asp Pro Ile Cys
885 890 895
Gly Lys Gly Tyr Ser Arg Ile Lys Gly Thr Gln Cys Glu Asp Ile Asp
900 905 910
Glu Cys Glu Val Phe Pro Gly Val Cys Lys Asn Gly Leu Cys Val Asn
915 920 925
Thr Arg Gly Ser Phe Lys Cys Gln Cys Pro Ser Gly Met Thr Leu Asp
930 935 940
Ala Thr Gly Arg Ile Cys Leu Asp Ile Arg Leu Glu Thr Cys Phe Leu
945 950 955 960
Arg Tyr Glu Asp Glu Glu Cys Thr Leu Pro Ile Ala Gly Arg His Arg
965 970 975
Met Asp Ala Cys Cys Cys Ser Val Gly Ala Ala Trp Gly Thr Glu Glu
980 985 990
Cys Glu Glu Cys Pro Met Arg Asn Thr Pro Glu Tyr Glu Glu Leu Cys
995 1000 1005
Pro Arg Gly Pro Gly Phe Ala Thr Lys Glu Ile Thr Asn Gly Lys Pro
1010 1015 1020
Phe Phe Lys Asp Ile Asn Glu Cys Lys Met Ile Pro Ser Leu Cys Thr
1025 1030 1035 1040
His Gly Lys Cys Arg Asn Thr Ile Gly Ser Phe Lys Cys Arg Cys Asp
1045 1050 1055
Ser Gly Phe Ala Leu Asp Ser Glu Glu Arg Asn Cys Thr Asp Ile Asp
1060 1065 1070
Glu Cys Arg Ile Ser Pro Asp Leu Cys Gly Arg Gly Gln Cys Val Asn
1075 1080 1085
Thr Pro Gly Asp Phe Glu Cys Lys Cys Asp Glu Gly Tyr Glu Ser Gly
1090 1095 1100
Phe Met Met Met Lys Asn Cys Met Asp Ile Asp Glu Cys Gln Arg Asp
1105 1110 1115 1120
Pro Leu Leu Cys Arg Gly Gly Val Cys His Asn Thr Glu Gly Ser Tyr
1125 1130 1135
Arg Cys Glu Cys Pro Pro Gly His Gln Leu Ser Pro Asn Ile Ser Ala
1140 1145 1150
Cys Ile Asp Ile Asn Glu Cys Glu Leu Ser Ala His Leu Cys Pro Asn
1155 1160 1165
Gly Arg Cys Val Asn Leu Ile Gly Lys Tyr Gln Cys Ala Cys Asn Pro
1170 1175 1180
Gly Tyr His Ser Thr Pro Asp Arg Leu Phe Cys Val Asp Ile Asp Glu
1185 1190 1195 1200
Cys Ser Ile Met Asn Gly Gly Cys Glu Thr Phe Cys Thr Asn Ser Glu
1205 1210 1215
Gly Ser Tyr Glu Cys Ser Cys Gln Pro Gly Phe Ala Leu Met Pro Asp
1220 1225 1230
Gln Arg Ser Cys Thr Asp Ile Asp Glu Cys Glu Asp Asn Pro Asn Ile
1235 1240 1245
Cys Asp Gly Gly Gln Cys Thr Asn Ile Pro Gly Glu Tyr Arg Cys Leu
1250 1255 1260
Cys Tyr Asp Gly Phe Met Ala Ser Glu Asp Met Lys Thr Cys Val Asp
1265 1270 1275 1280
Val Asn Glu Cys Asp Leu Asn Pro Asn Ile Cys Leu Ser Gly Thr Cys
1285 1290 1295
Glu Asn Thr Lys Gly Ser Phe Ile Cys His Cys Asp Met Gly Tyr Ser
1300 1305 1310
Gly Lys Lys Gly Lys Thr Gly Cys Thr Asp Ile Asn Glu Cys Glu Ile
1315 1320 1325
Gly Ala His Asn Cys Gly Lys His Ala Val Cys Thr Asn Thr Ala Gly
1330 1335 1340
Ser Phe Lys Cys Ser Cys Ser Pro Gly Trp Ile Gly Asp Gly Ile Lys
1345 1350 1355 1360
Cys Thr Asp Leu Asp Glu Cys Ser Asn Gly Thr His Met Cys Ser Gln
1365 1370 1375
His Ala Asp Cys Lys Asn Thr Met Gly Ser Tyr Arg Cys Leu Cys Lys
1380 1385 1390
Glu Gly Tyr Thr Gly Asp Gly Phe Thr Cys Thr Asp Leu Asp Glu Cys
1395 1400 1405
Ser Glu Asn Leu Asn Leu Cys Gly Asn Gly Gln Cys Leu Asn Ala Pro
1410 1415 1420
Gly Gly Tyr Arg Cys Glu Cys Asp Met Gly Phe Val Pro Ser Ala Asp
1425 1430 1435 1440
Gly Lys Ala Cys Glu Asp Ile Asp Glu Cys Ser Leu Pro Asn Ile Cys
1445 1450 1455
Val Phe Gly Thr Cys His Asn Leu Pro Gly Leu Phe Arg Cys Glu Cys
1460 1465 1470
Glu Ile Gly Tyr Glu Leu Asp Arg Ser Gly Gly Asn Cys Thr Asp Val
1475 1480 1485
Asn Glu Cys Leu Asp Pro Thr Thr Cys Ile Ser Gly Asn Cys Val Asn
1490 1495 1500
Thr Pro Gly Ser Tyr Ile Cys Asp Cys Pro Pro Asp Phe Glu Leu Asn
1505 1510 1515 1520
Pro Thr Arg Val Gly Cys Val Asp Thr Arg Ser Gly Asn Cys Tyr Leu
1525 1530 1535
Asp Ile Arg Pro Arg Gly Asp Asn Gly Asp Thr Ala Cys Ser Asn Glu
1540 1545 1550
Ile Gly Val Gly Val Ser Lys Ala Ser Cys Cys Cys Ser Leu Gly Lys
1555 1560 1565
Ala Trp Gly Thr Pro Cys Glu Met Cys Pro Ala Val Asn Thr Ser Glu
1570 1575 1580
Tyr Lys Ile Leu Cys Pro Gly Gly Glu Gly Phe Arg Pro Asn Pro Ile
1585 1590 1595 1600
Thr Val Ile Leu Glu Asp Ile Asp Glu Cys Gln Glu Leu Pro Gly Leu
1605 1610 1615
Cys Gln Gly Gly Lys Cys Ile Asn Thr Phe Gly Ser Phe Gln Cys Arg
1620 1625 1630
Cys Pro Thr Gly Tyr Tyr Leu Asn Glu Asp Thr Arg Val Cys Asp Asp
1635 1640 1645
Val Asn Glu Cys Glu Thr Pro Gly Ile Cys Gly Pro Gly Thr Cys Tyr
1650 1655 1660
Asn Thr Val Gly Asn Tyr Thr Cys Ile Cys Pro Pro Asp Tyr Met Gln
1665 1670 1675 1680
Val Asn Gly Gly Asn Asn Cys Met Asp Met Arg Arg Ser Leu Cys Tyr
1685 1690 1695
Arg Asn Tyr Tyr Ala Asp Asn Gln Thr Cys Asp Gly Glu Leu Leu Phe
1700 1705 1710
Asn Met Thr Lys Lys Met Cys Cys Cys Ser Tyr Asn Ile Gly Arg Ala
1715 1720 1725
Trp Asn Lys Pro Cys Glu Gln Cys Pro Ile Pro Ser Thr Asp Glu Phe
1730 1735 1740
Ala Thr Leu Cys Gly Ser Gln Arg Pro Gly Phe Val Ile Asp Ile Tyr
1745 1750 1755 1760
Thr Gly Leu Pro Val Asp Ile Asp Glu Cys Arg Glu Ile Pro Gly Val
1765 1770 1775
Cys Glu Asn Gly Val Cys Ile Asn Met Val Gly Ser Phe Arg Cys Glu
1780 1785 1790
Cys Pro Val Gly Phe Phe Tyr Asn Asp Lys Leu Leu Val Cys Glu Asp
1795 1800 1805
Ile Asp Glu Cys Gln Asn Gly Pro Val Cys Gln Arg Asn Ala Glu Cys
1810 1815 1820
Ile Asn Thr Ala Gly Ser Tyr Arg Cys Asp Cys Lys Pro Gly Tyr Arg
1825 1830 1835 1840
Phe Thr Ser Thr Gly Gln Cys Asn Asp Arg Asn Glu Cys Gln Glu Ile
1845 1850 1855
Pro Asn Ile Cys Ser His Gly Gln Cys Ile Asp Thr Val Gly Ser Phe
1860 1865 1870
Tyr Cys Leu Cys His Thr Gly Phe Lys Thr Asn Asp Asp Gln Thr Met
1875 1880 1885
Cys Leu Asp Ile Asn Glu Cys Glu Arg Asp Ala Cys Gly Asn Gly Thr
1890 1895 1900
Cys Arg Asn Thr Ile Gly Ser Phe Asn Cys Arg Cys Asn His Gly Phe
1905 1910 1915 1920
Ile Leu Ser His Asn Asn Asp Cys Ile Asp Val Asp Glu Cys Ala Ser
1925 1930 1935
Gly Asn Gly Asn Leu Cys Arg Asn Gly Gln Cys Ile Asn Thr Val Gly
1940 1945 1950
Ser Phe Gln Cys Gln Cys Asn Glu Gly Tyr Glu Val Ala Pro Asp Gly
1955 1960 1965
Arg Thr Cys Val Asp Ile Asn Glu Cys Leu Leu Glu Pro Arg Lys Cys
1970 1975 1980
Ala Pro Gly Thr Cys Gln Asn Leu Asp Gly Ser Tyr Arg Cys Ile Cys
1985 1990 1995 2000
Pro Pro Gly Tyr Ser Leu Gln Asn Glu Lys Cys Glu Asp Ile Asp Glu
2005 2010 2015
Cys Val Glu Glu Pro Glu Ile Cys Ala Leu Gly Thr Cys Ser Asn Thr
2020 2025 2030
Glu Gly Ser Phe Lys Cys Leu Cys Pro Glu Gly Phe Ser Leu Ser Ser
2035 2040 2045
Ser Gly Arg Arg Cys Gln Asp Leu Arg Met Ser Tyr Cys Tyr Ala Lys
2050 2055 2060
Phe Glu Gly Gly Lys Cys Ser Ser Pro Lys Ser Arg Asn His Ser Lys
2065 2070 2075 2080
Gln Glu Cys Cys Cys Ala Leu Lys Gly Glu Gly Trp Gly Asp Pro Cys
2085 2090 2095
Glu Leu Cys Pro Thr Glu Pro Asp Glu Ala Phe Arg Gln Ile Cys Pro
2100 2105 2110
Tyr Gly Ser Gly Ile Ile Val Gly Pro Asp Asp Ser Ala Val Asp Met
2115 2120 2125
Asp Glu Cys Lys Glu Pro Asp Val Cys Lys His Gly Gln Cys Ile Asn
2130 2135 2140
Thr Asp Gly Ser Tyr Arg Cys Glu Cys Pro Phe Gly Tyr Ile Leu Ala
2145 2150 2155 2160
Gly Asn Glu Cys Val Asp Thr Asp Glu Cys Ser Val Gly Asn Pro Cys
2165 2170 2175
Gly Asn Gly Thr Cys Lys Asn Val Ile Gly Gly Phe Glu Cys Thr Cys
2180 2185 2190
Glu Glu Gly Phe Glu Pro Gly Pro Met Met Thr Cys Glu Asp Ile Asn
2195 2200 2205
Glu Cys Ala Gln Asn Pro Leu Leu Cys Ala Phe Arg Cys Val Asn Thr
2210 2215 2220
Tyr Gly Ser Tyr Glu Cys Lys Cys Pro Val Gly Tyr Val Leu Arg Glu
2225 2230 2235 2240
Asp Arg Arg Met Cys Lys Asp Glu Asp Glu Cys Glu Glu Gly Lys His
2245 2250 2255
Asp Cys Thr Glu Lys Gln Met Glu Cys Lys Asn Leu Ile Gly Thr Tyr
2260 2265 2270
Met Cys Ile Cys Gly Pro Gly Tyr Gln Arg Arg Pro Asp Gly Glu Gly
2275 2280 2285
Cys Val Asp Glu Asn Glu Cys Gln Thr Lys Pro Gly Ile Cys Glu Asn
2290 2295 2300
Gly Arg Cys Leu Asn Thr Arg Gly Ser Tyr Thr Cys Glu Cys Asn Asp
2305 2310 2315 2320
Gly Phe Thr Ala Ser Pro Asn Gln Asp Glu Cys Leu Asp Asn Arg Glu
2325 2330 2335
Gly Tyr Cys Phe Thr Glu Val Leu Gln Asn Met Cys Gln Ile Gly Ser
2340 2345 2350
Ser Asn Arg Asn Pro Val Thr Lys Ser Glu Cys Cys Cys Asp Gly Gly
2355 2360 2365
Arg Gly Trp Gly Pro His Cys Glu Ile Cys Pro Phe Gln Gly Thr Val
2370 2375 2380
Ala Phe Lys Lys Leu Cys Pro His Gly Arg Gly Phe Met Thr Asn Gly
2385 2390 2395 2400
Ala Asp Ile Asp Glu Cys Lys Val Ile His Asp Val Cys Arg Asn Gly
2405 2410 2415
Glu Cys Val Asn Asp Arg Gly Ser Tyr His Cys Ile Cys Lys Thr Gly
2420 2425 2430
Tyr Thr Pro Asp Ile Thr Gly Thr Ser Cys Val Asp Leu Asn Glu Cys
2435 2440 2445
Asn Gln Ala Pro Lys Pro Cys Asn Phe Ile Cys Lys Asn Thr Glu Gly
2450 2455 2460
Ser Tyr Gln Cys Ser Cys Pro Lys Gly Tyr Ile Leu Gln Glu Asp Gly
2465 2470 2475 2480
Arg Ser Cys Lys Asp Leu Asp Glu Cys Ala Thr Lys Gln His Asn Cys
2485 2490 2495
Gln Phe Leu Cys Val Asn Thr Ile Gly Gly Phe Thr Cys Lys Cys Pro
2500 2505 2510
Pro Gly Phe Thr Gln His His Thr Ser Cys Ile Asp Asn Asn Glu Cys
2515 2520 2525
Thr Ser Asp Ile Asn Leu Cys Gly Ser Lys Gly Ile Cys Gln Asn Thr
2530 2535 2540
Pro Gly Ser Phe Thr Cys Glu Cys Gln Arg Gly Phe Ser Leu Asp Gln
2545 2550 2555 2560
Thr Gly Ser Ser Cys Glu Asp Val Asp Glu Cys Glu Gly Asn His Arg
2565 2570 2575
Cys Gln His Gly Cys Gln Asn Ile Ile Gly Gly Tyr Arg Cys Ser Cys
2580 2585 2590
Pro Gln Gly Tyr Leu Gln His Tyr Gln Trp Asn Gln Cys Val Asp Glu
2595 2600 2605
Asn Glu Cys Leu Ser Ala His Ile Cys Gly Gly Ala Ser Cys His Asn
2610 2615 2620
Thr Leu Gly Ser Tyr Lys Cys Met Cys Pro Ala Gly Phe Gln Tyr Glu
2625 2630 2635 2640
Gln Phe Ser Gly Gly Cys Gln Asp Ile Asn Glu Cys Gly Ser Ala Gln
2645 2650 2655
Ala Pro Cys Ser Tyr Gly Cys Ser Asn Thr Glu Gly Gly Tyr Leu Cys
2660 2665 2670
Gly Cys Pro Pro Gly Tyr Phe Arg Ile Gly Gln Gly His Cys Val Ser
2675 2680 2685
Gly Met Gly Met Gly Arg Gly Asn Pro Glu Pro Pro Val Ser Gly Glu
2690 2695 2700
Met Asp Asp Asn Ser Leu Ser Pro Glu Ala Cys Tyr Glu Cys Lys Ile
2705 2710 2715 2720
Asn Gly Tyr Pro Lys Arg Gly Arg Lys Arg Arg Ser Thr Asn Glu Thr
2725 2730 2735
Asp Ala Ser Asn Ile Glu Asp Gln Ser Glu Thr Glu Ala Asn Val Ser
2740 2745 2750
Leu Ala Ser Trp Asp Val Glu Lys Thr Ala Ile Phe Ala Phe Asn Ile
2755 2760 2765
Ser His Val Ser Asn Lys Val Arg Ile Leu Glu Leu Leu Pro Ala Leu
2770 2775 2780
Thr Thr Leu Thr Asn His Asn Arg Tyr Leu Ile Glu Ser Gly Asn Glu
2785 2790 2795 2800
Asp Gly Phe Phe Lys Ile Asn Gln Lys Glu Gly Ile Ser Tyr Leu His
2805 2810 2815
Phe Thr Lys Lys Lys Pro Val Ala Gly Thr Tyr Ser Leu Gln Ile Ser
2820 2825 2830
Ser Thr Pro Leu Tyr Lys Lys Lys Glu Leu Asn Gln Leu Glu Asp Lys
2835 2840 2845
Tyr Asp Lys Asp Tyr Leu Ser Gly Glu Leu Gly Asp Asn Leu Lys Met
2850 2855 2860
Lys Ile Gln Val Leu Leu His
2865 2870
<210> 63
<211> 2912
<212> PRT
<213> 智人(Homo sapiens)
<400> 63
Met Gly Arg Arg Arg Arg Leu Cys Leu Gln Leu Tyr Phe Leu Trp Leu
1 5 10 15
Gly Cys Val Val Leu Trp Ala Gln Gly Thr Ala Gly Gln Pro Gln Pro
20 25 30
Pro Pro Pro Lys Pro Pro Arg Pro Gln Pro Pro Pro Gln Gln Val Arg
35 40 45
Ser Ala Thr Ala Gly Ser Glu Gly Gly Phe Leu Ala Pro Glu Tyr Arg
50 55 60
Glu Glu Gly Ala Ala Val Ala Ser Arg Val Arg Arg Arg Gly Gln Gln
65 70 75 80
Asp Val Leu Arg Gly Pro Asn Val Cys Gly Ser Arg Phe His Ser Tyr
85 90 95
Cys Cys Pro Gly Trp Lys Thr Leu Pro Gly Gly Asn Gln Cys Ile Val
100 105 110
Pro Ile Cys Arg Asn Ser Cys Gly Asp Gly Phe Cys Ser Arg Pro Asn
115 120 125
Met Cys Thr Cys Ser Ser Gly Gln Ile Ser Ser Thr Cys Gly Ser Lys
130 135 140
Ser Ile Gln Gln Cys Ser Val Arg Cys Met Asn Gly Gly Thr Cys Ala
145 150 155 160
Asp Asp His Cys Gln Cys Gln Lys Gly Tyr Ile Gly Thr Tyr Cys Gly
165 170 175
Gln Pro Val Cys Glu Asn Gly Cys Gln Asn Gly Gly Arg Cys Ile Gly
180 185 190
Pro Asn Arg Cys Ala Cys Val Tyr Gly Phe Thr Gly Pro Gln Cys Glu
195 200 205
Arg Asp Tyr Arg Thr Gly Pro Cys Phe Thr Gln Val Asn Asn Gln Met
210 215 220
Cys Gln Gly Gln Leu Thr Gly Ile Val Cys Thr Lys Thr Leu Cys Cys
225 230 235 240
Ala Thr Ile Gly Arg Ala Trp Gly His Pro Cys Glu Met Cys Pro Ala
245 250 255
Gln Pro Gln Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile Arg Thr Gly
260 265 270
Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Ile Pro Gly Ile Cys Gln
275 280 285
Gly Gly Asn Cys Ile Asn Thr Val Gly Ser Phe Glu Cys Arg Cys Pro
290 295 300
Ala Gly His Lys Gln Ser Glu Thr Thr Gln Lys Cys Glu Asp Ile Asp
305 310 315 320
Glu Cys Ser Ile Ile Pro Gly Ile Cys Glu Thr Gly Glu Cys Ser Asn
325 330 335
Thr Val Gly Ser Tyr Phe Cys Val Cys Pro Arg Gly Tyr Val Thr Ser
340 345 350
Thr Asp Gly Ser Arg Cys Ile Asp Gln Arg Thr Gly Met Cys Phe Ser
355 360 365
Gly Leu Val Asn Gly Arg Cys Ala Gln Glu Leu Pro Gly Arg Met Thr
370 375 380
Lys Met Gln Cys Cys Cys Glu Pro Gly Arg Cys Trp Gly Ile Gly Thr
385 390 395 400
Ile Pro Glu Ala Cys Pro Val Arg Gly Ser Glu Glu Tyr Arg Arg Leu
405 410 415
Cys Met Asp Gly Leu Pro Met Gly Gly Ile Pro Gly Ser Ala Gly Ser
420 425 430
Arg Pro Gly Gly Thr Gly Gly Asn Gly Phe Ala Pro Ser Gly Asn Gly
435 440 445
Asn Gly Tyr Gly Pro Gly Gly Thr Gly Phe Ile Pro Ile Pro Gly Gly
450 455 460
Asn Gly Phe Ser Pro Gly Val Gly Gly Ala Gly Val Gly Ala Gly Gly
465 470 475 480
Gln Gly Pro Ile Ile Thr Gly Leu Thr Ile Leu Asn Gln Thr Ile Asp
485 490 495
Ile Cys Lys His His Ala Asn Leu Cys Leu Asn Gly Arg Cys Ile Pro
500 505 510
Thr Val Ser Ser Tyr Arg Cys Glu Cys Asn Met Gly Tyr Lys Gln Asp
515 520 525
Ala Asn Gly Asp Cys Ile Asp Val Asp Glu Cys Thr Ser Asn Pro Cys
530 535 540
Thr Asn Gly Asp Cys Val Asn Thr Pro Gly Ser Tyr Tyr Cys Lys Cys
545 550 555 560
His Ala Gly Phe Gln Arg Thr Pro Thr Lys Gln Ala Cys Ile Asp Ile
565 570 575
Asp Glu Cys Ile Gln Asn Gly Val Leu Cys Lys Asn Gly Arg Cys Val
580 585 590
Asn Thr Asp Gly Ser Phe Gln Cys Ile Cys Asn Ala Gly Phe Glu Leu
595 600 605
Thr Thr Asp Gly Lys Asn Cys Val Asp His Asp Glu Cys Thr Thr Thr
610 615 620
Asn Met Cys Leu Asn Gly Met Cys Ile Asn Glu Asp Gly Ser Phe Lys
625 630 635 640
Cys Ile Cys Lys Pro Gly Phe Val Leu Ala Pro Asn Gly Arg Tyr Cys
645 650 655
Thr Asp Val Asp Glu Cys Gln Thr Pro Gly Ile Cys Met Asn Gly His
660 665 670
Cys Ile Asn Ser Glu Gly Ser Phe Arg Cys Asp Cys Pro Pro Gly Leu
675 680 685
Ala Val Gly Met Asp Gly Arg Val Cys Val Asp Thr His Met Arg Ser
690 695 700
Thr Cys Tyr Gly Gly Ile Lys Lys Gly Val Cys Val Arg Pro Phe Pro
705 710 715 720
Gly Ala Val Thr Lys Ser Glu Cys Cys Cys Ala Asn Pro Asp Tyr Gly
725 730 735
Phe Gly Glu Pro Cys Gln Pro Cys Pro Ala Lys Asn Ser Ala Glu Phe
740 745 750
His Gly Leu Cys Ser Ser Gly Val Gly Ile Thr Val Asp Gly Arg Asp
755 760 765
Ile Asn Glu Cys Ala Leu Asp Pro Asp Ile Cys Ala Asn Gly Ile Cys
770 775 780
Glu Asn Leu Arg Gly Ser Tyr Arg Cys Asn Cys Asn Ser Gly Tyr Glu
785 790 795 800
Pro Asp Ala Ser Gly Arg Asn Cys Ile Asp Ile Asp Glu Cys Leu Val
805 810 815
Asn Arg Leu Leu Cys Asp Asn Gly Leu Cys Arg Asn Thr Pro Gly Ser
820 825 830
Tyr Ser Cys Thr Cys Pro Pro Gly Tyr Val Phe Arg Thr Glu Thr Glu
835 840 845
Thr Cys Glu Asp Ile Asn Glu Cys Glu Ser Asn Pro Cys Val Asn Gly
850 855 860
Ala Cys Arg Asn Asn Leu Gly Ser Phe Asn Cys Glu Cys Ser Pro Gly
865 870 875 880
Ser Lys Leu Ser Ser Thr Gly Leu Ile Cys Ile Asp Ser Leu Lys Gly
885 890 895
Thr Cys Trp Leu Asn Ile Gln Asp Ser Arg Cys Glu Val Asn Ile Asn
900 905 910
Gly Ala Thr Leu Lys Ser Glu Cys Cys Ala Thr Leu Gly Ala Ala Trp
915 920 925
Gly Ser Pro Cys Glu Arg Cys Glu Leu Asp Thr Ala Cys Pro Arg Gly
930 935 940
Leu Ala Arg Ile Lys Gly Val Thr Cys Glu Asp Val Asn Glu Cys Glu
945 950 955 960
Val Phe Pro Gly Val Cys Pro Asn Gly Arg Cys Val Asn Ser Lys Gly
965 970 975
Ser Phe His Cys Glu Cys Pro Glu Gly Leu Thr Leu Asp Gly Thr Gly
980 985 990
Arg Val Cys Leu Asp Ile Arg Met Glu Gln Cys Tyr Leu Lys Trp Asp
995 1000 1005
Glu Asp Glu Cys Ile His Pro Val Pro Gly Lys Phe Arg Met Asp Ala
1010 1015 1020
Cys Cys Cys Ala Val Gly Ala Ala Trp Gly Thr Glu Cys Glu Glu Cys
1025 1030 1035 1040
Pro Lys Pro Gly Thr Lys Glu Tyr Glu Thr Leu Cys Pro Arg Gly Ala
1045 1050 1055
Gly Phe Ala Asn Arg Gly Asp Val Leu Thr Gly Arg Pro Phe Tyr Lys
1060 1065 1070
Asp Ile Asn Glu Cys Lys Ala Phe Pro Gly Met Cys Thr Tyr Gly Lys
1075 1080 1085
Cys Arg Asn Thr Ile Gly Ser Phe Lys Cys Arg Cys Asn Ser Gly Phe
1090 1095 1100
Ala Leu Asp Met Glu Glu Arg Asn Cys Thr Asp Ile Asp Glu Cys Arg
1105 1110 1115 1120
Ile Ser Pro Asp Leu Cys Gly Ser Gly Ile Cys Val Asn Thr Pro Gly
1125 1130 1135
Ser Phe Glu Cys Glu Cys Phe Glu Gly Tyr Glu Ser Gly Phe Met Met
1140 1145 1150
Met Lys Asn Cys Met Asp Ile Asp Glu Cys Glu Arg Asn Pro Leu Leu
1155 1160 1165
Cys Arg Gly Gly Thr Cys Val Asn Thr Glu Gly Ser Phe Gln Cys Asp
1170 1175 1180
Cys Pro Leu Gly His Glu Leu Ser Pro Ser Arg Glu Asp Cys Val Asp
1185 1190 1195 1200
Ile Asn Glu Cys Ser Leu Ser Asp Asn Leu Cys Arg Asn Gly Lys Cys
1205 1210 1215
Val Asn Met Ile Gly Thr Tyr Gln Cys Ser Cys Asn Pro Gly Tyr Gln
1220 1225 1230
Ala Thr Pro Asp Arg Gln Gly Cys Thr Asp Ile Asp Glu Cys Met Ile
1235 1240 1245
Met Asn Gly Gly Cys Asp Thr Gln Cys Thr Asn Ser Glu Gly Ser Tyr
1250 1255 1260
Glu Cys Ser Cys Ser Glu Gly Tyr Ala Leu Met Pro Asp Gly Arg Ser
1265 1270 1275 1280
Cys Ala Asp Ile Asp Glu Cys Glu Asn Asn Pro Asp Ile Cys Asp Gly
1285 1290 1295
Gly Gln Cys Thr Asn Ile Pro Gly Glu Tyr Arg Cys Leu Cys Tyr Asp
1300 1305 1310
Gly Phe Met Ala Ser Met Asp Met Lys Thr Cys Ile Asp Val Asn Glu
1315 1320 1325
Cys Asp Leu Asn Ser Asn Ile Cys Met Phe Gly Glu Cys Glu Asn Thr
1330 1335 1340
Lys Gly Ser Phe Ile Cys His Cys Gln Leu Gly Tyr Ser Val Lys Lys
1345 1350 1355 1360
Gly Thr Thr Gly Cys Thr Asp Val Asp Glu Cys Glu Ile Gly Ala His
1365 1370 1375
Asn Cys Asp Met His Ala Ser Cys Leu Asn Ile Pro Gly Ser Phe Lys
1380 1385 1390
Cys Ser Cys Arg Glu Gly Trp Ile Gly Asn Gly Ile Lys Cys Ile Asp
1395 1400 1405
Leu Asp Glu Cys Ser Asn Gly Thr His Gln Cys Ser Ile Asn Ala Gln
1410 1415 1420
Cys Val Asn Thr Pro Gly Ser Tyr Arg Cys Ala Cys Ser Glu Gly Phe
1425 1430 1435 1440
Thr Gly Asp Gly Phe Thr Cys Ser Asp Val Asp Glu Cys Ala Glu Asn
1445 1450 1455
Ile Asn Leu Cys Glu Asn Gly Gln Cys Leu Asn Val Pro Gly Ala Tyr
1460 1465 1470
Arg Cys Glu Cys Glu Met Gly Phe Thr Pro Ala Ser Asp Ser Arg Ser
1475 1480 1485
Cys Gln Asp Ile Asp Glu Cys Ser Phe Gln Asn Ile Cys Val Phe Gly
1490 1495 1500
Thr Cys Asn Asn Leu Pro Gly Met Phe His Cys Ile Cys Asp Asp Gly
1505 1510 1515 1520
Tyr Glu Leu Asp Arg Thr Gly Gly Asn Cys Thr Asp Ile Asp Glu Cys
1525 1530 1535
Ala Asp Pro Ile Asn Cys Val Asn Gly Leu Cys Val Asn Thr Pro Gly
1540 1545 1550
Arg Tyr Glu Cys Asn Cys Pro Pro Asp Phe Gln Leu Asn Pro Thr Gly
1555 1560 1565
Val Gly Cys Val Asp Asn Arg Val Gly Asn Cys Tyr Leu Lys Phe Gly
1570 1575 1580
Pro Arg Gly Asp Gly Ser Leu Ser Cys Asn Thr Glu Ile Gly Val Gly
1585 1590 1595 1600
Val Ser Arg Ser Ser Cys Cys Cys Ser Leu Gly Lys Ala Trp Gly Asn
1605 1610 1615
Pro Cys Glu Thr Cys Pro Pro Val Asn Ser Thr Glu Tyr Tyr Thr Leu
1620 1625 1630
Cys Pro Gly Gly Glu Gly Phe Arg Pro Asn Pro Ile Thr Ile Ile Leu
1635 1640 1645
Glu Asp Ile Asp Glu Cys Gln Glu Leu Pro Gly Leu Cys Gln Gly Gly
1650 1655 1660
Asn Cys Ile Asn Thr Phe Gly Ser Phe Gln Cys Glu Cys Pro Gln Gly
1665 1670 1675 1680
Tyr Tyr Leu Ser Glu Asp Thr Arg Ile Cys Glu Asp Ile Asp Glu Cys
1685 1690 1695
Phe Ala His Pro Gly Val Cys Gly Pro Gly Thr Cys Tyr Asn Thr Leu
1700 1705 1710
Gly Asn Tyr Thr Cys Ile Cys Pro Pro Glu Tyr Met Gln Val Asn Gly
1715 1720 1725
Gly His Asn Cys Met Asp Met Arg Lys Ser Phe Cys Tyr Arg Ser Tyr
1730 1735 1740
Asn Gly Thr Thr Cys Glu Asn Glu Leu Pro Phe Asn Val Thr Lys Arg
1745 1750 1755 1760
Met Cys Cys Cys Thr Tyr Asn Val Gly Lys Ala Trp Asn Lys Pro Cys
1765 1770 1775
Glu Pro Cys Pro Thr Pro Gly Thr Ala Asp Phe Lys Thr Ile Cys Gly
1780 1785 1790
Asn Ile Pro Gly Phe Thr Phe Asp Ile His Thr Gly Lys Ala Val Asp
1795 1800 1805
Ile Asp Glu Cys Lys Glu Ile Pro Gly Ile Cys Ala Asn Gly Val Cys
1810 1815 1820
Ile Asn Gln Ile Gly Ser Phe Arg Cys Glu Cys Pro Thr Gly Phe Ser
1825 1830 1835 1840
Tyr Asn Asp Leu Leu Leu Val Cys Glu Asp Ile Asp Glu Cys Ser Asn
1845 1850 1855
Gly Asp Asn Leu Cys Gln Arg Asn Ala Asp Cys Ile Asn Ser Pro Gly
1860 1865 1870
Ser Tyr Arg Cys Glu Cys Ala Ala Gly Phe Lys Leu Ser Pro Asn Gly
1875 1880 1885
Ala Cys Val Asp Arg Asn Glu Cys Leu Glu Ile Pro Asn Val Cys Ser
1890 1895 1900
His Gly Leu Cys Val Asp Leu Gln Gly Ser Tyr Gln Cys Ile Cys His
1905 1910 1915 1920
Asn Gly Phe Lys Ala Ser Gln Asp Gln Thr Met Cys Met Asp Val Asp
1925 1930 1935
Glu Cys Glu Arg His Pro Cys Gly Asn Gly Thr Cys Lys Asn Thr Val
1940 1945 1950
Gly Ser Tyr Asn Cys Leu Cys Tyr Pro Gly Phe Glu Leu Thr His Asn
1955 1960 1965
Asn Asp Cys Leu Asp Ile Asp Glu Cys Ser Ser Phe Phe Gly Gln Val
1970 1975 1980
Cys Arg Asn Gly Arg Cys Phe Asn Glu Ile Gly Ser Phe Lys Cys Leu
1985 1990 1995 2000
Cys Asn Glu Gly Tyr Glu Leu Thr Pro Asp Gly Lys Asn Cys Ile Asp
2005 2010 2015
Thr Asn Glu Cys Val Ala Leu Pro Gly Ser Cys Ser Pro Gly Thr Cys
2020 2025 2030
Gln Asn Leu Glu Gly Ser Phe Arg Cys Ile Cys Pro Pro Gly Tyr Glu
2035 2040 2045
Val Lys Ser Glu Asn Cys Ile Asp Ile Asn Glu Cys Asp Glu Asp Pro
2050 2055 2060
Asn Ile Cys Leu Phe Gly Ser Cys Thr Asn Thr Pro Gly Gly Phe Gln
2065 2070 2075 2080
Cys Leu Cys Pro Pro Gly Phe Val Leu Ser Asp Asn Gly Arg Arg Cys
2085 2090 2095
Phe Asp Thr Arg Gln Ser Phe Cys Phe Thr Asn Phe Glu Asn Gly Lys
2100 2105 2110
Cys Ser Val Pro Lys Ala Phe Asn Thr Thr Lys Ala Lys Cys Cys Cys
2115 2120 2125
Ser Lys Met Pro Gly Glu Gly Trp Gly Asp Pro Cys Glu Leu Cys Pro
2130 2135 2140
Lys Asp Asp Glu Val Ala Phe Gln Asp Leu Cys Pro Tyr Gly His Gly
2145 2150 2155 2160
Thr Val Pro Ser Leu His Asp Thr Arg Glu Asp Val Asn Glu Cys Leu
2165 2170 2175
Glu Ser Pro Gly Ile Cys Ser Asn Gly Gln Cys Ile Asn Thr Asp Gly
2180 2185 2190
Ser Phe Arg Cys Glu Cys Pro Met Gly Tyr Asn Leu Asp Tyr Thr Gly
2195 2200 2205
Val Arg Cys Val Asp Thr Asp Glu Cys Ser Ile Gly Asn Pro Cys Gly
2210 2215 2220
Asn Gly Thr Cys Thr Asn Val Ile Gly Ser Phe Glu Cys Asn Cys Asn
2225 2230 2235 2240
Glu Gly Phe Glu Pro Gly Pro Met Met Asn Cys Glu Asp Ile Asn Glu
2245 2250 2255
Cys Ala Gln Asn Pro Leu Leu Cys Ala Phe Arg Cys Met Asn Thr Phe
2260 2265 2270
Gly Ser Tyr Glu Cys Thr Cys Pro Ile Gly Tyr Ala Leu Arg Glu Asp
2275 2280 2285
Gln Lys Met Cys Lys Asp Leu Asp Glu Cys Ala Glu Gly Leu His Asp
2290 2295 2300
Cys Glu Ser Arg Gly Met Met Cys Lys Asn Leu Ile Gly Thr Phe Met
2305 2310 2315 2320
Cys Ile Cys Pro Pro Gly Met Ala Arg Arg Pro Asp Gly Glu Gly Cys
2325 2330 2335
Val Asp Glu Asn Glu Cys Arg Thr Lys Pro Gly Ile Cys Glu Asn Gly
2340 2345 2350
Arg Cys Val Asn Ile Ile Gly Ser Tyr Arg Cys Glu Cys Asn Glu Gly
2355 2360 2365
Phe Gln Ser Ser Ser Ser Gly Thr Glu Cys Leu Asp Asn Arg Gln Gly
2370 2375 2380
Leu Cys Phe Ala Glu Val Leu Gln Thr Ile Cys Gln Met Ala Ser Ser
2385 2390 2395 2400
Ser Arg Asn Leu Val Thr Lys Ser Glu Cys Cys Cys Asp Gly Gly Arg
2405 2410 2415
Gly Trp Gly His Gln Cys Glu Leu Cys Pro Leu Pro Gly Thr Ala Gln
2420 2425 2430
Tyr Lys Lys Ile Cys Pro His Gly Pro Gly Tyr Thr Thr Asp Gly Arg
2435 2440 2445
Asp Ile Asp Glu Cys Lys Val Met Pro Asn Leu Cys Thr Asn Gly Gln
2450 2455 2460
Cys Ile Asn Thr Met Gly Ser Phe Arg Cys Phe Cys Lys Val Gly Tyr
2465 2470 2475 2480
Thr Thr Asp Ile Ser Gly Thr Ser Cys Ile Asp Leu Asp Glu Cys Ser
2485 2490 2495
Gln Ser Pro Lys Pro Cys Asn Tyr Ile Cys Lys Asn Thr Glu Gly Ser
2500 2505 2510
Tyr Gln Cys Ser Cys Pro Arg Gly Tyr Val Leu Gln Glu Asp Gly Lys
2515 2520 2525
Thr Cys Lys Asp Leu Asp Glu Cys Gln Thr Lys Gln His Asn Cys Gln
2530 2535 2540
Phe Leu Cys Val Asn Thr Leu Gly Gly Phe Thr Cys Lys Cys Pro Pro
2545 2550 2555 2560
Gly Phe Thr Gln His His Thr Ala Cys Ile Asp Asn Asn Glu Cys Gly
2565 2570 2575
Ser Gln Pro Ser Leu Cys Gly Ala Lys Gly Ile Cys Gln Asn Thr Pro
2580 2585 2590
Gly Ser Phe Ser Cys Glu Cys Gln Arg Gly Phe Ser Leu Asp Ala Thr
2595 2600 2605
Gly Leu Asn Cys Glu Asp Val Asp Glu Cys Asp Gly Asn His Arg Cys
2610 2615 2620
Gln His Gly Cys Gln Asn Ile Leu Gly Gly Tyr Arg Cys Gly Cys Pro
2625 2630 2635 2640
Gln Gly Tyr Ile Gln His Tyr Gln Trp Asn Gln Cys Val Asp Glu Asn
2645 2650 2655
Glu Cys Ser Asn Pro Asn Ala Cys Gly Ser Ala Ser Cys Tyr Asn Thr
2660 2665 2670
Leu Gly Ser Tyr Lys Cys Ala Cys Pro Ser Gly Phe Ser Phe Asp Gln
2675 2680 2685
Phe Ser Ser Ala Cys His Asp Val Asn Glu Cys Ser Ser Ser Lys Asn
2690 2695 2700
Pro Cys Asn Tyr Gly Cys Ser Asn Thr Glu Gly Gly Tyr Leu Cys Gly
2705 2710 2715 2720
Cys Pro Pro Gly Tyr Tyr Arg Val Gly Gln Gly His Cys Val Ser Gly
2725 2730 2735
Met Gly Phe Asn Lys Gly Gln Tyr Leu Ser Leu Asp Thr Glu Val Asp
2740 2745 2750
Glu Glu Asn Ala Leu Ser Pro Glu Ala Cys Tyr Glu Cys Lys Ile Asn
2755 2760 2765
Gly Tyr Ser Lys Lys Asp Ser Arg Gln Lys Arg Ser Ile His Glu Pro
2770 2775 2780
Asp Pro Thr Ala Val Glu Gln Ile Ser Leu Glu Ser Val Asp Met Asp
2785 2790 2795 2800
Ser Pro Val Asn Met Lys Phe Asn Leu Ser His Leu Gly Ser Lys Glu
2805 2810 2815
His Ile Leu Glu Leu Arg Pro Ala Ile Gln Pro Leu Asn Asn His Ile
2820 2825 2830
Arg Tyr Val Ile Ser Gln Gly Asn Asp Asp Ser Val Phe Arg Ile His
2835 2840 2845
Gln Arg Asn Gly Leu Ser Tyr Leu His Thr Ala Lys Lys Lys Leu Met
2850 2855 2860
Pro Gly Thr Tyr Thr Leu Glu Ile Thr Ser Ile Pro Leu Tyr Lys Lys
2865 2870 2875 2880
Lys Glu Leu Lys Lys Leu Glu Glu Ser Asn Glu Asp Asp Tyr Leu Leu
2885 2890 2895
Gly Glu Leu Gly Glu Ala Leu Arg Met Arg Leu Gln Ile Gln Leu Tyr
2900 2905 2910
<210> 64
<211> 2809
<212> PRT
<213> 智人(Homo sapiens)
<400> 64
Met Thr Leu Glu Gly Leu Tyr Leu Ala Arg Gly Pro Leu Ala Arg Leu
1 5 10 15
Leu Leu Ala Trp Ser Ala Leu Leu Cys Met Ala Gly Gly Gln Gly Arg
20 25 30
Trp Asp Gly Ala Leu Glu Ala Ala Gly Pro Gly Arg Val Arg Arg Arg
35 40 45
Gly Ser Pro Gly Ile Leu Gln Gly Pro Asn Val Cys Gly Ser Arg Phe
50 55 60
His Ala Tyr Cys Cys Pro Gly Trp Arg Thr Phe Pro Gly Arg Ser Gln
65 70 75 80
Cys Val Val Pro Ile Cys Arg Arg Ala Cys Gly Glu Gly Phe Cys Ser
85 90 95
Gln Pro Asn Leu Cys Thr Cys Ala Asp Gly Thr Leu Ala Pro Ser Cys
100 105 110
Gly Val Ser Arg Gly Ser Gly Cys Ser Val Ser Cys Met Asn Gly Gly
115 120 125
Thr Cys Arg Gly Ala Ser Cys Leu Cys Gln Lys Gly Tyr Thr Gly Thr
130 135 140
Val Cys Gly Gln Pro Ile Cys Asp Arg Gly Cys His Asn Gly Gly Arg
145 150 155 160
Cys Ile Gly Pro Asn Arg Cys Ala Cys Val Tyr Gly Phe Met Gly Pro
165 170 175
Gln Cys Glu Arg Asp Tyr Arg Thr Gly Pro Cys Phe Gly Gln Val Gly
180 185 190
Pro Glu Gly Cys Gln His Gln Leu Thr Gly Leu Val Cys Thr Lys Ala
195 200 205
Leu Cys Cys Ala Thr Val Gly Arg Ala Trp Gly Leu Pro Cys Glu Leu
210 215 220
Cys Pro Ala Gln Pro His Pro Cys Arg Arg Gly Phe Ile Pro Asn Ile
225 230 235 240
His Thr Gly Ala Cys Gln Asp Val Asp Glu Cys Gln Ala Val Pro Gly
245 250 255
Leu Cys Gln Gly Gly Ser Cys Val Asn Met Val Gly Ser Phe His Cys
260 265 270
Arg Cys Pro Val Gly His Arg Leu Ser Asp Ser Ser Ala Ala Cys Glu
275 280 285
Asp Tyr Arg Ala Gly Ala Cys Phe Ser Val Leu Phe Gly Gly Arg Cys
290 295 300
Ala Gly Asp Leu Ala Gly His Tyr Thr Arg Arg Gln Cys Cys Cys Asp
305 310 315 320
Arg Gly Arg Cys Trp Ala Ala Gly Pro Val Pro Glu Leu Cys Pro Pro
325 330 335
Arg Gly Ser Asn Glu Phe Gln Gln Leu Cys Ala Gln Arg Leu Pro Leu
340 345 350
Leu Pro Gly His Pro Gly Leu Phe Pro Gly Leu Leu Gly Phe Gly Ser
355 360 365
Asn Gly Met Gly Pro Pro Leu Gly Pro Ala Arg Leu Asn Pro His Gly
370 375 380
Ser Asp Ala Arg Gly Ile Pro Ser Leu Gly Pro Gly Asn Ser Asn Ile
385 390 395 400
Gly Thr Ala Thr Leu Asn Gln Thr Ile Asp Ile Cys Arg His Phe Thr
405 410 415
Asn Leu Cys Leu Asn Gly Arg Cys Leu Pro Thr Pro Ser Ser Tyr Arg
420 425 430
Cys Glu Cys Asn Val Gly Tyr Thr Gln Asp Val Arg Gly Glu Cys Ile
435 440 445
Asp Val Asp Glu Cys Thr Ser Ser Pro Cys His His Gly Asp Cys Val
450 455 460
Asn Ile Pro Gly Thr Tyr His Cys Arg Cys Tyr Pro Gly Phe Gln Ala
465 470 475 480
Thr Pro Thr Arg Gln Ala Cys Val Asp Val Asp Glu Cys Ile Val Ser
485 490 495
Gly Gly Leu Cys His Leu Gly Arg Cys Val Asn Thr Glu Gly Ser Phe
500 505 510
Gln Cys Val Cys Asn Ala Gly Phe Glu Leu Ser Pro Asp Gly Lys Asn
515 520 525
Cys Val Asp His Asn Glu Cys Ala Thr Ser Thr Met Cys Val Asn Gly
530 535 540
Val Cys Leu Asn Glu Asp Gly Ser Phe Ser Cys Leu Cys Lys Pro Gly
545 550 555 560
Phe Leu Leu Ala Pro Gly Gly His Tyr Cys Met Asp Ile Asp Glu Cys
565 570 575
Gln Thr Pro Gly Ile Cys Val Asn Gly His Cys Thr Asn Thr Glu Gly
580 585 590
Ser Phe Arg Cys Gln Cys Leu Gly Gly Leu Ala Val Gly Thr Asp Gly
595 600 605
Arg Val Cys Val Asp Thr His Val Arg Ser Thr Cys Tyr Gly Ala Ile
610 615 620
Glu Lys Gly Ser Cys Ala Arg Pro Phe Pro Gly Thr Val Thr Lys Ser
625 630 635 640
Glu Cys Cys Cys Ala Asn Pro Asp His Gly Phe Gly Glu Pro Cys Gln
645 650 655
Leu Cys Pro Ala Lys Asp Ser Ala Glu Phe Gln Ala Leu Cys Ser Ser
660 665 670
Gly Leu Gly Ile Thr Thr Asp Gly Arg Asp Ile Asn Glu Cys Ala Leu
675 680 685
Asp Pro Glu Val Cys Ala Asn Gly Val Cys Glu Asn Leu Arg Gly Ser
690 695 700
Tyr Arg Cys Val Cys Asn Leu Gly Tyr Glu Ala Gly Ala Ser Gly Lys
705 710 715 720
Asp Cys Thr Asp Val Asp Glu Cys Ala Leu Asn Ser Leu Leu Cys Asp
725 730 735
Asn Gly Trp Cys Gln Asn Ser Pro Gly Ser Tyr Ser Cys Ser Cys Pro
740 745 750
Pro Gly Phe His Phe Trp Gln Asp Thr Glu Ile Cys Lys Asp Val Asp
755 760 765
Glu Cys Leu Ser Ser Pro Cys Val Ser Gly Val Cys Arg Asn Leu Ala
770 775 780
Gly Ser Tyr Thr Cys Lys Cys Gly Pro Gly Ser Arg Leu Asp Pro Ser
785 790 795 800
Gly Thr Phe Cys Leu Asp Ser Thr Lys Gly Thr Cys Trp Leu Lys Ile
805 810 815
Gln Glu Ser Arg Cys Glu Val Asn Leu Gln Gly Ala Ser Leu Arg Ser
820 825 830
Glu Cys Cys Ala Thr Leu Gly Ala Ala Trp Gly Ser Pro Cys Glu Arg
835 840 845
Cys Glu Ile Asp Pro Ala Cys Ala Arg Gly Phe Ala Arg Met Thr Gly
850 855 860
Val Thr Cys Asp Asp Val Asn Glu Cys Glu Ser Phe Pro Gly Val Cys
865 870 875 880
Pro Asn Gly Arg Cys Val Asn Thr Ala Gly Ser Phe Arg Cys Glu Cys
885 890 895
Pro Glu Gly Leu Met Leu Asp Ala Ser Gly Arg Leu Cys Val Asp Val
900 905 910
Arg Leu Glu Pro Cys Phe Leu Arg Trp Asp Glu Asp Glu Cys Gly Val
915 920 925
Thr Leu Pro Gly Lys Tyr Arg Met Asp Val Cys Cys Cys Ser Ile Gly
930 935 940
Ala Val Trp Gly Val Glu Cys Glu Ala Cys Pro Asp Pro Glu Ser Leu
945 950 955 960
Glu Phe Ala Ser Leu Cys Pro Arg Gly Leu Gly Phe Ala Ser Arg Asp
965 970 975
Phe Leu Ser Gly Arg Pro Phe Tyr Lys Asp Val Asn Glu Cys Lys Val
980 985 990
Phe Pro Gly Leu Cys Thr His Gly Thr Cys Arg Asn Thr Val Gly Ser
995 1000 1005
Phe His Cys Ala Cys Ala Gly Gly Phe Ala Leu Asp Ala Gln Glu Arg
1010 1015 1020
Asn Cys Thr Asp Ile Asp Glu Cys Arg Ile Ser Pro Asp Leu Cys Gly
1025 1030 1035 1040
Gln Gly Thr Cys Val Asn Thr Pro Gly Ser Phe Glu Cys Glu Cys Phe
1045 1050 1055
Pro Gly Tyr Glu Ser Gly Phe Met Leu Met Lys Asn Cys Met Asp Val
1060 1065 1070
Asp Glu Cys Ala Arg Asp Pro Leu Leu Cys Arg Gly Gly Thr Cys Thr
1075 1080 1085
Asn Thr Asp Gly Ser Tyr Lys Cys Gln Cys Pro Pro Gly His Glu Leu
1090 1095 1100
Thr Ala Lys Gly Thr Ala Cys Glu Asp Ile Asp Glu Cys Ser Leu Ser
1105 1110 1115 1120
Asp Gly Leu Cys Pro His Gly Gln Cys Val Asn Val Ile Gly Ala Phe
1125 1130 1135
Gln Cys Ser Cys His Ala Gly Phe Gln Ser Thr Pro Asp Arg Gln Gly
1140 1145 1150
Cys Val Asp Ile Asn Glu Cys Arg Val Gln Asn Gly Gly Cys Asp Val
1155 1160 1165
His Cys Ile Asn Thr Glu Gly Ser Tyr Arg Cys Ser Cys Gly Gln Gly
1170 1175 1180
Tyr Ser Leu Met Pro Asp Gly Arg Ala Cys Ala Asp Val Asp Glu Cys
1185 1190 1195 1200
Glu Glu Asn Pro Arg Val Cys Asp Gln Gly His Cys Thr Asn Met Pro
1205 1210 1215
Gly Gly His Arg Cys Leu Cys Tyr Asp Gly Phe Met Ala Thr Pro Asp
1220 1225 1230
Met Arg Thr Cys Val Asp Val Asp Glu Cys Asp Leu Asn Pro His Ile
1235 1240 1245
Cys Leu His Gly Asp Cys Glu Asn Thr Lys Gly Ser Phe Val Cys His
1250 1255 1260
Cys Gln Leu Gly Tyr Met Val Arg Lys Gly Ala Thr Gly Cys Ser Asp
1265 1270 1275 1280
Val Asp Glu Cys Glu Val Gly Gly His Asn Cys Asp Ser His Ala Ser
1285 1290 1295
Cys Leu Asn Ile Pro Gly Ser Phe Ser Cys Arg Cys Leu Pro Gly Trp
1300 1305 1310
Val Gly Asp Gly Phe Glu Cys His Asp Leu Asp Glu Cys Val Ser Gln
1315 1320 1325
Glu His Arg Cys Ser Pro Arg Gly Asp Cys Leu Asn Val Pro Gly Ser
1330 1335 1340
Tyr Arg Cys Thr Cys Arg Gln Gly Phe Ala Gly Asp Gly Phe Phe Cys
1345 1350 1355 1360
Glu Asp Arg Asp Glu Cys Ala Glu Asn Val Asp Leu Cys Asp Asn Gly
1365 1370 1375
Gln Cys Leu Asn Ala Pro Gly Gly Tyr Arg Cys Glu Cys Glu Met Gly
1380 1385 1390
Phe Asp Pro Thr Glu Asp His Arg Ala Cys Gln Asp Val Asp Glu Cys
1395 1400 1405
Ala Gln Gly Asn Leu Cys Ala Phe Gly Ser Cys Glu Asn Leu Pro Gly
1410 1415 1420
Met Phe Arg Cys Ile Cys Asn Gly Gly Tyr Glu Leu Asp Arg Gly Gly
1425 1430 1435 1440
Gly Asn Cys Thr Asp Ile Asn Glu Cys Ala Asp Pro Val Asn Cys Ile
1445 1450 1455
Asn Gly Val Cys Ile Asn Thr Pro Gly Ser Tyr Leu Cys Ser Cys Pro
1460 1465 1470
Gln Asp Phe Glu Leu Asn Pro Ser Gly Val Gly Cys Val Asp Thr Arg
1475 1480 1485
Ala Gly Asn Cys Phe Leu Glu Thr His Asp Arg Gly Asp Ser Gly Ile
1490 1495 1500
Ser Cys Ser Ala Glu Ile Gly Val Gly Val Thr Arg Ala Ser Cys Cys
1505 1510 1515 1520
Cys Ser Leu Gly Arg Ala Trp Gly Asn Pro Cys Glu Leu Cys Pro Met
1525 1530 1535
Ala Asn Thr Thr Glu Tyr Arg Thr Leu Cys Pro Gly Gly Glu Gly Phe
1540 1545 1550
Gln Pro Asn Arg Ile Thr Val Ile Leu Glu Asp Ile Asp Glu Cys Gln
1555 1560 1565
Glu Leu Pro Gly Leu Cys Gln Gly Gly Asp Cys Val Asn Thr Phe Gly
1570 1575 1580
Ser Phe Gln Cys Glu Cys Pro Pro Gly Tyr His Leu Ser Glu His Thr
1585 1590 1595 1600
Arg Ile Cys Glu Asp Ile Asp Glu Cys Ser Thr His Ser Gly Ile Cys
1605 1610 1615
Gly Pro Gly Thr Cys Tyr Asn Thr Leu Gly Asn Tyr Thr Cys Val Cys
1620 1625 1630
Pro Ala Glu Tyr Leu Gln Val Asn Gly Gly Asn Asn Cys Met Asp Met
1635 1640 1645
Arg Lys Ser Val Cys Phe Arg His Tyr Asn Gly Thr Cys Gln Asn Glu
1650 1655 1660
Leu Ala Phe Asn Val Thr Arg Lys Met Cys Cys Cys Ser Tyr Asn Ile
1665 1670 1675 1680
Gly Gln Ala Trp Asn Arg Pro Cys Glu Ala Cys Pro Thr Pro Ile Ser
1685 1690 1695
Pro Asp Tyr Gln Ile Leu Cys Gly Asn Gln Ala Pro Gly Phe Leu Thr
1700 1705 1710
Asp Ile His Thr Gly Lys Pro Leu Asp Ile Asp Glu Cys Gly Glu Ile
1715 1720 1725
Pro Ala Ile Cys Ala Asn Gly Ile Cys Ile Asn Gln Ile Gly Ser Phe
1730 1735 1740
Arg Cys Glu Cys Pro Ala Gly Phe Asn Tyr Asn Ser Ile Leu Leu Ala
1745 1750 1755 1760
Cys Glu Asp Val Asp Glu Cys Gly Ser Arg Glu Ser Pro Cys Gln Gln
1765 1770 1775
Asn Ala Asp Cys Ile Asn Ile Pro Gly Ser Tyr Arg Cys Lys Cys Thr
1780 1785 1790
Arg Gly Tyr Lys Leu Ser Pro Gly Gly Ala Cys Val Gly Arg Asn Glu
1795 1800 1805
Cys Arg Glu Ile Pro Asn Val Cys Ser His Gly Asp Cys Met Asp Thr
1810 1815 1820
Glu Gly Ser Tyr Met Cys Leu Cys His Arg Gly Phe Gln Ala Ser Ala
1825 1830 1835 1840
Asp Gln Thr Leu Cys Met Asp Ile Asp Glu Cys Asp Arg Gln Pro Cys
1845 1850 1855
Gly Asn Gly Thr Cys Lys Asn Ile Ile Gly Ser Tyr Asn Cys Leu Cys
1860 1865 1870
Phe Pro Gly Phe Val Val Thr His Asn Gly Asp Cys Val Asp Phe Asp
1875 1880 1885
Glu Cys Thr Thr Leu Val Gly Gln Val Cys Arg Phe Gly His Cys Leu
1890 1895 1900
Asn Thr Ala Gly Ser Phe His Cys Leu Cys Gln Asp Gly Phe Glu Leu
1905 1910 1915 1920
Thr Ala Asp Gly Lys Asn Cys Val Asp Thr Asn Glu Cys Leu Ser Leu
1925 1930 1935
Ala Gly Thr Cys Leu Pro Gly Thr Cys Gln Asn Leu Glu Gly Ser Phe
1940 1945 1950
Arg Cys Ile Cys Pro Pro Gly Phe Gln Val Gln Ser Asp His Cys Ile
1955 1960 1965
Asp Ile Asp Glu Cys Ser Glu Glu Pro Asn Leu Cys Leu Phe Gly Thr
1970 1975 1980
Cys Thr Asn Ser Pro Gly Ser Phe Gln Cys Leu Cys Pro Pro Gly Phe
1985 1990 1995 2000
Val Leu Ser Asp Asn Gly His Arg Cys Phe Asp Thr Arg Gln Ser Phe
2005 2010 2015
Cys Phe Thr Arg Phe Glu Ala Gly Lys Cys Ser Val Pro Lys Ala Phe
2020 2025 2030
Asn Thr Thr Lys Thr Arg Cys Cys Cys Ser Lys Arg Pro Gly Glu Gly
2035 2040 2045
Trp Gly Asp Pro Cys Glu Leu Cys Pro Gln Glu Gly Ser Ala Ala Phe
2050 2055 2060
Gln Glu Leu Cys Pro Phe Gly His Gly Ala Val Pro Gly Pro Asp Asp
2065 2070 2075 2080
Ser Arg Glu Asp Val Asn Glu Cys Ala Glu Asn Pro Gly Val Cys Thr
2085 2090 2095
Asn Gly Val Cys Val Asn Thr Asp Gly Ser Phe Arg Cys Glu Cys Pro
2100 2105 2110
Phe Gly Tyr Ser Leu Asp Phe Thr Gly Ile Asn Cys Val Asp Thr Asp
2115 2120 2125
Glu Cys Ser Val Gly His Pro Cys Gly Gln Gly Thr Cys Thr Asn Val
2130 2135 2140
Ile Gly Gly Phe Glu Cys Ala Cys Ala Asp Gly Phe Glu Pro Gly Leu
2145 2150 2155 2160
Met Met Thr Cys Glu Asp Ile Asp Glu Cys Ser Leu Asn Pro Leu Leu
2165 2170 2175
Cys Ala Phe Arg Cys His Asn Thr Glu Gly Ser Tyr Leu Cys Thr Cys
2180 2185 2190
Pro Ala Gly Tyr Thr Leu Arg Glu Asp Gly Ala Met Cys Arg Asp Val
2195 2200 2205
Asp Glu Cys Ala Asp Gly Gln Gln Asp Cys His Ala Arg Gly Met Glu
2210 2215 2220
Cys Lys Asn Leu Ile Gly Thr Phe Ala Cys Val Cys Pro Pro Gly Met
2225 2230 2235 2240
Arg Pro Leu Pro Gly Ser Gly Glu Gly Cys Thr Asp Asp Asn Glu Cys
2245 2250 2255
His Ala Gln Pro Asp Leu Cys Val Asn Gly Arg Cys Val Asn Thr Ala
2260 2265 2270
Gly Ser Phe Arg Cys Asp Cys Asp Glu Gly Phe Gln Pro Ser Pro Thr
2275 2280 2285
Leu Thr Glu Cys His Asp Ile Arg Gln Gly Pro Cys Phe Ala Glu Val
2290 2295 2300
Leu Gln Thr Met Cys Arg Ser Leu Ser Ser Ser Ser Glu Ala Val Thr
2305 2310 2315 2320
Arg Ala Glu Cys Cys Cys Gly Gly Gly Arg Gly Trp Gly Pro Arg Cys
2325 2330 2335
Glu Leu Cys Pro Leu Pro Gly Thr Ser Ala Tyr Arg Lys Leu Cys Pro
2340 2345 2350
His Gly Ser Gly Tyr Thr Ala Glu Gly Arg Asp Val Asp Glu Cys Arg
2355 2360 2365
Met Leu Ala His Leu Cys Ala His Gly Glu Cys Ile Asn Ser Leu Gly
2370 2375 2380
Ser Phe Arg Cys His Cys Gln Ala Gly Tyr Thr Pro Asp Ala Thr Ala
2385 2390 2395 2400
Thr Thr Cys Leu Asp Met Asp Glu Cys Ser Gln Val Pro Lys Pro Cys
2405 2410 2415
Thr Phe Leu Cys Lys Asn Thr Lys Gly Ser Phe Leu Cys Ser Cys Pro
2420 2425 2430
Arg Gly Tyr Leu Leu Glu Glu Asp Gly Arg Thr Cys Lys Asp Leu Asp
2435 2440 2445
Glu Cys Thr Ser Arg Gln His Asn Cys Gln Phe Leu Cys Val Asn Thr
2450 2455 2460
Val Gly Ala Phe Thr Cys Arg Cys Pro Pro Gly Phe Thr Gln His His
2465 2470 2475 2480
Gln Ala Cys Phe Asp Asn Asp Glu Cys Ser Ala Gln Pro Gly Pro Cys
2485 2490 2495
Gly Ala His Gly His Cys His Asn Thr Pro Gly Ser Phe Arg Cys Glu
2500 2505 2510
Cys His Gln Gly Phe Thr Leu Val Ser Ser Gly His Gly Cys Glu Asp
2515 2520 2525
Val Asn Glu Cys Asp Gly Pro His Arg Cys Gln His Gly Cys Gln Asn
2530 2535 2540
Gln Leu Gly Gly Tyr Arg Cys Ser Cys Pro Gln Gly Phe Thr Gln His
2545 2550 2555 2560
Ser Gln Trp Ala Gln Cys Val Asp Glu Asn Glu Cys Ala Leu Ser Pro
2565 2570 2575
Pro Thr Cys Gly Ser Ala Ser Cys Arg Asn Thr Leu Gly Gly Phe Arg
2580 2585 2590
Cys Val Cys Pro Ser Gly Phe Asp Phe Asp Gln Ala Leu Gly Gly Cys
2595 2600 2605
Gln Glu Val Asp Glu Cys Ala Gly Arg Arg Gly Pro Cys Ser Tyr Ser
2610 2615 2620
Cys Ala Asn Thr Pro Gly Gly Phe Leu Cys Gly Cys Pro Gln Gly Tyr
2625 2630 2635 2640
Phe Arg Ala Gly Gln Gly His Cys Val Ser Gly Leu Gly Phe Ser Pro
2645 2650 2655
Gly Pro Gln Asp Thr Pro Asp Lys Glu Glu Leu Leu Ser Ser Glu Ala
2660 2665 2670
Cys Tyr Glu Cys Lys Ile Asn Gly Leu Ser Pro Arg Asp Arg Pro Arg
2675 2680 2685
Arg Ser Ala His Arg Asp His Gln Val Asn Leu Ala Thr Leu Asp Ser
2690 2695 2700
Glu Ala Leu Leu Thr Leu Gly Leu Asn Leu Ser His Leu Gly Arg Ala
2705 2710 2715 2720
Glu Arg Ile Leu Glu Leu Arg Pro Ala Leu Glu Gly Leu Glu Gly Arg
2725 2730 2735
Ile Arg Tyr Val Ile Val Arg Gly Asn Glu Gln Gly Phe Phe Arg Met
2740 2745 2750
His His Leu Arg Gly Val Ser Ser Leu Gln Leu Gly Arg Arg Arg Pro
2755 2760 2765
Gly Pro Gly Thr Tyr Arg Leu Glu Val Val Ser His Met Ala Gly Pro
2770 2775 2780
Trp Gly Val Gln Pro Glu Gly Gln Pro Gly Pro Trp Gly Gln Ala Leu
2785 2790 2795 2800
Arg Leu Lys Val Gln Leu Gln Leu Leu
2805

Claims (75)

1.一种重组疱疹病毒基因组,所述重组疱疹病毒基因组包含编码包含第一美容蛋白的第一多肽的第一多核苷酸。
2.如权利要求1所述的重组疱疹病毒基因组,其中所述重组疱疹病毒基因组包含所述第一多核苷酸的两个或更多个拷贝。
3.如权利要求1或权利要求2所述的重组疱疹病毒基因组,其中所述重组疱疹病毒基因组是有复制能力的。
4.如权利要求1或权利要求2所述的重组疱疹病毒基因组,其中所述重组疱疹病毒基因组是复制缺陷性的。
5.如权利要求1-4中任一项所述的重组疱疹病毒基因组,其中所述重组疱疹病毒基因组选自由以下组成的组:重组单纯疱疹病毒基因组、重组水痘带状疱疹病毒基因组、重组人巨细胞病毒基因组、重组疱疹病毒6A基因组、重组疱疹病毒6B基因组、重组疱疹病毒7基因组、重组卡波西氏肉瘤相关疱疹病毒基因组以及它们的任何衍生物。
6.如权利要求1-5中任一项所述的重组疱疹病毒基因组,其中所述重组疱疹病毒基因组是重组单纯疱疹病毒基因组。
7.如权利要求6所述的重组疱疹病毒基因组,其中所述重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组、重组2型单纯疱疹病毒(HSV-2)基因组或它们的任何衍生物。
8.如权利要求6或权利要求7所述的重组疱疹病毒基因组,其中所述重组单纯疱疹病毒基因组是重组1型单纯疱疹病毒(HSV-1)基因组。
9.如权利要求6-8中任一项所述的重组疱疹病毒基因组,其中所述重组单纯疱疹病毒基因组包含失活性突变。
10.如权利要求9所述的重组疱疹病毒基因组,其中所述失活性突变在单纯疱疹病毒基因中。
11.如权利要求10所述的重组疱疹病毒基因组,其中所述失活性突变是所述单纯疱疹病毒基因的编码序列的缺失。
12.如权利要求10或权利要求11所述的重组疱疹病毒基因组,其中所述单纯疱疹病毒基因选自由感染细胞蛋白(ICP)0、ICP4、ICP22、ICP27、ICP47、胸苷激酶(tk)、长独特区域(UL)41和UL55组成的组。
13.如权利要求12所述的重组疱疹病毒基因组,其中所述重组单纯疱疹病毒基因组在所述ICP4基因的一个或两个拷贝中包含失活性突变。
14.如权利要求12或权利要求13所述的重组疱疹病毒基因组,其中所述重组单纯疱疹病毒基因组在所述ICP22基因中包含失活性突变。
15.如权利要求12-14中任一项所述的重组疱疹病毒基因组,其中所述重组单纯疱疹病毒基因组在所述UL41基因中包含失活性突变。
16.如权利要求12-15中任一项所述的重组疱疹病毒基因组,其中所述重组单纯疱疹病毒基因组在所述ICP0基因的一个或两个拷贝中包含失活性突变。
17.如权利要求12-16中任一项所述的重组疱疹病毒基因组,其中所述重组单纯疱疹病毒基因组在所述ICP27基因中包含失活性突变。
18.如权利要求6-17中任一项所述的重组疱疹病毒基因组,其中所述重组单纯疱疹病毒基因组在ICP4病毒基因座中的一个或两个内包含所述第一多核苷酸。
19.如权利要求1-18中任一项所述的重组疱疹病毒基因组,其中所述第一美容蛋白选自由以下组成的组:第一胶原蛋白、第一纤连蛋白、第一弹性蛋白、第一光蛋白聚糖蛋白、第一玻连蛋白、第一玻连蛋白受体蛋白、第一层粘连蛋白、第一神经调质蛋白和第一原纤蛋白。
20.如权利要求1-19中任一项所述的重组疱疹病毒基因组,其中所述第一美容蛋白包含与选自由SEQ ID NO:15-21和53-64组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
21.如权利要求1-20中任一项所述的重组疱疹病毒基因组,其中所述第一美容蛋白是结构性细胞外基质蛋白。
22.如权利要求19-21中任一项所述的重组疱疹病毒基因组,其中所述第一胶原蛋白是人胶原蛋白。
23.如权利要求19-22中任一项所述的重组疱疹病毒基因组,其中所述第一胶原蛋白选自由以下组成的组:胶原α-1(I)链多肽(COL1-1)、胶原α-2(I)链多肽(COL1-2)、胶原α-1(II)链多肽(COL2)、胶原α-1(III)链多肽(COL3)、胶原α-1(IV)链多肽(COL4-1)、胶原α-2(IV)链多肽(COL4-2)、胶原α-3(IV)链多肽(COL4-3)、胶原α-4(IV)链多肽(COL4-4)、胶原α-5(IV)链多肽(COL4-5)、胶原α-6(IV)链多肽(COL4-6)、胶原α-1(V)链多肽(COL5-1)、胶原α-2(V)链多肽(COL5-2)、胶原α-3(V)链多肽(COL5-3)、胶原α-1(VI)链多肽(COL6-1)、胶原α-2(VI)链多肽(COL6-2)、胶原α-3(VI)链多肽(COL6-3)、胶原α-4(VI)链多肽(COL6-4)、胶原α-5(VI)链多肽(COL6-5)、胶原α-6(VI)链多肽(COL6-6)、胶原α-1(VIII)链多肽(COL8)、胶原α-1(IX)链多肽(COL9-1)、胶原α-2(IX)链多肽(COL9-2)、胶原α-3(IX)链多肽(COL9-3)、胶原α-1(X)链多肽(COL10)、胶原α-1(XI)链多肽(COL11-1)、胶原α-2(XI)链多肽(COL11-2)、胶原α-1(XII)链多肽(COL12)、胶原α-1(XIII)链多肽(COL13)、胶原α-1(XIV)链多肽(COL14)、胶原α-1(XV)链多肽(COL15)、胶原α-1(XVI)链多肽(COL16)、胶原α-1(XVII)链多肽(COL17)、胶原α-1(XVIII)链多肽(COL18)、胶原α-1(XIX)链多肽(COL19)、胶原α-1(XX)链多肽(COL20)、胶原α-1(XXI)链多肽(COL21)、胶原α-1(XXII)链多肽(COL22)、胶原α-1(XXIII)链多肽(COL23)、胶原α-1(XXIV)链多肽(COL24)、胶原α-1(XXV)链多肽(COL25)、胶原α-1(XXVI)链多肽(COL26)、胶原α-1(XXVII)链多肽(COL27)和胶原α-1(XXVIII)链多肽(COL28)。
24.如权利要求19-23中任一项所述的重组疱疹病毒基因组,其中所述第一胶原蛋白选自由以下组成的组:COL1-1、COL1-2、COL3、COL4-1、COL4-2、COL6-1和COL17。
25.如权利要求19-24中任一项所述的重组疱疹病毒基因组,其中所述第一人胶原蛋白包含与SEQ ID NO:17的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
26.如权利要求1-25中任一项所述的重组疱疹病毒基因组,其中所述第一美容蛋白不是胶原α-1(VII)链多肽(COL7)。
27.如权利要求1-26中任一项所述的重组疱疹病毒基因组,其中所述第一多肽基本上由所述第一美容蛋白组成或由所述第一美容蛋白组成。
28.如权利要求1-26中任一项所述的重组疱疹病毒基因组,其中所述第一多肽包含:(a)所述第一美容蛋白;(b)另一美容蛋白;和(c)使(a)连接于(b)的接头多肽。
29.如权利要求28所述的重组疱疹病毒基因组,其中所述接头多肽是可裂解接头多肽。
30.如权利要求28或权利要求29所述的重组疱疹病毒基因组,其中所述接头多肽包含与选自由SEQ ID NO:28-31组成的组的氨基酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的序列。
31.如权利要求28-30中任一项所述的重组疱疹病毒基因组,其中所述第一美容蛋白和所述另一美容蛋白是不同的。
32.如权利要求1-31中任一项所述的重组疱疹病毒基因组,其中所述第一多核苷酸编码多顺反子mRNA,所述多顺反子mRNA包含:(a)编码所述第一多肽的第一开放阅读框(ORF);(b)编码额外美容蛋白的第二ORF;和(c)分隔(a)和(b)的内部核糖体进入位点(IRES)。
33.如权利要求32所述的重组疱疹病毒基因组,其中编码所述IRES的核酸序列与选自SEQ ID NO:22或SEQ ID NO:23的核酸序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
34.如权利要求32或权利要求33所述的重组疱疹病毒基因组,其中所述第一美容蛋白和所述额外美容蛋白是不同的。
35.如权利要求1-34中任一项所述的重组疱疹病毒基因组,其中所述重组疱疹病毒基因组还包含编码第二美容蛋白的第二多核苷酸。
36.如权利要求35所述的重组疱疹病毒基因组,其中所述第一美容蛋白和所述第二美容蛋白是不同的。
37.如权利要求1-36中任一项所述的重组疱疹病毒基因组,其中相较于相应野生型疱疹病毒基因组,所述重组疱疹病毒基因组当引入靶标细胞中时具有降低的细胞毒性。
38.如权利要求37所述的重组疱疹病毒基因组,其中所述靶标细胞是表皮和/或真皮的细胞。
39.如权利要求37或权利要求38所述的重组疱疹病毒基因组,其中所述靶标细胞是人细胞。
40.如权利要求37-39中任一项所述的重组疱疹病毒基因组,其中所述靶标细胞是纤维母细胞。
41.一种疱疹病毒,所述疱疹病毒包含如权利要求1-40中任一项所述的重组疱疹病毒基因组。
42.如权利要求41所述的疱疹病毒,其中所述疱疹病毒是有复制能力的。
43.如权利要求41所述的疱疹病毒,其中所述疱疹病毒是复制缺陷性的。
44.如权利要求41-43中任一项所述的疱疹病毒,其中相较于相应野生型疱疹病毒,所述疱疹病毒具有降低的细胞毒性。
45.如权利要求41-44中任一项所述的疱疹病毒,其中所述疱疹病毒选自由以下组成的组:单纯疱疹病毒、水痘带状疱疹病毒、人巨细胞病毒、疱疹病毒6A、疱疹病毒6B、疱疹病毒7和卡波西氏肉瘤相关疱疹病毒。
46.如权利要求41-45中任一项所述的疱疹病毒,其中所述疱疹病毒是单纯疱疹病毒。
47.如权利要求46所述的疱疹病毒,其中所述单纯疱疹病毒是1型单纯疱疹病毒(HSV-1)、2型单纯疱疹病毒(HSV-2)或它们的任何衍生物。
48.一种组合物,所述组合物包含:(a)如权利要求1-40中任一项所述的重组疱疹病毒基因组或如权利要求41-47中任一项所述的疱疹病毒;和(b)赋形剂。
49.如权利要求48所述的组合物,其中所述组合物是无菌的。
50.如权利要求48或权利要求49所述的组合物,其中所述组合物适于局部、经皮、皮下、真皮内、口服、鼻内、气管内、舌下、经颊、经直肠、经阴道、经尿道、吸入、静脉内、动脉内、肌肉内、心内、骨内、腹膜内、经粘膜、玻璃体内、视网膜下、关节内、关节周、局部或皮上施用。
51.如权利要求48-50中任一项所述的组合物,其中所述组合物适于真皮内施用。
52.如权利要求48-51中任一项所述的组合物,其中所述组合物适于浅表注射。
53.如权利要求48-52中任一项所述的组合物,其中所述组合物是美容组合物。
54.如权利要求48-53中任一项所述的组合物,其中所述组合物是皮肤护理产品。
55.如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物,所述疱疹病毒或所述组合物用作药剂。
56.如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物,所述疱疹病毒或所述组合物用于疗法中。
57.如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物制造用于治疗皮肤学老化的一种或多种征象或症状的药剂的用途。
58.一种增强、增加、加强和/或补充受试者中一种或多种真皮细胞外基质蛋白的水平的方法,所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。
59.一种增强、增加、加强和/或补充受试者中一种或多种胶原蛋白的水平的方法,所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。
60.一种增强、增加、加强和/或补充受试者的软组织的方法,所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。
61.如权利要求60所述的方法,其中将所述组合物注射至所述受试者的所述软组织中。
62.一种使有需要的受试者的皮肤状况、品质和/或外观改进的方法,所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。
63.如权利要求62所述的方法,其中向一个或多个日光损害或其他UV暴露部位、粗糙纹理部位、皮肤下陷部位、皱纹部位或它们的任何组合施用所述组合物。
64.一种减少有需要的受试者的皮肤中一种或多种浅表凹陷的出现的方法,所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。
65.如权利要求64所述的方法,其中皮肤中所述一种或多种浅表凹陷选自由以下组成的组:鼻唇皱褶、鱼尾纹、皱眉纹、烦恼纹、疤痕、眉间纹、眉下垂、泪槽、鼻颊纹、兔宝宝纹、面颊/面中部下垂、木偶纹、罂粟陷窝、微笑纹、笑纹、下巴皱痕、颈纹、颈阔肌带以及它们的任何组合。
66.一种使有需要的受试者的皮肤的纹理、光滑度、弹性或张力中的至少一者增加和/或改进的方法,所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。
67.如权利要求62-66中任一项所述的方法,其中所述受试者的皮肤是老化中的皮肤。
68.如权利要求62-67中任一项所述的方法,其中所述受试者的皮肤已由于暴露于紫外光而受损害。
69.如权利要求62-68中任一项所述的方法,其中所述受试者的皮肤是有皱纹的。
70.一种使有需要的受试者的一种或多种皮肤学老化征象减弱的方法,所述方法包括向所述受试者施用有效量的如权利要求41-47中任一项所述的疱疹病毒或如权利要求48-54中任一项所述的组合物。
71.如权利要求70所述的方法,其中一种或多种皮肤学老化征象的所述减弱由以下方面指示:(a)细纹和/或皱纹得到治疗、减轻和/或预防;(b)皮肤孔尺寸得到降低;(c)皮肤厚度、饱满度和/或紧固度得到改进;(d)皮肤光滑度、柔韧性和/或柔软度得到改进;(e)皮肤色泽、光亮度和/或透明度得到改进;(f)原胶原和/或胶原产生得到改进;(g)皮肤纹理得到改进和/或再纹理化得到促进;(h)皮肤轮廓的外观得到改进;(i)皮肤光泽和/或亮度得到恢复;(j)由于老化和/或绝经而减退的皮肤外观得到改进;(k)皮肤保湿得到改进;(l)皮肤弹性和/或回弹力得到增加;(m)皮肤下陷得到治疗、减轻和/或预防;(n)皮肤紧致度得到改进;(o)色素斑点、斑点化皮肤和/或疤痕得到减轻;(p)就光衍射或反射来说的皮肤光学性质得到改进;或(q)它们的任何组合。
72.如权利要求58-71中任一项所述的方法,其中所述受试者是人。
73.如权利要求58-72中任一项所述的方法,其中所述疱疹病毒或所述组合物局部、经皮、皮下、皮上、真皮内、口服、舌下、经颊、经直肠、经阴道、尿道内、静脉内、动脉内、肌肉内、骨内、心内、腹膜内、经粘膜、玻璃体内、视网膜下、关节内、关节周、局部、或通过吸入来向所述受试者施用。
74.如权利要求58-73中任一项所述的方法,其中所述疱疹病毒或所述组合物向所述受试者真皮内施用。
75.如权利要求58-74中任一项所述的方法,其中所述疱疹病毒或所述组合物通过浅表注射来施用。
CN201980028654.6A 2018-04-27 2019-04-26 用于美容性应用的编码一种或多种美容蛋白的重组核酸 Pending CN112041434A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862663476P 2018-04-27 2018-04-27
US62/663,476 2018-04-27
PCT/US2019/029422 WO2019210219A1 (en) 2018-04-27 2019-04-26 Recombinant nucleic acids encoding cosmetic protein(s) for aesthetic applications

Publications (1)

Publication Number Publication Date
CN112041434A true CN112041434A (zh) 2020-12-04

Family

ID=68291937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980028654.6A Pending CN112041434A (zh) 2018-04-27 2019-04-26 用于美容性应用的编码一种或多种美容蛋白的重组核酸

Country Status (13)

Country Link
US (2) US10786438B2 (zh)
EP (1) EP3810149A4 (zh)
JP (2) JP2021521894A (zh)
KR (1) KR20210005141A (zh)
CN (1) CN112041434A (zh)
AU (2) AU2019260757B2 (zh)
BR (1) BR112020021804A2 (zh)
CA (1) CA3095187A1 (zh)
CL (2) CL2020002755A1 (zh)
CO (1) CO2020013588A2 (zh)
MX (1) MX2020011257A (zh)
SG (1) SG11202009895TA (zh)
WO (1) WO2019210219A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112746076A (zh) * 2020-12-28 2021-05-04 中吉智药(南京)生物技术有限公司 一种密码子优化的col7a1基因及慢病毒和应用
CN114195884A (zh) * 2021-10-27 2022-03-18 禾美生物科技(浙江)有限公司 一种重组人源胶原蛋白及其制备方法
CN114656572A (zh) * 2022-02-25 2022-06-24 北京大学第一医院 一种bp180抗体快速检测试剂盒及其制备方法
CN117143223A (zh) * 2022-08-23 2023-12-01 山西锦波生物医药股份有限公司 一种生物合成人体结构性材料的制备方法
CN117230103A (zh) * 2023-09-25 2023-12-15 广东瀚润生物科技有限公司 17型人源化胶原蛋白及其蛋白支架、填充材料及应用
CN117402235A (zh) * 2023-10-25 2024-01-16 山西锦波生物医药股份有限公司 生物合成人体结构性材料iv型胶原蛋白的制备方法
CN117866077A (zh) * 2024-03-13 2024-04-12 北京未名拾光生物技术有限公司 重组xvii型胶原蛋白及其表达体系
CN117986389A (zh) * 2024-04-02 2024-05-07 百肽德医药生物科技(广东)有限公司 一种重组人源化xvii型胶原蛋白、制备方法及应用

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109072255A (zh) 2016-04-08 2018-12-21 克里斯托生物技术股份有限公司 用于治疗皮肤的伤口、病症和疾病的组合物和方法
GB201607901D0 (en) * 2016-05-05 2016-06-22 Ipsen Biopharm Ltd Chimeric neurotoxins
EP3752128A1 (de) * 2018-02-16 2020-12-23 Bontana Therapies Gmbh Nukleinsäure-basiertes botulinum neurotoxin zur therapeutischen anwendung
EP3775236A1 (en) 2018-04-12 2021-02-17 Krystal Biotech, LLC Compositions and methods for the treatment of autosomal recessive congenital ichthyosis
EP3921334A1 (en) 2019-02-08 2021-12-15 Krystal Biotech, Inc. Compositions and methods for delivering cftr polypeptides
AU2020405147A1 (en) 2019-12-20 2022-06-23 Krystal Biotech, Inc. Compositions and methods for gene delivery to the airways and/or lungs
WO2021175293A1 (zh) * 2020-03-05 2021-09-10 北京唯源立康生物科技有限公司 一种单纯疱疹病毒及其用途
CN111423516B (zh) * 2020-04-01 2022-02-11 广州佰斯伦医疗器械有限公司 一种蛋白及其在创口修复及抑菌中的应用
CA3213789A1 (en) 2021-04-02 2022-10-06 Krystal Biotech, Inc. Viral vectors for cancer therapy

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040018592A1 (en) * 1999-11-12 2004-01-29 Fibrogen, Inc. Bovine collagens and gelatins
US20140341877A1 (en) * 2006-12-20 2014-11-20 University Of Central Florida Research Foundation, Inc. Mcpip as wound therapy
CN105940110A (zh) * 2014-01-31 2016-09-14 菲克特生物科学股份有限公司 用于核酸产生和递送的方法和产品
US20170290866A1 (en) * 2016-04-08 2017-10-12 Krystal Biotech, LLC Compositions and methods for the treatment of wounds, disorders, and diseases of the skin

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5658724A (en) 1992-07-31 1997-08-19 University Of Pittsburgh Of The Commonwealth System Of Higher Education Herpes simplex virus strains deficient for the essential immediate early genes ICP4 and ICP27 and methods for their production, growth and use
ES2303726T3 (es) 1997-04-10 2008-08-16 University Of Southern California Proteinas modificadas que se fijan a componentes de la matriz extracelular.
US5998174A (en) 1997-05-12 1999-12-07 University Of Pittsburgh Of The Commonwealth System Of Higher Education Multigene vectors
GB9715085D0 (en) 1997-07-18 1997-09-24 Jahoda Amanda J Gene therapy vehicle
US6106826A (en) 1997-12-17 2000-08-22 Wisconsin Alumni Research Foundation Replication competent, avirulent Herpes simplex virus as a vector for neural and ocular gene therapy
GB9801930D0 (en) 1998-01-29 1998-03-25 Univ London Mutant herpes simplex viruses and uses thereof
AU4680699A (en) 1998-06-12 1999-12-30 Aradigm Corporation Methods of delivering aerosolized polynucleotides to the respiratory tract
WO2000040734A1 (en) 1998-12-31 2000-07-13 Arch Development Corporation Recombinant herpes simplex virus useful for treating neoplastic disease
GB9930418D0 (en) 1999-12-22 2000-02-16 Neurovex Ltd Replication incompetent herpes virus vectors
US6846670B2 (en) 2000-11-28 2005-01-25 The University Of Chicago Genetically engineered herpes virus for the treatment of cardiovascular disease
JP2008174459A (ja) * 2007-01-16 2008-07-31 Maruzen Pharmaceut Co Ltd 抗老化剤、並びに皮膚外用剤及び美容用飲食品
WO2008106646A2 (en) 2007-03-01 2008-09-04 Introgen Therapeutics, Inc Methods and formulations for topical gene therapy
ES2590461T3 (es) 2010-07-02 2016-11-22 Fundación Centro Nacional De Investigaciones Oncológicas Carlos Iii La transcriptasa inversa de la telomerasa como protección frente al envejecimiento
CN102212559B (zh) 2011-04-14 2014-04-09 郑州威瑞生物技术有限公司 一种重组的hsv扩增子载体及其用途
ES2670495T3 (es) 2011-10-11 2018-05-30 Inserm - Institut National De La Santé Et De La Recherche Médicale Tratamiento de salto de exones para epidermólisis ampollosa distrófica
GB201202561D0 (en) 2012-02-15 2012-03-28 Univ Dundee Treatment of skin disorders
AU2013243951A1 (en) * 2012-04-02 2014-10-30 Moderna Therapeutics, Inc. Modified polynucleotides for the production of secreted proteins
CA2873881A1 (en) 2012-05-18 2013-11-21 Stephen Bruce Fleming Combination treatments and compositions for wound healing
AU2014223243B2 (en) 2013-03-01 2019-10-17 Regents Of The University Of Minnesota Talen-based gene correction
KR102382295B1 (ko) 2013-07-17 2022-04-04 유니버시티 오브 피츠버그-오브 더 커먼웰쓰 시스템 오브 하이어 에듀케이션 효율적인 유전자 전달 적용을 위한 비독성 hsv 벡터 및 이의 생산을 위한 보완 세포
JP2015221759A (ja) * 2014-05-22 2015-12-10 株式会社東洋新薬 コラーゲン合成促進剤、ヒアルロン酸合成促進剤及びセラミド合成促進剤
FR3021541B1 (fr) 2014-05-28 2017-10-27 Oreal Procede cosmetique pour attenuer les rides
WO2016128783A1 (en) 2015-02-09 2016-08-18 Allergan Industrie Sas Compositions and methods for improving skin appearance
BR112017019054B1 (pt) 2015-03-05 2021-05-11 Avon Products, Inc método cosmético, não terapêutico, para diminuir sinais dermatológicos de envelhecimento em pele humana e produtos para cuidados com a pele
DK3432912T3 (da) 2016-03-25 2023-03-13 Periphagen Inc Hsv-vektorer med høj transduktion
MA45492A (fr) 2016-06-23 2019-05-01 Hopitaux Paris Assist Publique Vecteurs viraux pour le traitement de l'hyperactivité vésicale neurogène
EP3775236A1 (en) * 2018-04-12 2021-02-17 Krystal Biotech, LLC Compositions and methods for the treatment of autosomal recessive congenital ichthyosis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040018592A1 (en) * 1999-11-12 2004-01-29 Fibrogen, Inc. Bovine collagens and gelatins
US20140341877A1 (en) * 2006-12-20 2014-11-20 University Of Central Florida Research Foundation, Inc. Mcpip as wound therapy
CN105940110A (zh) * 2014-01-31 2016-09-14 菲克特生物科学股份有限公司 用于核酸产生和递送的方法和产品
US20170290866A1 (en) * 2016-04-08 2017-10-12 Krystal Biotech, LLC Compositions and methods for the treatment of wounds, disorders, and diseases of the skin

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ELDEM SADIKOGLOU等: ""Comparative analysis of internal ribosomal entry sites as molecular tools for bicistronic expression"", 《JOURNAL OF BIOTECHNOLOGY》, vol. 181 *
IVANOV等: ""A Tobamovirus Genome That Contains an Internal Ribosome Entry Site Functional in Vitro"", 《VIROLOGY》, vol. 232, pages 6 *
NUUTILA K 等: ""Recombinant human collagen III gel for transplantation of autologous skin cells in porcine full-thickness wounds"", 《J TISSUE ENG REGEN MED》, vol. 9, no. 12, pages 1386 - 93 *
王佩君等: ""带状疱疹的神经系统并发症"", 《浙江医学》, no. 6, pages 26 - 28 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112746076B (zh) * 2020-12-28 2023-05-12 中吉智药(南京)生物技术有限公司 一种密码子优化的col7a1基因及慢病毒和应用
CN112746076A (zh) * 2020-12-28 2021-05-04 中吉智药(南京)生物技术有限公司 一种密码子优化的col7a1基因及慢病毒和应用
CN114195884A (zh) * 2021-10-27 2022-03-18 禾美生物科技(浙江)有限公司 一种重组人源胶原蛋白及其制备方法
CN114195884B (zh) * 2021-10-27 2024-03-29 禾美生物科技(浙江)有限公司 一种重组人源胶原蛋白及其制备方法
CN114656572A (zh) * 2022-02-25 2022-06-24 北京大学第一医院 一种bp180抗体快速检测试剂盒及其制备方法
CN117143223A (zh) * 2022-08-23 2023-12-01 山西锦波生物医药股份有限公司 一种生物合成人体结构性材料的制备方法
CN117143223B (zh) * 2022-08-23 2024-03-08 山西锦波生物医药股份有限公司 一种生物合成人体结构性材料的制备方法
CN117230103B (zh) * 2023-09-25 2024-04-19 爱光生物医药(南昌)有限公司 17型人源化胶原蛋白及其蛋白支架、填充材料及应用
CN117230103A (zh) * 2023-09-25 2023-12-15 广东瀚润生物科技有限公司 17型人源化胶原蛋白及其蛋白支架、填充材料及应用
CN117402235A (zh) * 2023-10-25 2024-01-16 山西锦波生物医药股份有限公司 生物合成人体结构性材料iv型胶原蛋白的制备方法
CN117402235B (zh) * 2023-10-25 2024-06-11 山西锦波生物医药股份有限公司 生物合成人体结构性材料iv型胶原蛋白的制备方法
CN117866077A (zh) * 2024-03-13 2024-04-12 北京未名拾光生物技术有限公司 重组xvii型胶原蛋白及其表达体系
CN117866077B (zh) * 2024-03-13 2024-05-28 北京未名拾光生物技术有限公司 重组xvii型胶原蛋白及其表达体系
CN117986389A (zh) * 2024-04-02 2024-05-07 百肽德医药生物科技(广东)有限公司 一种重组人源化xvii型胶原蛋白、制备方法及应用
CN117986389B (zh) * 2024-04-02 2024-06-07 百肽德医药生物科技(广东)有限公司 一种重组人源化xvii型胶原蛋白、制备方法及应用

Also Published As

Publication number Publication date
CO2020013588A2 (es) 2020-11-10
KR20210005141A (ko) 2021-01-13
JP2024056823A (ja) 2024-04-23
BR112020021804A2 (pt) 2021-02-23
SG11202009895TA (en) 2020-11-27
US20210045988A1 (en) 2021-02-18
CA3095187A1 (en) 2019-10-31
MX2020011257A (es) 2021-01-15
CL2023001338A1 (es) 2023-10-20
AU2023285844A1 (en) 2024-01-25
AU2019260757B2 (en) 2023-09-28
EP3810149A4 (en) 2022-08-24
US20190328644A1 (en) 2019-10-31
US10786438B2 (en) 2020-09-29
CL2020002755A1 (es) 2021-01-29
WO2019210219A1 (en) 2019-10-31
JP2021521894A (ja) 2021-08-30
AU2019260757A1 (en) 2020-12-03
EP3810149A1 (en) 2021-04-28

Similar Documents

Publication Publication Date Title
CN112041434A (zh) 用于美容性应用的编码一种或多种美容蛋白的重组核酸
AU2019280069B2 (en) Compositions and methods for the treatment of wounds, disorders, and diseases of the skin
AU2022201307B2 (en) Genetically modified cells, tissues, and organs for treating disease
AU2023214237A1 (en) Modified polynucleotides for the production of biologics and proteins associated with human disease
KR102469450B1 (ko) 인터류킨-12 (il12)를 코딩하는 폴리뉴클레오티드 및 그의 용도
AU2023251441A1 (en) RNA containing composition for treatment of tumor diseases
KR102252561B1 (ko) C/ebp 알파 짧은 활성화 rna 조성물 및 사용 방법
US6262333B1 (en) Human genes and gene expression products
KR20210049859A (ko) 게놈을 조절하는 방법 및 조성물
KR20210040948A (ko) 단핵구 및 대식세포의 염증성 표현형을 조절하기 위한 조성물 및 방법, 그리고 이의 면역요법 용도
KR20200116933A (ko) 인간 심근세포에서 디스트로핀 돌연변이를 교정하기 위한 조성물 및 방법
WO1995014772A1 (fr) Signature genique
KR20220002609A (ko) 포유동물 세포의 특성을 변경하기 위한 인공 마이크로-rna 및 이들 생성물의 조성물을 사용한 포유동물 세포의 변형
KR20100017494A (ko) 프로테오글리칸 폴리펩타이드를 암호화하는 핵산을 이용한 상처 및 피부손상의 치료
JP2024063082A (ja) 皮膚疾患の治療のための組成物及び方法
KR20220139926A (ko) 인공 시냅스
KR102195319B1 (ko) 상처치료제 스크리닝용 조성물 및 이를 이용한 상처 치료제 스크리닝 방법
KR20220077916A (ko) 세포를 형질세포양 수지상 세포 또는 인터페론 유형 i-생산 세포로 재프로그래밍하기 위한 조성물, 방법 및 이의 용도
EP1070125A2 (de) Menchliche nukleinsaeurefragmente, deren expression in brustnormalgewebe erhoeht ist
CN113874512A (zh) 诱导毛细胞分化的组合物和方法
KR20240005837A (ko) 성숙한 각막 내피 세포의 생성 방법
US8455191B2 (en) Cell transdifferentiation into brown adipocytes
Castagnola et al. Expression ofruntBIs Modulated during Chondrocyte Differentiation
US20060148677A1 (en) Chondrogenesis stimulator
US20030113720A1 (en) cDNAs expressed in adipocyte differentiation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination