KR20180128016A - 피부의 상처, 장애 및 질환의 치료를 위한 조성물 및 방법 - Google Patents

피부의 상처, 장애 및 질환의 치료를 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20180128016A
KR20180128016A KR1020187030112A KR20187030112A KR20180128016A KR 20180128016 A KR20180128016 A KR 20180128016A KR 1020187030112 A KR1020187030112 A KR 1020187030112A KR 20187030112 A KR20187030112 A KR 20187030112A KR 20180128016 A KR20180128016 A KR 20180128016A
Authority
KR
South Korea
Prior art keywords
polypeptide
pharmaceutical composition
vector
transgene
vii
Prior art date
Application number
KR1020187030112A
Other languages
English (en)
Inventor
수마 크리쉬난
푸자 아가왈
Original Assignee
크리스탈 바이오테크, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=57822104&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20180128016(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 크리스탈 바이오테크, 인크. filed Critical 크리스탈 바이오테크, 인크.
Publication of KR20180128016A publication Critical patent/KR20180128016A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • A61K35/763Herpes virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/1703Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • A61K38/1709Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • A61K38/1748Keratin; Cytokeratin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/39Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin, cold insoluble globulin [CIG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/44Oxidoreductases (1)
    • A61K38/443Oxidoreductases (1) acting on CH-OH groups as donors, e.g. glucose oxidase, lactate dehydrogenase (1.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0014Skin, i.e. galenical aspects of topical compositions
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/02Drugs for dermatological disorders for treating wounds, ulcers, burns, scars, keloids, or the like
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/04Antipruritics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/16Emollients or protectives, e.g. against radiation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/30Macromolecular organic or inorganic compounds, e.g. inorganic polyphosphates
    • A61K47/36Polysaccharides; Derivatives thereof, e.g. gums, starch, alginate, dextrin, hyaluronic acid, chitosan, inulin, agar or pectin
    • A61K47/38Cellulose; Derivatives thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/06Ointments; Bases therefor; Other semi-solid forms, e.g. creams, sticks, gels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16611Simplexvirus, e.g. human herpesvirus 1, 2
    • C12N2710/16641Use of virus, viral particle or viral elements as a vector
    • C12N2710/16643Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/11Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
    • C12Y114/11004Procollagen-lysine 5-dioxygenase (1.14.11.4), i.e. lysine-hydroxylase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Epidemiology (AREA)
  • Genetics & Genomics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Dermatology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Biophysics (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mycology (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 개시내용은, 부분적으로는, 대상체에서 콜라겐 알파-1(VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충하는데 적합한 하나 이상의 폴리뉴클레오타이드를 포함하는 약제학적 조성물에 관한 것이다. 또한, 본 개시내용은, 부분적으로는, 수포성 표피박리증의 하나 이상의 증상을 갖고 있거나 이의 발병 위험이 있는 대상체를 비롯한 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하기 위한 약제학적 조성물 및 이의 사용 방법에 관한 것이다.

Description

피부의 상처, 장애 및 질환의 치료를 위한 조성물 및 방법
관련 출원에 대한 상호 참조
본 출원은 미국 가출원 일련번호 62/320,316(출원일: 2016년 4월 8일)의 우선권의 이익을 주장하며, 이 기초출원은 그의 전문이 참고로 본 명세서에 편입된다.
ASCII 텍스트 파일에 대한 서열목록의 제출
ASCII 텍스트 파일에 대한 이하의 제출의 내용은 이의 전문이 참고로 본 명세서에 편입된다: 서열목록(파일명: 761342000140SEQLIST.txt, 기록일: 2016년 12월 28일, 크기: 394 KB)의 컴퓨터 판독 가능한 형태(CRF).
본 발명의 기술분야
본 발명은, 부분적으로는, 수포성 표피박리증의 하나 이상의 증상을 갖고 있거나 이의 발병 위험이 있는 대상체를 비롯한 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하기 위한 약제학적 조성물 및 이의 사용 방법에 관한 것이다.
많은 심각한 질환-관련 피부 병태는 이러한 질환을 앓고 있는 환자에서 하나 이상의 유전자 장애와 연관된다. 하나의 이러한 질환인, 수포성 표피박리증(epidermolysis bullosa: EB)은, 병에 걸린 개체의 피부 및 점막에 긁힘, 러빙(rubbing) 또는 할큄 등과 같은 미소한 손상 또는 마찰에 반응하여 물집이 생기게 하거나 짓무름을 생기게 하는 일군의 유전자 장애이다. 이영양성 수포성 표피박리증(dystrophic epidermolysis bullosa: DEB)은 EB의 주된 형태 중 하나이다. 이 병태의 증상 및 징후는, 영향을 받은 개체에서, 경미한 것(물집이 손, 발, 무릎 및 팔꿈치에만 영향을 미칠 수 있음)에서부터 중증의 것(광범위한 물집 및 반흔, 가능하게는 시력 상실, 미관손상, 및 기타 심각하고 때로는 치명적인 의학적 병태까지 초래함)에 이르는 매우 광범위하다.
이영양성 수포성 표피박리증은 3가지 주된 유형으로 분류된다. 상염색체 우선 이영양성 수포성 표피박리증(우선 이영양성 수포성 표피박리증(dominant dystrophic epidermolysis bullosa) 또는 DDEB라 지칭됨)은 전형적으로 가장 경미한 형태이며, 이것은 물집이 흔히 손, 발, 무릎 및 팔꿈치로 제한된다. 이영양성 수포성 표피박리증, 알로프-지멘스 유형(Hallopeau-Siemens type) 퇴행적 이영양성 수포성 표피박리증, 및 비-알로프-지멘스 유형(non-Hallopeau-Siemens type) 퇴행적 수포성 표피박리증(일괄적으로 퇴행적 이영양성 수포성 표피박리증(recessive dystrophic epidermolysis bullosa) 또는 RDEB라 지칭됨)의 나머지 두 유형은 더욱 중증이다. RDEB는 대부분 피부 및 점막의 확대된 물집 및 반흔을 특징으로 한다. 물집은 점막(예컨대, 구강 및 소화관의 내벽) 위를 비롯하여 전신에 걸쳐 통상적으로 존재하며, 이러한 물집의 치유는 광범위한 반흔을 초래한다. 구강 및 식도가 손상되면, 음식을 씹거나 삼기는 것이 곤란해져서, 만성 영양실조 및 느린 성장을 초래한다. 광범위한 반흔으로부터의 합병증은 손가락과 발가락의 융합, 관절의 기형 및 시력 상실로 이어지는 눈의 염증을 포함할 수 있다. 또한, RDEB를 앓고 있는 환자는 편평 세포 암종의 발병 위험이 높으며, 이러한 암종은 이 환자 모집단에서 특이하게 공격적일 수 있어, 종종 생명을 위협하게 된다. 3가지의 유형의 이영양성 수포성 표피박리증은 중증도가 상이하지만, 이들은 많은 공통된 특징을 갖고, 동일한 유전자 돌연변이에 의해 유발된다.
이영양성 수포성 표피박리증은, 콜라겐 알파-1 (VII) 사슬 단백질(콜라겐 7)을 암호화하는, Col7a1 유전자에 돌연변이에 의해 초래된다. 이 유전자에 대해서 240개 이상의 별개의 돌연변이가 DEB 환자에서 확인, 즉, 동정되었다. 부가적으로, 라이실 하이드록실라제 3 효소(LH3)를 변형시키는 콜라겐을 암호화하는 PLOD3 유전자의 발현의 상당한 감소가 또한 이영양성 표피박리증 환자에세 관찰되었다. 콜라겐 알파-1 (VII) 사슬 단백질은 피부를 강화시키고 안정화시키는 기능을 하는 한편, 라이실 하이드록실라제 3은 기능성 콜라겐 알파-1 (VII) 사슬 단백질의 합성 및 분비에서 중요한 역할을 한다. 간략하게는, Col7a1 전사물은 번역되고, 얻어진 펩타이드가 이들의 프롤린 잔기를 (프롤릴 하이드록실라제에 의해) 그리고 이들의 라이신 잔기를 (라이실 하이드록실라제, 예컨대, LH3에 의해) 하이드록실화함으로써 번역후 변형된다. 그 후, 하이드록시라이신 잔기는 글리코실화될 수 있고, 이어서 3개의 글리코실화 펩타이드가 프로-콜라겐으로 알려진 삼중 나선을 형성하고, 세포에 분비된다. 분비된 프로-콜라겐은 이어서 고차 구조로 연합되어 고정 원섬유(anchoring fibril)를 형성할 수 있다. 그 후, 고정 원섬유는 상피 기저막의 부착에서 조직화, 안정화 및 원조에 도움을 주도록 이용 가능하다. 상피 기저막은 기저의 소성 결합 조직에 상피를 고정시키는 것을 담당하고, 표피-진피 안정성(표피진피경계 온전성(dermoepidermal junction integrity))을 위하여 필수적이다. Col7a1 유전자에서의 돌연변이, 그리고 PLOD3 발현의 감소된 수준은, 이영양성 수포성 표피박리증 환자의 진피에 상비를 적절하게 결합시키는 콜라겐 알파-1 (VII) 사슬 단백질의 능력을 손상시켜, 손상되기 쉬운 피부를 초래한다.
수포성 표피박리증 환자에 대한 치료 옵션은 제한되고, 현재의 관심사는 통증과 가려움증을 통제하기 위한 약물을 제공하는 것, 피부 및 점막 상의 개방 상처에 기인하는 감염을 모면하기 위하여 경구 항생제를 투여하는 것, 그리고 반흔 및 기형에 대처하기 위한 수술적 전략을 비롯하여, 질환의 증상을 관리하는데 초점을 맞추고 있다. 수포성 표피박리증의 근본적인 원인을 치료하기 위한 연구 방법은 정제된 콜라겐 7, 콜라겐 7을 함유하는 섬유모세포, 또는 콜라겐 7을 암호화하는 바이러스 벡터를 피부내 주사에 의해 투여하는 것을 포함한다. 많은 DEB 환자는 외상이 발생하기 쉬운 부위(예컨대, 천골, 둔부, 발, 허리 및 손)의 커다란 영역에 걸쳐 다수의 상처를 지니기 때문에, 피부내 주입을 포함하는 많은 치료가 극히 침습적이어서, 이들 커다란 상처 영역이 모두 아마도 반복적으로 주사되어야 필요가 있지만, 주사 시간 간격은 불명확하다.
따라서, 이 환자 모집단에서 관찰된, 콜라겐 알파-1 (VII) 사슬 단백질에서의 결손뿐만 아니라 라이실 하이드록실라제 3 단백질에서의 결손에 대처할 수 있는 수포성 표피박리증 환자에 대한 덜 침습적/최소 침습적/비침습적 치료 옵션에 대한 명백한 요구가 존재한다.
특허 출원, 특허 공보, 비특허 문헌 및 UniProtKB/Swiss-Prot 수탁 번호를 비롯하여 본 명세서에서 인용된 모든 참고 문헌은, 마치 각각의 개별적인 참고 문헌이 구체적으로 개별적으로 참고로 원용되도록 나타낸 것처럼 이들의 전문이 본 명세서에 참고로 편입된다.
이들 요구를 충족시키기 위하여, 본 개시내용은, 부분적으로는, 대상체에서, 특히, 수포성 표피박리증의 하나 이상의 증상을 지니거나 또는 이의 발병 위험이 있는 대상체에서 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하기 위한 약제학적 조성물 및 사용 방법에 관한 것이다. 특히, 본 개시내용은, 부분적으로는, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 약제학적 조성물을 투여(예컨대, 국소 또는 경피 투여)함으로써 개체를 치료하는 방법에 관한 것이다.
따라서, 본 개시내용의 소정의 양상은 벡터를 포함하는 바이러스를 포함하는 약제학적 조성물에 관한 것으로, 여기서 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 또는 이들의 키메라 폴리펩타이드를 암호화하는 1개 이상의 전이유전자(transgene), 및 약제학적으로 허용 가능한 담체를 포함한다. 몇몇 실시형태에 있어서, 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 단순 포진 바이러스(HSV)이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 변형된 외피를 포함한다. 몇몇 실시형태에 있어서, 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시킨다. 몇몇 실시형태에 있어서, 변형된 외피는 돌연변이 단순 포진 바이러스 당단백질을 포함한다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘(Sleeping Beauty hybrid amplicon)이다. 몇몇 실시형태에 있어서, 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합하다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 miRNA 결합 부위를 포함한다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 하나 이상의 이종 촉진자에 작동 가능하게 연결된다. 몇몇 실시형태에 있어서, 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물 중 하나 이상이다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 벡터는 다시스트론성(polycistronic)인 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(open reading frame: ORF) 상에서 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1 및 제2 ORF는 내부 리보솜 유입 부위(internal ribosomal entry site: IRES)에 의해 분리된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 약 등몰비로 있다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대, 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드와 라이실 하이드록실라제 3 폴리펩타이드 사이에 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다.
본 개시내용의 다른 양상은 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는 방법에 관한 것으로, 상기 방법은 대상체의 하나 이상의 세포에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 약제학적 조성물을 국소 또는 경피 투여하는 단계를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하는 바이러스를 포함하되, 여기서 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 약제학적으로 허용 가능한 담체를 포함한다. 몇몇 실시형태에 있어서, 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 단순 포진 바이러스(HSV)이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 변형된 외피를 포함한다. 몇몇 실시형태에 있어서, 상기 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시킨다. 몇몇 실시형태에 있어서, 변형된 외피는 돌연변이 단순 포진 바이러스 당단백질을 포함한다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합하다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 miRNA 결합 부위를 포함한다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 하나 이상의 이종 촉진자에 작동 가능하게 연결된다. 몇몇 실시형태에 있어서, 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물 중 하나 이상이다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 벡터는 다시스트론성인 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1 및 제2 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 약 등몰비로 있다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대, 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드와 라이실 하이드록실라제 3 폴리펩타이드 사이에 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 대상체의 하나 이상의 환부 영역 또는 비환부 영역에 투여된다. 몇몇 실시형태에 있어서, 피부의 질환 또는 장애는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군(nethertons syndrome), 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창 중 하나 이상이다.
본 개시내용의 다른 양상은 단리된 키메라 폴리펩타이드(여기서 단리된 키메라 폴리펩타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및 링커 폴리펩타이드를 포함하되, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드는 링커 폴리펩타이드에 의해 분리됨), 이를 암호화하는 폴리뉴클레오타이드, 상기 폴리뉴클레오타이드를 포함하는 벡터, 및 상기 벡터를 포함하는 숙주 세포에 관한 것이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 폴리뉴클레오타이드를 포함한다.
본 개시내용의 다른 양상은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 또는 이들의 임의의 조합을 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 벡터(여기서 벡터는 재조합 단순 포진 바이러스 게놈임), 및 벡터를 포함하는 숙주 세포에 관한 것이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다.
본 개시내용의 다른 양상은 단순 포진 바이러스를 수집하는 방법에 관한 것으로, 관심 대상 벡터는 상기 단순 포진 바이러스 내에 패키징되어 있다. 몇몇 실시형태에 있어서, 상기 방법은 숙주 세포를 헬퍼 바이러스를 암호화하는 벡터와 접촉시키는 단계, 상기 숙주 세포를 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘과 접촉시키는 단계, 및 상기 숙주 세포에 의해 생성된 단순 포진 바이러스 유전자를 수집하는 단계를 포함한다. 몇몇 실시형태에 있어서, 상기 방법은 상보성 숙주 세포를 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 재조합 단순 포진 바이러스 게놈 벡터와 접촉시키는 단계, 및 상기 상보성 숙주 세포에 의해 생성된 단순 포진 바이러스 유전자를 수집하는 단계를 포함한다. 몇몇 실시형태에 있어서, 수집된 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다.
본 개시내용의 다른 양상은 본 명세서에 기재된 약제학적 조성물 및 약제학적 조성물을 투여하기 위한 설명서를 포함하는 키트에 관한 것이다.
본 개시내용의 다른 양상은 벡터를 포함하는 바이러스를 포함하는 약제학적 조성물에 관한 것으로, 여기서 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 약제학적으로 허용 가능한 담체를 포함한다. 몇몇 실시형태에 있어서, 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 단순 포진 바이러스(HSV)이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 경피 또는 피부내 투여에 적합하다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 miRNA 결합 부위를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서,라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 서열번호 30의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 30의 적어도 100개 연속 아미노산이다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자 및 제2 전이유전자는 각각 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자, 제2 전이유전자 및 제3 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다.
본 개시내용의 다른 양상은 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는 방법에 관한 것으로, 상기 방법은 벡터를 포함하는 약제학적 조성물을 대상체에게 투여하는 단계를 포함하되, 벡터는 재조합 단순 포진 바이러스 게놈이고, 약제학적 조성물은 대상체의 하나 이상의 세포에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능하다. 몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하는 바이러스를 포함하되, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 약제학적으로 허용 가능한 담체를 포함한다. 몇몇 실시형태에 있어서, 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 단순 포진 바이러스(HSV)이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 또는 UL55이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4, ICP27 및 UL55 유전자 내의 비활성화 돌연변이는 ICP4, ICP27 및 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자 내의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역에서의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 비활성화 돌연변이는 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를, UL41 유전자에 비활성화 돌연변이를, 또는 ICP47 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 바이러스 유전자 좌위 내에 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합하다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 경피 또는 피부내 투여에 적합하다. 몇몇 실시형태에 있어서, 하나 이상의 전이유전자는 miRNA 결합 부위를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드는 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 서열번호 30의 서열에 대해서 적어도 80% 서열 동일성을 갖는다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 단편이되, 여기서 단편은 서열번호 30의 적어도 100개 연속 아미노산이다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드는 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자 및 제2 전이유전자는 각각 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 벡터는 적어도 제1 전이유전자, 제2 전이유전자 및 제3 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 대상체에게 국소 또는 경피 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 대상체에게 경피 또는 피부내 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 대상체의 하나 이상의 환부 영역 또는 비환부 영역에 투여된다. 몇몇 실시형태에 있어서, 피부의 질환 또는 장애는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군, 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창 중 하나 이상이다.
도 1a 내지 도 1f 야생형 및 변형된 단순 포진 바이러스 게놈의 개략도를 도시한다. 도 1a 야생형 단순 포진 바이러스 게놈을 도시한다. 도 1b 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 1c 2개의 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시하되, 전이유전자 중 하나는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고 다른 하나는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 전이유전자는 DNA의 동일 가닥 상에서 암호화된다. 도 1d 2개의 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시하되, 전이유전자 중 하나는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고 다른 하나는 라이실 하이드록실라제 3 폴리펩타이드암호화하며, 전이유전자는 안티센스 배향에서 DNA의 대향하는 가닥 상에서 암호화된다. 도 1e는 내부 리보솜 유입 부위(IRES)에 의해 분리된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 다시스트론성인 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 1f 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 전이유전자를 포함하는 변형된 단순 포진 바이러스 게놈을 도시한다.
도 2a 내지 도 2g는 야생형 및 변형된 단순 포진 바이러스 게놈의 추가적인 개략도를 도시한다. 도 2a 야생형 단순 포진 바이러스 게놈을 도시한다. 도 2b는 ICP4(둘 다 복제), ICP27 및 UL55의 암호화 서열의 결실과, ICP22 및 ICP47의 촉진자 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2c ICP4(둘 다 복제) 및 ICP22의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2d ICP0 및 ICP4(둘 다 복제)의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2e는 ICP0, ICP4(둘 다 복제), 및 ICP22의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2f ICP0, ICP4(둘 다 복제), ICP22, 및 ICP27의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다. 도 2g ICP0, ICP4 (둘 다 복제), ICP22, ICP27, 및 UL55의 암호화 서열의 결실을 포함하고, 2개의 전이유전자가 ICP4 좌위에서 통합된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 변형된 단순 포진 바이러스 게놈을 도시한다.
도 3은 인간 콜라겐 7 (COL7A1) 발현 카세트를 보유하는 복제-결함성 제1형 단순 포진 바이러스(HSV-1)인 "KB103"의 개략도를 도시한다.
도 4A 내지 도 4B KB103-감염된 RDEB 인간 피부 각질세포(도 4A) 및 RDEB 인간 피부 섬유모세포(도 4B)로부터의 COL7 전사 수준의 용량-의존적 증가를 도시한다. 전사물은 β-액틴 수준에 대해서 정량화되고 비감염 세포에서의 발현에 대해서 정규화되었다.
도 5A 내지 도 5B KB103-감염된 세포에서 검출된 인간 Col7 단백질 발현을 도시한다. 도 5A는 표시된 감염다중도(multiplicity of infection: MOI)에서 KB103에 감염된 섬유모세포뿐만 아니라, 비감염 정상 및 RDEB 섬유모세포에서의 인간 Col7 단백질 발현을 도시한다. 도 5B는 표시된 감염다중도(MOI)에서 KB103에 감염된 각질세포뿐만 아니라, 비감염 정상 및 RDEB 각질세포에서의 인간 Col7 단백질 발현을 도시한다. 인간 GAPDH 단백질 발현이 장입 대조군(loading control)으로서 도시되어 있다.
도 6은 면역형광법에 의해 평가된 바와 같은, 비감염(대조군) 또는 KB103 감염된 (C7, MOI 3) RDEB 인간 피부 섬유모세포(EB HDF), 정상 인간 피부 각질세포(정상 HDK), 및 RDEB 인간 피부 각질세포(RDEB HDK)에서의 인간 COL7A1 단백질 발현을 도시한다.
도 7 표시된 MOI에서 KB103으로 감염된 각질세포뿐만 아니라, 비감염 정상 및 RDEB 인간 피부 각질세포에서의 인간 Col7 및 LH3 단백질 발현을 도시한다. 인간 GAPDH 단백질 발현이 장입 대조군으로서 도시되어 있다.
도 8은 표시된 MOI에서 KB103으로 감염된 섬유모세포뿐만 아니라, 비감염 정상 및 RDEB 인간 피부 섬유모세포에서의 인간 TSP-1 단백질 발현을 도시한다. 인간 GAPDH 단백질 발현이 장입 대조군으로서 도시되어 있다.
도 9A 내지 도 9B 표시된 래트 꼬리 콜라겐 1(도 9A) 및 인간 파이브로넥틴(도 9B)의 농도 증가에 따라 처리된 웰에 대한, 표시된 MOI에서 KB103으로 감염된 각질세포 및 비감염 (대조군) RDEB 인간 피부 각질세포의 세포 부착을 도시한다.
도 10은 면역형광법에 의해 KB103 감염된 피부-등가 기관형 배양(organotypic culture)에서 기저막 구역(basement membrane zone: BMZ)에서의 Col7 침착(deposition)을 도시한다.
도 11은 KB103-감염된 마우스로부터 단리된 조직에서의 인간 Col7 전사 수준 및 바이러스 게놈 복제수의 정량화를 도시한다.
도 12는 기저막 구역(BMZ)에서 인간 Col7 침착의 개시를 비롯하여, 면역형광법에 의한 KB103-감염된 마우스로부터의 진피 조직에서의 인간 Col7 단백질 발현을 도시한다.
본 개시내용은, 부분적으로는, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 약제학적 조성물에 관한 것이다. 몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하되, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 대상체의 하나 이상의 세포에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충하는데 적합한 하나 이상의 전이유전자를 포함한다. 본 개시내용은 또한, 부분적으로는, 본 명세서에 기재된 약제학적 조성물을 투여(예컨대, 국소 또는 경피 투여)함으로써 대상체에서 피부의 상처, 장애 또는 질환(예컨대, 이영양성 수포성 표피박리증)의 예방적, 일시적 또는 치료적 완화를 제공하는 방법에 관한 것이다.
이하의 설명은 예시적인 방법, 파라미터 등을 기술한다. 이러한 설명은 본 개시내용의 범위에 대한 제한으로서 의도된 것이 아니라 대신에 예시적인 실시형태의 설명으로서 제공되는 것임이 인식되어야 한다.
일반적 수법
본 명세서에 기재된 또는 인용된 수법 및 절차는 일반적으로 잘 이해되며, 당업자에게 공지된 통상의 방법, 예를 들어, 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual 3d edition (2001) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.; Current Protocols in Molecular Biology (F.M. Ausubel, et al. eds., (2003)); the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988); Oligonucleotide Synthesis (M.J. Gait, ed., 1984); Methods in Molecular Biology, Humana Press; Cell Biology: A Laboratory Notebook (J.E. Cellis, ed., 1998) Academic Press; Animal Cell Culture (R.I. Freshney), ed., 1987); Introduction to Cell and Tissue Culture (J.P. Mather and P.E. Roberts, 1998) Plenum Press; Cell and Tissue Culture: Laboratory Procedures (A. Doyle, J.B. Griffiths, and D.G. Newell, eds., 1993-8) J. Wiley and Sons; Gene Transfer Vectors for Mammalian Cells (J.M. Miller and M.P. Calos, eds., 1987); PCR : The Polymerase Chain Reaction, (Mullis et al., eds., 1994); Short Protocols in Molecular Biology (Wiley and Sons, 1999)]에 기재된 광범위하게 이용되는 방법을 이용해서 통상적으로 이용된다.
정의
본 발명을 상세히 설명하기 전에, 본 발명은, 물론 다양할 수 있는 특정 조성물 또는 생물학적 시스템으로 한정되지 않는 것이 이해되어야 한다. 또한, 본 명세서에서 사용되는 용어는 특정 실시형태를 오로지 설명할 목적이며 제한으로 의도되지 않는 것이 이해되어야 한다.
본 명세서에서 이용되는 바와 같이, 단수 형태는 문맥이 달리 명확하게 지칭하지 않는 한 복수의 지시 대상을 포함한다. 따라서, 예를 들어, "분자"라는 언급은 선택적으로 이러한 분자의 2개 이상의 조합을 포함한다.
본 명세서에서 이용되는 바와 같이, 용어 "약"은 당해 기술 분야에서의 당업자에게 용이하게 공지된 각각의 값에 대한 통상의 오차 범위를 지칭한다. 본 명세서에서 값 또는 파라미터의 "약"으로의 언급은 그 값 또는 파라미터 자체를 지칭하는 실시형태를 포함한다(그리고 기술한다).
본 명세서에서 이용되는 바와 같이, 용어 "폴리뉴클레오타이드", "핵산 서열", "핵산", 및 이들의 변형어는 폴리데옥시리보뉴클레오타이드(2-데옥시-D-리보스를 함유), 폴리리보뉴클레오타이드(D-리보스를 함유), 퓨린 또는 피미리딘 염기의 N-글리코사이드인 폴리뉴클레오타이드의 임의의 다른 유형, 및 비-뉴클레오타이드 골격을 함유하는 기타 중합체에 대한 총칭일 것이며, 단 중합체는, DNA 및 RNA에서 발견되는 바와 같이, 염기 짝?기 및 염기 스태킹(stacking)을 허용하는 입체형태의 핵염기를 함유한다. 따라서, 이들 용어는 공지된 유형의 핵산 서열 변형, 예를 들어, 유사체 및 인터-뉴클레오타이드 변형과 함께 천연형 뉴클레오타이드들 중의 하나 이상의 뉴클레오타이드의 치환을 포함한다.
본 명세서에서 이용되는 바와 같이, 핵산은 다른 핵산 서열과의 기능적 관계에 놓일 때 "작동 가능하게 연결된" 또는 "작동적으로 연결된"다. 예를 들어, 촉진자 또는 증강자(enhancer)는 서열의 전사에 영향을 미칠 경우 암호화 서열에 작동 가능하게 연결되거나; 또는 리보솜 결합 부위는 번역을 용이하게 하기 위하여 위치될 경우 암호화 서열에 작동 가능하게 연결된다. 일반적으로, "작동 가능하게 연결된"은 연결 중인 DNA 서열이 인접해 있는 것을 의미한다.
본 명세서에서 이용되는 바와 같이, 용어 "벡터"는 이종 핵산을 그의 발현 또는 복제를 위하여 세포에 도입하는데 사용되는 별도의 요소를 지칭한다. 발현 벡터는 이러한 핵산의 발현을 수행할 수 있게 하는, 조절 서열, 예컨대, 촉진자 영역과 작동 가능하게 연결된 핵산을 발현 가능한 벡터를 포함한다. 따라서, 발현 벡터는, DNA 또는 RNA 작제물, 예컨대, 플라스미드, 파지, 재조합 바이러스 또는 기타 벡터를 지칭할 수 있으며, 이들은 적절한 숙주 세포에 도입 시, 핵산의 발현을 유발한다. 적절한 발현 벡터는 당업자에게 잘 알려져 있고, 진핵생물 세포로 복제 가능한 것들 및 에피솜인 채로 있는 것들 또는 숙주 세포 게놈에 통합되는 것들을 포함한다.
본 명세서에서 이용되는 바와 같이, "개방형 해독틀" 또는 "ORF"은, 단백질 또는 폴리펩타이드를 암호화하는, 핵산인 DNA 또는 RNA 중 하나의 연속 스트레치를 지칭한다. 전형적으로, 핵산은, 예컨대, ATG 또는 AUG, 및 종결 코돈과 같은 번역 시작 신호 또는 개시 코돈을 포함한다.
본 명세서에서 이용되는 바와 같이, "내부 리보솜 유입 부위" 또는 "IRES"는 중도에서, 예를 들어, mRNA 서열의 제1 개시 코돈 후에 번역 개시를 허용하는 뉴클레오타이드 서열을 지칭한다.
본 명세서에서 이용되는 바와 같이, "비번역(untranslated) 영역" 또는 "UTR"은 개방형 해독틀의 5' 및/또는 3' 말단에서 비번역된 핵산을 지칭한다. 폴리뉴클레오타이드에서 하나 이상의 UTR의 내포는 전사후 조절, mRNA 안정성, 및/또는 폴리뉴클레오타이드의 번역에 영향을 미칠 수 있다.
본 명세서에서 이용되는 바와 같이, 용어 "전이유전자"는 세포 내로 도입된 후에 RNA로 전사되고 적절한 조건 하에 번역 및/또는 발현되는 폴리뉴클레오타이드를 지칭한다. 몇몇 양상에 있어서, 도입되는 세포에 목적하는 특성을 부여하거나 또는 다르게는 목적하는 치료 또는 진단 성과를 초래한다.
본 명세서에서 이용되는 바와 같이, 용어 "폴리펩타이드," "단백질" 및 "펩타이드"는 호환 가능하게 사용되며 2개 이상의 아미노산의 중합체를 지칭할 수 있다.
본 명세서에서 이용되는 바와 같이, "대상체", "숙주" 또는 "개체"는 인간을 비롯한 포유동물, 가축 및 농장 동물, 및 동물원, 스포츠 또는 애완 동물, 예컨대, 개, 말, 고양이, 소뿐만 아니라, 마우스 및 래트 등과 같은 연구에 이용되는 동물로서 분류되는 임의의 동물을 지칭한다. 몇몇 실시형태에 있어서, 포유류는 인간이다.
본 명세서에서 이용되는 바와 같이, "국소 투여" 또는 "국소적으로 투여하는"은, 직접 또는 다르게는 대상체의 피부의 전부 또는 일부에 조성물을 포함하는 제형을 접촉시킴으로써 대상체에 대한 조성물의 전달을 지칭한다. 이 용어는, 국소 및 경피를 포함하지만, 이들로 제한되는 것은 아닌 여러 투여 경로를 포함한다. 국소 투여는 대상체의 표피 또는 진피에 또는 이의 특정 층에 조성물을 전달하는 수단으로서 사용된다.
본 명세서에서 이용되는 바와 같이, "유효량"은 적어도 특정 장애의 하나 이상의 증상의 측정 가능한 개선 또는 예방을 시행하는데 필요한 최소량이다. 유효량은 또한 치료의 임의의 독성 또는 유해 효과가 치료적으로 유익한 효과에 의해 능가되는 것이다. 예방적 이용을 위하여, 유리한 또는 바람직한 결과는 질환, 이의 합병증 및 질환의 발병 동안 제시되는 중간의 병리적 표현형의 위험을 제거 또는 감소, 이의 중증도를 약화, 또는 이의 발병을 지연시키는 것과 같은 결과를 포함한다. 치료적 이용을 위하여, 유리한 또는 바람직한 결과는 질환으로부터 기인되는 하나 이상의 증상의 감소, 질환을 앓고 있는 자의 삶의 질의 증가, 질환의 진행의 지연, 및/또는 생존율 연장과 같은 임상 결과를 포함한다. 유효량은 1회 이상의 투여로 투여될 수 있다.
약제학적 조성물
폴리뉴클레오타이드
일 양상에 있어서, 본 명세서에서는, 콜라겐 알파-1 (VII) 사슬(Col7) 폴리펩타이드, 라이실 하이드록실라제 3 (LH3) 폴리펩타이드, 케라틴 유형 I 세포골격 17 (KRT17) 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함하는 약제학적 조성물이 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 키메라 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 라이실 하이드록실라제 3 폴리펩타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하되, 여기서 벡터는 본 명세서에 기재된 폴리뉴클레오타이드를 포함하는 하나 이상의 전이유전자를 암호화한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 벡터를 포함하되, 여기서 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 하나 이상의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 코라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다.
몇몇 실시형태에 있어서, 약제학적 조성물은 합성 RNA를 포함하되, 여기서 합성 RNA는 본 명세서에 기재된 폴리뉴클레오타이드를 포함하는 하나 이상의 전이유전자를 암호화한다. 몇몇 실시형태에 있어서, 약제학적 조성물은 합성 RNA를 포함하되, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 키메라 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 합성 RNA는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 하나 이상의 전이유전자, 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다.
콜라겐 알파-1 (VII) 사슬
몇몇 양상에 있어서, 본 개시내용의 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 1이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 1의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드는 서열번호 1의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 또는 적어도 350, 적어도 500, 적어도 1000, 적어도 2500, 적어도 5000, 적어도 7500개, 그러나 8835개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 2의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 2의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 본 개시내용은 호모 사피엔스(H. sapiens) 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 동족체인 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 관한 것이다. 관심 대상 폴리펩타이드의 동족체인 폴리펩타이드를 식별하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 2의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 2의 적어도 10, 적어도 12, 적어도 14, 적어도 16, 적어도 18, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 75, 적어도 100, 적어도 250, 적어도 500, 적어도 750, 적어도 1000, 적어도 1500, 적어도 2000, 또는 적어도 2500개, 그러나 2944개 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대상체의 하나 이상의 표적 세포에 전달될 경우 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 발현은 대상체의 표피진피경계 온전성을 증강, 증가, 증대 및/또는 보충시킨다.
라이실 하이드록실라제 3
몇몇 양상에 있어서, 본 개시내용의 폴리뉴클레오타이드는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 3이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 3의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 라이실 하이드록실라제 3 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. 라이실 하이드록실라제 3 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드는 서열번호 3의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 500, 적어도 750, 적어도 1000, 적어도 1500, 또는 적어도 2000개, 그러나 2217개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 4의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 4의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 본 개시내용은 호모 사피엔스 라이실 하이드록실라제 3 폴리펩타이드의 동족체인 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 관한 것이다. 관심 대상 폴리펩타이드의 동족체인 폴리펩타이드를 식별하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 4의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 4의 적어도 10, 적어도 12, 적어도 14, 적어도 16, 적어도 18, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 75, 적어도 100, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 600, 또는 적어도 700개, 그러나 738개 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대상체의 하나 이상의 표적 세포에 전달될 경우 라이실 하이드록실라제 3 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 라이실 하이드록실라제 3 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 라이실 하이드록실라제 3 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드의 발현은 대상체의 표피진피경계 온전성을 증강, 증가, 증대 및/또는 보충시킨다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 대상체의 동일한 세포에 전달된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 사슬 (VII) 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는, 폴리뉴클레오타이드들이 대상체의 동일한 세포에 전달될 경우 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 등몰비에서 발현시킨다.
케라틴 유형 I 세포골격 17
몇몇 양상에 있어서, 본 개시내용의 폴리뉴클레오타이드는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 29이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 29의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 케라틴 유형 I 세포골격 17 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드는 서열번호 29의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 또는 적어도 350, 적어도 500, 적어도 1000, 적어도 1250개, 그러나 1299개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 30의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 30의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 본 개시내용은 호모 사피엔스 케라틴 유형 I 세포골격 17 폴리펩타이드의 동족체인 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 관한 것이다. 관심 대상 폴리펩타이드의 동족체인 폴리펩타이드를 식별하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 30의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 30의 적어도 10, 적어도 12, 적어도 14, 적어도 16, 적어도 18, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 75, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 425개, 그러나 432개 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대상체의 하나 이상의 표적 세포에 전달될 경우 케라틴 유형 I 세포골격 17 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 케라틴 유형 I 세포골격 17 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 케라틴 유형 I 세포골격 17 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드의 발현은 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시킨다.
링커를 포함하는 키메라 폴리펩타이드
몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 더 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 절단 가능한 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 절단 가능한 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 T2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 P2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 E2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 F2A 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다.
몇몇 양상에 있어서, 본 개시내용의 폴리뉴클레오타이드는 링커 폴리펩타이드를 암호화한다. 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 5, 서열번호 7, 서열번호 9 및 서열번호 11이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 5, 서열번호 7, 서열번호 9, 또는 서열번호 11의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 링커 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. 링커 폴리펩타이드의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드는 서열번호 5, 서열번호 7, 서열번호 9, 또는 서열번호 11의 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 또는 적어도 60개, 그러나 66개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 6, 서열번호 8, 서열번호 10, 또는 서열번호 12의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드는 서열번호 6, 서열번호 8, 서열번호 10, 또는 서열번호 12의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 6, 서열번호 8, 서열번호 10, 또는 서열번호 12의 적어도 4, 적어도 6, 적어도 8, 적어도 10, 적어도 12, 적어도 14, 적어도 16, 적어도 18, 또는 적어도 20개, 그러나 22개 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 1개 이상의 퓨린 절단 부위를 암호호하는 폴리뉴클레오타이드를 더 포함한다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위를 암호화하는 폴리뉴클레오타이드는 정규(canonical) 퓨린 절단 부위(Arg-X-(Arg/Lys)-Arg)의 서열과 동일한 또는 실질적으로 유사한 아미노산 서열을 암호화한다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 T2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 T2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 P2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 P2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 E2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 E2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 F2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 F2A 링커 폴리펩타이드의 하류에서 암호화된다.
몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는, 5'에서부터 3'로, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는, 5'에서부터 3'로, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함한다.
콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27이다. 본 개시내용의 폴리뉴클레오타이드는 또한 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 또는 서열번호 27의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 N-말단 절단부, C-말단 절단부, 또는 키메라 폴리펩타이드의 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 키메라 폴리펩타이드의 단편을 암호화하는 폴리뉴클레오타이드는, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 또는 서열번호 27의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 450, 적어도 500, 적어도 550, 적어도 600, 적어도 650, 적어도 700, 적어도 750, 적어도 800, 적어도 850, 적어도 900, 적어도 950, 적어도 1000, 적어도 2000, 적어도 3000, 적어도 4000, 적어도 5000, 적어도 6000, 적어도 7000, 적어도 8000, 적어도 9000, 또는 적어도 10000개, 그러나 11121개 미만의 연속 뉴클레오타이드를 갖는 폴리뉴클레오타이드를 포함한다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 갖는 폴리펩타이드를 암호화하는 폴리뉴클레오타이드이다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 아미노산 서열의 N-말단 절단부, C-말단 절단부, 또는 단편을 암호화하는 폴리뉴클레오타이드이다. N-말단 절단부, C-말단 절단부, 또는 단편은 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 적어도 25, 적어도 50, 적어도 75, 적어도 100, 적어도 125, 적어도 150, 적어도 175, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 450, 적어도 500, 적어도 550, 적어도 600, 적어도 650, 적어도 700, 적어도 750, 적어도 800, 적어도 850, 적어도 900, 적어도 950, 적어도 1000, 적어도 1250, 적어도 1500, 적어도 1750, 적어도 2000, 적어도 2250, 적어도 2500, 적어도 2750, 적어도 3000, 적어도 3250, 또는 적어도 3500개, 그러나 3706 미만의 연속 아미노산을 포함할 수 있다.
몇몇 실시형태에 있어서, 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 폴리뉴클레오타이드가 대상체의 하나 이상의 표적 세포에 전달될 경우 키메라 폴리펩타이드를 발현시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 하나 이상의 표적 세포에서 발현된 후에 절단된다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 하나 이상의 표적 세포에서 발현된 경우 링커 폴리펩타이드 내에서 절단된다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드는 2개의 폴리펩타이드로 절단되는데, 그중 하나는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함하고 다른 하나는 라이실 하이드록실라제 3 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 하나 이상의 표적 세포에서 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 대상체의 하나 이상의 콜라겐 폴리펩타이드 상에 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 키메라 폴리펩타이드의 발현은 대상체의 표피진피경계 온전성을 증강, 증가, 증대 및/또는 보충시킨다.
본 개시내용의 폴리뉴클레오타이드는 코돈-최적화될 수 있다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 인간 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 마우스 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 래트 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 햄스터 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 개 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 효모 세포에 대해서 코돈-최적화된다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 박테리아 세포에 대해서 코돈-최적화된다. 본 개시내용의 폴리뉴클레오타이드는 DNA 폴리뉴클레오타이드, RNA 폴리뉴클레오타이드, 또는 하나 이상의 DNA 폴리뉴클레오타이드와 하나 이상의 RNA 폴리뉴클레오타이드의 조합일 수 있다.
벡터
몇몇 양상에 있어서, 본 개시내용은 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 함유하는 벡터, 바람직하게는 발현 벡터에 관한 것이다. 몇몇 실시형태에 있어서, 벡터는 DNA 벡터이다. 일반적으로, 대상체에서 하나 이상의 폴리펩타이드를 생산하기 위하여 폴리뉴클레오타이드를 유지, 전파 또는 발현시키는데 적합한 벡터가 사용될 수 있다. 적합한 벡터의 예는, 플라스미드, 코스미드, 에피솜, 트랜스포존(transposon), 및 바이러스 벡터(예컨대, 아데노바이러스, 백시니아 바이러스, 신드비스 바이러스(Sindbis-viral), 홍역, 포진 바이러스, 렌티 바이러스, 레트로바이러스, 아데노-연관 바이러스 벡터 등)를 포함하지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 벡터는 숙주 세포에서 자율 복제 가능하다. 몇몇 실시형태에 있어서, 벡터는 숙주 세포에서 자율 복제 불가능하다. 몇몇 실시형태에 있어서, 벡터는 숙주 DNA 내에 통합 가능하다. 관심 대상인 하나 이상의 폴리뉴클레오타이드를 함유하는 벡터를 제조하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 벡터는 단순 포진 바이러스 벡터이다. 몇몇 실시형태에 있어서, 단순 포진 바이러스 벡터는 포진 바이러스 앰플리콘 벡터이다. 구조적 특징 및 벡터를 제조하는 방법을 비롯하여 포진 바이러스 앰플리콘 벡터는, 당업자에게 일반적으로 공지되어 있다(de Silva S. and Bowers W. "Herpes Virus Amplicon Vectors". Viruses 2009, 1, 594-629). 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 혼성 앰플리콘이다. HSV-1 혼성 앰플리콘의 예는, HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, HSV/EBV/RV 혼성 앰플리콘 및 HSV/슬리핑 뷰티 혼성 앰플리콘을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 벡터는 HSV/AAV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/EBV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/EBV/RV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는HSV/슬리핑 뷰티 혼성 앰플리콘이다.
몇몇 실시형태에 있어서, 단순 포진 바이러스 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 1개 이상의 독성 단순 포진 바이러스 유전자의 발현을 감소 또는 제거하도록 조작되었다. 재조합 단순 포진 바이러스 게놈을 조작하는 방법은 일반적으로 WO2015/009952에 기재되어 있다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 비활성화 돌연변이를 포함한다. 비활성화 돌연변이의 예는, 결실, 삽입, 점 돌연변이 및 재배열을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55 단순 포진 바이러스 유전자 중 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 또는 8개 모두에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물) 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP4(하나 또는 둘 다의 복제물), ICP27, 및/또는 UL55 유전자의 비활성화 돌연변이는 ICP4(하나 또는 둘 다의 복제물), ICP27, 및/또는 UL55 유전자의 암호화 서열의 결실이다. 몇몇 실시형태에 있어서, ICP22 및 ICP47 유전자에서의 비활성화 돌연변이는 ICP22 및 ICP47 유전자의 촉진자 영역의 결실이다(예컨대, ICP22 및 ICP47 암호화 서열은 무손상이지만 전사 활성이다). 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP27 및 UL55 유전자의 암호화 서열의 결실과 ICP22 및 ICP47 유전자의 촉진자 영역의 결실을 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), 및 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4(하나 또는 둘 다의 복제물)유전자에 비활성화 돌연변이를 포함한다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물) 및 ICP22에 비활성화 돌연변이를 포함한다. 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물), ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물), ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, ICP0, ICP4 (하나 또는 둘 다의 복제물), ICP22, ICP27 및/또는 UL55 유전자에서의 비활성화 돌연변이는 ICP0, ICP4 (하나 또는 둘 다의 복제물), ICP22, ICP27 및/또는 UL55 유전자의 암호화 서열의 결실을 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물), ICP22, ICP27 및 UL55 유전자의 암호화 서열의 결실을 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP47 유전자 및 UL41 유전자에 비활성화 돌연변이를 더 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4(하나 또는 둘 다의 복제물), ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4(하나 또는 둘 다의 복제물), ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 1, 2, 3, 4, 5, 6, 7개 또는 그 이상의 바이러스 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 적합한 바이러스 좌위의 예는, 제한 없이, ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55 단순 포진 바이러스 유전자 좌위를 포함할 수 있다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 바이러스 ICP4 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다(예컨대, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스 등). 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 바이러스 UL41 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 바이러스 ICP47 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 바이러스 ICP4 유전자 좌위 중 하나 이상 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를, 그리고 바이러스 UL41 유전자 좌위 내에 하나 이상의 폴리뉴클레오타이드를 포함한다(예컨대, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스 등).
벡터는 숙주 세포에서 폴리뉴클레오타이드의 발현에 적합한 형태로 본 개시내용의 폴리뉴클레오타이드를 포함할 수 있다. 발현 벡터는 발현될 폴리뉴클레오타이드에 작동 가능하게 연결된 하나 이상의 조절 서열을 포함할 수 있다. 용어 "조절 서열"은 촉진자, 증강자 및 기타 발현 제어 요소(예컨대, 폴리아데닐화 신호)를 포함한다. 적합한 증강자의 예는, 포유류 유전자(예컨대, 글로빈, 엘라스타제, 알부민, α-태아단백질, 인슐린 등), 및 진핵생물 세포 바이러스로부터의 증강자 서열(예컨대, 복제 원점(bp 100-270)의 마지막 측면 상의 SV40 증강자, 거대세포바이러스 조기 촉진자 증강자, 복제 원점의 마지막 측면 상의 폴리오마 증강자, 아데노바이러스 증강자 등)을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 포유류 숙주 세포에서의 전사에 적합한 촉진자의 예는, 바이러스(예컨대, 폴리오마 바이러스, 계두 바이러스, 아데노바이러스(예컨대, 아데노바이러스 2), 소 유두종 바이러스, 조류 육종 바이러스, 거대세포바이러스, 레트로바이러스, B형 간염 바이러스, 유인원(Simian) 바이러스 40(SV40) 등)의 게놈으로부터, 또는 이종 포유류 촉진자(예컨대, 액틴 촉진자, 면역글로불린 촉진자, 열-충격 촉진자 등)로부터 얻어진 촉진자를 포함할 수 있지만, 이들로 제한되는 것은 아니며, 단 이러한 촉진자는 숙주 세포와 양립 가능하다. 몇몇 실시형태에 있어서, 본 개시내용의 폴리뉴클레오타이드는 1종 이상의 이종 촉진자에 작동 가능하게 연결된다. 몇몇 실시형태에 있어서, 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물 중 하나 이상이다. 몇몇 실시형태에 있어서, 1종 이상의 이종 촉진자는 구성적 촉진자, 조직-특이적 촉진자, 시간 촉진자, 공간 촉진자, 유도 촉진자 및 억제 촉진자 중 1종 이상이다. 조절 서열은 조직-특이적 조절 및/또는 유도성 서열뿐만 아나리, 뉴클레오타이드 서열의 구성적 발현을 지시하는 것들을 포함할 수 있다. 발현 벡터의 설계는 본 개시내용의 폴리뉴클레오타이드와 접촉될 숙주 세포, 목적하는 단백질의 발현 수준 등과 같은 이러한 인자에 좌우될 수 있다. 본 개시내용의 발현 벡터는 숙주 세포에 도입될으로써 본 명세서에 기재된 바와 같은 폴리뉴클레오타이드에 의해 암호화된 단백질 또는 폴리펩타이드(예컨대, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드s, 케라틴 유형 I 세포골격 17 폴리펩타이드, 키메라 폴리펩타이드 등)를 생산할 수 있다.
몇몇 실시형태에 있어서, 본 개시내용의 벡터는 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 하나 이상의 전이유전자를 포함한다. 하나 이상의 전이유전자는 벡터에 임의의 배향에서 삽입될 수 있다. 벡터가 2개 이상(예컨대, 2개 이상, 3개 이상 등)의 전이유전자를 포함할 경우, 전이유전자는 서로 동일 배향 또는 대향 배향(opposite orientation)으로 삽입될 수 있다. 이론에 의해 얽매이길 원치 않지만, 안티센스 배향으로 벡터 내에 2개의 전이유전자를 편입시키는 것은 각 전이유전자의 번역초과(read-through)를 회피하여 적절한 발현을 확보하는 것을 도울 수 있다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및/또는 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 단일의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 각각 암호화하는 2개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 각각 암호화하는 3개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 단일의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 각각 암호화하는 2개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 각각 암호화하는 3개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 단일의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 각가가 암호화하는 2개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 각각 암호화하는 3개의 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 단일의 전이유전자를 포함한다.
몇몇 실시형태에 있어서, 벡터는 적어도 2개의 전이유전자(예컨대, 2개, 3개, 4개, 5개, 6개, 7개 또는 그 이상의 전이유전자)를 포함한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다.
몇몇 실시형태에 있어서, 벡터는 적어도 3개의 전이유전자(예컨대, 3, 4, 5, 6, 7개 또는 그 이상의 전이유전자)를 포함한다. 몇몇 실시형태에 있어서, 적어도 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 적어도 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 적어도 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화한다.
몇몇 실시형태에 있어서, 벡터는 다시스트론성인 전이유전자를 포함한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다.
몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 제2 개방형 해독틀(ORF) 상에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1 및 제2 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 다시스트론성 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1, 제2 및 제3 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
적합한 IRES의 적합한 예는 바이러스-유래 IRES(예컨대, 폴리오바이러스, 리노바이러스, 뇌척수심근염바이러스, 구제역 바이러스, C형 간염 바이러스, 고전적 돼지 콜레라 바이러스, 라우스 육종 바이러스, 인간 면역결핍 바이러스, 귀뚜라미마비병 바이러스, 카포시 육종-연관 헤르페스바이러스 등으로부터 유래된 IRES) 및 세포 mRNA-유래 IRES(예컨대, 성장 인자 mRNA로부터 유래된 IRES, 예컨대, 섬유모세포 성장 인자 2, 혈소판-유래 성장 인자 B, 및 혈관 내피 성장 인자, 전사 인자 mRNA로부터 유래된 IRES, 예컨대, 안테나페디아(antennapedia), 울트라비트로락삼, 및 NF-κB 억제 인자, 종양유전자 mRNA로부터 유래된 IRES에 의해 정제시켜, c-myc, pim-1, 및 단백질 키나제 p58PITSLRE 등)를 포함할 수 있지만, 이들로 제한되는 것은 아니다.
본 개시내용의 벡터는 추가의 암호화 및 비-암호화 서열을 더 포함할 수 있다. 추가의 암호화 및 비-암호화 서열의 예는, 추가의 폴리펩타이드 태그, 인트론, 5' 및 3' UTR 등을 암호화하는 서열을 포함할 수 있지만 이들로 제한되는 것은 아니다. 적합한 폴리펩타이드 태그의 예는, 정제 태그의 임의의 조합, 예컨대, his-태그, 플래그-태그, 말토스 결합 단백질 및 글루타티온-S-전이효소 태그, 검출 태그, 예컨대, 광학 측정법으로 검출될 수 있는 태크(예컨대, 적색 형광 단백질 등) 및 검출 가능한 효소 활성도를 갖는 태그(예컨대, 알칼리성 포스파타제 등), 분비 서열, 리더 서열, 및/또는 안정화 서열, 프로테아제 절단 부위(예컨대, 퓨린 절단 부위, TEV 절단 부위, 트롬빈 절단 부위)를 함유하는 태그 등을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 폴리뉴클레오타이드의 안정성, 국부화 및/또는 번역 효율을 증가시킨다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 하나 이상의 폴리뉴클레오타이드의 안정성, 국부화 및/또는 번역 효율을 증가시키도록 변형된다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 단백질 발현의 수준 및/또는 지속기간을 개선시킨다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 오프-타깃 전이유전자 발현을 차단 또는 저감(예컨대, 특정 세포 유형(예컨대, 신경 세포)에서, 세포 주기 내 특정 시간에, 특정 발달 단계 등에서 발현을 저해)시킬 수 있는 요소(예컨대, 1개 이상의 miRNA 결합 부위 등)를 포함한다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 특정 세포 유형에서 전이유전자 발현을 증강시킬 수 있는 요소(예컨대, 1개 이상의 miRNA 결합 부위 등)를 포함한다.
합성 RNA 폴리뉴클레오타이드
몇몇 양상에 있어서, 본 개시내용은 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 함유하는 합성 RNA, 특히 합성 mRNA에 관한 것이다. 몇몇 실시형태에 있어서, 합성 mRNA 폴리뉴클레오타이드는 5'-캡(cap) 구조를 포함한다. 5'-캡 구조의 예는, 캡-0, 캡-1, 캡-2, 및 캡-3 구조, 및 이들의 유도체를 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 합성 mRNA 폴리뉴클레오타이드는 3'-폴리(A) 테일을 포함한다. 몇몇 실시형태에 있어서, 합성 mRNA 폴리뉴클레오타이드는 합성 mRNA 폴리뉴클레오타이드 내에 함유된 1개 이상의 암호화 서열에 측접하는 1개 이상의 5' 및/또는 3' UTR을 포함한다. 몇몇 실시형태에 있어서, 5' 및/또는 3' UTR은 합성 mRNA 폴리뉴클레오타이드의 안정성, 국부화 및/또는 번역 효율을 증가시킨다. 몇몇 실시형태에 있어서, 5' 및/또는 3' UTR은 합성 mRNA 폴리뉴클레오타이드의 안정성, 국부화 및/또는 번역 효율을 증가시키도록 변형된다. 몇몇 실시형태에 있어서, 5' 및/또는 3' UTR은 단백질 발현의 수준 및/또는 지속기간을 개선시킨다. 몇몇 실시형태에 있어서, 5' 및/또는 3' UTR은 단백질 발현의 수준 및/또는 지속기간을 개선시키도록 변형된다. 몇몇 실시형태에 있어서, 5' 및/또는 3'UTR은 오프-타깃 전이유전자 발현을 제한(예컨대, 특정 세포 유형(예컨대, 신경 세포)에서, 세포 주기 내 특정 시간에, 특정 발달 단계 등에서 발현을 저해)시킬 수 있는 요소(예컨대, 1개 이상의 miRNA 결합 부위 등)를 포함한다. 몇몇 실시형태에 있어서, 5' UTR은 Kozak 서열을 포함한다. 몇몇 실시형태에 있어서, Kozak 서열은 Kozak 연속 서열과 동일하거나 또는 실질적으로 유사하다. 관심 대상인 하나 이상의 폴리뉴클레오타이드를 함유하는 합성 mRNA 폴리뉴클레오타이드의 제조 방법은 당업자에게 잘 알려져 있다.
몇몇 양상에 있어서, 본 개시내용의 합성 mRNA 폴리뉴클레오타이드는 하나 이상의 변형된 리보뉴클레오타이드를 포함한다. 변형된 리보뉴클레오타이드의 예는, 2-티오유리딘, 5-아자유리딘, 슈도유리딘, 4-티오유리딘, 5-메틸유리딘, 5-아미노유리딘, 5-하이드록시유리딘, 5-메틸-5-아자유리딘, 5-아미노-5-아자유리딘, 5-하이드록시-5-아자유리딘, 5-메틸슈도유리딘, 5-아미노슈도유리딘, 5-하이드록시슈도유리딘, 4-티오-5-아자유리딘, 4-티오슈도유리딘, 4-티오-5-메틸유리딘, 4-티오-5-아미노유리딘, 4-티오-5-하이드록시유리딘, 4-티오-5-메틸-5-아자유리딘, 4-티오-5-아미노-5-아자유리딘, 4-티오-5-하이드록시-5-아자유리딘, 4-티오-5-메틸슈도유리딘, 4-티오-5-아미노슈도유리딘, 4-티오-5-하이드록시슈도유리딘, 2-티오사이티딘, 5-아자사이티딘, 슈도아이소사이티딘, N4-메틸사이티딘, N4-아미노사이티딘, N4-하이드록시사이티딘, 5-메틸사이티딘, 5-아미노사이티딘, 5-하이드록시사이티딘, 5-메틸-5-아자사이티딘, 5-아미노-5-아자사이티딘, 5-하이드록시-5-아자사이티딘, 5-메틸슈도아이소사이티딘, 5-아미노슈도아이소사이티딘, 5-하이드록시슈도아이소사이티딘, N4-메틸-5-아자사이티딘, N4-메틸슈도아이소사이티딘, 2-티오-5-아자사이티딘, 2-티오슈도아이소사이티딘, 2-티오-N4-메틸사이티딘, 2-티오-N4-아미노사이티딘, 2-티오-N4-하이드록시사이티딘, 2-티오-5-메틸사이티딘, 2-티오-5-아미노사이티딘, 2-티오-5-하이드록시사이티딘, 2-티오-5-메틸-5-아자사이티딘, 2-티오-5-아미노-5-아자사이티딘, 2-티오-5-하이드록시-5-아자사이티딘, 2-티오-5-메틸슈도아이소사이티딘, 2-티오-5-아미노슈도아이소사이티딘, 2-티오-5-하이드록시슈도아이소사이티딘, 2-티오-N4-메틸-5-아자사이티딘, 2-티오-N4-메틸슈도아이소사이티딘, N4-메틸-5-메틸사이티딘, N4-메틸-5-아미노사이티딘, N4-메틸-5-하이드록시사이티딘, N4-메틸-5-메틸-5-아자사이티딘, N4-메틸-5-아미노-5-아자사이티딘, N4-메틸-5-하이드록시-5-아자사이티딘, N4-메틸-5-메틸슈도아이소사이티딘, N4-메틸-5-아미노슈도아이소사이티딘, N4-메틸-5-하이드록시슈도아이소사이티딘, N4-아미노-5-아자사이티딘, N4-아미노슈도아이소사이티딘, N4-아미노-5-메틸사이티딘, N4-아미노-5-아미노사이티딘, N4-아미노-5-하이드록시사이티딘, N4-아미노-5-메틸-5-아자사이티딘, N4-아미노-5-아미노-5-아자사이티딘, N4-아미노-5-하이드록시-5-아자사이티딘, N4-아미노-5-메틸슈도아이소사이티딘, N4-아미노-5-아미노슈도아이소사이티딘, N4-아미노-5-하이드록시슈도아이소사이티딘, N4-하이드록시-5-아자사이티딘, N4-하이드록시슈도아이소사이티딘, N4-하이드록시-5-메틸사이티딘, N4-하이드록시-5-아미노사이티딘, N4-하이드록시-5-하이드록시사이티딘, N4-하이드록시-5-메틸-5-아자사이티딘, N4-하이드록시-5-아미노-5-아자사이티딘, N4-하이드록시-5-하이드록시-5-아자사이티딘, N4-하이드록시-5-메틸슈도아이소사이티딘, N4-하이드록시-5-아미노슈도아이소사이티딘, N4-하이드록시-5-하이드록시슈도아이소사이티딘, 2-티오-N4-메틸-5-메틸사이티딘, 2-티오-N4-메틸-5-아미노사이티딘, 2-티오-N4-메틸-5-하이드록시사이티딘, 2-티오-N4-메틸-5-메틸-5-아자사이티딘, 2-티오-N4-메틸-5-아미노-5-아자사이티딘, 2-티오-N4-메틸-5-하이드록시-5-아자사이티딘, 2-티오-N4-메틸-5-메틸슈도아이소사이티딘, 2-티오- N4-메틸-5-아미노슈도아이소사이티딘, 2-티오-N4-메틸-5-하이드록시슈도아이소사이티딘, 2-티오-N4-아미노-5-아자사이티딘, 2-티오-N4-아미노슈도아이소사이티딘, 2-티오-N4-아미노-5-메틸사이티딘, 2-티오-N4-아미노-5-아미노사이티딘, 2-티오-N4-아미노-5-하이드록시사이티딘, 2-티오-N4-아미노-5-메틸-5-아자사이티딘, 2-티오-N4-아미노-5-아미노-5-아자사이티딘, 2-티오-N4-아미노-5-하이드록시-5-아자사이티딘, 2-티오-N4-아미노-5-메틸슈도아이소사이티딘, 2-티오-N4-아미노-5-아미노슈도아이소사이티딘, 2-티오-N4-아미노-5-하이드록시슈도아이소사이티딘, 2-티오-N4-하이드록시-5-아자사이티딘, 2-티오-N4-하이드록시슈도아이소사이티딘, 2-티오-N4-하이드록시-5-메틸사이티딘, N4-하이드록시-5-아미노사이티딘, 2-티오-N4-하이드록시-5-하이드록시사이티딘, 2-티오-N4-하이드록시-5-메틸-5-아자사이티딘, 2-티오-N4-하이드록시-5-아미노-5-아자사이티딘, 2-티오-N4-하이드록시-5-하이드록시-5-아자사이티딘, 2-티오-N4-하이드록시-5-메틸슈도아이소사이티딘, 2-티오-N4-하이드록시-5-아미노슈도아이소사이티딘, 2-티오-N4-하이드록시-5-하이드록시슈도아이소사이티딘, N6-메틸아데노신, N6-아미노아데노신, N6-하이드록시아데노신, 7-데아자아데노신, 8-아자아데노신, N6-메틸-7-데아자아데노신, N6-메틸-8-아자아데노신, 7-데아자-8-아자아데노신, N6-메틸-7-데아자-8-아자아데노신, N6-아미노-7-데아자아데노신, N6-아미노-8-아자아데노신, N6-아미노-7-데아자-8-아자아데노신, N6-하이드록시아데노신, N6-하이드록시-7-데아자아데노신, N6-하이드록시-8-아자아데노신, N6-하이드록시-7-데아자-8-아자아데노신, 6-티오구아노신, 7-데아자구아노신, 8-아자구아노신, 6-티오-7-데아자구아노신, 6-티오-8-아자구아노신, 7-데아자-8-아자구아노신, 및 6-티오-7-데아자-8-아자구아노신을 포함할 수 있지만, 이들로 제한되는 것은 아니다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 2개의 개별의 합성 mRNA 폴리뉴클레오타이드 내에 함유된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 2개의 개별의 합성 mRNA 폴리뉴클레오타이드 내에 함유된다. 몇몇 실시형태에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 2개의 개별의 합성 mRNA 폴리뉴클레오타이드 내에 함유된다. 몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 3개의 개별의 합성 mRNA 폴리뉴클레오타이드 내에 함유된다.
몇몇 실시형태에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 단일의 합성 mRNA 폴리뉴클레오타이드 내에 함유된 단일의 연속적 폴리뉴클레오타이드이다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 제2 개방형 해독틀(ORF) 상에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 2개의 ORF는 IRES에 의해 분리된다.
몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 케라틴 유형 I 세포골격 17 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 라이실 하이드록실라제 3 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 17 폴리펩타이드 on 제1 개방형 해독틀(ORF), 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 단일의 연속적 폴리뉴클레오타이드는 단일의 합성 mRNA에서 케라틴 유형 I 세포골격 17 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서, 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제3 개방형 해독틀(ORF) 상에서 암호화한다. 몇몇 실시형태에 있어서, 제1, 제2 및 제3 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리된다.
적합한 IRES의 예는 바이러스-유래된 IRES(예컨대, 폴리오바이러스, 리노바이러스, 뇌척수심근염바이러스, 구제역 바이러스, C형 간염 바이러스, 고전적 돼지 콜레라 바이러스, 라우스 육종 바이러스, 인간 면역결핍 바이러스, 귀뚜라미마비병 바이러스, 카포시 육종-연관 헤르페스바이러스 등으로부터 유래된 IRES) 및 세포 mRNA-유래 IRES(예컨대, 성장 인자 mRNA로부터 유래된 IRES, 예컨대, 섬유모세포 성장 인자 2, 혈소판-유래 성장 인자 B, 및 혈관 내피 성장 인자, 전사 인자 mRNA로부터 유래된 IRES, 예컨대, 안테나페디아, 울트라비트로락삼, 및 NF-κB 억제 인자, 종양유전자 mRNA로부터 유래된 IRES에 의해 정제시켜, c-myc, pim-1, 및 단백질 키나제 p58PITSLRE 등)를 포함할 수 있지만, 이들로 제한되는 것은 아니다.
몇몇 실시형태에 있어서, 본 명세서에 기재된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 키메라 폴리펩타이드 중 임의의 것을 암호화하는 폴리뉴클레오타이드는 합성 mRNA 폴리뉴클레오타이드 내에서 단일 ORF 상에서 암호화된다.
본 개시내용의 합성 mRNA 폴리뉴클레오타이드는 추가의 암호화 서열을 더 암호화할 수 있다. 추가의 암호화 서열의 예는 추가의 폴리펩타이드 태그를 암호화하는 서열을 포함할 수 있지만 이들로 제한되는 것은 아니다. 적합한 폴리펩타이드 태그의 예는 정제 태그의 임의의 조합, 예컨대, his-태그, 플래그-태그, 말토스 결합 단백질 및 글루타티온-S-전이효소 태그, 검출 태그, 예컨대, 광학 측정법으로 검출될 수 있는 태크(예컨대, 적색 형광 단백질 등) 및 검출 가능한 효소 활성도를 갖는 태그(예컨대, 알칼리성 포스파타제 등), 분비 서열, 리더 서열, 및/또는 안정화 서열, 프로테아제 절단 부위(예컨대, 퓨린 절단 부위, TEV 절단 부위, 트롬빈 절단 부위)를 함유하는 태그 등을 포함할 수 있지만, 이들로 제한되는 것은 아니다.
전달 비히클
본 개시내용의 소정의 양상은 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 전달 비히클을 포함하는 약제학적 조성물에 관한 것이다. 몇몇 실시형태에 있어서, 전달 비히클은 하나 이상의 폴리뉴클레오타이드를하나 이상의 표적 세포에 전달하는데 적합하다.
몇몇 실시형태에 있어서, 전달 비히클은 바이러스이다. 바이러스 전달 비히클의 예는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스를 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 바이러스는 복제-결함성이다. 몇몇 실시형태에 있어서, 바이러스는 복제 가능하다. 몇몇 실시형태에 있어서, 바이러스는 비변형된, 야생형 바이러스의 조직 친화도에 대해서 그의 조직 친화도를 변화시키도록 변형되었다. 하나 이상의 폴리뉴클레오타이드를 포함하는 바이러스를 제조하는 방법은 당업자에게 잘 알려져 있다.
몇몇 실시형태에 있어서, 바이러스 전달 비히클은 단순 포진 바이러스이다. 단순 포진 바이러스 전달 비히클은, 예를 들어, WO2015/009952에 개시된 방법에 의해 제조될 수 있다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 변형된 외피를 포함한다. 몇몇 실시형태에 있어서, 변형된 외피는 1개 이상(예컨대, 1, 2, 3, 4 또는 그 이상)의 돌연변이 단순 포진 바이러스 당단백질을 포함한다. 단순 포진 바이러스 당단백질의 예는 당단백질 gB, gD, gH 및 gL을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 상기 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시킨다. 몇몇 실시형태에 있어서, 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 바이러스는 제1형 단순 포진 바이러스이다. 몇몇 실시형태에 있어서, 바이러스는 제2형 단순 포진 바이러스이다.
몇몇 실시형태에 있어서, 전달 비히클은 비-바이러스 전달 비히클이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 화학물질-기반 전달 비히클(화학물질-기반 전달 시약)이다. 화학물질-기반 전달 비히클의 예는 인산칼슘, 덴드리머, 리포솜(양이온성 리포솜, 비-양이온성 리포솜, 및 혼합물), 엑소솜, 하전된 지질, 및 양이온성 중합체(예컨대, DEAE-덱스트란, 폴리에틸렌이민 등)를 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 비-화학 전달 비히클이다. 비-화학물질 전달 비히클의 예는, 전기영동, 뉴클레오펙션, 초음파천공법, 광학 형질주입, 및 입자-기반 비히클(예컨대, 유전자 건, 자기-보조 형질주입, 임페일펙선(impalefection), 입자 충격 등)을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 덴드리머, 리포솜, 엑소솜, 하전된 지질 또는 양이온성 중합체이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 덴드리머이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 리포솜이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 엑소솜이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 하전된 지질이다. 몇몇 실시형태에 있어서, 비-바이러스 전달 비히클은 양이온성 중합체이다. 비-바이러스 전달 비히클과의 복합체 중에서 관심 대상인 하나 이상의 폴리뉴클레오타이드를 제조하는 방법은 당업자에게 잘 알려져 있다.
약제학적으로 허용 가능한 담체
본 개시내용의 소정의 양상은 약제학적으로 허용 가능한 담체를 포함하는 약제학적 조성물에 관한 것이다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 및/또는 경피 투여/도포에 충분한 담체이다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 피하 및/또는 피부내 투여/도포하기에 충분한 담체이다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 최소 침습적 또는 비-침습적이다. 약제학적으로 허용 가능한 담체는 일반적으로 이용된 농도 및 투약량 및 농도에서 수용자에게 비독성이고, 완충액, 예컨대, 인산염, 시트르산염 및 기타 유기산; 아스코르브산 및 메티오닌을 포함하는 항산화제; 보존제(예컨대, 옥타데실다이메틸벤질 암모늄 클로라이드; 헥사메토늄 클로라이드; 벤잘코늄 클로라이드; 벤제토늄 클로라이드; 페놀; 부틸 또는 벤질 알코올; 알킬 파라벤, 예컨대, 메틸 또는 프로필 파라벤; 카테콜; 제졸시놀; 사이클로헥산올; 3-펜탄올; 및 m-크레졸); 저분자량(약 10개 미만의 잔기) 폴리펩타이드; 단백질, 예컨대, 혈청 알부민, 젤라틴 또는 면역글로불린; 친수성 중합체, 예컨대, 폴리비닐피롤리돈; 아미노산, 예컨대, 글리신, 글루타민; 아스파라긴, 히스티딘, 아르기닌 또는 라이신; 단당류, 이당류 및 기타 탄수화물(글루코스, 만노스 또는 덱스트린을 포함); 킬레이트제, 예컨대, EDTA; 당류, 예컨대, 수크로스, 만니놀, 트레할로스 또는 솔비톨; 폴리올, 예컨대, 글리세롤(예컨대, 10% 글리세롤을 포함하는 제형); 염-형성 반대이온, 예컨대, 나트륨; 금속 착물(예컨대, Zn-단백질 착물); 및/또는 비이온성 계면활성제, 예컨대, 폴리에틸렌 글리콜(PEG)을 포함할 수 있지만 이들로 제한되는 것은 아니다. 약제학적으로 허용 가능한 담체의 철저한 논의는 문헌[REMINGTON'S PHARMACEUTICAL SCIENCES (Mack Pub. Co., N.J. 1991)]에서 입수 가능하다.
몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 도포/투여에 적합하다. 국소 또는 경피 도포/투여에 이용하기에 적합한 담체의 예는 연고, 페이스트, 크림, 현탁액, 에멀션, 지방 연고, 겔, 분말, 로션, 용액, 스프레이, 패취, 마이크로니들 어레이(microneedle array), 및 흡입제를 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 연고, 페이스트, 크림, 현탁액, 에멀션, 지방 연고, 겔, 분말, 로션, 용액, 스프레이, 및 흡입제 중 하나 이상을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 연고를 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 페이스트를 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 크림을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 현탁액을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 에멀션을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 겔을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 분말을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 로션을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 용액을 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 스프레이를 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 흡입제를 포함한다. 몇몇 실시형태에 있어서, 약제학적 담체는 패취(예컨대, 피부에 부착하는 패취)를 포함한다. 몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 마이크로니들 어레이를 포함한다. 약제학적 조성물 전달에 적합한 마이크로니들 어레이를 제조하고 이용하느 방법은 당업계에 일반적으로 공지되어 있다(Kim Y. et al. "Microneedles for drug and vaccine delivery". Advanced Drug Delivery Reviews 2012, 64 (14): 1547-68).
몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 국소 또는 경피 도포/투여에 적합한 2종, 3종, 4종, 5종 또는 그 이상의 상이한 약제학적으로 허용 가능한 담체의 조합물을 포함한다.
몇몇 실시형태에 있어서, 약제학적으로 허용 가능한 담체는 1종 이상의 추가의 성분을 더 포함한다. 추가의 성분의 예는 결합제(예컨대, 전호화 옥수수 전분, 폴리비닐피롤리돈 또는 하이드록시프로필 메틸셀룰로스 등); 충전제(예컨대, 락토스 및 기타 당, 미세결정성 셀룰로스, 펙틴, 젤라틴, 황산칼슘, 에틸 셀룰로스, 폴리아크릴레이트 또는 인산수소칼슘 등); 윤활제(예컨대, 스테아르산마그네슘, 탤크, 실리카, 콜로이드성 이산화규소, 스테아르산, 금속성 스테아르산염, 수소화 식물성 오일, 옥수수 전분, 폴리 에틸렌 글리콜, 벤조산나트륨, 아세트산나트륨 등); 붕해제(예컨대, 전분, 나트륨 전분 글리콜레이트 등); 습윤제(예컨대, 라우릴황산나트륨 등); 염 용액; 알코올; 폴리에틸렌 글리콜; 젤라틴; 락토스; 아밀라제; 스테아르산마그네슘; 탤크; 규산; 점성 파라핀; 하이드록시메틸셀룰로스; 폴리비닐피롤리돈; 감미제; 착향제; 방향제; 착색제; 보습제; 썬크림; 항박테리아제; 폴리뉴클레오타이드를 안정화시키거나 이의 분해를 방지할 수 있는 제제 등을 포함할 수 있지만 이들로 제한되는 것은 아니다.
본 명세서에 기재된 바와 같은 약제학적 조성물 및 제형은 하나 이상의 폴리뉴클레오타이드를 포함하는 전달 비히클를 1종 이상의 약제학적으로 허용 가능한 담체와 혼합함으로써 제조될 수 있다. 생체내 투여에 이용될 제형은 일반적으로 멸균성이다. 멸균은, 예컨대, 멸균 여과막에 의해 용이하게 달성될 수 있다.
치료 방법
본 개시내용은, 부분적으로는, 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하기 위한 약제학적 조성물 및 사용 방법에 관한 것이다. 피부의 질환 또는 장애의 예는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군, 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창을 포함할 수 있지만, 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 피부의 질환 또는 장애는 수포성 표피박리증이다. 몇몇 실시형태에 있어서, 대상체는 수포성 표피박리증의 하나 이상의 증상을 갖거나 이의 발병 위험이 있다.
본 명세서에 기재된 폴리뉴클레오타이드 및 약제학적 조성물은, 수포성 표피박리증(예컨대, 퇴행적 이영양성 수포성 표피박리증, 우선 이영양성 수포성 표피박리증 등)의 하나 이상의 증상을 치료를 포함하는, 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는데 유용하다. 본 개시내용의 약제학적 조성물은, 제한 없이, 경구 투여, 설하 투여, 협측 투여, 국소 투여, 직장 투여, 흡입을 통해, 경피 투여, 피하 주사, 피부내 주사, 정맥내(IV) 주사, 관절내 주사, 근육내 주사, 심장내 주사, 골내 주사, 복강내 주사, 경점막 투여, 질 투여, 유리체내 투여, 관절내 투여, 관절 주위 투여, 국부 투여, 표피(epicutaneous) 투여, 또는 이들의 임의의 조합을 비롯하여, 당업계에 공지된 임의의 적합한 방법에 의해 투여될 수 있다. 약제학적 조성물은, 피하, 피부내, 국소, 경피, 및 경점막 투여를 포함하지만, 이들로 제한되는 것은 아닌 각종 경로를 통해서 개체에게 전달될 수 있다. 따라서, 본 개시내용은 또한 개체(예컨대, 수포성 표피박리증을 지니거나 이의 발병 위험이 있는 개체)에게 본 명세서에 기재된 폴리뉴클레오타이드 또는 약제학적 조성물 중 어느 것인가를 전달하는 방법을 포함한다.
몇몇 실시형태에 있어서, 대상체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 것을 포함하는, 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화가 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 피부내 및/또는 피하 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 국소 및/또는 경피 투여된다. 몇몇 실시형태에 있어서, 대상체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 국소 투여하는 것을 포함하는, 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화가 제공된다. 약제학적 조성물은 본 명세서에 기재된 임의의 약제학적 조성물일 수 있다. 몇몇 실시형태에 있어서, 개체는 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 우선 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 퇴행적 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 환부에 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 비환부에 투여된다.
몇몇 실시형태에 있어서, 본 명세서에 기재된 약제학적 조성물은 수포성 표피박리증의 하나 이상의 증상을 치료 또는 완화시키는데 사용될 수 있다. 수포성 표피박리증(예컨대, 퇴행적 이영양성 수포성 표피박리증, 우선 이영양성 수포성 표피박리증 등)의 증상은 피부 상의 물집(특히 손, 발, 무릎 및 팔꿈치 상의 물집), 점막 상의 물집, 피부의 반흔, 점막의 반흔, 피부 침식, 손가락 및/또는 발가락의 기형, 손가락 및/또는 발가락의 손실, 내부 물집(성대, 식도, 및 상기도 상의 것을 포함), 피부의 두꺼워짐(특히 손바닥 및 발의 발바닥 상의 피부의 두꺼워짐), 두피의 물집, 두피의 반흔, 탈모(반흔 탈모증), 야위어 보이는 피부, 아토피성 반흔, 패립종, 치아 병태(예컨대, 충치 및 불량하게 형성된 법랑질), 관절 기형, 손가락 및 발가락의 융합 및 연하곤란을 포함할 수 있다지만 이들로 제한되는 것은 아니다.
몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증을 앓고 있는 개체를 치료적으로 치료하는 방법이 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 피부내 및/또는 피하 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 국소 및/또는 경피 투여된다. 몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증을 앓고 있는 개체를 치료적으로 치료하는 방법이 제공된다. 약제학적 조성물은 본 명세서에 기재된 임의의 약제학적 조성물일 수 있다. 몇몇 실시형태에 있어서, 개체는 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 우선 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 퇴행적 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 환부에 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 비환부에 투여된다.
몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증을 앓고 있는 개체를 예방적으로 치료하는 방법이 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 피부내 및/또는 피하 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 국소 및/또는 경피 투여된다. 몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 국소 투여하는 것을 포함하는, 수포성 표피박리증을 앓고 있는 개체를 예방적으로 치료하는 방법이 제공된다. 약제학적 조성물은 본 명세서에 기재된 임의의 약제학적 조성물일 수 있다. 몇몇 실시형태에 있어서, 개체는 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는우선 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 개체는 퇴행적 이영양성 수포성 표피박리증을 앓고 있다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 환부에 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 비환부에 투여된다.
몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증의 발병의 위험이 있는 있는 개체를 예방적으로 치료하는 방법이 제공된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 피부내 및/또는 피하 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 국소 및/또는 경피 투여된다. 몇몇 실시형태에 있어서, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 유효량의 약제학적 조성물을 투여하는 단계를 포함하는, 수포성 표피박리증의 발병의 위험이 있는 있는 개체를 예방적으로 치료하는 방법이 제공된다. 약제학적 조성물은 본 명세서에 기재된 임의의 약제학적 조성물일 수 있다. 몇몇 실시형태에 있어서, 개체는 이영양성 수포성 표피박리증의 발병의 위험이 있다. 몇몇 실시형태에 있어서, 개체는 우선 이영양성 수포성 표피박리증의 발병의 위험이 있다. 몇몇 실시형태에 있어서, 개체는 퇴행적 이영양성 수포성 표피박리증의 발병의 위험이 있다. 몇몇 실시형태에 있어서, 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 환부에 투여된다. 몇몇 실시형태에 있어서, 약제학적 조성물은 개체의 하나 이상의 비환부에 투여된다.
몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 기능을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 하나 이상의 세포에 콜라겐 알파-1 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 활성도를 증강, 증가, 증대 및/또는 보충시킨다.
몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 상피 기저막 조직화를 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 표피진피경계 온전성을 증강, 증가, 증대 및/또는 보충시킨다. 몇몇 실시형태에 있어서, 유효량의 본 명세서에 기재된 약제학적 조성물의 임의의 것을 개체에게 투여하면, 개체의 상처 치유를 증강, 증가, 증대 및/또는 보충시킨다. 이론에 얽매이길 원치 않지만, 본 명세서에 기재된 약제학적 조성물의 하나 이상을 투여함으로써 개체의 하나 이상의 세포에 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 수준을 증가, 증대 및/또는 보충시키는 것에 의해서, 개체의 기능적 콜라겐 알파-1 (VII) 사슬 단백질의 생산 및 분비의 증가를 허용할 것으로 여겨진다. 이론에 얽매이길 원치 않지만, 본 명세서에 기재된 약제학적 조성물의 하나 이상을 투여함으로써 개체의 하나 이상의 세포에 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증가, 증대 및/또는 보충시키는 것에 의해서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 전사후 변형을 증가시켜서, 개체의 기능적 콜라겐 알파-1 (VII) 사슬 단백질의 생산 및/또는 분비를 증강시킬 것으로 여겨진다. 이론에 얽매이길 원치 않지만, 추가적으로, 본 명세서에 기재된 약제학적 조성물의 하나 이상을 투여함으로써(세포를 폴리펩타이드를 발현하는 2가지 별도의 폴리뉴클레오타이드와 접촉시킴으로써, 세포를 2가지 폴리펩타이드를 개별적으로 발현시키는 단일의 연속적 폴리뉴클레오타이드와 접촉시킴으로써, 또는 세포를 키메라 폴리펩타이드를 발현시키는 단일의 연속적 폴리뉴클레오타이드와 접촉시킴으로써), 개체의 하나 이상의 세포에 콜라겐 알파-1 (VII) 사슬 폴리펩타이드의 수준을 증가, 증대 및/또는 보충시키는 것에 의해서, 개체의 동일 세포에 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증가, 증대 및/또는 보충시키는 것에 의해서, 기능적 콜라겐 알파-1 (VII) 사슬 단백질의 생산 및 분비의 증강에 부가적인 효과를 지닐 것으로 여겨진다. 이론에 얽매이길 원치 않지만, 기능적 콜라겐 알파-1 (VII) 사슬 단백질의 생산 및 분비의 증가는 개선된 고정 원섬유 형성을 허용하고, 개체의 상피 기저막의 부착을 도울 것으로 여겨진다. 이론에 얽매이길 원치 않지만, 궁극적으로, 이것은 수포성 표피박리증을 앓고 있는 자에게 증가된 표피-진피 안정성을 초래하여, 기존의 상처를 치료하고, 치료된 영역에서의 상처의 재형성을 예방 또는 지연시킬 것으로 여겨진다.
단리된 폴리뉴클레오타이드 폴리펩타이드
본 개시내용의 소정의 양상은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 단리된 폴리뉴클레오타이드에 관한 것이다. 본 개시내용의 다른 양상은 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 단리된 폴리뉴클레오타이드에 관한 것이다. 본 개시내용의 다른 양상은 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 단리된 폴리뉴클레오타이드에 관한 것이다.
본 개시내용의 다른 양상은 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드에 의해 분리된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드와 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드를 포함하는 단리된 폴리뉴클레오타이드에 관한 것이다. 몇몇 실시형태에 있어서, 단리된 폴리뉴클레오타이드는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화한다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 1개 이상의 퓨린 절단 부위를 암호화하는 폴리뉴클레오타이드를 더 포함한다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 T2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 T2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 P2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 P2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 E2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 E2A 링커 폴리펩타이드의 하류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 F2A 링커 폴리펩타이드의 상류에서 암호화된다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 F2A 링커 폴리펩타이드의 하류에서 암호화된다.
콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 1이다. 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 1의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 3이다. 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 3의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 29이다. 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 29에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 5, 서열번호 7, 서열번호 9, 및 서열번호 11이다. 링커 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 5, 서열번호 7, 서열번호 9, 또는 서열번호 11의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 링커 폴리펩타이드, 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드의 예는 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25 및 서열번호 27이다. 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드는 또한 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 서열번호 25, 또는 서열번호 27의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 폴리뉴클레오타이드를 포함한다.
본 개시내용의 추가의 양상은 벡터 내에 함유된 본 명세서에 기재된 1개 이상(예컨대, 1개 이상, 2개 이상, 3개 이상 등)의 단리된 폴리뉴클레오타이드에 관한 것이다. 몇몇 실시형태에 있어서, 벡터는 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 벡터, 백시니아 바이러스 벡터, 또는 이들의 임의의 잡종 바이러스 벡터이다. 몇몇 실시형태에 있어서, 벡터는 단순 포진 바이러스 벡터이다. 몇몇 실시형태에 있어서, 벡터는 1개 이상(예컨대, 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상 등)의 전이유전자를 포함한다.
몇몇 실시형태에 있어서, 단순 포진 바이러스 벡터는 포진 바이러스 앰플리콘 벡터이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 혼성 앰플리콘이다. HSV-1 혼성 앰플리콘의 예는 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, HSV/EBV/RV 혼성 앰플리콘, 및 HSV/슬리핑 뷰티 혼성 앰플리콘을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 벡터는 HSV/AAV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/EBV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/EBV/RV 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 벡터는 HSV/슬리핑 뷰티 혼성 앰플리콘이다. 본 개시내용의 추가의 양상은 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 함유하는 바이러스 전달 비히클을 제조하는 방법에 관한 것이다. 몇몇 실시형태에 있어서, 상기 방법은 숙주 세포를 본 명세서에 기재된 하나 이상의 단리된 폴리뉴클레오타이드를 함유하는 하나 이상의 바이러스 벡터와 접촉시키는 단계 및 숙주 세포에 의해 생성된 바이러스 전달 비히클을 수집하는 단계를 포함한다. 세포를 배양하고 세포를 관심 대상인 하나 이상의 바이러스 벡터와 예컨대, 형질도입 또는 형질주입에 의해 접촉시키는 방법은 당업자에 잘 알려져 있다.
몇몇 실시형태에 있어서, 단순 포진 바이러스 벡터는 재조합 단순 포진 바이러스 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 1개 이상의 독성 단순 포진 바이러스 유전자의 발현을 감소 또는 제거하도록 조작되어 있었다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 비활성화 돌연변이를 포함한다. 비활성화 돌연변이의 예는 결실(예컨대, 유전자의 암호화 서열의 결실 또는 유전자의 전사 조절 요소의 하나 이상의 결실), 삽입, 점 돌연변이 및 재배열을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 1개 이상의 급초기 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55 단순 포진 바이러스 유전자 중 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 또는 8개 모두에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP22 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP4, ICP22, ICP27, ICP47 및 UL55 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함한다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈이다. 몇몇 실시형태에 있어서, 재조합 단순 포진 바이러스 게놈은 재조합 HSV-2 게놈이다.
몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 1, 2, 3, 4, 5, 6, 7개 또는 그 이상의 바이러스 유전자 좌위 내에 본 개시내용의 1개 이상(예컨대, 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상 등)의 폴리뉴클레오타이드(예컨대, 전이유전자)를 포함한다. 적합한 바이러스 좌위의 예는, 제한 없이, ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55 단순 포진 바이러스 유전자 좌위를 포함할 수 있다. 몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 1개 이상의 바이러스 ICP4 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다(예컨대, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위 중 한쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 다른쪽 ICP4 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스 등). 몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 바이러스 UL41 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 바이러스 ICP47 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다. 몇몇 실시형태에 있어서, 단리된 재조합 단순 포진 바이러스 게놈은 바이러스 ICP4 유전자 좌위 중 하나 이상 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를, 그리고 바이러스 UL41 유전자 좌위 내에 본 개시내용의 하나 이상의 폴리뉴클레오타이드를 포함한다(예컨대, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 Col7을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 LH3을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 LH3을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 Col7을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스, ICP4 좌위의 한쪽 또는 양쪽에 KRT17을 암호화하는 폴리뉴클레오타이드 및 UL41 좌위에 KRT17을 암호화하는 폴리뉴클레오타이드를 보유하는 재조합 바이러스 등).
몇몇 양상에 있어서, 본 명세서에 기재된 단리된 폴리뉴클레오타이드는 합성 mRNA 내에 함유된다. 몇몇 실시형태에 있어서, 합성 mRNA는 하나 이상의 변형된 리보뉴클레오타이드를 포함한다.
본 개시내용의 소정의 양상은 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함하는 단리된 폴리펩타이드에 관한 것이다. 본 개시내용의 다른 양상은 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 단리된 폴리펩타이드에 관한 것이다. 본 개시내용의 다른 양상은 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 단리된 폴리펩타이드에 관한 것이다.
본 개시내용의 다른 양상은 링커 폴리펩타이드에 의해 분리된 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 단리된 키메라 폴리펩타이드에 관한 것이다.
몇몇 실시형태에 있어서, 링커 폴리펩타이드는 1개 이상의 퓨린 절단 부위를 더 포함한다. 몇몇 실시형태에 있어서, 퓨린 절단 부위의 아미노산 서열은 정규 퓨린 절단 부위(Arg-X-(Arg/Lys)-Arg)의 서열과 동일하거나 또는 실질적으로 유사하다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 N-말단에 있다. 몇몇 실시형태에 있어서, 1개 이상의 퓨린 절단 부위는 링커 폴리펩타이드의 C-말단에 있다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, 1개 이상의 퓨린 절단 부위 및 T2A 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, T2A 링커 폴리펩타이드 및 1개 이상의 퓨린 절단 부위를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, 1개 이상의 퓨린 절단 부위 및 P2A 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, P2A 링커 폴리펩타이드 및 1개 이상의 퓨린 절단 부위를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, 1개 이상의 퓨린 절단 부위 및 E2A 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, E2A 링커 폴리펩타이드 및 1개 이상의 퓨린 절단 부위를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, 1개 이상의 퓨린 절단 부위 및 F2A 링커 폴리펩타이드를 포함한다. 몇몇 실시형태에 있어서, 링커 폴리펩타이드는, N-말단에서부터 C-말단까지, F2A 링커 폴리펩타이드 및 1개 이상의 퓨린 절단 부위를 포함한다.
몇몇 양상에 있어서, 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함하는 단리된 폴리펩타이드는 서열번호 2의 아미노산 서열을 포함한다. 단리된 폴리펩타이드는 또한 서열번호 2의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 포함하는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함한다.
몇몇 양상에 있어서, 라이실 하이드록실라제 3 폴리펩타이드를 포함하는 단리된 폴리펩타이드는 서열번호 4를 포함한다. 단리된 폴리펩타이드는 또한 서열번호 4의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 라이실 하이드록실라제 3 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함하는 단리된 폴리펩타이드는 서열번호 30을 포함한다. 단리된 폴리펩타이드는 또한 서열번호 30의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 케라틴 유형 I 세포골격 17 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 키메라 폴리펩타이드는 서열번호 2의 아미노산 서열을 포함하는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함한다. 키메라 폴리펩타이드는 또한 서열번호 2의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 키메라 폴리펩타이드는 서열번호 4의 아미노산 서열을 포함하는 라이실 하이드록실라제 3 폴리펩타이드를 포함한다. 키메라 폴리펩타이드는 또한 서열번호 4의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 라이실 하이드록실라제 3 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 키메라 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 아미노산 서열을 함유하는 링커 폴리펩타이드를 포함한다. 키메라 폴리펩타이드는 또한 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열을 함유하는 링커 폴리펩타이드를 포함할 수 있다.
몇몇 양상에 있어서, 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 아미노산 서열이다. 키메라 폴리펩타이드는 또한 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 아미노산 서열일 수 있다.
숙주 세포
본 개시내용의 소정의 양상은 본 명세서에 기재된 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 1개 이상의 숙주 세포에 관한 것이다. 몇몇 실시형태에 있어서, 벡터는 본 명세서에 기재된 단리된 재조합 단순 포진 바이러스 벡터 중 임의의 것이다. 몇몇 실시형태에 있어서, 숙주 세포는 박테리아 세포(예컨대, 이.콜라이(E. coli) 세포 등)이다. 몇몇 실시형태에 있어서, 숙주 세포는 진균 세포(예컨대, 에스. 세레비시애(S. cerevisiae) 세포 등)이다. 몇몇 실시형태에 있어서, 숙주 세포는 곤충 세포(예컨대, S2 세포 등)이다. 몇몇 실시형태에 있어서, 숙주 세포는 포유류 세포이다. 몇몇 실시형태에 있어서, 숙주 세포는 세포주로부터의 세포이다. 적합한 숙주 세포 또는 세포주의 예는, 293, HeLa, SH-Sy5y, Hep G2, CACO-2, A549, L929, 3T3, K562, CHO-K1, MDCK, HUVEC, Vero, N20, COS-7, PSN1, VCaP, CHO 세포 등을 포함할 수 있지만 이들로 제한되는 것은 아니다. 몇몇 실시형태에 있어서, 벡터는 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 단순 포진 바이러스 벡터, 백시니아 바이러스 벡터, 또는 이들의 임의의 잡종 바이러스 벡터이다. 몇몇 실시형태에 있어서, 벡터는 단순 포진 바이러스 벡터이다. 몇몇 실시형태에 있어서, 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘이다. 몇몇 실시형태에 있어서, 숙주 세포는 헬퍼 바이러스를 포함한다. 몇몇 실시형태에 있어서, 헬퍼 바이러스를 포함하는 숙주 세포는 본 명세서에 기재된 벡터와 접촉된다. 몇몇 실시형태에 있어서, 헬퍼 바이러스를 포함하는 숙수 세포를 본 명세서에 기재된 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘과 접촉시킴으로써 본 명세서에 기재된 1개 이상의 벡터를 포함하는 바이러스의 생산을 초래한다. 몇몇 실시형태에 있어서, 바이러스는 접촉된 숙주 세포의 상청액으로부터 수집된다. 헬퍼 바이러스를 포함하는 숙수 세포를 HSV-1 앰플리콘 또는 HSV-1/혼성 앰플리콘과 접촉시킴으로써 바이러스를 생성하는 방법은 당업계에 공지되어 있다. 몇몇 실시형태에 있어서, 숙주 세포는 상보성 숙주 세포이다. 몇몇 실시형태에 있어서, 상보성 숙주 세포는 본 명세서에 기재된 바이러스 벡터 중 임의의 것에서 비활성화된 1개 이상의 유전자를 발현시킨다. 몇몇 실시형태에 있어서, 상보성 숙주 세포는 본 명세서에 기재된 재조합 단순 포진 바이러스 게놈과 접촉된다. 몇몇 실시형태에 있어서, 상보성 숙주 세포를 본 명세서에 기재된 재조합 단순 포진 바이러스 게놈과 접촉시킴으로써 본 명세서에 기재된 1개 이상의 벡터를 포함하는 바이러스의 생산을 초래한다. 몇몇 실시형태에 있어서, 바이러스는 접촉된 숙주 세포의 상청액으로부터 수집된다. 재조합 단순 포진 바이러스와 접촉시킴으로써 바이러스를 생성하는 방법은 일반적으로 WO2015/009952에 기재되어 있다.
제조 물품 또는 키트
본 개시내용의 소정의 양상은 본 명세서에 기재된 약제학적 조성물을 포함하는 제조 물품 또는 키트에 관한 것이다. 몇몇 실시형태에 있어서, 제조 물품 또는 키트는 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하도록 약제학적 조성물을 투여하기 위한 설명서를 포함하는 패키지 삽입물(package insert)을 포함한다.
몇몇 실시형태에 있어서, 본 명세서에 기재된 하나 이상의 폴리뉴클레오타이드를 포함하는 전달 비히클 및 약제학적으로 허용 가능한 담체는 동일한 용기 또는 별도의 용기에 있다. 적합한 용기는, 예를 들어, 병, 바이알, 백 및 시린지를 포함한다. 용기는 유기, 플라스틱(예컨대, 폴리염화비닐 또는 폴리올레핀) 또는 금속 합금(예컨대, 스테인리스강 또는 하스텔로이)과 같은 각종 재료로 형성될 수 있다. 몇몇 실시형태에 있어서, 용기는 용기 상에 또는 용기와 연관된 라벨을 포함하되, 여기서 라벨은 사용법을 나타낸다. 제조 물품 또는 키트는 기타 완충제, 희석제, 필터 등을 비롯하여 상업적 사용자 관점으로부터 바람직한 기타 재료를 더 포함할 수 있다.
본 명세서는 당업자가 본 발명을 실시할 수 있도록 충분한 것으로 여겨진다. 본 명세서에 도시되고 기재된 것 이외에 본 발명의 각종 변형이 전술한 설명으로부터 당업자에게 명백하게 될 것이고 첨부된 청구범위의 범주 내에 들어갈 것이다.
실시예
본 개시내용은 이하의 실시예를 참조하여 더욱 완전히 이해될 것이다. 그러나, 이것은 본 개시내용의 범위를 제한하는 것으로 해석되어서는 안 된다. 본 명세서에 기재된 실시예 및 실시형태는 단지 예시적인 목적을 위한 것이고 이를 감안하여 각종 변형 또는 변화가 당업자에게 제시될 것이며 본 출원의 정신과 권한 그리고 첨부된 청구범위의 범주 내에 포함되는 것으로 이해된다.
실시예 1: 변형된 단순 포진 바이러스 벡터의 생성, 및 벡터를 함유하는 바이러스를 생산/단리
표적 포유류 세포에서 하나 이상의 전이유전자를 발현시킬 수 있는 변형된 단순 포진 바이러스 게놈 벡터를 생성하기 위해, 단순 포진 바이러스 게놈(도 1a)을 급초기 유전자 ICP0, ICP4 및 ICP27을 비활성화시키도록 변형시킨 한편, 급초기 유전자 ICP22는 이종성, 유도 촉진자를 유도하도록 변형된다. 이는 포유류 세포에서 게놈의 독성을 감소시킨다. 다음에, 카세트는 제한 클로닝에 의해 변형된 포진 바이러스 게놈 내로 삽입된다. 상기 카세트는 표적 포유류 세포에서 전이유전자를 발현시킬 수 있는 이종 촉진자를 함유한다. 촉진자는 콜라겐 알파-1(VII) 사슬 폴리펩타이드를 암호화하는 핵산 서열뿐만 아니라 mRNA의 적절한 생성을 보장하는 하류의 조절 요소(도 1b)에 작동 가능하게 연결된다. 대안적으로, 카세트는 2개의 전이유전자를 포함하는데, 이들 각각은 콜라겐 알파-1(VII) 사슬 폴리펩타이드 또는 라이실 하이드록실라제 3 폴리펩타이드 중 하나를 암호화하는 핵산에 작동 가능하게 연결되는 그 자신의 이종 촉진자를 가진다. 전이유전자는 DNA의 동일한 가닥 중 하나 상에서(도 1c), 또는 안티센스 배향으로 DNA의 반대편 가닥 상에서(도 1d) 암호화된다. 그 자신의 촉진자 및 조절 요소를 갖는 각각의 전이유전자를 연결하는 것은 별개의 mRNA 전사물 상에서 각각의 암호화 서열의 독립적 발현을 허용한다. 별개의 촉진자로부터의 전이유전자를 발현시키는 것은 상이한 촉진자 유형에 암호화 서열을 작동 가능하게 연결시키는 능력을 허용하는데, 이는 상이한 수준에서 세포 주기 내 상이한 시간에, 상이한 세포 유형에서, 또는 상이한 유도자 또는 억제자의 제어 하에서 전이유전자의 발현을 유도할 수 있다.
내부 리보솜 유입 부위에 의해 분리된 단일 mRNA 암호화 콜라겐 알파-1(VII) 사슬 폴리펩타이드 및 라이실 하이드록실라제 3 폴리펩타이드를 발현하는 카세트를 포함하는 변형된 포진 바이러스 게놈이 또한 작제된다(도 1e). 이것은 표적 세포에서 발현될 때 각각의 폴리펩타이드의 대략 등몰의 생성을 허용한다. 최종적으로, 키메라 폴리펩타이드를 발현시키는 카세트를 포함하는 변형된 포진 바이러스 게놈이 작제된다. 이 키메라 폴리펩타이드는 N-말단에서부터 C-말단까지, 콜라겐 알파-1(VII) 사슬 폴리펩타이드, 절단 가능한 펩타이드 링커 및 라이실 하이드록실라제 3 폴리펩타이드를 포함한다(도 1f).
각각 콜라겐 알파-1(VII) 사슬 폴리펩타이드를 발현시키는 2개의 카세트를 포함하는 추가적인 변형된 포진 바이러스 게놈이 작제되며, 여기서 각각의 카세트는 야생형 단순 포진 바이러스 게놈(도 2a)의 ICP4 유전자 좌위(도 2b 내지 도 2g)의 복제물 내로 삽입된다. 이들 추가적인 재조합 포진 바이러스 게놈은 포진 바이러스 유전자 결실/변형의 다양한 조합에 의해 작제된다.
ICP4 유전자의 두 복제의 암호화 서열의 결실뿐만 아니라, ICP27 및 UL55 유전자의 암호화 서열의 결실을 함유하는 재조합 포진 바이러스 게놈이 작제된다. 이들 재조합 바이러스는 ICP22 및 ICP47 유전자가 정상 역학(normal kinetics)으로 발현되지 않게끔 ICP22 및 ICP47 유전자의 촉진자 영역에 비활성화 돌연변이를 함유하도록 더욱 변형된다(도 2b).
포진 ICP4 유전자의 두 좌위 내로 콜라겐 알파-1(VII) 사슬 폴리펩타이드용의 발현 카세트를 편입하는 추가의 재조합 단순 포진 바이러스가 작제된다. 이들 재조합 바이러스는, ICP22 유전자 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2c); ICP0 유전자 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2d); ICP0 및 ICP22 유전자, 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2e); ICP0, ICP22 및 ICP27 유전자, 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2f); 및 ICP0, ICP22, ICP27, 및 UL55 유전자, 및 ICP4 유전자의 두 복제의 암호화 서열의 결실(도 2g)을 함유하는 바이러스를 포함한다. 추가의 벡터는 도 2c 내지 도 2g에 도시된 벡터에 기반하여 작제되고, 이는 ICP0 및/또는 UL41 좌위에 하나 이상의 추가의 효과기(예컨대, LH3, KRT17)를 암호화하는 하나 이상의 전이유전자를 더 포함한다.
이들 변형된 단순 포진 바이러스 게놈 벡터는 포진 바이러스 유전자를 발현시키도록 변형된 조작된 Vero 세포에 감염시킨다. 이들 조작된 Vero 세포는 상청액 내에서 패키징된 변형된 게놈을 가진 복제-결함성 단순 포진 바이러스를 분비한다. 이어서, 상청액을 수집하여, 농축시키고, 5㎛ 필터를 통해서 멸균 여과시킨다.
실시예 2: 복제 결핍성 HSV-1을 이용한 Col7 발현의 구제(rescuing)
이하의 실시예는 인간 COL7A1 유전자를 발현시키도록 변형된 복제 결핍성 제1형 단순 포진 바이러스의 작제, 및 RDEB 환자로부터 단리된 세포에서 관찰된 몇 가지 결함을 구제하기 위하여 이러한 바이러스 벡터의 사용을 기술한다.
방법
세포 및 세포 배양액
정상 및 RDEB 인간 피부 섬유모세포 및 각질세포를 앞서 기재된 바와 같이 단리시켰다(NG, Y. Z. et al. (2012) Cancer Res. 72: 3522-3534; Rheinwald, J. G. and Green, H. (1975) Cell 6: 331-42). 세포는 표준 수법에 따라서 배양시켰다.
KB103의 작제
KB103 벡터를 바이러스 ICP4 대신에 GFP를 보유하는 복제-결함성 HSV-1 벡터인 D3GFP로부터 생성하였다. ICP4 재조합 플라스미드 pSASB3의 EcoRI 부위 내로 COL7A1을 클로닝시킴으로써 D3GFP에서 GFP의 서열을 전달 플라스미드를 이용하여 인간 COL7A1의 암호화 서열로 대체하였다. COL7A1 함유 전달 플라스미드 및 D3GFP 벡터의 혼합된 형질감염/감염을 VeroD 세포 상에서 수행하였다. GFP를 발현시키지 않은 얻어진 플라크를 단리시키고, Col7 단백질 발현에 대한 웨스턴 블롯에 의해 시험하였다.
바이러스 정제
표준 기법에 따라 KB103 바이러스를 정제하였다(문헌[Diefenbach, R. and Fraefel, C. Herpes Simplex Virus. New York: Humana Press, 2014] 참조).
바이러스 감염
바이러스 감염 1일 전에 대략 50% 합류에서 6-웰 플레이트에서 2회 또는 3회 중복하여 세포를 파종시켰다. 세포 계수화 및 MOI 결정을 위해 추가적인 웰을 동시에 파종시켰다. 세포 파종 후 24시간에, 하나의 웰로부터의 세포를 트립신처리하고 계수화하여 MOI를 계산하고, 그리고 바이러스 저장액을 해동시키고 나서, 세포 배양 배지에서 희석시켜 목적으로 하는 MOI를 달성하였다. 감염될 각각의 웰로부터 배양 배지를 흡입하고 나서, 500㎕의 KB103-함유 배지(또는 대조군 배지)를 각각의 웰에 첨가하였다. 플레이트를 37℃에서 5 내지 7.5% CO2와 함께 1.5 내지 2시간 동안 15 내지 20분마다 간헐적으로 로킹(rocking)하면서 항온처리시키고, 이어서, 1.5 내지 2 mL의 완전 세포 배양 배지를 각각의 웰에 첨가하고 나서, 플레이트를 24 내지 72시간 동안 37℃에서 항온처리시켰다. 항온처리 후에, 세포 및 상청액을 채취하고 나서, 분석을 위해 처리하였다.
mRNA 정량화
제조업자의 프로토콜에 따라 SYBR PCR 분석(사이버 셀렉트 마스터 믹스(Sybr Select Master Mix), 라이프 테크놀로지즈(Life Technologies))을 이용하는 감염 후에 1차 RDEB 각질세포로부터 단리시킨 RNA로부터 Col7 전사물을 증폭시켰다. Col7 전사 수준을 β-액틴 전사 수준으로 정규화시켰다.
웨스턴 블롯 분석
감염 후 48시간에 세포로부터 세포 채취물을 생성하고 나서, 다음의 항체를 이용하여 표준 기법에 따라 웨스턴 블롯을 수행하였다: 토끼 항-인간 Col7 다클론성 항체(시그마(Sigma), 카탈로그 번호 HPA042420), 마우스 항-인간 GAPDH 항체(산타 크루즈 바이오테크놀로지(Santa Cruz Biotechnology), 카탈로그 번호 sc-365062), 토끼 항-LH3 항체(프로테인 테크(Protein Tech), 카탈로그 번호 11027-1-AP), 및 마우스 항-TSP1 항체(산타 크루즈 바이오테크놀로지, 카탈로그 번호 sc-59887).
면역형광법
감염 전에 세포를 커버 슬립 상에서 플레이팅하고 나서, 감염 48시간 후에 고정시키고, 1차 토끼 항-인간 Col7 다클론성 항체(시그마(Sigma), 카탈로그 번호 HPA042420)로 염색하고 나서, 세척 후, 형광 표지된 항-토끼 2차 항체(인비트로젠(Invitrogen), 카탈로그 3 A11012)를 이용하여 추가로 염색하였다. 표준 기법을 이용하여 DAPI에 의해 세포핵을 염색하였다.
세포 접착
96-웰 플레이트를 100㎕ 반응 용적에서 4℃에서 밤새 10, 20, 또는 50 ㎍/㎖ 래트 꼬리 콜라겐 1(마라톤 래버러토리 서플라이(Marathon Laboratory Supply)) 또는 인간 파이브로넥틴(Sigma-Aldrich)으로 코팅하고, 이어서, PBS로 세척하고 나서, PBS + 0.1% BSA 1시간 동안 37℃에서 차단시켰다. 모의(대조군) 감염 또는 KB103 감염 RDEB 각질세포(100㎕의 DMEM/HamF12 + 0.1% BSA 중의 2.4*104개의 세포)를 플레이트에 첨가하였고, 37℃에서 40 내지 90분 동안 항온처리시켰다. 웰을 PBS로 3회 세척하여 임의의 비결합 세포를 제거하고, 접착 세포를 20분 동안 PFE를 이용하여 고정시켰다. 이어서, 고정 세포를 70% 에탄올로 처리하고 나서, 크리스탈 바이올렛으로 염색하고, 100% 에탄올 중에 용해시키고, 630㎚에서 흡광도를 측정함으로써 정량화하였다.
피부 등가(Skin equivalent: SE) 기관형 배양물
RDEB 섬유모세포 및 각질세포로 구성된 피부 등가 기관형 배양물을 사용하여 기저막 구역(BMZ)에서의 Col7의 발현을 평가하였다. 간략하게, RDEB 섬유모세포(2*105개의 세포/웰)를 6-웰 플레이트에서 피브린 겔 매트릭스에 포매시키고, DMEM + 아스코르브산 및 아프로티닌을 함유하는 10% 혈청 중에서 24시간 동안 37℃ 및 5% CO2에서 항온처리시켰다. 이어서, RDEB 각질세포(1*106개의 세포/웰)를 기질 상에 파종시키고, 50 mg/㎖의 아스코르브산을 함유하는 DMEM/F-12 각질세포 배지에서 합류까지 성장시키고 나서, 공기-액체 계면에서 상승시켰다. 상승 2일 후에, KB103 바이러스를 (MOI 3에서) 배양물에 첨가하고 나서, 1.5시간 동안 항온처리시켰다. 항온처리 후에, 배양물을 세척하고 나서, 상피로의 계층화 및 분화에 바람직하도록 5 내지 14일 동안 항온처리시켰다. 피부 등가(SE)을 플레이트로부터 수동으로 탈착하고 나서, 최적의 절단 온도 화합물에서 포매하고, 액체 질소에서 냉동시키고 나서, 단클론성 항-Col7 항체를 이용하여 면역형광법을 위해 6㎜ 절편으로 절단하였다.
결과
정상 및 RDEB 세포에서 KB103 약리학
Col7 결손을 수정하기 위한 시도에서 RDEB 환자로부터 단리된 1차 세포에 인간 COL7A1 유전자를 전달하기 위한 다수의 생체외 접근에 착수하였다(Ortiz-Urda, S. et al. (2003) J. Clin. Invest. 111(2) 251-5; Woodley, D.T. et al. (2003) J. Invest. Dematol. 121(5) 1021-8). 중요한 질환 특징의 지속 가능한 수정을 달성하는 데 성공적이지만, 수포성 표피박리증을 치료하기 위한 생체내 유전자 전달 전략은 고비용, 불량한 이식, 수술적인 괴사 조직 제거, 복잡한 붕대 및 상처치료, 및 수술 후 감염에 대한 높은 가능성을 포함하는 다수의 중요한 단점을 가진다. 유전자 요법을 위한 매력적인 대안의 경로는 유전자 산물을 전달하기 위한 바이러스 또는 비-바이러스 벡터의 사용이다. 그러나, 플라스미드 DNA를 이용하는 비-바이러스 벡터는 주사될 때 또는 국소로 투여될 때 매우 낮은 유전자 전달 효율을 겪는 한편, 인간 유전자 요법 시험(레트로바이러스 벡터)에서 대부분의 널리 사용되는 바이러스 벡터는 비분할 세포를 감염시키지 않는다. 이는 분할 세포의 적절한 집단을 생성하기 위한 조직의 조작(예컨대 상처 치유)이 레트로바이러스 유전자 요법에 필요하기 때문에 피부에 대한 유전자 전달에 문제가 된다. 대용량 아데노바이러스 벡터는 게놈-크기 전사 단위를 전달할 수 있고, 장기간의 시간 동안 형질도입 세포에서 생존하지만, 아데노바이러스 입자의 독성 및 면역원성뿐만 아니라 벡터 생성 동안의 헬퍼 바이러스에 대한 필요는 인간 유전자 요법 전략에서 그들의 사용을 위한 상당한 장애물로서 남아있다. 복제-결함성 HSV 벡터는 다수의 전임상 연구에서 전달 비히클로서 사용되었지만, 수포성 표피박리증 또는 다른 피부 적용을 위한 HSV-기반 바이러스 벡터의 용도를 뒷받침하는 전임상 증거는 보고되지 않았다.
이를 위하여, 인간 COL7A1 유전자를 암호화하는 복제 결핍성 제1형 단순 포진 바이러스(HSV-1)를 DEB 환자의 유전자 요법에 유용한 신규한 벡터로서 개발하였다. 바이러스 ICP4, ICP27 및 UL55 유전자의 완전한 결실을 보유하도록 HSV-1 바이러스를 변형시켰고, ICP4 결실은 급초기 바이러스 유전자 ICP22 및 ICP47의 전사를 유도하는 상류의 촉진자 서열의 제거를 초래한다. 결실된 ICP4 좌위의 두 복제 내에서 암호화된 인간 거대세포바이러스(HCMV) 급초기 촉진자-유래 인간 COL7A1 발현 카세트를 포함하기 위해 바이러스를 추가로 변형시켜, 표적 세포에 인간 COL7A1를 전달하기에 적합한 KB103으로 칭하는 복제-결함성 HSV-1 벡터를 생성하였다(도 3).
인간 세포에서 Col7을 전달하고 발현시키기 위한 KB103의 능력을 시험하기 위해, 그리고 RDEB 환자에서 Col7 결손을 구제하기 위해, 환자-유래 인간 피부 섬유모세포 및 각질세포를 건강한 개체뿐만 아니라 RDEB를 앓는 개체로부터 단리시키고, 이들 1차 세포를 다양한 MOI에서 KB103으로 감염시켰다. 감염 후 24 내지 72시간에, 형질도입 세포에서 실시간 PCR에 의해 COL7A1 유전자 발현을 측정한 한편, Col7 단백질 발현을 웨스턴 블롯과 면역형광법 분석을 둘 다 병행하여 분석하였다.
COL7A1 유전자 발현에서 용량-의존적 증가를 KB103으로 감염시킨 RDEB 각질세포(도 4A) 및 섬유모세포(도 4B)로 관찰하였다. KB103 감염은 각각 0.3, 1 및 3의 MOI로 감염시킨 RDEB 각질세포에서 대략 7.5배, 12.5배, 및 25배만큼 COL7A1 유전자 발현을 증가시켰다(도 4A). 놀랍게도, 감염된 RDEB 섬유모세포에서 COL7A1 유전자 발현에서 훨씬 더 극적인 변화가 관찰되었다. MOI 0.1 및 0.3에서의 감염은 COL7A1 유전자 발현의 보통의 증가를 나타내었지만, MOI 1으로 감염된 RDEB 섬유모세포에 대해 COL7A1 유전자 발현의 대략 30배 증가가 측정된 반면, MOI 3으로 감염된 이런 세포 유형에서 60배 증가가 관찰되었다. 이 데이터는 COL7A1 유전자 발현이 KB103에 의한 감염 후 RDEB 1차 세포에서 대량으로 상향조절되었다는 것을 나타내었다.
결과적으로, KB103으로 감염된 세포에서 강한 Col7 단백질 발현이 또한 관찰되었다. 0.3, 1 및 3의 MOI에서 KB103로 감염 48시간 후에 정상 및 RDEB 각질세포(도 5A)와 섬유모세포(도 5B) 둘 다에서 Col7 단백질 발현이 검출되었고, 더 높은 바이러스 역가에서 관찰된 Col7 단백질 발현에서 명백한 용량-의존적 증가가 있었다. 감염된 세포로부터의 상청액과 세포 용해물 둘 다에서 Col7의 발현이 관찰되었다. 놀랍게도, MOI 0.3에서 감염된 RDEB 섬유모세포는 더 고수준의 Col7이 비감염 정상 섬유모세포에서 관찰되었다는 것을 나타내는데(도 5B), 이는 낮은 바이러스 역가에서조차 KB103을 이용하는 RDEB 섬유모세포에서 Col7 발현의 완전한 구제를 시사한다. 높은 바이러스 용량(MOI 3)을 이용하는 세포 형태에 대한 분명한 효과는 관찰되지 않았다. 추가적으로, GAPDH 발현에 의해 결정하여 고용량의 KB103을 이용하는 섬유모세포 또는 각질세포 세포 증식에 대한 부정적 영향은 이들 실험에서 나타나지 않았다.
상기 실험과 일치되게, Col7 단백질 발현의 면역형광 검출에 의해 입증되는 바와 같은 KB103으로 감염된 정상 및 RDEB 세포에서 Col7 단백질 발현에서 강한 그리고 용량 의존적 증가가 확인되었다(도 6). 예상된 바와 같이, 비감염 RDEB 인간 피부 섬유모세포 또는 각질세포에서 Col7 단백질은 검출되지 않았고; 제한된 Col7 단백질은 비감염 정상 각질세포 및 섬유모세포에서 검출되었다. 그러나, KB103에 의한 감염은 비감염 정상 세포에서 관찰된 수준 이상에서 RDEB 섬유모세포 및 각질세포 내 Col7 단백질 발현을 구제할 수 있었다. 더 나아가, (MOI 3에서) KB103의 감염 효율은 각각의 감염 복제물에 대한 3개 이상의 독립적 패널의 평가에 기반하여 95% 이상이 되는 것으로 계산되었는데, 이는 KB103이 COL7A1 발현 카세트를 효율적으로 전달하고 발현시킨다는 것을 나타낸다. 종합하면, 이 데이터는 KB103이 정상 및 RDEB 1차 세포에서 COL7A1을 전달하고 발현시킬 수 있다는 것과, KB103이 인간 피부 섬유모세포와 각질세포 둘 다에 의해 잘 용인되었다는 것을 시사한다.
RDEB 세포에서 KB103의 기능성 평가
KB103으로부터 발현된 인간 Col7 단백질의 기능성을 다음에 인간 피부 섬유모세포 및 각질세포에서 연구하였다. 처음에, 라이실 하이드록실라제 3의 수준에 대한 Col7 발현 효과를 KB103-감염된 세포에서 시험하였다. 세포외 기질의 침착 및 조직화에 LH3이 필요하며, LH3 수준이 RDEB 피부에서 감소된다는 것이 보고되었다(Watt, S. A. et al. (2015) PLoS One 10(9): p. e0137639). 이전의 연구와 일치되게 정상 각질세포에 비해 비감염 RDEB 각질세포에서 LH3은 거의 또는 전혀 관찰되지 않았다(도 7, 레인 1 대 5). 그러나, 예상치 못하게, Col7 단백질 발현에 부수적으로 LH3 수준에서의 용량-의존적 증가가 KB103으로 감염된 RDEB 각질세포에서 관찰되었는데(도 7), 이는 KB103이 Col7 단백질 발현뿐만 아니라 RDEB 세포에서의 LH3 발현을 구제할 수 있다는 것을 시사한다.
다음에, TSP-1 수준에 대한 Col7 발현 효과를 시험하였다. TSP-1은 혈관신생의 음성 조절제이며, RDEB 섬유모세포에서 증가될 것으로 보고되었다(Ng, Y. Z. et al. (2012) Cancer Res. 72(14): p. 3522-34). 이전의 연구와 일치되게, 비감염 RDEB 대 정상 인간 피부 섬유모세포에서 더 고수준의 TSP-1이 관찰되었다(도 8, 레인 1 및 4). 놀랍게도, KB103으로 감염된 정상 또는 RDEB 섬유모세포 중 하나의 감염 시 TSP-1 단백질 발현은 강하게 저해되었다(도 8). 이 데이터는 KB103이 감염된 세포에서 Col7 및 LH3 수준을 증가시킬 뿐만 아니라, 음성 조절자 TSP-1을 저해함으로써 혈관신생을 촉진시킬 수 있다는 것을 시사하였다.
최종적으로, 콜라겐 1 또는 파이브로넥틴 중 하나에 대한 RDEB 각질세포의 세포 접작을 증가시키는 KB103의 능력을 시험하였다. 다양한 MOI에서 KB103으로 감염된 RDEB 각질세포에서 콜라겐 1과 파이브로넥틴 둘 다에 대한 세포 접착에서의 용량-의존적 증가가 관찰되었다(도 9A 및 도 9B). 모든 MOI에서 RDEB 각질세포의 감염은 비감염(대조군) 세포에 대한 물질 둘 다의 모든 농도에 의해 처리된 웰에 대해 더 큰 접착을 나타내었다. 종합하면, 이 데이터는 KB103으로부터 발현된 인간 Col7 단백질이 형질도입 세포에서 기능성이었다는 것을 나타내었다. 이 단백질의 기능성은 LH3 단백질 수준을 증가시키고, TSP-1 단백질 수준을 감소시키며, 그리고 모의-감염 샘플에 비해 콜라겐 1과 파이브로넥틴 둘 다에 대한 세포 접착을 개선시키는 그의 능력에 의해 나타났다.
RDEB 기관형 배양물에서의 KB103 약리학 및 독성
RDEB 섬유모세포 및 각질세포로 구성된 피부 등가(SE) 기관형 배양물을 사용하여 기저막 구역(BMZ)에서 KB103으로부터 발현된 Col7 단백질의 발현을 평가하였다. RDEB 섬유모세포 및 각질세포를 모의 감염시키거나 또는 MOI 3으로 KB103에 의해 감염시키고, 상피로의 계층화 및 분화에 바람직하도록 5일 동안 항온처리시켰다. 피부 등가(SE)을 단리시키고, 절편화하고 나서, Col7 단백질 발현을 검출하기 위한 면역형광법을 위해 염색하였다. KB103으로 감염시킨 세포로부터의 이들 기관 배양물에서 Col7 발현을 검출하였고, BMZ에서 Col7 단백질 침착의 개시를 모의-감염 대조군에 대해 관찰하였다(도 10). 이 데이터는 KB103가 COL7A1을 전달하고 Col7 단백질을 효율적으로 발현시킬 뿐만 아니라, Col7 단백질이 생체내 Col7 단백질에 대해 예상되는 조직화 패턴과 유사하게 기관형 배양물에서 조직화하기 시작한다는 것을 시사한다.
전부 종합하면, 이들 실험은 처음 시기 동안 복제-결함성 HSV-1 벡터가 수포성 표피박리증 환자로부터 단리된 1차 세포 내로 COL7A1발현 카세트를 전달하기 위한 비히클로서 사용될 수 있다는 것을 나타내었다. 게다가, 이들 데이터는 건강한 개체뿐만 아니라 피부 장애를 앓는 개체로부터의 2종의 상이한 인간 세포에서 이 발현 카세트로부터 Col7 단백질이 고수준으로 발현될 수 있었다는 것을 나타내었다. 최종적으로, Col7 단백질은 기능성이되는 것으로 나타났는데, LH3의 발현을 증가시키고, TSP-1의 발현을 감소시키며, 콜라겐 1 및 파이브로넥틴에 대한 세포 접착을 증가시킬 수 있기 때문이며, 생체내 Col7의 조직과 유사한 패턴으로 기관형 배양물에서 조직화할 수 있다. 이론에 얽매이길 원치 않지만, 본 명세서에 제시된 데이터는 KB103 및 다른 HSV-1 벡터가 수포성 표피박리증 및/또는 다른 피부과적 적용을 위한 신규한 생체내 치료 전략으로서 유용할 수 있다는 것을 시사한다.
실시예 3: 복제 결핍성 HSV-1을 사용한 생체내 Col7 발현
이하의 실시예는 생체내 인간 Col7 단백질의 발현을 위한 전달 비히클로서 복제 결핍성 제1형 단순 포진 바이러스(인간 COL7A1 전이유전자를 함유하도록 변형됨)의 용도를 기재한다.
방법
KB103의 작제 및 정제
KB103 바이러스를 작제하고 상기 실시예 2에 기재한 바와 같이 정제하였다.
바이러스 감염
KB103 바이러스를 다음과 같이 피부내 주사에 의해 야생형 Balb/c 또는 skh1-엘리트 마우스에게 전달하였다: 각각의 동물에 50㎕ 용적으로 바이러스/부위의 1x108개의 플라크 형성 단위(plaque forming unit: PFU)로 동물의 옆구리 영역 내의 2 내지 4개 부위에 1회 주사하였다. KB103 투여 48시간 후에 동물을 희생시키고, 주사 부위를 채취하고 나서, 실시간 qPCR 또는 면역형광법 분석 중 하나를 위해 처리하였다.
qPCR 분석을 위해, 6㎜ 펀치 생검 도구를 이용하여 근막까지 피부 조직을 해부하였다. 생검을 2개 조각으로 2등분하고, 각각의 조각을 액체 질소를 이용하여 순간 냉동시켰다. 퀴아젠 올프렙(Qiagen AllPrep) DNA/RNA 키트를 이용하여 생검의 하나의 절반으로부터 총 RNA 및 DNA를 단리시켰다.
면역형광법 분석을 위해, 직경이 대략 1 cm인 원형 면적을 주사 부위에서 피부로부터 절개하였고, 절반으로 절단한 다음, 원형 면적의 중심 부분이 위쪽으로 향하도록 OCT에 장착하였다. 준비한 샘플을 액체 질소 냉각된 아이소펜탄으로 급속 냉동시키고, -80℃에서 저장하였다.
mRNA 정량화
2-단계 프로토콜을 이용하여 KB103 주사 후에 마우스 진피 조직으로부터 단리시킨 RNA로부터 Col7 전사물을 증폭시켰다: 1) 슈퍼스크립트 III(superscript III) 제1 가닥 합성 키트(써모피셔(Thermofisher), 카탈로그 번호 18-080-051)를 이용하여 cDNA 합성을 수행하였고, 그리고 2) 제조업자의 프로토콜에 따라 퀀티텍트 프로브(Quantitect Probe) PCR 키트(퀴아젠, 카탈로그 번호 204345)를 이용하여 qPCR 증폭을 수행하였다. 100ng의 cDNA를 각각의 반응에서 사용하였다. Col7 전사 수준을 GAPDH 전사 수준으로 정규화하였다.
게놈 복제 정량화
퀀티텍트 프로브 PCR 키트(퀴아젠 카탈로그 번호 204345)를 이용하여 qPCR 증폭에 의해 KB103 감염된 마우스에서 KB103 바이러스 게놈의 복제 수를 정량화하였다. 100ng의 마우스 게놈 DNA를 각각의 반응에서 사용하였고, 마우스 게놈 GAPDH를 대조군으로서 사용하였다.
면역형광법
KB103으로 주사한 마우스로부터의 조직 절편을 고정시키고, 후속적으로 1차 토끼 항-인간 Col7 다클론성 항체(시그마, 카탈로그 번호 HPA042420)로 염색하고, 세척 후, 추가로 형광 표지된 항-토끼 2차 항체(인비트로젠, 카탈로그 3 A11012)로 염색하였다. 표준 기법을 이용하는 DAPI에 의해 세포핵을 염색하였다.
결과
생체내 인간 Col7 단백질을 성공적으로 전달하고 발현시키는 KB103의 능력을 시험하기 위해, 마우스에 KB103 바이러스를 피부내로 투여하였다. 감염 마우스 조직에서의 바이러스 게놈 복제수를 평가하였고, KB103 바이러스 게놈의 고수준의 전달(>1,000,000 바이러스 게놈 복제수/100ng 마우스 DNA)을 마우스에서 관찰하였다(도 11). 다음에, 생체내 인간 Col7을 발현시키는 바이러스의 능력을 시험하였다. KB103-감염된 마우스에서 인간 Col7 전사물의 정량화를 측정하고 나서, 대조군 마우스 하우스키핑 유전자의 발현에 비교하여 평가하였다. 감염 마우스 조직에서 고수준의 인간 Col7 전사를 관찰하였는데(도 11), 이는 전달된 바이러스 게놈이 그들의 인간 유전자 화물(cargo)을 성공적으로 발현시킬 수 있다는 것을 시사한다. 최종적으로, Col7 단백질을 발현시키는 KB103의 능력을 감염된 마우스에서 시험하였다. 감염 후 마우스로부터 마우스 진피 조직을 절개하였고, 마우스 조직의 면역조직화학적 염색에 의해 Col7 단백질 발현을 평가하였다. 조직 염색 후에 고수준의 인간 Col7 단백질을 검출하였다(도 12). 놀랍게도, 마우스 진피에서 KB103 바이러스로부터 인간 Col7 단백질이 발현되었을 뿐만 아니라, KB103-감염된 마우스에서의 기저막 구역에서 인간 Col7의 침착 개시가 관찰되었다(도 12). 이론에 얽매이길 원치 않지만, 이 데이터는: 1) KB103 바이러스가 생체내 적절한 조직을 성공적으로 감염시켜 이들 조직에 높은 게놈 복제 수를 전달할 수 있고, 2) 적절한 조직에 대한 KB103 바이러스의 전달이 이 바이러스 상에서 암호화된 인간 유전자의 상당한 발현을 초래하며, 그리고 3) KB103이 생체내 인간 Col7 단백질을 성공적으로 발현시킬 뿐만 아니라, 영향받은 개체에서 내인성 Col7 결함을 구제하는 그의 능력을 시사하는 방법에서 이 단백질이 (예컨대 기저막 구역에서) 조직화를 시작할 수 있다는 것을 시사한다.
SEQUENCE LISTING <110> Krystal Biotech, LLC <120> COMPOSITIONS AND METHODS FOR THE TREATMENT OF WOUNDS, DISORDERS, AND DISEASES OF THE SKIN <130> WO/2017/176336 <140> WO/2017/176336 <141> 2016-12-28 <150> US 62/320,316 <151> 2016-04-08 <160> 30 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 8835 <212> DNA <213> Homo sapiens <400> 1 atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60 gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120 ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180 ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240 acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300 ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360 gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420 cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480 caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540 gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600 ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660 ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720 tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780 ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840 caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900 accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960 gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020 cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080 cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140 ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200 cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260 ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320 gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380 gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440 cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500 cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560 gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620 gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680 gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740 ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800 gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860 gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920 cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980 taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040 gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100 tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160 tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220 gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280 gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340 aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400 ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460 atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520 tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580 actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640 cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700 caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760 ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820 ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880 gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940 agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000 gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060 ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120 tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180 gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240 ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300 cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360 atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420 gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480 atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540 caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600 cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660 agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720 cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780 gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840 ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900 cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960 gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020 ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080 cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140 ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200 gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260 ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320 cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380 cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440 gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500 ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560 gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620 gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680 cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740 cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800 ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860 cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920 gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980 ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040 gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100 cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160 cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220 gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280 ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340 agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400 aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460 ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520 aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580 gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640 ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700 ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760 aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820 aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880 gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940 aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000 gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060 cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120 attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180 ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240 cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300 cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360 agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420 ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480 gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540 ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600 ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660 ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720 caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780 cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840 ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900 gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960 gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020 aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080 gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140 cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200 ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260 agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320 ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380 ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440 ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500 aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560 gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620 cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680 gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740 ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800 ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860 ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920 ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980 atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040 cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100 ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160 gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220 cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280 gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340 ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400 cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460 gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520 gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580 gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640 gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700 acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760 acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820 actgcccagg actga 8835 <210> 2 <211> 2944 <212> PRT <213> Homo sapiens <400> 2 Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala 1 5 10 15 Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr 20 25 30 Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser 35 40 45 Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu 50 55 60 Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala 65 70 75 80 Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala 85 90 95 Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr 100 105 110 Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp 115 120 125 His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys 130 135 140 Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala 145 150 155 160 Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys 165 170 175 Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser 180 185 190 Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu 195 200 205 Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val 210 215 220 Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu 225 230 235 240 Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser 245 250 255 Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu 260 265 270 Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly 275 280 285 Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln 290 295 300 Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser 305 310 315 320 Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln 325 330 335 Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly 340 345 350 Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr 355 360 365 Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp 370 375 380 Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly 385 390 395 400 Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser 405 410 415 Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu 420 425 430 Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp 435 440 445 Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser 450 455 460 Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr 465 470 475 480 Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro 485 490 495 Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr 500 505 510 Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp 515 520 525 Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr 530 535 540 Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe 545 550 555 560 Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser 565 570 575 Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg 580 585 590 Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val 595 600 605 Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala 610 615 620 Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser 625 630 635 640 Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln 645 650 655 Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu 660 665 670 Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro 675 680 685 Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile 690 695 700 Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His 705 710 715 720 Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr 725 730 735 Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His 740 745 750 Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val 755 760 765 Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile 770 775 780 Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr 785 790 795 800 Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro 805 810 815 Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg 820 825 830 Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val 835 840 845 Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro 850 855 860 Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu 865 870 875 880 His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe 885 890 895 Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu 900 905 910 Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr 915 920 925 Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro 930 935 940 Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile 945 950 955 960 Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp 965 970 975 Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu 980 985 990 Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly 995 1000 1005 Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr 1010 1015 1020 Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala 1025 1030 1035 1040 Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val 1045 1050 1055 Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr 1060 1065 1070 Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro 1075 1080 1085 Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro 1090 1095 1100 Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg 1105 1110 1115 1120 Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr 1125 1130 1135 Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly 1140 1145 1150 Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro 1155 1160 1165 Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly 1170 1175 1180 Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu 1185 1190 1195 1200 Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val 1205 1210 1215 Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala 1220 1225 1230 Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro 1235 1240 1245 Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu 1250 1255 1260 Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr 1265 1270 1275 1280 Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly 1285 1290 1295 Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg 1300 1305 1310 Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro 1315 1320 1325 Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly 1330 1335 1340 Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly 1345 1350 1355 1360 Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro 1365 1370 1375 Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly 1380 1385 1390 Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg 1395 1400 1405 Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly 1410 1415 1420 Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro 1425 1430 1435 1440 Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly 1445 1450 1455 Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro 1460 1465 1470 Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu 1475 1480 1485 Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly 1490 1495 1500 Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro 1505 1510 1515 1520 Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro 1525 1530 1535 Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro 1540 1545 1550 Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr 1555 1560 1565 Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp 1570 1575 1580 Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr 1585 1590 1595 1600 Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly 1605 1610 1615 Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg 1620 1625 1630 Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro 1635 1640 1645 Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly 1650 1655 1660 Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu 1665 1670 1675 1680 Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg 1685 1690 1695 Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly 1700 1705 1710 Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly 1715 1720 1725 Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu 1730 1735 1740 Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro 1745 1750 1755 1760 Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly 1765 1770 1775 Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro 1780 1785 1790 Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp 1795 1800 1805 Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly 1810 1815 1820 Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu 1825 1830 1835 1840 Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys 1845 1850 1855 Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly 1860 1865 1870 Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro 1875 1880 1885 Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly 1890 1895 1900 Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser 1905 1910 1915 1920 Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro 1925 1930 1935 Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys 1940 1945 1950 Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly 1955 1960 1965 Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser 1970 1975 1980 Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly 1985 1990 1995 2000 Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro 2005 2010 2015 Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu 2020 2025 2030 Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala 2035 2040 2045 Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly 2050 2055 2060 Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu 2065 2070 2075 2080 Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val 2085 2090 2095 Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu 2100 2105 2110 Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys 2115 2120 2125 Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly 2130 2135 2140 Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met 2145 2150 2155 2160 Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro 2165 2170 2175 Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly 2180 2185 2190 Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu 2195 2200 2205 Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly 2210 2215 2220 Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro 2225 2230 2235 2240 Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro 2245 2250 2255 Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly 2260 2265 2270 Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro 2275 2280 2285 Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly 2290 2295 2300 Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly 2305 2310 2315 2320 Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly 2325 2330 2335 Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp 2340 2345 2350 Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys 2355 2360 2365 Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro 2370 2375 2380 Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro 2385 2390 2395 2400 Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly 2405 2410 2415 Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg 2420 2425 2430 Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val 2435 2440 2445 Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly 2450 2455 2460 Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg 2465 2470 2475 2480 Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly 2485 2490 2495 Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser 2500 2505 2510 Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro 2515 2520 2525 Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg 2530 2535 2540 Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly 2545 2550 2555 2560 Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu 2565 2570 2575 Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala 2580 2585 2590 Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly 2595 2600 2605 Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu 2610 2615 2620 Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys 2625 2630 2635 2640 Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly 2645 2650 2655 His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala 2660 2665 2670 Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp 2675 2680 2685 Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly 2690 2695 2700 Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser 2705 2710 2715 2720 Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu 2725 2730 2735 Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val 2740 2745 2750 Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln 2755 2760 2765 Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala 2770 2775 2780 Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln 2785 2790 2795 2800 His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu 2805 2810 2815 Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro 2820 2825 2830 Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu 2835 2840 2845 Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln 2850 2855 2860 Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu 2865 2870 2875 2880 Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala 2885 2890 2895 Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys 2900 2905 2910 Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg 2915 2920 2925 Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp 2930 2935 2940 <210> 3 <211> 2217 <212> DNA <213> Homo sapiens <400> 3 atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60 gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120 gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180 ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240 gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300 gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360 agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420 gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480 aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540 cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600 gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660 aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720 cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780 cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840 ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900 gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960 ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020 ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080 gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140 caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200 cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260 cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320 tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380 atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440 gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500 ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560 tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620 aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680 cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740 gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800 gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860 gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920 ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980 cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040 cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100 tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160 gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga cccctga 2217 <210> 4 <211> 738 <212> PRT <213> Homo sapiens <400> 4 Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu 1 5 10 15 Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp 20 25 30 Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu 35 40 45 Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr 50 55 60 Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val 65 70 75 80 Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu 85 90 95 Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp 100 105 110 Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys 115 120 125 Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys 130 135 140 Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly 145 150 155 160 Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile 165 170 175 His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln 180 185 190 Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu 195 200 205 Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly 210 215 220 Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile 225 230 235 240 Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly 245 250 255 Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly 260 265 270 Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr 275 280 285 Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val 290 295 300 Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu 305 310 315 320 Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu 325 330 335 Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp 340 345 350 His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro 355 360 365 Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu 370 375 380 Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu 385 390 395 400 Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro 405 410 415 Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu 420 425 430 Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val 435 440 445 Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala 450 455 460 Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp 465 470 475 480 Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser 485 490 495 Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe 500 505 510 Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro 515 520 525 Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr 530 535 540 Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu 545 550 555 560 Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met 565 570 575 Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly 580 585 590 Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro 595 600 605 Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu 610 615 620 Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro 625 630 635 640 Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr 645 650 655 Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr 660 665 670 Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly 675 680 685 Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg 690 695 700 Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu 705 710 715 720 Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val 725 730 735 Asp Pro <210> 5 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 5 agggccaaga ggggcagcgg cgagggcagg ggcagcctgc tgacctgcgg cgacgtggag 60 gagaaccccg gcccc 75 <210> 6 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 6 Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 1 5 10 15 Gly Asp Val Glu Glu Asn Pro Gly Pro 20 25 <210> 7 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 7 ggaagcggag ctactaactt cagcctgctg aagcaggctg gagacgtgga ggagaaccct 60 ggacct 66 <210> 8 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 8 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 9 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 9 ggaagcggac agtgtactaa ttatgctctc ttgaaattgg ctggagatgt tgagagcaac 60 cctggacct 69 <210> 10 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 10 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 1 5 10 15 Val Glu Ser Asn Pro Gly Pro 20 <210> 11 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 11 ggaagcggag tgaaacagac tttgaatttt gaccttctca agttggcggg agacgtggag 60 tccaaccctg gacct 75 <210> 12 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 12 Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala 1 5 10 15 Gly Asp Val Glu Ser Asn Pro Gly Pro 20 25 <210> 13 <211> 11121 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 13 atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60 gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120 ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180 ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240 acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300 ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360 gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420 cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480 caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540 gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600 ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660 ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720 tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780 ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840 caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900 accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960 gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020 cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080 cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140 ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200 cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260 ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320 gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380 gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440 cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500 cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560 gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620 gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680 gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740 ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800 gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860 gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920 cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980 taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040 gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100 tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160 tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220 gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280 gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340 aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400 ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460 atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520 tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580 actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640 cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700 caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760 ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820 ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880 gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940 agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000 gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060 ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120 tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180 gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240 ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300 cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360 atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420 gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480 atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540 caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600 cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660 agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720 cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780 gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840 ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900 cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960 gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020 ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080 cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140 ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200 gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260 ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320 cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380 cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440 gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500 ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560 gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620 gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680 cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740 cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800 ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860 cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920 gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980 ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040 gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100 cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160 cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220 gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280 ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340 agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400 aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460 ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520 aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580 gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640 ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700 ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760 aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820 aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880 gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940 aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000 gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060 cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120 attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180 ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240 cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300 cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360 agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420 ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480 gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540 ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600 ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660 ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720 caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780 cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840 ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900 gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960 gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020 aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080 gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140 cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200 ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260 agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320 ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380 ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440 ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500 aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560 gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620 cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680 gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740 ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800 ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860 ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920 ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980 atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040 cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100 ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160 gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220 cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280 gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340 ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400 cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460 gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520 gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580 gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640 gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700 acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760 acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820 actgcccagg acagggccaa gaggggcagc ggcgagggca ggggcagcct gctgacctgc 8880 ggcgacgtgg aggagaaccc cggccccacc tcctcggggc ctggaccccg gttcctgctg 8940 ctgctgccgc tgctgctgcc ccctgcggcc tcagcctccg accggccccg gggccgagac 9000 ccggtcaacc cagagaagct gctggtgatc actgtggcca cagctgaaac cgaggggtac 9060 ctgcgtttcc tgcgctctgc ggagttcttc aactacactg tgcggaccct gggcctggga 9120 gaggagtggc gagggggtga tgtggctcga acagttggtg gaggacagaa ggtccggtgg 9180 ttaaagaagg aaatggagaa atacgctgac cgggaggata tgatcatcat gtttgtggat 9240 agctacgacg tgattctggc cggcagcccc acagagctgc tgaagaagtt cgtccagagt 9300 ggcagccgcc tgctcttctc tgcagagagc ttctgctggc ccgagtgggg gctggcggag 9360 cagtaccctg aggtgggcac ggggaagcgc ttcctcaatt ctggtggatt catcggtttt 9420 gccaccacca tccaccaaat cgtgcgccag tggaagtaca aggatgatga cgacgaccag 9480 ctgttctaca cacggctcta cctggaccca ggactgaggg agaaactcag ccttaatctg 9540 gatcataagt ctcggatctt tcagaacctc aacggggctt tagatgaagt ggttttaaag 9600 tttgatcgga accgtgtgcg tatccggaac gtggcctacg acacgctccc cattgtggtc 9660 catggaaacg gtcccactaa gctgcagctc aactacctgg gaaactacgt ccccaatggc 9720 tggactcctg agggaggctg tggcttctgc aaccaggacc ggaggacact cccggggggg 9780 cagcctcccc cccgggtgtt tctggccgtg tttgtggaac agcctactcc gtttctgccc 9840 cgcttcctgc agcggctgct actcctggac tatccccccg acagggtcac ccttttcctg 9900 cacaacaacg aggtcttcca tgaaccccac atcgctgact cctggccgca gctccaggac 9960 cacttctcag ctgtgaagct cgtggggccg gaggaggctc tgagcccagg cgaggccagg 10020 gacatggcca tggacctgtg tcggcaggac cccgagtgtg agttctactt cagcctggac 10080 gccgacgctg tcctcaccaa cctgcagacc ctgcgtatcc tcattgagga gaacaggaag 10140 gtgatcgccc ccatgctgtc ccgccacggc aagctgtggt ccaacttctg gggcgccctg 10200 agccccgatg agtactacgc ccgctccgag gactacgtgg agctggtgca gcggaagcga 10260 gtgggtgtgt ggaatgtacc atacatctcc caggcctatg tgatccgggg tgataccctg 10320 cggatggagc tgccccagag ggatgtgttc tcgggcagtg acacagaccc ggacatggcc 10380 ttctgtaaga gctttcgaga caagggcatc ttcctccatc tgagcaatca gcatgaattt 10440 ggccggctcc tggccacttc cagatacgac acggagcacc tgcaccccga cctctggcag 10500 atcttcgaca accccgtcga ctggaaggag cagtacatcc acgagaacta cagccgggcc 10560 ctggaagggg aaggaatcgt ggagcagcca tgcccggacg tgtactggtt cccactgctg 10620 tcagaacaaa tgtgtgatga gctggtggca gagatggagc actacggcca gtggtcaggc 10680 ggccggcatg aggattcaag gctggctgga ggctacgaga atgtgcccac cgtggacatc 10740 cacatgaagc aggtggggta cgaggaccag tggctgcagc tgctgcggac gtatgtgggc 10800 cccatgaccg agagcctgtt tcccggttac cacaccaagg cgcgggcggt gatgaacttt 10860 gtggttcgct accggccaga cgagcagccg tctctgcggc cacaccacga ctcatccacc 10920 ttcaccctca acgttgccct caaccacaag ggcctggact atgagggagg tggctgccgc 10980 ttcctgcgct acgactgtgt gatctcctcc ccgaggaagg gctgggcact cctgcacccc 11040 ggccgcctca cccactacca cgaggggctg ccaacgacct ggggcacacg ctacatcatg 11100 gtgtcctttg tcgacccctg a 11121 <210> 14 <211> 3706 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 14 Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala 1 5 10 15 Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr 20 25 30 Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser 35 40 45 Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu 50 55 60 Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala 65 70 75 80 Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala 85 90 95 Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr 100 105 110 Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp 115 120 125 His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys 130 135 140 Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala 145 150 155 160 Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys 165 170 175 Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser 180 185 190 Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu 195 200 205 Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val 210 215 220 Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu 225 230 235 240 Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser 245 250 255 Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu 260 265 270 Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly 275 280 285 Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln 290 295 300 Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser 305 310 315 320 Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln 325 330 335 Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly 340 345 350 Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr 355 360 365 Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp 370 375 380 Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly 385 390 395 400 Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser 405 410 415 Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu 420 425 430 Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp 435 440 445 Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser 450 455 460 Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr 465 470 475 480 Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro 485 490 495 Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr 500 505 510 Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp 515 520 525 Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr 530 535 540 Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe 545 550 555 560 Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser 565 570 575 Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg 580 585 590 Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val 595 600 605 Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala 610 615 620 Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser 625 630 635 640 Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln 645 650 655 Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu 660 665 670 Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro 675 680 685 Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile 690 695 700 Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His 705 710 715 720 Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr 725 730 735 Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His 740 745 750 Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val 755 760 765 Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile 770 775 780 Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr 785 790 795 800 Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro 805 810 815 Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg 820 825 830 Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val 835 840 845 Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro 850 855 860 Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu 865 870 875 880 His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe 885 890 895 Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu 900 905 910 Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr 915 920 925 Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro 930 935 940 Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile 945 950 955 960 Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp 965 970 975 Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu 980 985 990 Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly 995 1000 1005 Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr 1010 1015 1020 Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala 1025 1030 1035 1040 Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val 1045 1050 1055 Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr 1060 1065 1070 Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro 1075 1080 1085 Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro 1090 1095 1100 Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg 1105 1110 1115 1120 Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr 1125 1130 1135 Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly 1140 1145 1150 Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro 1155 1160 1165 Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly 1170 1175 1180 Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu 1185 1190 1195 1200 Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val 1205 1210 1215 Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala 1220 1225 1230 Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro 1235 1240 1245 Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu 1250 1255 1260 Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr 1265 1270 1275 1280 Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly 1285 1290 1295 Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg 1300 1305 1310 Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro 1315 1320 1325 Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly 1330 1335 1340 Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly 1345 1350 1355 1360 Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro 1365 1370 1375 Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly 1380 1385 1390 Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg 1395 1400 1405 Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly 1410 1415 1420 Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro 1425 1430 1435 1440 Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly 1445 1450 1455 Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro 1460 1465 1470 Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu 1475 1480 1485 Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly 1490 1495 1500 Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro 1505 1510 1515 1520 Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro 1525 1530 1535 Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro 1540 1545 1550 Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr 1555 1560 1565 Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp 1570 1575 1580 Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr 1585 1590 1595 1600 Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly 1605 1610 1615 Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg 1620 1625 1630 Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro 1635 1640 1645 Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly 1650 1655 1660 Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu 1665 1670 1675 1680 Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg 1685 1690 1695 Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly 1700 1705 1710 Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly 1715 1720 1725 Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu 1730 1735 1740 Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro 1745 1750 1755 1760 Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly 1765 1770 1775 Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro 1780 1785 1790 Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp 1795 1800 1805 Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly 1810 1815 1820 Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu 1825 1830 1835 1840 Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys 1845 1850 1855 Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly 1860 1865 1870 Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro 1875 1880 1885 Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly 1890 1895 1900 Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser 1905 1910 1915 1920 Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro 1925 1930 1935 Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys 1940 1945 1950 Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly 1955 1960 1965 Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser 1970 1975 1980 Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly 1985 1990 1995 2000 Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro 2005 2010 2015 Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu 2020 2025 2030 Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala 2035 2040 2045 Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly 2050 2055 2060 Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu 2065 2070 2075 2080 Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val 2085 2090 2095 Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu 2100 2105 2110 Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys 2115 2120 2125 Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly 2130 2135 2140 Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met 2145 2150 2155 2160 Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro 2165 2170 2175 Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly 2180 2185 2190 Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu 2195 2200 2205 Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly 2210 2215 2220 Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro 2225 2230 2235 2240 Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro 2245 2250 2255 Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly 2260 2265 2270 Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro 2275 2280 2285 Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly 2290 2295 2300 Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly 2305 2310 2315 2320 Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly 2325 2330 2335 Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp 2340 2345 2350 Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys 2355 2360 2365 Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro 2370 2375 2380 Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro 2385 2390 2395 2400 Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly 2405 2410 2415 Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg 2420 2425 2430 Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val 2435 2440 2445 Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly 2450 2455 2460 Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg 2465 2470 2475 2480 Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly 2485 2490 2495 Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser 2500 2505 2510 Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro 2515 2520 2525 Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg 2530 2535 2540 Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly 2545 2550 2555 2560 Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu 2565 2570 2575 Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala 2580 2585 2590 Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly 2595 2600 2605 Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu 2610 2615 2620 Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys 2625 2630 2635 2640 Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly 2645 2650 2655 His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala 2660 2665 2670 Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp 2675 2680 2685 Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly 2690 2695 2700 Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser 2705 2710 2715 2720 Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu 2725 2730 2735 Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val 2740 2745 2750 Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln 2755 2760 2765 Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala 2770 2775 2780 Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln 2785 2790 2795 2800 His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu 2805 2810 2815 Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro 2820 2825 2830 Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu 2835 2840 2845 Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln 2850 2855 2860 Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu 2865 2870 2875 2880 Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala 2885 2890 2895 Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys 2900 2905 2910 Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg 2915 2920 2925 Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp 2930 2935 2940 Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 2945 2950 2955 2960 Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro 2965 2970 2975 Arg Phe Leu Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala 2980 2985 2990 Ser Asp Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu 2995 3000 3005 Val Ile Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu 3010 3015 3020 Arg Ser Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly 3025 3030 3035 3040 Glu Glu Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln 3045 3050 3055 Lys Val Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu 3060 3065 3070 Asp Met Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly 3075 3080 3085 Ser Pro Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu 3090 3095 3100 Leu Phe Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu 3105 3110 3115 3120 Gln Tyr Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly 3125 3130 3135 Phe Ile Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys 3140 3145 3150 Tyr Lys Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu 3155 3160 3165 Asp Pro Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser 3170 3175 3180 Arg Ile Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys 3185 3190 3195 3200 Phe Asp Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu 3205 3210 3215 Pro Ile Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr 3220 3225 3230 Leu Gly Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly 3235 3240 3245 Phe Cys Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro 3250 3255 3260 Arg Val Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro 3265 3270 3275 3280 Arg Phe Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val 3285 3290 3295 Thr Leu Phe Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala 3300 3305 3310 Asp Ser Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val 3315 3320 3325 Gly Pro Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met 3330 3335 3340 Asp Leu Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp 3345 3350 3355 3360 Ala Asp Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu 3365 3370 3375 Glu Asn Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu 3380 3385 3390 Trp Ser Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg 3395 3400 3405 Ser Glu Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp 3410 3415 3420 Asn Val Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu 3425 3430 3435 3440 Arg Met Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp 3445 3450 3455 Pro Asp Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu 3460 3465 3470 His Leu Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg 3475 3480 3485 Tyr Asp Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn 3490 3495 3500 Pro Val Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala 3505 3510 3515 3520 Leu Glu Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp 3525 3530 3535 Phe Pro Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met 3540 3545 3550 Glu His Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu 3555 3560 3565 Ala Gly Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln 3570 3575 3580 Val Gly Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly 3585 3590 3595 3600 Pro Met Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala 3605 3610 3615 Val Met Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu 3620 3625 3630 Arg Pro His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn 3635 3640 3645 His Lys Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr 3650 3655 3660 Asp Cys Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro 3665 3670 3675 3680 Gly Arg Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr 3685 3690 3695 Arg Tyr Ile Met Val Ser Phe Val Asp Pro 3700 3705 <210> 15 <211> 11121 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 15 atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60 gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120 gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180 ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240 gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300 gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360 agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420 gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480 aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540 cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600 gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660 aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720 cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780 cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840 ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900 gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960 ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020 ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080 gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140 caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200 cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260 cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320 tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380 atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440 gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500 ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560 tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620 aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680 cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740 gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800 gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860 gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920 ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980 cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040 cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100 tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160 gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccagggcc 2220 aagaggggca gcggcgaggg caggggcagc ctgctgacct gcggcgacgt ggaggagaac 2280 cccggcccca cgctgcggct tctggtggcc gcgctctgcg ccgggatcct ggcagaggcg 2340 ccccgagtgc gagcccagca cagggagaga gtgacctgca cgcgccttta cgccgctgac 2400 attgtgttct tactggatgg ctcctcatcc attggccgca gcaatttccg cgaggtccgc 2460 agctttctcg aagggctggt gctgcctttc tctggagcag ccagtgcaca gggtgtgcgc 2520 tttgccacag tgcagtacag cgatgaccca cggacagagt tcggcctgga tgcacttggc 2580 tctgggggtg atgtgatccg cgccatccgt gagcttagct acaagggggg caacactcgc 2640 acaggggctg caattctcca tgtggctgac catgtcttcc tgccccagct ggcccgacct 2700 ggtgtcccca aggtctgcat cctgatcaca gacgggaagt cccaggacct ggtggacaca 2760 gctgcccaaa ggctgaaggg gcagggggtc aagctatttg ctgtggggat caagaatgct 2820 gaccctgagg agctgaagcg agttgcctca cagcccacca gtgacttctt cttcttcgtc 2880 aatgacttca gcatcttgag gacactactg cccctcgttt cccggagagt gtgcacgact 2940 gctggtggcg tgcctgtgac ccgacctccg gatgactcga cctctgctcc acgagacctg 3000 gtgctgtctg agccaagcag ccaatccttg agagtacagt ggacagcggc cagtggccct 3060 gtgactggct acaaggtcca gtacactcct ctgacggggc tgggacagcc actgccgagt 3120 gagcggcagg aggtgaacgt cccagctggt gagaccagtg tgcggctgcg gggtctccgg 3180 ccactgaccg agtaccaagt gactgtgatt gccctctacg ccaacagcat cggggaggct 3240 gtgagcggga cagctcggac cactgcccta gaagggccgg aactgaccat ccagaatacc 3300 acagcccaca gcctcctggt ggcctggcgg agtgtgccag gtgccactgg ctaccgtgtg 3360 acatggcggg tcctcagtgg tgggcccaca cagcagcagg agctgggccc tgggcagggt 3420 tcagtgttgc tgcgtgactt ggagcctggc acggactatg aggtgaccgt gagcacccta 3480 tttggccgca gtgtggggcc cgccacttcc ctgatggctc gcactgacgc ttctgttgag 3540 cagaccctgc gcccggtcat cctgggcccc acatccatcc tcctttcctg gaacttggtg 3600 cctgaggccc gtggctaccg gttggaatgg cggcgtgaga ctggcttgga gccaccgcag 3660 aaggtggtac tgccctctga tgtgacccgc taccagttgg atgggctgca gccgggcact 3720 gagtaccgcc tcacactcta cactctgctg gagggccacg aggtggccac ccctgcaacc 3780 gtggttccca ctggaccaga gctgcctgtg agccctgtaa cagacctgca agccaccgag 3840 ctgcccgggc agcgggtgcg agtgtcctgg agcccagtcc ctggtgccac ccagtaccgc 3900 atcattgtgc gcagcaccca gggggttgag cggaccctgg tgcttcctgg gagtcagaca 3960 gcattcgact tggatgacgt tcaggctggg cttagctaca ctgtgcgggt gtctgctcga 4020 gtgggtcccc gtgagggcag tgccagtgtc ctcactgtcc gccgggagcc ggaaactcca 4080 cttgctgttc cagggctgcg ggttgtggtg tcagatgcaa cgcgagtgag ggtggcctgg 4140 ggacccgtcc ctggagccag tggatttcgg attagctgga gcacaggcag tggtccggag 4200 tccagccaga cactgccccc agactctact gccacagaca tcacagggct gcagcctgga 4260 accacctacc aggtggctgt gtcggtactg cgaggcagag aggagggccc tgctgcagtc 4320 atcgtggctc gaacggaccc actgggccca gtgaggacgg tccatgtgac tcaggccagc 4380 agctcatctg tcaccattac ctggaccagg gttcctggcg ccacaggata cagggtttcc 4440 tggcactcag cccacggccc agagaaatcc cagttggttt ctggggaggc cacggtggct 4500 gagctggatg gactggagcc agatactgag tatacggtgc atgtgagggc ccatgtggct 4560 ggcgtggatg ggccccctgc ctctgtggtt gtgaggactg cccctgagcc tgtgggtcgt 4620 gtgtcgaggc tgcagatcct caatgcttcc agcgacgttc tacggatcac ctgggtaggg 4680 gtcactggag ccacagctta cagactggcc tggggccgga gtgaaggcgg ccccatgagg 4740 caccagatac tcccaggaaa cacagactct gcagagatcc ggggtctcga aggtggagtc 4800 agctactcag tgcgagtgac tgcacttgtc ggggaccgcg agggcacacc tgtctccatt 4860 gttgtcacta cgccgcctga ggctccgcca gccctgggga cgcttcacgt ggtgcagcgc 4920 ggggagcact cgctgaggct gcgctgggag ccggtgccca gagcgcaggg cttccttctg 4980 cactggcaac ctgagggtgg ccaggaacag tcccgggtcc tggggcccga gctcagcagc 5040 tatcacctgg acgggctgga gccagcgaca cagtaccgcg tgaggctgag tgtcctaggg 5100 ccagctggag aagggccctc tgcagaggtg actgcgcgca ctgagtcacc tcgtgttcca 5160 agcattgaac tacgtgtggt ggacacctcg atcgactcgg tgactttggc ctggactcca 5220 gtgtccaggg catccagcta catcctatcc tggcggccac tcagaggccc tggccaggaa 5280 gtgcctgggt ccccgcagac acttccaggg atctcaagct cccagcgggt gacagggcta 5340 gagcctggcg tctcttacat cttctccctg acgcctgtcc tggatggtgt gcggggtcct 5400 gaggcatctg tcacacagac gccagtgtgc ccccgtggcc tggcggatgt ggtgttccta 5460 ccacatgcca ctcaagacaa tgctcaccgt gcggaggcta cgaggagggt cctggagcgt 5520 ctggtgttgg cacttgggcc tcttgggcca caggcagttc aggttggcct gctgtcttac 5580 agtcatcggc cctccccact gttcccactg aatggctccc atgaccttgg cattatcttg 5640 caaaggatcc gtgacatgcc ctacatggac ccaagtggga acaacctggg cacagccgtg 5700 gtcacagctc acagatacat gttggcacca gatgctcctg ggcgccgcca gcacgtacca 5760 ggggtgatgg ttctgctagt ggatgaaccc ttgagaggtg acatattcag ccccatccgt 5820 gaggcccagg cttctgggct taatgtggtg atgttgggaa tggctggagc ggacccagag 5880 cagctgcgtc gcttggcgcc gggtatggac tctgtccaga ccttcttcgc cgtggatgat 5940 gggccaagcc tggaccaggc agtcagtggt ctggccacag ccctgtgtca ggcatccttc 6000 actactcagc cccggccaga gccctgccca gtgtattgtc caaagggcca gaagggggaa 6060 cctggagaga tgggcctgag aggacaagtt gggcctcctg gcgaccctgg cctcccgggc 6120 aggaccggtg ctcccggccc ccaggggccc cctggaagtg ccactgccaa gggcgagagg 6180 ggcttccctg gagcagatgg gcgtccaggc agccctggcc gcgccgggaa tcctgggacc 6240 cctggagccc ctggcctaaa gggctctcca gggttgcctg gccctcgtgg ggacccggga 6300 gagcgaggac ctcgaggccc aaagggggag ccgggggctc ccggacaagt catcggaggt 6360 gaaggacctg ggcttcctgg gcggaaaggg gaccctggac catcgggccc ccctggacct 6420 cgtggaccac tgggggaccc aggaccccgt ggccccccag ggcttcctgg aacagccatg 6480 aagggtgaca aaggcgatcg tggggagcgg ggtccccctg gaccaggtga aggtggcatt 6540 gctcctgggg agcctgggct gccgggtctt cccggaagcc ctggacccca aggccccgtt 6600 ggcccccctg gaaagaaagg agaaaaaggt gactctgagg atggagctcc aggcctccca 6660 ggacaacctg ggtctccggg tgagcagggc ccacggggac ctcctggagc tattggcccc 6720 aaaggtgacc ggggctttcc agggcccctg ggtgaggctg gagagaaggg cgaacgtgga 6780 cccccaggcc cagcgggatc ccgggggctg ccaggggttg ctggacgtcc tggagccaag 6840 ggtcctgaag ggccaccagg acccactggc cgccaaggag agaaggggga gcctggtcgc 6900 cctggggacc ctgcagtggt gggacctgct gttgctggac ccaaaggaga aaagggagat 6960 gtggggcccg ctgggcccag aggagctacc ggagtccaag gggaacgggg cccacccggc 7020 ttggttcttc ctggagaccc tggccccaag ggagaccctg gagaccgggg tcccattggc 7080 cttactggca gagcaggacc cccaggtgac tcagggcctc ctggagagaa gggagaccct 7140 gggcggcctg gccccccagg acctgttggc ccccgaggac gagatggtga agttggagag 7200 aaaggtgacg agggtcctcc gggtgacccg ggtttgcctg gaaaagcagg cgagcgtggc 7260 cttcgggggg cacctggagt tcgggggcct gtgggtgaaa agggagacca gggagatcct 7320 ggagaggatg gacgaaatgg cagccctgga tcatctggac ccaagggtga ccgtggggag 7380 ccgggtcccc caggaccccc gggacggctg gtagacacag gacctggagc cagagagaag 7440 ggagagcctg gggaccgcgg acaagagggt cctcgagggc ccaagggtga tcctggcctc 7500 cctggagccc ctggggaaag gggcattgaa gggtttcggg gacccccagg cccacagggg 7560 gacccaggtg tccgaggccc agcaggagaa aagggtgacc ggggtccccc tgggctggat 7620 ggccggagcg gactggatgg gaaaccagga gccgctgggc cctctgggcc gaatggtgct 7680 gcaggcaaag ctggggaccc agggagagac gggcttccag gcctccgtgg agaacagggc 7740 ctccctggcc cctctggtcc ccctggatta ccgggaaagc caggcgagga tggcaaacct 7800 ggcctgaatg gaaaaaacgg agaacctggg gaccctggag aagacgggag gaagggagag 7860 aaaggagatt caggcgcctc tgggagagaa ggtcgtgatg gccccaaggg tgagcgtgga 7920 gctcctggta tccttggacc ccaggggcct ccaggcctcc cagggccagt gggccctcct 7980 ggccagggtt ttcctggtgt cccaggaggc acgggcccca agggtgaccg tggggagact 8040 ggatccaaag gggagcaggg cctccctgga gagcgtggcc tgcgaggaga gcctggaagt 8100 gtgccgaatg tggatcggtt gctggaaact gctggcatca aggcatctgc cctgcgggag 8160 atcgtggaga cctgggatga gagctctggt agcttcctgc ctgtgcccga acggcgtcga 8220 ggccccaagg gggactcagg cgaacagggc cccccaggca aggagggccc catcggcttt 8280 cctggagaac gcgggctgaa gggcgaccgt ggagaccctg gccctcaggg gccacctggt 8340 ctggcccttg gggagagggg cccccccggg ccttccggcc ttgccgggga gcctggaaag 8400 cctggtattc ccgggctccc aggcagggct gggggtgtgg gagaggcagg aaggccagga 8460 gagaggggag aacggggaga gaaaggagaa cgtggagaac agggcagaga tggccctcct 8520 ggactccctg gaacccctgg gccccccgga ccccctggcc ccaaggtgtc tgtggatgag 8580 ccaggtcctg gactctctgg agaacaggga ccccctggac tcaagggtgc taagggggag 8640 ccgggcagca atggtgacca aggtcccaaa ggagacaggg gtgtgccagg catcaaagga 8700 gaccggggag agcctggacc gaggggtcag gacggcaacc cgggtctacc aggagagcgt 8760 ggtatggctg ggcctgaagg gaagccgggt ctgcagggtc caagaggccc ccctggccca 8820 gtgggtggtc atggagaccc tggaccacct ggtgccccgg gtcttgctgg ccctgcagga 8880 ccccaaggac cttctggcct gaagggggag cctggagaga caggacctcc aggacggggc 8940 ctgactggac ctactggagc tgtgggactt cctggacccc ccggcccttc aggccttgtg 9000 ggtccacagg ggtctccagg tttgcctgga caagtggggg agacagggaa gccgggagcc 9060 ccaggtcgag atggtgccag tggaaaagat ggagacagag ggagccctgg tgtgccaggg 9120 tcaccaggtc tgcctggccc tgtcggacct aaaggagaac ctggccccac gggggcccct 9180 ggacaggctg tggtcgggct ccctggagca aagggagaga agggagcccc tggaggcctt 9240 gctggagacc tggtgggtga gccgggagcc aaaggtgacc gaggactgcc agggccgcga 9300 ggcgagaagg gtgaagctgg ccgtgcaggg gagcccggag accctgggga agatggtcag 9360 aaaggggctc caggacccaa aggtttcaag ggtgacccag gagtcggggt cccgggctcc 9420 cctgggcctc ctggccctcc aggtgtgaag ggagatctgg gcctccctgg cctgcccggt 9480 gctcctggtg ttgttgggtt cccgggtcag acaggccctc gaggagagat gggtcagcca 9540 ggccctagtg gagagcgggg tctggcaggc cccccaggga gagaaggaat cccaggaccc 9600 ctggggccac ctggaccacc ggggtcagtg ggaccacctg gggcctctgg actcaaagga 9660 gacaagggag accctggagt agggctgcct gggccccgag gcgagcgtgg ggagccaggc 9720 atccggggtg aagatggccg ccccggccag gagggacccc gaggactcac ggggccccct 9780 ggcagcaggg gagagcgtgg ggagaagggt gatgttggga gtgcaggact aaagggtgac 9840 aagggagact cagctgtgat cctggggcct ccaggcccac ggggtgccaa gggggacatg 9900 ggtgaacgag ggcctcgggg cttggatggt gacaaaggac ctcggggaga caatggggac 9960 cctggtgaca agggcagcaa gggagagcct ggtgacaagg gctcagccgg gttgccagga 10020 ctgcgtggac tcctgggacc ccagggtcaa cctggtgcag cagggatccc tggtgacccg 10080 ggatccccag gaaaggatgg agtgcctggt atccgaggag aaaaaggaga tgttggcttc 10140 atgggtcccc ggggcctcaa gggtgaacgg ggagtgaagg gagcctgtgg ccttgatgga 10200 gagaagggag acaagggaga agctggtccc ccaggccgcc ccgggctggc aggacacaaa 10260 ggagagatgg gggagcctgg tgtgccgggc cagtcggggg cccctggcaa ggagggcctg 10320 atcggtccca agggtgaccg aggctttgac gggcagccag gccccaaggg tgaccagggc 10380 gagaaagggg agcggggaac cccaggaatt gggggcttcc caggccccag tggaaatgat 10440 ggctctgctg gtcccccagg gccacctggc agtgttggtc ccagaggccc cgaaggactt 10500 cagggccaga agggtgagcg aggtcccccc ggagagagag tggtgggggc tcctggggtc 10560 cctggagctc ctggcgagag aggggagcag gggcggccag ggcctgccgg tcctcgaggc 10620 gagaagggag aagctgcact gacggaggat gacatccggg gctttgtgcg ccaagagatg 10680 agtcagcact gtgcctgcca gggccagttc atcgcatctg gatcacgacc cctccctagt 10740 tatgctgcag acactgccgg ctcccagctc catgctgtgc ctgtgctccg cgtctctcat 10800 gcagaggagg aagagcgggt accccctgag gatgatgagt actctgaata ctccgagtat 10860 tctgtggagg agtaccagga ccctgaagct ccttgggata gtgatgaccc ctgttccctg 10920 ccactggatg agggctcctg cactgcctac accctgcgct ggtaccatcg ggctgtgaca 10980 ggcagcacag aggcctgtca cccttttgtc tatggtggct gtggagggaa tgccaaccgt 11040 tttgggaccc gtgaggcctg cgagcgccgc tgcccacccc gggtggtcca gagccagggg 11100 acaggtactg cccaggactg a 11121 <210> 16 <211> 3706 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 16 Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu 1 5 10 15 Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp 20 25 30 Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu 35 40 45 Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr 50 55 60 Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val 65 70 75 80 Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu 85 90 95 Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp 100 105 110 Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys 115 120 125 Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys 130 135 140 Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly 145 150 155 160 Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile 165 170 175 His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln 180 185 190 Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu 195 200 205 Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly 210 215 220 Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile 225 230 235 240 Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly 245 250 255 Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly 260 265 270 Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr 275 280 285 Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val 290 295 300 Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu 305 310 315 320 Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu 325 330 335 Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp 340 345 350 His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro 355 360 365 Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu 370 375 380 Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu 385 390 395 400 Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro 405 410 415 Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu 420 425 430 Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val 435 440 445 Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala 450 455 460 Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp 465 470 475 480 Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser 485 490 495 Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe 500 505 510 Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro 515 520 525 Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr 530 535 540 Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu 545 550 555 560 Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met 565 570 575 Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly 580 585 590 Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro 595 600 605 Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu 610 615 620 Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro 625 630 635 640 Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr 645 650 655 Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr 660 665 670 Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly 675 680 685 Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg 690 695 700 Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu 705 710 715 720 Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val 725 730 735 Asp Pro Arg Ala Lys Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu 740 745 750 Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Leu Arg Leu Leu 755 760 765 Val Ala Ala Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg 770 775 780 Ala Gln His Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp 785 790 795 800 Ile Val Phe Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe 805 810 815 Arg Glu Val Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly 820 825 830 Ala Ala Ser Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp 835 840 845 Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp 850 855 860 Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg 865 870 875 880 Thr Gly Ala Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln 885 890 895 Leu Ala Arg Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly 900 905 910 Lys Ser Gln Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln 915 920 925 Gly Val Lys Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu 930 935 940 Leu Lys Arg Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val 945 950 955 960 Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg 965 970 975 Val Cys Thr Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp 980 985 990 Ser Thr Ser Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln 995 1000 1005 Ser Leu Arg Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr 1010 1015 1020 Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser 1025 1030 1035 1040 Glu Arg Gln Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu 1045 1050 1055 Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu 1060 1065 1070 Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr 1075 1080 1085 Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser 1090 1095 1100 Leu Leu Val Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val 1105 1110 1115 1120 Thr Trp Arg Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly 1125 1130 1135 Pro Gly Gln Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp 1140 1145 1150 Tyr Glu Val Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala 1155 1160 1165 Thr Ser Leu Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg 1170 1175 1180 Pro Val Ile Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val 1185 1190 1195 1200 Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu 1205 1210 1215 Glu Pro Pro Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln 1220 1225 1230 Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr 1235 1240 1245 Leu Leu Glu Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr 1250 1255 1260 Gly Pro Glu Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu 1265 1270 1275 1280 Leu Pro Gly Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala 1285 1290 1295 Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr 1300 1305 1310 Leu Val Leu Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln 1315 1320 1325 Ala Gly Leu Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg 1330 1335 1340 Glu Gly Ser Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro 1345 1350 1355 1360 Leu Ala Val Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val 1365 1370 1375 Arg Val Ala Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser 1380 1385 1390 Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp 1395 1400 1405 Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln 1410 1415 1420 Val Ala Val Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val 1425 1430 1435 1440 Ile Val Ala Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val 1445 1450 1455 Thr Gln Ala Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro 1460 1465 1470 Gly Ala Thr Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu 1475 1480 1485 Lys Ser Gln Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly 1490 1495 1500 Leu Glu Pro Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala 1505 1510 1515 1520 Gly Val Asp Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu 1525 1530 1535 Pro Val Gly Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp 1540 1545 1550 Val Leu Arg Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg 1555 1560 1565 Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu 1570 1575 1580 Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val 1585 1590 1595 1600 Ser Tyr Ser Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr 1605 1610 1615 Pro Val Ser Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu 1620 1625 1630 Gly Thr Leu His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg 1635 1640 1645 Trp Glu Pro Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro 1650 1655 1660 Glu Gly Gly Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser 1665 1670 1675 1680 Tyr His Leu Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu 1685 1690 1695 Ser Val Leu Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala 1700 1705 1710 Arg Thr Glu Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp 1715 1720 1725 Thr Ser Ile Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala 1730 1735 1740 Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu 1745 1750 1755 1760 Val Pro Gly Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg 1765 1770 1775 Val Thr Gly Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro 1780 1785 1790 Val Leu Asp Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro 1795 1800 1805 Val Cys Pro Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr 1810 1815 1820 Gln Asp Asn Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg 1825 1830 1835 1840 Leu Val Leu Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly 1845 1850 1855 Leu Leu Ser Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly 1860 1865 1870 Ser His Asp Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr 1875 1880 1885 Met Asp Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His 1890 1895 1900 Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro 1905 1910 1915 1920 Gly Val Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe 1925 1930 1935 Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu 1940 1945 1950 Gly Met Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly 1955 1960 1965 Met Asp Ser Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu 1970 1975 1980 Asp Gln Ala Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe 1985 1990 1995 2000 Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly 2005 2010 2015 Gln Lys Gly Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro 2020 2025 2030 Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln 2035 2040 2045 Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly 2050 2055 2060 Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr 2065 2070 2075 2080 Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg 2085 2090 2095 Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly 2100 2105 2110 Ala Pro Gly Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg 2115 2120 2125 Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu 2130 2135 2140 Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met 2145 2150 2155 2160 Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly 2165 2170 2175 Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly 2180 2185 2190 Ser Pro Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu 2195 2200 2205 Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly 2210 2215 2220 Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro 2225 2230 2235 2240 Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys 2245 2250 2255 Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly 2260 2265 2270 Val Ala Gly Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro 2275 2280 2285 Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro 2290 2295 2300 Ala Val Val Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp 2305 2310 2315 2320 Val Gly Pro Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg 2325 2330 2335 Gly Pro Pro Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp 2340 2345 2350 Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro 2355 2360 2365 Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly 2370 2375 2380 Pro Pro Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu 2385 2390 2395 2400 Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala 2405 2410 2415 Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly 2420 2425 2430 Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser 2435 2440 2445 Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro 2450 2455 2460 Gly Pro Pro Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys 2465 2470 2475 2480 Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly 2485 2490 2495 Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe 2500 2505 2510 Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala 2515 2520 2525 Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly 2530 2535 2540 Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala 2545 2550 2555 2560 Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg 2565 2570 2575 Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly 2580 2585 2590 Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu 2595 2600 2605 Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser 2610 2615 2620 Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly 2625 2630 2635 2640 Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro 2645 2650 2655 Val Gly Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly 2660 2665 2670 Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu 2675 2680 2685 Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val 2690 2695 2700 Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu 2705 2710 2715 2720 Ile Val Glu Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro 2725 2730 2735 Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro 2740 2745 2750 Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly 2755 2760 2765 Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly 2770 2775 2780 Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys 2785 2790 2795 2800 Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala 2805 2810 2815 Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly 2820 2825 2830 Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro 2835 2840 2845 Pro Gly Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly 2850 2855 2860 Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu 2865 2870 2875 2880 Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro 2885 2890 2895 Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly 2900 2905 2910 Asn Pro Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys 2915 2920 2925 Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His 2930 2935 2940 Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly 2945 2950 2955 2960 Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro 2965 2970 2975 Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly 2980 2985 2990 Pro Pro Gly Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu 2995 3000 3005 Pro Gly Gln Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp 3010 3015 3020 Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly 3025 3030 3035 3040 Ser Pro Gly Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro 3045 3050 3055 Thr Gly Ala Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly 3060 3065 3070 Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro 3075 3080 3085 Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly 3090 3095 3100 Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln 3105 3110 3115 3120 Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly 3125 3130 3135 Val Pro Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp 3140 3145 3150 Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro 3155 3160 3165 Gly Gln Thr Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly 3170 3175 3180 Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro 3185 3190 3195 3200 Leu Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser 3205 3210 3215 Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro 3220 3225 3230 Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro 3235 3240 3245 Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly 3250 3255 3260 Glu Arg Gly Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp 3265 3270 3275 3280 Lys Gly Asp Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala 3285 3290 3295 Lys Gly Asp Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys 3300 3305 3310 Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly 3315 3320 3325 Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu 3330 3335 3340 Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro 3345 3350 3355 3360 Gly Ser Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly 3365 3370 3375 Asp Val Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val 3380 3385 3390 Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala 3395 3400 3405 Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly 3410 3415 3420 Glu Pro Gly Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu 3425 3430 3435 3440 Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys 3445 3450 3455 Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly 3460 3465 3470 Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro 3475 3480 3485 Pro Gly Ser Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys 3490 3495 3500 Gly Glu Arg Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val 3505 3510 3515 3520 Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala 3525 3530 3535 Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile 3540 3545 3550 Arg Gly Phe Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly 3555 3560 3565 Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp 3570 3575 3580 Thr Ala Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His 3585 3590 3595 3600 Ala Glu Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu 3605 3610 3615 Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp 3620 3625 3630 Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr 3635 3640 3645 Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu 3650 3655 3660 Ala Cys His Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg 3665 3670 3675 3680 Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val 3685 3690 3695 Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp 3700 3705 <210> 17 <211> 11112 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 17 atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60 gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120 ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180 ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240 acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300 ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360 gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420 cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480 caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540 gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600 ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660 ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720 tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780 ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840 caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900 accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960 gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020 cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080 cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140 ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200 cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260 ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320 gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380 gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440 cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500 cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560 gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620 gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680 gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740 ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800 gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860 gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920 cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980 taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040 gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100 tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160 tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220 gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280 gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340 aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400 ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460 atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520 tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580 actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640 cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700 caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760 ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820 ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880 gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940 agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000 gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060 ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120 tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180 gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240 ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300 cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360 atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420 gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480 atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540 caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600 cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660 agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720 cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780 gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840 ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900 cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960 gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020 ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080 cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140 ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200 gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260 ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320 cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380 cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440 gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500 ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560 gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620 gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680 cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740 cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800 ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860 cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920 gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980 ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040 gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100 cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160 cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220 gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280 ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340 agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400 aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460 ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520 aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580 gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640 ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700 ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760 aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820 aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880 gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940 aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000 gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060 cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120 attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180 ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240 cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300 cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360 agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420 ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480 gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540 ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600 ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660 ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720 caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780 cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840 ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900 gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960 gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020 aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080 gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140 cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200 ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260 agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320 ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380 ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440 ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500 aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560 gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620 cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680 gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740 ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800 ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860 ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920 ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980 atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040 cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100 ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160 gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220 cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280 gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340 ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400 cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460 gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520 gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580 gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640 gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700 acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760 acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820 actgcccagg acggaagcgg agctactaac ttcagcctgc tgaagcaggc tggagacgtg 8880 gaggagaacc ctggacctac ctcctcgggg cctggacccc ggttcctgct gctgctgccg 8940 ctgctgctgc cccctgcggc ctcagcctcc gaccggcccc ggggccgaga cccggtcaac 9000 ccagagaagc tgctggtgat cactgtggcc acagctgaaa ccgaggggta cctgcgtttc 9060 ctgcgctctg cggagttctt caactacact gtgcggaccc tgggcctggg agaggagtgg 9120 cgagggggtg atgtggctcg aacagttggt ggaggacaga aggtccggtg gttaaagaag 9180 gaaatggaga aatacgctga ccgggaggat atgatcatca tgtttgtgga tagctacgac 9240 gtgattctgg ccggcagccc cacagagctg ctgaagaagt tcgtccagag tggcagccgc 9300 ctgctcttct ctgcagagag cttctgctgg cccgagtggg ggctggcgga gcagtaccct 9360 gaggtgggca cggggaagcg cttcctcaat tctggtggat tcatcggttt tgccaccacc 9420 atccaccaaa tcgtgcgcca gtggaagtac aaggatgatg acgacgacca gctgttctac 9480 acacggctct acctggaccc aggactgagg gagaaactca gccttaatct ggatcataag 9540 tctcggatct ttcagaacct caacggggct ttagatgaag tggttttaaa gtttgatcgg 9600 aaccgtgtgc gtatccggaa cgtggcctac gacacgctcc ccattgtggt ccatggaaac 9660 ggtcccacta agctgcagct caactacctg ggaaactacg tccccaatgg ctggactcct 9720 gagggaggct gtggcttctg caaccaggac cggaggacac tcccgggggg gcagcctccc 9780 ccccgggtgt ttctggccgt gtttgtggaa cagcctactc cgtttctgcc ccgcttcctg 9840 cagcggctgc tactcctgga ctatcccccc gacagggtca cccttttcct gcacaacaac 9900 gaggtcttcc atgaacccca catcgctgac tcctggccgc agctccagga ccacttctca 9960 gctgtgaagc tcgtggggcc ggaggaggct ctgagcccag gcgaggccag ggacatggcc 10020 atggacctgt gtcggcagga ccccgagtgt gagttctact tcagcctgga cgccgacgct 10080 gtcctcacca acctgcagac cctgcgtatc ctcattgagg agaacaggaa ggtgatcgcc 10140 cccatgctgt cccgccacgg caagctgtgg tccaacttct ggggcgccct gagccccgat 10200 gagtactacg cccgctccga ggactacgtg gagctggtgc agcggaagcg agtgggtgtg 10260 tggaatgtac catacatctc ccaggcctat gtgatccggg gtgataccct gcggatggag 10320 ctgccccaga gggatgtgtt ctcgggcagt gacacagacc cggacatggc cttctgtaag 10380 agctttcgag acaagggcat cttcctccat ctgagcaatc agcatgaatt tggccggctc 10440 ctggccactt ccagatacga cacggagcac ctgcaccccg acctctggca gatcttcgac 10500 aaccccgtcg actggaagga gcagtacatc cacgagaact acagccgggc cctggaaggg 10560 gaaggaatcg tggagcagcc atgcccggac gtgtactggt tcccactgct gtcagaacaa 10620 atgtgtgatg agctggtggc agagatggag cactacggcc agtggtcagg cggccggcat 10680 gaggattcaa ggctggctgg aggctacgag aatgtgccca ccgtggacat ccacatgaag 10740 caggtggggt acgaggacca gtggctgcag ctgctgcgga cgtatgtggg ccccatgacc 10800 gagagcctgt ttcccggtta ccacaccaag gcgcgggcgg tgatgaactt tgtggttcgc 10860 taccggccag acgagcagcc gtctctgcgg ccacaccacg actcatccac cttcaccctc 10920 aacgttgccc tcaaccacaa gggcctggac tatgagggag gtggctgccg cttcctgcgc 10980 tacgactgtg tgatctcctc cccgaggaag ggctgggcac tcctgcaccc cggccgcctc 11040 acccactacc acgaggggct gccaacgacc tggggcacac gctacatcat ggtgtccttt 11100 gtcgacccct ga 11112 <210> 18 <211> 3703 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 18 Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala 1 5 10 15 Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr 20 25 30 Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser 35 40 45 Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu 50 55 60 Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala 65 70 75 80 Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala 85 90 95 Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr 100 105 110 Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp 115 120 125 His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys 130 135 140 Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala 145 150 155 160 Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys 165 170 175 Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser 180 185 190 Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu 195 200 205 Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val 210 215 220 Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu 225 230 235 240 Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser 245 250 255 Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu 260 265 270 Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly 275 280 285 Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln 290 295 300 Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser 305 310 315 320 Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln 325 330 335 Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly 340 345 350 Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr 355 360 365 Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp 370 375 380 Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly 385 390 395 400 Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser 405 410 415 Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu 420 425 430 Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp 435 440 445 Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser 450 455 460 Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr 465 470 475 480 Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro 485 490 495 Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr 500 505 510 Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp 515 520 525 Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr 530 535 540 Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe 545 550 555 560 Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser 565 570 575 Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg 580 585 590 Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val 595 600 605 Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala 610 615 620 Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser 625 630 635 640 Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln 645 650 655 Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu 660 665 670 Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro 675 680 685 Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile 690 695 700 Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His 705 710 715 720 Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr 725 730 735 Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His 740 745 750 Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val 755 760 765 Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile 770 775 780 Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr 785 790 795 800 Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro 805 810 815 Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg 820 825 830 Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val 835 840 845 Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro 850 855 860 Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu 865 870 875 880 His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe 885 890 895 Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu 900 905 910 Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr 915 920 925 Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro 930 935 940 Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile 945 950 955 960 Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp 965 970 975 Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu 980 985 990 Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly 995 1000 1005 Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr 1010 1015 1020 Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala 1025 1030 1035 1040 Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val 1045 1050 1055 Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr 1060 1065 1070 Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro 1075 1080 1085 Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro 1090 1095 1100 Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg 1105 1110 1115 1120 Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr 1125 1130 1135 Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly 1140 1145 1150 Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro 1155 1160 1165 Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly 1170 1175 1180 Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu 1185 1190 1195 1200 Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val 1205 1210 1215 Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala 1220 1225 1230 Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro 1235 1240 1245 Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu 1250 1255 1260 Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr 1265 1270 1275 1280 Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly 1285 1290 1295 Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg 1300 1305 1310 Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro 1315 1320 1325 Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly 1330 1335 1340 Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly 1345 1350 1355 1360 Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro 1365 1370 1375 Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly 1380 1385 1390 Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg 1395 1400 1405 Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly 1410 1415 1420 Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro 1425 1430 1435 1440 Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly 1445 1450 1455 Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro 1460 1465 1470 Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu 1475 1480 1485 Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly 1490 1495 1500 Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro 1505 1510 1515 1520 Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro 1525 1530 1535 Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro 1540 1545 1550 Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr 1555 1560 1565 Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp 1570 1575 1580 Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr 1585 1590 1595 1600 Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly 1605 1610 1615 Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg 1620 1625 1630 Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro 1635 1640 1645 Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly 1650 1655 1660 Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu 1665 1670 1675 1680 Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg 1685 1690 1695 Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly 1700 1705 1710 Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly 1715 1720 1725 Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu 1730 1735 1740 Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro 1745 1750 1755 1760 Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly 1765 1770 1775 Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro 1780 1785 1790 Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp 1795 1800 1805 Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly 1810 1815 1820 Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu 1825 1830 1835 1840 Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys 1845 1850 1855 Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly 1860 1865 1870 Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro 1875 1880 1885 Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly 1890 1895 1900 Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser 1905 1910 1915 1920 Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro 1925 1930 1935 Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys 1940 1945 1950 Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly 1955 1960 1965 Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser 1970 1975 1980 Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly 1985 1990 1995 2000 Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro 2005 2010 2015 Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu 2020 2025 2030 Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala 2035 2040 2045 Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly 2050 2055 2060 Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu 2065 2070 2075 2080 Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val 2085 2090 2095 Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu 2100 2105 2110 Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys 2115 2120 2125 Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly 2130 2135 2140 Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met 2145 2150 2155 2160 Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro 2165 2170 2175 Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly 2180 2185 2190 Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu 2195 2200 2205 Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly 2210 2215 2220 Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro 2225 2230 2235 2240 Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro 2245 2250 2255 Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly 2260 2265 2270 Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro 2275 2280 2285 Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly 2290 2295 2300 Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly 2305 2310 2315 2320 Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly 2325 2330 2335 Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp 2340 2345 2350 Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys 2355 2360 2365 Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro 2370 2375 2380 Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro 2385 2390 2395 2400 Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly 2405 2410 2415 Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg 2420 2425 2430 Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val 2435 2440 2445 Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly 2450 2455 2460 Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg 2465 2470 2475 2480 Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly 2485 2490 2495 Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser 2500 2505 2510 Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro 2515 2520 2525 Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg 2530 2535 2540 Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly 2545 2550 2555 2560 Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu 2565 2570 2575 Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala 2580 2585 2590 Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly 2595 2600 2605 Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu 2610 2615 2620 Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys 2625 2630 2635 2640 Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly 2645 2650 2655 His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala 2660 2665 2670 Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp 2675 2680 2685 Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly 2690 2695 2700 Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser 2705 2710 2715 2720 Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu 2725 2730 2735 Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val 2740 2745 2750 Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln 2755 2760 2765 Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala 2770 2775 2780 Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln 2785 2790 2795 2800 His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu 2805 2810 2815 Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro 2820 2825 2830 Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu 2835 2840 2845 Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln 2850 2855 2860 Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu 2865 2870 2875 2880 Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala 2885 2890 2895 Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys 2900 2905 2910 Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg 2915 2920 2925 Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp 2930 2935 2940 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 2945 2950 2955 2960 Glu Glu Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu 2965 2970 2975 Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg 2980 2985 2990 Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr 2995 3000 3005 Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala 3010 3015 3020 Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp 3025 3030 3035 3040 Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg 3045 3050 3055 Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile 3060 3065 3070 Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr 3075 3080 3085 Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser 3090 3095 3100 Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro 3105 3110 3115 3120 Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly 3125 3130 3135 Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp 3140 3145 3150 Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly 3155 3160 3165 Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe 3170 3175 3180 Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg 3185 3190 3195 3200 Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val 3205 3210 3215 Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn 3220 3225 3230 Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn 3235 3240 3245 Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe 3250 3255 3260 Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu 3265 3270 3275 3280 Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe 3285 3290 3295 Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala Asp Ser Trp 3300 3305 3310 Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val Gly Pro Glu 3315 3320 3325 Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys 3330 3335 3340 Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala 3345 3350 3355 3360 Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg 3365 3370 3375 Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn 3380 3385 3390 Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp 3395 3400 3405 Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro 3410 3415 3420 Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu 3425 3430 3435 3440 Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met 3445 3450 3455 Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser 3460 3465 3470 Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr 3475 3480 3485 Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp 3490 3495 3500 Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly 3505 3510 3515 3520 Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu 3525 3530 3535 Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr 3540 3545 3550 Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly 3555 3560 3565 Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln Val Gly Tyr 3570 3575 3580 Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr 3585 3590 3595 3600 Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn 3605 3610 3615 Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His 3620 3625 3630 His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly 3635 3640 3645 Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val 3650 3655 3660 Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu 3665 3670 3675 3680 Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile 3685 3690 3695 Met Val Ser Phe Val Asp Pro 3700 <210> 19 <211> 11112 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 19 atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60 gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120 gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180 ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240 gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300 gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360 agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420 gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480 aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540 cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600 gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660 aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720 cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780 cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840 ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900 gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960 ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020 ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080 gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140 caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200 cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260 cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320 tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380 atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440 gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500 ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560 tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620 aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680 cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740 gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800 gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860 gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920 ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980 cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040 cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100 tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160 gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccggaagc 2220 ggagctacta acttcagcct gctgaagcag gctggagacg tggaggagaa ccctggacct 2280 acgctgcggc ttctggtggc cgcgctctgc gccgggatcc tggcagaggc gccccgagtg 2340 cgagcccagc acagggagag agtgacctgc acgcgccttt acgccgctga cattgtgttc 2400 ttactggatg gctcctcatc cattggccgc agcaatttcc gcgaggtccg cagctttctc 2460 gaagggctgg tgctgccttt ctctggagca gccagtgcac agggtgtgcg ctttgccaca 2520 gtgcagtaca gcgatgaccc acggacagag ttcggcctgg atgcacttgg ctctgggggt 2580 gatgtgatcc gcgccatccg tgagcttagc tacaaggggg gcaacactcg cacaggggct 2640 gcaattctcc atgtggctga ccatgtcttc ctgccccagc tggcccgacc tggtgtcccc 2700 aaggtctgca tcctgatcac agacgggaag tcccaggacc tggtggacac agctgcccaa 2760 aggctgaagg ggcagggggt caagctattt gctgtgggga tcaagaatgc tgaccctgag 2820 gagctgaagc gagttgcctc acagcccacc agtgacttct tcttcttcgt caatgacttc 2880 agcatcttga ggacactact gcccctcgtt tcccggagag tgtgcacgac tgctggtggc 2940 gtgcctgtga cccgacctcc ggatgactcg acctctgctc cacgagacct ggtgctgtct 3000 gagccaagca gccaatcctt gagagtacag tggacagcgg ccagtggccc tgtgactggc 3060 tacaaggtcc agtacactcc tctgacgggg ctgggacagc cactgccgag tgagcggcag 3120 gaggtgaacg tcccagctgg tgagaccagt gtgcggctgc ggggtctccg gccactgacc 3180 gagtaccaag tgactgtgat tgccctctac gccaacagca tcggggaggc tgtgagcggg 3240 acagctcgga ccactgccct agaagggccg gaactgacca tccagaatac cacagcccac 3300 agcctcctgg tggcctggcg gagtgtgcca ggtgccactg gctaccgtgt gacatggcgg 3360 gtcctcagtg gtgggcccac acagcagcag gagctgggcc ctgggcaggg ttcagtgttg 3420 ctgcgtgact tggagcctgg cacggactat gaggtgaccg tgagcaccct atttggccgc 3480 agtgtggggc ccgccacttc cctgatggct cgcactgacg cttctgttga gcagaccctg 3540 cgcccggtca tcctgggccc cacatccatc ctcctttcct ggaacttggt gcctgaggcc 3600 cgtggctacc ggttggaatg gcggcgtgag actggcttgg agccaccgca gaaggtggta 3660 ctgccctctg atgtgacccg ctaccagttg gatgggctgc agccgggcac tgagtaccgc 3720 ctcacactct acactctgct ggagggccac gaggtggcca cccctgcaac cgtggttccc 3780 actggaccag agctgcctgt gagccctgta acagacctgc aagccaccga gctgcccggg 3840 cagcgggtgc gagtgtcctg gagcccagtc cctggtgcca cccagtaccg catcattgtg 3900 cgcagcaccc agggggttga gcggaccctg gtgcttcctg ggagtcagac agcattcgac 3960 ttggatgacg ttcaggctgg gcttagctac actgtgcggg tgtctgctcg agtgggtccc 4020 cgtgagggca gtgccagtgt cctcactgtc cgccgggagc cggaaactcc acttgctgtt 4080 ccagggctgc gggttgtggt gtcagatgca acgcgagtga gggtggcctg gggacccgtc 4140 cctggagcca gtggatttcg gattagctgg agcacaggca gtggtccgga gtccagccag 4200 acactgcccc cagactctac tgccacagac atcacagggc tgcagcctgg aaccacctac 4260 caggtggctg tgtcggtact gcgaggcaga gaggagggcc ctgctgcagt catcgtggct 4320 cgaacggacc cactgggccc agtgaggacg gtccatgtga ctcaggccag cagctcatct 4380 gtcaccatta cctggaccag ggttcctggc gccacaggat acagggtttc ctggcactca 4440 gcccacggcc cagagaaatc ccagttggtt tctggggagg ccacggtggc tgagctggat 4500 ggactggagc cagatactga gtatacggtg catgtgaggg cccatgtggc tggcgtggat 4560 gggccccctg cctctgtggt tgtgaggact gcccctgagc ctgtgggtcg tgtgtcgagg 4620 ctgcagatcc tcaatgcttc cagcgacgtt ctacggatca cctgggtagg ggtcactgga 4680 gccacagctt acagactggc ctggggccgg agtgaaggcg gccccatgag gcaccagata 4740 ctcccaggaa acacagactc tgcagagatc cggggtctcg aaggtggagt cagctactca 4800 gtgcgagtga ctgcacttgt cggggaccgc gagggcacac ctgtctccat tgttgtcact 4860 acgccgcctg aggctccgcc agccctgggg acgcttcacg tggtgcagcg cggggagcac 4920 tcgctgaggc tgcgctggga gccggtgccc agagcgcagg gcttccttct gcactggcaa 4980 cctgagggtg gccaggaaca gtcccgggtc ctggggcccg agctcagcag ctatcacctg 5040 gacgggctgg agccagcgac acagtaccgc gtgaggctga gtgtcctagg gccagctgga 5100 gaagggccct ctgcagaggt gactgcgcgc actgagtcac ctcgtgttcc aagcattgaa 5160 ctacgtgtgg tggacacctc gatcgactcg gtgactttgg cctggactcc agtgtccagg 5220 gcatccagct acatcctatc ctggcggcca ctcagaggcc ctggccagga agtgcctggg 5280 tccccgcaga cacttccagg gatctcaagc tcccagcggg tgacagggct agagcctggc 5340 gtctcttaca tcttctccct gacgcctgtc ctggatggtg tgcggggtcc tgaggcatct 5400 gtcacacaga cgccagtgtg cccccgtggc ctggcggatg tggtgttcct accacatgcc 5460 actcaagaca atgctcaccg tgcggaggct acgaggaggg tcctggagcg tctggtgttg 5520 gcacttgggc ctcttgggcc acaggcagtt caggttggcc tgctgtctta cagtcatcgg 5580 ccctccccac tgttcccact gaatggctcc catgaccttg gcattatctt gcaaaggatc 5640 cgtgacatgc cctacatgga cccaagtggg aacaacctgg gcacagccgt ggtcacagct 5700 cacagataca tgttggcacc agatgctcct gggcgccgcc agcacgtacc aggggtgatg 5760 gttctgctag tggatgaacc cttgagaggt gacatattca gccccatccg tgaggcccag 5820 gcttctgggc ttaatgtggt gatgttggga atggctggag cggacccaga gcagctgcgt 5880 cgcttggcgc cgggtatgga ctctgtccag accttcttcg ccgtggatga tgggccaagc 5940 ctggaccagg cagtcagtgg tctggccaca gccctgtgtc aggcatcctt cactactcag 6000 ccccggccag agccctgccc agtgtattgt ccaaagggcc agaaggggga acctggagag 6060 atgggcctga gaggacaagt tgggcctcct ggcgaccctg gcctcccggg caggaccggt 6120 gctcccggcc cccaggggcc ccctggaagt gccactgcca agggcgagag gggcttccct 6180 ggagcagatg ggcgtccagg cagccctggc cgcgccggga atcctgggac ccctggagcc 6240 cctggcctaa agggctctcc agggttgcct ggccctcgtg gggacccggg agagcgagga 6300 cctcgaggcc caaaggggga gccgggggct cccggacaag tcatcggagg tgaaggacct 6360 gggcttcctg ggcggaaagg ggaccctgga ccatcgggcc cccctggacc tcgtggacca 6420 ctgggggacc caggaccccg tggcccccca gggcttcctg gaacagccat gaagggtgac 6480 aaaggcgatc gtggggagcg gggtccccct ggaccaggtg aaggtggcat tgctcctggg 6540 gagcctgggc tgccgggtct tcccggaagc cctggacccc aaggccccgt tggcccccct 6600 ggaaagaaag gagaaaaagg tgactctgag gatggagctc caggcctccc aggacaacct 6660 gggtctccgg gtgagcaggg cccacgggga cctcctggag ctattggccc caaaggtgac 6720 cggggctttc cagggcccct gggtgaggct ggagagaagg gcgaacgtgg acccccaggc 6780 ccagcgggat cccgggggct gccaggggtt gctggacgtc ctggagccaa gggtcctgaa 6840 gggccaccag gacccactgg ccgccaagga gagaaggggg agcctggtcg ccctggggac 6900 cctgcagtgg tgggacctgc tgttgctgga cccaaaggag aaaagggaga tgtggggccc 6960 gctgggccca gaggagctac cggagtccaa ggggaacggg gcccacccgg cttggttctt 7020 cctggagacc ctggccccaa gggagaccct ggagaccggg gtcccattgg ccttactggc 7080 agagcaggac ccccaggtga ctcagggcct cctggagaga agggagaccc tgggcggcct 7140 ggccccccag gacctgttgg cccccgagga cgagatggtg aagttggaga gaaaggtgac 7200 gagggtcctc cgggtgaccc gggtttgcct ggaaaagcag gcgagcgtgg ccttcggggg 7260 gcacctggag ttcgggggcc tgtgggtgaa aagggagacc agggagatcc tggagaggat 7320 ggacgaaatg gcagccctgg atcatctgga cccaagggtg accgtgggga gccgggtccc 7380 ccaggacccc cgggacggct ggtagacaca ggacctggag ccagagagaa gggagagcct 7440 ggggaccgcg gacaagaggg tcctcgaggg cccaagggtg atcctggcct ccctggagcc 7500 cctggggaaa ggggcattga agggtttcgg ggacccccag gcccacaggg ggacccaggt 7560 gtccgaggcc cagcaggaga aaagggtgac cggggtcccc ctgggctgga tggccggagc 7620 ggactggatg ggaaaccagg agccgctggg ccctctgggc cgaatggtgc tgcaggcaaa 7680 gctggggacc cagggagaga cgggcttcca ggcctccgtg gagaacaggg cctccctggc 7740 ccctctggtc cccctggatt accgggaaag ccaggcgagg atggcaaacc tggcctgaat 7800 ggaaaaaacg gagaacctgg ggaccctgga gaagacggga ggaagggaga gaaaggagat 7860 tcaggcgcct ctgggagaga aggtcgtgat ggccccaagg gtgagcgtgg agctcctggt 7920 atccttggac cccaggggcc tccaggcctc ccagggccag tgggccctcc tggccagggt 7980 tttcctggtg tcccaggagg cacgggcccc aagggtgacc gtggggagac tggatccaaa 8040 ggggagcagg gcctccctgg agagcgtggc ctgcgaggag agcctggaag tgtgccgaat 8100 gtggatcggt tgctggaaac tgctggcatc aaggcatctg ccctgcggga gatcgtggag 8160 acctgggatg agagctctgg tagcttcctg cctgtgcccg aacggcgtcg aggccccaag 8220 ggggactcag gcgaacaggg ccccccaggc aaggagggcc ccatcggctt tcctggagaa 8280 cgcgggctga agggcgaccg tggagaccct ggccctcagg ggccacctgg tctggccctt 8340 ggggagaggg gcccccccgg gccttccggc cttgccgggg agcctggaaa gcctggtatt 8400 cccgggctcc caggcagggc tgggggtgtg ggagaggcag gaaggccagg agagagggga 8460 gaacggggag agaaaggaga acgtggagaa cagggcagag atggccctcc tggactccct 8520 ggaacccctg ggccccccgg accccctggc cccaaggtgt ctgtggatga gccaggtcct 8580 ggactctctg gagaacaggg accccctgga ctcaagggtg ctaaggggga gccgggcagc 8640 aatggtgacc aaggtcccaa aggagacagg ggtgtgccag gcatcaaagg agaccgggga 8700 gagcctggac cgaggggtca ggacggcaac ccgggtctac caggagagcg tggtatggct 8760 gggcctgaag ggaagccggg tctgcagggt ccaagaggcc cccctggccc agtgggtggt 8820 catggagacc ctggaccacc tggtgccccg ggtcttgctg gccctgcagg accccaagga 8880 ccttctggcc tgaaggggga gcctggagag acaggacctc caggacgggg cctgactgga 8940 cctactggag ctgtgggact tcctggaccc cccggccctt caggccttgt gggtccacag 9000 gggtctccag gtttgcctgg acaagtgggg gagacaggga agccgggagc cccaggtcga 9060 gatggtgcca gtggaaaaga tggagacaga gggagccctg gtgtgccagg gtcaccaggt 9120 ctgcctggcc ctgtcggacc taaaggagaa cctggcccca cgggggcccc tggacaggct 9180 gtggtcgggc tccctggagc aaagggagag aagggagccc ctggaggcct tgctggagac 9240 ctggtgggtg agccgggagc caaaggtgac cgaggactgc cagggccgcg aggcgagaag 9300 ggtgaagctg gccgtgcagg ggagcccgga gaccctgggg aagatggtca gaaaggggct 9360 ccaggaccca aaggtttcaa gggtgaccca ggagtcgggg tcccgggctc ccctgggcct 9420 cctggccctc caggtgtgaa gggagatctg ggcctccctg gcctgcccgg tgctcctggt 9480 gttgttgggt tcccgggtca gacaggccct cgaggagaga tgggtcagcc aggccctagt 9540 ggagagcggg gtctggcagg ccccccaggg agagaaggaa tcccaggacc cctggggcca 9600 cctggaccac cggggtcagt gggaccacct ggggcctctg gactcaaagg agacaaggga 9660 gaccctggag tagggctgcc tgggccccga ggcgagcgtg gggagccagg catccggggt 9720 gaagatggcc gccccggcca ggagggaccc cgaggactca cggggccccc tggcagcagg 9780 ggagagcgtg gggagaaggg tgatgttggg agtgcaggac taaagggtga caagggagac 9840 tcagctgtga tcctggggcc tccaggccca cggggtgcca agggggacat gggtgaacga 9900 gggcctcggg gcttggatgg tgacaaagga cctcggggag acaatgggga ccctggtgac 9960 aagggcagca agggagagcc tggtgacaag ggctcagccg ggttgccagg actgcgtgga 10020 ctcctgggac cccagggtca acctggtgca gcagggatcc ctggtgaccc gggatcccca 10080 ggaaaggatg gagtgcctgg tatccgagga gaaaaaggag atgttggctt catgggtccc 10140 cggggcctca agggtgaacg gggagtgaag ggagcctgtg gccttgatgg agagaaggga 10200 gacaagggag aagctggtcc cccaggccgc cccgggctgg caggacacaa aggagagatg 10260 ggggagcctg gtgtgccggg ccagtcgggg gcccctggca aggagggcct gatcggtccc 10320 aagggtgacc gaggctttga cgggcagcca ggccccaagg gtgaccaggg cgagaaaggg 10380 gagcggggaa ccccaggaat tgggggcttc ccaggcccca gtggaaatga tggctctgct 10440 ggtcccccag ggccacctgg cagtgttggt cccagaggcc ccgaaggact tcagggccag 10500 aagggtgagc gaggtccccc cggagagaga gtggtggggg ctcctggggt ccctggagct 10560 cctggcgaga gaggggagca ggggcggcca gggcctgccg gtcctcgagg cgagaaggga 10620 gaagctgcac tgacggagga tgacatccgg ggctttgtgc gccaagagat gagtcagcac 10680 tgtgcctgcc agggccagtt catcgcatct ggatcacgac ccctccctag ttatgctgca 10740 gacactgccg gctcccagct ccatgctgtg cctgtgctcc gcgtctctca tgcagaggag 10800 gaagagcggg taccccctga ggatgatgag tactctgaat actccgagta ttctgtggag 10860 gagtaccagg accctgaagc tccttgggat agtgatgacc cctgttccct gccactggat 10920 gagggctcct gcactgccta caccctgcgc tggtaccatc gggctgtgac aggcagcaca 10980 gaggcctgtc acccttttgt ctatggtggc tgtggaggga atgccaaccg ttttgggacc 11040 cgtgaggcct gcgagcgccg ctgcccaccc cgggtggtcc agagccaggg gacaggtact 11100 gcccaggact ga 11112 <210> 20 <211> 3703 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 20 Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu 1 5 10 15 Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp 20 25 30 Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu 35 40 45 Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr 50 55 60 Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val 65 70 75 80 Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu 85 90 95 Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp 100 105 110 Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys 115 120 125 Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys 130 135 140 Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly 145 150 155 160 Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile 165 170 175 His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln 180 185 190 Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu 195 200 205 Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly 210 215 220 Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile 225 230 235 240 Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly 245 250 255 Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly 260 265 270 Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr 275 280 285 Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val 290 295 300 Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu 305 310 315 320 Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu 325 330 335 Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp 340 345 350 His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro 355 360 365 Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu 370 375 380 Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu 385 390 395 400 Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro 405 410 415 Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu 420 425 430 Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val 435 440 445 Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala 450 455 460 Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp 465 470 475 480 Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser 485 490 495 Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe 500 505 510 Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro 515 520 525 Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr 530 535 540 Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu 545 550 555 560 Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met 565 570 575 Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly 580 585 590 Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro 595 600 605 Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu 610 615 620 Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro 625 630 635 640 Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr 645 650 655 Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr 660 665 670 Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly 675 680 685 Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg 690 695 700 Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu 705 710 715 720 Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val 725 730 735 Asp Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly 740 745 750 Asp Val Glu Glu Asn Pro Gly Pro Thr Leu Arg Leu Leu Val Ala Ala 755 760 765 Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg Ala Gln His 770 775 780 Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp Ile Val Phe 785 790 795 800 Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe Arg Glu Val 805 810 815 Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly Ala Ala Ser 820 825 830 Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp Asp Pro Arg 835 840 845 Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp Val Ile Arg 850 855 860 Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg Thr Gly Ala 865 870 875 880 Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln Leu Ala Arg 885 890 895 Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly Lys Ser Gln 900 905 910 Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln Gly Val Lys 915 920 925 Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu Leu Lys Arg 930 935 940 Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val Asn Asp Phe 945 950 955 960 Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg Val Cys Thr 965 970 975 Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp Ser Thr Ser 980 985 990 Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln Ser Leu Arg 995 1000 1005 Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr Lys Val Gln 1010 1015 1020 Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser Glu Arg Gln 1025 1030 1035 1040 Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu Arg Gly Leu 1045 1050 1055 Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu Tyr Ala Asn 1060 1065 1070 Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr Ala Leu Glu 1075 1080 1085 Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser Leu Leu Val 1090 1095 1100 Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val Thr Trp Arg 1105 1110 1115 1120 Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly Pro Gly Gln 1125 1130 1135 Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp Tyr Glu Val 1140 1145 1150 Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala Thr Ser Leu 1155 1160 1165 Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg Pro Val Ile 1170 1175 1180 Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val Pro Glu Ala 1185 1190 1195 1200 Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu Glu Pro Pro 1205 1210 1215 Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln Leu Asp Gly 1220 1225 1230 Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr Leu Leu Glu 1235 1240 1245 Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr Gly Pro Glu 1250 1255 1260 Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu Leu Pro Gly 1265 1270 1275 1280 Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala Thr Gln Tyr 1285 1290 1295 Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr Leu Val Leu 1300 1305 1310 Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln Ala Gly Leu 1315 1320 1325 Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg Glu Gly Ser 1330 1335 1340 Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro Leu Ala Val 1345 1350 1355 1360 Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val Arg Val Ala 1365 1370 1375 Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser Trp Ser Thr 1380 1385 1390 Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp Ser Thr Ala 1395 1400 1405 Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln Val Ala Val 1410 1415 1420 Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val Ile Val Ala 1425 1430 1435 1440 Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val Thr Gln Ala 1445 1450 1455 Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro Gly Ala Thr 1460 1465 1470 Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu Lys Ser Gln 1475 1480 1485 Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly Leu Glu Pro 1490 1495 1500 Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala Gly Val Asp 1505 1510 1515 1520 Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu Pro Val Gly 1525 1530 1535 Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp Val Leu Arg 1540 1545 1550 Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg Leu Ala Trp 1555 1560 1565 Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu Pro Gly Asn 1570 1575 1580 Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val Ser Tyr Ser 1585 1590 1595 1600 Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr Pro Val Ser 1605 1610 1615 Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu Gly Thr Leu 1620 1625 1630 His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg Trp Glu Pro 1635 1640 1645 Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro Glu Gly Gly 1650 1655 1660 Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser Tyr His Leu 1665 1670 1675 1680 Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu Ser Val Leu 1685 1690 1695 Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala Arg Thr Glu 1700 1705 1710 Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp Thr Ser Ile 1715 1720 1725 Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala Ser Ser Tyr 1730 1735 1740 Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu Val Pro Gly 1745 1750 1755 1760 Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg Val Thr Gly 1765 1770 1775 Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro Val Leu Asp 1780 1785 1790 Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro Val Cys Pro 1795 1800 1805 Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr Gln Asp Asn 1810 1815 1820 Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg Leu Val Leu 1825 1830 1835 1840 Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly Leu Leu Ser 1845 1850 1855 Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly Ser His Asp 1860 1865 1870 Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr Met Asp Pro 1875 1880 1885 Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His Arg Tyr Met 1890 1895 1900 Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro Gly Val Met 1905 1910 1915 1920 Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe Ser Pro Ile 1925 1930 1935 Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu Gly Met Ala 1940 1945 1950 Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly Met Asp Ser 1955 1960 1965 Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu Asp Gln Ala 1970 1975 1980 Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe Thr Thr Gln 1985 1990 1995 2000 Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly Gln Lys Gly 2005 2010 2015 Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro Pro Gly Asp 2020 2025 2030 Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln Gly Pro Pro 2035 2040 2045 Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly Ala Asp Gly 2050 2055 2060 Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr Pro Gly Ala 2065 2070 2075 2080 Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg Gly Asp Pro 2085 2090 2095 Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly Ala Pro Gly 2100 2105 2110 Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg Lys Gly Asp 2115 2120 2125 Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu Gly Asp Pro 2130 2135 2140 Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met Lys Gly Asp 2145 2150 2155 2160 Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly Glu Gly Gly 2165 2170 2175 Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly Ser Pro Gly 2180 2185 2190 Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu Lys Gly Asp 2195 2200 2205 Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly Ser Pro Gly 2210 2215 2220 Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro Lys Gly Asp 2225 2230 2235 2240 Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys Gly Glu Arg 2245 2250 2255 Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly Val Ala Gly 2260 2265 2270 Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro Thr Gly Arg 2275 2280 2285 Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro Ala Val Val 2290 2295 2300 Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp Val Gly Pro 2305 2310 2315 2320 Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg Gly Pro Pro 2325 2330 2335 Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp Pro Gly Asp 2340 2345 2350 Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro Gly Asp Ser 2355 2360 2365 Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly Pro Pro Gly 2370 2375 2380 Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu Lys Gly Asp 2385 2390 2395 2400 Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala Gly Glu Arg 2405 2410 2415 Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly Glu Lys Gly 2420 2425 2430 Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser Pro Gly Ser 2435 2440 2445 Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro Gly Pro Pro 2450 2455 2460 Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys Gly Glu Pro 2465 2470 2475 2480 Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly Asp Pro Gly 2485 2490 2495 Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe Arg Gly Pro 2500 2505 2510 Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala Gly Glu Lys 2515 2520 2525 Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly Leu Asp Gly 2530 2535 2540 Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala Ala Gly Lys 2545 2550 2555 2560 Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg Gly Glu Gln 2565 2570 2575 Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly Lys Pro Gly 2580 2585 2590 Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu Pro Gly Asp 2595 2600 2605 Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser Gly Ala Ser 2610 2615 2620 Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly Ala Pro Gly 2625 2630 2635 2640 Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro Val Gly Pro 2645 2650 2655 Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly Pro Lys Gly 2660 2665 2670 Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu Pro Gly Glu 2675 2680 2685 Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val Asp Arg Leu 2690 2695 2700 Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu Ile Val Glu 2705 2710 2715 2720 Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro Glu Arg Arg 2725 2730 2735 Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro Gly Lys Glu 2740 2745 2750 Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly Asp Arg Gly 2755 2760 2765 Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly Glu Arg Gly 2770 2775 2780 Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys Pro Gly Ile 2785 2790 2795 2800 Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala Gly Arg Pro 2805 2810 2815 Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly Glu Gln Gly 2820 2825 2830 Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro Pro Gly Pro 2835 2840 2845 Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly Leu Ser Gly 2850 2855 2860 Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu Pro Gly Ser 2865 2870 2875 2880 Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro Gly Ile Lys 2885 2890 2895 Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly Asn Pro Gly 2900 2905 2910 Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys Pro Gly Leu 2915 2920 2925 Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His Gly Asp Pro 2930 2935 2940 Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly Pro Gln Gly 2945 2950 2955 2960 Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro Pro Gly Arg 2965 2970 2975 Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly Pro Pro Gly 2980 2985 2990 Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu Pro Gly Gln 2995 3000 3005 Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp Gly Ala Ser 3010 3015 3020 Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly Ser Pro Gly 3025 3030 3035 3040 Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro Thr Gly Ala 3045 3050 3055 Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly Glu Lys Gly 3060 3065 3070 Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro Gly Ala Lys 3075 3080 3085 Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly Glu Ala Gly 3090 3095 3100 Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln Lys Gly Ala 3105 3110 3115 3120 Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly Val Pro Gly 3125 3130 3135 Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp Leu Gly Leu 3140 3145 3150 Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro Gly Gln Thr 3155 3160 3165 Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly Glu Arg Gly 3170 3175 3180 Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro Leu Gly Pro 3185 3190 3195 3200 Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser Gly Leu Lys 3205 3210 3215 Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro Arg Gly Glu 3220 3225 3230 Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro Gly Gln Glu 3235 3240 3245 Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly Glu Arg Gly 3250 3255 3260 Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp Lys Gly Asp 3265 3270 3275 3280 Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala Lys Gly Asp 3285 3290 3295 Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys Gly Pro Arg 3300 3305 3310 Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly Glu Pro Gly 3315 3320 3325 Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu Leu Gly Pro 3330 3335 3340 Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro Gly Ser Pro 3345 3350 3355 3360 Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly Asp Val Gly 3365 3370 3375 Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val Lys Gly Ala 3380 3385 3390 Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala Gly Pro Pro 3395 3400 3405 Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly Glu Pro Gly 3410 3415 3420 Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu Ile Gly Pro 3425 3430 3435 3440 Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys Gly Asp Gln 3445 3450 3455 Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly Phe Pro Gly 3460 3465 3470 Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly Ser 3475 3480 3485 Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys Gly Glu Arg 3490 3495 3500 Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val Pro Gly Ala 3505 3510 3515 3520 Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala Gly Pro Arg 3525 3530 3535 Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile Arg Gly Phe 3540 3545 3550 Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly Gln Phe Ile 3555 3560 3565 Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp Thr Ala Gly 3570 3575 3580 Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His Ala Glu Glu 3585 3590 3595 3600 Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu Tyr Ser Glu 3605 3610 3615 Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp Asp Ser Asp 3620 3625 3630 Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr Ala Tyr Thr 3635 3640 3645 Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu Ala Cys His 3650 3655 3660 Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg Phe Gly Thr 3665 3670 3675 3680 Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val Gln Ser Gln 3685 3690 3695 Gly Thr Gly Thr Ala Gln Asp 3700 <210> 21 <211> 11115 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 21 atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60 gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120 ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180 ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240 acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300 ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360 gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420 cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480 caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540 gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600 ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660 ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720 tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780 ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840 caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900 accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960 gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020 cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080 cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140 ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200 cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260 ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320 gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380 gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440 cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500 cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560 gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620 gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680 gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740 ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800 gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860 gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920 cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980 taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040 gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100 tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160 tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220 gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280 gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340 aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400 ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460 atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520 tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580 actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640 cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700 caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760 ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820 ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880 gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940 agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000 gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060 ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120 tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180 gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240 ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300 cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360 atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420 gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480 atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540 caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600 cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660 agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720 cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780 gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840 ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900 cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960 gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020 ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080 cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140 ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200 gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260 ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320 cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380 cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440 gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500 ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560 gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620 gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680 cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740 cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800 ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860 cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920 gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980 ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040 gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100 cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160 cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220 gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280 ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340 agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400 aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460 ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520 aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580 gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640 ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700 ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760 aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820 aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880 gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940 aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000 gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060 cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120 attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180 ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240 cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300 cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360 agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420 ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480 gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540 ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600 ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660 ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720 caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780 cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840 ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900 gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960 gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020 aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080 gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140 cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200 ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260 agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320 ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380 ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440 ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500 aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560 gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620 cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680 gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740 ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800 ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860 ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920 ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980 atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040 cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100 ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160 gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220 cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280 gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340 ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400 cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460 gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520 gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580 gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640 gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700 acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760 acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820 actgcccagg acggaagcgg acagtgtact aattatgctc tcttgaaatt ggctggagat 8880 gttgagagca accctggacc tacctcctcg gggcctggac cccggttcct gctgctgctg 8940 ccgctgctgc tgccccctgc ggcctcagcc tccgaccggc cccggggccg agacccggtc 9000 aacccagaga agctgctggt gatcactgtg gccacagctg aaaccgaggg gtacctgcgt 9060 ttcctgcgct ctgcggagtt cttcaactac actgtgcgga ccctgggcct gggagaggag 9120 tggcgagggg gtgatgtggc tcgaacagtt ggtggaggac agaaggtccg gtggttaaag 9180 aaggaaatgg agaaatacgc tgaccgggag gatatgatca tcatgtttgt ggatagctac 9240 gacgtgattc tggccggcag ccccacagag ctgctgaaga agttcgtcca gagtggcagc 9300 cgcctgctct tctctgcaga gagcttctgc tggcccgagt gggggctggc ggagcagtac 9360 cctgaggtgg gcacggggaa gcgcttcctc aattctggtg gattcatcgg ttttgccacc 9420 accatccacc aaatcgtgcg ccagtggaag tacaaggatg atgacgacga ccagctgttc 9480 tacacacggc tctacctgga cccaggactg agggagaaac tcagccttaa tctggatcat 9540 aagtctcgga tctttcagaa cctcaacggg gctttagatg aagtggtttt aaagtttgat 9600 cggaaccgtg tgcgtatccg gaacgtggcc tacgacacgc tccccattgt ggtccatgga 9660 aacggtccca ctaagctgca gctcaactac ctgggaaact acgtccccaa tggctggact 9720 cctgagggag gctgtggctt ctgcaaccag gaccggagga cactcccggg ggggcagcct 9780 cccccccggg tgtttctggc cgtgtttgtg gaacagccta ctccgtttct gccccgcttc 9840 ctgcagcggc tgctactcct ggactatccc cccgacaggg tcaccctttt cctgcacaac 9900 aacgaggtct tccatgaacc ccacatcgct gactcctggc cgcagctcca ggaccacttc 9960 tcagctgtga agctcgtggg gccggaggag gctctgagcc caggcgaggc cagggacatg 10020 gccatggacc tgtgtcggca ggaccccgag tgtgagttct acttcagcct ggacgccgac 10080 gctgtcctca ccaacctgca gaccctgcgt atcctcattg aggagaacag gaaggtgatc 10140 gcccccatgc tgtcccgcca cggcaagctg tggtccaact tctggggcgc cctgagcccc 10200 gatgagtact acgcccgctc cgaggactac gtggagctgg tgcagcggaa gcgagtgggt 10260 gtgtggaatg taccatacat ctcccaggcc tatgtgatcc ggggtgatac cctgcggatg 10320 gagctgcccc agagggatgt gttctcgggc agtgacacag acccggacat ggccttctgt 10380 aagagctttc gagacaaggg catcttcctc catctgagca atcagcatga atttggccgg 10440 ctcctggcca cttccagata cgacacggag cacctgcacc ccgacctctg gcagatcttc 10500 gacaaccccg tcgactggaa ggagcagtac atccacgaga actacagccg ggccctggaa 10560 ggggaaggaa tcgtggagca gccatgcccg gacgtgtact ggttcccact gctgtcagaa 10620 caaatgtgtg atgagctggt ggcagagatg gagcactacg gccagtggtc aggcggccgg 10680 catgaggatt caaggctggc tggaggctac gagaatgtgc ccaccgtgga catccacatg 10740 aagcaggtgg ggtacgagga ccagtggctg cagctgctgc ggacgtatgt gggccccatg 10800 accgagagcc tgtttcccgg ttaccacacc aaggcgcggg cggtgatgaa ctttgtggtt 10860 cgctaccggc cagacgagca gccgtctctg cggccacacc acgactcatc caccttcacc 10920 ctcaacgttg ccctcaacca caagggcctg gactatgagg gaggtggctg ccgcttcctg 10980 cgctacgact gtgtgatctc ctccccgagg aagggctggg cactcctgca ccccggccgc 11040 ctcacccact accacgaggg gctgccaacg acctggggca cacgctacat catggtgtcc 11100 tttgtcgacc cctga 11115 <210> 22 <211> 3704 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 22 Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala 1 5 10 15 Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr 20 25 30 Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser 35 40 45 Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu 50 55 60 Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala 65 70 75 80 Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala 85 90 95 Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr 100 105 110 Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp 115 120 125 His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys 130 135 140 Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala 145 150 155 160 Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys 165 170 175 Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser 180 185 190 Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu 195 200 205 Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val 210 215 220 Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu 225 230 235 240 Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser 245 250 255 Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu 260 265 270 Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly 275 280 285 Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln 290 295 300 Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser 305 310 315 320 Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln 325 330 335 Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly 340 345 350 Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr 355 360 365 Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp 370 375 380 Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly 385 390 395 400 Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser 405 410 415 Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu 420 425 430 Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp 435 440 445 Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser 450 455 460 Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr 465 470 475 480 Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro 485 490 495 Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr 500 505 510 Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp 515 520 525 Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr 530 535 540 Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe 545 550 555 560 Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser 565 570 575 Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg 580 585 590 Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val 595 600 605 Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala 610 615 620 Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser 625 630 635 640 Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln 645 650 655 Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu 660 665 670 Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro 675 680 685 Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile 690 695 700 Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His 705 710 715 720 Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr 725 730 735 Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His 740 745 750 Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val 755 760 765 Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile 770 775 780 Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr 785 790 795 800 Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro 805 810 815 Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg 820 825 830 Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val 835 840 845 Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro 850 855 860 Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu 865 870 875 880 His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe 885 890 895 Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu 900 905 910 Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr 915 920 925 Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro 930 935 940 Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile 945 950 955 960 Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp 965 970 975 Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu 980 985 990 Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly 995 1000 1005 Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr 1010 1015 1020 Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala 1025 1030 1035 1040 Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val 1045 1050 1055 Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr 1060 1065 1070 Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro 1075 1080 1085 Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro 1090 1095 1100 Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg 1105 1110 1115 1120 Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr 1125 1130 1135 Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly 1140 1145 1150 Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro 1155 1160 1165 Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly 1170 1175 1180 Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu 1185 1190 1195 1200 Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val 1205 1210 1215 Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala 1220 1225 1230 Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro 1235 1240 1245 Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu 1250 1255 1260 Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr 1265 1270 1275 1280 Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly 1285 1290 1295 Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg 1300 1305 1310 Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro 1315 1320 1325 Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly 1330 1335 1340 Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly 1345 1350 1355 1360 Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro 1365 1370 1375 Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly 1380 1385 1390 Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg 1395 1400 1405 Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly 1410 1415 1420 Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro 1425 1430 1435 1440 Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly 1445 1450 1455 Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro 1460 1465 1470 Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu 1475 1480 1485 Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly 1490 1495 1500 Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro 1505 1510 1515 1520 Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro 1525 1530 1535 Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro 1540 1545 1550 Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr 1555 1560 1565 Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp 1570 1575 1580 Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr 1585 1590 1595 1600 Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly 1605 1610 1615 Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg 1620 1625 1630 Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro 1635 1640 1645 Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly 1650 1655 1660 Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu 1665 1670 1675 1680 Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg 1685 1690 1695 Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly 1700 1705 1710 Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly 1715 1720 1725 Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu 1730 1735 1740 Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro 1745 1750 1755 1760 Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly 1765 1770 1775 Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro 1780 1785 1790 Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp 1795 1800 1805 Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly 1810 1815 1820 Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu 1825 1830 1835 1840 Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys 1845 1850 1855 Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly 1860 1865 1870 Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro 1875 1880 1885 Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly 1890 1895 1900 Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser 1905 1910 1915 1920 Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro 1925 1930 1935 Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys 1940 1945 1950 Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly 1955 1960 1965 Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser 1970 1975 1980 Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly 1985 1990 1995 2000 Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro 2005 2010 2015 Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu 2020 2025 2030 Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala 2035 2040 2045 Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly 2050 2055 2060 Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu 2065 2070 2075 2080 Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val 2085 2090 2095 Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu 2100 2105 2110 Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys 2115 2120 2125 Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly 2130 2135 2140 Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met 2145 2150 2155 2160 Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro 2165 2170 2175 Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly 2180 2185 2190 Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu 2195 2200 2205 Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly 2210 2215 2220 Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro 2225 2230 2235 2240 Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro 2245 2250 2255 Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly 2260 2265 2270 Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro 2275 2280 2285 Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly 2290 2295 2300 Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly 2305 2310 2315 2320 Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly 2325 2330 2335 Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp 2340 2345 2350 Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys 2355 2360 2365 Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro 2370 2375 2380 Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro 2385 2390 2395 2400 Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly 2405 2410 2415 Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg 2420 2425 2430 Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val 2435 2440 2445 Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly 2450 2455 2460 Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg 2465 2470 2475 2480 Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly 2485 2490 2495 Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser 2500 2505 2510 Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro 2515 2520 2525 Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg 2530 2535 2540 Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly 2545 2550 2555 2560 Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu 2565 2570 2575 Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala 2580 2585 2590 Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly 2595 2600 2605 Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu 2610 2615 2620 Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys 2625 2630 2635 2640 Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly 2645 2650 2655 His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala 2660 2665 2670 Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp 2675 2680 2685 Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly 2690 2695 2700 Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser 2705 2710 2715 2720 Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu 2725 2730 2735 Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val 2740 2745 2750 Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln 2755 2760 2765 Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala 2770 2775 2780 Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln 2785 2790 2795 2800 His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu 2805 2810 2815 Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro 2820 2825 2830 Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu 2835 2840 2845 Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln 2850 2855 2860 Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu 2865 2870 2875 2880 Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala 2885 2890 2895 Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys 2900 2905 2910 Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg 2915 2920 2925 Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp 2930 2935 2940 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 2945 2950 2955 2960 Val Glu Ser Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro Arg Phe 2965 2970 2975 Leu Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp 2980 2985 2990 Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu Val Ile 2995 3000 3005 Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser 3010 3015 3020 Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly Glu Glu 3025 3030 3035 3040 Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln Lys Val 3045 3050 3055 Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu Asp Met 3060 3065 3070 Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro 3075 3080 3085 Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu Leu Phe 3090 3095 3100 Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr 3105 3110 3115 3120 Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile 3125 3130 3135 Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys Tyr Lys 3140 3145 3150 Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro 3155 3160 3165 Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser Arg Ile 3170 3175 3180 Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys Phe Asp 3185 3190 3195 3200 Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile 3205 3210 3215 Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly 3220 3225 3230 Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys 3235 3240 3245 Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro Arg Val 3250 3255 3260 Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe 3265 3270 3275 3280 Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu 3285 3290 3295 Phe Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala Asp Ser 3300 3305 3310 Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val Gly Pro 3315 3320 3325 Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met Asp Leu 3330 3335 3340 Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp 3345 3350 3355 3360 Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn 3365 3370 3375 Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu Trp Ser 3380 3385 3390 Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu 3395 3400 3405 Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp Asn Val 3410 3415 3420 Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu Arg Met 3425 3430 3435 3440 Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp Pro Asp 3445 3450 3455 Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu His Leu 3460 3465 3470 Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp 3475 3480 3485 Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn Pro Val 3490 3495 3500 Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala Leu Glu 3505 3510 3515 3520 Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro 3525 3530 3535 Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met Glu His 3540 3545 3550 Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu Ala Gly 3555 3560 3565 Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln Val Gly 3570 3575 3580 Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly Pro Met 3585 3590 3595 3600 Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala Val Met 3605 3610 3615 Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro 3620 3625 3630 His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn His Lys 3635 3640 3645 Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys 3650 3655 3660 Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro Gly Arg 3665 3670 3675 3680 Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr 3685 3690 3695 Ile Met Val Ser Phe Val Asp Pro 3700 <210> 23 <211> 11115 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 23 atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60 gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120 gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180 ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240 gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300 gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360 agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420 gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480 aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540 cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600 gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660 aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720 cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780 cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840 ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900 gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960 ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020 ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080 gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140 caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200 cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260 cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320 tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380 atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440 gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500 ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560 tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620 aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680 cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740 gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800 gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860 gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920 ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980 cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040 cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100 tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160 gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccggaagc 2220 ggacagtgta ctaattatgc tctcttgaaa ttggctggag atgttgagag caaccctgga 2280 cctacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 2340 gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 2400 ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 2460 ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 2520 acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 2580 ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 2640 gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 2700 cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 2760 caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 2820 gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 2880 ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 2940 ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 3000 tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 3060 ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 3120 caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 3180 accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 3240 gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 3300 cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 3360 cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 3420 ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 3480 cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 3540 ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 3600 gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 3660 gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 3720 cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 3780 cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 3840 gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 3900 gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 3960 gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 4020 ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 4080 gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 4140 gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 4200 cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 4260 taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 4320 gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 4380 tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 4440 tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 4500 gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 4560 gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 4620 aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 4680 ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 4740 atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 4800 tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 4860 actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 4920 cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 4980 caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 5040 ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 5100 ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 5160 gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 5220 agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 5280 gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 5340 ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 5400 tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 5460 gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 5520 ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 5580 cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 5640 atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 5700 gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 5760 atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 5820 caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 5880 cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 5940 agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 6000 cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 6060 gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 6120 ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 6180 cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 6240 gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 6300 ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 6360 cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 6420 ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 6480 gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 6540 ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 6600 cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 6660 cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 6720 gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 6780 ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 6840 gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 6900 gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 6960 cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 7020 cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 7080 ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 7140 cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 7200 gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 7260 ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 7320 gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 7380 cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 7440 cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 7500 gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 7560 ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 7620 agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 7680 aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 7740 ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 7800 aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 7860 gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 7920 ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 7980 ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 8040 aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 8100 aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 8160 gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 8220 aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 8280 gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 8340 cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 8400 attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 8460 ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 8520 cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 8580 cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 8640 agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 8700 ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 8760 gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 8820 ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 8880 ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 8940 ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 9000 caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 9060 cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 9120 ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 9180 gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 9240 gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 9300 aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 9360 gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 9420 cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 9480 ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 9540 agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 9600 ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 9660 ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 9720 ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 9780 aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 9840 gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 9900 cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 9960 gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 10020 ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 10080 ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 10140 ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 10200 ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 10260 atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 10320 cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 10380 ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 10440 gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 10500 cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 10560 gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 10620 ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 10680 cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 10740 gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 10800 gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 10860 gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 10920 gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 10980 acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 11040 acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 11100 actgcccagg actga 11115 <210> 24 <211> 3704 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 24 Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu 1 5 10 15 Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp 20 25 30 Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu 35 40 45 Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr 50 55 60 Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val 65 70 75 80 Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu 85 90 95 Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp 100 105 110 Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys 115 120 125 Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys 130 135 140 Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly 145 150 155 160 Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile 165 170 175 His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln 180 185 190 Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu 195 200 205 Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly 210 215 220 Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile 225 230 235 240 Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly 245 250 255 Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly 260 265 270 Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr 275 280 285 Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val 290 295 300 Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu 305 310 315 320 Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu 325 330 335 Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp 340 345 350 His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro 355 360 365 Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu 370 375 380 Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu 385 390 395 400 Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro 405 410 415 Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu 420 425 430 Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val 435 440 445 Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala 450 455 460 Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp 465 470 475 480 Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser 485 490 495 Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe 500 505 510 Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro 515 520 525 Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr 530 535 540 Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu 545 550 555 560 Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met 565 570 575 Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly 580 585 590 Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro 595 600 605 Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu 610 615 620 Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro 625 630 635 640 Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr 645 650 655 Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr 660 665 670 Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly 675 680 685 Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg 690 695 700 Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu 705 710 715 720 Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val 725 730 735 Asp Pro Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala 740 745 750 Gly Asp Val Glu Ser Asn Pro Gly Pro Thr Leu Arg Leu Leu Val Ala 755 760 765 Ala Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg Ala Gln 770 775 780 His Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp Ile Val 785 790 795 800 Phe Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe Arg Glu 805 810 815 Val Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly Ala Ala 820 825 830 Ser Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp Asp Pro 835 840 845 Arg Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp Val Ile 850 855 860 Arg Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg Thr Gly 865 870 875 880 Ala Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln Leu Ala 885 890 895 Arg Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly Lys Ser 900 905 910 Gln Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln Gly Val 915 920 925 Lys Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu Leu Lys 930 935 940 Arg Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val Asn Asp 945 950 955 960 Phe Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg Val Cys 965 970 975 Thr Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp Ser Thr 980 985 990 Ser Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln Ser Leu 995 1000 1005 Arg Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr Lys Val 1010 1015 1020 Gln Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser Glu Arg 1025 1030 1035 1040 Gln Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu Arg Gly 1045 1050 1055 Leu Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu Tyr Ala 1060 1065 1070 Asn Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr Ala Leu 1075 1080 1085 Glu Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser Leu Leu 1090 1095 1100 Val Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val Thr Trp 1105 1110 1115 1120 Arg Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly Pro Gly 1125 1130 1135 Gln Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp Tyr Glu 1140 1145 1150 Val Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala Thr Ser 1155 1160 1165 Leu Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg Pro Val 1170 1175 1180 Ile Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val Pro Glu 1185 1190 1195 1200 Ala Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu Glu Pro 1205 1210 1215 Pro Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln Leu Asp 1220 1225 1230 Gly Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr Leu Leu 1235 1240 1245 Glu Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr Gly Pro 1250 1255 1260 Glu Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu Leu Pro 1265 1270 1275 1280 Gly Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala Thr Gln 1285 1290 1295 Tyr Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr Leu Val 1300 1305 1310 Leu Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln Ala Gly 1315 1320 1325 Leu Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg Glu Gly 1330 1335 1340 Ser Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro Leu Ala 1345 1350 1355 1360 Val Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val Arg Val 1365 1370 1375 Ala Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser Trp Ser 1380 1385 1390 Thr Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp Ser Thr 1395 1400 1405 Ala Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln Val Ala 1410 1415 1420 Val Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val Ile Val 1425 1430 1435 1440 Ala Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val Thr Gln 1445 1450 1455 Ala Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro Gly Ala 1460 1465 1470 Thr Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu Lys Ser 1475 1480 1485 Gln Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly Leu Glu 1490 1495 1500 Pro Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala Gly Val 1505 1510 1515 1520 Asp Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu Pro Val 1525 1530 1535 Gly Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp Val Leu 1540 1545 1550 Arg Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg Leu Ala 1555 1560 1565 Trp Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu Pro Gly 1570 1575 1580 Asn Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val Ser Tyr 1585 1590 1595 1600 Ser Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr Pro Val 1605 1610 1615 Ser Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu Gly Thr 1620 1625 1630 Leu His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg Trp Glu 1635 1640 1645 Pro Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro Glu Gly 1650 1655 1660 Gly Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser Tyr His 1665 1670 1675 1680 Leu Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu Ser Val 1685 1690 1695 Leu Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala Arg Thr 1700 1705 1710 Glu Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp Thr Ser 1715 1720 1725 Ile Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala Ser Ser 1730 1735 1740 Tyr Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu Val Pro 1745 1750 1755 1760 Gly Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg Val Thr 1765 1770 1775 Gly Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro Val Leu 1780 1785 1790 Asp Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro Val Cys 1795 1800 1805 Pro Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr Gln Asp 1810 1815 1820 Asn Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg Leu Val 1825 1830 1835 1840 Leu Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly Leu Leu 1845 1850 1855 Ser Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly Ser His 1860 1865 1870 Asp Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr Met Asp 1875 1880 1885 Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His Arg Tyr 1890 1895 1900 Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro Gly Val 1905 1910 1915 1920 Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe Ser Pro 1925 1930 1935 Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu Gly Met 1940 1945 1950 Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly Met Asp 1955 1960 1965 Ser Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu Asp Gln 1970 1975 1980 Ala Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe Thr Thr 1985 1990 1995 2000 Gln Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly Gln Lys 2005 2010 2015 Gly Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro Pro Gly 2020 2025 2030 Asp Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln Gly Pro 2035 2040 2045 Pro Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly Ala Asp 2050 2055 2060 Gly Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr Pro Gly 2065 2070 2075 2080 Ala Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg Gly Asp 2085 2090 2095 Pro Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly Ala Pro 2100 2105 2110 Gly Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg Lys Gly 2115 2120 2125 Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu Gly Asp 2130 2135 2140 Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met Lys Gly 2145 2150 2155 2160 Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly Glu Gly 2165 2170 2175 Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly Ser Pro 2180 2185 2190 Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu Lys Gly 2195 2200 2205 Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly Ser Pro 2210 2215 2220 Gly Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro Lys Gly 2225 2230 2235 2240 Asp Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys Gly Glu 2245 2250 2255 Arg Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly Val Ala 2260 2265 2270 Gly Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro Thr Gly 2275 2280 2285 Arg Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro Ala Val 2290 2295 2300 Val Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp Val Gly 2305 2310 2315 2320 Pro Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg Gly Pro 2325 2330 2335 Pro Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp Pro Gly 2340 2345 2350 Asp Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro Gly Asp 2355 2360 2365 Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly Pro Pro 2370 2375 2380 Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu Lys Gly 2385 2390 2395 2400 Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala Gly Glu 2405 2410 2415 Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly Glu Lys 2420 2425 2430 Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser Pro Gly 2435 2440 2445 Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro Gly Pro 2450 2455 2460 Pro Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys Gly Glu 2465 2470 2475 2480 Pro Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly Asp Pro 2485 2490 2495 Gly Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe Arg Gly 2500 2505 2510 Pro Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala Gly Glu 2515 2520 2525 Lys Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly Leu Asp 2530 2535 2540 Gly Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala Ala Gly 2545 2550 2555 2560 Lys Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg Gly Glu 2565 2570 2575 Gln Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly Lys Pro 2580 2585 2590 Gly Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu Pro Gly 2595 2600 2605 Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser Gly Ala 2610 2615 2620 Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly Ala Pro 2625 2630 2635 2640 Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro Val Gly 2645 2650 2655 Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly Pro Lys 2660 2665 2670 Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu Pro Gly 2675 2680 2685 Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val Asp Arg 2690 2695 2700 Leu Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu Ile Val 2705 2710 2715 2720 Glu Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro Glu Arg 2725 2730 2735 Arg Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro Gly Lys 2740 2745 2750 Glu Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly Asp Arg 2755 2760 2765 Gly Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly Glu Arg 2770 2775 2780 Gly Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys Pro Gly 2785 2790 2795 2800 Ile Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala Gly Arg 2805 2810 2815 Pro Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly Glu Gln 2820 2825 2830 Gly Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro Pro Gly 2835 2840 2845 Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly Leu Ser 2850 2855 2860 Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu Pro Gly 2865 2870 2875 2880 Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro Gly Ile 2885 2890 2895 Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly Asn Pro 2900 2905 2910 Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys Pro Gly 2915 2920 2925 Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His Gly Asp 2930 2935 2940 Pro Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly Pro Gln 2945 2950 2955 2960 Gly Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro Pro Gly 2965 2970 2975 Arg Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly Pro Pro 2980 2985 2990 Gly Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu Pro Gly 2995 3000 3005 Gln Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp Gly Ala 3010 3015 3020 Ser Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly Ser Pro 3025 3030 3035 3040 Gly Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro Thr Gly 3045 3050 3055 Ala Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly Glu Lys 3060 3065 3070 Gly Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro Gly Ala 3075 3080 3085 Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly Glu Ala 3090 3095 3100 Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln Lys Gly 3105 3110 3115 3120 Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly Val Pro 3125 3130 3135 Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp Leu Gly 3140 3145 3150 Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro Gly Gln 3155 3160 3165 Thr Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly Glu Arg 3170 3175 3180 Gly Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro Leu Gly 3185 3190 3195 3200 Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser Gly Leu 3205 3210 3215 Lys Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro Arg Gly 3220 3225 3230 Glu Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro Gly Gln 3235 3240 3245 Glu Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly Glu Arg 3250 3255 3260 Gly Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp Lys Gly 3265 3270 3275 3280 Asp Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala Lys Gly 3285 3290 3295 Asp Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys Gly Pro 3300 3305 3310 Arg Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly Glu Pro 3315 3320 3325 Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu Leu Gly 3330 3335 3340 Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro Gly Ser 3345 3350 3355 3360 Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly Asp Val 3365 3370 3375 Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val Lys Gly 3380 3385 3390 Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala Gly Pro 3395 3400 3405 Pro Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly Glu Pro 3410 3415 3420 Gly Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu Ile Gly 3425 3430 3435 3440 Pro Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys Gly Asp 3445 3450 3455 Gln Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly Phe Pro 3460 3465 3470 Gly Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro Pro Gly 3475 3480 3485 Ser Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys Gly Glu 3490 3495 3500 Arg Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val Pro Gly 3505 3510 3515 3520 Ala Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala Gly Pro 3525 3530 3535 Arg Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile Arg Gly 3540 3545 3550 Phe Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly Gln Phe 3555 3560 3565 Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp Thr Ala 3570 3575 3580 Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His Ala Glu 3585 3590 3595 3600 Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu Tyr Ser 3605 3610 3615 Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp Asp Ser 3620 3625 3630 Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr Ala Tyr 3635 3640 3645 Thr Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu Ala Cys 3650 3655 3660 His Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg Phe Gly 3665 3670 3675 3680 Thr Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val Gln Ser 3685 3690 3695 Gln Gly Thr Gly Thr Ala Gln Asp 3700 <210> 25 <211> 11121 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 25 atgacgctgc ggcttctggt ggccgcgctc tgcgccggga tcctggcaga ggcgccccga 60 gtgcgagccc agcacaggga gagagtgacc tgcacgcgcc tttacgccgc tgacattgtg 120 ttcttactgg atggctcctc atccattggc cgcagcaatt tccgcgaggt ccgcagcttt 180 ctcgaagggc tggtgctgcc tttctctgga gcagccagtg cacagggtgt gcgctttgcc 240 acagtgcagt acagcgatga cccacggaca gagttcggcc tggatgcact tggctctggg 300 ggtgatgtga tccgcgccat ccgtgagctt agctacaagg ggggcaacac tcgcacaggg 360 gctgcaattc tccatgtggc tgaccatgtc ttcctgcccc agctggcccg acctggtgtc 420 cccaaggtct gcatcctgat cacagacggg aagtcccagg acctggtgga cacagctgcc 480 caaaggctga aggggcaggg ggtcaagcta tttgctgtgg ggatcaagaa tgctgaccct 540 gaggagctga agcgagttgc ctcacagccc accagtgact tcttcttctt cgtcaatgac 600 ttcagcatct tgaggacact actgcccctc gtttcccgga gagtgtgcac gactgctggt 660 ggcgtgcctg tgacccgacc tccggatgac tcgacctctg ctccacgaga cctggtgctg 720 tctgagccaa gcagccaatc cttgagagta cagtggacag cggccagtgg ccctgtgact 780 ggctacaagg tccagtacac tcctctgacg gggctgggac agccactgcc gagtgagcgg 840 caggaggtga acgtcccagc tggtgagacc agtgtgcggc tgcggggtct ccggccactg 900 accgagtacc aagtgactgt gattgccctc tacgccaaca gcatcgggga ggctgtgagc 960 gggacagctc ggaccactgc cctagaaggg ccggaactga ccatccagaa taccacagcc 1020 cacagcctcc tggtggcctg gcggagtgtg ccaggtgcca ctggctaccg tgtgacatgg 1080 cgggtcctca gtggtgggcc cacacagcag caggagctgg gccctgggca gggttcagtg 1140 ttgctgcgtg acttggagcc tggcacggac tatgaggtga ccgtgagcac cctatttggc 1200 cgcagtgtgg ggcccgccac ttccctgatg gctcgcactg acgcttctgt tgagcagacc 1260 ctgcgcccgg tcatcctggg ccccacatcc atcctccttt cctggaactt ggtgcctgag 1320 gcccgtggct accggttgga atggcggcgt gagactggct tggagccacc gcagaaggtg 1380 gtactgccct ctgatgtgac ccgctaccag ttggatgggc tgcagccggg cactgagtac 1440 cgcctcacac tctacactct gctggagggc cacgaggtgg ccacccctgc aaccgtggtt 1500 cccactggac cagagctgcc tgtgagccct gtaacagacc tgcaagccac cgagctgccc 1560 gggcagcggg tgcgagtgtc ctggagccca gtccctggtg ccacccagta ccgcatcatt 1620 gtgcgcagca cccagggggt tgagcggacc ctggtgcttc ctgggagtca gacagcattc 1680 gacttggatg acgttcaggc tgggcttagc tacactgtgc gggtgtctgc tcgagtgggt 1740 ccccgtgagg gcagtgccag tgtcctcact gtccgccggg agccggaaac tccacttgct 1800 gttccagggc tgcgggttgt ggtgtcagat gcaacgcgag tgagggtggc ctggggaccc 1860 gtccctggag ccagtggatt tcggattagc tggagcacag gcagtggtcc ggagtccagc 1920 cagacactgc ccccagactc tactgccaca gacatcacag ggctgcagcc tggaaccacc 1980 taccaggtgg ctgtgtcggt actgcgaggc agagaggagg gccctgctgc agtcatcgtg 2040 gctcgaacgg acccactggg cccagtgagg acggtccatg tgactcaggc cagcagctca 2100 tctgtcacca ttacctggac cagggttcct ggcgccacag gatacagggt ttcctggcac 2160 tcagcccacg gcccagagaa atcccagttg gtttctgggg aggccacggt ggctgagctg 2220 gatggactgg agccagatac tgagtatacg gtgcatgtga gggcccatgt ggctggcgtg 2280 gatgggcccc ctgcctctgt ggttgtgagg actgcccctg agcctgtggg tcgtgtgtcg 2340 aggctgcaga tcctcaatgc ttccagcgac gttctacgga tcacctgggt aggggtcact 2400 ggagccacag cttacagact ggcctggggc cggagtgaag gcggccccat gaggcaccag 2460 atactcccag gaaacacaga ctctgcagag atccggggtc tcgaaggtgg agtcagctac 2520 tcagtgcgag tgactgcact tgtcggggac cgcgagggca cacctgtctc cattgttgtc 2580 actacgccgc ctgaggctcc gccagccctg gggacgcttc acgtggtgca gcgcggggag 2640 cactcgctga ggctgcgctg ggagccggtg cccagagcgc agggcttcct tctgcactgg 2700 caacctgagg gtggccagga acagtcccgg gtcctggggc ccgagctcag cagctatcac 2760 ctggacgggc tggagccagc gacacagtac cgcgtgaggc tgagtgtcct agggccagct 2820 ggagaagggc cctctgcaga ggtgactgcg cgcactgagt cacctcgtgt tccaagcatt 2880 gaactacgtg tggtggacac ctcgatcgac tcggtgactt tggcctggac tccagtgtcc 2940 agggcatcca gctacatcct atcctggcgg ccactcagag gccctggcca ggaagtgcct 3000 gggtccccgc agacacttcc agggatctca agctcccagc gggtgacagg gctagagcct 3060 ggcgtctctt acatcttctc cctgacgcct gtcctggatg gtgtgcgggg tcctgaggca 3120 tctgtcacac agacgccagt gtgcccccgt ggcctggcgg atgtggtgtt cctaccacat 3180 gccactcaag acaatgctca ccgtgcggag gctacgagga gggtcctgga gcgtctggtg 3240 ttggcacttg ggcctcttgg gccacaggca gttcaggttg gcctgctgtc ttacagtcat 3300 cggccctccc cactgttccc actgaatggc tcccatgacc ttggcattat cttgcaaagg 3360 atccgtgaca tgccctacat ggacccaagt gggaacaacc tgggcacagc cgtggtcaca 3420 gctcacagat acatgttggc accagatgct cctgggcgcc gccagcacgt accaggggtg 3480 atggttctgc tagtggatga acccttgaga ggtgacatat tcagccccat ccgtgaggcc 3540 caggcttctg ggcttaatgt ggtgatgttg ggaatggctg gagcggaccc agagcagctg 3600 cgtcgcttgg cgccgggtat ggactctgtc cagaccttct tcgccgtgga tgatgggcca 3660 agcctggacc aggcagtcag tggtctggcc acagccctgt gtcaggcatc cttcactact 3720 cagccccggc cagagccctg cccagtgtat tgtccaaagg gccagaaggg ggaacctgga 3780 gagatgggcc tgagaggaca agttgggcct cctggcgacc ctggcctccc gggcaggacc 3840 ggtgctcccg gcccccaggg gccccctgga agtgccactg ccaagggcga gaggggcttc 3900 cctggagcag atgggcgtcc aggcagccct ggccgcgccg ggaatcctgg gacccctgga 3960 gcccctggcc taaagggctc tccagggttg cctggccctc gtggggaccc gggagagcga 4020 ggacctcgag gcccaaaggg ggagccgggg gctcccggac aagtcatcgg aggtgaagga 4080 cctgggcttc ctgggcggaa aggggaccct ggaccatcgg gcccccctgg acctcgtgga 4140 ccactggggg acccaggacc ccgtggcccc ccagggcttc ctggaacagc catgaagggt 4200 gacaaaggcg atcgtgggga gcggggtccc cctggaccag gtgaaggtgg cattgctcct 4260 ggggagcctg ggctgccggg tcttcccgga agccctggac cccaaggccc cgttggcccc 4320 cctggaaaga aaggagaaaa aggtgactct gaggatggag ctccaggcct cccaggacaa 4380 cctgggtctc cgggtgagca gggcccacgg ggacctcctg gagctattgg ccccaaaggt 4440 gaccggggct ttccagggcc cctgggtgag gctggagaga agggcgaacg tggaccccca 4500 ggcccagcgg gatcccgggg gctgccaggg gttgctggac gtcctggagc caagggtcct 4560 gaagggccac caggacccac tggccgccaa ggagagaagg gggagcctgg tcgccctggg 4620 gaccctgcag tggtgggacc tgctgttgct ggacccaaag gagaaaaggg agatgtgggg 4680 cccgctgggc ccagaggagc taccggagtc caaggggaac ggggcccacc cggcttggtt 4740 cttcctggag accctggccc caagggagac cctggagacc ggggtcccat tggccttact 4800 ggcagagcag gacccccagg tgactcaggg cctcctggag agaagggaga ccctgggcgg 4860 cctggccccc caggacctgt tggcccccga ggacgagatg gtgaagttgg agagaaaggt 4920 gacgagggtc ctccgggtga cccgggtttg cctggaaaag caggcgagcg tggccttcgg 4980 ggggcacctg gagttcgggg gcctgtgggt gaaaagggag accagggaga tcctggagag 5040 gatggacgaa atggcagccc tggatcatct ggacccaagg gtgaccgtgg ggagccgggt 5100 cccccaggac ccccgggacg gctggtagac acaggacctg gagccagaga gaagggagag 5160 cctggggacc gcggacaaga gggtcctcga gggcccaagg gtgatcctgg cctccctgga 5220 gcccctgggg aaaggggcat tgaagggttt cggggacccc caggcccaca gggggaccca 5280 ggtgtccgag gcccagcagg agaaaagggt gaccggggtc cccctgggct ggatggccgg 5340 agcggactgg atgggaaacc aggagccgct gggccctctg ggccgaatgg tgctgcaggc 5400 aaagctgggg acccagggag agacgggctt ccaggcctcc gtggagaaca gggcctccct 5460 ggcccctctg gtccccctgg attaccggga aagccaggcg aggatggcaa acctggcctg 5520 aatggaaaaa acggagaacc tggggaccct ggagaagacg ggaggaaggg agagaaagga 5580 gattcaggcg cctctgggag agaaggtcgt gatggcccca agggtgagcg tggagctcct 5640 ggtatccttg gaccccaggg gcctccaggc ctcccagggc cagtgggccc tcctggccag 5700 ggttttcctg gtgtcccagg aggcacgggc cccaagggtg accgtgggga gactggatcc 5760 aaaggggagc agggcctccc tggagagcgt ggcctgcgag gagagcctgg aagtgtgccg 5820 aatgtggatc ggttgctgga aactgctggc atcaaggcat ctgccctgcg ggagatcgtg 5880 gagacctggg atgagagctc tggtagcttc ctgcctgtgc ccgaacggcg tcgaggcccc 5940 aagggggact caggcgaaca gggcccccca ggcaaggagg gccccatcgg ctttcctgga 6000 gaacgcgggc tgaagggcga ccgtggagac cctggccctc aggggccacc tggtctggcc 6060 cttggggaga ggggcccccc cgggccttcc ggccttgccg gggagcctgg aaagcctggt 6120 attcccgggc tcccaggcag ggctgggggt gtgggagagg caggaaggcc aggagagagg 6180 ggagaacggg gagagaaagg agaacgtgga gaacagggca gagatggccc tcctggactc 6240 cctggaaccc ctgggccccc cggaccccct ggccccaagg tgtctgtgga tgagccaggt 6300 cctggactct ctggagaaca gggaccccct ggactcaagg gtgctaaggg ggagccgggc 6360 agcaatggtg accaaggtcc caaaggagac aggggtgtgc caggcatcaa aggagaccgg 6420 ggagagcctg gaccgagggg tcaggacggc aacccgggtc taccaggaga gcgtggtatg 6480 gctgggcctg aagggaagcc gggtctgcag ggtccaagag gcccccctgg cccagtgggt 6540 ggtcatggag accctggacc acctggtgcc ccgggtcttg ctggccctgc aggaccccaa 6600 ggaccttctg gcctgaaggg ggagcctgga gagacaggac ctccaggacg gggcctgact 6660 ggacctactg gagctgtggg acttcctgga ccccccggcc cttcaggcct tgtgggtcca 6720 caggggtctc caggtttgcc tggacaagtg ggggagacag ggaagccggg agccccaggt 6780 cgagatggtg ccagtggaaa agatggagac agagggagcc ctggtgtgcc agggtcacca 6840 ggtctgcctg gccctgtcgg acctaaagga gaacctggcc ccacgggggc ccctggacag 6900 gctgtggtcg ggctccctgg agcaaaggga gagaagggag cccctggagg ccttgctgga 6960 gacctggtgg gtgagccggg agccaaaggt gaccgaggac tgccagggcc gcgaggcgag 7020 aagggtgaag ctggccgtgc aggggagccc ggagaccctg gggaagatgg tcagaaaggg 7080 gctccaggac ccaaaggttt caagggtgac ccaggagtcg gggtcccggg ctcccctggg 7140 cctcctggcc ctccaggtgt gaagggagat ctgggcctcc ctggcctgcc cggtgctcct 7200 ggtgttgttg ggttcccggg tcagacaggc cctcgaggag agatgggtca gccaggccct 7260 agtggagagc ggggtctggc aggcccccca gggagagaag gaatcccagg acccctgggg 7320 ccacctggac caccggggtc agtgggacca cctggggcct ctggactcaa aggagacaag 7380 ggagaccctg gagtagggct gcctgggccc cgaggcgagc gtggggagcc aggcatccgg 7440 ggtgaagatg gccgccccgg ccaggaggga ccccgaggac tcacggggcc ccctggcagc 7500 aggggagagc gtggggagaa gggtgatgtt gggagtgcag gactaaaggg tgacaaggga 7560 gactcagctg tgatcctggg gcctccaggc ccacggggtg ccaaggggga catgggtgaa 7620 cgagggcctc ggggcttgga tggtgacaaa ggacctcggg gagacaatgg ggaccctggt 7680 gacaagggca gcaagggaga gcctggtgac aagggctcag ccgggttgcc aggactgcgt 7740 ggactcctgg gaccccaggg tcaacctggt gcagcaggga tccctggtga cccgggatcc 7800 ccaggaaagg atggagtgcc tggtatccga ggagaaaaag gagatgttgg cttcatgggt 7860 ccccggggcc tcaagggtga acggggagtg aagggagcct gtggccttga tggagagaag 7920 ggagacaagg gagaagctgg tcccccaggc cgccccgggc tggcaggaca caaaggagag 7980 atgggggagc ctggtgtgcc gggccagtcg ggggcccctg gcaaggaggg cctgatcggt 8040 cccaagggtg accgaggctt tgacgggcag ccaggcccca agggtgacca gggcgagaaa 8100 ggggagcggg gaaccccagg aattgggggc ttcccaggcc ccagtggaaa tgatggctct 8160 gctggtcccc cagggccacc tggcagtgtt ggtcccagag gccccgaagg acttcagggc 8220 cagaagggtg agcgaggtcc ccccggagag agagtggtgg gggctcctgg ggtccctgga 8280 gctcctggcg agagagggga gcaggggcgg ccagggcctg ccggtcctcg aggcgagaag 8340 ggagaagctg cactgacgga ggatgacatc cggggctttg tgcgccaaga gatgagtcag 8400 cactgtgcct gccagggcca gttcatcgca tctggatcac gacccctccc tagttatgct 8460 gcagacactg ccggctccca gctccatgct gtgcctgtgc tccgcgtctc tcatgcagag 8520 gaggaagagc gggtaccccc tgaggatgat gagtactctg aatactccga gtattctgtg 8580 gaggagtacc aggaccctga agctccttgg gatagtgatg acccctgttc cctgccactg 8640 gatgagggct cctgcactgc ctacaccctg cgctggtacc atcgggctgt gacaggcagc 8700 acagaggcct gtcacccttt tgtctatggt ggctgtggag ggaatgccaa ccgttttggg 8760 acccgtgagg cctgcgagcg ccgctgccca ccccgggtgg tccagagcca ggggacaggt 8820 actgcccagg acggaagcgg agtgaaacag actttgaatt ttgaccttct caagttggcg 8880 ggagacgtgg agtccaaccc tggacctacc tcctcggggc ctggaccccg gttcctgctg 8940 ctgctgccgc tgctgctgcc ccctgcggcc tcagcctccg accggccccg gggccgagac 9000 ccggtcaacc cagagaagct gctggtgatc actgtggcca cagctgaaac cgaggggtac 9060 ctgcgtttcc tgcgctctgc ggagttcttc aactacactg tgcggaccct gggcctggga 9120 gaggagtggc gagggggtga tgtggctcga acagttggtg gaggacagaa ggtccggtgg 9180 ttaaagaagg aaatggagaa atacgctgac cgggaggata tgatcatcat gtttgtggat 9240 agctacgacg tgattctggc cggcagcccc acagagctgc tgaagaagtt cgtccagagt 9300 ggcagccgcc tgctcttctc tgcagagagc ttctgctggc ccgagtgggg gctggcggag 9360 cagtaccctg aggtgggcac ggggaagcgc ttcctcaatt ctggtggatt catcggtttt 9420 gccaccacca tccaccaaat cgtgcgccag tggaagtaca aggatgatga cgacgaccag 9480 ctgttctaca cacggctcta cctggaccca ggactgaggg agaaactcag ccttaatctg 9540 gatcataagt ctcggatctt tcagaacctc aacggggctt tagatgaagt ggttttaaag 9600 tttgatcgga accgtgtgcg tatccggaac gtggcctacg acacgctccc cattgtggtc 9660 catggaaacg gtcccactaa gctgcagctc aactacctgg gaaactacgt ccccaatggc 9720 tggactcctg agggaggctg tggcttctgc aaccaggacc ggaggacact cccggggggg 9780 cagcctcccc cccgggtgtt tctggccgtg tttgtggaac agcctactcc gtttctgccc 9840 cgcttcctgc agcggctgct actcctggac tatccccccg acagggtcac ccttttcctg 9900 cacaacaacg aggtcttcca tgaaccccac atcgctgact cctggccgca gctccaggac 9960 cacttctcag ctgtgaagct cgtggggccg gaggaggctc tgagcccagg cgaggccagg 10020 gacatggcca tggacctgtg tcggcaggac cccgagtgtg agttctactt cagcctggac 10080 gccgacgctg tcctcaccaa cctgcagacc ctgcgtatcc tcattgagga gaacaggaag 10140 gtgatcgccc ccatgctgtc ccgccacggc aagctgtggt ccaacttctg gggcgccctg 10200 agccccgatg agtactacgc ccgctccgag gactacgtgg agctggtgca gcggaagcga 10260 gtgggtgtgt ggaatgtacc atacatctcc caggcctatg tgatccgggg tgataccctg 10320 cggatggagc tgccccagag ggatgtgttc tcgggcagtg acacagaccc ggacatggcc 10380 ttctgtaaga gctttcgaga caagggcatc ttcctccatc tgagcaatca gcatgaattt 10440 ggccggctcc tggccacttc cagatacgac acggagcacc tgcaccccga cctctggcag 10500 atcttcgaca accccgtcga ctggaaggag cagtacatcc acgagaacta cagccgggcc 10560 ctggaagggg aaggaatcgt ggagcagcca tgcccggacg tgtactggtt cccactgctg 10620 tcagaacaaa tgtgtgatga gctggtggca gagatggagc actacggcca gtggtcaggc 10680 ggccggcatg aggattcaag gctggctgga ggctacgaga atgtgcccac cgtggacatc 10740 cacatgaagc aggtggggta cgaggaccag tggctgcagc tgctgcggac gtatgtgggc 10800 cccatgaccg agagcctgtt tcccggttac cacaccaagg cgcgggcggt gatgaacttt 10860 gtggttcgct accggccaga cgagcagccg tctctgcggc cacaccacga ctcatccacc 10920 ttcaccctca acgttgccct caaccacaag ggcctggact atgagggagg tggctgccgc 10980 ttcctgcgct acgactgtgt gatctcctcc ccgaggaagg gctgggcact cctgcacccc 11040 ggccgcctca cccactacca cgaggggctg ccaacgacct ggggcacacg ctacatcatg 11100 gtgtcctttg tcgacccctg a 11121 <210> 26 <211> 3706 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 26 Met Thr Leu Arg Leu Leu Val Ala Ala Leu Cys Ala Gly Ile Leu Ala 1 5 10 15 Glu Ala Pro Arg Val Arg Ala Gln His Arg Glu Arg Val Thr Cys Thr 20 25 30 Arg Leu Tyr Ala Ala Asp Ile Val Phe Leu Leu Asp Gly Ser Ser Ser 35 40 45 Ile Gly Arg Ser Asn Phe Arg Glu Val Arg Ser Phe Leu Glu Gly Leu 50 55 60 Val Leu Pro Phe Ser Gly Ala Ala Ser Ala Gln Gly Val Arg Phe Ala 65 70 75 80 Thr Val Gln Tyr Ser Asp Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala 85 90 95 Leu Gly Ser Gly Gly Asp Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr 100 105 110 Lys Gly Gly Asn Thr Arg Thr Gly Ala Ala Ile Leu His Val Ala Asp 115 120 125 His Val Phe Leu Pro Gln Leu Ala Arg Pro Gly Val Pro Lys Val Cys 130 135 140 Ile Leu Ile Thr Asp Gly Lys Ser Gln Asp Leu Val Asp Thr Ala Ala 145 150 155 160 Gln Arg Leu Lys Gly Gln Gly Val Lys Leu Phe Ala Val Gly Ile Lys 165 170 175 Asn Ala Asp Pro Glu Glu Leu Lys Arg Val Ala Ser Gln Pro Thr Ser 180 185 190 Asp Phe Phe Phe Phe Val Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu 195 200 205 Pro Leu Val Ser Arg Arg Val Cys Thr Thr Ala Gly Gly Val Pro Val 210 215 220 Thr Arg Pro Pro Asp Asp Ser Thr Ser Ala Pro Arg Asp Leu Val Leu 225 230 235 240 Ser Glu Pro Ser Ser Gln Ser Leu Arg Val Gln Trp Thr Ala Ala Ser 245 250 255 Gly Pro Val Thr Gly Tyr Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu 260 265 270 Gly Gln Pro Leu Pro Ser Glu Arg Gln Glu Val Asn Val Pro Ala Gly 275 280 285 Glu Thr Ser Val Arg Leu Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln 290 295 300 Val Thr Val Ile Ala Leu Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser 305 310 315 320 Gly Thr Ala Arg Thr Thr Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln 325 330 335 Asn Thr Thr Ala His Ser Leu Leu Val Ala Trp Arg Ser Val Pro Gly 340 345 350 Ala Thr Gly Tyr Arg Val Thr Trp Arg Val Leu Ser Gly Gly Pro Thr 355 360 365 Gln Gln Gln Glu Leu Gly Pro Gly Gln Gly Ser Val Leu Leu Arg Asp 370 375 380 Leu Glu Pro Gly Thr Asp Tyr Glu Val Thr Val Ser Thr Leu Phe Gly 385 390 395 400 Arg Ser Val Gly Pro Ala Thr Ser Leu Met Ala Arg Thr Asp Ala Ser 405 410 415 Val Glu Gln Thr Leu Arg Pro Val Ile Leu Gly Pro Thr Ser Ile Leu 420 425 430 Leu Ser Trp Asn Leu Val Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp 435 440 445 Arg Arg Glu Thr Gly Leu Glu Pro Pro Gln Lys Val Val Leu Pro Ser 450 455 460 Asp Val Thr Arg Tyr Gln Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr 465 470 475 480 Arg Leu Thr Leu Tyr Thr Leu Leu Glu Gly His Glu Val Ala Thr Pro 485 490 495 Ala Thr Val Val Pro Thr Gly Pro Glu Leu Pro Val Ser Pro Val Thr 500 505 510 Asp Leu Gln Ala Thr Glu Leu Pro Gly Gln Arg Val Arg Val Ser Trp 515 520 525 Ser Pro Val Pro Gly Ala Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr 530 535 540 Gln Gly Val Glu Arg Thr Leu Val Leu Pro Gly Ser Gln Thr Ala Phe 545 550 555 560 Asp Leu Asp Asp Val Gln Ala Gly Leu Ser Tyr Thr Val Arg Val Ser 565 570 575 Ala Arg Val Gly Pro Arg Glu Gly Ser Ala Ser Val Leu Thr Val Arg 580 585 590 Arg Glu Pro Glu Thr Pro Leu Ala Val Pro Gly Leu Arg Val Val Val 595 600 605 Ser Asp Ala Thr Arg Val Arg Val Ala Trp Gly Pro Val Pro Gly Ala 610 615 620 Ser Gly Phe Arg Ile Ser Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser 625 630 635 640 Gln Thr Leu Pro Pro Asp Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln 645 650 655 Pro Gly Thr Thr Tyr Gln Val Ala Val Ser Val Leu Arg Gly Arg Glu 660 665 670 Glu Gly Pro Ala Ala Val Ile Val Ala Arg Thr Asp Pro Leu Gly Pro 675 680 685 Val Arg Thr Val His Val Thr Gln Ala Ser Ser Ser Ser Val Thr Ile 690 695 700 Thr Trp Thr Arg Val Pro Gly Ala Thr Gly Tyr Arg Val Ser Trp His 705 710 715 720 Ser Ala His Gly Pro Glu Lys Ser Gln Leu Val Ser Gly Glu Ala Thr 725 730 735 Val Ala Glu Leu Asp Gly Leu Glu Pro Asp Thr Glu Tyr Thr Val His 740 745 750 Val Arg Ala His Val Ala Gly Val Asp Gly Pro Pro Ala Ser Val Val 755 760 765 Val Arg Thr Ala Pro Glu Pro Val Gly Arg Val Ser Arg Leu Gln Ile 770 775 780 Leu Asn Ala Ser Ser Asp Val Leu Arg Ile Thr Trp Val Gly Val Thr 785 790 795 800 Gly Ala Thr Ala Tyr Arg Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro 805 810 815 Met Arg His Gln Ile Leu Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg 820 825 830 Gly Leu Glu Gly Gly Val Ser Tyr Ser Val Arg Val Thr Ala Leu Val 835 840 845 Gly Asp Arg Glu Gly Thr Pro Val Ser Ile Val Val Thr Thr Pro Pro 850 855 860 Glu Ala Pro Pro Ala Leu Gly Thr Leu His Val Val Gln Arg Gly Glu 865 870 875 880 His Ser Leu Arg Leu Arg Trp Glu Pro Val Pro Arg Ala Gln Gly Phe 885 890 895 Leu Leu His Trp Gln Pro Glu Gly Gly Gln Glu Gln Ser Arg Val Leu 900 905 910 Gly Pro Glu Leu Ser Ser Tyr His Leu Asp Gly Leu Glu Pro Ala Thr 915 920 925 Gln Tyr Arg Val Arg Leu Ser Val Leu Gly Pro Ala Gly Glu Gly Pro 930 935 940 Ser Ala Glu Val Thr Ala Arg Thr Glu Ser Pro Arg Val Pro Ser Ile 945 950 955 960 Glu Leu Arg Val Val Asp Thr Ser Ile Asp Ser Val Thr Leu Ala Trp 965 970 975 Thr Pro Val Ser Arg Ala Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu 980 985 990 Arg Gly Pro Gly Gln Glu Val Pro Gly Ser Pro Gln Thr Leu Pro Gly 995 1000 1005 Ile Ser Ser Ser Gln Arg Val Thr Gly Leu Glu Pro Gly Val Ser Tyr 1010 1015 1020 Ile Phe Ser Leu Thr Pro Val Leu Asp Gly Val Arg Gly Pro Glu Ala 1025 1030 1035 1040 Ser Val Thr Gln Thr Pro Val Cys Pro Arg Gly Leu Ala Asp Val Val 1045 1050 1055 Phe Leu Pro His Ala Thr Gln Asp Asn Ala His Arg Ala Glu Ala Thr 1060 1065 1070 Arg Arg Val Leu Glu Arg Leu Val Leu Ala Leu Gly Pro Leu Gly Pro 1075 1080 1085 Gln Ala Val Gln Val Gly Leu Leu Ser Tyr Ser His Arg Pro Ser Pro 1090 1095 1100 Leu Phe Pro Leu Asn Gly Ser His Asp Leu Gly Ile Ile Leu Gln Arg 1105 1110 1115 1120 Ile Arg Asp Met Pro Tyr Met Asp Pro Ser Gly Asn Asn Leu Gly Thr 1125 1130 1135 Ala Val Val Thr Ala His Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly 1140 1145 1150 Arg Arg Gln His Val Pro Gly Val Met Val Leu Leu Val Asp Glu Pro 1155 1160 1165 Leu Arg Gly Asp Ile Phe Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly 1170 1175 1180 Leu Asn Val Val Met Leu Gly Met Ala Gly Ala Asp Pro Glu Gln Leu 1185 1190 1195 1200 Arg Arg Leu Ala Pro Gly Met Asp Ser Val Gln Thr Phe Phe Ala Val 1205 1210 1215 Asp Asp Gly Pro Ser Leu Asp Gln Ala Val Ser Gly Leu Ala Thr Ala 1220 1225 1230 Leu Cys Gln Ala Ser Phe Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro 1235 1240 1245 Val Tyr Cys Pro Lys Gly Gln Lys Gly Glu Pro Gly Glu Met Gly Leu 1250 1255 1260 Arg Gly Gln Val Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr 1265 1270 1275 1280 Gly Ala Pro Gly Pro Gln Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly 1285 1290 1295 Glu Arg Gly Phe Pro Gly Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg 1300 1305 1310 Ala Gly Asn Pro Gly Thr Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro 1315 1320 1325 Gly Leu Pro Gly Pro Arg Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly 1330 1335 1340 Pro Lys Gly Glu Pro Gly Ala Pro Gly Gln Val Ile Gly Gly Glu Gly 1345 1350 1355 1360 Pro Gly Leu Pro Gly Arg Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro 1365 1370 1375 Gly Pro Arg Gly Pro Leu Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly 1380 1385 1390 Leu Pro Gly Thr Ala Met Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg 1395 1400 1405 Gly Pro Pro Gly Pro Gly Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly 1410 1415 1420 Leu Pro Gly Leu Pro Gly Ser Pro Gly Pro Gln Gly Pro Val Gly Pro 1425 1430 1435 1440 Pro Gly Lys Lys Gly Glu Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly 1445 1450 1455 Leu Pro Gly Gln Pro Gly Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro 1460 1465 1470 Pro Gly Ala Ile Gly Pro Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu 1475 1480 1485 Gly Glu Ala Gly Glu Lys Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly 1490 1495 1500 Ser Arg Gly Leu Pro Gly Val Ala Gly Arg Pro Gly Ala Lys Gly Pro 1505 1510 1515 1520 Glu Gly Pro Pro Gly Pro Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro 1525 1530 1535 Gly Arg Pro Gly Asp Pro Ala Val Val Gly Pro Ala Val Ala Gly Pro 1540 1545 1550 Lys Gly Glu Lys Gly Asp Val Gly Pro Ala Gly Pro Arg Gly Ala Thr 1555 1560 1565 Gly Val Gln Gly Glu Arg Gly Pro Pro Gly Leu Val Leu Pro Gly Asp 1570 1575 1580 Pro Gly Pro Lys Gly Asp Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr 1585 1590 1595 1600 Gly Arg Ala Gly Pro Pro Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly 1605 1610 1615 Asp Pro Gly Arg Pro Gly Pro Pro Gly Pro Val Gly Pro Arg Gly Arg 1620 1625 1630 Asp Gly Glu Val Gly Glu Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro 1635 1640 1645 Gly Leu Pro Gly Lys Ala Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly 1650 1655 1660 Val Arg Gly Pro Val Gly Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu 1665 1670 1675 1680 Asp Gly Arg Asn Gly Ser Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg 1685 1690 1695 Gly Glu Pro Gly Pro Pro Gly Pro Pro Gly Arg Leu Val Asp Thr Gly 1700 1705 1710 Pro Gly Ala Arg Glu Lys Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly 1715 1720 1725 Pro Arg Gly Pro Lys Gly Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu 1730 1735 1740 Arg Gly Ile Glu Gly Phe Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro 1745 1750 1755 1760 Gly Val Arg Gly Pro Ala Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly 1765 1770 1775 Leu Asp Gly Arg Ser Gly Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro 1780 1785 1790 Ser Gly Pro Asn Gly Ala Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp 1795 1800 1805 Gly Leu Pro Gly Leu Arg Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly 1810 1815 1820 Pro Pro Gly Leu Pro Gly Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu 1825 1830 1835 1840 Asn Gly Lys Asn Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys 1845 1850 1855 Gly Glu Lys Gly Asp Ser Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly 1860 1865 1870 Pro Lys Gly Glu Arg Gly Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro 1875 1880 1885 Pro Gly Leu Pro Gly Pro Val Gly Pro Pro Gly Gln Gly Phe Pro Gly 1890 1895 1900 Val Pro Gly Gly Thr Gly Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser 1905 1910 1915 1920 Lys Gly Glu Gln Gly Leu Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro 1925 1930 1935 Gly Ser Val Pro Asn Val Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys 1940 1945 1950 Ala Ser Ala Leu Arg Glu Ile Val Glu Thr Trp Asp Glu Ser Ser Gly 1955 1960 1965 Ser Phe Leu Pro Val Pro Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser 1970 1975 1980 Gly Glu Gln Gly Pro Pro Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly 1985 1990 1995 2000 Glu Arg Gly Leu Lys Gly Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro 2005 2010 2015 Pro Gly Leu Ala Leu Gly Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu 2020 2025 2030 Ala Gly Glu Pro Gly Lys Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala 2035 2040 2045 Gly Gly Val Gly Glu Ala Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly 2050 2055 2060 Glu Lys Gly Glu Arg Gly Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu 2065 2070 2075 2080 Pro Gly Thr Pro Gly Pro Pro Gly Pro Pro Gly Pro Lys Val Ser Val 2085 2090 2095 Asp Glu Pro Gly Pro Gly Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu 2100 2105 2110 Lys Gly Ala Lys Gly Glu Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys 2115 2120 2125 Gly Asp Arg Gly Val Pro Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly 2130 2135 2140 Pro Arg Gly Gln Asp Gly Asn Pro Gly Leu Pro Gly Glu Arg Gly Met 2145 2150 2155 2160 Ala Gly Pro Glu Gly Lys Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro 2165 2170 2175 Gly Pro Val Gly Gly His Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly 2180 2185 2190 Leu Ala Gly Pro Ala Gly Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu 2195 2200 2205 Pro Gly Glu Thr Gly Pro Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly 2210 2215 2220 Ala Val Gly Leu Pro Gly Pro Pro Gly Pro Ser Gly Leu Val Gly Pro 2225 2230 2235 2240 Gln Gly Ser Pro Gly Leu Pro Gly Gln Val Gly Glu Thr Gly Lys Pro 2245 2250 2255 Gly Ala Pro Gly Arg Asp Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly 2260 2265 2270 Ser Pro Gly Val Pro Gly Ser Pro Gly Leu Pro Gly Pro Val Gly Pro 2275 2280 2285 Lys Gly Glu Pro Gly Pro Thr Gly Ala Pro Gly Gln Ala Val Val Gly 2290 2295 2300 Leu Pro Gly Ala Lys Gly Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly 2305 2310 2315 2320 Asp Leu Val Gly Glu Pro Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly 2325 2330 2335 Pro Arg Gly Glu Lys Gly Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp 2340 2345 2350 Pro Gly Glu Asp Gly Gln Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys 2355 2360 2365 Gly Asp Pro Gly Val Gly Val Pro Gly Ser Pro Gly Pro Pro Gly Pro 2370 2375 2380 Pro Gly Val Lys Gly Asp Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro 2385 2390 2395 2400 Gly Val Val Gly Phe Pro Gly Gln Thr Gly Pro Arg Gly Glu Met Gly 2405 2410 2415 Gln Pro Gly Pro Ser Gly Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg 2420 2425 2430 Glu Gly Ile Pro Gly Pro Leu Gly Pro Pro Gly Pro Pro Gly Ser Val 2435 2440 2445 Gly Pro Pro Gly Ala Ser Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly 2450 2455 2460 Val Gly Leu Pro Gly Pro Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg 2465 2470 2475 2480 Gly Glu Asp Gly Arg Pro Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly 2485 2490 2495 Pro Pro Gly Ser Arg Gly Glu Arg Gly Glu Lys Gly Asp Val Gly Ser 2500 2505 2510 Ala Gly Leu Lys Gly Asp Lys Gly Asp Ser Ala Val Ile Leu Gly Pro 2515 2520 2525 Pro Gly Pro Arg Gly Ala Lys Gly Asp Met Gly Glu Arg Gly Pro Arg 2530 2535 2540 Gly Leu Asp Gly Asp Lys Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly 2545 2550 2555 2560 Asp Lys Gly Ser Lys Gly Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu 2565 2570 2575 Pro Gly Leu Arg Gly Leu Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala 2580 2585 2590 Gly Ile Pro Gly Asp Pro Gly Ser Pro Gly Lys Asp Gly Val Pro Gly 2595 2600 2605 Ile Arg Gly Glu Lys Gly Asp Val Gly Phe Met Gly Pro Arg Gly Leu 2610 2615 2620 Lys Gly Glu Arg Gly Val Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys 2625 2630 2635 2640 Gly Asp Lys Gly Glu Ala Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly 2645 2650 2655 His Lys Gly Glu Met Gly Glu Pro Gly Val Pro Gly Gln Ser Gly Ala 2660 2665 2670 Pro Gly Lys Glu Gly Leu Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp 2675 2680 2685 Gly Gln Pro Gly Pro Lys Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly 2690 2695 2700 Thr Pro Gly Ile Gly Gly Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser 2705 2710 2715 2720 Ala Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Arg Gly Pro Glu 2725 2730 2735 Gly Leu Gln Gly Gln Lys Gly Glu Arg Gly Pro Pro Gly Glu Arg Val 2740 2745 2750 Val Gly Ala Pro Gly Val Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln 2755 2760 2765 Gly Arg Pro Gly Pro Ala Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala 2770 2775 2780 Leu Thr Glu Asp Asp Ile Arg Gly Phe Val Arg Gln Glu Met Ser Gln 2785 2790 2795 2800 His Cys Ala Cys Gln Gly Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu 2805 2810 2815 Pro Ser Tyr Ala Ala Asp Thr Ala Gly Ser Gln Leu His Ala Val Pro 2820 2825 2830 Val Leu Arg Val Ser His Ala Glu Glu Glu Glu Arg Val Pro Pro Glu 2835 2840 2845 Asp Asp Glu Tyr Ser Glu Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln 2850 2855 2860 Asp Pro Glu Ala Pro Trp Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu 2865 2870 2875 2880 Asp Glu Gly Ser Cys Thr Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala 2885 2890 2895 Val Thr Gly Ser Thr Glu Ala Cys His Pro Phe Val Tyr Gly Gly Cys 2900 2905 2910 Gly Gly Asn Ala Asn Arg Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg 2915 2920 2925 Cys Pro Pro Arg Val Val Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp 2930 2935 2940 Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala 2945 2950 2955 2960 Gly Asp Val Glu Ser Asn Pro Gly Pro Thr Ser Ser Gly Pro Gly Pro 2965 2970 2975 Arg Phe Leu Leu Leu Leu Pro Leu Leu Leu Pro Pro Ala Ala Ser Ala 2980 2985 2990 Ser Asp Arg Pro Arg Gly Arg Asp Pro Val Asn Pro Glu Lys Leu Leu 2995 3000 3005 Val Ile Thr Val Ala Thr Ala Glu Thr Glu Gly Tyr Leu Arg Phe Leu 3010 3015 3020 Arg Ser Ala Glu Phe Phe Asn Tyr Thr Val Arg Thr Leu Gly Leu Gly 3025 3030 3035 3040 Glu Glu Trp Arg Gly Gly Asp Val Ala Arg Thr Val Gly Gly Gly Gln 3045 3050 3055 Lys Val Arg Trp Leu Lys Lys Glu Met Glu Lys Tyr Ala Asp Arg Glu 3060 3065 3070 Asp Met Ile Ile Met Phe Val Asp Ser Tyr Asp Val Ile Leu Ala Gly 3075 3080 3085 Ser Pro Thr Glu Leu Leu Lys Lys Phe Val Gln Ser Gly Ser Arg Leu 3090 3095 3100 Leu Phe Ser Ala Glu Ser Phe Cys Trp Pro Glu Trp Gly Leu Ala Glu 3105 3110 3115 3120 Gln Tyr Pro Glu Val Gly Thr Gly Lys Arg Phe Leu Asn Ser Gly Gly 3125 3130 3135 Phe Ile Gly Phe Ala Thr Thr Ile His Gln Ile Val Arg Gln Trp Lys 3140 3145 3150 Tyr Lys Asp Asp Asp Asp Asp Gln Leu Phe Tyr Thr Arg Leu Tyr Leu 3155 3160 3165 Asp Pro Gly Leu Arg Glu Lys Leu Ser Leu Asn Leu Asp His Lys Ser 3170 3175 3180 Arg Ile Phe Gln Asn Leu Asn Gly Ala Leu Asp Glu Val Val Leu Lys 3185 3190 3195 3200 Phe Asp Arg Asn Arg Val Arg Ile Arg Asn Val Ala Tyr Asp Thr Leu 3205 3210 3215 Pro Ile Val Val His Gly Asn Gly Pro Thr Lys Leu Gln Leu Asn Tyr 3220 3225 3230 Leu Gly Asn Tyr Val Pro Asn Gly Trp Thr Pro Glu Gly Gly Cys Gly 3235 3240 3245 Phe Cys Asn Gln Asp Arg Arg Thr Leu Pro Gly Gly Gln Pro Pro Pro 3250 3255 3260 Arg Val Phe Leu Ala Val Phe Val Glu Gln Pro Thr Pro Phe Leu Pro 3265 3270 3275 3280 Arg Phe Leu Gln Arg Leu Leu Leu Leu Asp Tyr Pro Pro Asp Arg Val 3285 3290 3295 Thr Leu Phe Leu His Asn Asn Glu Val Phe His Glu Pro His Ile Ala 3300 3305 3310 Asp Ser Trp Pro Gln Leu Gln Asp His Phe Ser Ala Val Lys Leu Val 3315 3320 3325 Gly Pro Glu Glu Ala Leu Ser Pro Gly Glu Ala Arg Asp Met Ala Met 3330 3335 3340 Asp Leu Cys Arg Gln Asp Pro Glu Cys Glu Phe Tyr Phe Ser Leu Asp 3345 3350 3355 3360 Ala Asp Ala Val Leu Thr Asn Leu Gln Thr Leu Arg Ile Leu Ile Glu 3365 3370 3375 Glu Asn Arg Lys Val Ile Ala Pro Met Leu Ser Arg His Gly Lys Leu 3380 3385 3390 Trp Ser Asn Phe Trp Gly Ala Leu Ser Pro Asp Glu Tyr Tyr Ala Arg 3395 3400 3405 Ser Glu Asp Tyr Val Glu Leu Val Gln Arg Lys Arg Val Gly Val Trp 3410 3415 3420 Asn Val Pro Tyr Ile Ser Gln Ala Tyr Val Ile Arg Gly Asp Thr Leu 3425 3430 3435 3440 Arg Met Glu Leu Pro Gln Arg Asp Val Phe Ser Gly Ser Asp Thr Asp 3445 3450 3455 Pro Asp Met Ala Phe Cys Lys Ser Phe Arg Asp Lys Gly Ile Phe Leu 3460 3465 3470 His Leu Ser Asn Gln His Glu Phe Gly Arg Leu Leu Ala Thr Ser Arg 3475 3480 3485 Tyr Asp Thr Glu His Leu His Pro Asp Leu Trp Gln Ile Phe Asp Asn 3490 3495 3500 Pro Val Asp Trp Lys Glu Gln Tyr Ile His Glu Asn Tyr Ser Arg Ala 3505 3510 3515 3520 Leu Glu Gly Glu Gly Ile Val Glu Gln Pro Cys Pro Asp Val Tyr Trp 3525 3530 3535 Phe Pro Leu Leu Ser Glu Gln Met Cys Asp Glu Leu Val Ala Glu Met 3540 3545 3550 Glu His Tyr Gly Gln Trp Ser Gly Gly Arg His Glu Asp Ser Arg Leu 3555 3560 3565 Ala Gly Gly Tyr Glu Asn Val Pro Thr Val Asp Ile His Met Lys Gln 3570 3575 3580 Val Gly Tyr Glu Asp Gln Trp Leu Gln Leu Leu Arg Thr Tyr Val Gly 3585 3590 3595 3600 Pro Met Thr Glu Ser Leu Phe Pro Gly Tyr His Thr Lys Ala Arg Ala 3605 3610 3615 Val Met Asn Phe Val Val Arg Tyr Arg Pro Asp Glu Gln Pro Ser Leu 3620 3625 3630 Arg Pro His His Asp Ser Ser Thr Phe Thr Leu Asn Val Ala Leu Asn 3635 3640 3645 His Lys Gly Leu Asp Tyr Glu Gly Gly Gly Cys Arg Phe Leu Arg Tyr 3650 3655 3660 Asp Cys Val Ile Ser Ser Pro Arg Lys Gly Trp Ala Leu Leu His Pro 3665 3670 3675 3680 Gly Arg Leu Thr His Tyr His Glu Gly Leu Pro Thr Thr Trp Gly Thr 3685 3690 3695 Arg Tyr Ile Met Val Ser Phe Val Asp Pro 3700 3705 <210> 27 <211> 11121 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 27 atgacctcct cggggcctgg accccggttc ctgctgctgc tgccgctgct gctgccccct 60 gcggcctcag cctccgaccg gccccggggc cgagacccgg tcaacccaga gaagctgctg 120 gtgatcactg tggccacagc tgaaaccgag gggtacctgc gtttcctgcg ctctgcggag 180 ttcttcaact acactgtgcg gaccctgggc ctgggagagg agtggcgagg gggtgatgtg 240 gctcgaacag ttggtggagg acagaaggtc cggtggttaa agaaggaaat ggagaaatac 300 gctgaccggg aggatatgat catcatgttt gtggatagct acgacgtgat tctggccggc 360 agccccacag agctgctgaa gaagttcgtc cagagtggca gccgcctgct cttctctgca 420 gagagcttct gctggcccga gtgggggctg gcggagcagt accctgaggt gggcacgggg 480 aagcgcttcc tcaattctgg tggattcatc ggttttgcca ccaccatcca ccaaatcgtg 540 cgccagtgga agtacaagga tgatgacgac gaccagctgt tctacacacg gctctacctg 600 gacccaggac tgagggagaa actcagcctt aatctggatc ataagtctcg gatctttcag 660 aacctcaacg gggctttaga tgaagtggtt ttaaagtttg atcggaaccg tgtgcgtatc 720 cggaacgtgg cctacgacac gctccccatt gtggtccatg gaaacggtcc cactaagctg 780 cagctcaact acctgggaaa ctacgtcccc aatggctgga ctcctgaggg aggctgtggc 840 ttctgcaacc aggaccggag gacactcccg ggggggcagc ctcccccccg ggtgtttctg 900 gccgtgtttg tggaacagcc tactccgttt ctgccccgct tcctgcagcg gctgctactc 960 ctggactatc cccccgacag ggtcaccctt ttcctgcaca acaacgaggt cttccatgaa 1020 ccccacatcg ctgactcctg gccgcagctc caggaccact tctcagctgt gaagctcgtg 1080 gggccggagg aggctctgag cccaggcgag gccagggaca tggccatgga cctgtgtcgg 1140 caggaccccg agtgtgagtt ctacttcagc ctggacgccg acgctgtcct caccaacctg 1200 cagaccctgc gtatcctcat tgaggagaac aggaaggtga tcgcccccat gctgtcccgc 1260 cacggcaagc tgtggtccaa cttctggggc gccctgagcc ccgatgagta ctacgcccgc 1320 tccgaggact acgtggagct ggtgcagcgg aagcgagtgg gtgtgtggaa tgtaccatac 1380 atctcccagg cctatgtgat ccggggtgat accctgcgga tggagctgcc ccagagggat 1440 gtgttctcgg gcagtgacac agacccggac atggccttct gtaagagctt tcgagacaag 1500 ggcatcttcc tccatctgag caatcagcat gaatttggcc ggctcctggc cacttccaga 1560 tacgacacgg agcacctgca ccccgacctc tggcagatct tcgacaaccc cgtcgactgg 1620 aaggagcagt acatccacga gaactacagc cgggccctgg aaggggaagg aatcgtggag 1680 cagccatgcc cggacgtgta ctggttccca ctgctgtcag aacaaatgtg tgatgagctg 1740 gtggcagaga tggagcacta cggccagtgg tcaggcggcc ggcatgagga ttcaaggctg 1800 gctggaggct acgagaatgt gcccaccgtg gacatccaca tgaagcaggt ggggtacgag 1860 gaccagtggc tgcagctgct gcggacgtat gtgggcccca tgaccgagag cctgtttccc 1920 ggttaccaca ccaaggcgcg ggcggtgatg aactttgtgg ttcgctaccg gccagacgag 1980 cagccgtctc tgcggccaca ccacgactca tccaccttca ccctcaacgt tgccctcaac 2040 cacaagggcc tggactatga gggaggtggc tgccgcttcc tgcgctacga ctgtgtgatc 2100 tcctccccga ggaagggctg ggcactcctg caccccggcc gcctcaccca ctaccacgag 2160 gggctgccaa cgacctgggg cacacgctac atcatggtgt cctttgtcga ccccggaagc 2220 ggagtgaaac agactttgaa ttttgacctt ctcaagttgg cgggagacgt ggagtccaac 2280 cctggaccta cgctgcggct tctggtggcc gcgctctgcg ccgggatcct ggcagaggcg 2340 ccccgagtgc gagcccagca cagggagaga gtgacctgca cgcgccttta cgccgctgac 2400 attgtgttct tactggatgg ctcctcatcc attggccgca gcaatttccg cgaggtccgc 2460 agctttctcg aagggctggt gctgcctttc tctggagcag ccagtgcaca gggtgtgcgc 2520 tttgccacag tgcagtacag cgatgaccca cggacagagt tcggcctgga tgcacttggc 2580 tctgggggtg atgtgatccg cgccatccgt gagcttagct acaagggggg caacactcgc 2640 acaggggctg caattctcca tgtggctgac catgtcttcc tgccccagct ggcccgacct 2700 ggtgtcccca aggtctgcat cctgatcaca gacgggaagt cccaggacct ggtggacaca 2760 gctgcccaaa ggctgaaggg gcagggggtc aagctatttg ctgtggggat caagaatgct 2820 gaccctgagg agctgaagcg agttgcctca cagcccacca gtgacttctt cttcttcgtc 2880 aatgacttca gcatcttgag gacactactg cccctcgttt cccggagagt gtgcacgact 2940 gctggtggcg tgcctgtgac ccgacctccg gatgactcga cctctgctcc acgagacctg 3000 gtgctgtctg agccaagcag ccaatccttg agagtacagt ggacagcggc cagtggccct 3060 gtgactggct acaaggtcca gtacactcct ctgacggggc tgggacagcc actgccgagt 3120 gagcggcagg aggtgaacgt cccagctggt gagaccagtg tgcggctgcg gggtctccgg 3180 ccactgaccg agtaccaagt gactgtgatt gccctctacg ccaacagcat cggggaggct 3240 gtgagcggga cagctcggac cactgcccta gaagggccgg aactgaccat ccagaatacc 3300 acagcccaca gcctcctggt ggcctggcgg agtgtgccag gtgccactgg ctaccgtgtg 3360 acatggcggg tcctcagtgg tgggcccaca cagcagcagg agctgggccc tgggcagggt 3420 tcagtgttgc tgcgtgactt ggagcctggc acggactatg aggtgaccgt gagcacccta 3480 tttggccgca gtgtggggcc cgccacttcc ctgatggctc gcactgacgc ttctgttgag 3540 cagaccctgc gcccggtcat cctgggcccc acatccatcc tcctttcctg gaacttggtg 3600 cctgaggccc gtggctaccg gttggaatgg cggcgtgaga ctggcttgga gccaccgcag 3660 aaggtggtac tgccctctga tgtgacccgc taccagttgg atgggctgca gccgggcact 3720 gagtaccgcc tcacactcta cactctgctg gagggccacg aggtggccac ccctgcaacc 3780 gtggttccca ctggaccaga gctgcctgtg agccctgtaa cagacctgca agccaccgag 3840 ctgcccgggc agcgggtgcg agtgtcctgg agcccagtcc ctggtgccac ccagtaccgc 3900 atcattgtgc gcagcaccca gggggttgag cggaccctgg tgcttcctgg gagtcagaca 3960 gcattcgact tggatgacgt tcaggctggg cttagctaca ctgtgcgggt gtctgctcga 4020 gtgggtcccc gtgagggcag tgccagtgtc ctcactgtcc gccgggagcc ggaaactcca 4080 cttgctgttc cagggctgcg ggttgtggtg tcagatgcaa cgcgagtgag ggtggcctgg 4140 ggacccgtcc ctggagccag tggatttcgg attagctgga gcacaggcag tggtccggag 4200 tccagccaga cactgccccc agactctact gccacagaca tcacagggct gcagcctgga 4260 accacctacc aggtggctgt gtcggtactg cgaggcagag aggagggccc tgctgcagtc 4320 atcgtggctc gaacggaccc actgggccca gtgaggacgg tccatgtgac tcaggccagc 4380 agctcatctg tcaccattac ctggaccagg gttcctggcg ccacaggata cagggtttcc 4440 tggcactcag cccacggccc agagaaatcc cagttggttt ctggggaggc cacggtggct 4500 gagctggatg gactggagcc agatactgag tatacggtgc atgtgagggc ccatgtggct 4560 ggcgtggatg ggccccctgc ctctgtggtt gtgaggactg cccctgagcc tgtgggtcgt 4620 gtgtcgaggc tgcagatcct caatgcttcc agcgacgttc tacggatcac ctgggtaggg 4680 gtcactggag ccacagctta cagactggcc tggggccgga gtgaaggcgg ccccatgagg 4740 caccagatac tcccaggaaa cacagactct gcagagatcc ggggtctcga aggtggagtc 4800 agctactcag tgcgagtgac tgcacttgtc ggggaccgcg agggcacacc tgtctccatt 4860 gttgtcacta cgccgcctga ggctccgcca gccctgggga cgcttcacgt ggtgcagcgc 4920 ggggagcact cgctgaggct gcgctgggag ccggtgccca gagcgcaggg cttccttctg 4980 cactggcaac ctgagggtgg ccaggaacag tcccgggtcc tggggcccga gctcagcagc 5040 tatcacctgg acgggctgga gccagcgaca cagtaccgcg tgaggctgag tgtcctaggg 5100 ccagctggag aagggccctc tgcagaggtg actgcgcgca ctgagtcacc tcgtgttcca 5160 agcattgaac tacgtgtggt ggacacctcg atcgactcgg tgactttggc ctggactcca 5220 gtgtccaggg catccagcta catcctatcc tggcggccac tcagaggccc tggccaggaa 5280 gtgcctgggt ccccgcagac acttccaggg atctcaagct cccagcgggt gacagggcta 5340 gagcctggcg tctcttacat cttctccctg acgcctgtcc tggatggtgt gcggggtcct 5400 gaggcatctg tcacacagac gccagtgtgc ccccgtggcc tggcggatgt ggtgttccta 5460 ccacatgcca ctcaagacaa tgctcaccgt gcggaggcta cgaggagggt cctggagcgt 5520 ctggtgttgg cacttgggcc tcttgggcca caggcagttc aggttggcct gctgtcttac 5580 agtcatcggc cctccccact gttcccactg aatggctccc atgaccttgg cattatcttg 5640 caaaggatcc gtgacatgcc ctacatggac ccaagtggga acaacctggg cacagccgtg 5700 gtcacagctc acagatacat gttggcacca gatgctcctg ggcgccgcca gcacgtacca 5760 ggggtgatgg ttctgctagt ggatgaaccc ttgagaggtg acatattcag ccccatccgt 5820 gaggcccagg cttctgggct taatgtggtg atgttgggaa tggctggagc ggacccagag 5880 cagctgcgtc gcttggcgcc gggtatggac tctgtccaga ccttcttcgc cgtggatgat 5940 gggccaagcc tggaccaggc agtcagtggt ctggccacag ccctgtgtca ggcatccttc 6000 actactcagc cccggccaga gccctgccca gtgtattgtc caaagggcca gaagggggaa 6060 cctggagaga tgggcctgag aggacaagtt gggcctcctg gcgaccctgg cctcccgggc 6120 aggaccggtg ctcccggccc ccaggggccc cctggaagtg ccactgccaa gggcgagagg 6180 ggcttccctg gagcagatgg gcgtccaggc agccctggcc gcgccgggaa tcctgggacc 6240 cctggagccc ctggcctaaa gggctctcca gggttgcctg gccctcgtgg ggacccggga 6300 gagcgaggac ctcgaggccc aaagggggag ccgggggctc ccggacaagt catcggaggt 6360 gaaggacctg ggcttcctgg gcggaaaggg gaccctggac catcgggccc ccctggacct 6420 cgtggaccac tgggggaccc aggaccccgt ggccccccag ggcttcctgg aacagccatg 6480 aagggtgaca aaggcgatcg tggggagcgg ggtccccctg gaccaggtga aggtggcatt 6540 gctcctgggg agcctgggct gccgggtctt cccggaagcc ctggacccca aggccccgtt 6600 ggcccccctg gaaagaaagg agaaaaaggt gactctgagg atggagctcc aggcctccca 6660 ggacaacctg ggtctccggg tgagcagggc ccacggggac ctcctggagc tattggcccc 6720 aaaggtgacc ggggctttcc agggcccctg ggtgaggctg gagagaaggg cgaacgtgga 6780 cccccaggcc cagcgggatc ccgggggctg ccaggggttg ctggacgtcc tggagccaag 6840 ggtcctgaag ggccaccagg acccactggc cgccaaggag agaaggggga gcctggtcgc 6900 cctggggacc ctgcagtggt gggacctgct gttgctggac ccaaaggaga aaagggagat 6960 gtggggcccg ctgggcccag aggagctacc ggagtccaag gggaacgggg cccacccggc 7020 ttggttcttc ctggagaccc tggccccaag ggagaccctg gagaccgggg tcccattggc 7080 cttactggca gagcaggacc cccaggtgac tcagggcctc ctggagagaa gggagaccct 7140 gggcggcctg gccccccagg acctgttggc ccccgaggac gagatggtga agttggagag 7200 aaaggtgacg agggtcctcc gggtgacccg ggtttgcctg gaaaagcagg cgagcgtggc 7260 cttcgggggg cacctggagt tcgggggcct gtgggtgaaa agggagacca gggagatcct 7320 ggagaggatg gacgaaatgg cagccctgga tcatctggac ccaagggtga ccgtggggag 7380 ccgggtcccc caggaccccc gggacggctg gtagacacag gacctggagc cagagagaag 7440 ggagagcctg gggaccgcgg acaagagggt cctcgagggc ccaagggtga tcctggcctc 7500 cctggagccc ctggggaaag gggcattgaa gggtttcggg gacccccagg cccacagggg 7560 gacccaggtg tccgaggccc agcaggagaa aagggtgacc ggggtccccc tgggctggat 7620 ggccggagcg gactggatgg gaaaccagga gccgctgggc cctctgggcc gaatggtgct 7680 gcaggcaaag ctggggaccc agggagagac gggcttccag gcctccgtgg agaacagggc 7740 ctccctggcc cctctggtcc ccctggatta ccgggaaagc caggcgagga tggcaaacct 7800 ggcctgaatg gaaaaaacgg agaacctggg gaccctggag aagacgggag gaagggagag 7860 aaaggagatt caggcgcctc tgggagagaa ggtcgtgatg gccccaaggg tgagcgtgga 7920 gctcctggta tccttggacc ccaggggcct ccaggcctcc cagggccagt gggccctcct 7980 ggccagggtt ttcctggtgt cccaggaggc acgggcccca agggtgaccg tggggagact 8040 ggatccaaag gggagcaggg cctccctgga gagcgtggcc tgcgaggaga gcctggaagt 8100 gtgccgaatg tggatcggtt gctggaaact gctggcatca aggcatctgc cctgcgggag 8160 atcgtggaga cctgggatga gagctctggt agcttcctgc ctgtgcccga acggcgtcga 8220 ggccccaagg gggactcagg cgaacagggc cccccaggca aggagggccc catcggcttt 8280 cctggagaac gcgggctgaa gggcgaccgt ggagaccctg gccctcaggg gccacctggt 8340 ctggcccttg gggagagggg cccccccggg ccttccggcc ttgccgggga gcctggaaag 8400 cctggtattc ccgggctccc aggcagggct gggggtgtgg gagaggcagg aaggccagga 8460 gagaggggag aacggggaga gaaaggagaa cgtggagaac agggcagaga tggccctcct 8520 ggactccctg gaacccctgg gccccccgga ccccctggcc ccaaggtgtc tgtggatgag 8580 ccaggtcctg gactctctgg agaacaggga ccccctggac tcaagggtgc taagggggag 8640 ccgggcagca atggtgacca aggtcccaaa ggagacaggg gtgtgccagg catcaaagga 8700 gaccggggag agcctggacc gaggggtcag gacggcaacc cgggtctacc aggagagcgt 8760 ggtatggctg ggcctgaagg gaagccgggt ctgcagggtc caagaggccc ccctggccca 8820 gtgggtggtc atggagaccc tggaccacct ggtgccccgg gtcttgctgg ccctgcagga 8880 ccccaaggac cttctggcct gaagggggag cctggagaga caggacctcc aggacggggc 8940 ctgactggac ctactggagc tgtgggactt cctggacccc ccggcccttc aggccttgtg 9000 ggtccacagg ggtctccagg tttgcctgga caagtggggg agacagggaa gccgggagcc 9060 ccaggtcgag atggtgccag tggaaaagat ggagacagag ggagccctgg tgtgccaggg 9120 tcaccaggtc tgcctggccc tgtcggacct aaaggagaac ctggccccac gggggcccct 9180 ggacaggctg tggtcgggct ccctggagca aagggagaga agggagcccc tggaggcctt 9240 gctggagacc tggtgggtga gccgggagcc aaaggtgacc gaggactgcc agggccgcga 9300 ggcgagaagg gtgaagctgg ccgtgcaggg gagcccggag accctgggga agatggtcag 9360 aaaggggctc caggacccaa aggtttcaag ggtgacccag gagtcggggt cccgggctcc 9420 cctgggcctc ctggccctcc aggtgtgaag ggagatctgg gcctccctgg cctgcccggt 9480 gctcctggtg ttgttgggtt cccgggtcag acaggccctc gaggagagat gggtcagcca 9540 ggccctagtg gagagcgggg tctggcaggc cccccaggga gagaaggaat cccaggaccc 9600 ctggggccac ctggaccacc ggggtcagtg ggaccacctg gggcctctgg actcaaagga 9660 gacaagggag accctggagt agggctgcct gggccccgag gcgagcgtgg ggagccaggc 9720 atccggggtg aagatggccg ccccggccag gagggacccc gaggactcac ggggccccct 9780 ggcagcaggg gagagcgtgg ggagaagggt gatgttggga gtgcaggact aaagggtgac 9840 aagggagact cagctgtgat cctggggcct ccaggcccac ggggtgccaa gggggacatg 9900 ggtgaacgag ggcctcgggg cttggatggt gacaaaggac ctcggggaga caatggggac 9960 cctggtgaca agggcagcaa gggagagcct ggtgacaagg gctcagccgg gttgccagga 10020 ctgcgtggac tcctgggacc ccagggtcaa cctggtgcag cagggatccc tggtgacccg 10080 ggatccccag gaaaggatgg agtgcctggt atccgaggag aaaaaggaga tgttggcttc 10140 atgggtcccc ggggcctcaa gggtgaacgg ggagtgaagg gagcctgtgg ccttgatgga 10200 gagaagggag acaagggaga agctggtccc ccaggccgcc ccgggctggc aggacacaaa 10260 ggagagatgg gggagcctgg tgtgccgggc cagtcggggg cccctggcaa ggagggcctg 10320 atcggtccca agggtgaccg aggctttgac gggcagccag gccccaaggg tgaccagggc 10380 gagaaagggg agcggggaac cccaggaatt gggggcttcc caggccccag tggaaatgat 10440 ggctctgctg gtcccccagg gccacctggc agtgttggtc ccagaggccc cgaaggactt 10500 cagggccaga agggtgagcg aggtcccccc ggagagagag tggtgggggc tcctggggtc 10560 cctggagctc ctggcgagag aggggagcag gggcggccag ggcctgccgg tcctcgaggc 10620 gagaagggag aagctgcact gacggaggat gacatccggg gctttgtgcg ccaagagatg 10680 agtcagcact gtgcctgcca gggccagttc atcgcatctg gatcacgacc cctccctagt 10740 tatgctgcag acactgccgg ctcccagctc catgctgtgc ctgtgctccg cgtctctcat 10800 gcagaggagg aagagcgggt accccctgag gatgatgagt actctgaata ctccgagtat 10860 tctgtggagg agtaccagga ccctgaagct ccttgggata gtgatgaccc ctgttccctg 10920 ccactggatg agggctcctg cactgcctac accctgcgct ggtaccatcg ggctgtgaca 10980 ggcagcacag aggcctgtca cccttttgtc tatggtggct gtggagggaa tgccaaccgt 11040 tttgggaccc gtgaggcctg cgagcgccgc tgcccacccc gggtggtcca gagccagggg 11100 acaggtactg cccaggactg a 11121 <210> 28 <211> 3706 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <400> 28 Met Thr Ser Ser Gly Pro Gly Pro Arg Phe Leu Leu Leu Leu Pro Leu 1 5 10 15 Leu Leu Pro Pro Ala Ala Ser Ala Ser Asp Arg Pro Arg Gly Arg Asp 20 25 30 Pro Val Asn Pro Glu Lys Leu Leu Val Ile Thr Val Ala Thr Ala Glu 35 40 45 Thr Glu Gly Tyr Leu Arg Phe Leu Arg Ser Ala Glu Phe Phe Asn Tyr 50 55 60 Thr Val Arg Thr Leu Gly Leu Gly Glu Glu Trp Arg Gly Gly Asp Val 65 70 75 80 Ala Arg Thr Val Gly Gly Gly Gln Lys Val Arg Trp Leu Lys Lys Glu 85 90 95 Met Glu Lys Tyr Ala Asp Arg Glu Asp Met Ile Ile Met Phe Val Asp 100 105 110 Ser Tyr Asp Val Ile Leu Ala Gly Ser Pro Thr Glu Leu Leu Lys Lys 115 120 125 Phe Val Gln Ser Gly Ser Arg Leu Leu Phe Ser Ala Glu Ser Phe Cys 130 135 140 Trp Pro Glu Trp Gly Leu Ala Glu Gln Tyr Pro Glu Val Gly Thr Gly 145 150 155 160 Lys Arg Phe Leu Asn Ser Gly Gly Phe Ile Gly Phe Ala Thr Thr Ile 165 170 175 His Gln Ile Val Arg Gln Trp Lys Tyr Lys Asp Asp Asp Asp Asp Gln 180 185 190 Leu Phe Tyr Thr Arg Leu Tyr Leu Asp Pro Gly Leu Arg Glu Lys Leu 195 200 205 Ser Leu Asn Leu Asp His Lys Ser Arg Ile Phe Gln Asn Leu Asn Gly 210 215 220 Ala Leu Asp Glu Val Val Leu Lys Phe Asp Arg Asn Arg Val Arg Ile 225 230 235 240 Arg Asn Val Ala Tyr Asp Thr Leu Pro Ile Val Val His Gly Asn Gly 245 250 255 Pro Thr Lys Leu Gln Leu Asn Tyr Leu Gly Asn Tyr Val Pro Asn Gly 260 265 270 Trp Thr Pro Glu Gly Gly Cys Gly Phe Cys Asn Gln Asp Arg Arg Thr 275 280 285 Leu Pro Gly Gly Gln Pro Pro Pro Arg Val Phe Leu Ala Val Phe Val 290 295 300 Glu Gln Pro Thr Pro Phe Leu Pro Arg Phe Leu Gln Arg Leu Leu Leu 305 310 315 320 Leu Asp Tyr Pro Pro Asp Arg Val Thr Leu Phe Leu His Asn Asn Glu 325 330 335 Val Phe His Glu Pro His Ile Ala Asp Ser Trp Pro Gln Leu Gln Asp 340 345 350 His Phe Ser Ala Val Lys Leu Val Gly Pro Glu Glu Ala Leu Ser Pro 355 360 365 Gly Glu Ala Arg Asp Met Ala Met Asp Leu Cys Arg Gln Asp Pro Glu 370 375 380 Cys Glu Phe Tyr Phe Ser Leu Asp Ala Asp Ala Val Leu Thr Asn Leu 385 390 395 400 Gln Thr Leu Arg Ile Leu Ile Glu Glu Asn Arg Lys Val Ile Ala Pro 405 410 415 Met Leu Ser Arg His Gly Lys Leu Trp Ser Asn Phe Trp Gly Ala Leu 420 425 430 Ser Pro Asp Glu Tyr Tyr Ala Arg Ser Glu Asp Tyr Val Glu Leu Val 435 440 445 Gln Arg Lys Arg Val Gly Val Trp Asn Val Pro Tyr Ile Ser Gln Ala 450 455 460 Tyr Val Ile Arg Gly Asp Thr Leu Arg Met Glu Leu Pro Gln Arg Asp 465 470 475 480 Val Phe Ser Gly Ser Asp Thr Asp Pro Asp Met Ala Phe Cys Lys Ser 485 490 495 Phe Arg Asp Lys Gly Ile Phe Leu His Leu Ser Asn Gln His Glu Phe 500 505 510 Gly Arg Leu Leu Ala Thr Ser Arg Tyr Asp Thr Glu His Leu His Pro 515 520 525 Asp Leu Trp Gln Ile Phe Asp Asn Pro Val Asp Trp Lys Glu Gln Tyr 530 535 540 Ile His Glu Asn Tyr Ser Arg Ala Leu Glu Gly Glu Gly Ile Val Glu 545 550 555 560 Gln Pro Cys Pro Asp Val Tyr Trp Phe Pro Leu Leu Ser Glu Gln Met 565 570 575 Cys Asp Glu Leu Val Ala Glu Met Glu His Tyr Gly Gln Trp Ser Gly 580 585 590 Gly Arg His Glu Asp Ser Arg Leu Ala Gly Gly Tyr Glu Asn Val Pro 595 600 605 Thr Val Asp Ile His Met Lys Gln Val Gly Tyr Glu Asp Gln Trp Leu 610 615 620 Gln Leu Leu Arg Thr Tyr Val Gly Pro Met Thr Glu Ser Leu Phe Pro 625 630 635 640 Gly Tyr His Thr Lys Ala Arg Ala Val Met Asn Phe Val Val Arg Tyr 645 650 655 Arg Pro Asp Glu Gln Pro Ser Leu Arg Pro His His Asp Ser Ser Thr 660 665 670 Phe Thr Leu Asn Val Ala Leu Asn His Lys Gly Leu Asp Tyr Glu Gly 675 680 685 Gly Gly Cys Arg Phe Leu Arg Tyr Asp Cys Val Ile Ser Ser Pro Arg 690 695 700 Lys Gly Trp Ala Leu Leu His Pro Gly Arg Leu Thr His Tyr His Glu 705 710 715 720 Gly Leu Pro Thr Thr Trp Gly Thr Arg Tyr Ile Met Val Ser Phe Val 725 730 735 Asp Pro Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys 740 745 750 Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro Thr Leu Arg Leu Leu 755 760 765 Val Ala Ala Leu Cys Ala Gly Ile Leu Ala Glu Ala Pro Arg Val Arg 770 775 780 Ala Gln His Arg Glu Arg Val Thr Cys Thr Arg Leu Tyr Ala Ala Asp 785 790 795 800 Ile Val Phe Leu Leu Asp Gly Ser Ser Ser Ile Gly Arg Ser Asn Phe 805 810 815 Arg Glu Val Arg Ser Phe Leu Glu Gly Leu Val Leu Pro Phe Ser Gly 820 825 830 Ala Ala Ser Ala Gln Gly Val Arg Phe Ala Thr Val Gln Tyr Ser Asp 835 840 845 Asp Pro Arg Thr Glu Phe Gly Leu Asp Ala Leu Gly Ser Gly Gly Asp 850 855 860 Val Ile Arg Ala Ile Arg Glu Leu Ser Tyr Lys Gly Gly Asn Thr Arg 865 870 875 880 Thr Gly Ala Ala Ile Leu His Val Ala Asp His Val Phe Leu Pro Gln 885 890 895 Leu Ala Arg Pro Gly Val Pro Lys Val Cys Ile Leu Ile Thr Asp Gly 900 905 910 Lys Ser Gln Asp Leu Val Asp Thr Ala Ala Gln Arg Leu Lys Gly Gln 915 920 925 Gly Val Lys Leu Phe Ala Val Gly Ile Lys Asn Ala Asp Pro Glu Glu 930 935 940 Leu Lys Arg Val Ala Ser Gln Pro Thr Ser Asp Phe Phe Phe Phe Val 945 950 955 960 Asn Asp Phe Ser Ile Leu Arg Thr Leu Leu Pro Leu Val Ser Arg Arg 965 970 975 Val Cys Thr Thr Ala Gly Gly Val Pro Val Thr Arg Pro Pro Asp Asp 980 985 990 Ser Thr Ser Ala Pro Arg Asp Leu Val Leu Ser Glu Pro Ser Ser Gln 995 1000 1005 Ser Leu Arg Val Gln Trp Thr Ala Ala Ser Gly Pro Val Thr Gly Tyr 1010 1015 1020 Lys Val Gln Tyr Thr Pro Leu Thr Gly Leu Gly Gln Pro Leu Pro Ser 1025 1030 1035 1040 Glu Arg Gln Glu Val Asn Val Pro Ala Gly Glu Thr Ser Val Arg Leu 1045 1050 1055 Arg Gly Leu Arg Pro Leu Thr Glu Tyr Gln Val Thr Val Ile Ala Leu 1060 1065 1070 Tyr Ala Asn Ser Ile Gly Glu Ala Val Ser Gly Thr Ala Arg Thr Thr 1075 1080 1085 Ala Leu Glu Gly Pro Glu Leu Thr Ile Gln Asn Thr Thr Ala His Ser 1090 1095 1100 Leu Leu Val Ala Trp Arg Ser Val Pro Gly Ala Thr Gly Tyr Arg Val 1105 1110 1115 1120 Thr Trp Arg Val Leu Ser Gly Gly Pro Thr Gln Gln Gln Glu Leu Gly 1125 1130 1135 Pro Gly Gln Gly Ser Val Leu Leu Arg Asp Leu Glu Pro Gly Thr Asp 1140 1145 1150 Tyr Glu Val Thr Val Ser Thr Leu Phe Gly Arg Ser Val Gly Pro Ala 1155 1160 1165 Thr Ser Leu Met Ala Arg Thr Asp Ala Ser Val Glu Gln Thr Leu Arg 1170 1175 1180 Pro Val Ile Leu Gly Pro Thr Ser Ile Leu Leu Ser Trp Asn Leu Val 1185 1190 1195 1200 Pro Glu Ala Arg Gly Tyr Arg Leu Glu Trp Arg Arg Glu Thr Gly Leu 1205 1210 1215 Glu Pro Pro Gln Lys Val Val Leu Pro Ser Asp Val Thr Arg Tyr Gln 1220 1225 1230 Leu Asp Gly Leu Gln Pro Gly Thr Glu Tyr Arg Leu Thr Leu Tyr Thr 1235 1240 1245 Leu Leu Glu Gly His Glu Val Ala Thr Pro Ala Thr Val Val Pro Thr 1250 1255 1260 Gly Pro Glu Leu Pro Val Ser Pro Val Thr Asp Leu Gln Ala Thr Glu 1265 1270 1275 1280 Leu Pro Gly Gln Arg Val Arg Val Ser Trp Ser Pro Val Pro Gly Ala 1285 1290 1295 Thr Gln Tyr Arg Ile Ile Val Arg Ser Thr Gln Gly Val Glu Arg Thr 1300 1305 1310 Leu Val Leu Pro Gly Ser Gln Thr Ala Phe Asp Leu Asp Asp Val Gln 1315 1320 1325 Ala Gly Leu Ser Tyr Thr Val Arg Val Ser Ala Arg Val Gly Pro Arg 1330 1335 1340 Glu Gly Ser Ala Ser Val Leu Thr Val Arg Arg Glu Pro Glu Thr Pro 1345 1350 1355 1360 Leu Ala Val Pro Gly Leu Arg Val Val Val Ser Asp Ala Thr Arg Val 1365 1370 1375 Arg Val Ala Trp Gly Pro Val Pro Gly Ala Ser Gly Phe Arg Ile Ser 1380 1385 1390 Trp Ser Thr Gly Ser Gly Pro Glu Ser Ser Gln Thr Leu Pro Pro Asp 1395 1400 1405 Ser Thr Ala Thr Asp Ile Thr Gly Leu Gln Pro Gly Thr Thr Tyr Gln 1410 1415 1420 Val Ala Val Ser Val Leu Arg Gly Arg Glu Glu Gly Pro Ala Ala Val 1425 1430 1435 1440 Ile Val Ala Arg Thr Asp Pro Leu Gly Pro Val Arg Thr Val His Val 1445 1450 1455 Thr Gln Ala Ser Ser Ser Ser Val Thr Ile Thr Trp Thr Arg Val Pro 1460 1465 1470 Gly Ala Thr Gly Tyr Arg Val Ser Trp His Ser Ala His Gly Pro Glu 1475 1480 1485 Lys Ser Gln Leu Val Ser Gly Glu Ala Thr Val Ala Glu Leu Asp Gly 1490 1495 1500 Leu Glu Pro Asp Thr Glu Tyr Thr Val His Val Arg Ala His Val Ala 1505 1510 1515 1520 Gly Val Asp Gly Pro Pro Ala Ser Val Val Val Arg Thr Ala Pro Glu 1525 1530 1535 Pro Val Gly Arg Val Ser Arg Leu Gln Ile Leu Asn Ala Ser Ser Asp 1540 1545 1550 Val Leu Arg Ile Thr Trp Val Gly Val Thr Gly Ala Thr Ala Tyr Arg 1555 1560 1565 Leu Ala Trp Gly Arg Ser Glu Gly Gly Pro Met Arg His Gln Ile Leu 1570 1575 1580 Pro Gly Asn Thr Asp Ser Ala Glu Ile Arg Gly Leu Glu Gly Gly Val 1585 1590 1595 1600 Ser Tyr Ser Val Arg Val Thr Ala Leu Val Gly Asp Arg Glu Gly Thr 1605 1610 1615 Pro Val Ser Ile Val Val Thr Thr Pro Pro Glu Ala Pro Pro Ala Leu 1620 1625 1630 Gly Thr Leu His Val Val Gln Arg Gly Glu His Ser Leu Arg Leu Arg 1635 1640 1645 Trp Glu Pro Val Pro Arg Ala Gln Gly Phe Leu Leu His Trp Gln Pro 1650 1655 1660 Glu Gly Gly Gln Glu Gln Ser Arg Val Leu Gly Pro Glu Leu Ser Ser 1665 1670 1675 1680 Tyr His Leu Asp Gly Leu Glu Pro Ala Thr Gln Tyr Arg Val Arg Leu 1685 1690 1695 Ser Val Leu Gly Pro Ala Gly Glu Gly Pro Ser Ala Glu Val Thr Ala 1700 1705 1710 Arg Thr Glu Ser Pro Arg Val Pro Ser Ile Glu Leu Arg Val Val Asp 1715 1720 1725 Thr Ser Ile Asp Ser Val Thr Leu Ala Trp Thr Pro Val Ser Arg Ala 1730 1735 1740 Ser Ser Tyr Ile Leu Ser Trp Arg Pro Leu Arg Gly Pro Gly Gln Glu 1745 1750 1755 1760 Val Pro Gly Ser Pro Gln Thr Leu Pro Gly Ile Ser Ser Ser Gln Arg 1765 1770 1775 Val Thr Gly Leu Glu Pro Gly Val Ser Tyr Ile Phe Ser Leu Thr Pro 1780 1785 1790 Val Leu Asp Gly Val Arg Gly Pro Glu Ala Ser Val Thr Gln Thr Pro 1795 1800 1805 Val Cys Pro Arg Gly Leu Ala Asp Val Val Phe Leu Pro His Ala Thr 1810 1815 1820 Gln Asp Asn Ala His Arg Ala Glu Ala Thr Arg Arg Val Leu Glu Arg 1825 1830 1835 1840 Leu Val Leu Ala Leu Gly Pro Leu Gly Pro Gln Ala Val Gln Val Gly 1845 1850 1855 Leu Leu Ser Tyr Ser His Arg Pro Ser Pro Leu Phe Pro Leu Asn Gly 1860 1865 1870 Ser His Asp Leu Gly Ile Ile Leu Gln Arg Ile Arg Asp Met Pro Tyr 1875 1880 1885 Met Asp Pro Ser Gly Asn Asn Leu Gly Thr Ala Val Val Thr Ala His 1890 1895 1900 Arg Tyr Met Leu Ala Pro Asp Ala Pro Gly Arg Arg Gln His Val Pro 1905 1910 1915 1920 Gly Val Met Val Leu Leu Val Asp Glu Pro Leu Arg Gly Asp Ile Phe 1925 1930 1935 Ser Pro Ile Arg Glu Ala Gln Ala Ser Gly Leu Asn Val Val Met Leu 1940 1945 1950 Gly Met Ala Gly Ala Asp Pro Glu Gln Leu Arg Arg Leu Ala Pro Gly 1955 1960 1965 Met Asp Ser Val Gln Thr Phe Phe Ala Val Asp Asp Gly Pro Ser Leu 1970 1975 1980 Asp Gln Ala Val Ser Gly Leu Ala Thr Ala Leu Cys Gln Ala Ser Phe 1985 1990 1995 2000 Thr Thr Gln Pro Arg Pro Glu Pro Cys Pro Val Tyr Cys Pro Lys Gly 2005 2010 2015 Gln Lys Gly Glu Pro Gly Glu Met Gly Leu Arg Gly Gln Val Gly Pro 2020 2025 2030 Pro Gly Asp Pro Gly Leu Pro Gly Arg Thr Gly Ala Pro Gly Pro Gln 2035 2040 2045 Gly Pro Pro Gly Ser Ala Thr Ala Lys Gly Glu Arg Gly Phe Pro Gly 2050 2055 2060 Ala Asp Gly Arg Pro Gly Ser Pro Gly Arg Ala Gly Asn Pro Gly Thr 2065 2070 2075 2080 Pro Gly Ala Pro Gly Leu Lys Gly Ser Pro Gly Leu Pro Gly Pro Arg 2085 2090 2095 Gly Asp Pro Gly Glu Arg Gly Pro Arg Gly Pro Lys Gly Glu Pro Gly 2100 2105 2110 Ala Pro Gly Gln Val Ile Gly Gly Glu Gly Pro Gly Leu Pro Gly Arg 2115 2120 2125 Lys Gly Asp Pro Gly Pro Ser Gly Pro Pro Gly Pro Arg Gly Pro Leu 2130 2135 2140 Gly Asp Pro Gly Pro Arg Gly Pro Pro Gly Leu Pro Gly Thr Ala Met 2145 2150 2155 2160 Lys Gly Asp Lys Gly Asp Arg Gly Glu Arg Gly Pro Pro Gly Pro Gly 2165 2170 2175 Glu Gly Gly Ile Ala Pro Gly Glu Pro Gly Leu Pro Gly Leu Pro Gly 2180 2185 2190 Ser Pro Gly Pro Gln Gly Pro Val Gly Pro Pro Gly Lys Lys Gly Glu 2195 2200 2205 Lys Gly Asp Ser Glu Asp Gly Ala Pro Gly Leu Pro Gly Gln Pro Gly 2210 2215 2220 Ser Pro Gly Glu Gln Gly Pro Arg Gly Pro Pro Gly Ala Ile Gly Pro 2225 2230 2235 2240 Lys Gly Asp Arg Gly Phe Pro Gly Pro Leu Gly Glu Ala Gly Glu Lys 2245 2250 2255 Gly Glu Arg Gly Pro Pro Gly Pro Ala Gly Ser Arg Gly Leu Pro Gly 2260 2265 2270 Val Ala Gly Arg Pro Gly Ala Lys Gly Pro Glu Gly Pro Pro Gly Pro 2275 2280 2285 Thr Gly Arg Gln Gly Glu Lys Gly Glu Pro Gly Arg Pro Gly Asp Pro 2290 2295 2300 Ala Val Val Gly Pro Ala Val Ala Gly Pro Lys Gly Glu Lys Gly Asp 2305 2310 2315 2320 Val Gly Pro Ala Gly Pro Arg Gly Ala Thr Gly Val Gln Gly Glu Arg 2325 2330 2335 Gly Pro Pro Gly Leu Val Leu Pro Gly Asp Pro Gly Pro Lys Gly Asp 2340 2345 2350 Pro Gly Asp Arg Gly Pro Ile Gly Leu Thr Gly Arg Ala Gly Pro Pro 2355 2360 2365 Gly Asp Ser Gly Pro Pro Gly Glu Lys Gly Asp Pro Gly Arg Pro Gly 2370 2375 2380 Pro Pro Gly Pro Val Gly Pro Arg Gly Arg Asp Gly Glu Val Gly Glu 2385 2390 2395 2400 Lys Gly Asp Glu Gly Pro Pro Gly Asp Pro Gly Leu Pro Gly Lys Ala 2405 2410 2415 Gly Glu Arg Gly Leu Arg Gly Ala Pro Gly Val Arg Gly Pro Val Gly 2420 2425 2430 Glu Lys Gly Asp Gln Gly Asp Pro Gly Glu Asp Gly Arg Asn Gly Ser 2435 2440 2445 Pro Gly Ser Ser Gly Pro Lys Gly Asp Arg Gly Glu Pro Gly Pro Pro 2450 2455 2460 Gly Pro Pro Gly Arg Leu Val Asp Thr Gly Pro Gly Ala Arg Glu Lys 2465 2470 2475 2480 Gly Glu Pro Gly Asp Arg Gly Gln Glu Gly Pro Arg Gly Pro Lys Gly 2485 2490 2495 Asp Pro Gly Leu Pro Gly Ala Pro Gly Glu Arg Gly Ile Glu Gly Phe 2500 2505 2510 Arg Gly Pro Pro Gly Pro Gln Gly Asp Pro Gly Val Arg Gly Pro Ala 2515 2520 2525 Gly Glu Lys Gly Asp Arg Gly Pro Pro Gly Leu Asp Gly Arg Ser Gly 2530 2535 2540 Leu Asp Gly Lys Pro Gly Ala Ala Gly Pro Ser Gly Pro Asn Gly Ala 2545 2550 2555 2560 Ala Gly Lys Ala Gly Asp Pro Gly Arg Asp Gly Leu Pro Gly Leu Arg 2565 2570 2575 Gly Glu Gln Gly Leu Pro Gly Pro Ser Gly Pro Pro Gly Leu Pro Gly 2580 2585 2590 Lys Pro Gly Glu Asp Gly Lys Pro Gly Leu Asn Gly Lys Asn Gly Glu 2595 2600 2605 Pro Gly Asp Pro Gly Glu Asp Gly Arg Lys Gly Glu Lys Gly Asp Ser 2610 2615 2620 Gly Ala Ser Gly Arg Glu Gly Arg Asp Gly Pro Lys Gly Glu Arg Gly 2625 2630 2635 2640 Ala Pro Gly Ile Leu Gly Pro Gln Gly Pro Pro Gly Leu Pro Gly Pro 2645 2650 2655 Val Gly Pro Pro Gly Gln Gly Phe Pro Gly Val Pro Gly Gly Thr Gly 2660 2665 2670 Pro Lys Gly Asp Arg Gly Glu Thr Gly Ser Lys Gly Glu Gln Gly Leu 2675 2680 2685 Pro Gly Glu Arg Gly Leu Arg Gly Glu Pro Gly Ser Val Pro Asn Val 2690 2695 2700 Asp Arg Leu Leu Glu Thr Ala Gly Ile Lys Ala Ser Ala Leu Arg Glu 2705 2710 2715 2720 Ile Val Glu Thr Trp Asp Glu Ser Ser Gly Ser Phe Leu Pro Val Pro 2725 2730 2735 Glu Arg Arg Arg Gly Pro Lys Gly Asp Ser Gly Glu Gln Gly Pro Pro 2740 2745 2750 Gly Lys Glu Gly Pro Ile Gly Phe Pro Gly Glu Arg Gly Leu Lys Gly 2755 2760 2765 Asp Arg Gly Asp Pro Gly Pro Gln Gly Pro Pro Gly Leu Ala Leu Gly 2770 2775 2780 Glu Arg Gly Pro Pro Gly Pro Ser Gly Leu Ala Gly Glu Pro Gly Lys 2785 2790 2795 2800 Pro Gly Ile Pro Gly Leu Pro Gly Arg Ala Gly Gly Val Gly Glu Ala 2805 2810 2815 Gly Arg Pro Gly Glu Arg Gly Glu Arg Gly Glu Lys Gly Glu Arg Gly 2820 2825 2830 Glu Gln Gly Arg Asp Gly Pro Pro Gly Leu Pro Gly Thr Pro Gly Pro 2835 2840 2845 Pro Gly Pro Pro Gly Pro Lys Val Ser Val Asp Glu Pro Gly Pro Gly 2850 2855 2860 Leu Ser Gly Glu Gln Gly Pro Pro Gly Leu Lys Gly Ala Lys Gly Glu 2865 2870 2875 2880 Pro Gly Ser Asn Gly Asp Gln Gly Pro Lys Gly Asp Arg Gly Val Pro 2885 2890 2895 Gly Ile Lys Gly Asp Arg Gly Glu Pro Gly Pro Arg Gly Gln Asp Gly 2900 2905 2910 Asn Pro Gly Leu Pro Gly Glu Arg Gly Met Ala Gly Pro Glu Gly Lys 2915 2920 2925 Pro Gly Leu Gln Gly Pro Arg Gly Pro Pro Gly Pro Val Gly Gly His 2930 2935 2940 Gly Asp Pro Gly Pro Pro Gly Ala Pro Gly Leu Ala Gly Pro Ala Gly 2945 2950 2955 2960 Pro Gln Gly Pro Ser Gly Leu Lys Gly Glu Pro Gly Glu Thr Gly Pro 2965 2970 2975 Pro Gly Arg Gly Leu Thr Gly Pro Thr Gly Ala Val Gly Leu Pro Gly 2980 2985 2990 Pro Pro Gly Pro Ser Gly Leu Val Gly Pro Gln Gly Ser Pro Gly Leu 2995 3000 3005 Pro Gly Gln Val Gly Glu Thr Gly Lys Pro Gly Ala Pro Gly Arg Asp 3010 3015 3020 Gly Ala Ser Gly Lys Asp Gly Asp Arg Gly Ser Pro Gly Val Pro Gly 3025 3030 3035 3040 Ser Pro Gly Leu Pro Gly Pro Val Gly Pro Lys Gly Glu Pro Gly Pro 3045 3050 3055 Thr Gly Ala Pro Gly Gln Ala Val Val Gly Leu Pro Gly Ala Lys Gly 3060 3065 3070 Glu Lys Gly Ala Pro Gly Gly Leu Ala Gly Asp Leu Val Gly Glu Pro 3075 3080 3085 Gly Ala Lys Gly Asp Arg Gly Leu Pro Gly Pro Arg Gly Glu Lys Gly 3090 3095 3100 Glu Ala Gly Arg Ala Gly Glu Pro Gly Asp Pro Gly Glu Asp Gly Gln 3105 3110 3115 3120 Lys Gly Ala Pro Gly Pro Lys Gly Phe Lys Gly Asp Pro Gly Val Gly 3125 3130 3135 Val Pro Gly Ser Pro Gly Pro Pro Gly Pro Pro Gly Val Lys Gly Asp 3140 3145 3150 Leu Gly Leu Pro Gly Leu Pro Gly Ala Pro Gly Val Val Gly Phe Pro 3155 3160 3165 Gly Gln Thr Gly Pro Arg Gly Glu Met Gly Gln Pro Gly Pro Ser Gly 3170 3175 3180 Glu Arg Gly Leu Ala Gly Pro Pro Gly Arg Glu Gly Ile Pro Gly Pro 3185 3190 3195 3200 Leu Gly Pro Pro Gly Pro Pro Gly Ser Val Gly Pro Pro Gly Ala Ser 3205 3210 3215 Gly Leu Lys Gly Asp Lys Gly Asp Pro Gly Val Gly Leu Pro Gly Pro 3220 3225 3230 Arg Gly Glu Arg Gly Glu Pro Gly Ile Arg Gly Glu Asp Gly Arg Pro 3235 3240 3245 Gly Gln Glu Gly Pro Arg Gly Leu Thr Gly Pro Pro Gly Ser Arg Gly 3250 3255 3260 Glu Arg Gly Glu Lys Gly Asp Val Gly Ser Ala Gly Leu Lys Gly Asp 3265 3270 3275 3280 Lys Gly Asp Ser Ala Val Ile Leu Gly Pro Pro Gly Pro Arg Gly Ala 3285 3290 3295 Lys Gly Asp Met Gly Glu Arg Gly Pro Arg Gly Leu Asp Gly Asp Lys 3300 3305 3310 Gly Pro Arg Gly Asp Asn Gly Asp Pro Gly Asp Lys Gly Ser Lys Gly 3315 3320 3325 Glu Pro Gly Asp Lys Gly Ser Ala Gly Leu Pro Gly Leu Arg Gly Leu 3330 3335 3340 Leu Gly Pro Gln Gly Gln Pro Gly Ala Ala Gly Ile Pro Gly Asp Pro 3345 3350 3355 3360 Gly Ser Pro Gly Lys Asp Gly Val Pro Gly Ile Arg Gly Glu Lys Gly 3365 3370 3375 Asp Val Gly Phe Met Gly Pro Arg Gly Leu Lys Gly Glu Arg Gly Val 3380 3385 3390 Lys Gly Ala Cys Gly Leu Asp Gly Glu Lys Gly Asp Lys Gly Glu Ala 3395 3400 3405 Gly Pro Pro Gly Arg Pro Gly Leu Ala Gly His Lys Gly Glu Met Gly 3410 3415 3420 Glu Pro Gly Val Pro Gly Gln Ser Gly Ala Pro Gly Lys Glu Gly Leu 3425 3430 3435 3440 Ile Gly Pro Lys Gly Asp Arg Gly Phe Asp Gly Gln Pro Gly Pro Lys 3445 3450 3455 Gly Asp Gln Gly Glu Lys Gly Glu Arg Gly Thr Pro Gly Ile Gly Gly 3460 3465 3470 Phe Pro Gly Pro Ser Gly Asn Asp Gly Ser Ala Gly Pro Pro Gly Pro 3475 3480 3485 Pro Gly Ser Val Gly Pro Arg Gly Pro Glu Gly Leu Gln Gly Gln Lys 3490 3495 3500 Gly Glu Arg Gly Pro Pro Gly Glu Arg Val Val Gly Ala Pro Gly Val 3505 3510 3515 3520 Pro Gly Ala Pro Gly Glu Arg Gly Glu Gln Gly Arg Pro Gly Pro Ala 3525 3530 3535 Gly Pro Arg Gly Glu Lys Gly Glu Ala Ala Leu Thr Glu Asp Asp Ile 3540 3545 3550 Arg Gly Phe Val Arg Gln Glu Met Ser Gln His Cys Ala Cys Gln Gly 3555 3560 3565 Gln Phe Ile Ala Ser Gly Ser Arg Pro Leu Pro Ser Tyr Ala Ala Asp 3570 3575 3580 Thr Ala Gly Ser Gln Leu His Ala Val Pro Val Leu Arg Val Ser His 3585 3590 3595 3600 Ala Glu Glu Glu Glu Arg Val Pro Pro Glu Asp Asp Glu Tyr Ser Glu 3605 3610 3615 Tyr Ser Glu Tyr Ser Val Glu Glu Tyr Gln Asp Pro Glu Ala Pro Trp 3620 3625 3630 Asp Ser Asp Asp Pro Cys Ser Leu Pro Leu Asp Glu Gly Ser Cys Thr 3635 3640 3645 Ala Tyr Thr Leu Arg Trp Tyr His Arg Ala Val Thr Gly Ser Thr Glu 3650 3655 3660 Ala Cys His Pro Phe Val Tyr Gly Gly Cys Gly Gly Asn Ala Asn Arg 3665 3670 3675 3680 Phe Gly Thr Arg Glu Ala Cys Glu Arg Arg Cys Pro Pro Arg Val Val 3685 3690 3695 Gln Ser Gln Gly Thr Gly Thr Ala Gln Asp 3700 3705 <210> 29 <211> 1299 <212> DNA <213> Homo sapiens <400> 29 atgaccacct ccatccgcca gttcacctcc tccagctcca tcaagggctc ctccggcctg 60 gggggcggct cgtcccgcac ctcctgccgg ctgtctggcg gcctgggtgc cggctcctgc 120 aggctgggat ctgctggcgg cctgggcagc accctcgggg gtagcagcta ctccagctgc 180 tacagctttg gctctggtgg tggctatggc agcagctttg ggggtgttga tgggctgctg 240 gctggaggtg agaaggccac catgcagaac ctcaatgacc gcctggcctc ctacctggac 300 aaggtgcgtg ccctggagga ggccaacact gagctggagg tgaagatccg tgactggtac 360 cagaggcagg ccccggggcc cgcccgtgac tacagccagt actacaggac aattgaggag 420 ctgcagaaca agatcctcac agccaccgtg gacaatgcca acatcctgct acagattgac 480 aatgcccgtc tggctgctga tgacttccgc accaagtttg agacagagca ggccctgcgc 540 ctgagtgtgg aggccgacat caatggcctg cgcagggtgc tggatgagct gaccctggcc 600 agagccgacc tggagatgca gattgagaac ctcaaggagg agctggccta cctgaagaag 660 aaccacgagg aggagatgaa cgccctgcga ggccaggtgg gtggtgagat caatgtggag 720 atggacgctg ccccaggcgt ggacctgagc cgcatcctca acgagatgcg tgaccagtat 780 gagaagatgg cagagaagaa ccgcaaggat gccgaggatt ggttcttcag caagacagag 840 gaactgaacc gcgaggtggc caccaacagt gagctggtgc agagtggcaa gagtgagatc 900 tcggagctcc ggcgcaccat gcaggccttg gagatagagc tgcagtccca gctcagcatg 960 aaagcatccc tggagggcaa cctggcggag acagagaacc gctactgcgt gcagctgtcc 1020 cagatccagg ggctgattgg cagcgtggag gagcagctgg cccagcttcg ctgcgagatg 1080 gagcagcaga accaggaata caaaatcctg ctggatgtga agacgcggct ggagcaggag 1140 attgccacct accgccgcct gctggaggga gaggatgccc acctgactca gtacaagaaa 1200 gaaccggtga ccacccgtca ggtgcgtacc attgtggaag aggtccagga tggcaaggtc 1260 atctcctccc gcgagcaggt ccaccagacc acccgctga 1299 <210> 30 <211> 432 <212> PRT <213> Homo sapiens <400> 30 Met Thr Thr Ser Ile Arg Gln Phe Thr Ser Ser Ser Ser Ile Lys Gly 1 5 10 15 Ser Ser Gly Leu Gly Gly Gly Ser Ser Arg Thr Ser Cys Arg Leu Ser 20 25 30 Gly Gly Leu Gly Ala Gly Ser Cys Arg Leu Gly Ser Ala Gly Gly Leu 35 40 45 Gly Ser Thr Leu Gly Gly Ser Ser Tyr Ser Ser Cys Tyr Ser Phe Gly 50 55 60 Ser Gly Gly Gly Tyr Gly Ser Ser Phe Gly Gly Val Asp Gly Leu Leu 65 70 75 80 Ala Gly Gly Glu Lys Ala Thr Met Gln Asn Leu Asn Asp Arg Leu Ala 85 90 95 Ser Tyr Leu Asp Lys Val Arg Ala Leu Glu Glu Ala Asn Thr Glu Leu 100 105 110 Glu Val Lys Ile Arg Asp Trp Tyr Gln Arg Gln Ala Pro Gly Pro Ala 115 120 125 Arg Asp Tyr Ser Gln Tyr Tyr Arg Thr Ile Glu Glu Leu Gln Asn Lys 130 135 140 Ile Leu Thr Ala Thr Val Asp Asn Ala Asn Ile Leu Leu Gln Ile Asp 145 150 155 160 Asn Ala Arg Leu Ala Ala Asp Asp Phe Arg Thr Lys Phe Glu Thr Glu 165 170 175 Gln Ala Leu Arg Leu Ser Val Glu Ala Asp Ile Asn Gly Leu Arg Arg 180 185 190 Val Leu Asp Glu Leu Thr Leu Ala Arg Ala Asp Leu Glu Met Gln Ile 195 200 205 Glu Asn Leu Lys Glu Glu Leu Ala Tyr Leu Lys Lys Asn His Glu Glu 210 215 220 Glu Met Asn Ala Leu Arg Gly Gln Val Gly Gly Glu Ile Asn Val Glu 225 230 235 240 Met Asp Ala Ala Pro Gly Val Asp Leu Ser Arg Ile Leu Asn Glu Met 245 250 255 Arg Asp Gln Tyr Glu Lys Met Ala Glu Lys Asn Arg Lys Asp Ala Glu 260 265 270 Asp Trp Phe Phe Ser Lys Thr Glu Glu Leu Asn Arg Glu Val Ala Thr 275 280 285 Asn Ser Glu Leu Val Gln Ser Gly Lys Ser Glu Ile Ser Glu Leu Arg 290 295 300 Arg Thr Met Gln Ala Leu Glu Ile Glu Leu Gln Ser Gln Leu Ser Met 305 310 315 320 Lys Ala Ser Leu Glu Gly Asn Leu Ala Glu Thr Glu Asn Arg Tyr Cys 325 330 335 Val Gln Leu Ser Gln Ile Gln Gly Leu Ile Gly Ser Val Glu Glu Gln 340 345 350 Leu Ala Gln Leu Arg Cys Glu Met Glu Gln Gln Asn Gln Glu Tyr Lys 355 360 365 Ile Leu Leu Asp Val Lys Thr Arg Leu Glu Gln Glu Ile Ala Thr Tyr 370 375 380 Arg Arg Leu Leu Glu Gly Glu Asp Ala His Leu Thr Gln Tyr Lys Lys 385 390 395 400 Glu Pro Val Thr Thr Arg Gln Val Arg Thr Ile Val Glu Glu Val Gln 405 410 415 Asp Gly Lys Val Ile Ser Ser Arg Glu Gln Val His Gln Thr Thr Arg 420 425 430

Claims (251)

  1. 약제학적 조성물로서,
    a) 벡터를 포함하는 바이러스로서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함하는, 상기 바이러스; 및
    b) 약제학적으로 허용 가능한 담체를 포함하는, 약제학적 조성물.
  2. 제1항에 있어서, 상기 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스인, 약제학적 조성물.
  3. 제1항에 있어서, 상기 바이러스는 단순 포진 바이러스(HSV)인, 약제학적 조성물.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 바이러스는 복제-결함성인, 약제학적 조성물.
  5. 제3항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 약제학적 조성물.
  6. 제3항에 있어서, 상기 단순 포진 바이러스는 변형된 외피를 포함하는, 약제학적 조성물.
  7. 제6항에 있어서, 상기 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시키는, 약제학적 조성물.
  8. 제6항에 있어서, 상기 변형된 외피는 돌연변이 단순 포진 바이러스 당단백질을 포함하는, 약제학적 조성물.
  9. 제1항에 있어서, 상기 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘인, 약제학적 조성물.
  10. 제9항에 있어서, 상기 HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘(Sleeping Beauty hybrid amplicon)인, 약제학적 조성물.
  11. 제1항에 있어서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 약제학적 조성물.
  12. 제11항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 약제학적 조성물.
  13. 제11항 또는 제12항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에서 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  14. 제13항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 약제학적 조성물.
  15. 제11항 내지 제14항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  16. 제11항 내지 제14항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  17. 제15항 또는 제16항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  18. 제15항 내지 제17항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  19. 제15항 내지 제18항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  20. 제15항 내지 제18항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 약제학적 조성물.
  21. 제15항 내지 제20항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 약제학적 조성물.
  22. 제11항 내지 제21항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 약제학적 조성물.
  23. 제11항 내지 제22항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
  24. 제11항 내지 제23항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
  25. 제11항 내지 제24항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
  26. 제1항에 있어서, 상기 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능한, 약제학적 조성물.
  27. 제1항에 있어서, 상기 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합한, 약제학적 조성물.
  28. 제1항에 있어서, 상기 하나 이상의 전이유전자는 miRNA 결합 부위를 포함하는, 약제학적 조성물.
  29. 제1항에 있어서, 상기 하나 이상의 전이유전자는 하나 이상의 이종 촉진자에 작동 가능하게 연결되는, 약제학적 조성물.
  30. 제29항에 있어서, 상기 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물로 이루어진 군으로부터 선택되는, 약제학적 조성물.
  31. 제1항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 약제학적 조성물.
  32. 제1항에 있어서, 상기 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는, 약제학적 조성물.
  33. 제1항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
  34. 제1항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 상기 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
  35. 제1항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
  36. 제1항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
  37. 제1항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
  38. 제1항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 상기 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
  39. 제1항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
  40. 제1항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현된 경우 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
  41. 제1항에 있어서, 상기 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함하는, 약제학적 조성물.
  42. 제41항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는, 약제학적 조성물.
  43. 제1항에 있어서, 상기 벡터는 다시스트론성(polycistronic)인 전이유전자를 포함하는, 약제학적 조성물.
  44. 제43항에 있어서, 상기 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(open reading frame: ORF) 상에서 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화하는, 약제학적 조성물.
  45. 제44항에 있어서, 상기 제1 및 제2 ORF는 내부 리보솜 유입 부위(internal ribosomal entry site: IRES)에 의해 분리되는, 약제학적 조성물.
  46. 제42항 내지 제45항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 약 등몰비로 있는, 약제학적 조성물.
  47. 제42항 내지 제45항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대, 및/또는 보충시키는, 약제학적 조성물.
  48. 제1항에 있어서, 상기 키메라 폴리펩타이드는 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드와 상기 라이실 하이드록실라제 3 폴리펩타이드 사이에 링커 폴리펩타이드를 포함하는, 약제학적 조성물.
  49. 제48항에 있어서, 상기 링커 폴리펩타이드는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드인, 약제학적 조성물.
  50. 제48항 또는 제49항에 있어서, 상기 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
  51. 제48항 내지 제50항 중 어느 한 항에 있어서, 상기 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
  52. 제48항 내지 제51항 중 어느 한 항에 있어서, 상기 키메라 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에 발현될 경우 상기 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물
  53. 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는 방법으로서, 상기 대상체의 하나 이상의 세포에 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한 약제학적 조성물을 국소 또는 경피 투여하는 단계를 포함하는, 방법.
  54. 제53항에 있어서, 상기 약제학적 조성물은,
    a) 벡터를 포함하는 바이러스로서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 및 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함하는, 상기 바이러스; 및
    b) 약제학적으로 허용 가능한 담체를 포함하는, 방법.
  55. 제54항에 있어서, 상기 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스인, 방법.
  56. 제54항에 있어서, 상기 바이러스는 단순 포진 바이러스(HSV)인, 방법.
  57. 제54항 내지 제56항 중 어느 한 항에 있어서, 상기 바이러스는 복제-결함성인, 방법.
  58. 제56항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 방법.
  59. 제56항에 있어서, 상기 단순 포진 바이러스는 변형된 외피를 포함하는, 방법.
  60. 제59항에 있어서, 상기 변형된 외피는 야생형 단순 포진 바이러스에 대해서 단순 포진 바이러스 조직 친화도를 변화시키는, 방법.
  61. 제59항에 있어서, 상기 변형된 외피는 돌연변이 단순 포진 바이러스 당단백질을 포함하는, 방법.
  62. 제54항에 있어서, 상기 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘인, 방법.
  63. 제62항에 있어서, 상기 HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘인, 방법.
  64. 제54항에 있어서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 방법.
  65. 제64항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 방법.
  66. 제64항 또는 제65항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 방법.
  67. 제66항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 방법.
  68. 제64항 내지 제67항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 방법.
  69. 제64항 내지 제67항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 방법.
  70. 제68항 또는 제69항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 방법.
  71. 제68항 내지 제70항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 방법.
  72. 제68항 내지 제71항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 방법.
  73. 제68항 내지 제72항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 방법.
  74. 제68항 내지 제73항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 방법.
  75. 제64항 내지 제74항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 방법.
  76. 제64항 내지 제75항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
  77. 제64항 내지 제76항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
  78. 제64항 내지 제77항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
  79. 제54항에 있어서, 상기 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능한, 방법.
  80. 제54항에 있어서, 상기 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합한, 방법.
  81. 제54항에 있어서, 상기 하나 이상의 전이유전자는 miRNA 결합 부위를 포함하는, 방법.
  82. 제54항에 있어서, 상기 하나 이상의 전이유전자는 하나 이상의 이종 촉진자에 작동 가능하게 연결되는, 방법.
  83. 제82항에 있어서, 상기 하나 이상의 이종 촉진자는 인간 거대세포바이러스(HCMV) 급초기 촉진자, 연장 인자-1(EF1) 촉진자, 및 이들의 임의의 조합물로 이루어진 군으로부터 선택되는, 방법.
  84. 제54항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 방법.
  85. 제54항에 있어서, 상기 벡터는 2개의 전이유전자를 포함하되, 각각의 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는, 방법.
  86. 제54항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 방법.
  87. 제54항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 상기 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는, 방법.
  88. 제54항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시키는, 방법.
  89. 제54항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
  90. 제54항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
  91. 제54항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 상기 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는, 방법.
  92. 제54항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시키는, 방법.
  93. 제54항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현된 경우 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
  94. 제54항에 있어서, 상기 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함하는, 방법.
  95. 제94항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는, 방법.
  96. 제54항에 있어서, 상기 벡터는 다시스트론성인 전이유전자를 포함하는, 방법.
  97. 제96항에 있어서, 상기 다시스트론성 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 제1 개방형 해독틀(ORF) 상에서 그리고 라이실 하이드록실라제 3 폴리펩타이드를 제2 개방형 해독틀(ORF) 상에서 암호화하는, 방법.
  98. 제97항에 있어서, 상기 제1 및 제2 ORF는 내부 리보솜 유입 부위(IRES)에 의해 분리되는, 방법.
  99. 제95항 내지 제98항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 약 등몰비로 있는, 방법.
  100. 제95항 내지 제98항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드들이 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대, 및/또는 보충시키는, 방법.
  101. 제54항에 있어서, 상기 키메라 폴리펩타이드는 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드와 상기 라이실 하이드록실라제 3 폴리펩타이드 사이에 링커 폴리펩타이드를 포함하는, 방법.
  102. 제101항에 있어서, 상기 링커 폴리펩타이드는 T2A, P2A, E2A, 또는 F2A 링커 폴리펩타이드인, 방법.
  103. 제101항 또는 제102항에 있어서, 상기 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
  104. 제101항 내지 제103항 중 어느 한 항에 있어서, 상기 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
  105. 제101항 내지 제104항 중 어느 한 항에 있어서, 상기 키메라 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에 발현될 경우 상기 대상체의 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
  106. 제53항에 있어서, 상기 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여되는, 방법.
  107. 제53항에 있어서, 상기 약제학적 조성물은 상기 대상체의 하나 이상의 환부 영역 또는 비환부 영역에 투여되는, 방법.
  108. 제53항에 있어서, 상기 피부의 상기 질환 또는 장애는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군, 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창 중 하나 이상인, 방법.
  109. 단리된 키메라 폴리펩타이드로서, 상기 단리된 키메라 폴리펩타이드는,
    a) 콜라겐 알파-1 (VII) 사슬 폴리펩타이드;
    b) 라이실 하이드록실라제 3 폴리펩타이드; 및
    c) 링커 폴리펩타이드를 포함하되;
    상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 링커 폴리펩타이드에 의해 분리되는, 단리된 키메라 폴리펩타이드.
  110. 제109항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 단리된 키메라 폴리펩타이드.
  111. 제109항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 단리된 키메라 폴리펩타이드.
  112. 제109항에 있어서, 상기 링커 폴리펩타이드는 서열번호 6, 서열번호 8, 서열번호 10 또는 서열번호 12의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 단리된 키메라 폴리펩타이드.
  113. 제109항 내지 제112항 중 어느 한 항에 있어서, 상기 단리된 키메라 폴리펩타이드는 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22, 서열번호 24, 서열번호 26 또는 서열번호 28의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 단리된 키메라 폴리펩타이드.
  114. 제109항 내지 제113항 중 어느 한 항의 키메라 폴리펩타이드를 암호화하는 폴리뉴클레오타이드.
  115. 제114항의 폴리뉴클레오타이드를 포함하는 벡터.
  116. 제115항에 있어서, 상기 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘인, 벡터.
  117. 제116항에 있어서, 상기 HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘인, 벡터.
  118. 제115항에 있어서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 벡터.
  119. 제118항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 벡터.
  120. 제118항 또는 제119항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  121. 제120항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 벡터.
  122. 제118항 내지 제121항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  123. 제118항 내지 제121항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  124. 제122항 또는 제123항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  125. 제122항 내지 제124항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  126. 제122항 내지 제125항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  127. 제122항 내지 제126항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 벡터.
  128. 제122항 내지 제127항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 벡터.
  129. 제118항 내지 제128항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 벡터.
  130. 제118항 내지 제129항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 폴리뉴클레오타이드를 포함하는, 벡터.
  131. 제118항 내지 제130항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 벡터.
  132. 제118항 내지 제131항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 폴리뉴클레오타이드를 포함하는, 벡터.
  133. 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 또는 이들의 임의의 조합을 포함하는 하나 이상의 폴리뉴클레오타이드를 포함하는 벡터로서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 벡터.
  134. 제133항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 벡터.
  135. 제133항 또는 제134항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  136. 제135항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 벡터.
  137. 제133항 내지 제136항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  138. 제133항 내지 제136항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  139. 제137항 또는 제138항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  140. 제137항 내지 제139항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  141. 제137항 내지 제140항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 벡터.
  142. 제137항 내지 제141항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 벡터.
  143. 제137항 내지 제142항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 벡터.
  144. 제133항 내지 제143항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 벡터.
  145. 제133항 내지 제144항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 폴리뉴클레오타이드를 포함하는, 벡터.
  146. 제133항 내지 제145항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 벡터.
  147. 제133항 내지 제146항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 폴리뉴클레오타이드를 포함하는, 벡터.
  148. 제133항 내지 제147항 중 어느 한 항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 하나의 폴리펩타이드를 포함하는, 벡터.
  149. 제133항 내지 제147항 중 어느 한 항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 2개의 폴리뉴클레오타이드를 포함하는, 벡터.
  150. 제115항 내지 제149항 중 어느 한 항의 벡터를 포함하는 숙주 세포.
  151. 단순 포진 바이러스를 수집하는 방법으로서, 관심 대상 벡터가 상기 단순 포진 바이러스 내에 패키징되고, 상기 방법은,
    a) 숙주 세포를 헬퍼 바이러스를 암호화하는 벡터와 접촉시키는 단계;
    b) 상기 숙주 세포를 제115항 내지 제117항 중 어느 한 항의 벡터와 접촉시키는 단계; 및
    c) 상기 숙주 세포에 의해 생성된 단순 포진 바이러스 유전자를 수집하는 단계를 포함하는, 단순 포진 바이러스를 수집하는 방법.
  152. 단순 포진 바이러스를 수집하는 방법으로서, 관심 대상 벡터가 상기 단순 포진 바이러스 내에 패키징되고, 상기 방법은,
    a) 상보성 숙주 세포를 제118항 내지 제149항 중 어느 한 항의 벡터와 접촉시키는 단계; 및
    b) 상기 상보성 숙주 세포에 의해 생성된 단순 포진 바이러스 유전자를 수집하는 단계를 포함하는, 단순 포진 바이러스를 수집하는 방법.
  153. 제151항 또는 제152항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 단순 포진 바이러스를 수집하는 방법.
  154. 키트로서,
    a) 제1항 내지 제52항 중 어느 한 항의 약제학적 조성물; 및
    b) 약제학적 조성물을 투여하기 위한 설명서를 포함하는, 키트.
  155. 약제학적 조성물로서,
    a) 벡터를 포함하는 바이러스로서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함하는, 상기 바이러스; 및
    b) 약제학적으로 허용 가능한 담체를 포함하는, 약제학적 조성물.
  156. 제155항에 있어서, 상기 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스인, 약제학적 조성물.
  157. 제155항에 있어서, 상기 바이러스는 단순 포진 바이러스(HSV)인, 약제학적 조성물.
  158. 제155항 내지 제157항 중 어느 한 항에 있어서, 상기 바이러스는 복제-결함성인, 약제학적 조성물.
  159. 제155항 내지 제158항 중 어느 한 항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 약제학적 조성물.
  160. 제155항 내지 제159항 중 어느 한 항에 있어서, 상기 벡터는 HSV-1 앰플리콘 또는 HSV-1 혼성 앰플리콘인, 약제학적 조성물.
  161. 제160항에 있어서, 상기 HSV-1 혼성 앰플리콘은 HSV/AAV 혼성 앰플리콘, HSV/EBV 혼성 앰플리콘, 및 HSV/EBV/RV 혼성 앰플리콘, 또는 HSV/슬리핑 뷰티 혼성 앰플리콘인, 약제학적 조성물.
  162. 제155항 내지 제159항 중 어느 한 항에 있어서, 상기 벡터는 재조합 단순 포진 바이러스 게놈인, 약제학적 조성물.
  163. 제162항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 약제학적 조성물.
  164. 제162항 또는 제163항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  165. 제164항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 약제학적 조성물.
  166. 제162항 내지 제165항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  167. 제162항 내지 제165항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  168. 제166항 또는 제167항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  169. 제166항 내지 제168항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  170. 제166항 내지 제169항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 약제학적 조성물.
  171. 제166항 내지 제170항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 약제학적 조성물.
  172. 제166항 내지 제171항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 약제학적 조성물.
  173. 제162항 내지 제172항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 약제학적 조성물.
  174. 제162항 내지 제173항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
  175. 제162항 내지 제174항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
  176. 제162항 내지 제175항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 약제학적 조성물.
  177. 제155항에 있어서, 상기 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능한, 약제학적 조성물.
  178. 제155항에 있어서, 상기 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합한, 약제학적 조성물.
  179. 제155항에 있어서, 상기 약제학적으로 허용 가능한 담체는 경피 또는 피부내 투여에 적합한, 약제학적 조성물.
  180. 제155항에 있어서, 상기 하나 이상의 전이유전자는 miRNA 결합 부위를 포함하는, 약제학적 조성물.
  181. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 약제학적 조성물.
  182. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 약제학적 조성물.
  183. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 약제학적 조성물.
  184. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
  185. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 상기 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
  186. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
  187. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
  188. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
  189. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 상기 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
  190. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
  191. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현된 경우 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
  192. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 서열번호 30의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 약제학적 조성물.
  193. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 단편이되, 상기 단편은 서열번호 30의 적어도 100개 연속 아미노산을 갖는, 약제학적 조성물.
  194. 제155항 내지 제180항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시키는, 약제학적 조성물.
  195. 제155항 내지 제194항 중 어느 한 항에 있어서, 상기 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함하는, 약제학적 조성물.
  196. 제195항에 있어서, 상기 제1 전이유전자 및 상기 제2 전이유전자는 각각 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는, 약제학적 조성물.
  197. 제195항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는, 약제학적 조성물.
  198. 제195항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 약제학적 조성물.
  199. 제195항에 있어서, 상기 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 약제학적 조성물.
  200. 제155항에 있어서, 상기 벡터는 적어도 제1 전이유전자, 제2 전이유전자 및 제3 전이유전자를 포함하는, 약제학적 조성물.
  201. 제200항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 상기 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 약제학적 조성물.
  202. 대상체의 피부의 상처, 장애 또는 질환의 예방적, 일시적 또는 치료적 완화를 제공하는 방법으로서, 벡터를 포함하는 약제학적 조성물을 상기 대상체에 투여하는 단계를 포함하되, 상기 벡터는 재조합 단순 포진 바이러스 게놈을 포함하고, 상기 약제학적 조성물은 상기 대상체의 하나 이상의 세포에서 콜라겐 알파-1 (VII) 사슬 폴리펩타이드 및/또는 라이실 하이드록실라제 3 폴리펩타이드 및/또는 케라틴 유형 I 세포골격 17 폴리펩타이드의 수준을 증강, 증가 증대 및/또는 보충 가능한, 방법.
  203. 제202항에 있어서, 상기 약제학적 조성물은,
    a) 상기 벡터를 포함하는 바이러스로서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드, 라이실 하이드록실라제 3 폴리펩타이드, 케라틴 유형 I 세포골격 17 폴리펩타이드, 및 이들의 키메라 폴리펩타이드로 이루어진 군으로부터 선택된 폴리펩타이드를 암호화하는 하나 이상의 전이유전자를 포함하는, 상기 바이러스; 및
    b) 약제학적으로 허용 가능한 담체를 포함하는, 방법.
  204. 제203항에 있어서, 상기 바이러스는 아데노바이러스, 아데노-연관 바이러스, 레트로바이러스, 렌티바이러스, 센다이바이러스, 단순 포진 바이러스, 백시니아 바이러스, 또는 이들의 임의의 잡종 바이러스인, 방법.
  205. 제203항에 있어서, 상기 바이러스는 단순 포진 바이러스(HSV)인, 방법.
  206. 제203항 내지 제205항 중 어느 한 항에 있어서, 상기 바이러스는 복제-결함성인, 방법.
  207. 제203항 내지 제206항 중 어느 한 항에 있어서, 상기 단순 포진 바이러스는 제1형 단순 포진 바이러스, 제2형 단순 포진 바이러스, 또는 이들의 임의의 유도체인, 방법.
  208. 제202항 내지 제207항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 재조합 HSV-1 게놈, 재조합 HSV-2 게놈, 또는 이들의 임의의 유도체인, 방법.
  209. 제202항 내지 제208항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 급초기 단순 포진 바이러스 유전자에 비활성화 돌연변이를 포함하는, 방법.
  210. 제209항에 있어서, 상기 단순 포진 바이러스 유전자는 ICP0, ICP4, ICP22, ICP27, ICP47, tk, UL41 및 UL55로 이루어진 군으로부터 선택되는, 방법.
  211. 제202항 내지 제210항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 방법.
  212. 제202항 내지 제210항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0 및 ICP4 유전자에 비활성화 돌연변이를 포함하는, 방법.
  213. 제211항 또는 제212항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4 및 ICP22 유전자에 비활성화 돌연변이를 포함하는, 방법.
  214. 제211항 내지 제213항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22 및 ICP27 유전자에 비활성화 돌연변이를 포함하는, 방법.
  215. 제211항 내지 제214항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP0, ICP4, ICP22, ICP27 및 UL55 유전자에 비활성화 돌연변이를 포함하는, 방법.
  216. 제211항 내지 제215항 중 어느 한 항에 있어서, 상기 비활성화 돌연변이는 상기 유전자의 암호화 서열의 결실인, 방법.
  217. 제211항 내지 제216항 중 어느 한 항에 있어서, 상기 ICP47 유전자에 비활성화 돌연변이를 더 포함하는, 방법.
  218. 제202항 내지 제217항 중 어느 한 항에 있어서, 상기 UL41 유전자에 비활성화 돌연변이를 더 포함하는, 방법.
  219. 제202항 내지 제218항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 하나 이상의 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
  220. 제202항 내지 제219항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 ICP4 바이러스 유전자 좌위 중 하나 이상 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
  221. 제202항 내지 제220항 중 어느 한 항에 있어서, 상기 재조합 단순 포진 바이러스 게놈은 상기 UL41 바이러스 유전자 좌위 내에 상기 하나 이상의 전이유전자를 포함하는, 방법.
  222. 제202항에 있어서, 상기 벡터는 표적 세포 내로 전달될 경우 상기 표적 세포 내에서 복제 가능한, 방법.
  223. 제203항에 있어서, 상기 약제학적으로 허용 가능한 담체는 국소 또는 경피 투여에 적합한, 방법.
  224. 제203항에 있어서, 상기 약제학적으로 허용 가능한 담체는 경피 또는 피부내 투여에 적합한, 방법.
  225. 제203항에 있어서, 상기 하나 이상의 전이유전자는 miRNA 결합 부위를 포함하는, 방법.
  226. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 벡터는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 방법.
  227. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 벡터는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 방법.
  228. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 벡터는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는 전이유전자를 포함하는, 방법.
  229. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 서열번호 2의 서열과 적어도 80% 서열 동일성을 갖는, 방법.
  230. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 단편이되, 상기 단편은 서열번호 2의 적어도 100개 연속 아미노산을 갖는, 방법.
  231. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (VII) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 고정 원섬유 형성을 증강, 증가, 증대 및/또는 보충시키는, 방법.
  232. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 콜라겐 알파-1 (II) 사슬 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 상피 기저막 조직화 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
  233. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 서열번호 4의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
  234. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 단편이되, 상기 단편은 서열번호 4의 적어도 100개 연속 아미노산을 갖는, 방법.
  235. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 라이실 하이드록실라제 3 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현될 경우 상기 대상체의 하나 이상의 콜라겐 폴리펩타이드 상의 하이드록시라이신 잔기의 형성을 증강, 증가, 증대 및/또는 보충시키는, 방법.
  236. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 라이실 하이드록실라제 3 폴리펩타이드는 상기 폴리펩타이드가 대상체의 하나 이상의 표적 세포에서 발현된 경우 고정 원섬유 형성, 상피 기저막 조직화, 및/또는 상피 기저 유착을 증강, 증가, 증대 및/또는 보충시키는, 방법.
  237. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 서열번호 30의 서열에 대해서 적어도 80% 서열 동일성을 갖는, 방법.
  238. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 단편이되, 상기 단편은 서열번호 30의 적어도 100개 연속 아미노산을 갖는, 방법.
  239. 제202항 내지 제225항 중 어느 한 항에 있어서, 상기 케라틴 유형 I 세포골격 17 폴리펩타이드는 대상체의 상처 치유를 증강, 증가, 증대 및/또는 보충시키는, 방법.
  240. 제202항 내지 제239항 중 어느 한 항에 있어서, 상기 벡터는 적어도 제1 전이유전자 및 제2 전이유전자를 포함하는, 방법.
  241. 제240항에 있어서, 상기 제1 전이유전자 및 상기 제2 전이유전자는 각각 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하는, 방법.
  242. 제240항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하는, 방법.
  243. 제240항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 방법.
  244. 제240항에 있어서, 상기 제1 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 방법.
  245. 제202항 내지 제239항 중 어느 한 항에 있어서, 상기 벡터는 적어도 제1 전이유전자, 제2 전이유전자 및 제3 전이유전자를 포함하는, 방법.
  246. 제245항에 있어서, 상기 제1 전이유전자는 콜라겐 알파-1 (VII) 사슬 폴리펩타이드를 암호화하고, 상기 제2 전이유전자는 라이실 하이드록실라제 3 폴리펩타이드를 암호화하며, 상기 제3 전이유전자는 케라틴 유형 I 세포골격 17 폴리펩타이드를 암호화하는, 방법.
  247. 제202항 내지 제246항 중 어느 한 항에 있어서, 상기 약제학적 조성물은 상기 대상체에게 국소 또는 경피 투여되는, 방법.
  248. 제202항 내지 제246항 중 어느 한 항에 있어서, 상기 약제학적 조성물은 상기 대상체에게 경피 또는 피부내 투여되는, 방법.
  249. 제202항 내지 제248항 중 어느 한 항에 있어서, 상기 약제학적 조성물은 1일당 1, 2, 3, 4, 5회 또는 그 이상 투여되는, 방법.
  250. 제202항 내지 제249항 중 어느 한 항에 있어서, 상기 약제학적 조성물은 상기 대상체의 하나 이상의 환부 영역 또는 비환부 영역에 투여되는, 방법.
  251. 제202항 내지 제250항 중 어느 한 항에 있어서, 상기 피부의 상기 질환 또는 장애는 수포성 표피박리증, 피부암, 건선, 태평 태선, 루푸스, 주사, 습진, 피부 칸디다증, 봉와직염, 농가진, 욕창, 얕은연조직염, 심상성 어린선, 피부근육염, 말단피부염, 울체성 피부염, 니트레토 증후군, 단순형 수포성 표피박리증(LAMB3 유전자), 상염색체 퇴행적 선천 비늘증, 색소성 건피증 및 유천포창 중 하나 이상인, 방법.
KR1020187030112A 2016-04-08 2016-12-28 피부의 상처, 장애 및 질환의 치료를 위한 조성물 및 방법 KR20180128016A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662320316P 2016-04-08 2016-04-08
US62/320,316 2016-04-08
PCT/US2016/068974 WO2017176336A1 (en) 2016-04-08 2016-12-28 Compositions and methods for the treatment of wounds, disorders, and diseases of the skin

Publications (1)

Publication Number Publication Date
KR20180128016A true KR20180128016A (ko) 2018-11-30

Family

ID=57822104

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187030112A KR20180128016A (ko) 2016-04-08 2016-12-28 피부의 상처, 장애 및 질환의 치료를 위한 조성물 및 방법

Country Status (21)

Country Link
US (7) US9877990B2 (ko)
EP (2) EP3377637B1 (ko)
JP (3) JP6970086B2 (ko)
KR (1) KR20180128016A (ko)
CN (1) CN109072255A (ko)
AU (3) AU2016401692B2 (ko)
CA (1) CA3017487A1 (ko)
CL (3) CL2018002814A1 (ko)
CY (1) CY1123024T1 (ko)
DK (1) DK3377637T3 (ko)
ES (1) ES2796488T3 (ko)
HR (1) HRP20200853T1 (ko)
HU (1) HUE049237T2 (ko)
LT (1) LT3377637T (ko)
MX (2) MX2018012135A (ko)
PL (1) PL3377637T3 (ko)
PT (1) PT3377637T (ko)
RS (1) RS60410B1 (ko)
SG (1) SG11201808314QA (ko)
SI (1) SI3377637T1 (ko)
WO (1) WO2017176336A1 (ko)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112017013858A2 (pt) 2014-12-26 2018-02-27 Univ Emory n4-hidroxicitidina e derivados e usos antivirais relacionados aos mesmos
JP6970086B2 (ja) 2016-04-08 2021-11-24 クリスタル バイオテック,インコーポレイティド 皮膚の創傷、障害、及び疾患を処置するための組成物及び方法
CN110312506A (zh) * 2016-11-14 2019-10-08 密歇根大学董事会 用于阻挡紫外线辐射的组合物和方法
CA3049652A1 (en) 2017-01-10 2018-07-19 Intrexon Corporation Modulating expression of polypeptides via new gene switch expression systems
MX2020005392A (es) 2017-12-07 2020-12-07 Univ Emory N4-hidroxicitidina y derivados y usos antivirales relacionados con los mismos.
CA3094345A1 (en) 2018-04-12 2019-10-17 Krystal Biotech, Inc. Compositions and methods for the treatment of autosomal recessive congenital ichthyosis
WO2019210219A1 (en) 2018-04-27 2019-10-31 Krystal Biotech, Inc. Recombinant nucleic acids encoding cosmetic protein(s) for aesthetic applications
CA3112627A1 (en) 2018-09-24 2020-04-02 Krystal Biotech, Inc. Compositions and methods for the treatment of netherton syndrome
CA3112633A1 (en) 2018-09-26 2020-04-02 Krystal Biotech, Inc. Compositions and methods for the treatment of skin diseases
WO2020149395A1 (ja) * 2019-01-18 2020-07-23 国立大学法人大阪大学 栄養障害型表皮水疱症治療薬
US10829529B2 (en) 2019-02-08 2020-11-10 Krystal Biotech, Inc. Compositions and methods for delivering CFTR polypeptides
EP3946596A4 (en) * 2019-03-27 2022-12-21 Phoenix Tissue Repair, Inc. SYSTEMS AND METHODS OF PRODUCING COLLAGEN COMPOSITIONS 7
EP4025699A1 (en) 2019-09-03 2022-07-13 Krystal Biotech, Inc. Compositions and methods for the treatment of congenital ichthyoses
CN112724225B (zh) * 2019-10-28 2023-09-26 中国医学科学院药物研究所 一种角蛋白bd-6、制法和其药物组合物与用途
EP4077688A1 (en) 2019-12-20 2022-10-26 Krystal Biotech, Inc. Compositions and methods for gene delivery to the airways and/or lungs
CN117412986A (zh) 2021-04-02 2024-01-16 克里斯托生物技术股份有限公司 用于癌症疗法的病毒载体
WO2023064806A1 (en) 2021-10-12 2023-04-20 Phoenix Tissue Repair, Inc. Collagen 7 protein replacement therapy
CN117143223B (zh) * 2022-08-23 2024-03-08 山西锦波生物医药股份有限公司 一种生物合成人体结构性材料的制备方法

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5672344A (en) * 1987-12-30 1997-09-30 The Regents Of The University Of Michigan Viral-mediated gene transfer system
US5658724A (en) 1992-07-31 1997-08-19 University Of Pittsburgh Of The Commonwealth System Of Higher Education Herpes simplex virus strains deficient for the essential immediate early genes ICP4 and ICP27 and methods for their production, growth and use
IL132087A0 (en) * 1997-04-10 2001-03-19 Univ Southern California Modified proteins which bind extracellular matrix components
US5998174A (en) 1997-05-12 1999-12-07 University Of Pittsburgh Of The Commonwealth System Of Higher Education Multigene vectors
GB9715085D0 (en) * 1997-07-18 1997-09-24 Jahoda Amanda J Gene therapy vehicle
US6106826A (en) * 1997-12-17 2000-08-22 Wisconsin Alumni Research Foundation Replication competent, avirulent Herpes simplex virus as a vector for neural and ocular gene therapy
GB9801930D0 (en) * 1998-01-29 1998-03-25 Univ London Mutant herpes simplex viruses and uses thereof
WO1999064094A1 (en) * 1998-06-12 1999-12-16 Aradigm Corporation Methods of delivering aerosolized polynucleotides to the respiratory tract
JP2003535565A (ja) 1998-12-31 2003-12-02 アーチ ディベロプメント コーポレイション 新生物疾患の治療に有用な組換え単純ヘルペスウイルス
GB9930418D0 (en) * 1999-12-22 2000-02-16 Neurovex Ltd Replication incompetent herpes virus vectors
AU1788502A (en) * 2000-11-28 2002-06-11 Univ Chicago Genetically engineered herpes virus for the treatment of cardiovascular disease
AU2003298786A1 (en) 2002-11-26 2004-06-18 Protein Design Labs, Inc. Methods of detecting soft tissue sarcoma, compositions and methods of screening for soft tissue sarcoma modulators
CN101203530A (zh) * 2004-10-28 2008-06-18 匹兹堡大学高等教育联邦体系 关于脊髓损伤疼痛的外周递送的谷氨酸脱羧酶基因治疗
RU2007131689A (ru) * 2005-01-21 2009-02-27 Интроджен Тетрапьютикс, Инк. (Us) Местное введение терапевтических и профилактических нуклеиновых кислот, обеспечивающее их пролонгированное действие на клетки-мишени
AU2006252406B2 (en) * 2005-06-01 2012-05-17 California Institute Of Technology Method of targeted gene delivery using viral vectors
US8703703B2 (en) * 2006-12-20 2014-04-22 University Of Central Flordia Research Foundation, Inc. MCPIP as wound therapy
WO2008106646A2 (en) * 2007-03-01 2008-09-04 Introgen Therapeutics, Inc Methods and formulations for topical gene therapy
US20080289058A1 (en) * 2007-05-14 2008-11-20 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Targeted delivery of glycine receptors to excitable cells
WO2009105690A2 (en) * 2008-02-21 2009-08-27 Targeted Genetics Corporation Devices and methods for delivering polynucleotides into retinal cells of the macula and fovea
CN102212559B (zh) 2011-04-14 2014-04-09 郑州威瑞生物技术有限公司 一种重组的hsv扩增子载体及其用途
US9340783B2 (en) * 2011-10-11 2016-05-17 Inserm (Institut National De La Sante Et De La Recherche Medicale Exon skipping therapy for dystrophic epidermolysis bullosa
GB201202561D0 (en) 2012-02-15 2012-03-28 Univ Dundee Treatment of skin disorders
CN104768567B (zh) * 2012-05-18 2017-07-11 奥塔哥创业有限公司 用于伤口愈合的联合治疗和组合物
AU2014223243B2 (en) * 2013-03-01 2019-10-17 Regents Of The University Of Minnesota Talen-based gene correction
BR112015022868B1 (pt) * 2013-03-14 2023-05-16 Ethris Gmbh Composições de mrna de cftr e usos e métodos relacionados
WO2015009952A1 (en) * 2013-07-17 2015-01-22 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Non-toxic hsv vectors for efficient gene delivery applications and complementing cells for their production
ES2810800T3 (es) * 2013-10-28 2021-03-09 Univ Pittsburgh Commonwealth Sys Higher Education Vector de HSV oncolítico
MX2016009771A (es) 2014-01-31 2016-11-14 Factor Bioscience Inc Metodos y productos para la produccion y administracion de acido nucleico.
GB2526339A (en) * 2014-05-21 2015-11-25 Imp Innovations Ltd Lentiviral vectors
WO2016049183A1 (en) * 2014-09-24 2016-03-31 Aerpio Therapeutics, Inc. Ve-ptp extracellular domain antibodies delivered by a gene therapy vector
JP6925805B2 (ja) * 2014-10-31 2021-08-25 京都府公立大学法人 ラミニンによる角膜の新規治療
US20180148711A1 (en) * 2015-05-28 2018-05-31 Coda Biotherapeutics, Inc. Genome editing vectors
CN109069668B (zh) * 2015-12-14 2023-04-18 宾夕法尼亚州大学信托人 用于眼病的基因疗法
EP3432905B1 (en) * 2016-03-25 2022-06-01 PeriphaGen, Inc. Hsv vectors for delivery of nt3 and treatment of cipn
DK3432912T3 (da) * 2016-03-25 2023-03-13 Periphagen Inc Hsv-vektorer med høj transduktion
JP6970086B2 (ja) 2016-04-08 2021-11-24 クリスタル バイオテック,インコーポレイティド 皮膚の創傷、障害、及び疾患を処置するための組成物及び方法
CA3094345A1 (en) 2018-04-12 2019-10-17 Krystal Biotech, Inc. Compositions and methods for the treatment of autosomal recessive congenital ichthyosis
WO2019210219A1 (en) 2018-04-27 2019-10-31 Krystal Biotech, Inc. Recombinant nucleic acids encoding cosmetic protein(s) for aesthetic applications
JP2021529531A (ja) 2018-06-29 2021-11-04 クリスタル バイオテック インコーポレイテッド 抗体送達のための組成物及び方法

Also Published As

Publication number Publication date
AU2019280069A1 (en) 2020-01-16
US10155016B2 (en) 2018-12-18
SI3377637T1 (sl) 2020-08-31
US10441614B2 (en) 2019-10-15
JP2023118838A (ja) 2023-08-25
PL3377637T3 (pl) 2020-09-07
US20180169160A1 (en) 2018-06-21
US9877990B2 (en) 2018-01-30
HUE049237T2 (hu) 2020-09-28
AU2016401692A1 (en) 2018-09-27
US20190160122A1 (en) 2019-05-30
AU2022204729A1 (en) 2022-07-21
CL2018002814A1 (es) 2019-02-15
JP2019513689A (ja) 2019-05-30
PT3377637T (pt) 2020-06-17
MX2018012135A (es) 2019-03-28
US20220273737A1 (en) 2022-09-01
US11185564B2 (en) 2021-11-30
LT3377637T (lt) 2020-07-10
EP3712273A1 (en) 2020-09-23
EP3377637A1 (en) 2018-09-26
DK3377637T3 (da) 2020-05-18
US11865148B2 (en) 2024-01-09
JP7480105B2 (ja) 2024-05-09
CN109072255A (zh) 2018-12-21
JP2022023174A (ja) 2022-02-07
US20200101123A1 (en) 2020-04-02
MX2022006072A (es) 2022-06-14
CA3017487A1 (en) 2017-10-12
US20230414686A1 (en) 2023-12-28
US20170290866A1 (en) 2017-10-12
CY1123024T1 (el) 2021-10-29
EP3377637B1 (en) 2020-03-18
JP6970086B2 (ja) 2021-11-24
ES2796488T3 (es) 2020-11-27
US20230149486A1 (en) 2023-05-18
WO2017176336A1 (en) 2017-10-12
CL2023000743A1 (es) 2023-09-29
NZ746213A (en) 2021-08-27
CL2021000881A1 (es) 2021-09-10
AU2019280069B2 (en) 2022-04-07
AU2016401692B2 (en) 2019-10-03
SG11201808314QA (en) 2018-10-30
RS60410B1 (sr) 2020-07-31
HRP20200853T1 (hr) 2020-08-21

Similar Documents

Publication Publication Date Title
AU2019280069B2 (en) Compositions and methods for the treatment of wounds, disorders, and diseases of the skin
JP2024056823A (ja) 審美的用途のための美容用タンパク質をコードする組換え核酸
EP1141283B1 (en) NOVEL METHOD FOrR IDENTIFICATION OF A COMPOUND MODULATING INTERACTION BETWEEN A TNF LIGAND AND ITS RECEPTOR ON B CELLS
KR20100017494A (ko) 프로테오글리칸 폴리펩타이드를 암호화하는 핵산을 이용한 상처 및 피부손상의 치료
US6300484B1 (en) DNA encoding DP. 75 and a process for its use
JP2024063082A (ja) 皮膚疾患の治療のための組成物及び方法
US20030175260A1 (en) Novel DNA and a process for its use
US8076293B2 (en) Use of BiP or a variant, homologue, derivative or fragment thereof in the manufacture of a medicament for the prevention or treatment of bone loss or bone resorption
US20230295658A1 (en) Compositions and methods for in vivo gene transfer
AU759409B2 (en) Preventives and/or remedies for obesity
NZ746213B2 (en) Compositions and methods for the treatment of wounds, disorders, and diseases of the skin
KR19980701695A (ko) 미오신 중쇄 sm1 이소폼 단백질을 암호화하는 dna를 벡터 dna에 삽입시킨 재조합 dna, 전기 재조합 dna가 도입된 미생물 및 재조합 dna를 포함하는 동맥경화증 치료제
US20020142963A1 (en) Methods for increasing bone formation and enhancing bone accretion

Legal Events

Date Code Title Description
E902 Notification of reason for refusal