KR20220149588A - 대사성 간 장애의 치료를 위한 조성물 및 방법 - Google Patents

대사성 간 장애의 치료를 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20220149588A
KR20220149588A KR1020227034141A KR20227034141A KR20220149588A KR 20220149588 A KR20220149588 A KR 20220149588A KR 1020227034141 A KR1020227034141 A KR 1020227034141A KR 20227034141 A KR20227034141 A KR 20227034141A KR 20220149588 A KR20220149588 A KR 20220149588A
Authority
KR
South Korea
Prior art keywords
sequence
aav
nucleic acid
seq
acid sequence
Prior art date
Application number
KR1020227034141A
Other languages
English (en)
Inventor
징징 지앙
줄리안 다운
시앙홍 리
에릭 엠 오스터택
Original Assignee
포세이다 테라퓨틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포세이다 테라퓨틱스, 인크. filed Critical 포세이다 테라퓨틱스, 인크.
Publication of KR20220149588A publication Critical patent/KR20220149588A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1018Carboxy- and carbamoyl transferases (2.1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • A01K2217/052Animals comprising random inserted nucleic acids (transgenic) inducing gain of function
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/40Vector systems having a special element relevant for transcription being an insulator
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y201/00Transferases transferring one-carbon groups (2.1)
    • C12Y201/03Carboxy- and carbamoyltransferases (2.1.3)
    • C12Y201/03003Ornithine carbamoyltransferase (2.1.3.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

본 개시내용은 대사성 간 장애의 치료를 위한 조성물 및 방법에 관한 것이다. 상기 조성물 및 방법은 이식유전자를 포함하는 아데노 관련 바이러스(AAV) piggyBac 폴리뉴클레오타이드를 포함할 수 있다. 상기 이식유전자는 오르니틴 트랜스카르바밀라제(OTC) 또는 메틸말로닐-CoA 뮤타제(MUT1)를 포함할 수 있다.

Description

대사성 간 장애의 치료를 위한 조성물 및 방법
관련 출원에 대한 상호 참조
본 출원은 2020년 3월 4일에 출원된 미국 가출원 제62/985,047호 및 2020년 12월 4일에 출원된 미국 가출원 제63/121,488호에 대한 우선권 및 이익을 주장한다. 전술한 특허 출원 각각의 내용은 그 전체가 참고로 본원에 포함된다.
서열 목록
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출된 서열 목록을 포함하며 이는 그 전체가 참조로 본원에 포함된다. 2021년 3월 3일에 생성된 ASCII 사본의 이름은 "POTH-058_001WO_SeqList.txt"이며 크기는 약 329KB이다.
선천성 대사 이상으로도 알려진 유전성 대사 장애는 가장 흔하게는 양쪽 부모로부터 유전되는 유전적 결함에 의해 유발되는 의학적 상태이다. 적절한 대사는 세포와 유기체가 음식과 기타 영양소를 필수 화합물과 에너지로 변환하기 위해 사용하는 복잡한 화학 반응 세트를 필요로 한다. 이러한 화학 반응은 또한 독성 물질을 포함하여 필요하지 않은 물질을 분해하고 제거하는 데 사용된다. 유전적 대사 장애를 유발하는 유전적 결함은 종종 하나 이상의 대사 경로 내에서 특정 효소의 활성 결핍을 초래한다. 이러한 결핍은 잠재적 독성 물질의 축적을 초래할 뿐만 아니라 필수 화합물을 합성하는 대상체의 능력을 제한할 수 있다. 간에 주로 영향을 미치는 유전성 대사 장애를 포함하여 수백 개의 규명된 유전성 대사 장애가 있다. 간의 유전성 대사 장애는 요소 회로 장애(urea cycle disorder, UCD) 및 메틸말론산혈증(methylmalonic acidemia, MMA)을 포함한다.
요소 회로 장애(UCD)는 단백질뿐만 아니라 기타 질소 함유 분자의 분해에 의해 생산된 질소 대사의 결함을 초래하는 유전적 돌연변이로부터 비롯된다. UCD는 일반적으로 요소 회로의 처음 4개의 효소, 즉 카르바모일포스페이트 신테타제 I(Carbamoylphosphate Synthetase I, CPSI), 오르니틴 트랜스카르바밀라제(Ornithine Transcarbamylase, OTC), 아르기니노석시네이트 신테타제 결핍(Argininosuccinate Synthetase Deficiency, ASS) 및 아르기노석시네이트 리아제 결핍(Argininosuccinate Lyase Deficiency, ASL), 또는 보조인자 생산자 N-아세틸글루타메이트 신테타제(N-Acetylglutamate Synthetase, NAGS) 중 어느 것의 활성의 심각한 결핍 또는 완전한 부재에 의해 유발되어, 암모니아 및 다른 전구체 대사산물의 축적을 야기한다. UCD는 일반적으로 신생아에서 진단되지만, 늦게 발병하는 UCD가 보고되었다. UCD는 뇌 손상, 인지 결함 및 심지어 사망을 초래할 수 있다. 실제로, 영아돌연사증후군(sudden infant death syndrome, SIDS) 사례의 최대 20%가 UCD와 같은 유전성 대사 장애에 기인할 수 있다고 가정된다.
UCD의 현재 치료는 UCD의 일반적인 증상인 고암모니아혈증의 급성 제어에 초점이 맞춰져 있다. 고암모니아혈증은 신경독성이 높기 때문에, 정정맥 혈액여과(veno-venous hemofiltration)를 포함한 집중 치료 개입이 필요하다. UCD의 장기 치료는 현재 대체 경로 요법, 엄격한 식이 단백질 제한, 요소 회로 중간체 보충 및 이화작용의 엄격한 회피에 의존한다. UCD 환자는 종종 간 이식이 필요하다. 그러나, 간 이식 전에 재발하는 고암모니아혈증의 예방은 어려울 수 있다. 따라서, UCD의 치료를 위한 개선된 조성물 및 방법이 당업계에 필요하다.
간에 영향을 미치는 다른 대사 장애는 상염색체 열성 장애 메틸말론산혈증(MMA)(메틸말론산 뇨증이라고도 함)을 포함한다. MMA는 정상적인 아미노산 대사를 방해한다. 유전된 형태의 메틸말론산혈증은 메틸말로닐-조효소 A(CoA)가 효소 메틸말로닐-CoA 뮤타제에 의해 석시닐-CoA로 전환되는 것을 조절하는 대사 경로의 결함을 유발한다. 이러한 상태의 결과는 특정 지방과 단백질을 적절하게 소화하지 못하는 능력이며, 이는 결국 혈액 내에 메틸말론산의 독성 수준의 축적으로 이어진다. 단독 메틸말론산혈증은 5개의 유전자 MMUT, MMAA, MMAB, MMADHC 또는 MCEE 중 하나의 변화에 의해 유발된다. 호모시스틴뇨증(homocystinuria)을 갖는 메틸말론산혈증은 MMADHC, LMBRD1 및 ABCD4 유전자의 돌연변이에 의해 유발된다.
메틸말론산혈증에 대한 특별한 치료법은 없다. 치료는 현재 증상을 관리하는 것으로 제한되어 있으며, 보상부전(decompensation) 사건의 적극적인 치료, 특별한 단백질 관리 식단, 비타민 B12 반응성 아형을 위한 비타민 B12 보충, 카르니틴과 같은 약물, 및 보상부전 사건으로 이어질 수 있는 스트레스 요인(예컨대, 금식 또는 질병)의 회피를 포함한다. 간 또는 신장 이식(또는 둘 모두)은 일부 환자에게 도움이 되는 것으로 나타났다. 이러한 이식은 메틸말론산을 정상적으로 분해하는 데 도움이 되는 새로운 세포를 신체에 제공한다.
간의 유전성 대사 장애를 포함한 유전성 대사 장애의 치료를 위한 유전자 요법을 개발하려는 이전의 시도는 표적 조직에서 전달된 이식유전자의 장기간 발현을 야기하지 못하는 문제로 어려움을 겪었다. 이 문제는 소아의 간과 같이 빠르게 분열하는 조직에서 특히 두드러진다. AAV 벡터와 같은 기존의 유전자 요법 벡터는 숙주의 게놈 내로의 통합 부족을 겪어, 전달된 이식유전자의 단기간 발현만을 초래한다. 본 개시내용의 조성물 및 방법은 표적 조직에서 전달된 이식유전자의 장기간 발현을 생성하는 트랜스포존/트랜스포사제 기반의 AAV 벡터를 제공함으로써 당업계의 이러한 오래된 필요성에 대한 해결책을 제공한다.
본 개시내용은 5'에서 3' 방향으로: a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열; b) 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열; c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체(insulator) 서열; d) 서열번호: 126의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열; e) 서열번호: 22의 핵산 서열을 포함하는 적어도 하나의 이식유전자 서열; f) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열; g) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열; h) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열; i) 서열번호: 129의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및 j) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열을 포함하는 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 뉴클레오타이드를 제공한다.
본 개시내용은 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 제공하며, 여기서 AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 138의 핵산 서열을 포함한다.
본 개시내용은 5'에서 3' 방향으로: a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열; b) 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열; c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열; d) 서열번호: 132의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열; e) 서열번호: 22의 핵산 서열을 포함하는 적어도 하나의 이식유전자 서열; f) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열; g) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열; h) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열; i) 서열번호: 130의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및 j) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 제공한다.
본 개시내용은 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 제공하며, 여기서 AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 139의 핵산 서열을 포함한다.
본 개시내용은 5'에서 3' 방향으로: a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열; b) 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열; c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열; d) 서열번호: 13의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열; e) 서열번호: 22의 핵산 서열을 포함하는 적어도 하나의 이식유전자 서열; f) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열; g) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열; h) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열; i) 서열번호: 131의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및 j) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열을 포함하는 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 뉴클레오타이드를 제공한다.
본 개시내용은 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 제공하며, 여기서 AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 140의 핵산 서열을 포함한다.
본 개시내용은 5'에서 3' 방향으로: a) 서열번호: 127의 핵산 서열을 포함하는 제1 AAV ITR 서열; b) 서열번호: 126의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열 적어도 하나의 프로모터 서열; c) 서열번호: 48의 핵산 서열을 포함하는 적어도 하나의 트랜스포사제 서열; d) 서열번호: 136의 핵산 서열을 포함하는 폴리A 서열; e) 서열번호: 137의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및 f) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열을 포함하는 AAV 트랜스포사제 폴리뉴클레오타이드를 제공한다.
본 개시내용은 AAV 트랜스포사제 폴리뉴클레오타이드를 제공하며, 여기서 AAV 트랜스포사제 폴리뉴클레오타이드는 서열번호: 144의 핵산 서열을 포함한다.
본 개시내용은 본 개시내용의 AAV piggyBac 트랜스포존 폴리뉴클레오타이드 중 적어도 하나를 포함하는 벡터를 제공한다. 일부 양태에서, 벡터는 바이러스 벡터일 수 있다. 일부 양태에서, 바이러스 벡터는 AAV 바이러스 벡터일 수 있다. 일부 양태에서, AAV 바이러스 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11 바이러스 벡터일 수 있다. 일부 양태에서, AAV 바이러스 벡터는 AAV-KP-1 또는 AAV-NP59 바이러스 벡터일 수 있다. 일부 양태에서, AAV 바이러스 벡터는 AAV-KP-1 바이러스 벡터일 수 있다.
본 개시내용은 본 개시내용의 적어도 하나의 벡터를 포함하는 조성물을 제공한다.
본 개시내용은 본 개시내용의 폴리뉴클레오타이드, 벡터 또는 조성물의 적어도 하나의 치료적 유효량을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 적어도 하나의 대사성 간 장애(MLD)를 치료하는 방법을 제공한다.
본 개시내용은 a) 본 개시내용의 AAV piggyBac 트랜스포존 폴리뉴클레오타이드, 또는 본 개시내용의 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 벡터 또는 조성물; 및 b) 본 개시내용의 AAV 트랜스포사제 폴리뉴클레오타이드, 또는 본 개시내용의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 벡터 또는 조성물을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 적어도 하나의 MLD를 치료하는 방법을 제공한다.
본 개시내용은 이를 필요로 하는 대상체에서 적어도 하나의 MLD의 치료를 위한 본 개시내용의 폴리뉴클레오타이드, 벡터 또는 조성물의 용도를 제공하며, 여기서 폴리뉴클레오타이드, 벡터 또는 조성물은 적어도 하나의 치료적 유효량으로 대상체에 투여하기 위한 것이다.
본 개시내용은 이를 필요로 하는 대상체에서 적어도 하나의 MLD의 치료에서의 용도를 위한 a) 본 개시내용의 AAV piggyBac 트랜스포존 폴리뉴클레오타이드, 또는 본 개시내용의 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 벡터 또는 조성물; 및 b) 본 개시내용의 AAV 트랜스포사제 폴리뉴클레오타이드, 또는 본 개시내용의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 벡터 또는 조성물의 조합을 제공한다.
일부 양태에서, 적어도 하나의 MLD는 N-아세틸글루타메이트 신테타제(NAGS) 결핍, 카르바모일포스페이트 신테타제 I 결핍(CPSI 결핍), 오르니틴 트랜스카르바밀라제(OTC) 결핍, 아르기니노석시네이트 신테타제 결핍(ASSD)(시트룰린혈증 I), 시트린 결핍(시트룰린혈증 II), 아르기니노석시네이트 리아제 결핍(아르기노석신산 뇨증), 아르기나제 결핍(고아르기닌혈증), 오르니틴 트랜스로카제 결핍(HHH 증후군), 메틸말론산혈증(MMA), 진행성 가족성 간내 담즙정체 1형(PFIC1), 진행성 가족성 간내 담즙정체 1형(PFIC2), 진행성 가족성 간내 담즙정체 1형(PFIC3) 또는 이들의 임의의 조합이다. 일부 양태에서, MLD는 OTC 결핍이다.
상기 양태 중 어느 것은 임의의 다른 양태와 조합될 수 있다.
달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 명세서에서, 단수 형태는 문맥이 명백히 달리 지시하지 않는 한 복수도 포함하며, 예로서, 용어 "a", "an" 및 "the"는 단수 또는 복수인 것으로 이해되고, 용어 "또는"은 포괄적인 것으로 이해된다. 예로서, "요소"는 하나 이상의 요소를 의미한다. 명세서 전체에 걸쳐, 단어 "포함하는" 또는 "포함하다"와 같은 변형은 명시된 요소, 완전체 또는 단계, 또는 요소, 완전체 또는 단계의 그룹의 포함을 의미하지만, 임의의 다른 요소, 완전체 또는 단계, 또는 요소, 완전체 또는 단계의 그룹의 배제를 의미하지 않는 것으로 이해될 것이다. 약은 명시된 값의 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.1%, 0.05% 또는 0.01% 이내로 이해될 수 있다. 문맥상 달리 명백하지 않는 한, 본원에 제공된 모든 수치는 용어 "약"에 의해 수식된다.
본원에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 개시내용의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 물질이 하기에 기재되어 있다. 본원에 언급된 모든 간행물, 특허 출원, 특허 및 기타 참고 문헌은 그 전체가 참고로 포함된다. 본원에 인용된 참고 문헌은 청구된 발명에 대한 선행 기술로 인정되는 것은 아니다. 상충되는 경우, 정의를 포함한 본 명세서가 우선할 것이다. 또한, 물질, 방법 및 실시예는 예시일 뿐이며 제한하고자 하는 것이 아니다. 본 개시내용의 다른 특징 및 이점은 다음의 상세한 설명 및 청구범위로부터 명백할 것이다.
상기 및 추가 특징은 첨부 도면과 함께 다음의 상세한 설명으로부터 보다 명확하게 이해될 것이다.
도 1은 본 개시내용의 예시적인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 개략도이다.
도 2는 본 개시내용의 예시적인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 개략도이다.
도 3a는 본 개시내용의 예시적인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 개략도이다.
도 3b는 본 개시내용의 예시적인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 개략도이다.
도 4a는 본 개시내용의 예시적인 AAV 트랜스포사제 폴리뉴클레오타이드의 개략도이다.
도 4b는 본 개시내용의 예시적인 AAV 트랜스포사제 폴리뉴클레오타이드의 개략도이다.
도 5는 본 개시내용의 예시적인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 개략도이다.
도 6은 본 개시내용의 예시적인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 개략도이다.
도 7은 본 개시내용의 예시적인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 개략도이다.
도 8은 본 개시내용의 예시적인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 개략도이다.
도 9는 본 개시내용의 예시적인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 개략도이다.
도 10은 본 개시내용의 다양한 바이러스 벡터로 처리된 마우스에서 측정된 BLI를 나타내는 그래프이다.
도 11은 다양한 농도의 본 개시내용의 다양한 바이러스 벡터로 처리된 마우스에서 측정된 BLI를 나타내는 그래프이다.
도 12는 본 개시내용의 다양한 바이러스 벡터로 처리된 Otcspf-ash 마우스에서 측정된 BLI를 나타내는 그래프이다.
도 13은 Otcspf-ash 마우스에 투여된 본 개시내용의 다양한 바이러스 벡터에 대한 이배체 게놈당 비통합된 벡터 카피 수의 양을 나타내는 일련의 그래프이다.
도 14는 Otcspf-ash 마우스에 투여된 본 개시내용의 다양한 바이러스 벡터에 대한 이배체 게놈당 비통합된 벡터 카피 수 및 이배체 게놈당 통합된 벡터 카피 수의 양을 나타내는 일련의 그래프이다.
도 15는 본 개시내용의 바이러스 벡터로 처리된 Otcspf-ash 마우스에서 쥣과 OTC mRNA의 수준 대비 인간 OTC mRNA 및 SPB mRNA의 양을 나타내는 일련의 그래프이다.
도 16은 본 개시내용의 바이러스 벡터로 처리된 Otcspf-ash 마우스에서 인간 OTC mRNA 또는 SPB mRNA와 이배체 게놈당 총 벡터 카피 수 사이의 상관관계를 나타내는 그래프이다.
도 17은 본 개시내용의 바이러스 벡터로 처리된 유도성 고암모니아혈증 마우스 모델에서의 생존 확률을 나타내는 그래프이다.
도 18은 본 개시내용의 바이러스 벡터로 처리된 유도성 고암모니아혈증 마우스 모델로부터 수득된 혈장 중 암모니아 농도를 나타내는 그래프이다.
도 19는 본 개시내용의 다양한 바이러스 벡터로 처리된 마우스에서 측정된 간 BLI를 나타내는 그래프이다.
도 20은 본 개시내용의 바이러스 벡터로 처리된 마우스에서 쥣과 OTC mRNA의 수준 대비 인간 OTC mRNA의 양을 나타내는 그래프이다.
도 21은 본 개시내용의 바이러스 벡터로 처리된 마우스에서 쥣과 OTC mRNA의 수준 대비 SBP mRNA의 양을 나타내는 그래프이다.
도 22는 본 개시내용의 바이러스 벡터로 처리된 마우스에서 쥣과 OTC 단백질의 수준 대비 인간 OTC 단백질의 양을 나타내는 그래프이다.
도 23은 본 개시내용의 다양한 바이러스 벡터로 처리된 마우스에서 측정된 BLI를 나타내는 그래프이다.
도 24는 본 개시내용의 바이러스 벡터로 처리된 마우스에서 쥣과 OTC mRNA의 수준 대비 인간 OTC mRNA의 양을 나타내는 그래프이다.
도 25는 본 개시내용의 바이러스 벡터로 처리된 마우스에서 쥣과 OTC mRNA의 수준 대비 SBP mRNA의 양을 나타내는 그래프이다.
도 26은 본 개시내용의 바이러스 벡터로 처리된 마우스에서 쥣과 OTC 단백질의 수준 대비 인간 OTC 단백질의 양을 나타내는 그래프이다.
도 27은 본 개시내용의 벡터로 처리된 마우스로부터 단리된 간세포의 면역조직화학 분석을 나타낸다.
본 개시내용은 비제한적으로 우레아 회로 장애(UCD)를 포함하는 대사성 간 장애의 치료를 위한 조성물 및 방법을 제공한다. 조성물 및 방법은 본원에서 더 상세하게 설명된다.
개시내용의 조성물
아데노 관련 바이러스(AAV) piggyBac 트랜스포존 폴리뉴클레오타이드
본 개시내용은 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 조성물을 제공한다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 AAV 역 말단 반복(ITR) 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 piggyBac ITR 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 절연체 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 프로모터 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 이식유전자 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 폴리A 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 자가 절단 펩타이드 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 Int6F 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 Int6P1 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 Int6R 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 JctR 서열을 포함할 수 있다. 일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 MCS 서열을 포함할 수 있다.
AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 제1 piggyBac ITR 서열, 그 다음 제1 절연체 서열, 그 다음 제2 절연체 서열, 그 다음 제2 piggyBac ITR 서열, 및 그 다음 제2 AAV ITR 서열을 포함할 수 있다.
AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있으며, 여기서 제1 절연체 서열과 제2 절연체 서열 사이에는 적어도 하나의 프로모터 서열, 적어도 하나의 이식유전자 서열, 적어도 하나의 자가 절단 펩타이드 서열, 및 적어도 하나의 폴리A 서열의 임의의 조합이 존재한다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있으며, 여기서 제1 절연체 서열과 제2 절연체 서열 사이에는 적어도 하나의 프로모터 서열, 적어도 하나의 이식유전자 서열, 적어도 하나의 자가 절단 펩타이드 서열, 및 적어도 하나의 폴리A 서열의 임의의 조합이 존재한다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 제1 piggyBac ITR 서열, 그 다음 제1 절연체 서열, 그 다음 제2 절연체 서열, 그 다음 제2 piggyBac ITR 서열, 및 그 다음 제2 AAV ITR 서열을 포함할 수 있으며, 여기서 제1 절연체 서열과 제2 절연체 서열 사이에는 적어도 하나의 프로모터 서열, 적어도 하나의 이식유전자 서열, 적어도 하나의 자가 절단 펩타이드 서열, 및 적어도 하나의 폴리A 서열의 임의의 조합이 존재한다.
AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 제1 piggyBac ITR 서열, 그 다음 제1 절연체 서열, 그 다음 적어도 하나의 프로모터 서열, 그 다음 적어도 하나의 이식유전자 서열, 그 다음 폴리A 서열, 그 다음 제2 절연체 서열, 그 다음 제2 piggyBac ITR 서열, 및 그 다음 제2 AAV ITR 서열을 포함할 수 있다.
전술한 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 비제한적인 예에서, 적어도 하나의 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있고, 적어도 하나의 이식유전자 서열은 메틸말로닐-CoA 뮤타제(MUT1) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 2에 나타나 있다.
AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 적어도 하나의 DNA 스페이서 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 적어도 하나의 DNA 스페이서 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 제1 piggyBac ITR 서열, 그 다음 제1 절연체 서열, 그 다음 적어도 하나의 프로모터 서열, 그 다음 적어도 하나의 이식유전자 서열, 그 다음 폴리A 서열, 그 다음 제2 절연체 서열, 그 다음 제2 piggyBac ITR 서열, 그 다음 적어도 하나의 DNA 스페이서 서열 및 그 다음 제2 AAV ITR 서열을 포함할 수 있다.
전술한 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 비제한적 예에서, 적어도 하나의 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있고, 적어도 하나의 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 3a에 나타나 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제2 piggyBac ITR 서열과 제2 AAV ITR 서열 사이에 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 제2 AAV ITR 서열 및 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 제2 AAV ITR 서열 및 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 제1 piggyBac ITR 서열, 그 다음 제1 절연체 서열, 그 다음 적어도 하나의 프로모터 서열, 그 다음 적어도 하나의 이식유전자 서열, 그 다음 폴리A 서열, 그 다음 제2 절연체 서열, 그 다음 제2 piggyBac ITR 서열, 그 다음 제2 AAV ITR 서열 및 그 다음 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
전술한 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 비제한적 예에서, 적어도 하나의 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있고, 적어도 하나의 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 3b에 나타나 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제2 AAV ITR 서열 뒤에 적어도 하나의 DNA 스페이서를 포함할 수 있다. 제2 AAV ITR 서열 다음에 적어도 하나의 DNA 스페이서를 갖는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 비제한적인 예가 도 3b에 나타나 있다.
AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 제1 이식유전자 서열, 적어도 하나의 자가 절단 펩타이드 서열, 적어도 제2 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 제1 이식유전자 서열, 적어도 하나의 자가 절단 펩타이드 서열, 적어도 제2 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 제1 piggyBac ITR 서열, 그 다음 제1 절연체 서열, 그 다음 적어도 하나의 프로모터 서열, 그 다음 제1 이식유전자 서열, 그 다음 적어도 하나의 자가 절단 펩타이드 서열, 그 다음 적어도 제2 이식유전자 서열, 그 다음 폴리A 서열, 그 다음 제2 절연체 서열, 그 다음 제2 piggyBac ITR 서열, 및 그 다음 제2 AAV ITR 서열을 포함할 수 있다.
전술한 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 비제한적인 예에서, 적어도 하나의 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있고, 제1 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 적어도 하나의 자가 절단 펩타이드 서열은 T2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있고, 적어도 제2 이식유전자 서열은 오르니틴 트랜스카르바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 5에 제시되어 있다.
전술한 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 또 다른 비제한적인 예에서, 적어도 하나의 프로모터 서열은 티록신 결합 글로불린(TBG) 프로모터를 포함할 수 있고, 제1 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 적어도 하나의 자가 절단 펩타이드 서열은 T2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있고, 적어도 제2 이식유전자 서열은 루시퍼라제 서열(예컨대, NanoLuc)을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 8에 나타나 있다.
전술한 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 비제한적 예에서, 적어도 하나의 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있고, 제1 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 적어도 하나의 자가 절단 펩타이드 서열은 T2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있고, 적어도 제2 이식유전자 서열은 유도성 카스파제-9(iCAS9) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 7에 나타나 있다.
AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 제1 프로모터 서열, 제1 이식유전자 서열, 적어도 제2 프로모터 서열, 적어도 제2 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있다.
AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 제1 프로모터 서열, 제1 이식유전자 서열, 적어도 제2 프로모터 서열, 적어도 제2 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열, 및 제2 AAV ITR 서열을 포함할 수 있다.
AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 제1 piggyBac ITR 서열, 그 다음 제1 절연체 서열, 그 다음 제1 프로모터 서열, 그 다음 제1 이식유전자 서열, 그 다음 적어도 제2 프로모터 서열, 그 다음 적어도 제2 이식유전자 서열, 그 다음 폴리A 서열, 그 다음 제2 절연체 서열, 그 다음 제2 piggyBac ITR 서열 및 그 다음 제2 AAV ITR 서열을 포함할 수 있다.
전술한 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 비제한적 예에서, 제1 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있고, 제1 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 적어도 제2 프로모터 서열은 HLP를 포함할 수 있고, 적어도 제2 이식유전자 서열은 오르니틴 트랜스카르바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 6에 나타나 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 하나 초과의 이식유전자 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드가 하나 초과의 이식유전자 서열을 포함하는 일부 양태에서, 개별 이식유전자 서열은 자가 절단 펩타이드 서열에 의해 분리될 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드가 하나 초과의 자가 절단 펩타이드 서열을 포함하는 일부 양태에서, 자가 절단 펩타이드 서열은 동일하거나 상이할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 하나 초과의 이식유전자 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드가 하나 초과의 이식유전자 서열을 포함하는 일부 양태에서, AAV piggyBac 트랜스포존은 동일한 폴리펩타이드를 코딩하는 핵산 서열의 다중 카피를 포함할 수 있다. 비제한적인 예에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 이식유전자 서열 및 제2 이식유전자 서열을 포함할 수 있고, 여기서 제1 이식유전자 서열 및 제2 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산을 포함한다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 하나 초과의 프로모터 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드가 하나 초과의 프로모터 서열을 포함하는 일부 양태에서, 프로모터 서열은 동일할 수 있거나 프로모터 서열은 상이할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 제1 이식유전자 서열, 제1 자가 절단 펩타이드 서열, 제2 이식유전자 서열, 적어도 제2 자가 절단 펩타이드 서열, 적어도 제3 이식유전자 서열, 폴리A 서열, 제2 절연체 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 제1 이식유전자 서열, 제1 자가 절단 펩타이드 서열, 제2 이식유전자 서열, 적어도 제2 자가 절단 펩타이드 서열, 적어도 제3 이식유전자 서열, 폴리A 서열, 제2 절연체 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 제1 piggyBac ITR 서열, 그 다음 제1 절연체 서열, 그 다음 적어도 하나의 프로모터 서열, 그 다음 제1 이식유전자 서열, 그 다음 제1 자가 절단 펩타이드 서열, 그 다음 제2 이식유전자 서열, 그 다음 적어도 제2 자가 절단 펩타이드 서열, 그 다음 적어도 제3 이식유전자 서열, 그 다음 폴리A 서열, 그 다음 제2 절연체 서열 및 그 다음 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 제1 이식유전자 서열, 제1 자가 절단 펩타이드 서열, 제2 이식유전자 서열, 적어도 제2 자가 절단 펩타이드 서열, 적어도 제3 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 제1 이식유전자 서열, 제1 자가 절단 펩타이드 서열, 제2 이식유전자 서열, 적어도 제2 자가 절단 펩타이드 서열, 적어도 제3 이식유전자 서열, 폴리A 서열, 제2 절연체 서열, 제2 piggyBac ITR 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 제1 piggyBac ITR 서열, 그 다음 제1 절연체 서열, 그 다음 적어도 하나의 프로모터 서열, 그 다음 제1 이식유전자 서열, 그 다음 제1 자가 절단 펩타이드 서열, 그 다음 제2 이식유전자 서열, 그 다음 적어도 제2 자가 절단 펩타이드 서열, 그 다음 적어도 제3 이식유전자 서열, 그 다음 폴리A 서열, 그 다음 제2 절연체 서열, 그 다음 제2 piggyBac ITR 서열 및 그 다음 제2 AAV ITR 서열을 포함할 수 있다.
전술한 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 비제한적인 예에서, 적어도 하나의 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있고, 제1 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 제2 이식유전자 서열은 형광 단백질 서열(예컨대, GFP 또는 eGFP)을 포함할 수 있고, 적어도 제3 이식유전자 서열은 루시퍼라제 서열(예컨대, NanoLuc)을 포함할 수 있다. 이러한 비제한적인 예에서, 제1 자가 절단 펩타이드 서열 및 적어도 제2 자가 절단 펩타이드 서열 모두는 T2A 펩타이드 또는 GSG-T2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 1에 나타나 있다.
전술한 AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 또 다른 비제한적인 예에서, 적어도 하나의 프로모터 서열은 LP1 프로모터를 포함할 수 있고, 제1 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 제2 이식유전자 서열은 형광 단백질 서열(예컨대, GFP 또는 eGFP)을 포함할 수 있고, 적어도 제3 이식유전자 서열은 루시퍼라제 서열(예컨대, NanoLuc)을 포함할 수 있다. 이러한 비제한적인 예에서, 제1 자가 절단 펩타이드 서열 및 적어도 제2 자가 절단 펩타이드 서열 모두는 T2A 펩타이드 또는 GSG-T2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 9에 나타나 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 104에 제시된 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
AAV ITR 서열
일부 양태에서, AAV ITR 서열은 당업계에 공지된 임의의 AAV ITR 서열을 포함할 수 있다. 일부 양태에서, AAV ITR 서열은 서열번호: 1-4, 93-94, 105-106 및 127에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 AAV ITR 서열은 서열번호: 1과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 AAV ITR 서열은 서열번호: 2와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 AAV ITR 서열은 서열번호: 3과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 AAV ITR 서열은 서열번호: 4와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 AAV ITR 서열은 서열번호: 93과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 AAV ITR 서열은 서열번호: 94와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 AAV ITR 서열은 서열번호: 105와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 AAV ITR 서열은 서열번호: 106과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 AAV ITR 서열은 서열번호: 127과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 AAV ITR 서열은 서열번호: 4와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
piggyBac ITR 서열
일부 양태에서, piggyBac ITR 서열은 당업계에 공지된 임의의 piggyBac ITR 서열을 포함할 수 있다. 일부 양태에서, piggyBac ITR 서열은 서열번호: 5-6, 86-90, 95-96 및 125에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 piggyBac ITR 서열은 서열번호: 5와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 piggyBac ITR 서열은 서열번호: 6과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 piggyBac ITR 서열은 서열번호: 6과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 piggyBac ITR 서열은 서열번호: 5와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 piggyBac ITR 서열은 서열번호: 95와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 piggyBac ITR 서열은 서열번호: 96과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 piggyBac ITR 서열은 서열번호: 125와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 piggyBac ITR 서열은 서열번호: 96과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
본 개시내용의 방법의 일부 양태에서, AAV piggyBac 트랜스포존에서 제1 piggyBac ITR 서열 및/또는 제2 piggyBac ITR 서열과 같은 piggyBac ITR 서열은 잠자는 숲속의 미녀(Sleeping Beauty) 트랜스포존 ITR, 헬라이저(Helraiser) 트랜스포존 ITR, Tol2 트랜스포존 ITR, TcBuster 트랜스포존 ITR 또는 이들의 임의의 조합을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 본 개시내용의 piggyBac ITR 서열은 한쪽 또는 양쪽 말단에서 하기 서열 중 적어도 하나에 의해 측접될 수 있다: 5'-CTAA-3', 5'-TTAG-3', 5'-ATAA-3', 5'-TCAA-3', 5'AGTT-3', 5'-ATTA-3', 5'-GTTA-3', 5'-TTGA-3', 5'-TTTA-3', 5'-TTAC-3', 5'-ACTA-3', 5'-AGGG-3', 5'-CTAG-3', 5'-TGAA-3', 5'-AGGT-3', 5'-ATCA-3', 5'-CTCC-3', 5'-TAAA-3', 5'-TCTC-3', 5'TGAA-3', 5'-AAAT-3', 5'-AATC-3', 5'-ACAA-3', 5'-ACAT-3', 5'-ACTC-3', 5'-AGTG-3', 5'-ATAG-3', 5'-CAAA-3', 5'-CACA-3', 5'-CATA-3', 5'-CCAG-3', 5'-CCCA-3', 5'-CGTA-3', 5'-GTCC-3', 5'-TAAG-3', 5'-TCTA-3', 5'-TGAG-3', 5'-TGTT-3', 5'-TTCA-3', 5'-TTCT-3' 및 5'-TTTT-3'. 일부 양태에서, piggyBac ITR 서열은 5'-TTAA-3'에 의해 측접될 수 있다. 따라서, 본 개시내용의 임의의 AAV 트랜스포사제 폴리뉴클레오타이드, AAV piggyBac 트랜스포존 폴리뉴클레오타이드 및/또는 임의의 간 나노플라스미드는 piggyBac ITR 서열에 측접하는 5'-CTAA-3', 5'-TTAG-3', 5'-ATAA-3', 5'-TCAA-3', 5'AGTT-3', 5'-ATTA-3', 5'- GTTA-3', 5'-TTGA-3', 5'-TTTA-3', 5'-TTAC-3', 5'-ACTA-3', 5'-AGGG-3', 5'-CTAG- 3', 5'-TGAA-3', 5'-AGGT-3', 5'-ATCA-3', 5'-CTCC-3', 5'-TAA-3', 5'-TCTC-3' , 5'TGAA-3', 5'-AAAT-3', 5'-AATC-3', 5'-ACAA-3', 5'-ACAT-3', 5'-ACTC-3', 5' -AGTG-3', 5'-ATAG-3', 5'-CAAA-3', 5'-CACA-3', 5'-CATA-3', 5'-CCAG-3', 5'-CCCA -3', 5'-CGTA-3', 5'-GTCC-3', 5'-TAAG-3', 5'-TCTA-3', 5'-TGAG-3', 5'-TGTT-3 ', 5'-TTCA-3'5'-TTCT-3' 및 5'-TTTT-3' 중 어느 하나를 추가로 포함할 수 있다.
절연체 서열
일부 양태에서, 절연체 서열은 당업계에 공지된 임의의 절연체 서열을 포함할 수 있다. 일부 양태에서, 절연체 서열은 서열번호: 7-8, 77-80 및 91-92에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 절연체 서열은 서열번호: 7과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 절연체 서열은 임의의 서열번호: 8과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 절연체 서열은 서열번호: 77과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 절연체 서열은 임의의 서열번호: 78과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 절연체 서열은 서열번호: 79와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 절연체 서열은 임의의 서열번호: 80과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 제1 절연체 서열은 서열번호: 91과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있고, 제2 절연체 서열은 임의의 서열번호: 92와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
프로모터 서열
일부 양태에서, 프로모터 서열은 당업계에 공지된 임의의 프로모터 서열을 포함할 수 있다. 일부 양태에서, 프로모터 서열은 당업계에 공지된 임의의 간 특이적 프로모터 서열을 포함할 수 있다.
일부 양태에서, 프로모터 서열은 서열번호: 9-16, 69, 107, 126, 132, 145 및 146에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있다. 일부 양태에서, HLP는 서열번호: 9, 107 또는 126과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 LP1 프로모터를 포함할 수 있다. LP1 프로모터는 서열번호: 10 또는 132와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 pp52의 백혈구 특이적 발현(LSP1) 긴 프로모터를 포함할 수 있다. LSP1 긴 프로모터는 서열번호: 11과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 티록신 결합 글로불린(TBG) 프로모터를 포함할 수 있다. TBG 프로모터는 서열번호: 12와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 wTBG 프로모터를 포함할 수 있다. wTBG 프로모터는 서열번호: 13과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 간 조합 번들(HCB) 프로모터를 포함할 수 있다. HCB 프로모터는 서열번호: 14와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 2xApoE-hAAT 프로모터를 포함할 수 있다. 2xApoE-hAAT 프로모터는 서열번호: 15와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 pp52의 백혈구 특이적 발현(LSP1) 및 키메라 인트론 프로모터를 포함할 수 있다. LSP1 및 키메라 인트론 프로모터는 서열번호: 16과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 사이토메갈로바이러스(CMV) 프로모터를 포함할 수 있다. CMV 프로모터는 서열번호: 69와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 TTR 프로모터를 포함할 수 있다. TTR 프로모터는 서열번호: 145와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 프로모터 서열은 TTRm 프로모터를 포함할 수 있다. TTRm 프로모터는 서열번호: 146과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
이식유전자 서열
일부 양태에서, 이식유전자 서열은 메틸말로닐-CoA 뮤타제(MUT1) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 이식유전자 서열은 MUT1 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 여기서 MUT1 폴리펩타이드는 서열번호: 17, 18, 121 또는 122와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 일부 양태에서, MUT1 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 19, 20 또는 111-120에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 이식유전자 서열은 오르니틴 트랜스카르바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 이식유전자 서열은 OTC 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있고, 여기서 OTC 폴리펩타이드는 서열번호: 21, 81, 123 또는 124와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 일부 양태에서, OTC 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 22, 23, 82 및 83에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 이식유전자 서열은 iCAS9 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 이식유전자 서열은 iCAS9 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 여기서 iCAS9 폴리펩타이드는 서열번호: 24 또는 84와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 일부 양태에서, iCAS9 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 25 또는 85에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 이식유전자 서열은 당업계에 공지된 방법에 따라 코돈 최적화될 수 있다.
일부 양태에서, 폴리펩타이드(예컨대, OTC, MUT1 등)를 코딩하는 핵산 서열은 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 서열일 수 있다. 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 서열은 폴리펩타이드를 코딩하는 야생형 인간 핵산 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
서열번호: 19, 20, 22, 23, 82 및 83은 본 개시내용의 폴리뉴클레오타이드, 벡터 및 조성물에 포함될 수 있는 고유한 코돈 최적화된 핵산 서열이다.
일부 양태에서, 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 서열, 예컨대, 서열번호: 19, 20, 22, 23, 82 및 83에 제시된 핵산 서열은 공여자 스플라이스 부위를 포함하지 않을 수 있다. 일부 양태에서, 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 서열은 약 1개, 또는 약 2개, 또는 약 3개, 또는 약 4개, 또는 약 5개, 또는 약 6개, 또는 약 7개, 또는 약 8개, 또는 약 9개 또는 약 10개 이하의 공여자 스플라이스 부위를 포함할 수 있다. 일부 양태에서, 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 서열은 폴리펩타이드를 코딩하는 야생형 인간 핵산 서열과 비교하여 적어도 1개, 또는 적어도 2개, 또는 적어도 3개, 또는 적어도 4개, 또는 적어도 5개, 또는 적어도 6개, 또는 적어도 7개, 또는 적어도 8개, 또는 적어도 9개, 또는 적어도 10개 더 적은 공여자 스플라이스 부위를 포함할 수 있다. 이론에 얽매이지 않고, 코돈 최적화된 핵산 서열에서 공여자 스플라이스 부위의 제거는 크립틱 스플라이싱(cryptic splicing)이 방지됨에 따라 생체내에서 폴리펩타이드의 발현을 예기치 않고 예측할 수 없게 증가시킬 수 있다. 더욱이, 크립틱 스플라이싱은 상이한 대상체 사이에서 달라질 수 있으며, 이는 공여자 스플라이스 부위를 포함하는 폴리펩타이드의 발현 수준이 상이한 대상체 사이에서 예측할 수 없게 달라질 수 있음을 의미한다.
일부 양태에서, 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 서열, 예컨대 서열번호: 19, 20, 22, 23, 82 및 83에 제시된 핵산 서열은 폴리펩타이드를 코딩하는 야생형 인간 핵산 서열의 GC 함량과 상이한 GC 함량을 가질 수 있다. 일부 양태에서, 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 서열의 GC 함량은 폴리펩타이드를 코딩하는 야생형 인간 핵산 서열과 비교하여 전체 핵산 서열에 걸쳐 더 균일하게 분포된다. 이론에 얽매이지 않고, 전체 핵산 서열에 걸쳐 GC 함량을 더 균일하게 분포시킴으로써, 코돈 최적화된 핵산 서열은 전사체의 길이에 걸쳐 더 균일한 용융 온도("Tm")를 나타낸다. 핵산 서열의 전사 및/또는 번역이 중합효소 및/또는 리보솜의 정지를 덜 일으키면서 발생하기 때문에, 용융 온도의 균일성은 인간 대상체에서 코돈 최적화된 핵산의 발현 증가를 예기치 않게 초래한다.
일부 양태에서, 폴리펩타이드를 코딩하는 코돈 최적화된 핵산 서열, 예컨대, 서열번호: 19, 20, 22, 23, 82 및 83에 제시된 핵산 서열은 폴리펩타이드를 코딩하는 야생형 또는 비코돈 최적화된 핵산 서열에 비해 인간 대상체에서 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 50%, 적어도 75%, 적어도 100%, 적어도 200%, 적어도 300%, 적어도 500%, 또는 적어도 1000% 증가된 발현을 나타낸다.
일부 양태에서, 적어도 하나의 이식유전자 서열은 동일한 폴리뉴클레오타이드에 존재하는 적어도 하나의 프로모터 서열에 작동가능하게 연결될 수 있다.
폴리A 서열
일부 양태에서, 폴리A 서열은 당업계에 공지된 임의의 폴리A 서열을 포함할 수 있다. 폴리A 서열의 비제한적 예는, 비제한적으로 SV40 폴리A 서열을 포함한다. 일부 양태에서, 폴리A 서열은 서열번호: 26-27, 97, 108, 128 및 136에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
자가 절단 펩타이드 서열
일부 양태에서, 자가 절단 펩타이드 서열은 당업계에 공지된 임의의 자가 절단 펩타이드 서열을 포함할 수 있다. 일부 양태에서, 자가 절단 펩타이드 서열은 당업계에 공지된 2A 자가 절단 펩타이드 서열을 포함할 수 있다. 자가 절단 펩타이드의 비제한적 예는 T2A 펩타이드, GSG-T2A 펩타이드, E2A 펩타이드, GSG-E2A 펩타이드, F2A 펩타이드, GSG-F2A 펩타이드, P2A 펩타이드, 또는 GSG-P2A 펩타이드를 포함한다.
일부 양태에서, 자가 절단 펩타이드 서열은 T2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 자가 절단 펩타이드 서열은 T2A 펩타이드를 코딩하는 핵산 서열을 포함하고, 여기서 T2A 펩타이드는 서열번호: 28과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
일부 양태에서, 자가 절단 펩타이드 서열은 GSG-T2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 자가 절단 펩타이드 서열은 GSG-T2A 펩타이드를 코딩하는 핵산 서열을 포함하며, 여기서 GSG-T2A 펩타이드는 서열번호: 29와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다. 일부 양태에서, GSG-T2A 펩타이드를 코딩하는 핵산 서열은 서열번호: 30-32 및 135와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 자가 절단 펩타이드 서열은 E2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 자가 절단 펩타이드 서열은 E2A 펩타이드를 코딩하는 핵산 서열을 포함하며, 여기서 E2A 펩타이드는 서열번호: 33과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
일부 양태에서, 자가 절단 펩타이드 서열은 GSG-E2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 자가 절단 펩타이드 서열은 GSG-E2A 펩타이드를 코딩하는 핵산 서열을 포함하며, 여기서 GSG-E2A 펩타이드는 서열번호: 34와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
일부 양태에서, 자가 절단 펩타이드 서열은 F2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 자가 절단 펩타이드 서열은 F2A 펩타이드를 코딩하는 핵산 서열을 포함하며, 여기서 F2A 펩타이드는 서열번호: 35와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
일부 양태에서, 자가 절단 펩타이드 서열은 GSG-F2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 자가 절단 펩타이드 서열은 GSG-F2A 펩타이드를 코딩하는 핵산 서열을 포함하며, 여기서 GSG-F2A 펩타이드는 서열번호: 36과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
일부 양태에서, 자가 절단 펩타이드 서열은 P2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 자가 절단 펩타이드 서열은 P2A 펩타이드를 코딩하는 핵산 서열을 포함하며, 여기서 P2A 펩타이드는 서열번호: 37과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
일부 양태에서, 자가 절단 펩타이드 서열은 GSG-P2A 펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 자가 절단 펩타이드 서열은 GSG-P2A 펩타이드를 코딩하는 핵산 서열을 포함하며, 여기서 GSG-P2A 펩타이드는 서열번호: 38과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
DNA 스페이서 서열
일부 양태에서, DNA 스페이서 서열은 서열번호: 103, 109, 129-131 및 137에 제시된 핵산 서열 중 어느 하나와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
DNA 스페이서 서열은 AAV piggyBac 트랜스포존 폴리뉴클레오타이드 또는 AAV piggyBac 트랜스포사제 폴리뉴클레오타이드 내의 임의의 위치에 위치할 수 있다.
Int6F 서열
일부 양태에서, Int6F 서열은 서열번호: 98과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 일부 양태에서, Int6F 서열은 폴리A 서열과 제2 절연체 서열 사이에 위치할 수 있다.
Int6P1 서열
일부 양태에서, Int6P1 서열은 서열번호: 99와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 일부 양태에서, IntP1 서열은 폴리A 서열과 제2 절연체 서열 사이에 위치할 수 있다.
Int6R 서열
일부 양태에서, Int6R 서열은 서열번호: 100과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 일부 양태에서, Int6R 서열은 폴리A 서열과 제2 절연체 서열 사이에 위치할 수 있다.
JctR 서열
일부 양태에서, JctR 서열은 서열번호: 101과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 일부 양태에서, JctR 서열은 제2 piggyBac ITR 서열과 제2 AAV ITR 서열 사이에 위치할 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 138과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 139와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 140과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 141과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 142와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 143과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
MCS 서열
일부 양태에서, MCS 서열은 서열번호: 102와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 일부 양태에서, MCS 서열은 제2 piggyBac ITR 서열과 제2 AAV ITR 서열 사이에 위치할 수 있다.
AAV 트랜스포사제 폴리뉴클레오타이드
본 개시내용은 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 조성물을 제공한다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 적어도 하나의 AAV 역 말단 반복(ITR) 서열을 포함할 수 있다. 일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 적어도 하나의 프로모터 서열을 포함할 수 있다. 일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 적어도 하나의 트랜스포사제 서열을 포함할 수 있다. 일부 양태에서, AAV 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 폴리A 서열을 포함할 수 있다. 일부 양태에서, AAV 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 제1 AAV ITR 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 트랜스포사제 서열, 폴리A 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 트랜스포사제 서열, 폴리A 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 적어도 하나의 프로모터 서열, 그 다음 적어도 하나의 트랜스포사제 서열, 그 다음 폴리A 서열 및 그 다음 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 제1 AAV ITR 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 트랜스포사제 서열, 폴리A 서열, 적어도 하나의 DNA 스페이서 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 트랜스포사제 서열, 폴리A 서열, 적어도 하나의 DNA 스페이서 서열 및 제2 AAV ITR 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 적어도 하나의 프로모터 서열, 그 다음 적어도 하나의 트랜스포사제 서열, 그 다음 폴리A 서열, 그 다음 적어도 하나의 DNA 스페이서 서열 및 그 다음 제2 AAV ITR 서열을 포함할 수 있다.
전술한 AAV 트랜스포사제 폴리뉴클레오타이드의 비제한적인 예에서, 적어도 하나의 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있고, 적어도 하나의 트랜스포사제 서열은 Super piggyBac™(SPB) 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 4a에 나타나 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 도 4a에 제시된 비제한적 예에 나타낸 바와 같이 폴리A 서열과 제2 AAV ITR 서열 사이에 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 제1 AAV ITR 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 트랜스포사제 서열, 폴리A 서열, 제2 AAV ITR 서열 및 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 5'에서 3' 방향으로 제1 AAV ITR 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 트랜스포사제 서열, 폴리A 서열, 제2 AAV ITR 서열 및 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 제1 AAV ITR 서열, 그 다음 적어도 하나의 프로모터 서열, 그 다음 적어도 하나의 트랜스포사제 서열, 그 다음 폴리A 서열, 그 다음 제2 AAV ITR 서열 및 그 다음 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
전술한 AAV 트랜스포사제 폴리뉴클레오타이드의 비제한적인 예에서, 적어도 하나의 프로모터 서열은 하이브리드 간 프로모터(HLP)를 포함할 수 있고, 적어도 하나의 트랜스포사제 서열은 Super piggyBac™(SPB) 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. AAV piggyBac 트랜스포존 폴리뉴클레오타이드의 이러한 비제한적인 예가 도 4b에 나타나 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 도 4b에 제시된 비제한적 예에 나타낸 바와 같이, 제2 AAV ITR 서열 이후에 적어도 하나의 DNA 스페이서 서열을 포함할 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 서열번호: 110에 제시된 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, AAV 트랜스포사제 폴리뉴클레오타이드는 서열번호: 144에 제시된 서열과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
트랜스포사제 서열
일부 양태에서, 트랜스포사제 서열은 당업계에 공지된 임의의 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 트랜스포사제 서열은 piggyBac™(PB) 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 트랜스포사제 서열은 piggyBac 유사(PBL) 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 트랜스포사제 서열은 Super piggyBac™(SPB) 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다.
PB 트랜스포존 및 PB, PBL 및 SPB 트랜스포사제의 비제한적 예는 미국 특허 제6,218,182호; 미국 특허 제6,962,810호; 미국 특허 제8,399,643호 및 PCT 공개 WO 제2010/099296호에 상세하게 기재되어 있다.
PB, PBL 및 SPB 트랜스포사제는 트랜스포존의 말단에 있는 트랜스포존 특이적 역 말단 반복 서열(ITR)을 인식하고 염색체 부위 내의 서열 5'-TTAA-3'(TTAA 표적 서열)에서의 ITR 사이에 내용물을 삽입한다. PB 또는 PBL 트랜스포존의 표적 서열은 5'-CTAA-3', 5'-TTAG-3', 5'-ATAA-3', 5'-TCAA-3', 5'AGTT-3', 5'-ATTA-3', 5'-GTTA-3', 5'-TTGA-3', 5'-TTTA-3', 5'-TTAC-3', 5'-ACTA-3', 5'-AGGG-3', 5'-CTAG-3', 5'-TGAA-3', 5'-AGGT-3', 5'-ATCA-3', 5'-CTCC-3', 5'-TAAA-3', 5'-TCTC-3', 5'TGAA-3', 5'-AAAT-3', 5'-AATC-3', 5'-ACAA-3', 5'-ACAT-3', 5'-ACTC-3', 5'-AGTG-3', 5'-ATAG-3', 5'-CAAA-3', 5'-CACA-3', 5'-CATA-3', 5'-CCAG-3', 5'-CCCA-3', 5'-CGTA-3', 5'-GTCC-3', 5'-TAAG-3', 5'-TCTA-3', 5'-TGAG-3', 5'-TGTT-3', 5'-TTCA-3', 5'-TTCT-3' 및 5'-TTTT-3'을 포함하거나 구성될 수 있다. PB 또는 PBL 트랜스포존 시스템은 ITR 사이에 포함될 수 있는 관심 유전자에 대한 페이로드(payload) 제한이 없다.
하나 이상의 PB, PBL 및 SPB 트랜스포사제에 대한 예시적인 아미노산 서열은 미국 특허 제6,218,185호; 미국 특허 제6,962,810호 및 미국특허 제8,399,643호에 개시되어 있다. 바람직한 양태에서, PB 트랜스포사제는 서열번호: 39와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 아미노산 서열을 포함하거나 구성된다.
PB 또는 PBL 트랜스포사제는 서열번호: 39의 서열의 위치 30, 165, 282, 및/또는 538 중 2개 이상, 3개 이상 또는 각각에서 아미노산 치환을 갖는 아미노산 서열을 포함하거나 구성될 수 있다. 트랜스포사제는 서열번호: 39의 서열의 아미노산 서열을 포함하거나 구성된 SPB 트랜스포사제일 수 있고, 여기서 위치 30에서의 아미노산 치환은 이소류신(I)에 대한 발린(V)의 치환일 수 있고, 위치 165에서의 아미노산 치환은 글리신(G)에 대한 세린(S)의 치환일 수 있으며, 위치 282에서의 아미노산 치환은 메티오닌(M)에 대한 발린(V)의 치환일 수 있고, 위치 538에서의 아미노산 치환은 아스파라긴(N)에 대한 라이신(K)의 치환일 수 있다. 바람직한 양태에서, SPB 트랜스포사제는 서열번호: 40과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 아미노산 서열을 포함하거나 구성된다.
트랜스포사제가 위치 30, 165, 282 및/또는 538에서 상기 기재된 돌연변이를 포함하는 특정 양태에서, PB, PBL 및 SPB 트랜스포사제는 서열번호: 39 또는 서열번호: 40의 서열의 위치 3, 46, 82, 103, 119, 125, 177, 180, 185, 187, 200, 207, 209, 226, 235, 240, 241, 243, 258, 296, 298, 311, 315, 319, 327, 328, 340, 421, 436, 456, 470, 486, 503, 552, 570 및 591 중 하나 이상에 아미노산 치환을 추가로 포함할 수 있고, 이는 PCT 공개 WO 제2019/173636호 및 제PCT/US2019/049816호에 더 상세히 기재되어 있다.
바람직한 양태에서, PB 트랜스포사제는 서열번호: 41과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 아미노산 서열을 포함하거나 구성된다.
PB 또는 PBL 트랜스포사제는 서열번호: 41의 서열의 위치 29, 164, 281, 및/또는 537 중 2개 이상, 3개 이상 또는 각각에서 아미노산 치환을 갖는 아미노산 서열을 포함하거나 구성될 수 있다. 트랜스포사제는 서열번호: 41의 서열의 아미노산 서열을 포함하거나 구성된 SPB 트랜스포사제일 수 있고, 여기서 위치 29에서의 아미노산 치환은 이소류신(I)에 대한 발린(V)의 치환일 수 있고, 위치 164에서의 아미노산 치환은 글리신(G)에 대한 세린(S)의 치환일 수 있으며, 위치 281에서의 아미노산 치환은 메티오닌(M)에 대한 발린(V)의 치환일 수 있고, 위치 537에서의 아미노산 치환은 아스파라긴(N)에 대한 라이신(K)의 치환일 수 있다. 바람직한 양태에서, SPB 트랜스포사제는 서열번호: 42와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 임의의 백분율) 동일한 아미노산 서열을 포함하거나 구성된다.
트랜스포사제가 위치 29, 164, 281 및/또는 537에서 전술한 돌연변이를 포함하는 특정 양태에서, PB, PBL 및 SPB 트랜스포사제는 서열번호: 41 또는 서열번호: 42의 서열의 위치 2, 45, 81, 102, 118, 124, 176, 179, 184, 186, 199, 206, 208, 225, 234, 239, 240, 242, 257, 295, 297, 310, 314, 318, 326, 327, 339, 420, 435, 455, 469, 485, 502, 551, 569 및 590 중 하나 이상에 아미노산 치환을 추가로 포함할 수 있고, 이는 PCT 공개 WO 제2019/173636호 및 제PCT/US2019/049816호에 더 상세히 기재되어 있다.
PB, PBL 또는 SPB 트랜스포사제는 PCT 공개 WO 제2019/173636호 및 제PCT/US2019/049816호에 더 상세히 기재된 바와 같이 곤충, 척추동물, 갑각류 또는 미삭동물(urochordate)로부터 단리되거나 유래될 수 있다. 바람직한 양태에서, PB, PBL 또는 SPB 트랜스포사제는 곤충 트리코플루시아 니(Trichoplusia ni, GenBank 수탁 번호 AAA87375) 또는 봄빅스 모리(Bombyx mori, GenBank 수탁 번호 BAD11135)로부터 단리되거나 유래된다.
과활성 PB 또는 PBL 트랜스포사제는 그것이 유래된 자연 발생 변이체보다 더 활성인 트랜스포사제이다. 바람직한 양태에서, 과활성 PB 또는 PBL 트랜스포사제는 봄빅스 모리 또는 제노푸스 트로피칼리스(Xenopus tropicalis)로부터 단리되거나 유래된다. 과활성 PB 또는 PBL 트랜스포사제의 예는 미국 특허 제6,218,185호; 미국 특허 제6,962,810호, 미국 특허 제8,399,643호 및 WO 제2019/173636호에 개시되어 있다. 과활성 아미노산 치환의 목록은 미국 특허 제10,041,077호에 개시되어 있다.
일부 양태에서, PB, PBL 또는 SPB 트랜스포사제는 통합 결핍이다. 통합 결핍 PB, PBL 또는 SPB 트랜스포사제는 그의 상응하는 트랜스포존을 절제할 수 있지만 상응하는 야생형 트랜스포사제보다 더 낮은 빈도로 절제된 트랜스포존을 통합하는 트랜스포사제이다. 통합 결핍 PB, PBL 또는 SPB 트랜스포사제의 예는 미국 특허 제6,218,185호; 미국 특허 제6,962,810호, 미국 특허 제8,399,643호 및 WO 제2019/173636호에 개시되어 있다. 통합 결핍 아미노산 치환의 목록은 미국 특허 제10,041,077호에 개시되어 있다.
일부 양태에서, PB, PBL 또는 SPB 트랜스포사제는 핵 국소화 신호에 융합될 수 있다. 핵 국소화 신호에 융합된 PB, PBL 또는 SPB 트랜스포사제의 예는 미국 특허 제6,218,185호; 미국 특허 제6,962,810호, 미국 특허 제8,399,643호 및 WO 제2019/173636호에 개시되어 있다. 핵 국소화 신호는 서열번호: 43과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 핵 국소화 신호는 서열번호: 44와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성되는 핵산 서열에 의해 코딩될 수 있다.
일부 양태에서, 핵 국소화 신호는 NLS와 PB, PBL 또는 SPB 사이에 위치한 G4S 링커를 사용하여 PB, PBL 또는 SPB 트랜스포사제에 융합될 수 있다. G4S 링커는 서열번호: 45와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. G4S 링커는 서열번호: 46과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성되는 핵산 서열에 의해 코딩될 수 있다.
일부 양태에서, 트랜스포사제 서열은 NLS에 융합된 SBP 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 여기서 NLS에 융합된 SBP 트랜스포사제 폴리펩타이드는 서열번호: 47과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다. 일부 양태에서, NLS에 융합된 SBP 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 48에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 트랜스포사제 서열은 NLS에 융합된 SBP 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 여기서 NLS에 융합된 SBP 트랜스포사제 폴리펩타이드는 서열번호: 49와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다. 일부 양태에서, NLS에 융합된 SBP 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 50에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 트랜스포사제 서열은 잠자는 숲속의 미녀 트랜스포사제 폴리펩타이드(예컨대, 미국 특허 제9,228,180호에 개시된 바와 같음)를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 트랜스포사제 서열은 과활성 잠자는 숲속의 미녀(SB100X) 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 잠자는 숲속의 미녀 트랜스포사제는 서열번호: 51 및 52와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나 구성된다. 바람직한 양태에서, 과활성 잠자는 숲속의 미녀(SB100X) 트랜스포사제는 서열번호: 53 및 54와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
일부 양태에서, 트랜스포사제 서열은 헬리트론 트랜스포사제 폴리펩타이드(예를 들어, WO 제2019/173636호에 개시된 바와 같음)를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 헬리트론 트랜스포사제 폴리펩타이드는 서열번호: 55 또는 56과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
일부 양태에서, 트랜스포사제 서열은 Tol2 트랜스포사제 폴리펩타이드(예를 들어, WO 제019/173636호에 개시된 바와 같음)를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, Tol2 트랜스포사제 폴리펩타이드는 서열번호: 57 또는 58과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다.
일부 양태에서, 트랜스포사제 서열은 TcBuster 트랜스포사제 폴리펩타이드(예를 들어, WO 제2019/173636호에 개시된 바와 같음) 또는 돌연변이 TcBuster 트랜스포사제 폴리펩타이드(PCT 공개 번호 WO 제2019/173636호 및 제PCT/US2019/049816호에 더 상세히 기술된 바와 같음)를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, TcBuster 트랜스포사제 폴리펩타이드는 서열번호: 59 또는 60과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다. TcBuster 트랜스포사제를 코딩하는 폴리뉴클레오타이드는 자연 발생 핵산 서열 또는 비자연 발생 핵산 서열을 포함하거나 구성될 수 있다.
간 특이적 프로모터를 시험하기 위한 나노플라스미드
본 개시내용은 본원에서 "간 나노플라스미드"로 지칭되는, 간 특이적 프로모터를 시험하기 위한 나노플라스미드를 포함하는 조성물을 제공한다.
일부 양태에서, 간 나노플라스미드는 적어도 하나의 piggyBac ITR 서열을 포함할 수 있다. 일부 양태에서, 간 나노플라스미드는 적어도 하나의 절연체 서열을 포함할 수 있다. 일부 양태에서, 간 나노플라스미드는 적어도 하나의 프로모터 서열을 포함할 수 있다. 일부 양태에서, 간 나노플라스미드는 적어도 하나의 형광 단백질 서열을 포함할 수 있다. 일부 양태에서, 간 나노플라스미드는 적어도 하나의 자가 절단 펩타이드 서열을 포함할 수 있다. 일부 양태에서, 간 나노플라스미드는 적어도 하나의 루시퍼라제 서열을 포함할 수 있다. 일부 양태에서, 간 나노플라스미드는 적어도 하나의 폴리A 서열을 포함할 수 있다.
간 나노플라스미드는 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 형광 단백질 서열, 적어도 하나의 자가 절단 펩타이드 서열, 루시페라제 서열, 폴리A 서열, 제2 절연체 서열 및 제2 piggyBac ITR 서열을 포함할 수 있다. 일부 양태에서, 간 나노플라스미드는 5'에서 3' 방향으로 제1 piggyBac ITR 서열, 제1 절연체 서열, 적어도 하나의 프로모터 서열, 형광 단백질 서열, 적어도 하나의 자가 절단 펩타이드 서열, 루시퍼라제 서열, 폴리A 서열, 제2 절연체 서열 및 제2 piggyBac ITR 서열을 포함할 수 있다.
본 개시내용의 일부 양태에서, 이식유전자 서열은 형광 단백질 서열을 포함할 수 있다.
일부 양태에서, 형광 단백질 서열은 eGFP 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 형광 단백질 서열은 eGFP 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 여기서 eGFP 폴리펩타이드는 서열번호: 61 또는 62와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다. 일부 양태에서, eGFP 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 63, 64 또는 133에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
본 개시내용의 일부 양태에서, 이식유전자 서열은 루시퍼라제 서열을 포함할 수 있다.
일부 양태에서, 루시페라제 서열은 fLuc2 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, 루시퍼라제 서열은 fLuc2 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있으며, 여기서 fLuc2 폴리펩타이드는 서열번호: 65 또는 66과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 아미노산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성된다. 일부 양태에서, eGFP 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 67 또는 68에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
일부 양태에서, 루시퍼라제 서열은 나노루시페라제(nLuc) 폴리펩타이드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 양태에서, nLuc 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 134에 제시된 서열 중 어느 것과 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100%(또는 그 사이의 백분율) 동일한 핵산 서열을 포함하거나, 본질적으로 구성되거나, 또는 구성될 수 있다.
본 개시내용의 벡터
본 개시내용은 벡터를 포함하는 조성물을 제공하며, 여기서 벡터는 적어도 하나의 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 폴리뉴클레오타이드를 포함한다. 적어도 하나의 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 벡터는 본원에서 "AAV piggyBac 트랜스포존 벡터"로 지칭된다.
본 개시내용은 벡터를 포함하는 조성물을 제공하며, 여기서 벡터는 적어도 하나의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함한다. 적어도 하나의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 벡터는 본원에서 "AAV 트랜스포사제 벡터"로 지칭된다.
본 개시의 벡터는 바이러스 벡터 또는 재조합 벡터일 수 있다. 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노 관련 바이러스 또는 이들의 임의의 조합으로부터 단리되거나 유래된 서열을 포함할 수 있다. 바이러스 벡터는 아데노 관련 바이러스(AAV)로부터 단리되거나 유래된 서열을 포함할 수 있다. 바이러스 벡터는 재조합 AAV(rAAV)를 포함할 수 있다.
예시적인 아데노 관련 바이러스 및 재조합 아데노 관련 바이러스는 비제한적으로 모든 혈청형(예컨대, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV11)을 포함한다. 예시적인 아데노 관련 바이러스 및 재조합 아데노 관련 바이러스는 비제한적으로 자가 상보적 AAV(scAAV) 및 하나의 혈청형의 게놈 및 또 다른 혈청형(예컨대, AAV2/5, AAV-DJ 및 AAV-DJ8)의 캡시드를 함유하는 AAV 하이브리드를 포함한다. 예시적인 아데노 관련 바이러스 및 재조합 아데노 관련 바이러스는 비제한적으로 rAAV-LK03, AAV-KP-1(AAV-KP1로도 지칭됨; 문헌[Kerun et al. JCI Insight, 2019; 4(22):e131610]에 상세히 기재됨) 및 AAV-NP59(문헌[Paulk et al. Molecular Therapy, 2018; 26(1): 289-303]에 상세히 기재됨)를 포함한다.
본 개시내용은 적어도 하나의 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 복수의 AAV-KP-1 입자를 포함하는 조성물을 제공한다. 본 개시내용은 적어도 하나의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 복수의 AAV-KP-1 입자를 포함하는 조성물을 제공한다. 본 개시내용은 적어도 하나의 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 복수의 AAV-KP-1 입자 및 적어도 하나의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 복수의 AAV-KP-1 입자를 포함하는 조성물을 제공한다.
본 개시내용은 적어도 하나의 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 복수의 AAV-NP59 입자를 포함하는 조성물을 제공한다. 본 개시내용은 적어도 하나의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 복수의 AAV-NP59 입자를 포함하는 조성물을 제공한다. 본 개시내용은 적어도 하나의 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 복수의 AAV-NP59 입자 및 적어도 하나의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 복수의 AAV-NP59 입자를 포함하는 조성물을 제공한다.
본 개시내용의 바이러스 벡터 및 바이러스 입자는 당업계에 공지된 표준 방법을 사용하여 생성될 수 있다.
일부 양태에서, 본 개시내용의 AAV-KP-1 입자는 KP-1 캡시드 벡터를 사용하여 생산될 수 있으며, 여기서 KP-1 캡시드 벡터는 서열번호: 70 및 서열번호: 71의 핵산 서열 중 적어도 하나를 포함한다. 일부 양태에서, 본 개시내용의 AAV-KP-1 입자는 AAV 벡터 패키징 플라스미드를 사용하여 생성될 수 있고, 여기서 AAV 벡터 패키징 플라스미드는 서열번호: 75 및 서열번호: 76의 핵산 서열 중 적어도 하나를 포함한다.
일부 양태에서, 본 개시내용의 AAV-NP59 입자는 NP-59 캡시드 벡터를 사용하여 생산될 수 있으며, 여기서 NP-59 캡시드 벡터는 서열번호: 72, 서열번호: 73 및 서열번호: 74의 핵산 서열 중 적어도 하나를 포함한다. 일부 양태에서, 본 개시내용의 AAV-NP59 입자는 AAV 벡터 패키징 플라스미드를 사용하여 생산될 수 있으며, 여기서 AAV 벡터 패키징 플라스미드는 서열번호: 75 및 서열번호: 76의 핵산 서열 중 적어도 하나를 포함한다.
본원에 개시된 세포 전달 조성물(예컨대, 폴리뉴클레오타이드, 벡터)은 치료 단백질 또는 치료제를 코딩하는 핵산을 포함할 수 있다. 치료 단백질의 예는 PCT 공개 WO 제2019/173636호 및 제PCT/US2019/049816호에 개시된 것들을 포함한다. 치료 단백질은 또한 비제한적으로 이식유전자 서열의 일부로서 본원에 기재된 임의의 폴리펩타이드(예컨대, OTC, MUT1 등)를 포함할 수 있다.
제제, 투여량 및 투여 방식
본 개시내용은 본원에 기재된 조성물의 투여를 위한 제제, 투여량 및 방법을 제공한다.
개시된 조성물 및 약제학적 조성물은 비제한적으로 희석제, 결합제, 안정화제, 완충제, 염, 친유성 용매, 보존제, 보조제 등과 같은 임의의 적합한 보조제 중 적어도 하나를 추가로 포함할 수 있다. 약제학적으로 허용가능한 보조제가 바람직하다. 이러한 멸균 용액의 비제한적 예 및 제조 방법은 비제한적으로 문헌[Gennaro, Ed., Remington's Pharmaceutical Sciences, 18th Edition, Mack Publishing Co. (Easton, Pa.) 1990 and in the “Physician's Desk Reference”, 52nd ed., Medical Economics (Montvale, N.J.) 1998]과 같이 당업계에 널리 알려져 있다. 당업계에 잘 알려져 있거나 본원에 기재된 바와 같은 단백질 스캐폴드, 단편 또는 변이체 조성물의 투여 방식, 용해도 및/또는 안정성에 적합한 약제학적으로 허용가능한 담체가 일상적으로 선택될 수 있다.
사용에 적합한 약제학적 부형제 및 첨가제의 비제한적 예는 단백질, 펩타이드, 아미노산, 지질 및 탄수화물(예컨대, 단당류, 이당류, 삼당류, 사당류 및 올리고당류를 포함하는 당; 유도체화된 당, 예컨대 알디톨, 알돈산, 에스테르화 당 등, 및 다당류 또는 당 중합체)을 포함하며, 이는 단독으로 또는 조합하여 1-99.99 중량% 또는 부피%를 포함하여 단일 또는 조합으로 존재할 수 있다. 단백질 부형제의 비제한적인 예는 혈청 알부민, 예컨대 인간 혈청 알부민(HSA), 재조합 인간 알부민(rHA), 젤라틴, 카제인 등을 포함한다. 완충 능력에서도 기능할 수 있는 대표적인 아미노산/단백질 성분은 알라닌, 글리신, 아르기닌, 베타인, 히스티딘, 글루탐산, 아스파르트산, 시스테인, 라이신, 류신, 이소류신, 발린, 메티오닌, 페닐알라닌, 아스파탐 등을 포함한다. 한 가지 바람직한 아미노산은 글리신이다.
사용에 적합한 탄수화물 부형제의 비제한적 예는 단당류, 예컨대 프럭토스, 말토스, 갈락토스, 글루코스, D-만노스, 소르보스 등; 이당류, 예컨대 락토스, 수크로스, 트레할로스, 셀로비오스 등; 다당류, 예컨대 라피노스, 멜레지토스, 말토덱스트린, 덱스트란, 전분 등; 및 알디톨, 예컨대 만니톨, 자일리톨, 말티톨, 락티톨, 자일리톨 소르비톨(글루시톨), 미오이노시톨 등을 포함한다. 바람직하게는, 탄수화물 부형제는 만니톨, 트레할로스 및/또는 라피노스이다.
조성물은 또한 완충제 또는 pH 조절제를 포함할 수 있으며; 일반적으로 완충제는 유기 산 또는 염기로부터 제조된 염이다. 대표적인 완충제는 유기산 염, 예컨대 시트르산, 아스코르브산, 글루콘산, 탄산, 타르타르산, 석신산, 아세트산 또는 프탈산의 염; 트리스, 트로메타민 염산염 또는 인산염 완충제를 포함한다. 바람직한 완충제는 시트레이트와 같은 유기산 염이다.
추가로, 개시된 조성물은 중합체성 부형제/첨가제, 예컨대 폴리비닐피롤리돈, 피콜(중합체성 당), 덱스트레이트(예컨대, 사이클로덱스트린, 예컨대 2-하이드록시프로필-β-사이클로덱스트린), 폴리에틸렌 글리콜, 향미제, 항미생물제, 감미제, 항산화제, 대전방지제, 계면활성제(예컨대, "TWEEN 20" 및 "TWEEN 80"과 같은 폴리소르베이트), 지질(예컨대, 인지질, 지방산), 스테로이드(예컨대, 콜레스테롤) 및 킬레이트제(예컨대, EDTA)를 포함할 수 있다.
본원에 개시된 조성물 또는 약제학적 조성물의 치료적 유효량을 투여하기 위해 많은 공지되고 개발된 방식이 사용될 수 있다. 투여 방식의 비제한적인 예는 볼루스, 협측, 주입, 관절내, 기관지내, 복강내, 피막내, 연골내, 강내, 복내, 소뇌내, 뇌실내, 결장내, 자궁경부내, 위내, 간내, 병변내, 근육내, 심근내, 비강내, 안내, 골내(intraosseous, intraosteal), 골반내, 심낭내, 복강내, 흉막내, 전립선내, 폐내, 직장내, 신장내, 망막내, 척수내, 활액내, 흉강내, 자궁내, 종양내, 정맥내, 방광내, 경구, 비경구, 직장, 설하, 피하, 경피 또는 질 수단을 포함한다.
본 개시내용의 조성물은 특히 액체 용액 또는 현탁액의 형태로 비경구(피하, 근육내 또는 정맥내) 또는 임의의 다른 투여를 위한 사용을 위해; 비제한적으로 크림 및 좌제와 같은 특히 반고체 형태로 질 또는 직장 투여에 사용하기 위해; 비제한적으로 정제 또는 캡슐의 형태와 같은 협측 또는 설하 투여를 위해; 또는 비제한적으로 분말, 점비제 또는 에어로졸 또는 특정 제제의 형태와 같이 비강내로; 또는 비제한적으로 피부 구조를 변형시키거나 경피 패치에서 약물 농도를 증가시키기 위해 디메틸 설폭사이드와 같은 화학적 향상제(Junginger, et al. In "Drug Permeation Enhancement;" Hsieh, D. S., Eds., pp. 59-90 (Marcel Dekker, Inc. New York 1994,), 또는 피부 상에 단백질 및 펩타이드를 함유하는 제제의 도포(WO 제98/53847호), 또는 전기천공과 같이 일시적 전달 경로를 생성하거나, 또는 이온영동법(iontophoresis)과 같은 피부를 통한 하전된 약물의 이동성을 개선하기 위한 전기장의 적용, 또는 초음파영동법(iontophoresis)과 같은 초음파의 적용(미국 특허 제4,309,989호 및 제4,767,402호)을 가능하게 하는 산화제를 갖는 겔, 연고, 로션, 현탁액 또는 패치 전달 시스템과 같이 경피로 제조될 수 있다(상기 간행물 및 특허는 참고로 본원에 전체적으로 포함됨).
비경구 투여를 위해, 본원에 개시된 임의의 조성물은 약제학적으로 허용가능한 비경구 비히클과 함께 또는 별도로 제공되는 용액, 현탁액, 유화액, 입자, 분말, 또는 동결건조 분말로서 제제화될 수 있다. 비경구 투여용 제제는 일반적인 부형제로서 멸균수 또는 식염수, 폴리알킬렌 글리콜, 예컨대 폴리에틸렌 글리콜, 식물 기원의 오일, 수소화된 나프탈렌 등을 함유할 수 있다. 주사용 수성 또는 유성 현탁액은 공지된 방법에 따라 적절한 유화제 또는 가습제 및 현탁제를 사용하여 제조될 수 있다. 주사용 제제는 수용액, 멸균 주사용 용액 또는 용매 중의 현탁액과 같은 무독성, 비경구 투여가능한 희석제일 수 있다. 사용가능한 비히클 또는 용매로서, 물, 링거액, 등장성 식염수 등이 허용되며; 일반 용매 또는 현탁 용매로서, 멸균 비휘발성 오일이 사용될 수 있다. 이러한 목적을 위해, 천연 또는 합성 또는 반합성 지방유 또는 지방산; 천연 또는 합성 또는 반합성 모노- 또는 디- 또는 트리-글리세라이드를 포함하는 임의의 종류의 비휘발성 오일 및 지방산이 사용될 수 있다. 비경구 투여는 당업계에 공지되어 있으며, 비제한적으로 통상적인 주사 수단, 미국 특허 제5,851,198호에 기재된 바와 같은 기체 가압 무바늘 주사 장치, 및 미국 특허 제5,839,446호에 기재된 바와 같은 레이저 천공기 장치를 포함한다.
경구 투여용 제제는 인공적으로 장벽의 투과성을 증가시키기 위해 보조제(예컨대, 레조르시놀 및 비이온성 계면활성제, 예컨대 폴리옥시에틸렌 올레일 에테르 및 n-헥사데실폴리에틸렌 에테르)의 공동 투여뿐만 아니라 효소 분해를 억제하기 위해 효소적 억제제(예컨대, 췌장 트립신 억제제, 디이소프로필플루오로포스페이트(DFF) 및 트라실롤)의 공동 투여에 의존한다. 단백질 및 단백질 스캐폴드를 포함하는 친수성 제제 및 경구, 협측, 점막, 비강, 폐, 질 막횡단, 또는 직장 투여용으로 의도된 적어도 2개의 계면활성제의 조합의 전달을 위한 제제가 미국 특허 제6,309,663호에 기재되어 있다. 경구 투여용 고체 유형 투여 형태의 활성 성분 화합물은 수크로스, 락토스, 셀룰로스, 만니톨, 트레할로스, 라피노스, 말티톨, 덱스트란, 전분, 한천, 아르기네이트, 키틴, 키토산, 펙틴, 트라가칸트 검, 아라비아 검, 젤라틴, 콜라겐, 카제인, 알부민, 합성 또는 반합성 중합체, 및 글리세라이드를 포함하는 적어도 하나의 첨가제와 혼합될 수 있다. 이러한 투여 형태는 또한 다른 유형의 첨가제, 예컨대 불활성 희석제, 윤활제, 예컨대 마그네슘 스테아레이트, 파라벤, 보존제, 예컨대 소르브산, 아스코르브산, 알파-토코페롤, 항산화제, 예컨대 시스테인, 붕해제, 결합제, 증점제, 완충제, 감미제, 향미제, 방향제 등을 함유할 수 있다.
정제 및 환제는 장용 코팅 제제로 추가로 가공될 수 있다. 경구 투여용 액상 제제는 의약용으로 허용가능한 유화액, 시럽, 엘릭시르, 현탁액 및 용액 제제를 포함한다. 이들 제제는 상기 분야에서 통상적으로 사용되는 불활성 희석제, 예컨대 물을 함유할 수 있다. 리포솜은 또한 인슐린과 헤파린을 위한 약물 전달 시스템으로서 설명되었다(미국 특허 제4,239,754호). 보다 최근에는, 혼합된 아미노산의 인공 중합체의 마이크로스피어(프로티노이드)가 의약품을 전달하는 데 사용되었다(미국 특허 제4,239,754호). 또한, 미국 특허 제5,879,681호 및 미국 특허 제5,871,753호에 기재되고 생물학적 활성제를 경구로 전달하는데 사용되는 담체 화합물은 당업계에 공지되어 있다.
폐 투여를 위해, 바람직하게는 본원에 기재된 조성물 또는 약제학적 조성물은 폐 또는 부비동의 하기도에 도달하기에 효과적인 입자 크기로 전달된다. 조성물 또는 약제학적 조성물은 흡입에 의해 치료제를 투여하기 위해 당업계에 공지된 임의의 다양한 흡입 또는 비강 장치에 의해 전달될 수 있다. 환자의 부비동 또는 폐포에 에어로졸화된 제제를 침착시킬 수 있는 이러한 장치는 정량 흡입기, 분무기(예컨대, 제트 분무기, 초음파 분무기), 건조 분말 생성기, 스프레이어 등을 포함한다. 이러한 모든 장치는 에어로졸에서 본원에 기재된 조성물 또는 약제학적 조성물의 분배를 위한 투여에 적합한 제제를 사용할 수 있다. 이러한 에어로졸은 용액(수성 및 비수성 모두) 또는 고체 입자로 구성될 수 있다. 추가로, 본원에 기재된 조성물 또는 약제학적 조성물을 포함하는 스프레이는 적어도 하나의 단백질 스캐폴드의 현탁액 또는 용액을 압력 하에서 노즐을 통하게 함으로써 생산될 수 있다. 정량 흡입기(MDI)에서, 추진제, 본원에 기재된 조성물 또는 약제학적 조성물, 및 임의의 부형제 또는 기타 첨가제는 액화 압축 가스를 포함하는 혼합물로서 통에 포함된다. 계량 밸브의 작동은 바람직하게는 약 10 μm 미만, 바람직하게는 약 1 μm 내지 약 5 μm, 가장 바람직하게는 약 2 μm 내지 약 3 μm의 크기 범위의 입자를 함유하는 에어로졸로서 혼합물을 방출한다. 폐 투여, 제제 및 관련 장치에 대한 보다 상세한 설명은 PCT 공개 WO 제2019/049816호에 개시되어 있다.
점막 표면을 통한 흡수를 위해, 조성물은 복수의 서브마이크론 입자, 점막접착성 거대분자, 생리활성 펩타이드, 및 유화액 입자의 점막접착을 달성함으로써 점막 표면을 통한 흡수를 촉진하는 수성 연속상을 포함하는 유화액을 포함한다(미국 특허 제5,514,670호). 본 개시내용의 유화액의 적용에 적합한 점막 표면은 각막, 결막, 협측, 설하, 비강, 질, 폐, 위, 장 및 직장 투여 경로를 포함할 수 있다. 질 또는 직장 투여용 제제, 예컨대 좌제는 부형제로서, 예를 들어 폴리알킬렌글리콜, 바셀린, 코코아 버터 등을 함유할 수 있다. 비강내 투여를 위한 제제는 고체일 수 있고 부형제로서, 예를 들어 락토스를 함유하거나 점비제의 수용액 또는 유성액일 수 있다. 협측 투여의 경우, 부형제는 당, 칼슘 스테아레이트, 마그네슘 스테아레이트, 전호화 전분 등을 포함한다(미국 특허 제5,849,695호). 점막 투여 및 제제에 대한 보다 상세한 설명은 PCT 공개 WO 제2019/049816호에 개시되어 있다.
경피 투여를 위해, 본원에 개시된 조성물 또는 약제학적 조성물은 리포솜 또는 중합체성 나노입자, 마이크로입자, 마이크로캡슐 또는 마이크로스피어(달리 언급되지 않는 한 통틀어 마이크로입자로 지칭됨)와 같은 전달 장치에 캡슐화된다. 합성 중합체, 예컨대 폴리하이드록시산, 예컨대 폴리락트산, 폴리글리콜산 및 이들의 공중합체, 폴리오르토에스테르, 폴리무수물, 및 폴리포스파젠, 및 천연 중합체, 예컨대 콜라겐, 폴리아미노산, 알부민 및 기타 단백질, 알기네이트 및 기타 다당류, 및 이들의 조합으로 구성된 마이크로입자를 포함하는 다수의 적합한 장치가 알려져 있다(미국 특허 제5,814,599호). 경피 투여, 제제 및 적합한 장치에 대한 보다 상세한 설명은 PCT 공개 WO 제2019/049816호에 개시되어 있다.
개시된 화합물을 장기간에 걸쳐, 예를 들어 단일 투여로부터 1주 내지 1년의 기간 동안 대상체에게 전달하는 것이 바람직할 수 있다. 다양한 서방성, 데포 또는 임플란트 투여 형태가 이용될 수 있다. 예를 들어, 투여 형태는 체액에서 낮은 용해도를 갖는 화합물의 약제학적으로 허용가능한 무독성 염, 예를 들어 (a) 다염기산, 예컨대 인산, 황산, 시트르산, 타르타르산, 탄닌산, 파모산, 알긴산, 폴리글루탐산, 나프탈렌 모노- 또는 디-술폰산, 폴리갈락투론산 등과의 산 부가염; (b) 다가 금속 양이온, 예컨대 아연, 칼슘, 비스무트, 바륨, 마그네슘, 알루미늄, 구리, 코발트, 니켈, 카드뮴 등과의 염, 또는 예컨대 N,N'-디벤질-에틸렌디아민 또는 에틸렌디아민으로부터 형성된 유기 양이온과의 염; 또는 (c) (a) 및 (b)의 조합, 예컨대 아연 탄네이트 염을 함유할 수 있다. 추가로, 개시된 화합물, 또는 바람직하게는 방금 설명한 것과 같은 비교적 불용성인 염은, 예컨대 주사에 적합한 참기름과 함께 겔, 예를 들어 알루미늄 모노스테아레이트 겔에서 제제화될 수 있다. 특히 바람직한 염은 아연 염, 아연 탄네이트 염, 파모에이트 염 등이다. 주사를 위한 서방성 데포 제제의 또 다른 유형은, 예를 들어 미국 특허 제3,773,919호에 기재된 바와 같은 폴리락트산/폴리글리콜산 중합체와 같은 느리게 분해하는 비독성의 비항원성 중합체에서 캡슐화하기 위해 분산된 화합물 또는 염을 함유할 것이다. 상기 기재된 것과 같은 화합물 또는 바람직하게는 비교적 불용성인 염은 또한 특히 동물에서 사용하기 위해 콜레스테롤 매트릭스 실라스틱 펠렛으로 제제화될 수 있다. 추가의 서방성, 데포 또는 임플란트 제제, 예컨대 기체 또는 액체 리포솜은 문헌에 공지되어 있다(미국 특허 제5,770,222호 및 “Sustained and Controlled Release Drug Delivery Systems”, J. R. Robinson ed., Marcel Dekker, Inc., N.Y., 1978).
적합한 투여량은 당업계에 잘 알려져 있다. 예컨대, 문헌[Wells et al., eds., Pharmacotherapy Handbook, 2nd Edition, Appleton and Lange, Stamford, Conn. (2000); PDR Pharmacopoeia, Tarascon Pocket Pharmacopoeia 2000, Deluxe Edition, Tarascon Publishing, Loma Linda, Calif. (2000); Nursing 2001 Handbook of Drugs, 21st edition, Springhouse Corp., Springhouse, Pa., 2001; Health Professional's Drug Guide 2001, ed., Shannon, Wilson, Stang, Prentice-Hall, Inc, Upper Saddle River, N.J]을 참고한다. 바람직한 용량은 선택적으로 약 0.1-99 및/또는 100-500 mg/kg/투여, 또는 이의 임의의 범위, 값 또는 분율을 포함할 수 있거나, 또는 단일 또는 다중 투여당 약 0.1-5000 μg/ml 혈청 농도, 또는 이의 임의의 범위, 값 또는 분율의 혈청 농도를 달성할 수 있다. 본원에 개시된 조성물 또는 약제학적 조성물에 대한 바람직한 투여량 범위는 대상체 체중의 약 1 mg/kg, 최대 약 3, 약 6 또는 약 12 mg/kg이다.
대안적으로, 투여되는 투여량은 특정 제제의 약력학적 특성, 및 그의 투여 방식 및 경로; 수여자의 연령, 건강 및 체중; 증상의 성질 및 정도, 동시 치료의 종류, 치료의 빈도, 원하는 효과와 같은 공지된 인자에 따라 달라질 수 있다. 일반적으로 활성 성분의 투여량은 체중 킬로그램당 약 0.1 내지 100 밀리그램일 수 있다. 일반적으로, 투여당 킬로그램당 0.1 내지 50, 및 바람직하게는 0.1 내지 10 밀리그램 또는 지속 방출 형태가 원하는 결과를 얻는 데 효과적이다.
비제한적 예로서, 인간 또는 동물의 치료는 1일당 약 0.1 내지 100 mg/kg 또는 그의 임의의 범위, 값 또는 분율의 본원에 개시된 조성물 또는 약제학적 조성물의 1회 또는 주기적 투여량으로서, 1-40일 중 적어도 1번, 또는 대안적으로 또는 추가로 1-52주 중 적어도 1번, 또는 대안적으로 또는 추가로, 단일, 주입 또는 반복을 사용하여 1-20년 중 적어도 1번, 또는 이들의 임의의 조합으로 제공될 수 있다.
내부 투여에 적합한 투여 형태는 일반적으로 단위 또는 용기당 약 0.001 밀리그램 내지 약 500 밀리그램의 활성 성분을 함유한다. 이러한 약제학적 조성물에서 활성 성분은 일반적으로 조성물의 총 중량을 기준으로 약 0.5-99.999 중량%의 양으로 존재할 것이다.
유효량은 단일(예컨대, 볼루스), 다중 또는 연속 투여당 약 0.001 내지 약 500 mg/kg의 양을 포함할 수 있거나, 단일, 다중 또는 연속 투여당 0.01-5000 μg/ml 혈청 농도, 또는 본원에 기재되거나 관련 분야에 공지된 바와 같이 공지된 방법을 사용하여 수행되고 결정된 바와 같은 임의의 유효 범위 또는 그 안의 값을 달성할 수 있다.
이를 필요로 하는 대상체에게 투여될 조성물이 본원에 개시된 바와 같은 변형된 세포인 양태에서, 세포는 약 1x103 내지 1x1015 세포; 약 1x104 내지 1x1012 세포; 약 1x105 내지 1x1010 세포; 약 1x106 내지 1x109 세포; 약 1x106 내지 1x108 세포; 약 1x106 내지 1x107 세포; 또는 약 1x106 내지 25x106 세포로 투여될 수 있다. 일 양태에서, 세포는 약 5x106 내지 25x106 세포로 투여된다.
개시된 조성물 및 약제학적 조성물의 약제학적으로 허용가능한 부형제, 제제, 투여량 및 투여 방법에 대한 보다 상세한 설명은 PCT 공개 WO 제2019/049816호에 개시되어 있다.
개시내용의 조성물을 사용하는 방법
본 개시내용은 개시된 조성물 및 약제학적 조성물을 사용하여, 예컨대 세포, 조직, 기관, 동물, 또는 대상체에게 조성물 또는 약제학적 조성물의 치료적 유효량을 투여하거나 이와 접촉시켜, 당업계에 공지되거나 본원에 기재된 바와 같은 세포, 조직, 기관, 동물, 또는 대상체에서 질환 또는 장애를 치료하기 위한 개시된 조성물 또는 약제학적 조성물의 용도를 제공한다. 일 양태에서, 대상체는 포유동물이다. 바람직하게는, 대상체는 인간이다. 용어 "대상체" 및 "환자"는 본원에서 상호교환적으로 사용된다.
본 개시내용은 본 개시내용의 적어도 하나의 조성물의 적어도 하나의 치료적 유효량을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 적어도 하나의 대사성 간 장애(MLD)를 치료하는 방법을 제공한다.
본 개시내용은 대상체에서 적어도 하나의 대사성 간 장애의 치료에서의 용도를 위한 본 개시내용의 적어도 하나의 조성물을 제공하며, 여기서 적어도 하나의 조성물은 적어도 하나의 치료적 유효량으로 대상체에게 투여하기 위한 것이다.
본 개시내용은 대상체에서 적어도 하나의 대사성 간 장애의 치료용 약제의 제조를 위한 본 개시내용의 적어도 하나의 조성물의 용도를 제공하며, 여기서 적어도 하나의 조성물은 적어도 하나의 치료적 유효량으로 대상체에게 투여하기 위한 것이다.
전술한 방법 및 용도의 일부 양태에서, 본 개시내용의 적어도 하나의 조성물은 본 개시내용의 적어도 하나의 AAV piggyBac 트랜스포존 벡터를 포함할 수 있다.
따라서, 본 개시내용은 본 개시내용의 적어도 하나의 AAV piggyBac 트랜스포존 벡터의 적어도 하나의 치료적 유효량을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 적어도 하나의 대사성 간 장애를 치료하는 방법을 제공한다.
본 개시내용은 대상체에서 적어도 하나의 대사성 간 장애의 치료에서의 용도를 위한 본 개시내용의 적어도 하나의 AAV piggyBac 트랜스포존 벡터를 제공하며, 여기서 적어도 하나의 AAV piggyBac 트랜스포존 벡터는 적어도 하나의 치료적 유효량으로 대상체에게 투여하기 위한 것이다.
본 개시내용은 대상체에서 적어도 하나의 대사성 간 장애의 치료용 약제의 제조를 위한 본 개시내용의 적어도 하나의 AAV piggyBac 트랜스포존 벡터의 용도를 제공하며, 여기서 적어도 하나의 AAV piggyBac 트랜스포존 벡터는 적어도 하나의 치료적 유효량으로 대상체에게 투여하기 위한 것이다.
전술한 방법 및 용도의 일부 양태에서, 본 개시내용의 적어도 하나의 조성물은 본 개시내용의 적어도 하나의 AAV 트랜스포사제 벡터를 포함할 수 있다.
따라서, 본 개시내용은 본 개시내용의 적어도 하나의 AAV 트랜스포사제 벡터의 적어도 하나의 치료적 유효량을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 적어도 하나의 대사성 간 장애를 치료하는 방법을 제공한다.
본 개시내용은 대상체에서 적어도 하나의 대사성 간 장애의 치료에서의 용도를 위한 본 개시내용의 적어도 하나의 AAV 트랜스포사제 벡터를 제공하며, 여기서 적어도 하나의 AAV 트랜스포사제 벡터는 적어도 하나의 치료적 유효량으로 대상체에게 투여하기 위한 것이다.
본 개시내용은 대상체에서 적어도 하나의 대사성 간 장애의 치료용 약제의 제조를 위한 본 개시내용의 적어도 하나의 AAV 트랜스포사제 벡터의 용도를 제공하며, 여기서 적어도 하나의 AAV 트랜스포사제 벡터는 적어도 하나의 치료적 유효량으로 대상체에게 투여하기 위한 것이다.
본 개시내용은 a) 트랜스포존을 포함하는 핵산 분자를 포함하는 조성물의 적어도 하나의 치료적 유효량으로서, 여기서 트랜스포존은 적어도 하나의 치료 단백질을 코딩하는 뉴클레오타이드 서열을 포함하는 것인 적어도 하나의 치료적 유효량; 및 b) 적어도 하나의 트랜스포사제를 코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분자를 포함하는 조성물의 적어도 하나의 치료적 유효량을 대상체에게 투여하는 단계를 포함하는, 대상체에서 적어도 하나의 대사성 간 장애를 치료하는 방법을 제공한다.
전술한 방법의 일부 양태에서, 트랜스포존을 포함하는 핵산 분자를 포함하는 조성물은 본원에 기재된 임의의 AAV piggyBac 트랜스포존 벡터일 수 있다.
전술한 방법의 일부 양태에서, 적어도 하나의 트랜스포사제를 코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분자를 포함하는 조성물은 본 개시내용의 임의의 AAV 트랜스포사제 벡터일 수 있다.
따라서, 본 개시내용은 a) 본 개시내용의 적어도 하나의 AAV piggyBac 트랜스포존 벡터의 적어도 하나의 치료적 유효량; 및 b) 본 개시내용의 적어도 하나의 AAV 트랜스포사제 벡터의 적어도 하나의 치료적 유효량을 대상체에게 투여하는 단계를 포함하는, 대상체에서 적어도 하나의 대사성 간 장애를 치료하는 방법을 제공한다.
따라서, 본 개시내용은 대상체에서 적어도 하나의 대사성 간 장애의 치료에서의 용도를 위한 본 개시내용의 적어도 하나의 AAV piggyBac 트랜스포존 벡터 및 본 개시내용의 적어도 하나의 AAV 트랜스포사제 벡터의 조합을 제공하며, 여기서 적어도 하나의 AAV piggyBac 트랜스포존 벡터는 적어도 하나의 치료적 유효량으로 대상체에 투여하기 위한 것이고, 적어도 하나의 AAV 트랜스포사제 벡터는 적어도 하나의 치료적 유효량으로 대상체에게 투여하기 위한 것이다.
따라서, 본 개시내용은 대상체에서 적어도 하나의 대사성 간 장애의 치료용 약제의 제조에 있어서 본 개시내용의 적어도 하나의 AAV piggyBac 트랜스포존 벡터 및 본 개시내용의 적어도 하나의 AAV 트랜스포사제 벡터의 조합의 용도를 제공하며, 여기서 적어도 하나의 AAV piggyBac 트랜스포존 벡터는 적어도 하나의 치료적 유효량으로 대상체에게 투여하기 위한 것이고, 적어도 하나의 AAV 트랜스포사제 벡터는 적어도 하나의 치료적 유효량으로 대상체에게 투여하기 위한 것이다.
대사성 간 장애는 비제한적으로 요소 회로 장애, N-아세틸글루타메이트 신테타제(NAGS) 결핍, 카르바모일포스페이트 신테타제 I 결핍(CPSI 결핍), 오르니틴 트랜스카르바밀라제(OTC) 결핍, 아르기니노석시네이트 신테타제 결핍(ASSD)(시트룰린혈증 I), 시트린 결핍(시트룰린혈증 II), 아르기니노석시네이트 리아제 결핍(아르기노석신산 뇨증), 아르기나제 결핍(고아르기닌혈증), 오르니틴 트랜스로카제 결핍(HHH 증후군) 메틸말론산혈증(MMA), 진행성 가족성 간내 담즙정체 1형(PFIC1), 진행성 가족성 간내 담즙정체 1형(PFIC2), 진행성 가족성 간내 담즙정체 1형(PFIC3) 또는 이들의 임의의 조합이다. 일부 양태에서, 대사성 간 장애는 오르니틴 트랜스카르바밀라제(OTC) 결핍이다.
전술한 방법의 일부 양태에서, 트랜스포존을 포함하는 핵산 분자를 포함하는 조성물로서 트랜스포존은 적어도 하나의 치료 단백질을 코딩하는 뉴클레오타이드 서열을 포함하는 것인 조성물 및 적어도 하나의 트랜스포사제를 코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분자를 포함하는 조성물은 동시에 투여될 수 있다. 일부 양태에서, 트랜스포존을 포함하는 핵산 분자를 포함하는 조성물로서 트랜스포존은 적어도 하나의 치료 단백질을 코딩하는 뉴클레오타이드 서열을 포함하는 것인 조성물 및 적어도 하나의 트랜스포사제를 코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분자를 포함하는 조성물은 순차적으로 투여될 수 있다. 일부 양태에서, 트랜스포존을 포함하는 핵산 분자를 포함하는 조성물로서 트랜스포존은 적어도 하나의 치료 단백질을 코딩하는 뉴클레오타이드 서열을 포함하는 것인 조성물 및 적어도 하나의 트랜스포사제를 코딩하는 뉴클레오타이드 서열을 포함하는 핵산 분자를 포함하는 조성물은 시간적 근접하여 투여될 수 있다.
본원에 사용된 바와 같이, 용어 "시간적 근접"은 하나의 치료 조성물(예컨대, 트랜스포존을 포함하는 조성물)의 투여가 또 다른 치료 조성물(예컨대, 트랜스포사제를 포함하는 조성물)의 투여 전 또는 후의 일정 기간 내에 발생하여, 하나의 치료제의 치료 효과가 다른 치료제의 치료 효과와 중첩되는 것을 지칭한다. 일부 구현예에서, 하나의 치료제의 치료 효과는 다른 치료제의 치료 효과와 완전히 중첩된다. 일부 구현예에서, "시간적 근접"은 하나의 치료제의 투여가 또 다른 치료제의 투여 전 또는 후의 일정 기간 내에 발생하여, 하나의 치료제와 다른 치료제 사이에 상승 효과가 있음을 의미한다. "시간적 근접"은 비제한적으로 치료제가 투여될 대상체의 연령, 성별, 체중, 유전적 배경, 의학적 상태, 병력 및 치료 이력; 치료 또는 개선될 질환 또는 병태; 달성될 치료 결과; 치료제의 투여량, 투여 빈도 및 투여 기간; 치료제의 약동학 및 약력학; 및 치료제가 투여되는 경로(들)을 포함하는 다양한 인자에 따라 달라질 수 있다. 일부 구현예에서, "시간적 근접"은 15분 이내, 30분 이내, 1시간 이내, 2시간 이내, 4시간 이내, 6시간 이내, 8시간 이내, 12시간 이내, 18시간 이내, 24시간 이내, 36시간 이내, 2일 이내, 3일 이내, 4일 이내, 5일 이내, 6일 이내, 1주일 이내, 2주 이내, 3주 이내, 4주 이내, 6주 이내, 또는 8주 이내를 의미한다. 일부 구현예에서, 하나의 치료제의 다중 투여는 또 다른 치료제의 단일 투여에 시간적 근접하여 발생할 수 있다. 일부 구현예에서, 시간적 근접은 치료 주기 동안 또는 투여 요법 내에서 변할 수 있다.
본 개시내용의 치료 방법의 일부 양태에서, 본 개시내용의 적어도 하나의 조성물 및/또는 벡터를 대상체에게 투여하는 것은 대상체에서 적어도 하나의 기관 및/또는 조직에서 외인성 단백질(예컨대, 치료 단백질, 트랜스포사제 등)의 발현을 초래할 수 있다.
일부 양태에서, 본 개시내용의 적어도 하나의 조성물 및/또는 벡터의 투여는 조직 및/또는 기관에서 세포의 적어도 약 10%, 또는 적어도 약 15%, 또는 적어도 약 20%, 또는 적어도 약 25%, 또는 적어도 약 30%, 또는 적어도 약 35%, 또는 적어도 약 40%, 또는 적어도 약 45%, 또는 적어도 약 50%, 또는 적어도 약 55%, 또는 적어도 약 60%, 또는 적어도 약 65%, 또는 적어도 약 70%, 또는 적어도 약 75%, 또는 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 99%로 외인성 단백질의 발현을 초래한다.
일부 양태에서, 본 개시내용의 적어도 하나의 조성물 및/또는 벡터의 투여는 조직 및/또는 기관에서 세포의 특정 서브세트 또는 서브세트들의 적어도 약 10%, 또는 적어도 약 15%, 또는 적어도 약 20%, 또는 적어도 약 25%, 또는 적어도 약 30%, 또는 적어도 약 35%, 또는 적어도 약 40%, 또는 적어도 약 45%, 또는 적어도 약 50%, 또는 적어도 약 55%, 또는 적어도 약 60%, 또는 적어도 약 65%, 또는 적어도 약 70%, 또는 적어도 약 75%, 또는 적어도 약 80%, 또는 적어도 약 85%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 99%로 외인성 단백질의 발현을 초래한다.
일부 양태에서, 본 개시내용의 적어도 하나의 조성물 및/또는 벡터의 투여는 조직 및/또는 기관에서 적어도 약 1일, 또는 적어도 약 2일, 또는 적어도 약 3일, 또는 적어도 약 4일, 또는 적어도 약 5일, 또는 적어도 약 6일, 또는 적어도 약 7일, 또는 적어도 약 8일, 또는 적어도 약 9일, 또는 적어도 약 10일 동안 외인성 단백질의 발현을 초래한다.
일부 양태에서, 본 개시내용의 적어도 하나의 조성물 및/또는 벡터의 투여는 조직 및/또는 기관에서 세포의 특정 서브세트 또는 서브세트들에서 적어도 약 1일, 또는 적어도 약 2일, 또는 적어도 약 3일, 또는 적어도 약 4일, 또는 적어도 약 5일, 또는 적어도 약 6일, 또는 적어도 약 7일, 또는 적어도 약 8일, 또는 적어도 약 9일, 또는 적어도 약 10일 동안 외인성 단백질의 발현을 초래한다.
일부 양태에서, 본 개시내용의 적어도 하나의 조성물 및/또는 벡터의 투여는 조직 및/또는 기관에서 약 1일 이하, 또는 약 2일 이하, 또는 약 3일 이하, 또는 약 4일 이하, 또는 약 5일 이하, 또는 약 6일 이하, 또는 약 7일 이하, 또는 약 8일 이하, 또는 약 9일 이하, 또는 약 10일 이하 동안 외인성 단백질의 발현을 초래한다.
일부 양태에서, 본 개시내용의 적어도 하나의 조성물 및/또는 벡터의 투여는 조직 및/또는 기관에서 세포의 특정 서브세트 또는 서브세트들에서 약 1일 이하, 또는 약 2일 이하, 또는 약 3일 이하, 또는 약 4일 이하, 또는 약 5일 이하, 또는 약 6일 이하, 또는 약 7일 이하, 또는 약 8일 이하, 또는 약 9일 이하, 또는 약 10일 이하 동안 외인성 단백질의 발현을 초래한다.
일부 양태에서, 조직 및/또는 기관은 간일 수 있다. 일부 양태에서, 세포의 특정 서브세트 또는 서브세트들은 비제한적으로 간세포, 간 성상 세포(hepatic stellate cell), 쿠퍼 세포, 간 동모양 혈관내피 세포(liver sinusoidal endothelial cell) 또는 이들의 임의의 조합을 포함할 수 있다.
본 개시내용의 임의의 방법은 본원에 개시된 임의의 조성물 또는 약제학적 조성물의 유효량을 이러한 조절, 치료 또는 요법을 필요로 하는 세포, 조직, 기관, 동물 또는 대상체에게 투여하는 단계를 포함할 수 있다. 이러한 방법은 선택적으로 이러한 질병 또는 장애를 치료하기 위한 공동 투여 또는 조합 요법을 추가로 포함할 수 있으며, 여기서 본원에 개시된 임의의 조성물 또는 약제학적 조성물의 투여는 이전에, 동시에, 및/또는 이후에 요소 회로 장애를 위한 적어도 하나의 추가의 치료를 추가로 포함한다.
요소 회로 장애를 위한 추가 치료는 비제한적으로 투석, 혈액여과, 칼로리 보충, 호르몬 억제, 포도당 점적(glucose drip), 인슐린 점적, 과잉 질소의 약리학적 소거, 덱스트로스의 투여, 유체의 투여, 인트라리피드(Intralipid®)의 투여, 암모니아 소거제의 투여, 아르기닌의 투여, 나트륨 페닐아세테이트의 투여, 나트륨 벤조에이트의 투여, 암모눌(Ammonul)의 투여, 프닐부티레이트의 투여, 시트룰린 보충, 아르기닌 보충, 또는 이들의 임의의 조합을 포함할 수 있다.
본 개시내용의 예시적인 구현예
구현예 1. 5'에서 3' 방향으로:
a) 제1 AAV 역 말단 반복(inverted terminal repeat, ITR) 서열;
b) 제1 piggyBac ITR 서열;
c) 제1 절연체 서열;
d) 적어도 하나의 프로모터 서열;
e) 적어도 하나의 이식유전자 서열;
f) 폴리A 서열;
g) 제2 절연체 서열;
h) 제2 piggyBac ITR 서열; 및
i) 제2 AAV ITR 서열
을 포함하는 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 2. 구현예 1에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 DNA, cDNA, gDNA, RNA, mRNA 또는 이들의 임의의 조합을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 3. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 및/또는 제2 AAV ITR 서열은 서열번호: 1-4, 93-94, 105-106 및 127 중 어느 하나의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 4. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 AAV ITR 서열은 서열번호: 3의 핵산 서열을 포함하고, 제2 AAV ITR 서열은 서열번호: 4의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 5. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열 및/또는 제2 piggyBac ITR 서열은 서열번호: 5-6, 86-90, 95-96 및 125 중 어느 하나의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 6. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 5의 핵산 서열을 포함하고, 제2 piggyBac ITR은 서열번호: 6의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 7. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 절연체 서열 및/또는 제2 절연체 서열은 서열번호: 7-8, 77-80 및 91-92 중 어느 하나의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 8. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 절연체 서열은 서열번호: 7의 핵산 서열을 포함하고, 제2 절연체 서열은 서열번호: 8의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 9. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 간 특이적 프로모터인 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 10. 전술한 구현예 중 어느 한 구현예에 있어서, 간 특이적 프로모터는 하이브리드 간 프로모터(HLP), LP1 프로모터, pp52의 백혈구 특이적 발현(LSP1) 긴 프로모터, 티록신 결합 글로불린(TBG) 프로모터, wTBG 프로모터, 간 조합 번들(HCB) 프로모터, 2xApoE-hAAT 프로모터 또는 pp52의 백혈구 특이적 발현(LSP1) 및 키메라 인트론 프로모터인 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 11. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 9-16, 69, 107, 126 및 132 중 어느 것의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 12. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 이식유전자 서열은 메틸말로닐-CoA 뮤타제(MUT1) 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 13. 전술한 구현예 중 어느 한 구현예에 있어서, MUT1 폴리펩타이드는 서열번호: 17, 18, 121 또는 122의 아미노산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 14. 전술한 구현예 중 어느 한 구현예에 있어서, MUT1 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 19, 20 또는 111-120의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 15. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 이식유전자 서열은 오르니틴 트랜스카바밀라아제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 16. 전술한 구현예 중 어느 한 구현예에 있어서, OTC 폴리펩타이드는 서열번호: 21 또는 81의 아미노산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 17. 전술한 구현예 중 어느 한 구현예에 있어서, OTC 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 22, 23, 82 및 83 중 어느 것의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 18. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 이식유전자 서열은 iCas9 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 19. 전술한 구현예 중 어느 한 구현예에 있어서, iCas9 폴리펩타이드는 서열번호: 24 또는 84의 아미노산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 20. 전술한 구현예 중 어느 한 구현예에 있어서, iCas9 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 25 또는 85의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 21. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 이식유전자 서열은 적어도 하나의 프로모터 서열에 작동가능하게 연결된 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 22. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 이식유전자 서열의 발현은 적어도 하나의 프로모터 서열에 의해 제어되는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 23. 전술한 구현예 중 어느 한 구현예에 있어서, 폴리A 서열은 서열번호: 26-27, 97, 108, 128 및 136 중 어느 하나의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 24. 전술한 구현예 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 제2 이식유전자 서열을 추가로 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 25. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 제2 이식유전자 서열은 iCas9 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 26. 전술한 구현예 중 어느 한 구현예에 있어서, iCas9 폴리펩타이드는 서열번호: 24 또는 84의 아미노산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 27. 전술한 구현예 중 어느 한 구현예에 있어서, iCas9 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 25 또는 85의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 28. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 제2 이식유전자 서열은 메틸말로닐-CoA 뮤타제(MUT1) 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 29. 전술한 구현예 중 어느 한 구현예에 있어서, MUT1 폴리펩타이드는 서열번호: 17, 18, 121 또는 122의 아미노산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 30. 전술한 구현예 중 어느 한 구현예에 있어서, MUT1 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 19, 20 또는 111-120의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 31. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 제2 이식유전자 서열은 오르니틴 트랜스카바밀라제(OTC) 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 32. 전술한 구현예 중 어느 한 구현예에 있어서, OTC 폴리펩타이드는 서열번호: 21 또는 81의 아미노산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 33. 전술한 구현예 중 어느 한 구현예에 있어서, OTC 폴리펩타이드를 코딩하는 핵산 서열은 서열번호: 22, 23, 82 및 83 중 어느 것의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 34. 전술한 구현예 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 제2 프로모터 서열을 추가로 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 35. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 제2 프로모터 서열은 적어도 하나의 이식유전자 서열과 적어도 제2 이식유전자 서열 사이에 위치하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 36. 전술한 구현예 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 하나의 자가 절단 펩타이드 서열을 추가로 포함하고, 적어도 하나의 자기 절단 펩타이드 서열은 T2A 펩타이드, GSG-T2A 펩타이드, E2A 펩타이드, GSG-E2A 펩타이드, F2A 펩타이드, GSG-F2A 펩타이드, P2A 펩타이드, 또는 GSG-P2A 펩타이드를 코딩하는 핵산 서열인 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 37. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 자가 절단 펩타이드 서열은 적어도 하나의 이식유전자 서열과 적어도 제2 이식유전자 서열 사이에 위치하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 38. 전술한 구현예 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 2개의 이식유전자 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 39. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 2개의 이식유전자 서열은 동일한 서열인 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 40. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 2개의 이식유전자 서열은 상이한 서열인 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 41. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 DNA 스페이서 서열을 추가로 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 42. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 DNA 스페이서 서열은 서열번호: 103, 109, 129-131 및 137 중 어느 하나의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 43. 전술한 구현예 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 적어도 2개의 프로모터 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 44. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 2개의 프로모터 서열은 동일한 서열인 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 45. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 2개의 프로모터 서열은 상이한 서열인 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46A. 5'에서 3' 방향으로:
a) 제1 AAV ITR 서열;
b) 제1 piggyBac ITR 서열;
c) 제1 절연체 서열;
d) 적어도 하나의 프로모터 서열;
e) 적어도 하나의 이식유전자 서열;
f) 폴리A 서열;
g) 제2 절연체 서열;
h) 제2 piggyBac ITR 서열;
i) 적어도 하나의 DNA 스페이서 서열; 및
j) 제2 AAV ITR 서열
을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46B. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 AAV ITR 서열은 서열번호: 3의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46C. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 95의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46D. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 125의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46E. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 절연체 서열은 서열번호: 7의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46F. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 9의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46G. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 126의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46H. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 이식유전자 서열은 서열번호: 22의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46I. 전술한 구현예 중 어느 한 구현예에 있어서, 폴리A 서열은 서열번호: 97의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46J. 전술한 구현예 중 어느 한 구현예에 있어서, 제2 절연체 서열은 서열번호: 8의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46K. 전술한 구현예 중 어느 한 구현예에 있어서, 제2 piggyBac ITR 서열은 서열번호: 96의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46L. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 DNA 스페이서 서열은 서열번호: 129의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46M. 전술한 구현예 중 어느 한 구현예에 있어서, 제2 AAV ITR 서열은 서열번호: 4의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 46N. 5'에서 3' 방향으로:
a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열;
b) 서열번호: 95 또는 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열;
c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열;
d) 서열번호: 9 또는 서열번호: 126의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
e) 서열번호: 22의 핵산 서열을 포함하는 적어도 하나의 이식유전자 서열;
f) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열;
g) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열;
h) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열;
i) 서열번호: 129의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및
j) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 47. 구현예 46A-46N 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 9의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 48. 구현예 46A-46N 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 126의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 49. 구현예 46A-46N 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 95의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 50. 구현예 46A-46N 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 125의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 51. 구현예 46A-50 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 138의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52A. 5'에서 3' 방향으로:
a) 제1 AAV ITR 서열;
b) 제1 piggyBac ITR 서열;
c) 제1 절연체 서열;
d) 적어도 하나의 프로모터 서열;
e) 적어도 하나의 이식유전자 서열;
f) 폴리A 서열;
g) 제2 절연체 서열;
h) 제2 piggyBac ITR 서열;
i) 적어도 하나의 DNA 스페이서 서열; 및
j) 제2 AAV ITR 서열
을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52B. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 AAV ITR 서열은 서열번호: 3의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52C. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 95의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52D. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 125의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52E. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 절연체 서열은 서열번호: 7의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52F. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 10의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52G. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 132의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52H. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 이식유전자 서열은 서열번호: 22의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52I. 전술한 구현예 중 어느 한 구현예에 있어서, 폴리A 서열은 서열번호: 97의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52J. 전술한 구현예 중 어느 한 구현예에 있어서, 제2 절연체 서열은 서열번호: 8의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52K. 전술한 구현예 중 어느 한 구현예에 있어서, 제2 piggyBac ITR 서열은 서열번호: 96의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52L. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 DNA 스페이서 서열은 서열번호: 130의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52M. 전술한 구현예 중 어느 한 구현예에 있어서, 제2 AAV ITR 서열은 서열번호: 4의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 52N. 5'에서 3' 방향으로:
a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열;
b) 서열번호: 95 또는 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열;
c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열;
d) 서열번호: 10 또는 서열번호: 132의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
e) 서열번호: 22의 핵산 서열을 포함하는 적어도 하나의 이식유전자 서열;
f) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열;
g) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열;
h) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열;
i) 서열번호: 130의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및
j) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 53. 구현예 52A-52N 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 10의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 54. 구현예 52A-52N 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 132의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 55. 구현예 52A-52N 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 95의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 56. 구현예 52A-52N 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 125의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 57. 구현예 52A-56 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 139의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58A. 5'에서 3' 방향으로:
a) 제1 AAV ITR 서열;
b) 제1 piggyBac ITR 서열;
c) 제1 절연체 서열;
d) 적어도 하나의 프로모터 서열;
e) 적어도 하나의 이식유전자 서열;
f) 폴리A 서열;
g) 제2 절연체 서열;
h) 제2 piggyBac ITR 서열;
i) 적어도 하나의 DNA 스페이서 서열; 및
j) 제2 AAV ITR 서열
을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58B. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 AAV ITR 서열은 서열번호: 3의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58C. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 95의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58D. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 125의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58E. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 절연체 서열은 서열번호: 7의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58F. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 13의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58G. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 이식유전자 서열은 서열번호: 22의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58H. 전술한 구현예 중 어느 한 구현예에 있어서, 폴리A 서열은 서열번호: 97의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58I. 전술한 구현예 중 어느 한 구현예에 있어서, 제2 절연체 서열은 서열번호: 8의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58J. 전술한 구현예 중 어느 한 구현예에 있어서, 제2 piggyBac ITR 서열은 서열번호: 96의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58K. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 DNA 스페이서 서열은 서열번호: 131의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58L. 전술한 구현예 중 어느 한 구현예에 있어서, 제2 AAV ITR 서열은 서열번호: 4의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 58M. 5'에서 3' 방향으로:
a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열;
b) 서열번호: 95 또는 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열;
c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열;
d) 서열번호: 13의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
e) 서열번호: 22의 핵산 서열을 포함하는 적어도 하나의 이식유전자 서열;
f) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열;
g) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열;
h) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열;
i) 서열번호: 131의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및
j) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 59. 구현예 58A-58M 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 95의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 60. 구현예 58A-58M 중 어느 한 구현예에 있어서, 제1 piggyBac ITR 서열은 서열번호: 125의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 61. 구현예 58A-60 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 140의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 62. 5'에서 3' 방향으로:
a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열;
b) 서열번호: 95 또는 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열;
c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열;
d) 서열번호: 9 또는 서열번호: 126의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
e) 서열번호: 22의 핵산 서열을 포함하는 제1 이식유전자 서열;
f) 서열번호: 31의 핵산 서열을 포함하는 제1 자가 절단 펩타이드 서열;
g) 서열번호: 133의 핵산 서열을 포함하는 제2 이식유전자 서열;
h) 서열번호: 32의 핵산 서열을 포함하는 적어도 제2 자가 절단 펩타이드 서열;
i) 서열번호: 134의 핵산 서열을 포함하는 적어도 제3 이식유전자 서열;
j) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열;
k) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열;
l) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열; 및
m) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 63. 구현예 62에 있어서, 제1 piggyBac ITR 서열은 서열번호: 95의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 64. 구현예 62에 있어서, 제1 piggyBac ITR 서열은 서열번호: 125의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 65. 구현예 62에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 9의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 66. 구현예 62에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 126의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 67. 구현예 62-66 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 141의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 68. 5'에서 3' 방향으로:
a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열;
b) 서열번호: 95 또는 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열;
c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열;
d) 서열번호: 10 또는 서열번호: 132의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
e) 서열번호: 22의 핵산 서열을 포함하는 제1 이식유전자 서열;
f) 서열번호: 31의 핵산 서열을 포함하는 제1 자가 절단 펩타이드 서열;
g) 서열번호: 133의 핵산 서열을 포함하는 제2 이식유전자 서열;
h) 서열번호: 32의 핵산 서열을 포함하는 적어도 제2 자가 절단 펩타이드 서열;
i) 서열번호: 134의 핵산 서열을 포함하는 적어도 제3의 이식유전자 서열;
j) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열;
k) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열;
l) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열; 및
m) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 69. 구현예 68에 있어서, 제1 piggyBac ITR 서열은 서열번호: 95의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 70. 구현예 68에 있어서, 제1 piggyBac ITR 서열은 서열번호: 125의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 71. 구현예 68에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 10의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 72. 구현예 68에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 132의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 73. 구현예 68-72 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 142의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 74. 5'에서 3' 방향으로:
a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열;
b) 서열번호: 95 또는 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열;
c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열;
d) 서열번호: 13의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
e) 서열번호: 22의 핵산 서열을 포함하는 제1 이식유전자 서열;
f) 서열번호: 135의 핵산 서열을 포함하는 적어도 하나의 자가 절단 펩타이드 서열;
g) 서열번호: 134의 핵산 서열을 포함하는 적어도 제2 이식유전자 서열;
h) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열;
i) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열;
j) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열; 및
k) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 75. 구현예 74에 있어서, 제1 piggyBac ITR 서열은 서열번호: 95의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 76. 구현예 74에 있어서, 제1 piggyBac ITR 서열은 서열번호: 125의 핵산 서열을 포함하는 것인 AAG piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 77. 구현예 74-76 중 어느 한 구현예에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 서열번호: 143의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 78. 전술한 구현예 중 어느 한 구현예의 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 벡터.
구현예 79. 전술한 구현예 중 어느 한 구현예에 있어서, 벡터는 바이러스 벡터인 것인 벡터.
구현예 80. 전술한 구현예 중 어느 한 구현예에 있어서, 바이러스 벡터는 아데노 관련 바이러스(AAV) 바이러스 벡터인 것인 벡터.
구현예 81. 전술한 구현예 중 어느 한 구현예에 있어서, AAV 바이러스 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11 바이러스 벡터인 것인 벡터.
구현예 82. 전술한 구현예 중 어느 한 구현예에 있어서, AAV 바이러스 벡터는 AAV-KP-1 또는 AAV-NP59 바이러스 벡터이고, 바람직하게는 AAV 바이러스 벡터는 AAV-KP-1 바이러스 벡터인 것인 벡터.
구현예 83. 구현예 78-82 중 어느 한 구현예의 벡터를 포함하는 조성물.
구현예 84. 5'에서 3' 방향으로 제1 AAV ITR 서열, 적어도 하나의 프로모터 서열, 적어도 하나의 트랜스포사제 서열, 폴리A 서열 및 제2 AAV ITR 서열을 포함하는 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 85. 구현예 84에 있어서, AAV piggyBac 트랜스포존 폴리뉴클레오타이드는 DNA, cDNA, gDNA, RNA, mRNA 또는 이들의 임의의 조합을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 86. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 및/또는 제2 AAV ITR 서열은 서열번호: 1-4, 93-94, 105-106 및 127 중 어느 것의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 87. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 AAV ITR 서열은 서열번호: 1의 핵산 서열을 포함하고, 제2 AAV ITR 서열은 서열번호: 2의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 88. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 AAV ITR 서열은 서열번호: 105의 핵산 서열을 포함하고, 제2 AAV ITR 서열은 서열번호: 106의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 89. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 간 특이적 프로모터인 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 90. 전술한 구현예 중 어느 한 구현예에 있어서, 간 특이적 프로모터는 하이브리드 간 프로모터(HLP), LP1 프로모터, pp52의 백혈구 특이적 발현(LSP1) 긴 프로모터, 티록신 결합 글로불린(TBG) 프로모터, wTBG 프로모터, 간 조합 번들(HCB) 프로모터, 2xApoE-hAAT 프로모터 또는 pp52의 백혈구 특이적 발현(LSP1) 및 키메라 인트론 프로모터인 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 91. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 9-16, 69, 107, 126 및 132 중 어느 것의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 92. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 트랜스포사제 서열은 piggyBac™(PB) 트랜스포사제 폴리펩타이드, piggyBac 유사(PBL) 트랜스포사제 폴리펩타이드 또는 Super piggyBac™(SPB) 트랜스포사제 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 93. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 트랜스포사제 서열은 서열번호: 39-42, 47 및 49 중 어느 것의 아미노산 서열을 코딩하는 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 94. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 트랜스포사제 서열은 서열번호: 48 또는 50의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 95. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 트랜스포사제 서열은 잠자는 숲속의 미녀(Sleeping Beauty) 트랜스포사제 폴리펩타이드, 과활성 잠자는 숲속의 미녀(SB100X) 트랜스포사제 폴리펩타이드, 헬리트론 트랜스포사제 폴리펩타이드, Tol2 트랜스포사제 폴리펩타이드, TcBuster 트랜스포사제 폴리펩타이드 또는 돌연변이 TcBuster 트랜스포사제 폴리펩타이드를 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 96. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 트랜스포사제 서열은 서열번호: 51-60 중 어느 것의 아미노산 서열을 코딩하는 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 97. 전술한 구현예 중 어느 한 구현예에 있어서, 폴리A 서열은 서열번호: 26-27, 97, 또는 108의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 98. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 트랜스포사제 서열은 적어도 하나의 프로모터 서열에 작동가능하게 연결된 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 99. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 트랜스포사제 서열의 발현은 적어도 하나의 프로모터 서열에 의해 제어되는 것인 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
구현예 100. 전술한 구현예 중 어느 한 구현예에 있어서, AAV 트랜스포사제 폴리뉴클레오타이드는 적어도 하나의 DNA 스페이서 서열을 추가로 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 101. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 DNA 스페이서 서열은 서열번호: 103 또는 109의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 102A. 5'에서 3' 방향으로:
a) 제1 AAV ITR 서열;
b) 적어도 하나의 프로모터 서열 적어도 하나의 프로모터 서열;
c) 적어도 하나의 트랜스포사제 서열;
d) 폴리A 서열;
e) 적어도 하나의 DNA 스페이서 서열; 및
f) 제2 AAV ITR 서열
을 포함하는 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 102B. 전술한 구현예 중 어느 한 구현예에 있어서, 제1 AAV ITR 서열은 서열번호: 127의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 102C. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 9의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 102D. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 126의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 102E. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 트랜스포사제 서열은 서열번호: 48의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 102F. 전술한 구현예 중 어느 한 구현예에 있어서, 폴리A 서열은 서열번호: 136의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 102G. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 DNA 스페이서 서열은 서열번호: 137의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 102H. 전술한 구현예 중 어느 한 구현예에 있어서, 적어도 하나의 DNA 스페이서 서열은 서열번호: 4의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 102I. 5'에서 3' 방향으로:
a) 서열번호: 127의 핵산 서열을 포함하는 제1 AAV ITR 서열;
b) 서열번호: 9 또는 서열번호: 126의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
c) 서열번호: 48의 핵산 서열을 포함하는 적어도 하나의 트랜스포사제 서열;
d) 서열번호: 136의 핵산 서열을 포함하는 폴리A 서열;
e) 서열번호: 137의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및
f) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
을 포함하는 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 103. 구현예 102A-102I 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 9의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 104. 구현예 102A-102I 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 126의 핵산 서열을 포함하는 것인 AAV 트랜스포사제 폴리뉴클레오타이드.
구현예 105. 구현예 102A-104 중 어느 한 구현예에 있어서, 적어도 하나의 프로모터 서열은 서열번호: 144의 핵산 서열을 포함하는 것인 AAV piggyBac 트랜스포사제 폴리뉴클레오타이드.
구현예 106. 전술한 구현예 중 어느 한 구현예의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 벡터.
구현예 107. 전술한 구현예 중 어느 한 구현예에 있어서, 벡터는 바이러스 벡터인 것인 벡터.
구현예 108. 전술한 구현예 중 어느 한 구현예에 있어서, 바이러스 벡터는 아데노 관련 바이러스(AAV) 바이러스 벡터인 것인 벡터.
구현예 109. 전술한 구현예 중 어느 한 구현예에 있어서, AAV 바이러스 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11 바이러스 벡터인 것인 벡터.
구현예 110. 전술한 구현예 중 어느 한 구현예에 있어서, AAV 바이러스 벡터는 AAV-KP-1 또는 AAV-NP59 AAV 바이러스 벡터이고, 바람직하게는 AAV 바이러스 벡터는 AAV-KP-1 바이러스 벡터인 것인 벡터.
구현예 111. 구현예 102-110 중 어느 한 구현예의 벡터를 포함하는 조성물.
구현예 112. 구현예 78-82 중 어느 한 구현예의 벡터 및 구현예 102-110 중 어느 한 구현예의 벡터를 포함하는 조성물.
구현예 113. 전술한 구현예 중 어느 한 구현예의 적어도 하나의 폴리뉴클레오타이드, 벡터 또는 조성물의 적어도 하나의 치료적 유효량을 대상체에게 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 적어도 하나의 대사성 간 장애(MLD)를 치료하는 방법.
구현예 114. 대상체에게 다음을 투여하는 단계를 포함하는, 이를 필요로 하는 대상체에서 적어도 하나의 대사성 간 장애(MLD)를 치료하는 방법:
a) 전술한 구현예 중 어느 한 구현예의 AAV piggyBac 트랜스포존 폴리뉴클레오타이드, 또는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 전술한 구현예의 벡터 및/또는 조성물 중 어느 하나의 적어도 하나의 치료적 유효량; 및
b) 전술한 구현예 중 어느 한 구현예의 AAV piggyBac 트랜스포사제 폴리뉴클레오타이드, 또는 AAV piggyBac 트랜스포사제 폴리뉴클레오타이드를 포함하는 전술한 구현예의 벡터 및/또는 조성물 중 어느 하나의 적어도 하나의 치료적 유효량.
구현예 115. 구현예 114에 있어서, 적어도 하나의 MLD는 N-아세틸글루타메이트 신테타제(NAGS) 결핍, 카르바모일포스페이트 신테타제 I 결핍(CPSI 결핍), 오르니틴 트랜스카바밀라제(OTC) 결핍, 아르기니노석시네이트 신테타제 결핍(ASSD)(시트룰린혈증 I), 시트린 결핍(시트룰린혈증 II), 아르기니노석시네이트 리아제 결핍(아르기노석신산 뇨증), 아르기나제 결핍(고아르기닌혈증), 오르니틴 트랜스로카제 결핍(HHH 증후군), 메틸말론산혈증(MMA), 진행성 가족성 간내 담즙정체 1형(PFIC1), 진행성 가족성 간내 담즙정체 1형(PFIC2), 진행성 가족성 간내 담즙정체 1형(PFIC3) 또는 이들의 임의의 조합인 것인 방법.
구현예 116. 구현예 115에 있어서, MLD는 오르니틴 트랜스카르바밀라제(OTC) 결핍인 것인 방법.
정의
핵산 및 폴리뉴클레오타이드 분자
본 개시내용의 핵산 분자 및 폴리뉴클레오타이드 분자는 mRNA, hnRNA, tRNA 또는 임의의 다른 형태와 같은 RNA의 형태, 또는 비제한적으로 클로닝에 의해 수득되거나 합성적으로 생산된 cDNA 및 게놈 DNA를 포함하는 DNA 형태, 또는 이들의 조합일 수 있다. DNA는 삼중 가닥, 이중 가닥 또는 단일 가닥, 또는 이들의 임의의 조합일 수 있다. DNA 또는 RNA의 적어도 하나의 가닥의 임의의 부분은 센스 가닥으로도 공지된 코딩 가닥일 수 있거나, 또는 그것은 안티센스 가닥으로도 지칭되는 비코딩 가닥일 수 있다.
핵산 및 폴리뉴클레오타이드 분자의 제작
본 개시내용의 핵산 및 폴리뉴클레오타이드 분자는 당업계에 널리 공지된 바와 같이 (a) 재조합 방법, (b) 합성 기술, (c) 정제 기술, 및/또는 (d) 이들의 조합을 사용하여 제조될 수 있다.
핵산 및 폴리뉴클레오타이드 분자는 본 개시내용의 폴리뉴클레오타이드 이외의 뉴클레오타이드 서열을 간편하게 포함할 수 있다. 예를 들어, 하나 이상의 엔도뉴클레아제 제한 부위를 포함하는 다중 클로닝 부위가 폴리뉴클레오타이드의 단리를 돕기 위해 핵산 내로 삽입될 수 있다. 또한, 번역가능한 서열이 본 개시내용의 번역된 폴리뉴클레오타이드의 단리를 돕기 위해 삽입될 수 있다. 예를 들어, 헥사-히스티딘 마커 서열은 본 개시내용의 단백질을 정제하기 위한 편리한 수단을 제공한다. 코딩 서열을 제외한 본 개시내용의 핵산은 선택적으로 본 개시내용의 폴리뉴클레오타이드의 클로닝 및/또는 발현을 위한 벡터, 어댑터 또는 링커이다.
추가적인 서열이 클로닝 및/또는 발현에서의 이들의 기능을 최적화하거나, 폴리뉴클레오타이드의 단리를 돕거나, 또는 폴리뉴클레오타이드의 세포 내로의 도입을 개선하기 위해 이러한 클로닝 및/또는 발현 서열에 추가될 수 있다. 클로닝 벡터, 발현 벡터, 어댑터 및 링커의 사용은 당업계에 잘 알려져 있다.
핵산 및 폴리뉴클레오타이드 분자를 제작하기 위한 재조합 방법
RNA, cDNA, 게놈 DNA, 또는 이들의 임의의 조합과 같은 본 개시내용의 핵산 및 폴리뉴클레오타이드 분자는 당업자에게 공지된 많은 클로닝 방법을 사용하여 생물학적 공급원으로부터 수득될 수 있다. 일부 양태에서, 엄격한 조건 하에 본 개시내용의 폴리뉴클레오타이드에 선택적으로 혼성화하는 올리고뉴클레오타이드 프로브가 cDNA 또는 게놈 DNA 라이브러리에서 원하는 서열을 확인하는 데 사용된다. RNA의 단리, 및 cDNA 및 게놈 라이브러리의 제작은 당업자에게 잘 알려져 있다.
핵산 스크리닝 및 단리 방법
cDNA 또는 게놈 라이브러리는 본 개시내용의 폴리뉴클레오타이드의 서열에 기초하여 프로브를 사용하여 스크리닝될 수 있다. 프로브는 게놈 DNA 또는 cDNA 서열과 혼성화하여 동일하거나 다른 유기체에서 상동 유전자를 단리하는 데 사용될 수 있다. 당업자는 다양한 정도의 혼성화 엄격성이 분석에서 사용될 수 있음을 이해할 것이며; 혼성화 또는 세척 배지는 엄격할 수 있다. 혼성화 조건이 더 엄격해짐에 따라, 이합체 형성이 발생하기 위해 프로브와 표적 사이에 더 큰 상보성 정도가 존재해야 한다. 엄격성의 정도는 온도, 이온 강도, pH 및 포름아미드와 같은 부분 변성 용매의 존재 중 하나 이상에 의해 제어될 수 있다. 예를 들어, 혼성화의 엄격성은, 예를 들어 포름아미드의 농도를 0% 내지 50% 범위 내에서 조작하는 것을 통해 반응 용액의 극성을 변경함으로써 간편하게 달라진다. 검출가능한 결합에 필요한 상보성(서열 동일성)의 정도는 혼성화 배지 및/또는 세척 배지의 엄격성에 따라 달라질 것이다. 상보성의 정도는 최적으로는 100%, 또는 70-100%, 또는 그 안의 임의의 범위 또는 값일 것이다. 그러나, 프로브 및 프라이머의 약간의 서열 변이는 혼성화 및/또는 세척 배지의 엄격성을 감소시킴으로써 보상될 수 있는 것으로 이해되어야 한다.
RNA 또는 DNA의 증폭 방법은 당업계에 잘 알려져 있으며, 본원에 제시된 교시 및 지침에 기초하여 과도한 실험 없이 본 개시내용에 따라 사용될 수 있다.
알려진 DNA 또는 RNA 증폭 방법은 비제한적으로 중합효소 연쇄 반응(PCR) 및 관련 증폭 과정(예컨대, 미국 특허 제4,683,195호, 제4,683,202호, 제4,800,159호, 제4,965,188호(Mullis, et al.); 제4,795,699호 및 제4,921,794호(Tabor, et al); 제5,142,033호(Innis); 제5,122,464호(Wilson, et al.); 제5,091,310호(Innis); 제5,066,584호(Gyllensten, et al); 제4,889,818호(Gelfand, et al); 제4,994,370호(Silver, et al); 제4,766,067호(Biswas); 제4,656,134호(Ringold)) 및 이중 가닥 DNA 합성을 위한 주형으로서 표적 서열에 대한 안티센스 RNA를 사용하는 RNA 매개 증폭(미국 특허 제5,130,238호(Malek, et al), 상표명 NASBA)를 포함하고, 이들 참고문헌의 전체 내용은 본원에 참조로 포함되어 있다.
예를 들어, 중합효소 연쇄 반응(PCR) 기술이 게놈 DNA 또는 cDNA 라이브러리로부터 직접 본 개시내용의 폴리뉴클레오타이드 및 관련 유전자의 서열을 증폭하는 데 사용될 수 있다. PCR 및 기타 시험관내 증폭 방법은 또한 예를 들어 발현될 단백질을 코딩하는 핵산 서열을 클로닝하는 데, 샘플에서 원하는 mRNA의 존재를 검출하기 위한 프로브로 사용하기 위해 핵산을 만드는 데, 핵산 시퀀싱에, 또는 다른 목적에 유용할 수 있다. 시험관 내 증폭 방법을 통해 숙련자를 지도하기에 충분한 기술의 예는 미국 특허 제4,683,202호(1987); 및 Innis, et al., PCR Protocols A Guide to Methods and Applications, Eds., Academic Press Inc., San Diego, Calif. (1990)에서 찾을 수 있다. 게놈 PCR 증폭을 위한 상업적으로 이용가능한 키트는 당업계에 공지되어 있다. 예컨대, Advantage-GC 게놈 PCR 키트(Clontech)를 참고한다. 또한, 예컨대, T4 유전자 32 단백질(Boehringer Mannheim)이 긴 PCR 산물의 수율을 개선하는 데 사용될 수 있다.
핵산을 제작하기 위한 합성 방법
본 개시내용의 핵산 및 폴리뉴클레오타이드 분자는 또한 공지된 방법에 의한 직접적인 화학적 합성에 의해 제조될 수 있다. 화학적 합성은 일반적으로 단일 가닥 올리고뉴클레오타이드를 생성하며, 이는 상보적 서열과의 혼성화에 의해 또는 단일 가닥을 주형으로 사용하는 DNA 중합효소를 이용한 중합에 의해 이중 가닥 DNA로 전환될 수 있다. 당업자는 DNA의 화학적 합성이 약 100개 이상의 염기 서열로 제한될 수 있지만 더 긴 서열이 더 짧은 서열들의 결찰에 의해 수득될 수 있음을 인식할 것이다.
재조합 발현 카세트
본 개시내용은 본 개시내용의 핵산 또는 폴리뉴클레오타이드 분자를 포함하는 재조합 발현 카세트를 추가로 제공한다. 본 개시내용의 핵산 또는 폴리뉴클레오타이드는 적어도 하나의 원하는 숙주 세포 내로 도입될 수 있는 재조합 발현 카세트를 제작하는 데 사용될 수 있다. 재조합 발현 카세트는 전형적으로 의도된 숙주 세포에서 폴리뉴클레오타이드의 전사를 지시할 전사 개시 조절 서열에 작동가능하게 연결된 본 개시내용의 폴리뉴클레오타이드를 포함할 것이다. 이종성 및 비이종성(즉, 내인성) 프로모터 둘 모두는 본 개시내용의 핵산의 발현을 지시하는 데 사용될 수 있다.
일부 양태에서, 프로모터, 인핸서, 또는 다른 요소로 작용하는 단리된 핵산은 본 개시내용의 폴리뉴클레오타이드의 발현을 상향 또는 하향 조절하기 위해 본 개시내용의 폴리뉴클레오타이드의 비이종 형태의 적절한 위치(상류, 하류 또는 인트론)에 도입될 수 있다. 예를 들어, 내인성 프로모터는 돌연변이, 결실 및/또는 치환에 의해 생체내 또는 시험관내에서 변경될 수 있다.
발현 벡터 및 숙주 세포
본 개시내용은 또한 본 개시내용의 단리된 핵산 및 폴리뉴클레오타이드 분자를 포함하는 벡터, 재조합 벡터로 유전적으로 조작된 숙주 세포, 및 당업계에 널리 공지된 바와 같은 재조합 기술에 의한 적어도 폴리뉴클레오타이드의 생산에 관한 것이다.
폴리뉴클레오타이드는 숙주에서 증식을 위한 선택가능한 마커를 함유하는 벡터에 선택적으로 연결될 수 있다. 일반적으로, 플라스미드 벡터는 인산칼슘 침전물과 같은 침전물 또는 하전된 지질과의 복합체에 도입된다. 벡터가 바이러스인 경우, 그것은 적절한 패키징 세포주를 사용하여 시험관 내에서 패키징된 다음 숙주 세포 내로 형질도입될 수 있다.
DNA 삽입물은 적절한 프로모터에 작동가능하게 연결되어야 한다. 발현 작제물은 전사 개시, 종결 부위 및 전사된 영역에서 번역을 위한 리보솜 결합 부위를 추가로 함유할 것이다. 작제물에 의해 발현된 성숙한 전사체의 코딩 부분은 바람직하게는 시작시 번역 개시 및 번역될 mRNA의 말단에 적절하게 위치하는 종결 코돈(예컨대, UAA, UGA 또는 UAG)을 포함할 것이며, 포유동물 또는 진핵 세포 발현을 위해 UAA 및 UAG가 바람직하다.
발현 벡터는 바람직하게는 그러나 선택적으로 적어도 하나의 선택가능한 마커를 포함할 것이다. 이러한 마커는 예컨대 비제한적으로 암피실린, 제오신(Sh bla 유전자), 퓨로마이신(pac 유전자), 하이그로마이신 B(hygB 유전자), G418/제네티신(neo 유전자), DHFR(디하이드로폴레이트 환원효소를 코딩하고 메토트렉세이트에 대한 내성 부여), 마이코페놀산, 또는 글루타민 신테타제(GS, 미국 특허 제5,122,464호; 제5,770,359호; 제5,827,739호), 블라스티시딘(bsd 유전자), 진핵 세포 배양을 위한 내성 유전자뿐만 아니라, 암피실린, 제오신(Sh bla 유전자), 퓨로마이신(pac 유전자), 하이그로마이신 B(hygB 유전자), G418/제네티신(neo 유전자), 카나마이신, 스펙티노마이신, 스트렙토마이신, 카르베니실린, 블레오마이신, 에리트로마이신, 폴리믹신 B, 또는 E. coli 및 기타 박테리아 또는 원핵생물에서 배양하기 위한 테트라사이클린 내성 유전자(상기 특허는 전체가 참고로 본원에 포함됨)를 포함한다. 전술한 숙주 세포에 대한 적절한 배양 배지 및 조건은 당업계에 공지되어 있다. 적합한 벡터는 당업자에게 쉽게 명백할 것이다. 숙주 세포 내로 벡터 작제물의 도입은 인산칼슘 형질감염, DEAE-덱스트란 매개 형질감염, 양이온성 지질 매개 형질감염, 전기천공, 형질도입, 감염 또는 기타 공지된 방법에 의해 달성될 수 있다.
발현 벡터는 바람직하게는 그러나 선택적으로 본 개시내용의 조성물 및 방법에 의해 변형된 세포의 단리를 위한 적어도 하나의 선택가능한 세포 표면 마커를 포함할 것이다. 본 개시내용의 선택가능한 세포 표면 마커는 세포 또는 세포의 서브세트를 또 다른 정의된 세포의 서브세트와 구별하는 표면 단백질, 당단백질, 또는 단백질의 그룹을 포함한다. 바람직하게는 선택가능한 세포 표면 마커는 본 개시내용의 조성물 또는 방법에 의해 변형된 세포를 본 개시내용의 조성물 또는 방법에 의해 변형되지 않은 세포와 구별한다. 이러한 세포 표면 마커는, 예컨대 비제한적으로 "지정 클러스터(cluster of designation)" 또는 "분류 결정인자" 단백질(종종 "CD"로 약칭됨), 예컨대 CD19, CD271, CD34, CD22, CD20, CD33, CD52의 절단된 또는 전장 형태, 또는 이들의 임의의 조합을 포함한다. 세포 표면 마커는 자살 유전자 마커 RQR8을 추가로 포함한다(Philip B et al. Blood. 2014 Aug 21; 124(8):1277-87).
발현 벡터는 바람직하게는 그러나 선택적으로 본 개시내용의 조성물 및 방법에 의해 변형된 세포의 단리를 위한 적어도 하나의 선택가능한 약물 내성 마커를 포함할 것이다. 본 개시내용의 선택가능한 약물 내성 마커는 야생형 또는 돌연변이 Neo, DHFR, TYMS, FRANCF, RAD51C, GCS, MDR1, ALDH1, NKX2.2, 또는 이들의 임의의 조합을 포함할 수 있다.
당업자는 핵산 또는 폴리뉴클레오타이드 분자의 발현에 이용가능한 수많은 발현 시스템을 알고 있다. 대안적으로, 본 개시내용의 핵산은 본 개시내용의 핵산 또는 폴리뉴클레오타이드를 코딩하는 내인성 DNA를 함유하는 숙주 세포에서 켜짐으로써(조작에 의해) 숙주 세포에서 발현될 수 있다. 이러한 방법은, 예컨대 전체가 참조로 본원에 포함된 미국 특허 제5,580,734호, 제5,641,670호, 제5,733,746호 및 제5,733,761호에 기재된 바와 같이, 당업계에 널리 공지되어 있다.
본 개시내용의 핵산 및 폴리뉴클레오타이드 분자, 이의 특정 부분 또는 변이체의 생산에 유용한 세포 배양물의 예시는 당업계에 공지된 바와 같은 박테리아, 효모 및 포유동물 세포이다. 포유동물 세포 시스템은 종종 세포의 단층 형태일 것이지만, 포유동물 세포 현탁액 또는 생물반응기가 또한 사용될 수 있다. 많은 적합한 숙주 세포주가 당업계에서 개발되었으며, 이는 COS-1(예컨대, ATCC CRL 1650), COS-7(예컨대, ATCC CRL-1651), HEK293, BHK21(예컨대, ATCC CRL-10), CHO(예컨대, ATCC CRL 1610) 및 BSC-1(예컨대, ATCC CRL-26) 세포주, Cos-7 세포, CHO 세포, hep G2 세포, P3X63Ag8.653, SP2/0-Ag14, 293 세포, HeLa 세포 등을 포함하며, 이는 예를 들어 아메리칸 타입 컬쳐 컬렉션(American Type Culture Collection, Manassas, Va. (www.atcc.org))으로부터 쉽게 입수가능하다. 바람직한 숙주 세포는 골수종 및 림프종 세포와 같은 림프계 기원의 세포를 포함한다. 특히 바람직한 숙주 세포는 P3X63Ag8.653 세포(ATCC 수탁 번호 CRL-1580) 및 SP2/0-Ag14 세포(ATCC 수탁 번호 CRL-1851)이다. 바람직한 양태에서, 재조합 세포는 P3X63Ab8.653 또는 SP2/0-Ag14 세포이다.
이들 세포에 대한 발현 벡터는 하기 발현 제어 서열, 예컨대 비제한적으로 복제 원점; 프로모터(예컨대, 후기 또는 초기 SV40 프로모터, CMV 프로모터(미국 특허 제5,168,062호; 제5,385,839호), HSV tk 프로모터, pgk(포스포글리세레이트 키나제) 프로모터, EF-1 알파 프로모터(미국 특허 제5,266,491호), 적어도 하나의 인간 프로모터; 인핸서, 및/또는 프로세싱 정보 부위, 예컨대 리보솜 결합 부위, RNA 스플라이스 부위, 폴리아데닐화 부위(예컨대, SV40 큰 T Ag 폴리 A 부가 부위), 및 전사 종결자 서열 중 하나 이상을 포함할 수 있다. 예컨대, 상기 문헌[Ausubel et al.; Sambrook, et al.]을 참고한다. 본 개시내용의 핵산 또는 단백질의 생산에 유용한 다른 세포는, 예를 들어 세포주 및 하이브리도마의 아메리칸 타입 컬쳐 컬렉션 카탈로그(www.atcc.org) 또는 기타 공지된 또는 상업적 출처로부터 공지 및/또는 입수가능하다.
진핵 숙주 세포가 사용되는 경우, 폴리아데닐화 또는 전사 종결자 서열이 전형적으로 벡터 내로 혼입된다. 종결자 서열의 예는 소 성장 호르몬 유전자의 폴리아데닐화 서열이다. 전사체의 정확한 스플라이싱을 위한 서열이 또한 포함될 수 있다. 스플라이싱 서열의 예는 SV40으로부터의 VP1 인트론이다(Sprague, et al., J. Virol. 45:773-781(1983)). 추가로, 숙주 세포에서 복제를 제어하기 위한 유전자 서열이 당업계에 공지된 바와 같이 벡터 내로 혼입될 수 있다.
본 개시내용은 단리되거나 실질적으로 정제된 폴리뉴클레오타이드 또는 단백질 조성물을 제공한다. "단리된" 또는 "정제된" 폴리뉴클레오타이드 또는 단백질, 또는 이의 생물학적 활성 부분은 그의 자연적으로 발생하는 환경에서 발견되는 폴리뉴클레오타이드 또는 단백질을 정상적으로 동반되거나 이와 상호작용하는 성분이 실질적으로 또는 본질적으로 없다. 따라서, 단리되거나 정제된 폴리뉴클레오타이드 또는 단백질은 재조합 기술에 의해 생성될 때 다른 세포 물질 또는 배양 배지가 실질적으로 없거나, 또는 화학적으로 합성될 때 화학적 전구체 또는 기타 화학물질이 실질적으로 없다. 최적으로, "단리된" 폴리뉴클레오타이드는 폴리뉴클레오타이드가 유래된 유기체의 게놈 DNA에서 폴리뉴클레오타이드에 자연적으로 측접하는(즉, 폴리뉴클레오타이드의 5' 및 3' 말단에 위치하는 서열) 서열(최적으로는 단백질 코딩 서열)이 없다. 예를 들어, 다양한 양태에서, 단리된 폴리뉴클레오타이드는 폴리뉴클레오타이드가 유래된 세포의 게놈 DNA에서 폴리뉴클레오타이드에 자연적으로 측접하는 약 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb, 또는 0.1 kb 미만의 뉴클레오타이드 서열을 함유할 수 있다. 세포 물질이 실질적으로 없는 단백질은 약 30%, 20%, 10%, 5%, 또는 1% 미만(건조 중량으로)의 오염 단백질을 갖는 단백질 제제를 포함한다. 본 개시내용의 단백질 또는 그의 생물학적 활성 부분이 재조합적으로 생성되는 경우, 최적으로 배양 배지는 약 30%, 20%, 10%, 5%, 또는 1% 미만(건조 중량으로)의 화학적 전구체 또는 비단백질 관심 화학 물질을 나타낸다.
본 개시내용은 개시된 DNA 서열의 단편 및 변이체 및 이들 DNA 서열에 의해 코딩된 단백질을 제공한다. 본 개시내용 전반에 걸쳐 사용된 바와 같이, 용어 "단편"은 DNA 서열의 일부 또는 아미노산 서열의 일부 및 이에 따라 이에 의해 코딩된 단백질을 지칭한다. 코딩 서열을 포함하는 DNA 서열의 단편은 천연 단백질의 생물학적 활성 및 이에 따라 본원에 기재된 바와 같은 표적 DNA 서열에 대한 DNA 인식 또는 결합 활성을 유지하는 단백질 단편을 코딩할 수 있다. 대안적으로, 혼성화 프로브로서 유용한 DNA 서열의 단편은 일반적으로 생물학적 활성을 유지하거나 프로모터 활성을 유지하지 않는 단백질을 코딩하지 않는다. 따라서, DNA 서열의 단편은적어도 약 20개 뉴클레오타이드, 약 50개 뉴클레오타이드, 약 100개 뉴클레오타이드, 및 본 개시내용의 전장 폴리뉴클레오타이드까지의 범위일 수 있다.
본 개시내용의 핵산 또는 단백질은 후속적으로 최종 목적 벡터로 조립될 수 있는 표적 벡터에서 단량체 단위 및/또는 반복 단위를 사전 조립하는 것을 포함하는 모듈식 접근법에 의해 구성될 수 있다. 본 개시내용의 폴리펩타이드는 본 개시내용의 반복 단량체를 포함할 수 있고, 후속적으로 최종 목적 벡터로 조립될 수 있는 표적 벡터에서 반복 단위를 사전 조립함으로써 모듈식 접근법에 의해 구성될 수 있다. 본 개시내용은 이 방법에 의해 생산된 폴리펩타이드뿐만 아니라 이들 폴리펩타이드를 코딩하는 핵산 서열을 제공한다. 본 개시내용은 이러한 모듈식 접근법에 의해 생산된 폴리펩타이드를 코딩하는 핵산 서열을 포함하는 숙주 유기체 및 세포를 제공한다.
용어 "포함하는"은 조성물 및 방법이 인용된 요소를 포함하지만 다른 요소를 배제하지 않는다는 것을 의미하도록 의도된다. 조성물 및 방법을 정의하는 데 사용될 때 "본질적으로 구성되는"은 의도된 목적을 위해 사용될 때 조합에 임의의 본질적으로 중요한 다른 요소를 배제하는 것을 의미할 것이다. 따라서, 본원에 정의된 바와 같은 요소로 본질적으로 구성된 조성물은 미량의 오염물 또는 불활성 담체를 배제하지 않을 것이다. "구성되는 것"은 다른 성분 및 실질적인 방법 단계의 미량 원소 이상을 배제하는 것을 의미할 것이다. 이러한 전환 용어 각각에 의해 정의된 양태는 본 개시내용의 범위에 속한다.
본원에 사용된 바와 같이, "발현"은 폴리뉴클레오타이드가 mRNA로 전사되는 과정 및/또는 전사된 mRNA가 후속적으로 펩타이드, 폴리펩타이드 또는 단백질로 번역되는 과정을 지칭한다. 폴리뉴클레오타이드가 게놈 DNA로부터 유래된 경우, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다.
"유전자 발현"은 유전자에 포함된 정보를 유전자 산물로 변환하는 것을 지칭한다. 유전자 산물은 유전자의 직접적인 전사 산물(예컨대, mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, shRNA, 마이크로 RNA, 구조적 RNA 또는 임의의 다른 유형의 RNA) 또는 mRNA의 번역에 의해 생산된 단백질일 수 있다. 유전자 산물은 또한 캡핑, 폴리아데닐화, 메틸화, 및 편집과 같은 과정에 의해 변형된 RNA, 및 예를 들어 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화, 및 글리코실화에 의해 변형된 단백질을 포함한다.
유전자 발현의 "조절"은 유전자의 활성의 변화를 지칭한다. 발현 조절은, 비제한적으로 유전자 활성화 및 유전자 억제를 포함할 수 있다.
용어 "작동적으로 연결된(opreratively linked)" 또는 그의 등가물(예컨대, "작동적으로 연결된(linked operatively)")은 둘 이상의 분자가 상호작용하여 하나 또는 두 분자 또는 이의 조합에 기인할 수 있는 기능에 영향을 미칠 수 있도록 서로에 대해 위치하는 것을 의미한다. 일부 양태에서, 이식유전자 서열, 또는 임의의 다른 서열은 프로모터 서열이 이식유전자 서열 또는 임의의 다른 서열의 발현을 제어할 때 프로모터 서열에 작동가능하게 연결된 것이라 한다. 일부 양태에서, 트랜스포사제 서열은 프로모터 서열이 트랜스포사제 서열의 발현을 제어할 때 프로모터 서열에 작동가능하게 연결된 것이라 한다.
비공유 연결된 구성요소 및 비공유 연결된 구성요소를 제조하고 사용하는 방법이 개시되어 있다. 다양한 구성요소는 본원에 기재된 바와 같은 다양한 상이한 형태를 취할 수 있다. 예를 들어, 비공유적으로 연결된(즉, 작동가능하게 연결된) 단백질은 당업계의 하나 이상의 문제를 피하는 일시적인 상호작용을 허용하기 위해 사용될 수 있다. 단백질과 같은 비공유 연결된 구성요소의 결합 및 해리하는 능력은 이러한 결합이 원하는 활성에 필요한 상황에서만 또는 주로 이러한 상황에서 기능적 결합을 가능하게 한다. 연결은 원하는 효과를 허용하기에 충분한 기간일 수 있다.
용어 "핵산" 또는 "올리고뉴클레오타이드" 또는 "폴리뉴클레오타이드"는 함께 공유 연결된 적어도 2개의 뉴클레오타이드를 지칭한다. 단일 가닥의 서술은 또한 상보적 가닥의 서열을 정의한다. 따라서, 핵산은 또한 도시된 단일 가닥의 상보적 가닥을 포괄할 수 있다. 본 개시내용의 핵산은 또한 동일한 구조를 유지하거나 동일한 단백질을 코딩하는 실질적으로 동일한 핵산 및 그의 상보체를 포괄한다.
본 개시내용의 핵산은 단일 가닥 또는 이중 가닥일 수 있다. 본 개시내용의 핵산은 분자의 대부분이 단일 가닥인 경우에도 이중 가닥 서열을 함유할 수 있다. 본 개시내용의 핵산은 분자의 대부분이 이중 가닥인 경우에도 단일 가닥 서열을 함유할 수 있다. 본 개시내용의 핵산은 게놈 DNA, cDNA, RNA, 또는 이들의 하이브리드를 포함할 수 있다. 본 개시내용의 핵산은 데옥시리보뉴클레오타이드 및 리보뉴클레오타이드의 조합을 함유할 수 있다. 본 개시내용의 핵산은 우라실, 아데닌, 티민, 시토신, 구아닌, 이노신, 잔틴, 하이포잔틴, 이소시토신 및 이소구아닌을 포함하는 염기의 조합을 함유할 수 있다. 본 개시내용의 핵산은 비자연 아미노산 변형을 포함하도록 합성될 수 있다. 본 개시내용의 핵산은 화학적 합성 방법에 의해 또는 재조합 방법에 의해 수득될 수 있다.
본 개시내용의 핵산, 그의 전체 서열 또는 그의 임의의 부분은 비자연 발생일 수 있다. 본 개시내용의 핵산은 자연적으로 발생하지 않는 하나 이상의 돌연변이, 치환, 결실 또는 삽입을 함유할 수 있으며, 이는 전체 핵산 서열을 비자연 발생으로 만든다. 본 개시내용의 핵산은 하나 이상의 복제, 역전 또는 반복 서열을 함유할 수 있으며, 이의 생성된 서열은 자연 발생하지 않아, 전체 핵산 서열을 비자연 발생으로 만든다. 본 개시내용의 핵산은 자연 발생이 아닌 변형, 인공 또는 합성 뉴클레오타이드를 함유할 수 있어, 전체 핵산 서열을 비자연 발생으로 만든다.
유전 코드의 중복성을 감안할 때, 복수의 뉴클레오타이드 서열은 임의의 특정 단백질을 코딩할 수 있다. 이러한 모든 뉴클레오타이드 서열이 본원에서 고려된다.
본 개시내용 전반에 걸쳐 사용된 바와 같이, 용어 "작동가능하게 연결된"은 공간적으로 연결된 프로모터의 제어 하에 있는 유전자의 발현을 지칭한다. 프로모터는 그의 제어 하에 있는 유전자의 5'(상류) 또는 3'(하류)에 위치할 수 있다. 프로모터와 유전자 사이의 거리는 그 프로모터와 프로모터가 유래된 유전자에서 그것이 제어하는 유전자 사이의 거리와 거의 동일할 수 있다. 프로모터와 유전자 사이의 거리 변화는 프로모터 기능의 손실 없이 수용될 수 있다.
본 개시내용 전반에 걸쳐 사용된 바와 같이, 용어 "프로모터"는 세포에서 핵산의 발현을 부여, 활성화 또는 향상시킬 수 있는 합성 또는 자연 유래 분자를 지칭한다. 프로모터는 발현을 더 향상시키고/시키거나 그의 공간적 발현 및/또는 시간적 발현을 변경하기 위해 하나 이상의 특이적 전사 조절 서열을 포함할 수 있다. 프로모터는 또한 원위 인핸서 또는 억제자 요소를 포함할 수 있고, 이는 전사 시작 부위로부터 수천 염기쌍만큼 위치할 수 있다. 프로모터는 바이러스, 박테리아, 진균, 식물, 곤충, 및 동물을 포함하는 공급원으로부터 유래될 수 있다. 프로모터는 발현이 발생나는 세포, 조직 또는 기관에 대해, 발현이 발생하는 발달 단계에 대해, 또는 생리학적 스트레스, 병원체, 금속 이온 또는 유도제와 같은 외부 자극에 대한 반응으로, 유전자 구성요소의 발현을 구성적으로 또는 차등적으로 조절할 수 있다. 프로모터의 대표적인 예는 박테리오파지 T7 프로모터, 박테리오파지 T3 프로모터, SP6 프로모터, lac 오퍼레이터-프로모터, tac 프로모터, SV40 후기 프로모터, SV40 초기 프로모터, RSV-LTR 프로모터, CMV IE 프로모터, EF-1 알파 프로모터, CAG 프로모터, SV40 초기 프로모터 또는 SV40 후기 프로모터 및 CMV IE 프로모터를 포함한다.
본 개시내용 전반에 걸쳐 사용된 바와 같이, 용어 "실질적으로 상보적"은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 180, 270, 360, 450, 540개, 또는 그 이상의 뉴클레오타이드 또는 아미노산의 영역에 걸쳐 제2 서열의 상보체와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일한 제1 서열을 지칭하거나, 또는 2개의 서열이 엄격한 혼성화 조건 하에서 혼성화한다는 것을 지칭한다.
본 개시내용 전체에 걸쳐 사용된 바와 같이, 용어 "실질적으로 동일한"은 제1 서열이 제2 서열의 상보체와 실질적으로 상보적인 경우 제1 및 제2 서열이 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 180, 270, 360, 450, 540개, 또는 그 이상의 뉴클레오타이드 또는 아미노산의 영역에 걸쳐, 또는 핵산에 대해, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일한 것을 지칭한다.
본 개시내용 전체에 걸쳐 사용된 바와 같이, 핵산을 설명하기 위해 사용될 때 용어 "변이체"는 (i) 참조된 뉴클레오타이드 서열의 부분 또는 단편; (ii) 참조된 뉴클레오타이드 서열의 상보체 또는 이의 부분; (iii) 참조된 핵산 또는 이의 상보체와 실질적으로 동일한 핵산; 또는 (iv) 엄격한 조건 하에 참조된 핵산, 이의 상보체, 또는 이와 실질적으로 동일한 서열에 혼성화하는 핵산을 지칭한다.
본 개시내용 전반에 걸쳐 사용된 바와 같이, 용어 "벡터"는 복제 원점을 함유하는 핵산 서열을 지칭한다. 벡터는 바이러스 벡터, 박테리오파지, 박테리아 인공 염색체 또는 효모 인공 염색체일 수 있다. 벡터는 DNA 또는 RNA 벡터일 수 있다. 벡터는 자가 복제 염색체외 벡터일 수 있고, 바람직하게는 DNA 플라스미드이다. 벡터는 아미노산과 DNA 서열, RNA 서열, 또는 DNA와 RNA 서열 둘 모두의 조합을 포함할 수 있다.
본 개시내용 전반에 걸쳐 사용된 바와 같이, 펩타이드 또는 폴리펩타이드를 설명하기 위해 사용될 때 용어 "변이체"는 아미노산의 삽입, 결실 또는 보존적 치환에 의해 아미노산 서열이 상이하지만 적어도 하나의 생물학적 활성을 유지하는 펩타이드 또는 폴리펩타이드를 지칭한다. 변이체는 또한 적어도 하나의 생물학적 활성을 유지하는 아미노산 서열을 갖는 참조 단백질과 실질적으로 동일한 아미노산 서열을 갖는 단백질을 의미할 수 있다.
아미노산의 보존적 치환, 즉 아미노산을 유사한 특성(예컨대, 친수성, 하전된 영역의 정도 및 분포)의 상이한 아미노산으로 대체하는 것은 통상적으로 사소한 변화를 수반하는 것으로 당업계에서 인식된다. 이러한 사소한 변화는 부분적으로, 당업계에서 이해되는 바와 같이 아미노산의 소수성 지수(hydropathic index)를 고려함으로써 확인될 수 있다(Kyte et al., J. Mol. 157: 29 -19501). 아미노산의 소수성 지수는 그의 소수성 및 전하의 고려에 기초한다. 유사한 소수성 지수의 아미노산은 대체될 수 있으며 여전히 단백질 기능을 유지한다. 일 양태에서, ±2의 소수성 지수를 갖는 아미노산이 치환된다. 아미노산의 친수성은 또한 생물학적 기능을 유지하는 단백질을 초래할 치환을 밝히는 데 사용될 수 있다. 펩타이드의 맥락에서 아미노산의 친수성의 고려는 항원성 및 면역원성과 상관관계가 있는 것으로 보고된 유용한 척도인 해당 펩타이드의 최대 국소 평균 친수성의 계산을 허용한다. 참조에 의해 본원에 완전히 통합된 미국 특허 제4,554,101호.
유사한 친수성 값을 갖는 아미노산의 치환은 생물학적 활성, 예를 들어 면역원성을 유지하는 펩타이드를 초래할 수 있다. 치환은 서로 ±2 이내의 친수성 값을 갖는 아미노산으로 수행될 수 있다. 아미노산의 소수성 지수와 친수성 값 모두는 해당 아미노산의 특정 측쇄에 의해 영향을 받는다. 그 관찰과 일치하게, 생물학적 기능과 양립할 수 있는 아미노산 치환은 소수성, 친수성, 전하, 크기, 다른 특성에 의해 밝혀진 바와 같이, 아미노산, 및 특히 상기 아미노산의 측쇄의 상대적 유사성에 좌우되는 것으로 이해된다.
본원에 사용된 바와 같이, "보존적" 아미노산 치환은 하기 표 A, B 또는 C에 제시된 바와 같이 정의될 수 있다. 일부 양태에서, 융합 폴리펩타이드 및/또는 이러한 융합 폴리펩타이드를 코딩하는 핵산은 본 개시내용의 폴리펩타이드를 코딩하는 폴리뉴클레오타이드의 변형에 의해 도입된 보존적 치환을 포함한다. 아미노산은 물리적 특성과 2차 및 3차 단백질 구조에 대한 기여에 따라 분류될 수 있다. 보존적 치환은 하나의 아미노산이 유사한 특성을 가진 또 다른 아미노산으로 치환되는 것이다. 예시적인 보존적 치환이 표 A에 제시되어 있다.
[표 A] -- 보존적 치환 I
Figure pct00001
대안적으로, 보존적 아미노산은 표 B에 제시된 바와 같이 문헌[Lehninger, (Biochemistry, Second Edition; Worth Publishers, Inc. NY, N.Y. (1975), pp. 71-77)]에 기재된 바와 같이 그룹화될 수 있다.
[표 B] -- 보존적 치환 II
Figure pct00002
대안적으로, 예시적인 보존적 치환이 표 C에 제시되어 있다.
[표 C] -- 보존적 치환 III
Figure pct00003
본 개시내용의 폴리펩타이드는 아미노산 잔기의 하나 이상의 삽입, 결실 또는 치환, 또는 이들의 임의의 조합을 보유하는 폴리펩타이드뿐만 아니라 아미노산 잔기의 삽입, 결실 또는 치환 이외의 변형을 포함하는 것으로 이해되어야 한다. 본 개시내용의 폴리펩타이드 또는 핵산은 하나 이상의 보존적 치환을 함유할 수 있다.
본 개시내용 전반에 걸쳐 사용된 바와 같이, 용어 "하나 초과의" 상기 언급된 아미노산 치환은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 이상의 언급된 아미노산 치환을 지칭한다. 용어 "하나 초과"는 2, 3, 4, 또는 5개의 언급된 아미노산 치환을 지칭할 수 있다.
본 개시내용의 폴리펩타이드 및 단백질, 이들의 전체 서열 또는 이의 임의의 부분은 비자연 발생일 수 있다. 본 개시내용의 폴리펩타이드 및 단백질은 자연 발생하지 않는 하나 이상의 돌연변이, 치환, 결실 또는 삽입을 함유하여, 전체 아미노산 서열을 비자연 발생으로 만들 수 있다. 본 개시내용의 폴리펩타이드 및 단백질은 하나 이상의 복제, 역전 또는 반복 서열을 함유할 수 있고, 이의 생성된 서열은 자연 발생하지 않아, 전체 아미노산 서열을 비자연 발생으로 만든다. 본 개시내용의 폴리펩타이드 및 단백질은 자연 발생하지 않는 변형, 인공 또는 합성 아미노산을 함유할 수 있어, 전체 아미노산 서열을 비자연 발생으로 만든다.
본 개시내용 전반에 걸쳐 사용된 바와 같이, "서열 동일성"은 기본 매개변수(Tatusova and Madden, FEMS Microbiol Lett., 1999, 174, 247-250; 이는 그 전체가 본원에 참고로 포함됨)를 사용하여, NCBI(National Center for Biotechnology Information) ftp 사이트에서 검색할 수 있는 2개의 서열을 블라스팅하기 위한 독립형 실행가능 BLAST 엔진 프로그램(bl2seq)을 사용하여 결정될 수 있다. 2개 이상의 핵산 또는 폴리펩타이드 서열의 맥락에서 사용될 때 용어 "동일한" 또는 "동일성"은 각각의 서열의 지정된 영역에 걸쳐 동일한 잔기의 특정 백분율을 지칭한다. 백분율은 두 서열을 최적으로 정렬하고, 두 서열을 지정된 영역에 대해 비교하고, 두 서열에서 동일한 잔기가 발생하는 위치의 수를 결정하여 일치된 위치의 수를 산출하고, 일치된 위치의 수를 지정된 영역에서의 위치의 총 수로 나누고, 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산될 수 있다. 두 서열이 상이한 길이이거나 정렬이 하나 이상의 엇갈린 말단을 생성하고 지정된 비교 영역이 단일 서열만을 포함하는 경우, 단일 서열의 잔기는 계산의 분자가 아닌 분모에 포함된다. DNA와 RNA를 비교할 때, 티민(T)과 우라실(U)은 동등한 것으로 간주될 수 있다. 동일성은 수동으로 또는 BLAST 또는 BLAST 2.0과 같은 컴퓨터 서열 알고리즘을 사용하여 수행될 수 있다.
본 개시내용 전반에 걸쳐 사용된 바와 같이, 용어 "내인성"은 표적 유전자 또는 그것이 도입된 숙주 세포와 자연적으로 결합된 핵산 또는 단백질 서열을 지칭한다.
본 개시내용 전반에 걸쳐 사용된 바와 같이, 용어 "외인성"은 표적 유전자 또는 그것이 도입된 숙주 세포와 자연적으로 결합되지 않은 핵산 또는 단백질 서열을 지칭하며, 이는 자연 발생 핵산, 예컨대 DNA 서열, 또는 비자연 발생 게놈 위치에 위치한 자연 발생 핵산 서열의 비자연 발생 다중 카피를 포함한다.
본 개시내용은 DNA 서열을 포함하는 폴리뉴클레오타이드 작제물을 숙주 세포 내로 도입하는 방법을 제공한다. "도입"은 작제물이 숙주 세포의 내부에 접근하는 방식으로 폴리뉴클레오타이드 작제물을 세포에 제시하는 것을 의미한다. 본 개시내용의 방법은 폴리뉴클레오타이드 작제물을 숙주 세포 내로 도입하기 위한 특정 방법에 의존하지 않고, 단지 폴리뉴클레오타이드 작제물이 숙주의 하나의 세포의 내부에 대한 접근을 얻는 것에 의존한다. 폴리뉴클레오타이드 작제물을 박테리아, 식물, 진균 및 동물에 도입하는 방법은 당업계에 공지되어 있으며, 비제한적으로 안정한 형질전환 방법, 일시적 형질전환 방법, 및 바이러스 매개 방법을 포함한다.
본원에 사용된 바와 같이, 용어 "대상체"는 용어 "이를 필요로 하는 대상체"와 상호교환가능하며, 둘 모두는 질환을 갖거나 질환 발병 위험이 증가된 대상체를 지칭한다. "대상체"는 포유동물을 포함한다. 포유동물은, 예컨대 인간 또는 적절한 비인간 포유동물, 예컨대 영장류, 마우스, 랫트, 개, 고양이, 소, 말, 염소, 낙타, 양 또는 돼지일 수 있다. 대상체는 새 또는 가금류일 수도 있다. 일 구현예에서, 포유동물은 인간이다.
본원에 사용된 바와 같이, 용어 "치료하는" 또는 "치료하다"는 질환, 병태 또는 장애를 퇴치할 목적으로 환자의 관리 및 보호를 설명하며, 질환, 병태 또는 장애의 증상 또는 합병증을 완화하거나, 질환, 병태 또는 장애를 제거하기 위한 본 개시내용의 화합물 또는 이의 약제학적으로 허용가능한 염, 다형체 또는 용매화물의 투여를 포함한다. 용어 "치료하다"는 또한 시험관내 세포 또는 동물 모델의 치료를 포함할 수 있다.
실시예 1 - 본 개시내용의 바이러스 벡터에 의해 매개된 이식유전자의 생체내 발현
하기 비제한적인 실시예에서, 마우스를 본 개시내용의 바이러스 벡터로 처리하고 바이러스 벡터에 함유된 이식유전자의 발현을 모니터링하였다.
신생 마우스를 4개의 상이한 처리군으로 나누었다.
처리군 #1의 마우스에게 3.3 x 1013 벡터 게놈(vg)/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터를 투여하였다.
처리군 #2의 마우스에게 3.3 x 1013 vg/kg의 투여량으로 도 8에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터를 투여하였다.
처리군 #3의 마우스에게 3.3 x 1013 vg/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 1.1 x 1013 vg/kg의 투여량으로 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 SPB 트랜스포사제를 코딩하는 트랜스포사제 서열을 포함하였다.
처리군 #4의 마우스에게 3.3 x 1013 vg/kg의 투여량으로 도 8에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 1.1 x 1013 vg/kg의 투여량으로 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 SPB 트랜스포사제를 코딩하는 트랜스포사제 서열을 포함하였다.
그 다음, AAV piggyBac 트랜스포존 폴리뉴클레오타이드에서 코딩된 이식유전자의 발현을 측정하기 위해 바이러스 벡터 투여 후 35일 동안 마우스에서 생물발광(BLI) 신호를 측정하였다. 이 분석 결과가 도 10에 나타나 있다. 도 10에서, 처리군 #1은 HLP-OTC로 지칭되고, 처리군 #2는 TBG-OTC로 지칭되며, 처리군 #3은 HLP-OTC+SPB로 지칭되고, 처리군 #4는 TBG-OTC+SPB로 지칭된다.
도 10에 나타낸 바와 같이, 처리군 #3 및 #4의 마우스는 35일 동안 증가된 BLI 수준을 나타낸다. 이론에 얽매이지 않고, 이러한 결과는 AAV piggyBac 트랜스포존 벡터와 AAV 트랜스포사제 벡터의 공동 투여가 AAV piggyBac 트랜스포존 벡터의 이식유전자를 숙주의 게놈 내로 통합하여, 이식유전자의 증가되고 지속적인 발현을 초래할 수 있음을 나타낸다. 더욱이, TBG 프로모터를 포함하는 AAV piggyBac 트랜스포존 벡터가 투여된 처리군 #4에서 이식유전자의 증가된 발현이 관찰되었다. 이론에 얽매이지 않고, 이들 결과는 TBG 프로모터의 사용이 투여 직후에 발생하는 증가된 이식유전자 발현을 제공할 수 있음을 나타낸다. 이러한 활성은 조기 발병 환자가 치료되고 있는 임상 환경에서 특히 유리하다.
실시예 2 - 상이한 농도의 본 개시내용의 바이러스 벡터에 의해 매개되는 이식유전자의 생체내 발현
하기 비제한적 실시예에서, 마우스를 다양한 농도의 본 개시내용의 바이러스 벡터로 처리하고 바이러스 벡터에 함유된 이식유전자의 발현을 모니터링하였다.
본 연구에서 마우스에게 다음 중 하나를 투여하였다:
a) 단독으로 도 8에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터의 증가하는 농도; 또는
b) AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터와 조합하여 도 8에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터의 증가하는 농도, 여기서 AAV 트랜스포사제 폴리뉴클레오타이드는 SPB 트랜스포사제를 코딩하는 트랜스포사제 서열을 포함함.
바이러스 벡터 투여 후 21일에, AAV piggyBac 트랜스포존 폴리뉴클레오타이드에서 코딩된 이식유전자의 발현을 측정하기 위해 마우스에서 BLI를 측정하였다. 이 분석 결과가 도 11에 나타나 있다. 도 11에 나타낸 바와 같이, AAV piggyBac 트랜스포존 벡터와 AAV 트랜스포사제 벡터 모두가 공동 투여되었을 때 더 낮은 투여량에서 더 높은 수준의 이식유전자 발현이 달성되었다. 이론에 얽매이지 않고, 이러한 결과는 AAV piggyBac 트랜스포존 벡터와 AAV 트랜스포사제 벡터의 공동 투여가 AAV piggyBac 트랜스포존 벡터의 이식유전자를 숙주의 게놈 내로 통합하여, 이식유전자의 증가되고 지속적인 발현을 초래할 수 있음을 나타낸다. 이는 대상체에게 투여될 필요가 있는 AAV의 총 용량을 감소시킬 수 있기 때문에 임상 환경에서 특히 유리하며, 이는 AAV 벡터의 투여와 전형적으로 관련된 부정적인 부작용을 피하는 데 도움을 줄 수 있다.
실시예 3 - 본 개시내용의 바이러스 벡터를 사용한 Otc spf-ash 마우스의 처리
하기 비제한적인 실시예에서, Otcspf-ash revl 마우스를 본 개시내용의 바이러스 벡터로 처리하였다.
숙련된 기술자에 의해 이해되는 바와 같이, Otcspf-ash 마우스는 OTC 결핍 및 만성 고암모니아혈증을 포함하는 요소 회로 장애의 널리 사용되는 모델이다. 마우스는 Otc 유전자의 엑손 4의 마지막 뉴클레오타이드에서 돌연변이(c. 386G>A; p. R129H)를 함유하여, 5' 스플라이스 부위에 영향을 미치고 인접한 인트론 내로 크립틱 스플라이스 부위의 부분적 사용을 초래한다.
신생 Otcspf-ash 마우스를 두 개의 상이한 처리군으로 나누었다.
처리군 #1의 마우스에게 3.3 x 1013 벡터 게놈(vg)/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 3.3 x 1013 vg/kg의 투여량으로 도 4에 기재된 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. 따라서, 처리군 #1의 마우스를 6.6 x 1013 vg/kg의 총 AAV 투여량으로 1:1의 투여량 비율로 AAV piggyBac 트랜스포존 벡터 및 AAV 트랜스포사제 벡터로 처리하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 인간 OTC를 코딩하는 이식유전자 서열을 포함하여, 이를 내인성 쥣과 OTC와 구별될 수 있게 해준다.
처리군 #2의 마우스에게 3.3 x 1013 벡터 게놈(vg)/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 1.7 x 1013 vg/kg의 투여량으로 도 4에 기재된 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. 따라서, 처리군 #2의 마우스를 5 x 1013 vg/kg의 총 AAV 투여량으로 2:1의 투여량 비율로 AAV piggyBac 트랜스포존 벡터 및 AAV 트랜스포사제 벡터로 처리하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 인간 OTC를 코딩하는 이식유전자 서열을 포함하여, 이를 내인성 쥣과 OTC와 구별될 수 있게 해준다.
바이러스 벡터의 투여 후, BLI를 마우스에서 측정하여 AAV piggyBac 트랜스포존 폴리뉴클레오타이드에서 코딩된 이식유전자의 발현을 측정하였다. 이 분석 결과가 도 12에 나타나 있다. 도 12에 나타난 바와 같이, 두 처리군 모두에서 높은 수준의 이식유전자 발현이 측정되었다.
바이러스 벡터의 투여 후, AAV piggyBAC 트랜스포존 벡터 및 AAV 트랜스포사제 벡터 모두에 대한 2배체 게놈당 비통합된 벡터 카피 수의 양을 측정하였다. 이 분석 결과가 도 13에 나타나 있다. 도 13에 나타난 바와 같이, 비통합된 AAV 트랜스포사제 벡터의 양은 마우스가 나이가 들어감에 따라 감소하였다. 더욱이, 7일째에도 비통합된 AAV 트랜스포사제 벡터의 양은 비통합된 AAV piggyBac 트랜스포존 벡터의 양에 비해 더 낮았다.
바이러스 벡터의 투여 후, 2배체 게놈당 비통합된 AAV piggyBac 트랜스포존 벡터 카피 수의 양 및 통합된 AAV piggyBac 트랜스포존 벡터 카피 수의 양을 측정하였다. 이 분석 결과가 도 14에 나타나 있다. 도 14에 나타낸 바와 같이, 처리 후 21일에 통합된 AAV piggbyBac 트랜스포존 벡터의 검출이 있었다. 더욱이, 통합은 처리군 #2(2:2 OTC:SPB)와 비교하여 처리군 #1(2:1 OTC:SPB)에서 더 일관되었다. 이론에 얽매이지 않고, 도 14의 결과, 특히 트랜스포존 벡터의 통합은 생체내 트랜스포존의 성공적인 전위를 나타낸다.
통합 부위의 수를 또한 21일 및 43일에 LM-PCR에 의해 분석하였다. 간략하게, 2 μg의 게놈 DNA를 마우스 간 조직으로부터 분리하고 초음파 처리에 의해 무작위로 전단하였다. 고유 분자 식별자(UMI)를 생성된 말단에 라이게이션하였다. 2 라운드의 PCR 증폭을 수행하였다. 최종 PCR 생성물을 일루미나(Illumina) 페어드 엔드(paired-end) 시퀀싱하였다. 통합된 부위를 이중 부위 중단점 확인에 의해 결정하였다. 이 PCR 분석의 결과가 표 1 및 2에 나타나 있다. 이론에 구속되기를 바라지 않고, 표 1 및 2에 제시된 결과는 생체내 트랜스포존의 성공적인 전위 및 통합을 나타낸다.
[표 1]
Figure pct00004
[표 2]
Figure pct00005
바이러스 벡터의 투여 후, 쥣과 OTC mRNA 수준 대비 인간 OTC mRNA 및 SPB mRNA의 양을 마우스에서 측정하였다. 이 분석 결과가 도 15에 나타나 있다. 도 15에 나타낸 바와 같이, 바이러스 벡터로 처리된 마우스는 상당한 양의 인간 OTC mRNA를 발현한다. 더욱이, SPB mRNA의 수준은 나이가 들면서 감소한다. 이론에 얽매이지 않고, SPB mRNA의 이러한 감소는 초기 치료 후 오프-표적(off-target) 전위 효과를 피하기 위해 임상 환경에서 유리할 수 있다. 인간 OTC mRNA와 SPB mRNA 대 2배체 게놈당 총 벡터 카피 수 사이의 상관관계 분석을 또한 수행하였다. 이 분석 결과가 도 16에 나타나 있다. 도 16에 나타낸 바와 같이, 인간 OTC 및 SPB의 mRNA 수준은 상응하는 벡터 카피 수와 상관관계가 있었다.
처리 후 21일에, 마우스로부터 간 샘플을 수집하고 GFP 발현을 분석하였다. 처리군 #1 및 처리군 #2 모두에서 수집된 샘플에서의 간 세포는 강력한 GFP 발현을 나타내었다.
실시예 4 - 본 개시내용의 바이러스 벡터를 사용한 유도성 고암모니아혈증 마우스 모델의 처리
하기 비제한적 실시예에서, Otcspf-ash 마우스를 본 개시내용의 바이러스 벡터로 처리하고, shRNA를 사용하여 유도된 고암모니아혈증 이환율 모델을 생성하였다.
신생 Otcspf-ash 마우스를 두 개의 상이한 처리군으로 나누었다.
처리군 #1의 마우스에게 3.3 x 1013 벡터 게놈(vg)/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 3.3 x 1013 vg/kg의 투여량으로 도 4에 기재된 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. 따라서, 처리군 #1의 마우스를 6.6 x 1013 vg/kg의 총 AAV 투여량으로 1:1의 투여량 비율로 AAV piggyBac 트랜스포존 벡터 및 AAV 트랜스포사제 벡터로 처리하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 인간 OTC를 코딩하는 이식유전자 서열을 포함하여, 이를 내인성 쥣과 OTC와 구별될 수 있게 해준다.
처리군 #2의 마우스에게 3.3 x 1013 벡터 게놈(vg)/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 1.7 x 1013 vg/kg의 투여량으로 도 4에 기재된 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. 따라서, 처리군 #2의 마우스를 5 x 1013 vg/kg의 총 AAV 투여량으로 2:1의 투여량 비율로 AAV piggyBac 트랜스포존 벡터 및 AAV 트랜스포사제 벡터로 처리하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 인간 OTC를 코딩하는 이식유전자 서열을 포함하여, 이를 내인성 쥣과 OTC와 구별될 수 있게 해준다.
처리 후 38일에, 각 처리군 내의 서브세트는 다음 중 하나였다.
a) 더 이상 처리되지 않은 상태로 남음
b) 마우스 OTC를 표적으로 하는 shRNA의 투여량이 투여됨.
대조군 및 비교를 위해, 바이러스 벡터로 처리되지 않은 유사한 연령의 Otcspf-ash 마우스에게 또한 마우스 OTC를 표적으로 하는 shRNA의 투여량을 투여하였다.
도 17은 더 이상 처리되지 않은 상태(2:2 OTC:SPB)로 남아 있거나 마우스 OTC를 표적으로 하는 shRNA의 투여량(2:2: OTC:SPB + shRNA)으로 추가로 추여된 처리군 #1의 마우스의 생존 확률을 보여준다. 도 17은 또한 바이러스 벡터로 처리되지 않은 유사한 연령의 Otcspf-ash 마우스 및 마우스 OTC를 표적으로 하는 shRNA의 투여량이 또한 투여된 유사한 연령의 Otcspf-ash 마우스의 생존 확률을 보여준다. 도 18은 전술한 마우스 군의 혈장 중의 암모니아 농도를 보여준다. 도 17 및 도 18에 나타난 바와 같이, shRNA 투여의 해로운 효과는 바이러스 벡터로 처리된 마우스에서 지연된다.
실시예 5 - 본 개시내용의 AAV piggyBac 트랜스포존 벡터에서 상이한 프로모터 서열에 작동가능하게 연결된 이식유전자의 생체내 발현
하기 비제한적 실시예에서, 마우스를 HLP 프로모터, LP1 프로모터 또는 TBG 프로모터 서열에 작동가능하게 연결된 이식유전자를 포함하는 본 개시내용의 바이러스 벡터로 처리하였다. 바이러스 벡터에 함유된 이식유전자의 발현을 모니터링하여 각 프로모터가 생체내, 특히 간 내에서 이식유전자 발현을 유도할 수 있는 효율을 결정하였다.
신생 야생형 마우스 및 성체 야생형 마우스 및 신생 Otcspf-ash 마우스를 12개의 상이한 처리군으로 나누었다.
처리군 #1-#6은 신생 야생형 마우스를 포함하였다.
처리군 #1의 마우스에게 5 x 1013 vg/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터를 투여하였다.
처리군 #2의 마우스에게 3.3 x 1013 vg/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 1.7 x 1013 vg/kg의 투여량으로 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 HLP 프로모터에 작동가능하게 연결된 SPB 트랜스포사제를 코딩하는 트랜스포사제 서열을 포함하였다.
처리군 #3의 마우스에게 5 x 1013 vg/kg의 투여량으로 도 8에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터를 투여하였다.
처리군 #4의 마우스에게 3.3 x 1013 vg/kg의 투여량으로 도 8에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 1.7 x 1013 vg/kg의 투여량으로 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 HLP 프로모터에 작동가능하게 연결된 SPB 트랜스포사제를 코딩하는 트랜스포사제 서열을 포함하였다.
처리군 #5의 마우스에게 5 x 1013 vg/kg의 투여량으로 도 9에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터를 투여하였다.
처리군 #6의 마우스에게 3.3 x 1013 vg/kg의 투여량으로 도 9에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 1.7 x 1013 vg/kg의 투여량으로 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 HLP 프로모터에 작동가능하게 연결된 SPB 트랜스포사제를 코딩하는 트랜스포사제 서열을 포함하였다.
이후, AAV piggyBac 트랜스포존 폴리뉴클레오타이드에서 코딩된 이식유전자의 발현을 측정하기 위해 바이러스 벡터 투여 후 42일 동안 처리군 #1-#6의 마우스에서 간 생물발광(BLI) 신호를 측정하였다. 이 분석 결과가 도 19에 나타나 있다. 도 19에서, 처리군 #1은 HLP-OTC로 지칭되고, 처리군 #2는 HLP-OTC + SPB로 지칭되며, 처리군 #3은 TBG-OTC로 지칭되고, 처리군 #4는 TBG-OTC + SPB로 지칭되며, 처리군 #5는 LP1-OTC+SPB로 지칭되고, 처리군 #6은 LP1-OTC+SPB로 지칭된다. 도 19에 나타낸 바와 같이, TBG 프로모터가 가장 효율적으로 이식유전자 발현을 유도하였고, 그 다음이 LP1 프로모터, 그 다음이 HLP 프로모터였다. 처리군 #2, #4 및 #6에서 증가되고 지속적인 발현이 관찰되었다. 이론에 얽매이지 않고, 이러한 결과는 AAV piggyBac 트랜스포존 벡터와 AAV 트랜스포사제 벡터의 공동 투여가 AAV piggyBac 트랜스포존 벡터의 이식유전자를 숙주의 게놈 내로 통합하여, 이식유전자의 증가되고 지속적인 발현을 초래할 수 있음을 나타낸다. 도 19에서 관찰된 트랜스포존 벡터의 통합은 생체내 트랜스포존의 성공적인 전위를 나타낸다.
쥣과 OTC mRNA의 수준 대비 인간 OTC mRNA 및 SPB mRNA의 양을 또한 처리군 #1-#6의 마우스에서 측정하였다. 이 분석 결과가 도 20(인간 OTC mRNA) 및 도 21(SPB mRNA)에 나타나 있다. 도 19에 나타낸 결과와 유사하게, 도 20 및 도 21의 결과는 TBG 프로모터가 가장 높은 수준의 이식유전자 mRNA를 산출하였고, 그 다음이 LP1 프로모터, 그 다음이 HLP 프로모터였음을 보여준다.
마우스 OTC 단백질의 양 대비 인간 OTC 단백질의 양을 또한 바이러스 벡터 투여 후 21일에 측정하였다. 이 분석 결과가 도 22에 나타나 있다. 도 19-21에 나타난 결과와 유사하게, 도 22에 나타난 결과는 TBG 프로모터가 가장 높은 수준의 인간 OTC 단백질을 산출하였고, 그 다음이 LP1 프로모터, 그 다음이 HLP 프로모터였음을 보여준다.
추가로, 처리군 #1 및 처리군 #2의 마우스로부터의 간세포를 또한 면역조직화학에 의해 분석하고 GFP에 대해 염색하였다. 간략하게, 간 조직을 21일에 수집하고, 10% 중성 완충 포르말린에서 고정하고, 염색 전에 파라핀 포매하였다. 면역조직화학 결과가 도 27에 나타나 있으며, 이는 처리군 #2에서 더 높은 수준의 GFP가 관찰되었음을 나타낸다. 이론에 얽매이지 않고, 이러한 결과는 AAV piggyBac 트랜스포존 벡터와 AAV 트랜스포사제 벡터의 공동 투여가 AAV piggyBac 트랜스포존 벡터의 이식유전자를 숙주의 게놈 내로 통합시켜, 이식유전자의 증가되고 지속적인 발현을 초래할 수 있음을 나타낸다.
또한, 처리된 마우스의 게놈에서 통합된 부위의 수를 LM-PCR에 의해 분석하였다. 간략하게, 2 μg의 게놈 DNA를 마우스 간 조직으로부터 분리하고 초음파 처리에 의해 무작위로 전단하였다. 생성된 말단 상에 고유 분자 식별자(UMI)를 라이게이션하였다. 2 라운드의 PCR 증폭을 수행하였다. 최종 PCR 생성물을 일루미나 페어드 엔드 시퀀싱하였다. 총 고유 통합 부위를 2개 이상의 UMI를 이용하여 단일 측면 중단점에 의해 결정하였다. 이 분석 결과가 표 3에 나타나 있다.
[표 3]
Figure pct00006
처리군 #7-#12는 성체 야생형 마우스를 포함하였다.
처리군 #7의 마우스에게 2 x 1013 vg/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터를 투여하였다.
처리군 #8의 마우스에게 1.3 x 1013 vg/kg의 투여량으로 도 1에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 0.7 x 1013 vg/kg의 투여량으로 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 HLP 프로모터에 작동가능하게 연결된 SPB 트랜스포사제를 코딩하는 트랜스포사제 서열을 포함하였다.
처리군 #9의 마우스에게 2 x 1013 vg/kg의 투여량으로 도 8에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터를 투여하였다.
처리군 #10의 마우스에게 1.3 x 1013 vg/kg의 투여량으로 도 8에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 0.7 x 1013 vg/kg의 투여량으로 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 HLP 프로모터에 작동가능하게 연결된 SPB 트랜스포사제를 코딩하는 트랜스포사제 서열을 포함하였다.
처리군 #11의 마우스에게 2 x 1013 vg/kg의 투여량으로 도 9에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터를 투여하였다.
처리군 #12의 마우스에게 1.3 x 1013 vg/kg의 투여량으로 도 9에 기재된 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 AAV piggyBac 트랜스포존 벡터 및 0.7 x 1013 vg/kg의 투여량으로 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 AAV 트랜스포사제 벡터를 투여하였다. AAV 트랜스포사제 폴리뉴클레오타이드는 HLP 프로모터에 작동가능하게 연결된 SPB 트랜스포사제를 코딩하는 트랜스포사제 서열을 포함하였다.
이후, AAV piggyBac 트랜스포존 폴리뉴클레오타이드에서 코딩된 이식유전자의 발현을 측정하기 위해 바이러스 벡터 투여 후 7일 및 14일에 처리군 #7-#12의 마우스에서 간 생물발광(BLI) 신호를 측정하였다. 이 분석 결과가 도 23에 나타나 있다. 도 23에서, 처리군 #7은 HLP-OTC로 지칭되고, 처리군 #8은 HLP-OTC + SPB로 지칭되며, 처리군 #9는 TBG-OTC로 지칭되고, 처리군 #10은 TBG-OTC + SPB로 지칭되며, 처리군 #11은 LP1-OTC+SPB로 지칭되고, 처리군 #12는 LP1-OTC+SPB로 지칭된다. 도 23에 나타낸 바와 같이, 이식유전자 발현의 유사한 강도가 각각의 프로모터에 대해 관찰되었다.
쥣과 OTC mRNA의 수준 대비 인간 OTC mRNA 및 SPB mRNA의 양을 또한 처리군 #7-#12의 마우스에서 바이러스 벡터 투여 후 14일에 측정하였다. 이 분석 결과가 도 24(인간 OTC mRNA) 및 도 25(SPB mRNA)에 나타나 있다. 도 24 및 25에 나타낸 바와 같이, 인간 OTC의 유사한 수준이 HLP 및 LP1 프로모터에 대해 관찰되었고, TBG 프로모터에서 가장 강한 발현이 관찰되었다.
마우스 OTC 단백질의 양 대비 인간 OTC 단백질의 양을 또한 바이러스 벡터 투여 후 14일에 측정하였다. 이 분석 결과가 도 26에 나타나 있다. 도 19-21에 나타낸 결과와 유사하게, 도 22에 나타낸 결과는 TBG 프로모터가 가장 높은 수준의 인간 OTC 단백질을 산출하였고, 그 다음이 LP1 프로모터, 그 다음이 HLP 프로모터였음을 보여준다.
균등물
전술한 설명은 예시의 목적으로만 제시되었으며 본 개시내용을 개시된 정확한 형태로 제한하고자 하는 것이 아니다. 본 개시내용의 하나 이상의 구현예의 세부사항은 상기 첨부된 설명에 제시되어 있다. 본원에 기재된 것과 유사하거나 균등인 임의의 방법 및 물질이 본 개시내용의 실시 또는 시험에 사용될 수 있지만, 바람직한 방법 및 물질이 이제 기재된다. 본 개시내용의 다른 특징, 목적 및 이점은 상세한 설명 및 청구범위로부터 명백할 것이다. 명세서 및 첨부된 특허청구범위에서, 단수 형태는 문맥이 명백하게 달리 지시하지 않는 한 복수의 지시 대상을 포함한다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 인용된 모든 특허 및 간행물은 참고로 포함된다.
SEQUENCE LISTING <110> Poseida Therapeutics, Inc. <120> COMPOSITIONS AND METHODS FOR THE TREATMENT OF METABOLIC LIVER DISORDERS <130> POTH-058/001WO (325002-2515) <160> 146 <170> PatentIn version 3.5 <210> 1 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 1 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgct 178 <210> 2 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 2 agcatggcta cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag 60 tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 120 aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 178 <210> 3 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 3 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct 130 <210> 4 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 4 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag ctgcctgcag g 141 <210> 5 <211> 303 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 5 tataacaaga aaatatatat ataataagtt atcacgtaag tagaacatga aataacaata 60 taattatcgt atgagttaaa tcttaaaagt cacgtaaaag ataatcatgc gtcattttga 120 ctcacgcggt cgttatagtt caaaatcagt gacacttacc gcattgacaa gcacgcctca 180 cgggagctcc aagcggcgac tgagatgtcc taaatgcaca gcgacggatt cgcgctattt 240 agaaagagag agcaatattt caagaatgca tgcgtcaatt ttacgcagac tatctttcta 300 ggg 303 <210> 6 <211> 238 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 6 ccctagaaag ataatcatat tgtgacgtac gttaaagata atcatgcgta aaattgacgc 60 atgtgtttta tcggtctgta tatcgaggtt tatttattaa tttgaataga tattaagttt 120 tattatattt acacttacat actaataata aattcaacaa acaatttatt tatgtttatt 180 tatttattaa aaaaaaacaa aaactcaaaa tttcttctat aaagtaacaa aactttta 238 <210> 7 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 7 gagggacagc ccccccccaa agcccccagg gatgtaatta cgtccctccc ccgctagggg 60 gcagcagcga gccgcccggg gctccgctcc ggtccggcgc tccccccgca tccccgagcc 120 ggcagcgtgc ggggacagcc cgggcacggg gaaggtggca cgggatcgct ttcctctgaa 180 cgcttctcgc tgctctttga gcctgcagac acctgggggg atacggggaa aa 232 <210> 8 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 8 ttttccccgt atccccccag gtgtctgcag gctcaaagag cagcgagaag cgttcagagg 60 aaagcgatcc cgtgccacct tccccgtgcc cgggctgtcc ccgcacgctg ccggctcggg 120 gatgcggggg gagcgccgga ccggagcgga gccccgggcg gctcgctgct gccccctagc 180 gggggaggga cgtaattaca tccctggggg ctttgggggg gggctgtccc tc 232 <210> 9 <211> 252 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 9 tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga 60 gccagggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac 120 tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg 180 cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg 240 ggacagtgaa tc 252 <210> 10 <211> 449 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 10 cccctaaaat gggcaaacat tgcaagcagc aaacagcaaa cacacagccc tccctgcctg 60 ctgaccttgg agctggggca gaggtcagag acctctctgg gcccatgcca cctccaacat 120 ccactcgacc ccttggaatt tcggtggaga ggagcagagg ttgtcctggc gtggtttagg 180 tagtgtgaga ggggaatgac tcctttcggt aagtgcagtg gaagctgtac actgcccagg 240 caaagcgtcc gggcagcgta ggcgggcgac tcagatccca gccagtggac ttagcccctg 300 tttgctcctc cgataactgg ggtgaccttg gttaatattc accagcagcc tcccccgttg 360 cccctctgga tccactgctt aaatacggac gaggacaggg ccctgtctcc tcagcttcag 420 gcaccaccac tgacctggga cagtgaatc 449 <210> 11 <211> 1214 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 11 gctcagaggc acacaggagt ttctgggctc accctgcccc cttccaaccc ctcagttccc 60 atcctccagc agctgtttgt gtgctgcctc tgaagtccac actgaacaaa cttcagccta 120 ctcatgtccc taaaatgggc aaacattgca agcagcaaac agcaaacaca cagccctccc 180 tgcctgctga ccttggagct ggggcagagg tcagagacct ctctgggccc atgccacctc 240 caacatccac tcgacccctt ggaatttcgg tggagaggag cagaggttgt cctggcgtgg 300 tttaggtagt gtgagagggt ccggcgatta actgcaggct cagaggcaca caggagtttc 360 tgggctcacc ctgccccctt ccaacccctc agttcccatc ctccagcagc tgtttgtgtg 420 ctgcctctga agtccacact gaacaaactt cagcctactc atgtccctaa aatgggcaaa 480 cattgcaagc agcaaacagc aaacacacag ccctccctgc ctgctgacct tggagctggg 540 gcagaggtca gagacctctc tgggcccatg ccacctccaa catccactcg accccttgga 600 atttcggtgg agaggagcag aggttgtcct ggcgtggttt aggtagtgtg agagggtccg 660 gcgaattaat gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca 720 gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca 780 ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 840 tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 900 gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 960 gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 1020 tcctcagctt caggcaccac cactgacctg ggacagtgaa ttgcggtaag tatcaaggtt 1080 acaagacagg tttaaggaga ccaatagaaa ctgggcttgt cgagacagag aagactcttg 1140 cgtttctgat aggcacctat tggtcttact gacatccact ttgcctttct ctccacagac 1200 ctgggacagt gaat 1214 <210> 12 <211> 1214 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 12 gctcagaggc acacaggagt ttctgggctc accctgcccc cttccaaccc ctcagttccc 60 atcctccagc agctgtttgt gtgctgcctc tgaagtccac actgaacaaa cttcagccta 120 ctcatgtccc taaaatgggc aaacattgca agcagcaaac agcaaacaca cagccctccc 180 tgcctgctga ccttggagct ggggcagagg tcagagacct ctctgggccc atgccacctc 240 caacatccac tcgacccctt ggaatttcgg tggagaggag cagaggttgt cctggcgtgg 300 tttaggtagt gtgagagggt ccggcgatta actgcaggct cagaggcaca caggagtttc 360 tgggctcacc ctgccccctt ccaacccctc agttcccatc ctccagcagc tgtttgtgtg 420 ctgcctctga agtccacact gaacaaactt cagcctactc atgtccctaa aatgggcaaa 480 cattgcaagc agcaaacagc aaacacacag ccctccctgc ctgctgacct tggagctggg 540 gcagaggtca gagacctctc tgggcccatg ccacctccaa catccactcg accccttgga 600 atttcggtgg agaggagcag aggttgtcct ggcgtggttt aggtagtgtg agagggtccg 660 gcgaattaat gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca 720 gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca 780 ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 840 tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 900 gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 960 gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 1020 tcctcagctt caggcaccac cactgacctg ggacagtgaa ttgcggtaag tatcaaggtt 1080 acaagacagg tttaaggaga ccaatagaaa ctgggcttgt cgagacagag aagactcttg 1140 cgtttctgat aggcacctat tggtcttact gacatccact ttgcctttct ctccacagac 1200 ctgggacagt gaat 1214 <210> 13 <211> 861 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 13 aggttaattt ttaaaaagca gtcaaaagtc caagtggccc ttggcagcat ttactctctc 60 tgtttgctct ggttaataat ctcaggagca caaacattcc agatccaggt taatttttaa 120 aaagcagtca aaagtccaag tggcccttgg cagcatttac tctctctgtt tgctctggtt 180 aataatctca ggagcacaaa cattccagat ccggcgcgcc agggctggaa gctacctttg 240 acatcatttc ctctgcgaat gcatgtataa tttctacaga acctattaga aaggatcacc 300 cagcctctgc ttttgtacaa ctttccctta aaaaactgcc aattccactg ctgtttggcc 360 caatagtgag aactttttcc tgctgcctct tggtgctttt gcctatggcc cctattctgc 420 ctgctgaaga cactcttgcc agcatggact taaacccctc cagctctgac aatcctcttt 480 ctcttttgtt ttacatgaag ggtctggcag ccaaagcaat cactcaaagt tcaaacctta 540 tcattttttg ctttgttcct cttggccttg gttttgtaca tcagctttga aaataccatc 600 ccagggttaa tgctggggtt aatttataac taagagtgct ctagttttgc aatacaggac 660 atgctataaa aatggaaaga tgttgctttc tgagagactg cagaagttgg tcgtgaggca 720 ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag aaactgggct 780 tgtcgagaca gagaagactc ttgcgtttct gataggcacc tattggtctt actgacatcc 840 actttgcctt tctctccaca g 861 <210> 14 <211> 146 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 14 gttaatcatt aagtcgttaa tttttgtggc ccttgcgatg tttgctctgg ttaataatct 60 caggacaaac agaggttaat aattttccag atctctctga gcaatagtat aaaaggccag 120 cagcagcctg accacatctc atcctc 146 <210> 15 <211> 716 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 15 gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac ttcagcctac tcatgtccct 60 aaaatgggca aacattgcaa gcagcaaaca gcaaacacac agccctccct gcctgctgac 120 cttggagctg gggcagaggt cagagacctc tctgagatct gctgtttgtg tgctgcctct 180 gaagtccaca ctgaacaaac ttcagcctac tcatgtccct aaaatgggca aacattgcaa 240 gcagcaaaca gcaaacacac agccctccct gcctgctgac cttggagctg gggcagaggt 300 cagagacctc tctggtaccc ggggatcttg ctaccagtgg aacagccact aaggattctg 360 cagtgagagc agagggccag ctaagtggta ctctcccaga gactgtctga ctcacgccac 420 cccctccacc ttggacacag gacgctgtgg tttctgagcc aggtacaatg actcctttcg 480 gtaagtgcag tggaagctgt acactgccca ggcaaagcgt ccgggcagcg taggcgggcg 540 actcagatcc cagccagtgg acttagcccc tgtttgctcc tccgataact ggggtgacct 600 tggttaatat tcaccagcag cctcccccgt tgcccctctg gatccactgc ttaaatacgg 660 acgaggacag ggccctgtct cctcagcttc aggcaccacc actgacctgg gacagt 716 <210> 16 <211> 1224 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 16 tcgtcgacgg gctcagaggc acacaggagt ttctgggctc accctgcccc cttccaaccc 60 ctcagttccc atcctccagc agctgtttgt gtgctgcctc tgaagtccac actgaacaaa 120 cttcagccta ctcatgtccc taaaatgggc aaacattgca agcagcaaac agcaaacaca 180 cagccctccc tgcctgctga ccttggagct ggggcagagg tcagagacct ctctgggccc 240 atgccacctc caacatccac tcgacccctt ggaatttcgg tggagaggag cagaggttgt 300 cctggcgtgg tttaggtagt gtgagagggt ccggcgatta actgcaggct cagaggcaca 360 caggagtttc tgggctcacc ctgccccctt ccaacccctc agttcccatc ctccagcagc 420 tgtttgtgtg ctgcctctga agtccacact gaacaaactt cagcctactc atgtccctaa 480 aatgggcaaa cattgcaagc agcaaacagc aaacacacag ccctccctgc ctgctgacct 540 tggagctggg gcagaggtca gagacctctc tgggcccatg ccacctccaa catccactcg 600 accccttgga atttcggtgg agaggagcag aggttgtcct ggcgtggttt aggtagtgtg 660 agagggtccg gcgaattaat gctaccagtg gaacagccac taaggattct gcagtgagag 720 cagagggcca gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac 780 cttggacaca ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca 840 gtggaagctg tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc 900 ccagccagtg gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata 960 ttcaccagca gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca 1020 gggccctgtc tcctcagctt caggcaccac cactgacctg ggacagtgaa ttgcggtaag 1080 tatcaaggtt acaagacagg tttaaggaga ccaatagaaa ctgggcttgt cgagacagag 1140 aagactcttg cgtttctgat aggcacctat tggtcttact gacatccact ttgcctttct 1200 ctccacagac ctgggacagt gaat 1224 <210> 17 <211> 750 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 17 Met Leu Arg Ala Lys Asn Gln Leu Phe Leu Leu Ser Pro His Tyr Leu 1 5 10 15 Arg Gln Val Lys Glu Ser Ser Gly Ser Arg Leu Ile Gln Gln Arg Leu 20 25 30 Leu His Gln Gln Gln Pro Leu His Pro Glu Trp Ala Ala Leu Ala Lys 35 40 45 Lys Gln Leu Lys Gly Lys Asn Pro Glu Asp Leu Ile Trp His Thr Pro 50 55 60 Glu Gly Ile Ser Ile Lys Pro Leu Tyr Ser Lys Arg Asp Thr Met Asp 65 70 75 80 Leu Pro Glu Glu Leu Pro Gly Val Lys Pro Phe Thr Arg Gly Pro Tyr 85 90 95 Pro Thr Met Tyr Thr Phe Arg Pro Trp Thr Ile Arg Gln Tyr Ala Gly 100 105 110 Phe Ser Thr Val Glu Glu Ser Asn Lys Phe Tyr Lys Asp Asn Ile Lys 115 120 125 Ala Gly Gln Gln Gly Leu Ser Val Ala Phe Asp Leu Ala Thr His Arg 130 135 140 Gly Tyr Asp Ser Asp Asn Pro Arg Val Arg Gly Asp Val Gly Met Ala 145 150 155 160 Gly Val Ala Ile Asp Thr Val Glu Asp Thr Lys Ile Leu Phe Asp Gly 165 170 175 Ile Pro Leu Glu Lys Met Ser Val Ser Met Thr Met Asn Gly Ala Val 180 185 190 Ile Pro Val Leu Ala Asn Phe Ile Val Thr Gly Glu Glu Gln Gly Val 195 200 205 Pro Lys Glu Lys Leu Thr Gly Thr Ile Gln Asn Asp Ile Leu Lys Glu 210 215 220 Phe Met Val Arg Asn Thr Tyr Ile Phe Pro Pro Glu Pro Ser Met Lys 225 230 235 240 Ile Ile Ala Asp Ile Phe Glu Tyr Thr Ala Lys His Met Pro Lys Phe 245 250 255 Asn Ser Ile Ser Ile Ser Gly Tyr His Met Gln Glu Ala Gly Ala Asp 260 265 270 Ala Ile Leu Glu Leu Ala Tyr Thr Leu Ala Asp Gly Leu Glu Tyr Ser 275 280 285 Arg Thr Gly Leu Gln Ala Gly Leu Thr Ile Asp Glu Phe Ala Pro Arg 290 295 300 Leu Ser Phe Phe Trp Gly Ile Gly Met Asn Phe Tyr Met Glu Ile Ala 305 310 315 320 Lys Met Arg Ala Gly Arg Arg Leu Trp Ala His Leu Ile Glu Lys Met 325 330 335 Phe Gln Pro Lys Asn Ser Lys Ser Leu Leu Leu Arg Ala His Cys Gln 340 345 350 Thr Ser Gly Trp Ser Leu Thr Glu Gln Asp Pro Tyr Asn Asn Ile Val 355 360 365 Arg Thr Ala Ile Glu Ala Met Ala Ala Val Phe Gly Gly Thr Gln Ser 370 375 380 Leu His Thr Asn Ser Phe Asp Glu Ala Leu Gly Leu Pro Thr Val Lys 385 390 395 400 Ser Ala Arg Ile Ala Arg Asn Thr Gln Ile Ile Ile Gln Glu Glu Ser 405 410 415 Gly Ile Pro Lys Val Ala Asp Pro Trp Gly Gly Ser Tyr Met Met Glu 420 425 430 Cys Leu Thr Asn Asp Val Tyr Asp Ala Ala Leu Lys Leu Ile Asn Glu 435 440 445 Ile Glu Glu Met Gly Gly Met Ala Lys Ala Val Ala Glu Gly Ile Pro 450 455 460 Lys Leu Arg Ile Glu Glu Cys Ala Ala Arg Arg Gln Ala Arg Ile Asp 465 470 475 480 Ser Gly Ser Glu Val Ile Val Gly Val Asn Lys Tyr Gln Leu Glu Lys 485 490 495 Glu Asp Ala Val Glu Val Leu Ala Ile Asp Asn Thr Ser Val Arg Asn 500 505 510 Arg Gln Ile Glu Lys Leu Lys Lys Ile Lys Ser Ser Arg Asp Gln Ala 515 520 525 Leu Ala Glu Arg Cys Leu Ala Ala Leu Thr Glu Cys Ala Ala Ser Gly 530 535 540 Asp Gly Asn Ile Leu Ala Leu Ala Val Asp Ala Ser Arg Ala Arg Cys 545 550 555 560 Thr Val Gly Glu Ile Thr Asp Ala Leu Lys Lys Val Phe Gly Glu His 565 570 575 Lys Ala Asn Asp Arg Met Val Ser Gly Ala Tyr Arg Gln Glu Phe Gly 580 585 590 Glu Ser Lys Glu Ile Thr Ser Ala Ile Lys Arg Val His Lys Phe Met 595 600 605 Glu Arg Glu Gly Arg Arg Pro Arg Leu Leu Val Ala Lys Met Gly Gln 610 615 620 Asp Gly His Asp Arg Gly Ala Lys Val Ile Ala Thr Gly Phe Ala Asp 625 630 635 640 Leu Gly Phe Asp Val Asp Ile Gly Pro Leu Phe Gln Thr Pro Arg Glu 645 650 655 Val Ala Gln Gln Ala Val Asp Ala Asp Val His Ala Val Gly Ile Ser 660 665 670 Thr Leu Ala Ala Gly His Lys Thr Leu Val Pro Glu Leu Ile Lys Glu 675 680 685 Leu Asn Ser Leu Gly Arg Pro Asp Ile Leu Val Met Cys Gly Gly Val 690 695 700 Ile Pro Pro Gln Asp Tyr Glu Phe Leu Phe Glu Val Gly Val Ser Asn 705 710 715 720 Val Phe Gly Pro Gly Thr Arg Ile Pro Lys Ala Ala Val Gln Val Leu 725 730 735 Asp Asp Ile Glu Lys Cys Leu Glu Lys Lys Gln Gln Ser Val 740 745 750 <210> 18 <211> 749 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 18 Leu Arg Ala Lys Asn Gln Leu Phe Leu Leu Ser Pro His Tyr Leu Arg 1 5 10 15 Gln Val Lys Glu Ser Ser Gly Ser Arg Leu Ile Gln Gln Arg Leu Leu 20 25 30 His Gln Gln Gln Pro Leu His Pro Glu Trp Ala Ala Leu Ala Lys Lys 35 40 45 Gln Leu Lys Gly Lys Asn Pro Glu Asp Leu Ile Trp His Thr Pro Glu 50 55 60 Gly Ile Ser Ile Lys Pro Leu Tyr Ser Lys Arg Asp Thr Met Asp Leu 65 70 75 80 Pro Glu Glu Leu Pro Gly Val Lys Pro Phe Thr Arg Gly Pro Tyr Pro 85 90 95 Thr Met Tyr Thr Phe Arg Pro Trp Thr Ile Arg Gln Tyr Ala Gly Phe 100 105 110 Ser Thr Val Glu Glu Ser Asn Lys Phe Tyr Lys Asp Asn Ile Lys Ala 115 120 125 Gly Gln Gln Gly Leu Ser Val Ala Phe Asp Leu Ala Thr His Arg Gly 130 135 140 Tyr Asp Ser Asp Asn Pro Arg Val Arg Gly Asp Val Gly Met Ala Gly 145 150 155 160 Val Ala Ile Asp Thr Val Glu Asp Thr Lys Ile Leu Phe Asp Gly Ile 165 170 175 Pro Leu Glu Lys Met Ser Val Ser Met Thr Met Asn Gly Ala Val Ile 180 185 190 Pro Val Leu Ala Asn Phe Ile Val Thr Gly Glu Glu Gln Gly Val Pro 195 200 205 Lys Glu Lys Leu Thr Gly Thr Ile Gln Asn Asp Ile Leu Lys Glu Phe 210 215 220 Met Val Arg Asn Thr Tyr Ile Phe Pro Pro Glu Pro Ser Met Lys Ile 225 230 235 240 Ile Ala Asp Ile Phe Glu Tyr Thr Ala Lys His Met Pro Lys Phe Asn 245 250 255 Ser Ile Ser Ile Ser Gly Tyr His Met Gln Glu Ala Gly Ala Asp Ala 260 265 270 Ile Leu Glu Leu Ala Tyr Thr Leu Ala Asp Gly Leu Glu Tyr Ser Arg 275 280 285 Thr Gly Leu Gln Ala Gly Leu Thr Ile Asp Glu Phe Ala Pro Arg Leu 290 295 300 Ser Phe Phe Trp Gly Ile Gly Met Asn Phe Tyr Met Glu Ile Ala Lys 305 310 315 320 Met Arg Ala Gly Arg Arg Leu Trp Ala His Leu Ile Glu Lys Met Phe 325 330 335 Gln Pro Lys Asn Ser Lys Ser Leu Leu Leu Arg Ala His Cys Gln Thr 340 345 350 Ser Gly Trp Ser Leu Thr Glu Gln Asp Pro Tyr Asn Asn Ile Val Arg 355 360 365 Thr Ala Ile Glu Ala Met Ala Ala Val Phe Gly Gly Thr Gln Ser Leu 370 375 380 His Thr Asn Ser Phe Asp Glu Ala Leu Gly Leu Pro Thr Val Lys Ser 385 390 395 400 Ala Arg Ile Ala Arg Asn Thr Gln Ile Ile Ile Gln Glu Glu Ser Gly 405 410 415 Ile Pro Lys Val Ala Asp Pro Trp Gly Gly Ser Tyr Met Met Glu Cys 420 425 430 Leu Thr Asn Asp Val Tyr Asp Ala Ala Leu Lys Leu Ile Asn Glu Ile 435 440 445 Glu Glu Met Gly Gly Met Ala Lys Ala Val Ala Glu Gly Ile Pro Lys 450 455 460 Leu Arg Ile Glu Glu Cys Ala Ala Arg Arg Gln Ala Arg Ile Asp Ser 465 470 475 480 Gly Ser Glu Val Ile Val Gly Val Asn Lys Tyr Gln Leu Glu Lys Glu 485 490 495 Asp Ala Val Glu Val Leu Ala Ile Asp Asn Thr Ser Val Arg Asn Arg 500 505 510 Gln Ile Glu Lys Leu Lys Lys Ile Lys Ser Ser Arg Asp Gln Ala Leu 515 520 525 Ala Glu Arg Cys Leu Ala Ala Leu Thr Glu Cys Ala Ala Ser Gly Asp 530 535 540 Gly Asn Ile Leu Ala Leu Ala Val Asp Ala Ser Arg Ala Arg Cys Thr 545 550 555 560 Val Gly Glu Ile Thr Asp Ala Leu Lys Lys Val Phe Gly Glu His Lys 565 570 575 Ala Asn Asp Arg Met Val Ser Gly Ala Tyr Arg Gln Glu Phe Gly Glu 580 585 590 Ser Lys Glu Ile Thr Ser Ala Ile Lys Arg Val His Lys Phe Met Glu 595 600 605 Arg Glu Gly Arg Arg Pro Arg Leu Leu Val Ala Lys Met Gly Gln Asp 610 615 620 Gly His Asp Arg Gly Ala Lys Val Ile Ala Thr Gly Phe Ala Asp Leu 625 630 635 640 Gly Phe Asp Val Asp Ile Gly Pro Leu Phe Gln Thr Pro Arg Glu Val 645 650 655 Ala Gln Gln Ala Val Asp Ala Asp Val His Ala Val Gly Ile Ser Thr 660 665 670 Leu Ala Ala Gly His Lys Thr Leu Val Pro Glu Leu Ile Lys Glu Leu 675 680 685 Asn Ser Leu Gly Arg Pro Asp Ile Leu Val Met Cys Gly Gly Val Ile 690 695 700 Pro Pro Gln Asp Tyr Glu Phe Leu Phe Glu Val Gly Val Ser Asn Val 705 710 715 720 Phe Gly Pro Gly Thr Arg Ile Pro Lys Ala Ala Val Gln Val Leu Asp 725 730 735 Asp Ile Glu Lys Cys Leu Glu Lys Lys Gln Gln Ser Val 740 745 <210> 19 <211> 2250 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 19 atgctgcggg ccaagaatca actgttcctg ctgtcccctc actacctgcg gcaagtgaaa 60 gagagcagcg gcagcagact gatccagcag agactgctgc atcagcagca gccactgcac 120 cctgaatggg ccgctctggc taagaagcag ctcaagggca agaaccccga ggacctgatc 180 tggcacacac cagagggcat cagcatcaag cccctgtact ccaagcggga cacaatggat 240 ctgcccgagg aactgcctgg cgtgaagcct tttacaagag gcccctatcc taccatgtat 300 accttcagac cctggaccat ccggcagtac gccggctttt ctaccgtgga agagagcaac 360 aagttctaca aggacaacat caaggccggc cagcagggac tgagcgtggc atttgatctg 420 gctacccaca ggggctacga cagcgacaac cctagagtgc ggggagatgt tggaatggcc 480 ggcgtggcaa tcgacacagt ggaagatacc aagatcctgt tcgacggcat ccctctggaa 540 aagatgagcg tgtccatgac catgaacggc gctgtgatcc ccgtgctggc taactttatt 600 gtgaccggcg aggaacaggg cgtgcccaaa gaaaagctga ccggcaccat ccagaacgac 660 atcctgaaag agttcatggt tcgaaacacc tacatcttcc cacctgagcc gagcatgaag 720 atcattgccg acatcttcga gtacaccgcc aagcacatgc ccaagttcaa cagcatctcc 780 atcagcggct accacatgca agaggctggc gccgatgcca tcctggaact ggcttataca 840 ctggccgacg gcctggaata ctccagaaca ggactgcaag ccggcctgac catcgatgag 900 tttgccccta gactgagctt cttctggggc atcggcatga acttctacat ggaaatcgcc 960 aagatgagag ccggcagacg gctgtgggct cacctgatcg agaagatgtt ccagcctaag 1020 aacagcaaga gcctgctcct gagagcccac tgtcagacaa gtggctggtc cctgactgag 1080 caggacccct acaacaacat cgtgcgcaca gccatcgaag ctatggccgc cgtgtttggc 1140 ggaacacaga gcctgcacac caacagcttt gacgaggctc tgggcctgcc taccgtgaag 1200 tctgccagaa tcgcccggaa cacccagatc atcatccaag aggaaagcgg catccccaag 1260 gtggcagatc cttggggcgg cagctacatg atggaatgcc tgaccaacga cgtgtacgac 1320 gccgctctga agctgatcaa cgagatcgaa gagatgggcg gcatggctaa ggctgtggcc 1380 gagggaatcc ccaagctgag aatcgaggaa tgcgccgcca gacggcaggc cagaattgat 1440 agcggaagcg aagtgatcgt gggcgtgaac aagtaccagc tcgaaaaaga ggacgccgtc 1500 gaggtcctgg ctatcgacaa taccagcgtg cggaaccggc agattgagaa gctgaagaag 1560 atcaagagca gccgcgatca ggccctggcc gaaagatgtc ttgctgccct gacagagtgt 1620 gccgccagcg gcgacggaaa tattctggct ctggccgtgg atgccagccg ggctagatgt 1680 accgtgggcg agattacaga cgccctgaag aaggtgttcg gcgagcacaa ggccaacgac 1740 agaatggtgt ctggcgccta cagacaagag tttggcgaga gcaaagagat caccagcgcc 1800 atcaagcggg tccacaagtt catggaaaga gaaggcaggc ggcccagact gctggtggct 1860 aagatgggac aagacggcca tgacagaggc gccaaagtga tcgccacagg ctttgccgat 1920 ctgggcttcg acgtggacat cggccctctg tttcagaccc ctagagaggt ggcacagcag 1980 gccgttgatg ccgatgttca cgctgtgggc atctctacac tggctgccgg acacaagaca 2040 ctggtgcccg aactgatcaa agagctgaac agcctgggca gacccgacat ccttgtgatg 2100 tgtggcggag tgatcccacc gcaggactac gagttcctgt ttgaagtggg cgtgtccaac 2160 gtgttcggcc ctggcacaag aatccctaaa gccgccgtgc aggttctgga cgacatcgag 2220 aagtgcctgg aaaaaaagca gcagagcgtg 2250 <210> 20 <211> 2247 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 20 ctgcgggcca agaatcaact gttcctgctg tcccctcact acctgcggca agtgaaagag 60 agcagcggca gcagactgat ccagcagaga ctgctgcatc agcagcagcc actgcaccct 120 gaatgggccg ctctggctaa gaagcagctc aagggcaaga accccgagga cctgatctgg 180 cacacaccag agggcatcag catcaagccc ctgtactcca agcgggacac aatggatctg 240 cccgaggaac tgcctggcgt gaagcctttt acaagaggcc cctatcctac catgtatacc 300 ttcagaccct ggaccatccg gcagtacgcc ggcttttcta ccgtggaaga gagcaacaag 360 ttctacaagg acaacatcaa ggccggccag cagggactga gcgtggcatt tgatctggct 420 acccacaggg gctacgacag cgacaaccct agagtgcggg gagatgttgg aatggccggc 480 gtggcaatcg acacagtgga agataccaag atcctgttcg acggcatccc tctggaaaag 540 atgagcgtgt ccatgaccat gaacggcgct gtgatccccg tgctggctaa ctttattgtg 600 accggcgagg aacagggcgt gcccaaagaa aagctgaccg gcaccatcca gaacgacatc 660 ctgaaagagt tcatggttcg aaacacctac atcttcccac ctgagccgag catgaagatc 720 attgccgaca tcttcgagta caccgccaag cacatgccca agttcaacag catctccatc 780 agcggctacc acatgcaaga ggctggcgcc gatgccatcc tggaactggc ttatacactg 840 gccgacggcc tggaatactc cagaacagga ctgcaagccg gcctgaccat cgatgagttt 900 gcccctagac tgagcttctt ctggggcatc ggcatgaact tctacatgga aatcgccaag 960 atgagagccg gcagacggct gtgggctcac ctgatcgaga agatgttcca gcctaagaac 1020 agcaagagcc tgctcctgag agcccactgt cagacaagtg gctggtccct gactgagcag 1080 gacccctaca acaacatcgt gcgcacagcc atcgaagcta tggccgccgt gtttggcgga 1140 acacagagcc tgcacaccaa cagctttgac gaggctctgg gcctgcctac cgtgaagtct 1200 gccagaatcg cccggaacac ccagatcatc atccaagagg aaagcggcat ccccaaggtg 1260 gcagatcctt ggggcggcag ctacatgatg gaatgcctga ccaacgacgt gtacgacgcc 1320 gctctgaagc tgatcaacga gatcgaagag atgggcggca tggctaaggc tgtggccgag 1380 ggaatcccca agctgagaat cgaggaatgc gccgccagac ggcaggccag aattgatagc 1440 ggaagcgaag tgatcgtggg cgtgaacaag taccagctcg aaaaagagga cgccgtcgag 1500 gtcctggcta tcgacaatac cagcgtgcgg aaccggcaga ttgagaagct gaagaagatc 1560 aagagcagcc gcgatcaggc cctggccgaa agatgtcttg ctgccctgac agagtgtgcc 1620 gccagcggcg acggaaatat tctggctctg gccgtggatg ccagccgggc tagatgtacc 1680 gtgggcgaga ttacagacgc cctgaagaag gtgttcggcg agcacaaggc caacgacaga 1740 atggtgtctg gcgcctacag acaagagttt ggcgagagca aagagatcac cagcgccatc 1800 aagcgggtcc acaagttcat ggaaagagaa ggcaggcggc ccagactgct ggtggctaag 1860 atgggacaag acggccatga cagaggcgcc aaagtgatcg ccacaggctt tgccgatctg 1920 ggcttcgacg tggacatcgg ccctctgttt cagaccccta gagaggtggc acagcaggcc 1980 gttgatgccg atgttcacgc tgtgggcatc tctacactgg ctgccggaca caagacactg 2040 gtgcccgaac tgatcaaaga gctgaacagc ctgggcagac ccgacatcct tgtgatgtgt 2100 ggcggagtga tcccaccgca ggactacgag ttcctgtttg aagtgggcgt gtccaacgtg 2160 ttcggccctg gcacaagaat ccctaaagcc gccgtgcagg ttctggacga catcgagaag 2220 tgcctggaaa aaaagcagca gagcgtg 2247 <210> 21 <211> 354 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 21 Met Leu Phe Asn Leu Arg Ile Leu Leu Asn Asn Ala Ala Phe Arg Asn 1 5 10 15 Gly His Asn Phe Met Val Arg Asn Phe Arg Cys Gly Gln Pro Leu Gln 20 25 30 Asn Lys Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe 35 40 45 Thr Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu Lys 50 55 60 Phe Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln Gly Lys 65 70 75 80 Ser Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg Leu Ser 85 90 95 Thr Glu Thr Gly Phe Ala Leu Leu Gly Gly His Pro Cys Phe Leu Thr 100 105 110 Thr Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu Thr Asp Thr Ala 115 120 125 Arg Val Leu Ser Ser Met Ala Asp Ala Val Leu Ala Arg Val Tyr Lys 130 135 140 Gln Ser Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser Ile Pro Ile Ile 145 150 155 160 Asn Gly Leu Ser Asp Leu Tyr His Pro Ile Gln Ile Leu Ala Asp Tyr 165 170 175 Leu Thr Leu Gln Glu His Tyr Ser Ser Leu Lys Gly Leu Thr Leu Ser 180 185 190 Trp Ile Gly Asp Gly Asn Asn Ile Leu His Ser Ile Met Met Ser Ala 195 200 205 Ala Lys Phe Gly Met His Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu 210 215 220 Pro Asp Ala Ser Val Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn 225 230 235 240 Gly Thr Lys Leu Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly 245 250 255 Gly Asn Val Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu 260 265 270 Glu Lys Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr Met 275 280 285 Lys Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His Cys Leu 290 295 300 Pro Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr Ser Pro Arg 305 310 315 320 Ser Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile Met Ala 325 330 335 Val Met Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys Pro 340 345 350 Lys Phe <210> 22 <211> 1062 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 22 atgctgttca acctgcgcat cctgctgaac aacgccgcct tcagaaacgg ccacaacttc 60 atggttcgaa acttcagatg cggccagcct ctccagaaca aggtgcagct gaaaggcagg 120 gacctgctga ccctgaagaa cttcaccggc gaagagatca agtacatgct gtggctgtcc 180 gccgacctga agttcagaat caagcagaag ggcgagtacc tgcctctgct ccagggaaag 240 tctctgggca tgatcttcga gaagcggagc accagaacca gactgagcac cgagacaggc 300 tttgccctgc tcggaggaca cccctgcttt ctgacaaccc aggacatcca cctgggcgtg 360 aacgagagcc tgaccgatac agccagagtg ctgtcctcta tggccgatgc cgtgctggct 420 agagtgtata agcagagcga cctggacacc ctggctaaag aggccagcat tcccatcatc 480 aacggcctgt ccgacctgta tcaccccatc cagatcctgg ccgactacct gacactgcaa 540 gagcactaca gcagcctgaa gggactgacc ctgtcttgga tcggcgacgg caacaacatc 600 ctgcacagca ttatgatgag cgccgccaag ttcggaatgc acctccaggc cgctacaccc 660 aagggctatg aacctgatgc cagcgtgaca aagctggccg agcagtacgc caaagagaac 720 ggcacaaagc tgctgctgac caacgatccc ctggaagctg ctcacggcgg caatgtgctg 780 atcaccgata cctggatcag catgggccaa gaggaagaga agaagaagcg gctgcaagcc 840 ttccagggct accaagtgac catgaagaca gccaaggtgg ccgccagcga ttggaccttt 900 ctgcactgcc tgcctcggaa gcctgaagag gtggacgacg aggtgttcta cagccctaga 960 agcctggtgt tccccgaggc cgagaacaga aagtggacca tcatggctgt gatggtgtct 1020 ctgctgaccg actactcccc tcagctccag aagcctaagt tc 1062 <210> 23 <211> 1062 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 23 atgctgttca acctgcgaat cctgctgaac aatgccgctt ttcggaacgg gcacaatttc 60 atggtgagga actttcgctg cggacagccc ctccagaaca aggtccagct gaagggcagg 120 gacctgctga ccctgaaaaa tttcacaggg gaggaaatca agtacatgct gtggctgtca 180 gccgatctga agttccggat caagcagaag ggcgaatatc tgcctctgct ccagggcaaa 240 agcctgggga tgatcttcga aaagcgcagt actcggacca gactgtcaac agagactgga 300 ttcgcactgc tgggaggaca cccatgtttt ctgaccacac aggacattca tctgggagtg 360 aacgagtccc tgaccgacac agcacgcgtc ctgagctcca tggctgatgc agtgctggct 420 cgagtctaca aacagtctga cctggatacc ctggccaagg aagcttctat cccaatcatt 480 aatggcctga gtgacctgta tcaccccatc cagattctgg ccgattacct gaccctccag 540 gagcattatt ctagtctgaa agggctgaca ctgagctgga ttggggacgg aaacaatatc 600 ctgcactcca ttatgatgag cgccgccaag tttggaatgc acctccaggc tgcaacccca 660 aaaggctacg aacccgatgc ctccgtgaca aagctggcag aacagtatgc caaagagaac 720 ggcactaagc tgctgctcac caatgaccct ctggaggccg ctcacggagg caacgtgctg 780 atcactgata cctggattag tatgggacag gaggaagaga agaagaagcg gctccaggcc 840 ttccagggct accaggtgac aatgaaaact gctaaggtcg cagccagcga ctggaccttt 900 ctgcattgcc tgcccagaaa gcctgaagag gtggacgatg aggtcttcta ctcacccaga 960 agcctggtgt ttcctgaagc tgagaatagg aagtggacaa tcatggcagt gatggtcagc 1020 ctgctgactg attattcccc tcagctccag aaaccaaagt tc 1062 <210> 24 <211> 395 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 24 Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe 1 5 10 15 Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu 20 25 30 Asp Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys 35 40 45 Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val 50 55 60 Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp 65 70 75 80 Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala 85 90 95 Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Gly Gly 100 105 110 Ser Gly Phe Gly Asp Val Gly Ala Leu Glu Ser Leu Arg Gly Asn Ala 115 120 125 Asp Leu Ala Tyr Ile Leu Ser Met Glu Pro Cys Gly His Cys Leu Ile 130 135 140 Ile Asn Asn Val Asn Phe Cys Arg Glu Ser Gly Leu Arg Thr Arg Thr 145 150 155 160 Gly Ser Asn Ile Asp Cys Glu Lys Leu Arg Arg Arg Phe Ser Ser Leu 165 170 175 His Phe Met Val Glu Val Lys Gly Asp Leu Thr Ala Lys Lys Met Val 180 185 190 Leu Ala Leu Leu Glu Leu Ala Gln Gln Asp His Gly Ala Leu Asp Cys 195 200 205 Cys Val Val Val Ile Leu Ser His Gly Cys Gln Ala Ser His Leu Gln 210 215 220 Phe Pro Gly Ala Val Tyr Gly Thr Asp Gly Cys Pro Val Ser Val Glu 225 230 235 240 Lys Ile Val Asn Ile Phe Asn Gly Thr Ser Cys Pro Ser Leu Gly Gly 245 250 255 Lys Pro Lys Leu Phe Phe Ile Gln Ala Cys Gly Gly Glu Gln Lys Asp 260 265 270 His Gly Phe Glu Val Ala Ser Thr Ser Pro Glu Asp Glu Ser Pro Gly 275 280 285 Ser Asn Pro Glu Pro Asp Ala Thr Pro Phe Gln Glu Gly Leu Arg Thr 290 295 300 Phe Asp Gln Leu Asp Ala Ile Ser Ser Leu Pro Thr Pro Ser Asp Ile 305 310 315 320 Phe Val Ser Tyr Ser Thr Phe Pro Gly Phe Val Ser Trp Arg Asp Pro 325 330 335 Lys Ser Gly Ser Trp Tyr Val Glu Thr Leu Asp Asp Ile Phe Glu Gln 340 345 350 Trp Ala His Ser Glu Asp Leu Gln Ser Leu Leu Leu Arg Val Ala Asn 355 360 365 Ala Val Ser Val Lys Gly Ile Tyr Lys Gln Met Pro Gly Cys Phe Asn 370 375 380 Phe Leu Arg Lys Lys Leu Phe Phe Lys Thr Ser 385 390 395 <210> 25 <211> 1185 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 25 atgggggtcc aggtggaaac aatctctccg ggggatgggc ggacattccc taaaaggggc 60 cagacctgcg tggtgcatta caccggcatg ctggaagatg gcaagaaggt ggacagcagc 120 cgggacagaa acaagccctt caagttcatg ctgggcaagc aagaagtgat cagaggctgg 180 gaagagggcg tcgcccagat gtctgttgga cagagagcca agctgacaat cagccccgat 240 tacgcctatg gcgccacagg acaccctggc atcattcctc cacatgccac actggtgttc 300 gacgtggaac tgctgaagct ggaaggcggc ggaggatctg gctttggaga tgtgggagcc 360 ctggaaagcc tgagaggcaa tgccgatctg gcctacatcc tgagcatgga accttgcggc 420 cactgcctga ttatcaacaa cgtgaacttc tgtagagaga gcggcctgcg gaccagaacc 480 ggcagcaata tcgattgcga gaagctgcgg cggagattca gcagcctgca cttcatggtg 540 gaagtgaagg gcgacctgac cgccaagaaa atggtgctgg ctctgctgga actggcccag 600 caagatcatg gcgccctgga ttgctgtgtg gtcgtgatcc tgtctcacgg ctgtcaggcc 660 agccaccttc aattccctgg cgccgtgtat ggcacagatg gctgtcctgt gtccgtggaa 720 aagatcgtga acatcttcaa cggcaccagc tgtcctagcc tcggcggaaa gcccaagctg 780 ttcttcatcc aagcctgtgg cggcgagcag aaggatcacg gatttgaggt ggccagcaca 840 agccccgagg atgagtctcc tggaagcaac cctgagcctg acgccacacc tttccaagag 900 ggcctgagaa ccttcgacca gctggacgct atcagctccc tgcctacacc tagcgacatc 960 ttcgtgtcct acagcacatt ccccggcttt gtgtcttggc gggaccctaa gtctggctct 1020 tggtacgtgg aaaccctgga cgacatcttt gagcagtggg ctcacagcga ggacctccag 1080 tctctgctgc tgagagtggc caatgccgtg tccgtgaagg gcatctacaa gcagatgcct 1140 ggctgcttca acttcctgcg gaagaagctg tttttcaaga ccagc 1185 <210> 26 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 26 attccgataa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 60 atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 120 atgtatctta tcatgtctg 139 <210> 27 <211> 192 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 27 cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 60 aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 120 ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggaggtgt 180 gggaggtttt tt 192 <210> 28 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 28 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 Gly Pro <210> 29 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 29 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 1 5 10 15 Glu Asn Pro Gly Pro 20 <210> 30 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 30 ggatctggag agggaagggg aagcctgctg acctgtggag acgtggagga aaacccagga 60 cca 63 <210> 31 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 31 ggatccggcg aaggcagagg ctcactgctt acttgtggcg acgtggagga gaaccccgga 60 cct 63 <210> 32 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 32 ggctccggag aaggacgggg aagcctgctt acatgcggag atgtggagga gaatcctggt 60 ccc 63 <210> 33 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 33 Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser 1 5 10 15 Asn Pro Gly Pro 20 <210> 34 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 34 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 1 5 10 15 Val Glu Ser Asn Pro Gly Pro 20 <210> 35 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 35 Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val 1 5 10 15 Glu Ser Asn Pro Gly Pro 20 <210> 36 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 36 Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala 1 5 10 15 Gly Asp Val Glu Ser Asn Pro Gly Pro 20 25 <210> 37 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 37 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 38 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 38 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 39 <211> 594 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 39 Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln 1 5 10 15 Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Ile Ser Asp 20 25 30 His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile 35 40 45 Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu 50 55 60 Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn 65 70 75 80 Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His 85 90 95 Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu 100 105 110 Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile 115 120 125 Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile 130 135 140 Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg 145 150 155 160 Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile 165 170 175 Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn 180 185 190 His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr 195 200 205 Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu 210 215 220 Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val 225 230 235 240 Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile 245 250 255 Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu 260 265 270 Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro Asn Lys Pro 275 280 285 Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Tyr Lys 290 295 300 Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn 305 310 315 320 Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val 325 330 335 His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile 340 345 350 Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val 355 360 365 Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn 370 375 380 Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro 385 390 395 400 Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu 405 410 415 Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys 420 425 430 Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr 435 440 445 Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg 450 455 460 Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn 465 470 475 480 Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val 485 490 495 Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser 500 505 510 Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu 515 520 525 Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro Gly Thr Ser 530 535 540 Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr 545 550 555 560 Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys 565 570 575 Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser 580 585 590 Cys Phe <210> 40 <211> 594 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 40 Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln 1 5 10 15 Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp 20 25 30 His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile 35 40 45 Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu 50 55 60 Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn 65 70 75 80 Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His 85 90 95 Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu 100 105 110 Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile 115 120 125 Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile 130 135 140 Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg 145 150 155 160 Glu Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile 165 170 175 Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn 180 185 190 His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr 195 200 205 Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu 210 215 220 Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val 225 230 235 240 Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile 245 250 255 Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu 260 265 270 Gly Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro 275 280 285 Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys 290 295 300 Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn 305 310 315 320 Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val 325 330 335 His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile 340 345 350 Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val 355 360 365 Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn 370 375 380 Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro 385 390 395 400 Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu 405 410 415 Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys 420 425 430 Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr 435 440 445 Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg 450 455 460 Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn 465 470 475 480 Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val 485 490 495 Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser 500 505 510 Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu 515 520 525 Arg Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser 530 535 540 Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr 545 550 555 560 Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys 565 570 575 Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser 580 585 590 Cys Phe <210> 41 <211> 593 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 41 Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln Ser 1 5 10 15 Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Ile Ser Asp His 20 25 30 Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile Asp 35 40 45 Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu Asp 50 55 60 Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn Arg 65 70 75 80 Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His Cys 85 90 95 Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu Asn 100 105 110 Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile Tyr 115 120 125 Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile Ser 130 135 140 Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg Glu 145 150 155 160 Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile Tyr 165 170 175 Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn His 180 185 190 Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr Val 195 200 205 Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu Arg 210 215 220 Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val Phe 225 230 235 240 Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile Gln 245 250 255 Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu Gly 260 265 270 Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro Asn Lys Pro Ser 275 280 285 Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Tyr Lys Tyr 290 295 300 Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn Gly 305 310 315 320 Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val His 325 330 335 Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile Pro 340 345 350 Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val Gly 355 360 365 Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn Ser 370 375 380 Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro Leu 385 390 395 400 Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu Leu 405 410 415 Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys Pro 420 425 430 Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr Leu 435 440 445 Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg Trp 450 455 460 Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn Ser 465 470 475 480 Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val Gln 485 490 495 Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser Ser 500 505 510 Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu Arg 515 520 525 Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro Gly Thr Ser Asp 530 535 540 Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr Tyr 545 550 555 560 Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys Cys 565 570 575 Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser Cys 580 585 590 Phe <210> 42 <211> 593 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 42 Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln Ser 1 5 10 15 Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp His 20 25 30 Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile Asp 35 40 45 Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu Asp 50 55 60 Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn Arg 65 70 75 80 Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His Cys 85 90 95 Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu Asn 100 105 110 Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile Tyr 115 120 125 Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile Ser 130 135 140 Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg Glu 145 150 155 160 Ser Met Thr Ser Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile Tyr 165 170 175 Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn His 180 185 190 Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr Val 195 200 205 Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu Arg 210 215 220 Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val Phe 225 230 235 240 Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile Gln 245 250 255 Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu Gly 260 265 270 Phe Arg Gly Arg Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro Ser 275 280 285 Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys Tyr 290 295 300 Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn Gly 305 310 315 320 Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val His 325 330 335 Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile Pro 340 345 350 Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val Gly 355 360 365 Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn Ser 370 375 380 Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro Leu 385 390 395 400 Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu Leu 405 410 415 Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys Pro 420 425 430 Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr Leu 435 440 445 Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg Trp 450 455 460 Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn Ser 465 470 475 480 Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val Gln 485 490 495 Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser Ser 500 505 510 Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu Arg 515 520 525 Asp Asn Ile Ser Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser Asp 530 535 540 Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr Tyr 545 550 555 560 Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys Cys 565 570 575 Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser Cys 580 585 590 Phe <210> 43 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 43 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 44 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 44 cccaagaaga agcggaaagt t 21 <210> 45 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 45 Gly Gly Gly Gly Ser 1 5 <210> 46 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 46 ggcggcggag gcagc 15 <210> 47 <211> 605 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 47 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Ser Leu 1 5 10 15 Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu Leu 20 25 30 Val Gly Glu Asp Ser Asp Ser Glu Val Ser Asp His Val Ser Glu Asp 35 40 45 Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His Glu 50 55 60 Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn Val 65 70 75 80 Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr Leu 85 90 95 Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr Ser 100 105 110 Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg Ser 115 120 125 Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu Leu 130 135 140 Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val Lys 145 150 155 160 Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr Ser 165 170 175 Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe Gly 180 185 190 Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn His Met Ser Thr Asp 195 200 205 Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr Val Ser Val Met Ser 210 215 220 Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp Lys 225 230 235 240 Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val Arg 245 250 255 Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr Pro 260 265 270 Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly Arg 275 280 285 Cys Pro Phe Arg Val Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly Ile 290 295 300 Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn Gly 305 310 315 320 Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu Gly 325 330 335 Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys Arg 340 345 350 Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys Asn 355 360 365 Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg Ser 370 375 380 Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg Pro 385 390 395 400 Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val Ser 405 410 415 Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys Asp 420 425 430 Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val Met 435 440 445 Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met Cys 450 455 460 Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala Leu 465 470 475 480 Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile Tyr 485 490 495 Ser His Asn Val Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys Lys 500 505 510 Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg Lys 515 520 525 Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile Ser 530 535 540 Asn Ile Leu Pro Lys Glu Val Pro Gly Thr Ser Asp Asp Ser Thr Glu 545 550 555 560 Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser Lys 565 570 575 Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val Ile 580 585 590 Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser Cys Phe 595 600 605 <210> 48 <211> 1815 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 48 atggctccca agaagaagcg gaaagttggc ggcggaggca gcagcctgga tgatgagcat 60 attctgagcg ccctgctgca gagcgacgat gaactcgtgg gcgaagatag cgacagcgag 120 gtgtccgatc acgtgtccga ggatgacgtg cagtccgata ccgaggaagc cttcatcgac 180 gaggtgcacg aagtgcagcc tacaagcagc ggcagcgaga tcctggacga gcagaatgtg 240 atcgagcagc caggatctag cctggccagc aacagaatcc tgacactgcc ccagagaacc 300 atccggggca agaacaagca ctgctggtcc accagcaaga gcaccagacg gtctagagtg 360 tctgccctga acatcgtgcg aagccagagg ggccctacca gaatgtgccg gaacatctac 420 gaccctctgc tgtgcttcaa gctgttcttc accgacgaga tcatctccga gatcgtgaag 480 tggaccaacg ccgagatcag cctgaagcgg agagaatcca tgaccagcgc caccttcaga 540 gacaccaacg aggacgagat ctacgccttc ttcggcatcc tggtcatgac agccgtgcgg 600 aaggacaacc acatgagcac cgacgacctg ttcgaccgca gcctgtctat ggtgtacgtg 660 tccgtgatga gccgggacag attcgacttc ctgatccggt gcctgcggat ggacgacaag 720 tccatcagac ccacactgcg cgagaacgac gtgttcacac ctgtgcggaa gatctgggac 780 ctgttcatcc accagtgcat ccagaactac acccctggcg ctcacctgac catcgacgaa 840 cagctgctgg gcttcagagg cagatgcccc ttcagagtgt acatccccaa caagccctct 900 aagtacggca tcaagatcct gatgatgtgc gacagcggca ccaagtacat gatcaacggc 960 atgccctacc tcggcagagg cacccaaaca aatggcgtgc cactgggcga gtactacgtg 1020 aaagaactga gcaagcctgt gcacggcagc tgcagaaaca tcacctgtga caactggttt 1080 accagcattc ccctggccaa gaacctgctg caagaaccct acaagctgac aatcgtgggc 1140 accgtgcgga gcaacaagag ggaaattccc gaggtgctga agaactctcg gagcagacct 1200 gtgggcacca gcatgttctg cttcgacgga cctctgacac tggtgtccta caagcccaag 1260 cctgccaaga tggtgtacct gctgagcagc tgtgacgagg acgccagcat caatgagagc 1320 accggcaagc cccagatggt catgtactac aaccagacca aaggcggcgt ggacaccctg 1380 gatcagatgt gcagcgtgat gacctgcagc agaaagacca acagatggcc catggctctg 1440 ctgtacggca tgatcaatat cgcctgcatc aacagcttca tcatctacag ccacaacgtg 1500 tccagcaagg gcgagaaggt gcagagccgg aagaaattca tgcggaacct gtacatgagc 1560 ctgaccagca gcttcatgag aaagcggctg gaagccccta cactgaagag atacctgcgg 1620 gacaacatca gcaacatcct gcctaaagag gtgcccggca ccagcgacga tagcacagag 1680 gaacccgtga tgaagaagag gacctactgc acctactgtc ccagcaagat ccggcggaag 1740 gccaacgcca gctgcaaaaa gtgcaagaaa gtgatctgcc gcgagcacaa catcgatatg 1800 tgccagagct gcttc 1815 <210> 49 <211> 603 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 49 Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Ser Leu Asp Asp 1 5 10 15 Glu His Ile Leu Ser Ala Leu Leu Gln Ser Asp Asp Glu Leu Val Gly 20 25 30 Glu Asp Ser Asp Ser Glu Val Ser Asp His Val Ser Glu Asp Asp Val 35 40 45 Gln Ser Asp Thr Glu Glu Ala Phe Ile Asp Glu Val His Glu Val Gln 50 55 60 Pro Thr Ser Ser Gly Ser Glu Ile Leu Asp Glu Gln Asn Val Ile Glu 65 70 75 80 Gln Pro Gly Ser Ser Leu Ala Ser Asn Arg Ile Leu Thr Leu Pro Gln 85 90 95 Arg Thr Ile Arg Gly Lys Asn Lys His Cys Trp Ser Thr Ser Lys Ser 100 105 110 Thr Arg Arg Ser Arg Val Ser Ala Leu Asn Ile Val Arg Ser Gln Arg 115 120 125 Gly Pro Thr Arg Met Cys Arg Asn Ile Tyr Asp Pro Leu Leu Cys Phe 130 135 140 Lys Leu Phe Phe Thr Asp Glu Ile Ile Ser Glu Ile Val Lys Trp Thr 145 150 155 160 Asn Ala Glu Ile Ser Leu Lys Arg Arg Glu Ser Met Thr Ser Ala Thr 165 170 175 Phe Arg Asp Thr Asn Glu Asp Glu Ile Tyr Ala Phe Phe Gly Ile Leu 180 185 190 Val Met Thr Ala Val Arg Lys Asp Asn His Met Ser Thr Asp Asp Leu 195 200 205 Phe Asp Arg Ser Leu Ser Met Val Tyr Val Ser Val Met Ser Arg Asp 210 215 220 Arg Phe Asp Phe Leu Ile Arg Cys Leu Arg Met Asp Asp Lys Ser Ile 225 230 235 240 Arg Pro Thr Leu Arg Glu Asn Asp Val Phe Thr Pro Val Arg Lys Ile 245 250 255 Trp Asp Leu Phe Ile His Gln Cys Ile Gln Asn Tyr Thr Pro Gly Ala 260 265 270 His Leu Thr Ile Asp Glu Gln Leu Leu Gly Phe Arg Gly Arg Cys Pro 275 280 285 Phe Arg Val Tyr Ile Pro Asn Lys Pro Ser Lys Tyr Gly Ile Lys Ile 290 295 300 Leu Met Met Cys Asp Ser Gly Thr Lys Tyr Met Ile Asn Gly Met Pro 305 310 315 320 Tyr Leu Gly Arg Gly Thr Gln Thr Asn Gly Val Pro Leu Gly Glu Tyr 325 330 335 Tyr Val Lys Glu Leu Ser Lys Pro Val His Gly Ser Cys Arg Asn Ile 340 345 350 Thr Cys Asp Asn Trp Phe Thr Ser Ile Pro Leu Ala Lys Asn Leu Leu 355 360 365 Gln Glu Pro Tyr Lys Leu Thr Ile Val Gly Thr Val Arg Ser Asn Lys 370 375 380 Arg Glu Ile Pro Glu Val Leu Lys Asn Ser Arg Ser Arg Pro Val Gly 385 390 395 400 Thr Ser Met Phe Cys Phe Asp Gly Pro Leu Thr Leu Val Ser Tyr Lys 405 410 415 Pro Lys Pro Ala Lys Met Val Tyr Leu Leu Ser Ser Cys Asp Glu Asp 420 425 430 Ala Ser Ile Asn Glu Ser Thr Gly Lys Pro Gln Met Val Met Tyr Tyr 435 440 445 Asn Gln Thr Lys Gly Gly Val Asp Thr Leu Asp Gln Met Cys Ser Val 450 455 460 Met Thr Cys Ser Arg Lys Thr Asn Arg Trp Pro Met Ala Leu Leu Tyr 465 470 475 480 Gly Met Ile Asn Ile Ala Cys Ile Asn Ser Phe Ile Ile Tyr Ser His 485 490 495 Asn Val Ser Ser Lys Gly Glu Lys Val Gln Ser Arg Lys Lys Phe Met 500 505 510 Arg Asn Leu Tyr Met Ser Leu Thr Ser Ser Phe Met Arg Lys Arg Leu 515 520 525 Glu Ala Pro Thr Leu Lys Arg Tyr Leu Arg Asp Asn Ile Ser Asn Ile 530 535 540 Leu Pro Lys Glu Val Pro Gly Thr Ser Asp Asp Ser Thr Glu Glu Pro 545 550 555 560 Val Met Lys Lys Arg Thr Tyr Cys Thr Tyr Cys Pro Ser Lys Ile Arg 565 570 575 Arg Lys Ala Asn Ala Ser Cys Lys Lys Cys Lys Lys Val Ile Cys Arg 580 585 590 Glu His Asn Ile Asp Met Cys Gln Ser Cys Phe 595 600 <210> 50 <211> 1809 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 50 cccaagaaga agcggaaagt tggcggcgga ggcagcagcc tggatgatga gcatattctg 60 agcgccctgc tgcagagcga cgatgaactc gtgggcgaag atagcgacag cgaggtgtcc 120 gatcacgtgt ccgaggatga cgtgcagtcc gataccgagg aagccttcat cgacgaggtg 180 cacgaagtgc agcctacaag cagcggcagc gagatcctgg acgagcagaa tgtgatcgag 240 cagccaggat ctagcctggc cagcaacaga atcctgacac tgccccagag aaccatccgg 300 ggcaagaaca agcactgctg gtccaccagc aagagcacca gacggtctag agtgtctgcc 360 ctgaacatcg tgcgaagcca gaggggccct accagaatgt gccggaacat ctacgaccct 420 ctgctgtgct tcaagctgtt cttcaccgac gagatcatct ccgagatcgt gaagtggacc 480 aacgccgaga tcagcctgaa gcggagagaa tccatgacca gcgccacctt cagagacacc 540 aacgaggacg agatctacgc cttcttcggc atcctggtca tgacagccgt gcggaaggac 600 aaccacatga gcaccgacga cctgttcgac cgcagcctgt ctatggtgta cgtgtccgtg 660 atgagccggg acagattcga cttcctgatc cggtgcctgc ggatggacga caagtccatc 720 agacccacac tgcgcgagaa cgacgtgttc acacctgtgc ggaagatctg ggacctgttc 780 atccaccagt gcatccagaa ctacacccct ggcgctcacc tgaccatcga cgaacagctg 840 ctgggcttca gaggcagatg ccccttcaga gtgtacatcc ccaacaagcc ctctaagtac 900 ggcatcaaga tcctgatgat gtgcgacagc ggcaccaagt acatgatcaa cggcatgccc 960 tacctcggca gaggcaccca aacaaatggc gtgccactgg gcgagtacta cgtgaaagaa 1020 ctgagcaagc ctgtgcacgg cagctgcaga aacatcacct gtgacaactg gtttaccagc 1080 attcccctgg ccaagaacct gctgcaagaa ccctacaagc tgacaatcgt gggcaccgtg 1140 cggagcaaca agagggaaat tcccgaggtg ctgaagaact ctcggagcag acctgtgggc 1200 accagcatgt tctgcttcga cggacctctg acactggtgt cctacaagcc caagcctgcc 1260 aagatggtgt acctgctgag cagctgtgac gaggacgcca gcatcaatga gagcaccggc 1320 aagccccaga tggtcatgta ctacaaccag accaaaggcg gcgtggacac cctggatcag 1380 atgtgcagcg tgatgacctg cagcagaaag accaacagat ggcccatggc tctgctgtac 1440 ggcatgatca atatcgcctg catcaacagc ttcatcatct acagccacaa cgtgtccagc 1500 aagggcgaga aggtgcagag ccggaagaaa ttcatgcgga acctgtacat gagcctgacc 1560 agcagcttca tgagaaagcg gctggaagcc cctacactga agagatacct gcgggacaac 1620 atcagcaaca tcctgcctaa agaggtgccc ggcaccagcg acgatagcac agaggaaccc 1680 gtgatgaaga agaggaccta ctgcacctac tgtcccagca agatccggcg gaaggccaac 1740 gccagctgca aaaagtgcaa gaaagtgatc tgccgcgagc acaacatcga tatgtgccag 1800 agctgcttc 1809 <210> 51 <211> 340 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 51 Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Lys Ile Val 1 5 10 15 Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu 20 25 30 Lys Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His 35 40 45 His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Val Leu 50 55 60 Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro 65 70 75 80 Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr 85 90 95 Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu 100 105 110 Lys Gly Arg Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys 115 120 125 Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr 130 135 140 Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe 145 150 155 160 Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys 165 170 175 Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile 180 185 190 Met Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys 195 200 205 Ile Asp Gly Ile Met Arg Lys Glu Asn Tyr Val Asp Ile Leu Lys Gln 210 215 220 His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val 225 230 235 240 Phe Gln Met Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys 245 250 255 Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser 260 265 270 Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg 275 280 285 Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys 290 295 300 Gln Glu Glu Trp Ala Lys Ile His Pro Thr Tyr Cys Gly Lys Leu Val 305 310 315 320 Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn 325 330 335 Ala Thr Lys Tyr 340 <210> 52 <211> 339 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 52 Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Lys Ile Val Asp 1 5 10 15 Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu Lys 20 25 30 Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His His 35 40 45 Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Val Leu Ser 50 55 60 Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro Arg 65 70 75 80 Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr Lys 85 90 95 Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu Lys 100 105 110 Gly Arg Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys Lys 115 120 125 Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr Phe 130 135 140 Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe Gly 145 150 155 160 His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys Lys 165 170 175 Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile Met 180 185 190 Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys Ile 195 200 205 Asp Gly Ile Met Arg Lys Glu Asn Tyr Val Asp Ile Leu Lys Gln His 210 215 220 Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val Phe 225 230 235 240 Gln Met Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys Trp 245 250 255 Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser Pro 260 265 270 Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg Val 275 280 285 Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys Gln 290 295 300 Glu Glu Trp Ala Lys Ile His Pro Thr Tyr Cys Gly Lys Leu Val Glu 305 310 315 320 Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn Ala 325 330 335 Thr Lys Tyr <210> 53 <211> 340 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 53 Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Arg Ile Val 1 5 10 15 Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu 20 25 30 Ala Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His 35 40 45 His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Val Leu 50 55 60 Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro 65 70 75 80 Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr 85 90 95 Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu 100 105 110 Lys Gly His Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys 115 120 125 Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr 130 135 140 Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe 145 150 155 160 Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys 165 170 175 Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile 180 185 190 Met Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys 195 200 205 Ile Asp Gly Ile Met Asp Ala Val Gln Tyr Val Asp Ile Leu Lys Gln 210 215 220 His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val 225 230 235 240 Phe Gln His Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys 245 250 255 Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser 260 265 270 Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg 275 280 285 Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys 290 295 300 Gln Glu Glu Trp Ala Lys Ile His Pro Asn Tyr Cys Gly Lys Leu Val 305 310 315 320 Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn 325 330 335 Ala Thr Lys Tyr 340 <210> 54 <211> 339 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 54 Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Arg Ile Val Asp 1 5 10 15 Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu Ala 20 25 30 Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His His 35 40 45 Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Val Leu Ser 50 55 60 Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro Arg 65 70 75 80 Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr Lys 85 90 95 Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu Lys 100 105 110 Gly His Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys Lys 115 120 125 Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr Phe 130 135 140 Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe Gly 145 150 155 160 His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys Lys 165 170 175 Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile Met 180 185 190 Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys Ile 195 200 205 Asp Gly Ile Met Asp Ala Val Gln Tyr Val Asp Ile Leu Lys Gln His 210 215 220 Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val Phe 225 230 235 240 Gln His Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys Trp 245 250 255 Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser Pro 260 265 270 Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg Val 275 280 285 Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys Gln 290 295 300 Glu Glu Trp Ala Lys Ile His Pro Asn Tyr Cys Gly Lys Leu Val Glu 305 310 315 320 Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn Ala 325 330 335 Thr Lys Tyr <210> 55 <211> 1496 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 55 Met Ser Lys Glu Gln Leu Leu Ile Gln Arg Ser Ser Ala Ala Glu Arg 1 5 10 15 Cys Arg Arg Tyr Arg Gln Lys Met Ser Ala Glu Gln Arg Ala Ser Asp 20 25 30 Leu Glu Arg Arg Arg Arg Leu Gln Gln Asn Val Ser Glu Glu Gln Leu 35 40 45 Leu Glu Lys Arg Arg Ser Glu Ala Glu Lys Gln Arg Arg His Arg Gln 50 55 60 Lys Met Ser Lys Asp Gln Arg Ala Phe Glu Val Glu Arg Arg Arg Trp 65 70 75 80 Arg Arg Gln Asn Met Ser Arg Glu Gln Ser Ser Thr Ser Thr Thr Asn 85 90 95 Thr Gly Arg Asn Cys Leu Leu Ser Lys Asn Gly Val His Glu Asp Ala 100 105 110 Ile Leu Glu His Ser Cys Gly Gly Met Thr Val Arg Cys Glu Phe Cys 115 120 125 Leu Ser Leu Asn Phe Ser Asp Glu Lys Pro Ser Asp Gly Lys Phe Thr 130 135 140 Arg Cys Cys Ser Lys Gly Lys Val Cys Pro Asn Asp Ile His Phe Pro 145 150 155 160 Asp Tyr Pro Ala Tyr Leu Lys Arg Leu Met Thr Asn Glu Asp Ser Asp 165 170 175 Ser Lys Asn Phe Met Glu Asn Ile Arg Ser Ile Asn Ser Ser Phe Ala 180 185 190 Phe Ala Ser Met Gly Ala Asn Ile Ala Ser Pro Ser Gly Tyr Gly Pro 195 200 205 Tyr Cys Phe Arg Ile His Gly Gln Val Tyr His Arg Thr Gly Thr Leu 210 215 220 His Pro Ser Asp Gly Val Ser Arg Lys Phe Ala Gln Leu Tyr Ile Leu 225 230 235 240 Asp Thr Ala Glu Ala Thr Ser Lys Arg Leu Ala Met Pro Glu Asn Gln 245 250 255 Gly Cys Ser Glu Arg Leu Met Ile Asn Ile Asn Asn Leu Met His Glu 260 265 270 Ile Asn Glu Leu Thr Lys Ser Tyr Lys Met Leu His Glu Val Glu Lys 275 280 285 Glu Ala Gln Ser Glu Ala Ala Ala Lys Gly Ile Ala Pro Thr Glu Val 290 295 300 Thr Met Ala Ile Lys Tyr Asp Arg Asn Ser Asp Pro Gly Arg Tyr Asn 305 310 315 320 Ser Pro Arg Val Thr Glu Val Ala Val Ile Phe Arg Asn Glu Asp Gly 325 330 335 Glu Pro Pro Phe Glu Arg Asp Leu Leu Ile His Cys Lys Pro Asp Pro 340 345 350 Asn Asn Pro Asn Ala Thr Lys Met Lys Gln Ile Ser Ile Leu Phe Pro 355 360 365 Thr Leu Asp Ala Met Thr Tyr Pro Ile Leu Phe Pro His Gly Glu Lys 370 375 380 Gly Trp Gly Thr Asp Ile Ala Leu Arg Leu Arg Asp Asn Ser Val Ile 385 390 395 400 Asp Asn Asn Thr Arg Gln Asn Val Arg Thr Arg Val Thr Gln Met Gln 405 410 415 Tyr Tyr Gly Phe His Leu Ser Val Arg Asp Thr Phe Asn Pro Ile Leu 420 425 430 Asn Ala Gly Lys Leu Thr Gln Gln Phe Ile Val Asp Ser Tyr Ser Lys 435 440 445 Met Glu Ala Asn Arg Ile Asn Phe Ile Lys Ala Asn Gln Ser Lys Leu 450 455 460 Arg Val Glu Lys Tyr Ser Gly Leu Met Asp Tyr Leu Lys Ser Arg Ser 465 470 475 480 Glu Asn Asp Asn Val Pro Ile Gly Lys Met Ile Ile Leu Pro Ser Ser 485 490 495 Phe Glu Gly Ser Pro Arg Asn Met Gln Gln Arg Tyr Gln Asp Ala Met 500 505 510 Ala Ile Val Thr Lys Tyr Gly Lys Pro Asp Leu Phe Ile Thr Met Thr 515 520 525 Cys Asn Pro Lys Trp Ala Asp Ile Thr Asn Asn Leu Gln Arg Trp Gln 530 535 540 Lys Val Glu Asn Arg Pro Asp Leu Val Ala Arg Val Phe Asn Ile Lys 545 550 555 560 Leu Asn Ala Leu Leu Asn Asp Ile Cys Lys Phe His Leu Phe Gly Lys 565 570 575 Val Ile Ala Lys Ile His Val Ile Glu Phe Gln Lys Arg Gly Leu Pro 580 585 590 His Ala His Ile Leu Leu Ile Leu Asp Ser Glu Ser Lys Leu Arg Ser 595 600 605 Glu Asp Asp Ile Asp Arg Ile Val Lys Ala Glu Ile Pro Asp Glu Asp 610 615 620 Gln Cys Pro Arg Leu Phe Gln Ile Val Lys Ser Asn Met Val His Gly 625 630 635 640 Pro Cys Gly Ile Gln Asn Pro Asn Ser Pro Cys Met Glu Asn Gly Lys 645 650 655 Cys Ser Lys Gly Tyr Pro Lys Glu Phe Gln Asn Ala Thr Ile Gly Asn 660 665 670 Ile Asp Gly Tyr Pro Lys Tyr Lys Arg Arg Ser Gly Ser Thr Met Ser 675 680 685 Ile Gly Asn Lys Val Val Asp Asn Thr Trp Ile Val Pro Tyr Asn Pro 690 695 700 Tyr Leu Cys Leu Lys Tyr Asn Cys His Ile Asn Val Glu Val Cys Ala 705 710 715 720 Ser Ile Lys Ser Val Lys Tyr Leu Phe Lys Tyr Ile Tyr Lys Gly His 725 730 735 Asp Cys Ala Asn Ile Gln Ile Ser Glu Lys Asn Ile Ile Asn His Asp 740 745 750 Glu Val Gln Asp Phe Ile Asp Ser Arg Tyr Val Ser Ala Pro Glu Ala 755 760 765 Val Trp Arg Leu Phe Ala Met Arg Met His Asp Gln Ser His Ala Ile 770 775 780 Thr Arg Leu Ala Ile His Leu Pro Asn Asp Gln Asn Leu Tyr Phe His 785 790 795 800 Thr Asp Asp Phe Ala Glu Val Leu Asp Arg Ala Lys Arg His Asn Ser 805 810 815 Thr Leu Met Ala Trp Phe Leu Leu Asn Arg Glu Asp Ser Asp Ala Arg 820 825 830 Asn Tyr Tyr Tyr Trp Glu Ile Pro Gln His Tyr Val Phe Asn Asn Ser 835 840 845 Leu Trp Thr Lys Arg Arg Lys Gly Gly Asn Lys Val Leu Gly Arg Leu 850 855 860 Phe Thr Val Ser Phe Arg Glu Pro Glu Arg Tyr Tyr Leu Arg Leu Leu 865 870 875 880 Leu Leu His Val Lys Gly Ala Ile Ser Phe Glu Asp Leu Arg Thr Val 885 890 895 Gly Gly Val Thr Tyr Asp Thr Phe His Glu Ala Ala Lys His Arg Gly 900 905 910 Leu Leu Leu Asp Asp Thr Ile Trp Lys Asp Thr Ile Asp Asp Ala Ile 915 920 925 Ile Leu Asn Met Pro Lys Gln Leu Arg Gln Leu Phe Ala Tyr Ile Cys 930 935 940 Val Phe Gly Cys Pro Ser Ala Ala Asp Lys Leu Trp Asp Glu Asn Lys 945 950 955 960 Ser His Phe Ile Glu Asp Phe Cys Trp Lys Leu His Arg Arg Glu Gly 965 970 975 Ala Cys Val Asn Cys Glu Met His Ala Leu Asn Glu Ile Gln Glu Val 980 985 990 Phe Thr Leu His Gly Met Lys Cys Ser His Phe Lys Leu Pro Asp Tyr 995 1000 1005 Pro Leu Leu Met Asn Ala Asn Thr Cys Asp Gln Leu Tyr Glu Gln 1010 1015 1020 Gln Gln Ala Glu Val Leu Ile Asn Ser Leu Asn Asp Glu Gln Leu 1025 1030 1035 Ala Ala Phe Gln Thr Ile Thr Ser Ala Ile Glu Asp Gln Thr Val 1040 1045 1050 His Pro Lys Cys Phe Phe Leu Asp Gly Pro Gly Gly Ser Gly Lys 1055 1060 1065 Thr Tyr Leu Tyr Lys Val Leu Thr His Tyr Ile Arg Gly Arg Gly 1070 1075 1080 Gly Thr Val Leu Pro Thr Ala Ser Thr Gly Ile Ala Ala Asn Leu 1085 1090 1095 Leu Leu Gly Gly Arg Thr Phe His Ser Gln Tyr Lys Leu Pro Ile 1100 1105 1110 Pro Leu Asn Glu Thr Ser Ile Ser Arg Leu Asp Ile Lys Ser Glu 1115 1120 1125 Val Ala Lys Thr Ile Lys Lys Ala Gln Leu Leu Ile Ile Asp Glu 1130 1135 1140 Cys Thr Met Ala Ser Ser His Ala Ile Asn Ala Ile Asp Arg Leu 1145 1150 1155 Leu Arg Glu Ile Met Asn Leu Asn Val Ala Phe Gly Gly Lys Val 1160 1165 1170 Leu Leu Leu Gly Gly Asp Phe Arg Gln Cys Leu Ser Ile Val Pro 1175 1180 1185 His Ala Met Arg Ser Ala Ile Val Gln Thr Ser Leu Lys Tyr Cys 1190 1195 1200 Asn Val Trp Gly Cys Phe Arg Lys Leu Ser Leu Lys Thr Asn Met 1205 1210 1215 Arg Ser Glu Asp Ser Ala Tyr Ser Glu Trp Leu Val Lys Leu Gly 1220 1225 1230 Asp Gly Lys Leu Asp Ser Ser Phe His Leu Gly Met Asp Ile Ile 1235 1240 1245 Glu Ile Pro His Glu Met Ile Cys Asn Gly Ser Ile Ile Glu Ala 1250 1255 1260 Thr Phe Gly Asn Ser Ile Ser Ile Asp Asn Ile Lys Asn Ile Ser 1265 1270 1275 Lys Arg Ala Ile Leu Cys Pro Lys Asn Glu His Val Gln Lys Leu 1280 1285 1290 Asn Glu Glu Ile Leu Asp Ile Leu Asp Gly Asp Phe His Thr Tyr 1295 1300 1305 Leu Ser Asp Asp Ser Ile Asp Ser Thr Asp Asp Ala Glu Lys Glu 1310 1315 1320 Asn Phe Pro Ile Glu Phe Leu Asn Ser Ile Thr Pro Ser Gly Met 1325 1330 1335 Pro Cys His Lys Leu Lys Leu Lys Val Gly Ala Ile Ile Met Leu 1340 1345 1350 Leu Arg Asn Leu Asn Ser Lys Trp Gly Leu Cys Asn Gly Thr Arg 1355 1360 1365 Phe Ile Ile Lys Arg Leu Arg Pro Asn Ile Ile Glu Ala Glu Val 1370 1375 1380 Leu Thr Gly Ser Ala Glu Gly Glu Val Val Leu Ile Pro Arg Ile 1385 1390 1395 Asp Leu Ser Pro Ser Asp Thr Gly Leu Pro Phe Lys Leu Ile Arg 1400 1405 1410 Arg Gln Phe Pro Val Met Pro Ala Phe Ala Met Thr Ile Asn Lys 1415 1420 1425 Ser Gln Gly Gln Thr Leu Asp Arg Val Gly Ile Phe Leu Pro Glu 1430 1435 1440 Pro Val Phe Ala His Gly Gln Leu Tyr Val Ala Phe Ser Arg Val 1445 1450 1455 Arg Arg Ala Cys Asp Val Lys Val Lys Val Val Asn Thr Ser Ser 1460 1465 1470 Gln Gly Lys Leu Val Lys His Ser Glu Ser Val Phe Thr Leu Asn 1475 1480 1485 Val Val Tyr Arg Glu Ile Leu Glu 1490 1495 <210> 56 <211> 1495 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 56 Ser Lys Glu Gln Leu Leu Ile Gln Arg Ser Ser Ala Ala Glu Arg Cys 1 5 10 15 Arg Arg Tyr Arg Gln Lys Met Ser Ala Glu Gln Arg Ala Ser Asp Leu 20 25 30 Glu Arg Arg Arg Arg Leu Gln Gln Asn Val Ser Glu Glu Gln Leu Leu 35 40 45 Glu Lys Arg Arg Ser Glu Ala Glu Lys Gln Arg Arg His Arg Gln Lys 50 55 60 Met Ser Lys Asp Gln Arg Ala Phe Glu Val Glu Arg Arg Arg Trp Arg 65 70 75 80 Arg Gln Asn Met Ser Arg Glu Gln Ser Ser Thr Ser Thr Thr Asn Thr 85 90 95 Gly Arg Asn Cys Leu Leu Ser Lys Asn Gly Val His Glu Asp Ala Ile 100 105 110 Leu Glu His Ser Cys Gly Gly Met Thr Val Arg Cys Glu Phe Cys Leu 115 120 125 Ser Leu Asn Phe Ser Asp Glu Lys Pro Ser Asp Gly Lys Phe Thr Arg 130 135 140 Cys Cys Ser Lys Gly Lys Val Cys Pro Asn Asp Ile His Phe Pro Asp 145 150 155 160 Tyr Pro Ala Tyr Leu Lys Arg Leu Met Thr Asn Glu Asp Ser Asp Ser 165 170 175 Lys Asn Phe Met Glu Asn Ile Arg Ser Ile Asn Ser Ser Phe Ala Phe 180 185 190 Ala Ser Met Gly Ala Asn Ile Ala Ser Pro Ser Gly Tyr Gly Pro Tyr 195 200 205 Cys Phe Arg Ile His Gly Gln Val Tyr His Arg Thr Gly Thr Leu His 210 215 220 Pro Ser Asp Gly Val Ser Arg Lys Phe Ala Gln Leu Tyr Ile Leu Asp 225 230 235 240 Thr Ala Glu Ala Thr Ser Lys Arg Leu Ala Met Pro Glu Asn Gln Gly 245 250 255 Cys Ser Glu Arg Leu Met Ile Asn Ile Asn Asn Leu Met His Glu Ile 260 265 270 Asn Glu Leu Thr Lys Ser Tyr Lys Met Leu His Glu Val Glu Lys Glu 275 280 285 Ala Gln Ser Glu Ala Ala Ala Lys Gly Ile Ala Pro Thr Glu Val Thr 290 295 300 Met Ala Ile Lys Tyr Asp Arg Asn Ser Asp Pro Gly Arg Tyr Asn Ser 305 310 315 320 Pro Arg Val Thr Glu Val Ala Val Ile Phe Arg Asn Glu Asp Gly Glu 325 330 335 Pro Pro Phe Glu Arg Asp Leu Leu Ile His Cys Lys Pro Asp Pro Asn 340 345 350 Asn Pro Asn Ala Thr Lys Met Lys Gln Ile Ser Ile Leu Phe Pro Thr 355 360 365 Leu Asp Ala Met Thr Tyr Pro Ile Leu Phe Pro His Gly Glu Lys Gly 370 375 380 Trp Gly Thr Asp Ile Ala Leu Arg Leu Arg Asp Asn Ser Val Ile Asp 385 390 395 400 Asn Asn Thr Arg Gln Asn Val Arg Thr Arg Val Thr Gln Met Gln Tyr 405 410 415 Tyr Gly Phe His Leu Ser Val Arg Asp Thr Phe Asn Pro Ile Leu Asn 420 425 430 Ala Gly Lys Leu Thr Gln Gln Phe Ile Val Asp Ser Tyr Ser Lys Met 435 440 445 Glu Ala Asn Arg Ile Asn Phe Ile Lys Ala Asn Gln Ser Lys Leu Arg 450 455 460 Val Glu Lys Tyr Ser Gly Leu Met Asp Tyr Leu Lys Ser Arg Ser Glu 465 470 475 480 Asn Asp Asn Val Pro Ile Gly Lys Met Ile Ile Leu Pro Ser Ser Phe 485 490 495 Glu Gly Ser Pro Arg Asn Met Gln Gln Arg Tyr Gln Asp Ala Met Ala 500 505 510 Ile Val Thr Lys Tyr Gly Lys Pro Asp Leu Phe Ile Thr Met Thr Cys 515 520 525 Asn Pro Lys Trp Ala Asp Ile Thr Asn Asn Leu Gln Arg Trp Gln Lys 530 535 540 Val Glu Asn Arg Pro Asp Leu Val Ala Arg Val Phe Asn Ile Lys Leu 545 550 555 560 Asn Ala Leu Leu Asn Asp Ile Cys Lys Phe His Leu Phe Gly Lys Val 565 570 575 Ile Ala Lys Ile His Val Ile Glu Phe Gln Lys Arg Gly Leu Pro His 580 585 590 Ala His Ile Leu Leu Ile Leu Asp Ser Glu Ser Lys Leu Arg Ser Glu 595 600 605 Asp Asp Ile Asp Arg Ile Val Lys Ala Glu Ile Pro Asp Glu Asp Gln 610 615 620 Cys Pro Arg Leu Phe Gln Ile Val Lys Ser Asn Met Val His Gly Pro 625 630 635 640 Cys Gly Ile Gln Asn Pro Asn Ser Pro Cys Met Glu Asn Gly Lys Cys 645 650 655 Ser Lys Gly Tyr Pro Lys Glu Phe Gln Asn Ala Thr Ile Gly Asn Ile 660 665 670 Asp Gly Tyr Pro Lys Tyr Lys Arg Arg Ser Gly Ser Thr Met Ser Ile 675 680 685 Gly Asn Lys Val Val Asp Asn Thr Trp Ile Val Pro Tyr Asn Pro Tyr 690 695 700 Leu Cys Leu Lys Tyr Asn Cys His Ile Asn Val Glu Val Cys Ala Ser 705 710 715 720 Ile Lys Ser Val Lys Tyr Leu Phe Lys Tyr Ile Tyr Lys Gly His Asp 725 730 735 Cys Ala Asn Ile Gln Ile Ser Glu Lys Asn Ile Ile Asn His Asp Glu 740 745 750 Val Gln Asp Phe Ile Asp Ser Arg Tyr Val Ser Ala Pro Glu Ala Val 755 760 765 Trp Arg Leu Phe Ala Met Arg Met His Asp Gln Ser His Ala Ile Thr 770 775 780 Arg Leu Ala Ile His Leu Pro Asn Asp Gln Asn Leu Tyr Phe His Thr 785 790 795 800 Asp Asp Phe Ala Glu Val Leu Asp Arg Ala Lys Arg His Asn Ser Thr 805 810 815 Leu Met Ala Trp Phe Leu Leu Asn Arg Glu Asp Ser Asp Ala Arg Asn 820 825 830 Tyr Tyr Tyr Trp Glu Ile Pro Gln His Tyr Val Phe Asn Asn Ser Leu 835 840 845 Trp Thr Lys Arg Arg Lys Gly Gly Asn Lys Val Leu Gly Arg Leu Phe 850 855 860 Thr Val Ser Phe Arg Glu Pro Glu Arg Tyr Tyr Leu Arg Leu Leu Leu 865 870 875 880 Leu His Val Lys Gly Ala Ile Ser Phe Glu Asp Leu Arg Thr Val Gly 885 890 895 Gly Val Thr Tyr Asp Thr Phe His Glu Ala Ala Lys His Arg Gly Leu 900 905 910 Leu Leu Asp Asp Thr Ile Trp Lys Asp Thr Ile Asp Asp Ala Ile Ile 915 920 925 Leu Asn Met Pro Lys Gln Leu Arg Gln Leu Phe Ala Tyr Ile Cys Val 930 935 940 Phe Gly Cys Pro Ser Ala Ala Asp Lys Leu Trp Asp Glu Asn Lys Ser 945 950 955 960 His Phe Ile Glu Asp Phe Cys Trp Lys Leu His Arg Arg Glu Gly Ala 965 970 975 Cys Val Asn Cys Glu Met His Ala Leu Asn Glu Ile Gln Glu Val Phe 980 985 990 Thr Leu His Gly Met Lys Cys Ser His Phe Lys Leu Pro Asp Tyr Pro 995 1000 1005 Leu Leu Met Asn Ala Asn Thr Cys Asp Gln Leu Tyr Glu Gln Gln 1010 1015 1020 Gln Ala Glu Val Leu Ile Asn Ser Leu Asn Asp Glu Gln Leu Ala 1025 1030 1035 Ala Phe Gln Thr Ile Thr Ser Ala Ile Glu Asp Gln Thr Val His 1040 1045 1050 Pro Lys Cys Phe Phe Leu Asp Gly Pro Gly Gly Ser Gly Lys Thr 1055 1060 1065 Tyr Leu Tyr Lys Val Leu Thr His Tyr Ile Arg Gly Arg Gly Gly 1070 1075 1080 Thr Val Leu Pro Thr Ala Ser Thr Gly Ile Ala Ala Asn Leu Leu 1085 1090 1095 Leu Gly Gly Arg Thr Phe His Ser Gln Tyr Lys Leu Pro Ile Pro 1100 1105 1110 Leu Asn Glu Thr Ser Ile Ser Arg Leu Asp Ile Lys Ser Glu Val 1115 1120 1125 Ala Lys Thr Ile Lys Lys Ala Gln Leu Leu Ile Ile Asp Glu Cys 1130 1135 1140 Thr Met Ala Ser Ser His Ala Ile Asn Ala Ile Asp Arg Leu Leu 1145 1150 1155 Arg Glu Ile Met Asn Leu Asn Val Ala Phe Gly Gly Lys Val Leu 1160 1165 1170 Leu Leu Gly Gly Asp Phe Arg Gln Cys Leu Ser Ile Val Pro His 1175 1180 1185 Ala Met Arg Ser Ala Ile Val Gln Thr Ser Leu Lys Tyr Cys Asn 1190 1195 1200 Val Trp Gly Cys Phe Arg Lys Leu Ser Leu Lys Thr Asn Met Arg 1205 1210 1215 Ser Glu Asp Ser Ala Tyr Ser Glu Trp Leu Val Lys Leu Gly Asp 1220 1225 1230 Gly Lys Leu Asp Ser Ser Phe His Leu Gly Met Asp Ile Ile Glu 1235 1240 1245 Ile Pro His Glu Met Ile Cys Asn Gly Ser Ile Ile Glu Ala Thr 1250 1255 1260 Phe Gly Asn Ser Ile Ser Ile Asp Asn Ile Lys Asn Ile Ser Lys 1265 1270 1275 Arg Ala Ile Leu Cys Pro Lys Asn Glu His Val Gln Lys Leu Asn 1280 1285 1290 Glu Glu Ile Leu Asp Ile Leu Asp Gly Asp Phe His Thr Tyr Leu 1295 1300 1305 Ser Asp Asp Ser Ile Asp Ser Thr Asp Asp Ala Glu Lys Glu Asn 1310 1315 1320 Phe Pro Ile Glu Phe Leu Asn Ser Ile Thr Pro Ser Gly Met Pro 1325 1330 1335 Cys His Lys Leu Lys Leu Lys Val Gly Ala Ile Ile Met Leu Leu 1340 1345 1350 Arg Asn Leu Asn Ser Lys Trp Gly Leu Cys Asn Gly Thr Arg Phe 1355 1360 1365 Ile Ile Lys Arg Leu Arg Pro Asn Ile Ile Glu Ala Glu Val Leu 1370 1375 1380 Thr Gly Ser Ala Glu Gly Glu Val Val Leu Ile Pro Arg Ile Asp 1385 1390 1395 Leu Ser Pro Ser Asp Thr Gly Leu Pro Phe Lys Leu Ile Arg Arg 1400 1405 1410 Gln Phe Pro Val Met Pro Ala Phe Ala Met Thr Ile Asn Lys Ser 1415 1420 1425 Gln Gly Gln Thr Leu Asp Arg Val Gly Ile Phe Leu Pro Glu Pro 1430 1435 1440 Val Phe Ala His Gly Gln Leu Tyr Val Ala Phe Ser Arg Val Arg 1445 1450 1455 Arg Ala Cys Asp Val Lys Val Lys Val Val Asn Thr Ser Ser Gln 1460 1465 1470 Gly Lys Leu Val Lys His Ser Glu Ser Val Phe Thr Leu Asn Val 1475 1480 1485 Val Tyr Arg Glu Ile Leu Glu 1490 1495 <210> 57 <211> 649 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 57 Met Glu Glu Val Cys Asp Ser Ser Ala Ala Ala Ser Ser Thr Val Gln 1 5 10 15 Asn Gln Pro Gln Asp Gln Glu His Pro Trp Pro Tyr Leu Arg Glu Phe 20 25 30 Phe Ser Leu Ser Gly Val Asn Lys Asp Ser Phe Lys Met Lys Cys Val 35 40 45 Leu Cys Leu Pro Leu Asn Lys Glu Ile Ser Ala Phe Lys Ser Ser Pro 50 55 60 Ser Asn Leu Arg Lys His Ile Glu Arg Met His Pro Asn Tyr Leu Lys 65 70 75 80 Asn Tyr Ser Lys Leu Thr Ala Gln Lys Arg Lys Ile Gly Thr Ser Thr 85 90 95 His Ala Ser Ser Ser Lys Gln Leu Lys Val Asp Ser Val Phe Pro Val 100 105 110 Lys His Val Ser Pro Val Thr Val Asn Lys Ala Ile Leu Arg Tyr Ile 115 120 125 Ile Gln Gly Leu His Pro Phe Ser Thr Val Asp Leu Pro Ser Phe Lys 130 135 140 Glu Leu Ile Ser Thr Leu Gln Pro Gly Ile Ser Val Ile Thr Arg Pro 145 150 155 160 Thr Leu Arg Ser Lys Ile Ala Glu Ala Ala Leu Ile Met Lys Gln Lys 165 170 175 Val Thr Ala Ala Met Ser Glu Val Glu Trp Ile Ala Thr Thr Thr Asp 180 185 190 Cys Trp Thr Ala Arg Arg Lys Ser Phe Ile Gly Val Thr Ala His Trp 195 200 205 Ile Asn Pro Gly Ser Leu Glu Arg His Ser Ala Ala Leu Ala Cys Lys 210 215 220 Arg Leu Met Gly Ser His Thr Phe Glu Val Leu Ala Ser Ala Met Asn 225 230 235 240 Asp Ile His Ser Glu Tyr Glu Ile Arg Asp Lys Val Val Cys Thr Thr 245 250 255 Thr Asp Ser Gly Ser Asn Phe Met Lys Ala Phe Arg Val Phe Gly Val 260 265 270 Glu Asn Asn Asp Ile Glu Thr Glu Ala Arg Arg Cys Glu Ser Asp Asp 275 280 285 Thr Asp Ser Glu Gly Cys Gly Glu Gly Ser Asp Gly Val Glu Phe Gln 290 295 300 Asp Ala Ser Arg Val Leu Asp Gln Asp Asp Gly Phe Glu Phe Gln Leu 305 310 315 320 Pro Lys His Gln Lys Cys Ala Cys His Leu Leu Asn Leu Val Ser Ser 325 330 335 Val Asp Ala Gln Lys Ala Leu Ser Asn Glu His Tyr Lys Lys Leu Tyr 340 345 350 Arg Ser Val Phe Gly Lys Cys Gln Ala Leu Trp Asn Lys Ser Ser Arg 355 360 365 Ser Ala Leu Ala Ala Glu Ala Val Glu Ser Glu Ser Arg Leu Gln Leu 370 375 380 Leu Arg Pro Asn Gln Thr Arg Trp Asn Ser Thr Phe Met Ala Val Asp 385 390 395 400 Arg Ile Leu Gln Ile Cys Lys Glu Ala Gly Glu Gly Ala Leu Arg Asn 405 410 415 Ile Cys Thr Ser Leu Glu Val Pro Met Phe Asn Pro Ala Glu Met Leu 420 425 430 Phe Leu Thr Glu Trp Ala Asn Thr Met Arg Pro Val Ala Lys Val Leu 435 440 445 Asp Ile Leu Gln Ala Glu Thr Asn Thr Gln Leu Gly Trp Leu Leu Pro 450 455 460 Ser Val His Gln Leu Ser Leu Lys Leu Gln Arg Leu His His Ser Leu 465 470 475 480 Arg Tyr Cys Asp Pro Leu Val Asp Ala Leu Gln Gln Gly Ile Gln Thr 485 490 495 Arg Phe Lys His Met Phe Glu Asp Pro Glu Ile Ile Ala Ala Ala Ile 500 505 510 Leu Leu Pro Lys Phe Arg Thr Ser Trp Thr Asn Asp Glu Thr Ile Ile 515 520 525 Lys Arg Gly Met Asp Tyr Ile Arg Val His Leu Glu Pro Leu Asp His 530 535 540 Lys Lys Glu Leu Ala Asn Ser Ser Ser Asp Asp Glu Asp Phe Phe Ala 545 550 555 560 Ser Leu Lys Pro Thr Thr His Glu Ala Ser Lys Glu Leu Asp Gly Tyr 565 570 575 Leu Ala Cys Val Ser Asp Thr Arg Glu Ser Leu Leu Thr Phe Pro Ala 580 585 590 Ile Cys Ser Leu Ser Ile Lys Thr Asn Thr Pro Leu Pro Ala Ser Ala 595 600 605 Ala Cys Glu Arg Leu Phe Ser Thr Ala Gly Leu Leu Phe Ser Pro Lys 610 615 620 Arg Ala Arg Leu Asp Thr Asn Asn Phe Glu Asn Gln Leu Leu Leu Lys 625 630 635 640 Leu Asn Leu Arg Phe Tyr Asn Phe Glu 645 <210> 58 <211> 648 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 58 Glu Glu Val Cys Asp Ser Ser Ala Ala Ala Ser Ser Thr Val Gln Asn 1 5 10 15 Gln Pro Gln Asp Gln Glu His Pro Trp Pro Tyr Leu Arg Glu Phe Phe 20 25 30 Ser Leu Ser Gly Val Asn Lys Asp Ser Phe Lys Met Lys Cys Val Leu 35 40 45 Cys Leu Pro Leu Asn Lys Glu Ile Ser Ala Phe Lys Ser Ser Pro Ser 50 55 60 Asn Leu Arg Lys His Ile Glu Arg Met His Pro Asn Tyr Leu Lys Asn 65 70 75 80 Tyr Ser Lys Leu Thr Ala Gln Lys Arg Lys Ile Gly Thr Ser Thr His 85 90 95 Ala Ser Ser Ser Lys Gln Leu Lys Val Asp Ser Val Phe Pro Val Lys 100 105 110 His Val Ser Pro Val Thr Val Asn Lys Ala Ile Leu Arg Tyr Ile Ile 115 120 125 Gln Gly Leu His Pro Phe Ser Thr Val Asp Leu Pro Ser Phe Lys Glu 130 135 140 Leu Ile Ser Thr Leu Gln Pro Gly Ile Ser Val Ile Thr Arg Pro Thr 145 150 155 160 Leu Arg Ser Lys Ile Ala Glu Ala Ala Leu Ile Met Lys Gln Lys Val 165 170 175 Thr Ala Ala Met Ser Glu Val Glu Trp Ile Ala Thr Thr Thr Asp Cys 180 185 190 Trp Thr Ala Arg Arg Lys Ser Phe Ile Gly Val Thr Ala His Trp Ile 195 200 205 Asn Pro Gly Ser Leu Glu Arg His Ser Ala Ala Leu Ala Cys Lys Arg 210 215 220 Leu Met Gly Ser His Thr Phe Glu Val Leu Ala Ser Ala Met Asn Asp 225 230 235 240 Ile His Ser Glu Tyr Glu Ile Arg Asp Lys Val Val Cys Thr Thr Thr 245 250 255 Asp Ser Gly Ser Asn Phe Met Lys Ala Phe Arg Val Phe Gly Val Glu 260 265 270 Asn Asn Asp Ile Glu Thr Glu Ala Arg Arg Cys Glu Ser Asp Asp Thr 275 280 285 Asp Ser Glu Gly Cys Gly Glu Gly Ser Asp Gly Val Glu Phe Gln Asp 290 295 300 Ala Ser Arg Val Leu Asp Gln Asp Asp Gly Phe Glu Phe Gln Leu Pro 305 310 315 320 Lys His Gln Lys Cys Ala Cys His Leu Leu Asn Leu Val Ser Ser Val 325 330 335 Asp Ala Gln Lys Ala Leu Ser Asn Glu His Tyr Lys Lys Leu Tyr Arg 340 345 350 Ser Val Phe Gly Lys Cys Gln Ala Leu Trp Asn Lys Ser Ser Arg Ser 355 360 365 Ala Leu Ala Ala Glu Ala Val Glu Ser Glu Ser Arg Leu Gln Leu Leu 370 375 380 Arg Pro Asn Gln Thr Arg Trp Asn Ser Thr Phe Met Ala Val Asp Arg 385 390 395 400 Ile Leu Gln Ile Cys Lys Glu Ala Gly Glu Gly Ala Leu Arg Asn Ile 405 410 415 Cys Thr Ser Leu Glu Val Pro Met Phe Asn Pro Ala Glu Met Leu Phe 420 425 430 Leu Thr Glu Trp Ala Asn Thr Met Arg Pro Val Ala Lys Val Leu Asp 435 440 445 Ile Leu Gln Ala Glu Thr Asn Thr Gln Leu Gly Trp Leu Leu Pro Ser 450 455 460 Val His Gln Leu Ser Leu Lys Leu Gln Arg Leu His His Ser Leu Arg 465 470 475 480 Tyr Cys Asp Pro Leu Val Asp Ala Leu Gln Gln Gly Ile Gln Thr Arg 485 490 495 Phe Lys His Met Phe Glu Asp Pro Glu Ile Ile Ala Ala Ala Ile Leu 500 505 510 Leu Pro Lys Phe Arg Thr Ser Trp Thr Asn Asp Glu Thr Ile Ile Lys 515 520 525 Arg Gly Met Asp Tyr Ile Arg Val His Leu Glu Pro Leu Asp His Lys 530 535 540 Lys Glu Leu Ala Asn Ser Ser Ser Asp Asp Glu Asp Phe Phe Ala Ser 545 550 555 560 Leu Lys Pro Thr Thr His Glu Ala Ser Lys Glu Leu Asp Gly Tyr Leu 565 570 575 Ala Cys Val Ser Asp Thr Arg Glu Ser Leu Leu Thr Phe Pro Ala Ile 580 585 590 Cys Ser Leu Ser Ile Lys Thr Asn Thr Pro Leu Pro Ala Ser Ala Ala 595 600 605 Cys Glu Arg Leu Phe Ser Thr Ala Gly Leu Leu Phe Ser Pro Lys Arg 610 615 620 Ala Arg Leu Asp Thr Asn Asn Phe Glu Asn Gln Leu Leu Leu Lys Leu 625 630 635 640 Asn Leu Arg Phe Tyr Asn Phe Glu 645 <210> 59 <211> 636 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 59 Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln 1 5 10 15 Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr 20 25 30 Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr 35 40 45 Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe 50 55 60 Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys 65 70 75 80 Glu Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg 85 90 95 His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe 100 105 110 Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg 115 120 125 Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val 130 135 140 Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys 145 150 155 160 Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu 165 170 175 Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Asp Thr Thr Ile 180 185 190 Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val 195 200 205 Asn Arg Leu Glu Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu 210 215 220 Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr 225 230 235 240 Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu 245 250 255 Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr 260 265 270 Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr 275 280 285 Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg 290 295 300 Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His 305 310 315 320 Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val 325 330 335 Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu 340 345 350 Asn Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His 355 360 365 Lys Asn Leu Leu Leu His Thr Glu Val Arg Trp Leu Ser Arg Gly Lys 370 375 380 Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe 385 390 395 400 Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln 405 410 415 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 420 425 430 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg 435 440 445 Ile Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr 450 455 460 Lys Asn Asn Thr Glu Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr 465 470 475 480 Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His 485 490 495 Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys 500 505 510 Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val 515 520 525 Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr 530 535 540 Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe 545 550 555 560 Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val 565 570 575 Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe 580 585 590 Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala 595 600 605 Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp 610 615 620 Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 60 <211> 635 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 60 Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln Glu 1 5 10 15 Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr Leu 20 25 30 Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr Ser 35 40 45 Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe Thr 50 55 60 Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys Glu 65 70 75 80 Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg His 85 90 95 Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe Lys 100 105 110 Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg Tyr 115 120 125 Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val Ser 130 135 140 Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys Leu 145 150 155 160 Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu Lys 165 170 175 Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Asp Thr Thr Ile Ser 180 185 190 Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val Asn 195 200 205 Arg Leu Glu Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu Ser 210 215 220 Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr Ile 225 230 235 240 His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu Pro 245 250 255 Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr Phe 260 265 270 Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr Asp 275 280 285 Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg Ile 290 295 300 Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His Arg 305 310 315 320 His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val Leu 325 330 335 Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu Asn 340 345 350 Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His Lys 355 360 365 Asn Leu Leu Leu His Thr Glu Val Arg Trp Leu Ser Arg Gly Lys Val 370 375 380 Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe Asn 385 390 395 400 Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln Asn 405 410 415 Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn Leu 420 425 430 Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg Ile 435 440 445 Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr Lys 450 455 460 Asn Asn Thr Glu Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr Ser 465 470 475 480 Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His Leu 485 490 495 Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys Asn 500 505 510 Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val Asp 515 520 525 Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr Asp 530 535 540 Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe Trp 545 550 555 560 Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val Lys 565 570 575 Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe Ser 580 585 590 Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala Glu 595 600 605 Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp Asn 610 615 620 Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 61 <211> 239 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 61 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys 225 230 235 <210> 62 <211> 238 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 62 Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val 1 5 10 15 Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu 20 25 30 Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys 35 40 45 Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu 50 55 60 Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln 65 70 75 80 His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg 85 90 95 Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val 100 105 110 Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile 115 120 125 Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn 130 135 140 Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly 145 150 155 160 Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val 165 170 175 Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro 180 185 190 Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser 195 200 205 Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val 210 215 220 Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys 225 230 235 <210> 63 <211> 717 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 63 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgtga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaag 717 <210> 64 <211> 714 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 64 gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60 gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120 aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180 gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag 240 cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300 aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360 aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420 ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc 480 atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540 cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600 ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgtgatca catggtcctg 660 ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caag 714 <210> 65 <211> 550 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 65 Met Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro Phe Tyr Pro 1 5 10 15 Leu Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala Met Lys Arg 20 25 30 Tyr Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala His Ile Glu 35 40 45 Val Asp Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val Arg Leu Ala 50 55 60 Glu Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg Ile Val Val 65 70 75 80 Cys Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu Gly Ala Leu 85 90 95 Phe Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr Asn Glu Arg 100 105 110 Glu Leu Leu Asn Ser Met Gly Ile Ser Gln Pro Thr Val Val Phe Val 115 120 125 Ser Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys Lys Leu Pro 130 135 140 Ile Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp Tyr Gln Gly 145 150 155 160 Phe Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro Pro Gly Phe 165 170 175 Asn Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp Lys Thr Ile 180 185 190 Ala Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro Lys Gly Val 195 200 205 Ala Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His Ala Arg Asp 210 215 220 Pro Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile Leu Ser Val 225 230 235 240 Val Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu Gly Tyr Leu 245 250 255 Ile Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu Glu Glu Leu 260 265 270 Phe Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala Leu Leu Val 275 280 285 Pro Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile Asp Lys Tyr 290 295 300 Asp Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala Pro Leu Ser 305 310 315 320 Lys Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu Pro Gly Ile 325 330 335 Arg Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu Ile Thr 340 345 350 Pro Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val Pro Phe 355 360 365 Phe Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu Gly Val 370 375 380 Asn Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met Ser Gly 385 390 395 400 Tyr Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys Asp Gly 405 410 415 Trp Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp Glu His Phe 420 425 430 Phe Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys Gly Tyr Gln 435 440 445 Val Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His Pro Asn Ile 450 455 460 Phe Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala Gly Glu Leu 465 470 475 480 Pro Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met Thr Glu Lys 485 490 495 Glu Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala Lys Lys Leu 500 505 510 Arg Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly Leu Thr Gly 515 520 525 Lys Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys Ala Lys Lys 530 535 540 Gly Gly Lys Ile Ala Val 545 550 <210> 66 <211> 549 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 66 Glu Asp Ala Lys Asn Ile Lys Lys Gly Pro Ala Pro Phe Tyr Pro Leu 1 5 10 15 Glu Asp Gly Thr Ala Gly Glu Gln Leu His Lys Ala Met Lys Arg Tyr 20 25 30 Ala Leu Val Pro Gly Thr Ile Ala Phe Thr Asp Ala His Ile Glu Val 35 40 45 Asp Ile Thr Tyr Ala Glu Tyr Phe Glu Met Ser Val Arg Leu Ala Glu 50 55 60 Ala Met Lys Arg Tyr Gly Leu Asn Thr Asn His Arg Ile Val Val Cys 65 70 75 80 Ser Glu Asn Ser Leu Gln Phe Phe Met Pro Val Leu Gly Ala Leu Phe 85 90 95 Ile Gly Val Ala Val Ala Pro Ala Asn Asp Ile Tyr Asn Glu Arg Glu 100 105 110 Leu Leu Asn Ser Met Gly Ile Ser Gln Pro Thr Val Val Phe Val Ser 115 120 125 Lys Lys Gly Leu Gln Lys Ile Leu Asn Val Gln Lys Lys Leu Pro Ile 130 135 140 Ile Gln Lys Ile Ile Ile Met Asp Ser Lys Thr Asp Tyr Gln Gly Phe 145 150 155 160 Gln Ser Met Tyr Thr Phe Val Thr Ser His Leu Pro Pro Gly Phe Asn 165 170 175 Glu Tyr Asp Phe Val Pro Glu Ser Phe Asp Arg Asp Lys Thr Ile Ala 180 185 190 Leu Ile Met Asn Ser Ser Gly Ser Thr Gly Leu Pro Lys Gly Val Ala 195 200 205 Leu Pro His Arg Thr Ala Cys Val Arg Phe Ser His Ala Arg Asp Pro 210 215 220 Ile Phe Gly Asn Gln Ile Ile Pro Asp Thr Ala Ile Leu Ser Val Val 225 230 235 240 Pro Phe His His Gly Phe Gly Met Phe Thr Thr Leu Gly Tyr Leu Ile 245 250 255 Cys Gly Phe Arg Val Val Leu Met Tyr Arg Phe Glu Glu Glu Leu Phe 260 265 270 Leu Arg Ser Leu Gln Asp Tyr Lys Ile Gln Ser Ala Leu Leu Val Pro 275 280 285 Thr Leu Phe Ser Phe Phe Ala Lys Ser Thr Leu Ile Asp Lys Tyr Asp 290 295 300 Leu Ser Asn Leu His Glu Ile Ala Ser Gly Gly Ala Pro Leu Ser Lys 305 310 315 320 Glu Val Gly Glu Ala Val Ala Lys Arg Phe His Leu Pro Gly Ile Arg 325 330 335 Gln Gly Tyr Gly Leu Thr Glu Thr Thr Ser Ala Ile Leu Ile Thr Pro 340 345 350 Glu Gly Asp Asp Lys Pro Gly Ala Val Gly Lys Val Val Pro Phe Phe 355 360 365 Glu Ala Lys Val Val Asp Leu Asp Thr Gly Lys Thr Leu Gly Val Asn 370 375 380 Gln Arg Gly Glu Leu Cys Val Arg Gly Pro Met Ile Met Ser Gly Tyr 385 390 395 400 Val Asn Asn Pro Glu Ala Thr Asn Ala Leu Ile Asp Lys Asp Gly Trp 405 410 415 Leu His Ser Gly Asp Ile Ala Tyr Trp Asp Glu Asp Glu His Phe Phe 420 425 430 Ile Val Asp Arg Leu Lys Ser Leu Ile Lys Tyr Lys Gly Tyr Gln Val 435 440 445 Ala Pro Ala Glu Leu Glu Ser Ile Leu Leu Gln His Pro Asn Ile Phe 450 455 460 Asp Ala Gly Val Ala Gly Leu Pro Asp Asp Asp Ala Gly Glu Leu Pro 465 470 475 480 Ala Ala Val Val Val Leu Glu His Gly Lys Thr Met Thr Glu Lys Glu 485 490 495 Ile Val Asp Tyr Val Ala Ser Gln Val Thr Thr Ala Lys Lys Leu Arg 500 505 510 Gly Gly Val Val Phe Val Asp Glu Val Pro Lys Gly Leu Thr Gly Lys 515 520 525 Leu Asp Ala Arg Lys Ile Arg Glu Ile Leu Ile Lys Ala Lys Lys Gly 530 535 540 Gly Lys Ile Ala Val 545 <210> 67 <211> 1650 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 67 atggaagatg ccaaaaacat taagaagggc ccagcgccat tctacccact cgaagacggg 60 accgccggcg agcagctgca caaagccatg aagcgctacg ccctggtgcc cggcaccatc 120 gcctttaccg acgcacatat cgaggtggac attacctacg ccgagtactt cgagatgagc 180 gttcggctgg cagaagctat gaagcgctat gggctgaata caaaccatcg gatcgtggtg 240 tgcagcgaga atagcttgca gttcttcatg cccgtgttgg gtgccctgtt catcggtgtg 300 gctgtggccc cagctaacga catctacaac gagcgcgagc tgctgaacag catgggcatc 360 agccagccca ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa 420 aagaagctac cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc 480 ttccaaagca tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac 540 ttcgtgcccg agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc 600 agtaccggat tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt 660 catgcccgcg accccatctt cggcaaccag atcatccccg acaccgctat cctcagcgtg 720 gtgccatttc accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt 780 cgggtcgtgc tcatgtaccg cttcgaggag gagctattct tgcgcagctt gcaagactat 840 aagattcaat ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc 900 atcgacaagt acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc 960 aaggaggtag gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac 1020 ggcctgacag aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc 1080 gcagtaggca aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag 1140 acactgggtg tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc 1200 tacgttaaca accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc 1260 ggcgacatcg cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc 1320 ctgatcaaat acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa 1380 caccccaaca tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg 1440 cccgccgcag tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac 1500 tatgtggcca gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac 1560 gaggtgccta aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt 1620 aaggccaaga agggcggcaa gatcgccgtg 1650 <210> 68 <211> 1647 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 68 gaagatgcca aaaacattaa gaagggccca gcgccattct acccactcga agacgggacc 60 gccggcgagc agctgcacaa agccatgaag cgctacgccc tggtgcccgg caccatcgcc 120 tttaccgacg cacatatcga ggtggacatt acctacgccg agtacttcga gatgagcgtt 180 cggctggcag aagctatgaa gcgctatggg ctgaatacaa accatcggat cgtggtgtgc 240 agcgagaata gcttgcagtt cttcatgccc gtgttgggtg ccctgttcat cggtgtggct 300 gtggccccag ctaacgacat ctacaacgag cgcgagctgc tgaacagcat gggcatcagc 360 cagcccaccg tcgtattcgt gagcaagaaa gggctgcaaa agatcctcaa cgtgcaaaag 420 aagctaccga tcatacaaaa gatcatcatc atggatagca agaccgacta ccagggcttc 480 caaagcatgt acaccttcgt gacttcccat ttgccacccg gcttcaacga gtacgacttc 540 gtgcccgaga gcttcgaccg ggacaaaacc atcgccctga tcatgaacag tagtggcagt 600 accggattgc ccaagggcgt agccctaccg caccgcaccg cttgtgtccg attcagtcat 660 gcccgcgacc ccatcttcgg caaccagatc atccccgaca ccgctatcct cagcgtggtg 720 ccatttcacc acggcttcgg catgttcacc acgctgggct acttgatctg cggctttcgg 780 gtcgtgctca tgtaccgctt cgaggaggag ctattcttgc gcagcttgca agactataag 840 attcaatctg ccctgctggt gcccacacta tttagcttct tcgctaagag cactctcatc 900 gacaagtacg acctaagcaa cttgcacgag atcgccagcg gcggggcgcc gctcagcaag 960 gaggtaggtg aggccgtggc caaacgcttc cacctaccag gcatccgcca gggctacggc 1020 ctgacagaaa caaccagcgc cattctgatc acccccgaag gggacgacaa gcctggcgca 1080 gtaggcaagg tggtgccctt cttcgaggct aaggtggtgg acttggacac cggtaagaca 1140 ctgggtgtga accagcgcgg cgagctgtgc gtccgtggcc ccatgatcat gagcggctac 1200 gttaacaacc ccgaggctac aaacgctctc atcgacaagg acggctggct gcacagcggc 1260 gacatcgcct actgggacga ggacgagcac ttcttcatcg tggaccggct gaagagcctg 1320 atcaaataca agggctacca ggtagcccca gccgaactgg agagcatcct gctgcaacac 1380 cccaacatct tcgacgccgg ggtcgccggc ctgcccgacg acgatgccgg cgagctgccc 1440 gccgcagtcg tcgtgctgga acacggtaaa accatgaccg agaaggagat cgtggactat 1500 gtggccagcc aggttacaac cgccaagaag ctgcgcggtg gtgttgtgtt cgtggacgag 1560 gtgcctaaag gactgaccgg caagttggac gcccgcaaga tccgcgagat tctcattaag 1620 gccaagaagg gcggcaagat cgccgtg 1647 <210> 69 <211> 869 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 69 tgtacattta tattggctca tgtccaatat gaccgccatg ttggcattga ttattgacta 60 gttattaata gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg 120 ttacataact tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga 180 cgtcaataat gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat 240 gggtggagta tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa 300 gtccgccccc tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca 360 tgaccttacg ggactttcct acttggcagt acatctacgt attagtcatc gctattacca 420 tggtgatgcg gttttggcag tacaccaatg ggcgtggata gcggtttgac tcacggggat 480 ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg 540 actttccaaa atgtcgtaat aaccccgccc cgttgacgca aatgggcggt aggcgtgtac 600 ggtgggaggt ctatataagc agaggtcgtt tagtgaaccg tcagatcact agtagcttta 660 ttgcggtagt ttatcacagt taaattgcta acgcagtcag tgctcgactg atcacaggta 720 agtatcaagg ttacaagaca ggtttaagga ggccaataga aactgggctt gtcgagacag 780 agaagattct tgcgtttctg ataggcacct attggtctta ctgacatcca ctttgccttt 840 ctctccacag gggtaccgaa gccgctagc 869 <210> 70 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 70 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggctct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataa 1866 <210> 71 <211> 2214 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 71 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tccgggttac aaatacctcg gacccggcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccgga 480 aaggcgggcc agcagcctgc gaggaagcga ctcaactttg gtcagactgg agacaccgac 540 tccgccgctg acccccagcc tctcggagaa ccaccagcag ccccctctgg tctgggaact 600 ggtacaatgg ctgcaggcgg tggcgctcca atggcagaca ataacgaagg cgccgacgga 660 gtgggtaatg cctcgggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720 accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780 tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840 gggtactttg acttcaaccg cttccactgc cacttctcac cacgtgactg gcaaagactc 900 atcaacaaca actggggatt ccggcccaag agactcaact tcaagctctt caacatccag 960 gtcaaggagg tcacgcagaa tgaaggcacc aagaccatcg ccaataacct taccagcacg 1020 gttcaggtgt ttactgactc ggagtaccag ctgccgtacg ttctcggctc tgcccaccag 1080 ggctgcctgc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140 ctcaacaatg gcagccaggc gatgggtcgc tcgtccttct actgcctgga gtactttccg 1200 tcgcagatgc tgagaaccgg caacaacttc cagtttactt acaccttcga ggacgtgcct 1260 ttccacagca gctacgctca cagccagagt ttggatcgct tgatgaatcc tcttattgat 1320 cagtatctgt actacctgaa cagaacgcaa ggaacaacct ctggaacaac caaccaatca 1380 cggctgcttt ttagccaggc tgggcctcag tctatgtctt tgcaggccag aaattggcta 1440 cctgggccct gctaccggca acagagactt tcaaagactg ctaacgacaa caacaacagt 1500 aactttcctt ggacagcggc cagcaaatat catctcaatg gccgcgactc gctggtgaat 1560 ccaggaccag ctatggccag tcacaaggac gatgaagaaa aatttttccc tatgcacggc 1620 aatctaatat ttggcaaaga agggacaacg gcaagtaacg cagaattaga taatgtaatg 1680 attacggatg aagaagagat tcgtaccacc aatcctgtgg caacagagca gtatggaact 1740 gtggcaaata acttgcagag ctcaaataca gctcccacga ctagaactgt caatgatcag 1800 ggggccttac ctggcatggt gtggcaagat cgtgacgtgt accttcaagg acctatctgg 1860 gcaaagattc ctcacacgga tggacacttt catccttctc ctctgatggg cggctttggc 1920 ctgaaacatc ctccgcctca gatcctgatc aagaacacgc ctgtacctgc ggatcctcca 1980 acggccttca acaaggacaa gctgaactct ttcatcaccc agtattctac tggccaagtc 2040 agcgtggaga tcgagtggga gctgcagaag gaaaacagca agcgctggaa ccccgagatc 2100 cagtacacct ccaactacta caaatctaca agtgtggact ttgctgttaa tacagaaggc 2160 gtgtactctg aaccccgccc cattggcacc cgttacctca cccgtaatct gtaa 2214 <210> 72 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 72 atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataa 1866 <210> 73 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 73 atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggctccg 420 ggaaaaaaga ggccggtaga gcactctcct gtggagccag actcctcctc gggaaccggc 480 aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540 tcagtcccag accctcaacc tctcggagaa ccaccagcag ccccctctgg tctgggaact 600 aatacgatgg ctacaggcag tggcgcacca atggcagaca ataacgaggg tgccgatgga 660 gtgggtaatt cctcaggaaa ttggcattgc gattcccaat ggctgggcga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca accatctcta caagcaaatc 780 tccagccaat caggagcttc aaacgacaac cactactttg gctacagcac cccttggggg 840 tattttgact ttaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatt 900 aacaacaact ggggattccg gcccaagaaa ctcagcttca agctcttcaa catccaagtt 960 aaagaggtca cgcagaacga tggcacgacg actattgcca ataaccttac cagcacggtt 1020 caagtgttta ctgactcgga gtaccagctc ccgtacgtcc tcggctcggc gcatcaagga 1080 tgcctcccgc cgttcccagc agacgtcttc atggtgccac agtatggata cctcaccctg 1140 aacaacggga gtcaggcagt aggacgctct tcattttact gcctggagta ctttccttct 1200 cagatgctgc gtaccggaaa caactttacc ttcagctaca cttttgagga cgttcctttc 1260 cacagcagct acgctcacag ccagagtctg gaccgtctca tgaatcctct catcgaccag 1320 tacctgtatt acttgagcag aacaaacact ccaagtggaa ccaccacgca gtcaaggctt 1380 cagttttctc aggccggagc gagtgacatt cgggaccagt ctaggaactg gcttcctgga 1440 ccctgttacc gccagcagcg agtatcaaag acatctgcgg ataacaacaa cagtgaatac 1500 tcgtgggctg gagctaccaa gtaccacctc aatggcagag actctctggt gaatccgggc 1560 ccggccatgg caagccacaa ggacgatgaa gaaaagtttt ttcctcagag cggggttctc 1620 atctttggga agcaaggctc agagaaaaca aatgtggaca ttgaaaaggt catgattaca 1680 gacgaagagg aaatcaggac aaccaatccc gtggctacgg agcagtatgg ttctgtatct 1740 accaacctcc agagaggcaa cagacaagca gctaccgcag atgtcgacac acaaggcgtt 1800 cttccaggca tggtatggca ggacagagat gtgtaccttc agggacccat ctgggcaaag 1860 attccacaca cggacggaca ttttcacccc tctcccctca tgggtggatt cggacttaaa 1920 caccctcctc cacagattct catcaagaac accccggtac ctgcgaatcc ttcgaccacc 1980 ttcagtgcgg caaagtttgc ttccttcatc acacagtact caacgggaca ggtcagcgtg 2040 gagatcgagt gggagctgca gaaggaaaac agcaaacgct ggaatcccga aattcagtac 2100 acttccaact acaacaagtc tgttaatgtg gactttactg tggacactaa tggcgtgtat 2160 tcagagcctc gccccattgg caccagatac ctgactcgta atctgtaa 2208 <210> 74 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 74 atgatttaaa tcaggt 16 <210> 75 <211> 5336 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 75 ggtacccaac tccatgctta acagtcccca ggtacagccc accctgcgtc gcaaccagga 60 acagctctac agcttcctgg agcgccactc gccctacttc cgcagccaca gtgcgcagat 120 taggagcgcc acttcttttt gtcacttgaa aaacatgtaa aaataatgta ctaggagaca 180 ctttcaataa aggcaaatgt ttttatttgt acactctcgg gtgattattt accccccacc 240 cttgccgtct gcgccgttta aaaatcaaag gggttctgcc gcgcatcgct atgcgccact 300 ggcagggaca cgttgcgata ctggtgttta gtgctccact taaactcagg cacaaccatc 360 cgcggcagct cggtgaagtt ttcactccac aggctgcgca ccatcaccaa cgcgtttagc 420 aggtcgggcg ccgatatctt gaagtcgcag ttggggcctc cgccctgcgc gcgcgagttg 480 cgatacacag ggttgcagca ctggaacact atcagcgccg ggtggtgcac gctggccagc 540 acgctcttgt cggagatcag atccgcgtcc aggtcctccg cgttgctcag ggcgaacgga 600 gtcaactttg gtagctgcct tcccaaaaag ggtgcatgcc caggctttga gttgcactcg 660 caccgtagtg gcatcagaag gtgaccgtgc ccggtctggg cgttaggata cagcgcctgc 720 atgaaagcct tgatctgctt aaaagccacc tgagcctttg cgccttcaga gaagaacatg 780 ccgcaagact tgccggaaaa ctgattggcc ggacaggccg cgtcatgcac gcagcacctt 840 gcgtcggtgt tggagatctg caccacattt cggccccacc ggttcttcac gatcttggcc 900 ttgctagact gctccttcag cgcgcgctgc ccgttttcgc tcgtcacatc catttcaatc 960 acgtgctcct tatttatcat aatgctcccg tgtagacact taagctcgcc ttcgatctca 1020 gcgcagcggt gcagccacaa cgcgcagccc gtgggctcgt ggtgcttgta ggttacctct 1080 gcaaacgact gcaggtacgc ctgcaggaat cgccccatca tcgtcacaaa ggtcttgttg 1140 ctggtgaagg tcagctgcaa cccgcggtgc tcctcgttta gccaggtctt gcatacggcc 1200 gccagagctt ccacttggtc aggcagtagc ttgaagtttg cctttagatc gttatccacg 1260 tggtacttgt ccatcaacgc gcgcgcagcc tccatgccct tctcccacgc agacacgatc 1320 ggcaggctca gcgggtttat caccgtgctt tcactttccg cttcactgga ctcttccttt 1380 tcctcttgcg tccgcatacc ccgcgccact gggtcgtctt cattcagccg ccgcaccgtg 1440 cgcttacctc ccttgccgtg cttgattagc accggtgggt tgctgaaacc caccatttgt 1500 agcgccacat cttctctttc ttcctcgctg tccacgatca cctctgggga tggcgggcgc 1560 tcgggcttgg gagaggggcg cttctttttc tttttggacg caatggccaa atccgccgtc 1620 gaggtcgatg gccgcgggct gggtgtgcgc ggcaccagcg catcttgtga cgagtcttct 1680 tcgtcctcgg actcgagacg ccgcctcagc cgcttttttg ggggcgcgcg gggaggcggc 1740 ggcgacggcg acggggacga cacgtcctcc atggttggtg gacgtcgcgc cgcaccgcgt 1800 ccgcgctcgg gggtggtttc gcgctgctcc tcttcccgac tggccatttc cttctcctat 1860 aggcagaaaa agatcatgga gtcagtcgag aaggaggaca gcctaaccgc cccctttgag 1920 ttcgccacca ccgcctccac cgatgccgcc aacgcgccta ccaccttccc cgtcgaggca 1980 cccccgcttg aggaggagga agtgattatc gagcaggacc caggttttgt aagcgaagac 2040 gacgaggatc gctcagtacc aacagaggat aaaaagcaag accaggacga cgcagaggca 2100 aacgaggaac aagtcgggcg gggggaccaa aggcatggcg actacctaga tgtgggagac 2160 gacgtgctgt tgaagcatct gcagcgccag tgcgccatta tctgcgacgc gttgcaagag 2220 cgcagcgatg tgcccctcgc catagcggat gtcagccttg cctacgaacg ccacctgttc 2280 tcaccgcgcg taccccccaa acgccaagaa aacggcacat gcgagcccaa cccgcgcctc 2340 aacttctacc ccgtatttgc cgtgccagag gtgcttgcca cctatcacat ctttttccaa 2400 aactgcaaga tacccctatc ctgccgtgcc aaccgcagcc gagcggacaa gcagctggcc 2460 ttgcggcagg gcgctgtcat acctgatatc gcctcgctcg acgaagtgcc aaaaatcttt 2520 gagggtcttg gacgcgacga gaaacgcgcg gcaaacgctc tgcaacaaga aaacagcgaa 2580 aatgaaagtc actgtggagt gctggtggaa cttgagggtg acaacgcgcg cctagccgtg 2640 ctgaaacgca gcatcgaggt cacccacttt gcctacccgg cacttaacct accccccaag 2700 gttatgagca cagtcatgag cgagctgatc gtgcgccgtg cacgacccct ggagagggat 2760 gcaaacttgc aagaacaaac cgaggagggc ctacccgcag ttggcgatga gcagctggcg 2820 cgctggcttg agacgcgcga gcctgccgac ttggaggagc gacgcaagct aatgatggcc 2880 gcagtgcttg ttaccgtgga gcttgagtgc atgcagcggt tctttgctga cccggagatg 2940 cagcgcaagc tagaggaaac gttgcactac acctttcgcc agggctacgt gcgccaggcc 3000 tgcaaaattt ccaacgtgga gctctgcaac ctggtctcct accttggaat tttgcacgaa 3060 aaccgcctcg ggcaaaacgt gcttcattcc acgctcaagg gcgaggcgcg ccgcgactac 3120 gtccgcgact gcgtttactt atttctgtgc tacacctggc aaacggccat gggcgtgtgg 3180 cagcaatgcc tggaggagcg caacctaaag gagctgcaga agctgctaaa gcaaaacttg 3240 aaggacctat ggacggcctt caacgagcgc tccgtggccg cgcacctggc ggacattatc 3300 ttccccgaac gcctgcttaa aaccctgcaa cagggtctgc cagacttcac cagtcaaagc 3360 atgttgcaaa actttaggaa ctttatccta gagcgttcag gaattctgcc cgccacctgc 3420 tgtgcgcttc ctagcgactt tgtgcccatt aagtaccgtg aatgccctcc gccgctttgg 3480 ggtcactgct accttctgca gctagccaac taccttgcct accactccga catcatggaa 3540 gacgtgagcg gtgacggcct actggagtgt cactgtcgct gcaacctatg caccccgcac 3600 cgctccctgg tctgcaattc gcaactgctt agcgaaagtc aaattatcgg tacctttgag 3660 ctgcagggtc cctcgcctga cgaaaagtcc gcggctccgg ggttgaaact cactccgggg 3720 ctgtggacgt cggcttacct tcgcaaattt gtacctgagg actaccacgc ccacgagatt 3780 aggttctacg aagaccaatc ccgcccgcca aatgcggagc ttaccgcctg cgtcattacc 3840 cagggccaca tccttggcca attgcaagcc atcaacaaag cccgccaaga gtttctgcta 3900 cgaaagggac ggggggttta cctggacccc cagtccggcg aggagctcaa cccaatcccc 3960 ccgccgccgc agccctatca gcagccgcgg gcccttgctt cccaggatgg cacccaaaaa 4020 gaagctgcag ctgccgccgc cgccacccac ggacgaggag gaatactggg acagtcaggc 4080 agaggaggtt ttggacgagg aggaggagat gatggaagac tgggacagcc tagacgaagc 4140 ttccgaggcc gaagaggtgt cagacgaaac accgtcaccc tcggtcgcat tcccctcgcc 4200 ggcgccccag aaattggcaa ccgttcccag catcgctaca acctccgctc ctcaggcgcc 4260 gccggcactg cctgttcgcc gacccaaccg tagatgggac accactggaa ccagggccgg 4320 taagtctaag cagccgccgc cgttagccca agagcaacaa cagcgccaag gctaccgctc 4380 gtggcgcggg cacaagaacg ccatagttgc ttgcttgcaa gactgtgggg gcaacatctc 4440 cttcgcccgc cgctttcttc tctaccatca cggcgtggcc ttcccccgta acatcctgca 4500 ttactaccgt catctctaca gcccctactg caccggcggc agcggcagcg gcagcaacag 4560 cagcggtcac acagaagcaa aggcgaccgg atagcaagac tctgacaaag cccaagaaat 4620 ccacagcggc ggcagcagca ggaggaggag cgctgcgtct ggcgcccaac gaacccgtat 4680 cgacccgcga gcttagaaat aggatttttc ccactctgta tgctatattt caacaaagca 4740 ggggccaaga acaagagctg aaaataaaaa acaggtctct gcgctccctc acccgcagct 4800 gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct ggaagacgcg gaggctctct 4860 tcagcaaata ctgcgcgctg actcttaagg actagtttcg cgccctttct caaatttaag 4920 cgcgaaaact acgtcatctc cagcggccac acccggcgcc agcacctgtc gtcagcgcca 4980 ttatgagcaa ggaaattccc acgccctaca tgtggagtta ccagccacaa atgggacttg 5040 cggctggagc tgcccaagac tactcaaccc gaataaacta catgagcgcg ggaccccaca 5100 tgatatcccg ggtcaacgga atccgcgccc accgaaaccg aattctcctc gaacaggcgg 5160 ctattaccac cacacctcgt aataacctta atccccgtag ttggcccgct gccctggtgt 5220 accaggaaag tcccgctccc accactgtgg tacttcccag agacgcccag gccgaagttc 5280 agatgactaa ctcaggggcg cagcttgcgg gcggctttcg tcacagggtg cggtcg 5336 <210> 76 <211> 3944 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 76 cccgggcgtt ttagggcgga gtaacttgca tgtattggga attgtagttt ttttaaaatg 60 ggaagtgacg tatcgtggga aaacggaagt gaagatttga ggaagttgtg ggttttttgg 120 ctttcgtttc tgggcgtagg ttcgcgtgcg gttttctggg tgttttttgt ggactttaac 180 cgttacgtca ttttttagtc ctatatatac tcgctctgta cttggccctt tttacactgt 240 gactgattga gctggtgccg tgtcgagtgg tgttttttaa taggtttttt tactggtaag 300 gctgactgtt atggctgccg ctgtggaagc gctgtatgtt gttctggagc gggagggtgc 360 tattttgcct aggcaggagg gtttttcagg tgtttatgtg tttttctctc ctattaattt 420 tgttatacct cctatggggg ctgtaatgtt gtctctacgc ctgcgggtat gtattccccc 480 gggctatttc ggtcgctttt tagcactgac cgatgttaac caacctgatg tgtttaccga 540 gtcttacatt atgactccgg acatgaccga ggaactgtcg gtggtgcttt ttaatcacgg 600 tgaccagttt ttttacggtc acgccggcat ggccgtagtc cgtcttatgc ttataagggt 660 tgtttttcct gttgtaagac aggcttctaa tgtttaaatg tttttttttt tgttatttta 720 ttttgtgttt aatgcaggaa cccgcagaca tgtttgagag aaaaatggtg tctttttctg 780 tggtggttcc ggaacttacc tgcctttatc tgcatgagca tgactacgat gtgcttgctt 840 ttttgcgcga ggctttgcct gattttttga gcagcacctt gcattttata tcgccgccca 900 tgcaacaagc ttacataggg gctacgctgg ttagcatagc tccgagtatg cgtgtcataa 960 tcagtgtggg ttcttttgtc atggttcctg gcggggaagt ggccgcgctg gtccgtgcag 1020 acctgcacga ttatgttcag ctggccctgc gaagggacct acgggatcgc ggtatttttg 1080 ttaatgttcc gcttttgaat cttatacagg tctgtgagga acctgaattt ttgcaatcat 1140 gattcgctgc ttgaggctga aggtggaggg cgctctggag cagattttta caatggccgg 1200 acttaatatt cgggatttgc ttagagacat attgataagg tggcgagatg aaaattattt 1260 gggcatggtt gaaggtgctg gaatgtttat agaggagatt caccctgaag ggtttagcct 1320 ttacgtccac ttggacgtga gggcagtttg ccttttggaa gccattgtgc aacatcttac 1380 aaatgccatt atctgttctt tggctgtaga gtttgaccac gccaccggag gggagcgcgt 1440 tcacttaata gatcttcatt ttgaggtttt ggataatctt ttggaataaa aaaaaaaaaa 1500 catggttctt ccagctcttc ccgctcctcc cgtgtgtgac tcgcagaacg aatgtgtagg 1560 ttggctgggt gtggcttatt ctgcggtggt ggatgttatc agggcagcgg cgcatgaagg 1620 agtttacata gaacccgaag ccagggggcg cctggatgct ttgagagagt ggatatacta 1680 caactactac acagagcgag ctaagcgacg agaccggaga cgcagatctg tttgtcacgc 1740 ccgcacctgg ttttgcttca ggaaatatga ctacgtccgg cgttccattt ggcatgacac 1800 tacgaccaac acgatctcgg ttgtctcggc gcactccgta cagtagggat cgcctacctc 1860 cttttgagac agagacccgc gctaccatac tggaggatca tccgctgctg cccgaatgta 1920 acactttgac aatgcacaac gtgagttacg tgcgaggtct tccctgcagt gtgggattta 1980 cgctgattca ggaatgggtt gttccctggg atatggttct gacgcgggag gagcttgtaa 2040 tcctgaggaa gtgtatgcac gtgtgcctgt gttgtgccaa cattgatatc atgacgagca 2100 tgatgatcca tggttacgag tcctgggctc tccactgtca ttgttccagt cccggttccc 2160 tgcagtgcat agccggcggg caggttttgg ccagctggtt taggatggtg gtggatggcg 2220 ccatgtttaa tcagaggttt atatggtacc gggaggtggt gaattacaac atgccaaaag 2280 aggtaatgtt tatgtccagc gtgtttatga ggggtcgcca cttaatctac ctgcgcttgt 2340 ggtatgatgg ccacgtgggt tctgtggtcc ccgccatgag ctttggatac agcgccttgc 2400 actgtgggat tttgaacaat attgtggtgc tgtgctgcag ttactgtgct gatttaagtg 2460 agatcagggt gcgctgctgt gcccggagga caaggcgtct catgctgcgg gcggtgcgaa 2520 tcatcgctga ggagaccact gccatgttgt attcctgcag gacggagcgg cggcggcagc 2580 agtttattcg cgcgctgctg cagcaccacc gccctatcct gatgcacgat tatgactcta 2640 cccccatgta ggcgtggact tccccttcgc cgcccgttga gcaaccgcaa gttggacagc 2700 agcctgtggc tcagcagctg gacagcgaca tgaacttaag cgagctgccc ggggagttta 2760 ttaatatcac tgatgagcgt ttggctcgac aggaaaccgt gtggaatata acacctaaga 2820 atatgtctgt tacccatgat atgatgcttt ttaaggccag ccggggagaa aggactgtgt 2880 actctgtgtg ttgggaggga ggtggcaggt tgaatactag ggttctgtga gtttgattaa 2940 ggtacggtga tcaatataag ctatgtggtg gtggggctat actactgaat gaaaaatgac 3000 ttgaaatttt ctgcaattga aaaataaaca cgttgaaaca taacatgcaa caggttcacg 3060 attctttatt cctgggcaat gtaggagaag gtgtaagagt tggtagcaaa agtttcagtg 3120 gtgtattttc cactttccca ggaccatgta aaagacatag agtaagtgct tacctcgcta 3180 gtttctgtgg attcactaga atcgatgtag gatgttgccc ctcctgacgc ggtaggagaa 3240 ggggagggtg ccctgcatgt ctgccgctgc tcttgctctt gccgctgctg aggagggggg 3300 cgcatctgcc gcagcaccgg atgcatctgg gaaaagcaaa aaaggggctc gtccctgttt 3360 ccggaggaat ttgcaagcgg ggtcttgcat gacggggagg caaacccccg ttcgccgcag 3420 tccggccggc ccgagactcg aaccgggggt cctgcgactc aacccttgga aaataaccct 3480 ccggctacag ggagcgagcc acttaatgct ttcgctttcc agcctaaccg cttacgccgc 3540 gcgcggccag tggccaaaaa agctagcgca gcagccgccg cgcctggaag gaagccaaaa 3600 ggagcgctcc cccgttgtct gacgtcgcac acctgggttc gacacgcggg cggtaaccgc 3660 atggatcacg gcggacggcc ggatccgggg ttcgaacccc ggtcgtccgc catgataccc 3720 ttgcgaattt atccaccaga ccacggaaga gtgcccgctt acaggctctc cttttgcacg 3780 gtctagagcg tcaacgactg cgcacgcctc accggccaga gcgtcccgac catggagcac 3840 tttttgccgc tgcgcaacat ctggaaccgc gtccgcgact ttccgcgcgc ctccaccacc 3900 gccgccggca tcacctggat gtccaggtac atctacggat tacg 3944 <210> 77 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 77 cccagggatg tacgtcccta acccgctagg gggcagcacc caggcctgca ctgccgcctg 60 ccggcagggg tccagtc 77 <210> 78 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 78 gactggaccc ctgccggcag gcggcagtgc aggcctgggt gctgccccct agcgggttag 60 ggacgtacat ccctggg 77 <210> 79 <211> 190 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 79 gtgcgggcca ggcccccgag ggccttatcg gccccagagg cgcttgctgt cgggccgggc 60 gctcccggca cgggcgggcg gaggggtggc gcccgcctgg ggaccgcaga ttacaagagc 120 acctcctccc ccaaccccag gaggccccgc tccccaggcc tcggccggcg cggacccctg 180 gttgccccgg 190 <210> 80 <211> 190 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 80 ccggggcaac caggggtccg cgccggccga ggcctgggga gcggggcctc ctggggttgg 60 gggaggaggt gctcttgtaa tctgcggtcc ccaggcgggc gccacccctc cgcccgcccg 120 tgccgggagc gcccggcccg acagcaagcg cctctggggc cgataaggcc ctcgggggcc 180 tggcccgcac 190 <210> 81 <211> 353 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 81 Leu Phe Asn Leu Arg Ile Leu Leu Asn Asn Ala Ala Phe Arg Asn Gly 1 5 10 15 His Asn Phe Met Val Arg Asn Phe Arg Cys Gly Gln Pro Leu Gln Asn 20 25 30 Lys Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe Thr 35 40 45 Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu Lys Phe 50 55 60 Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln Gly Lys Ser 65 70 75 80 Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg Leu Ser Thr 85 90 95 Glu Thr Gly Phe Ala Leu Leu Gly Gly His Pro Cys Phe Leu Thr Thr 100 105 110 Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu Thr Asp Thr Ala Arg 115 120 125 Val Leu Ser Ser Met Ala Asp Ala Val Leu Ala Arg Val Tyr Lys Gln 130 135 140 Ser Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser Ile Pro Ile Ile Asn 145 150 155 160 Gly Leu Ser Asp Leu Tyr His Pro Ile Gln Ile Leu Ala Asp Tyr Leu 165 170 175 Thr Leu Gln Glu His Tyr Ser Ser Leu Lys Gly Leu Thr Leu Ser Trp 180 185 190 Ile Gly Asp Gly Asn Asn Ile Leu His Ser Ile Met Met Ser Ala Ala 195 200 205 Lys Phe Gly Met His Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu Pro 210 215 220 Asp Ala Ser Val Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn Gly 225 230 235 240 Thr Lys Leu Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly Gly 245 250 255 Asn Val Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu Glu 260 265 270 Lys Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr Met Lys 275 280 285 Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His Cys Leu Pro 290 295 300 Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr Ser Pro Arg Ser 305 310 315 320 Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile Met Ala Val 325 330 335 Met Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys Pro Lys 340 345 350 Phe <210> 82 <211> 1059 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 82 ctgttcaacc tgcgcatcct gctgaacaac gccgccttca gaaacggcca caacttcatg 60 gttcgaaact tcagatgcgg ccagcctctc cagaacaagg tgcagctgaa aggcagggac 120 ctgctgaccc tgaagaactt caccggcgaa gagatcaagt acatgctgtg gctgtccgcc 180 gacctgaagt tcagaatcaa gcagaagggc gagtacctgc ctctgctcca gggaaagtct 240 ctgggcatga tcttcgagaa gcggagcacc agaaccagac tgagcaccga gacaggcttt 300 gccctgctcg gaggacaccc ctgctttctg acaacccagg acatccacct gggcgtgaac 360 gagagcctga ccgatacagc cagagtgctg tcctctatgg ccgatgccgt gctggctaga 420 gtgtataagc agagcgacct ggacaccctg gctaaagagg ccagcattcc catcatcaac 480 ggcctgtccg acctgtatca ccccatccag atcctggccg actacctgac actgcaagag 540 cactacagca gcctgaaggg actgaccctg tcttggatcg gcgacggcaa caacatcctg 600 cacagcatta tgatgagcgc cgccaagttc ggaatgcacc tccaggccgc tacacccaag 660 ggctatgaac ctgatgccag cgtgacaaag ctggccgagc agtacgccaa agagaacggc 720 acaaagctgc tgctgaccaa cgatcccctg gaagctgctc acggcggcaa tgtgctgatc 780 accgatacct ggatcagcat gggccaagag gaagagaaga agaagcggct gcaagccttc 840 cagggctacc aagtgaccat gaagacagcc aaggtggccg ccagcgattg gacctttctg 900 cactgcctgc ctcggaagcc tgaagaggtg gacgacgagg tgttctacag ccctagaagc 960 ctggtgttcc ccgaggccga gaacagaaag tggaccatca tggctgtgat ggtgtctctg 1020 ctgaccgact actcccctca gctccagaag cctaagttc 1059 <210> 83 <211> 1059 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 83 ctgttcaacc tgcgaatcct gctgaacaat gccgcttttc ggaacgggca caatttcatg 60 gtgaggaact ttcgctgcgg acagcccctc cagaacaagg tccagctgaa gggcagggac 120 ctgctgaccc tgaaaaattt cacaggggag gaaatcaagt acatgctgtg gctgtcagcc 180 gatctgaagt tccggatcaa gcagaagggc gaatatctgc ctctgctcca gggcaaaagc 240 ctggggatga tcttcgaaaa gcgcagtact cggaccagac tgtcaacaga gactggattc 300 gcactgctgg gaggacaccc atgttttctg accacacagg acattcatct gggagtgaac 360 gagtccctga ccgacacagc acgcgtcctg agctccatgg ctgatgcagt gctggctcga 420 gtctacaaac agtctgacct ggataccctg gccaaggaag cttctatccc aatcattaat 480 ggcctgagtg acctgtatca ccccatccag attctggccg attacctgac cctccaggag 540 cattattcta gtctgaaagg gctgacactg agctggattg gggacggaaa caatatcctg 600 cactccatta tgatgagcgc cgccaagttt ggaatgcacc tccaggctgc aaccccaaaa 660 ggctacgaac ccgatgcctc cgtgacaaag ctggcagaac agtatgccaa agagaacggc 720 actaagctgc tgctcaccaa tgaccctctg gaggccgctc acggaggcaa cgtgctgatc 780 actgatacct ggattagtat gggacaggag gaagagaaga agaagcggct ccaggccttc 840 cagggctacc aggtgacaat gaaaactgct aaggtcgcag ccagcgactg gacctttctg 900 cattgcctgc ccagaaagcc tgaagaggtg gacgatgagg tcttctactc acccagaagc 960 ctggtgtttc ctgaagctga gaataggaag tggacaatca tggcagtgat ggtcagcctg 1020 ctgactgatt attcccctca gctccagaaa ccaaagttc 1059 <210> 84 <211> 394 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 84 Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro 1 5 10 15 Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp 20 25 30 Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe 35 40 45 Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala 50 55 60 Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr 65 70 75 80 Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr 85 90 95 Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Gly Gly Ser 100 105 110 Gly Phe Gly Asp Val Gly Ala Leu Glu Ser Leu Arg Gly Asn Ala Asp 115 120 125 Leu Ala Tyr Ile Leu Ser Met Glu Pro Cys Gly His Cys Leu Ile Ile 130 135 140 Asn Asn Val Asn Phe Cys Arg Glu Ser Gly Leu Arg Thr Arg Thr Gly 145 150 155 160 Ser Asn Ile Asp Cys Glu Lys Leu Arg Arg Arg Phe Ser Ser Leu His 165 170 175 Phe Met Val Glu Val Lys Gly Asp Leu Thr Ala Lys Lys Met Val Leu 180 185 190 Ala Leu Leu Glu Leu Ala Gln Gln Asp His Gly Ala Leu Asp Cys Cys 195 200 205 Val Val Val Ile Leu Ser His Gly Cys Gln Ala Ser His Leu Gln Phe 210 215 220 Pro Gly Ala Val Tyr Gly Thr Asp Gly Cys Pro Val Ser Val Glu Lys 225 230 235 240 Ile Val Asn Ile Phe Asn Gly Thr Ser Cys Pro Ser Leu Gly Gly Lys 245 250 255 Pro Lys Leu Phe Phe Ile Gln Ala Cys Gly Gly Glu Gln Lys Asp His 260 265 270 Gly Phe Glu Val Ala Ser Thr Ser Pro Glu Asp Glu Ser Pro Gly Ser 275 280 285 Asn Pro Glu Pro Asp Ala Thr Pro Phe Gln Glu Gly Leu Arg Thr Phe 290 295 300 Asp Gln Leu Asp Ala Ile Ser Ser Leu Pro Thr Pro Ser Asp Ile Phe 305 310 315 320 Val Ser Tyr Ser Thr Phe Pro Gly Phe Val Ser Trp Arg Asp Pro Lys 325 330 335 Ser Gly Ser Trp Tyr Val Glu Thr Leu Asp Asp Ile Phe Glu Gln Trp 340 345 350 Ala His Ser Glu Asp Leu Gln Ser Leu Leu Leu Arg Val Ala Asn Ala 355 360 365 Val Ser Val Lys Gly Ile Tyr Lys Gln Met Pro Gly Cys Phe Asn Phe 370 375 380 Leu Arg Lys Lys Leu Phe Phe Lys Thr Ser 385 390 <210> 85 <211> 1182 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 85 ggggtccagg tggaaacaat ctctccgggg gatgggcgga cattccctaa aaggggccag 60 acctgcgtgg tgcattacac cggcatgctg gaagatggca agaaggtgga cagcagccgg 120 gacagaaaca agcccttcaa gttcatgctg ggcaagcaag aagtgatcag aggctgggaa 180 gagggcgtcg cccagatgtc tgttggacag agagccaagc tgacaatcag ccccgattac 240 gcctatggcg ccacaggaca ccctggcatc attcctccac atgccacact ggtgttcgac 300 gtggaactgc tgaagctgga aggcggcgga ggatctggct ttggagatgt gggagccctg 360 gaaagcctga gaggcaatgc cgatctggcc tacatcctga gcatggaacc ttgcggccac 420 tgcctgatta tcaacaacgt gaacttctgt agagagagcg gcctgcggac cagaaccggc 480 agcaatatcg attgcgagaa gctgcggcgg agattcagca gcctgcactt catggtggaa 540 gtgaagggcg acctgaccgc caagaaaatg gtgctggctc tgctggaact ggcccagcaa 600 gatcatggcg ccctggattg ctgtgtggtc gtgatcctgt ctcacggctg tcaggccagc 660 caccttcaat tccctggcgc cgtgtatggc acagatggct gtcctgtgtc cgtggaaaag 720 atcgtgaaca tcttcaacgg caccagctgt cctagcctcg gcggaaagcc caagctgttc 780 ttcatccaag cctgtggcgg cgagcagaag gatcacggat ttgaggtggc cagcacaagc 840 cccgaggatg agtctcctgg aagcaaccct gagcctgacg ccacaccttt ccaagagggc 900 ctgagaacct tcgaccagct ggacgctatc agctccctgc ctacacctag cgacatcttc 960 gtgtcctaca gcacattccc cggctttgtg tcttggcggg accctaagtc tggctcttgg 1020 tacgtggaaa ccctggacga catctttgag cagtgggctc acagcgagga cctccagtct 1080 ctgctgctga gagtggccaa tgccgtgtcc gtgaagggca tctacaagca gatgcctggc 1140 tgcttcaact tcctgcggaa gaagctgttt ttcaagacca gc 1182 <210> 86 <211> 309 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 86 gatatctata acaagaaaat atatatataa taagttatca cgtaagtaga acatgaaata 60 acaatataat tatcgtatga gttaaatctt aaaagtcacg taaaagataa tcatgcgtca 120 ttttgactca cgcggtcgtt atagttcaaa atcagtgaca cttaccgcat tgacaagcac 180 gcctcacggg agctccaagc ggcgactgag atgtcctaaa tgcacagcga cggattcgcg 240 ctatttagaa agagagagca atatttcaag aatgcatgcg tcaattttac gcagactatc 300 tttctaggg 309 <210> 87 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 87 ccctagaaag atagtctgcg taaaattgac gcatg 35 <210> 88 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 88 ccctagaaag ataatcatat tgtgacgtac gttaaagata atcatgcgta aaattgacgc 60 atg 63 <210> 89 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 89 ccctagaaag ataatcatat tgtgacgtac gttaaagata atcatgcgta aaattgacgc 60 atgc 64 <210> 90 <211> 237 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 90 ccctagaaag ataatcatat tgtgacgtac gttaaagata atcatgtgta aaattgacgc 60 atgtgtttta tcggtctgta tatcgaggtt tatttattaa tttgaataga tattaagttt 120 tattatattt acacttacat actaataata aattcaacaa acaatttatt tatgtttatt 180 tatttattaa aaaaaacaaa aactcaaaat ttcttctata aagtaacaaa actttta 237 <210> 91 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 91 ggtaccgtgc acgtcgactc tagacgcgta gaggggcgga agggacgtta ggagggaggc 60 agggaggcag ggaggcaggg aggaacggag ggag 94 <210> 92 <211> 94 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 92 ctccctccgt tcctccctgc ctccctgcct ccctgcctcc ctcctaacgt cccttccgcc 60 cctctacgcg tctagagtcg acgtgcacgg tacc 94 <210> 93 <211> 119 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 93 ctgcgcgctc gctcgctcac tgaggccgcc cgggcgtcgg gcgacctttg gtcgcccggc 60 ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta ggggttcct 119 <210> 94 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 94 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag ctg 133 <210> 95 <211> 238 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 95 ccctagaaag ataatcatat tgtgacgtac gttaaagata atcatgcgta aaattgacgc 60 atgtgtttta tcggtctgta tatcgaggtt tatttattaa tttgaataga tattaagttt 120 tattatattt acacttacat actaataata aattcaacaa acaatttatt tatgtttatt 180 tatttattaa aaaaaaacaa aaactcaaaa tttcttctat aaagtaacaa aactttta 238 <210> 96 <211> 309 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 96 gatatctata acaagaaaat atatatataa taagttatca cgtaagtaga acatgaaata 60 acaatataat tatcgtatga gttaaatctt aaaagtcacg taaaagataa tcatgcgtca 120 ttttgactca cgcggtcgtt atagttcaaa atcagtgaca cttaccgcat tgacaagcac 180 gcctcacggg agctccaagc ggcgactgag atgtcctaaa tgcacagcga cggattcgcg 240 ctatttagaa agagagagca atatttcaag aatgcatgcg tcaattttac gcagactatc 300 tttctaggg 309 <210> 97 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 97 taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 60 tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 120 tt 122 <210> 98 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 98 aagctgcaat aaacaagtta 20 <210> 99 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 99 ctgcgcatgc gcttg 15 <210> 100 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 100 gtaatcatgg tcatagctgt t 21 <210> 101 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 101 agctagcctt aagggcgc 18 <210> 102 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 102 acagtgtaca tcatgaccat ggtctagagt agac 34 <210> 103 <211> 977 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 103 acagtgtaca tcatgaccat ggtctagagt agacgataac cacactgacg ctaagacatc 60 gttatttttt tagacacttt accctctgtt attatccccg ccgggaatgg ctacccggat 120 catatacacc gacgtgccaa gttcccgccc tgtctcctta tttccgctcg gtgcaagatt 180 acagacgtcc gaagtgtatt agagtagacg catcagtatc acttgtgtcc ttaaaccgac 240 aggagaagtg ctagtacgct gtgtaaagga tcctgaatat aatataggac accgtctatt 300 atatgtatat aggaaactta tgtcgtattt gggcggacca ccaatccgat tccaaacccc 360 ggttggaacg tgtcggatcg acactcgccc aaaatgaaat ttaggctctt aaatgcaaaa 420 tctggttcgt aaattcagtc gggatagaga cagttaacgg ttgcttgtct ccatgaccta 480 cacatggtgc agggtgtctt ggggatacca gattgttata taacggtgat caaacaagta 540 gttccaaaag aaatatacag aagatccaca gctaggccat atcctttaag agttagttat 600 cacagcaacc tcgctaactg gcgtagagcg taagccgcgg ttcgcaggtc ataccacttt 660 atgattagtc cttgtcgaat gtgtacctac taaccctaac cgggtaaggc tgataaatgc 720 cttcacgtag ccaagtgtat tgaggaatct cccggccggg ggtaccgtct cgggctcccg 780 ttgcagttac ttacgatggt ctaaggtgca cctcccttca catggttttc cgcaacggaa 840 cccctcctgc tcacctttaa agggggcaat ttcaaatcca tgatagctca ttcatgtctg 900 cgatcagtac ctgttagaca atactaggcg catttccccg atttaatagt atttatactg 960 ggactcaggg ccacttt 977 <210> 104 <211> 4599 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 104 cagctgcgcg ctcgctcgct cactgaggcc gcccgggcgt cgggcgacct ttggtcgccc 60 ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120 ctgcggccgc gaagactctt aaccctagaa agataatcat attgtgacgt acgttaaaga 180 taatcatgcg taaaattgac gcatgtgttt tatcggtctg tatatcgagg tttatttatt 240 aatttgaata gatattaagt tttattatat ttacacttac atactaataa taaattcaac 300 aaacaattta tttatgttta tttatttatt aaaaaaaaac aaaaactcaa aatttcttct 360 ataaagtaac aaaactttta tcaaatacct gcagcccggg ggatgcagag ggacagcccc 420 cccccaaagc ccccagggat gtaattacgt ccctcccccg ctagggggca gcagcgagcc 480 gcccggggct ccgctccggt ccggcgctcc ccccgcatcc ccgagccggc agcgtgcggg 540 gacagcccgg gcacggggaa ggtggcacgg gatcgctttc ctctgaacgc ttctcgctgc 600 tctttgagcc tgcagacacc tggggggata cggggaaaag ttgactgtgc ctttcgatcg 660 agtactccta ggcgcgtgtt tgctgcttgc aatgtttgcc cattttaggg tggacacagg 720 acgctgtggt ttctgagcca gggggcgact cagatcccag ccagtggact tagcccctgt 780 ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 840 ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 900 caccaccact gacctgggac agtgaatcgc aaagcttatt ggacgtcgct tagcggtacc 960 gccaccatgc tgttcaacct gcgcatcctg ctgaacaacg ccgccttcag aaacggccac 1020 aacttcatgg ttcgaaactt cagatgcggc cagcctctcc agaacaaggt gcagctgaaa 1080 ggcagggacc tgctgaccct gaagaacttc accggcgaag agatcaagta catgctgtgg 1140 ctgtccgccg acctgaagtt cagaatcaag cagaagggcg agtacctgcc tctgctccag 1200 ggaaagtctc tgggcatgat cttcgagaag cggagcacca gaaccagact gagcaccgag 1260 acaggctttg ccctgctcgg aggacacccc tgctttctga caacccagga catccacctg 1320 ggcgtgaacg agagcctgac cgatacagcc agagtgctgt cctctatggc cgatgccgtg 1380 ctggctagag tgtataagca gagcgacctg gacaccctgg ctaaagaggc cagcattccc 1440 atcatcaacg gcctgtccga cctgtatcac cccatccaga tcctggccga ctacctgaca 1500 ctgcaagagc actacagcag cctgaaggga ctgaccctgt cttggatcgg cgacggcaac 1560 aacatcctgc acagcattat gatgagcgcc gccaagttcg gaatgcacct ccaggccgct 1620 acacccaagg gctatgaacc tgatgccagc gtgacaaagc tggccgagca gtacgccaaa 1680 gagaacggca caaagctgct gctgaccaac gatcccctgg aagctgctca cggcggcaat 1740 gtgctgatca ccgatacctg gatcagcatg ggccaagagg aagagaagaa gaagcggctg 1800 caagccttcc agggctacca agtgaccatg aagacagcca aggtggccgc cagcgattgg 1860 acctttctgc actgcctgcc tcggaagcct gaagaggtgg acgacgaggt gttctacagc 1920 cctagaagcc tggtgttccc cgaggccgag aacagaaagt ggaccatcat ggctgtgatg 1980 gtgtctctgc tgaccgacta ctcccctcag ctccagaagc ctaagttcta aacactagtt 2040 ctatagtgtc acctaaattc cctttagtga gggttaatgg ccgtaggccg ccagaattgg 2100 gtccagacat gataagatac attgatgagt ttggacaaac cacaactaga atgcagtgaa 2160 aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct 2220 gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg 2280 tgtgggaggt tttttcggac tctaggacct gcgcatgcgc ttggcgtaat catggtcata 2340 gctgtttcct gttttccccg tatcccccca ggtgtctgca ggctcaaaga gcagcgagaa 2400 gcgttcagag gaaagcgatc ccgtgccacc ttccccgtgc ccgggctgtc cccgcacgct 2460 gccggctcgg ggatgcgggg ggagcgccgg accggagcgg agccccgggc ggctcgctgc 2520 tgccccctag cgggggaggg acgtaattac atccctgggg gctttggggg ggggctgtcc 2580 ctctcaccgc ggtggagctc cagcttttgt tcgaattggg gccccccctc gagggtatcg 2640 atgatatcta taacaagaaa atatatatat aataagttat cacgtaagta gaacatgaaa 2700 taacaatata attatcgtat gagttaaatc ttaaaagtca cgtaaaagat aatcatgcgt 2760 cattttgact cacgcggtcg ttatagttca aaatcagtga cacttaccgc attgacaagc 2820 acgcctcacg ggagctccaa gcggcgactg agatgtccta aatgcacagc gacggattcg 2880 cgctatttag aaagagagag caatatttca agaatgcatg cgtcaatttt acgcagacta 2940 tctttctagg gttaatctag ctagccttaa gggcgcacag tgtacatcat gaccatggtc 3000 tagagtagac gataaccaca ctgacgctaa gacatcgtta tttttttaga cactttaccc 3060 tctgttatta tccccgccgg gaatggctac ccggatcata tacaccgacg tgccaagttc 3120 ccgccctgtc tccttatttc cgctcggtgc aagattacag acgtccgaag tgtattagag 3180 tagacgcatc agtatcactt gtgtccttaa accgacagga gaagtgctag tacgctgtgt 3240 aaaggatcct gaatataata taggacaccg tctattatat gtatatagga aacttatgtc 3300 gtatttgggc ggaccaccaa tccgattcca aaccccggtt ggaacgtgtc ggatcgacac 3360 tcgcccaaaa tgaaatttag gctcttaaat gcaaaatctg gttcgtaaat tcagtcggga 3420 tagagacagt taacggttgc ttgtctccat gacctacaca tggtgcaggg tgtcttgggg 3480 ataccagatt gttatataac ggtgatcaaa caagtagttc caaaagaaat atacagaaga 3540 tccacagcta ggccatatcc tttaagagtt agttatcaca gcaacctcgc taactggcgt 3600 agagcgtaag ccgcggttcg caggtcatac cactttatga ttagtccttg tcgaatgtgt 3660 acctactaac cctaaccggg taaggctgat aaatgccttc acgtagccaa gtgtattgag 3720 gaatctcccg gccgggggta ccgtctcggg ctcccgttgc agttacttac gatggtctaa 3780 ggtgcacctc ccttcacatg gttttccgca acggaacccc tcctgctcac ctttaaaggg 3840 ggcaatttca aatccatgat agctcattca tgtctgcgat cagtacctgt tagacaatac 3900 taggcgcatt tccccgattt aatagtattt atactgggac tcagggccac tttgggcgcc 3960 tcgagacctt gcggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4020 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 4080 cggcctcagt gagcgagcga gcgcgcagct gcctgcaggt ctagctagcc cgcctaatga 4140 gcgggctttt ttttggcttg ttgtccacaa ccgttaaacc ttaaaagctt taaaagcctt 4200 atatattctt ttttttctta taaaacttaa aaccttagag gctatttaag ttgctgattt 4260 atattaattt tattgttcaa acatgagagc ttagtacgtg aaacatgaga gcttagtacg 4320 ttagccatga gagcttagta cgttagccat gagggtttag ttcgttaaac atgagagctt 4380 agtacgttaa acatgagagc ttagtacgta ctatcaacag gttgaactgc tgatccacgt 4440 tgtggtagaa ttggtaaaga gagtcgtgta aaatatcgag ttcgcacatc ttgttgtctg 4500 attattgatt tttggcgaaa ccatttgatc atatgacaag atgtgtatct accttaactt 4560 aatgattttg ataaaaatca ttacctaggt tcctgcagg 4599 <210> 105 <211> 182 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 105 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 ag 182 <210> 106 <211> 178 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 106 agcatggcta cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag 60 tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 120 aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcag 178 <210> 107 <211> 256 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 107 gcgcgtgttt gctgcttgca atgtttgccc attttagggt ggacacagga cgctgtggtt 60 tctgagccag ggggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 120 ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 180 cactgcttaa atacggatat ccgaggacag ggccctgtct cctcagcttc aggcaccacc 240 actgacctgg gacagt 256 <210> 108 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 108 tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 60 aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 120 atgtctggcg ctagcagca 139 <210> 109 <211> 1906 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 109 cctcgcagga ggcctggccg gcctccggat tacttccggt gcaggcgtca gctgcatctt 60 gctggccagc tcggaggact gtccccgtaa ctcccgtccg ctgtgtatca acacagctct 120 agccaaattg ttgaccgaac gacggggttc gattgtttca ttcctcacat ccaacacttg 180 agtagtacaa tgccttgtct aagtgcgctt gggacccagt ctattttgtt tgtgtgcaca 240 agacgatact cctcgatcac gcaccaagcg caggctggcc ctaacgacgt ggtattctcg 300 tattggagag ccccagattg cataaggcac tcatcacctg cgtttatgac gctggacgcc 360 tgcgtatgtt gcaggactcc tatgatgtcg cttgcctgat gcgttgttat gtgattgagg 420 tttagtactt ggcaatatca ttagatggaa ctaatacgcg gtctaatcgt tacaggtttc 480 cgacgattga gaagtatcac ctgattctcg ggagcgactt gtaacactac tacacttatt 540 gatttggtac tcctatgtgt tgctatcttg actccgtaaa tcgccgtgat acactctctt 600 cgtttctcgg caatctatgg ctctaaacta tacacaggca ttctaagaat aatctgacct 660 gtccctgtag tactggtagg ttactaccag tacggcgaca atgtgggagc tacggcgtgg 720 tagaaccggg tacagacaca gtccctgatc ccgatagtaa cactgtgccc gtagcagtga 780 taatcattgc gcctcaacct gaggaagata agggaggcag tatatcgtgc tattccctct 840 attctcccac atgcgtatgg cctgaggtca atgttcaggt acatgccgta atatgaggtt 900 ttacgtagcc gatcacgaaa aggttgctaa atacttctcg tcatatccca gctcattgtt 960 gggattatcg ctaaacaggc taagttctaa tgcccgtggg catggcctca cgatctatgg 1020 tgatacagac agcccgattt agcaatgctt cagagcacag tggtaaatat tggttgatac 1080 gtagaaccat gatcactgct caattcgtga tgaagttgtt caatatacct agaagccact 1140 caaggattct ctctgagtca ctaatagagg tggtagagtg tttggaagcc ggttccacac 1200 agatttagag tgtcacctaa ttgccgttta tctaaggaat tacgacagga gataccgaag 1260 taattaggct attgcagaga tacaggctag gtgaggtgga gggtgtcttg cggtcttcgt 1320 ccagccgcct tgaaagcggg gtttttttca agcatcgctg cgtcattgcg tggtcgagac 1380 ttatgcgccc tacgaagttc gtctgaagta gtccaggaaa gacctacttt gcagttatct 1440 tcgcattccc acactcacca ctacaactac tcttccctca atttcccggt tagtttcgct 1500 aagctccgac cttgggttac tgtgttgcat ccgactcgct gcggctttct agtacgctgt 1560 actgtttcat tcttctgtag gtctggttcc gtaagtccga atttccaggc cgtggtctag 1620 tcctaattat tttctgtccc ggtagctata tttagccgag ggtttgtcca tttgcccggc 1680 gtagagcgcc gcgtttgcga acatttgcgc ccgtaatacg tagggacacc gtcgggtaat 1740 ggatggcaaa agccgaaaac ggcgtcttcc ggcgcttgga ttcagcgctc ttgagccata 1800 aaccgcgttg cttctttggt taattcgtat taatgatcct aagcgccagc ttattcgtta 1860 agaggcacta ggcgcgccgc ggcatgcgat cgccagcatg gctacg 1906 <210> 110 <211> 7302 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 110 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt ggagatcggt acttcgcgaa 420 tgcgtcgaga tggtaccacc ggtactgcgc gctcgctcgc tcactgaggc cgcccgggca 480 aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga 540 gagggagtgg ccaactccat cactaggggt tccttgtagt taatgattaa cccgccatgc 600 tacttatcta cgtagccatg ctctagctta agcctaggcg cgtgtttgct gcttgcaatg 660 tttgcccatt ttagggtgga cacaggacgc tgtggtttct gagccagggg gcgactcaga 720 tcccagccag tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa 780 tattcaccag cagcctcccc cgttgcccct ctggatccac tgcttaaata cggatatccg 840 aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatcgc 900 aagaattcac gcgtcaattg ctcgaggcca ccatggctcc caagaagaag cggaaagttg 960 gcggcggagg cagcagcctg gatgatgagc atattctgag cgccctgctg cagagcgacg 1020 atgaactcgt gggcgaagat agcgacagcg aggtgtccga tcacgtgtcc gaggatgacg 1080 tgcagtccga taccgaggaa gccttcatcg acgaggtgca cgaagtgcag cctacaagca 1140 gcggcagcga gatcctggac gagcagaatg tgatcgagca gccaggatct agcctggcca 1200 gcaacagaat cctgacactg ccccagagaa ccatccgggg caagaacaag cactgctggt 1260 ccaccagcaa gagcaccaga cggtctagag tgtctgccct gaacatcgtg cgaagccaga 1320 ggggccctac cagaatgtgc cggaacatct acgaccctct gctgtgcttc aagctgttct 1380 tcaccgacga gatcatctcc gagatcgtga agtggaccaa cgccgagatc agcctgaagc 1440 ggagagaatc catgaccagc gccaccttca gagacaccaa cgaggacgag atctacgcct 1500 tcttcggcat cctggtcatg acagccgtgc ggaaggacaa ccacatgagc accgacgacc 1560 tgttcgaccg cagcctgtct atggtgtacg tgtccgtgat gagccgggac agattcgact 1620 tcctgatccg gtgcctgcgg atggacgaca agtccatcag acccacactg cgcgagaacg 1680 acgtgttcac acctgtgcgg aagatctggg acctgttcat ccaccagtgc atccagaact 1740 acacccctgg cgctcacctg accatcgacg aacagctgct gggcttcaga ggcagatgcc 1800 ccttcagagt gtacatcccc aacaagccct ctaagtacgg catcaagatc ctgatgatgt 1860 gcgacagcgg caccaagtac atgatcaacg gcatgcccta cctcggcaga ggcacccaaa 1920 caaatggcgt gccactgggc gagtactacg tgaaagaact gagcaagcct gtgcacggca 1980 gctgcagaaa catcacctgt gacaactggt ttaccagcat tcccctggcc aagaacctgc 2040 tgcaagaacc ctacaagctg acaatcgtgg gcaccgtgcg gagcaacaag agggaaattc 2100 ccgaggtgct gaagaactct cggagcagac ctgtgggcac cagcatgttc tgcttcgacg 2160 gacctctgac actggtgtcc tacaagccca agcctgccaa gatggtgtac ctgctgagca 2220 gctgtgacga ggacgccagc atcaatgaga gcaccggcaa gccccagatg gtcatgtact 2280 acaaccagac caaaggcggc gtggacaccc tggatcagat gtgcagcgtg atgacctgca 2340 gcagaaagac caacagatgg cccatggctc tgctgtacgg catgatcaat atcgcctgca 2400 tcaacagctt catcatctac agccacaacg tgtccagcaa gggcgagaag gtgcagagcc 2460 ggaagaaatt catgcggaac ctgtacatga gcctgaccag cagcttcatg agaaagcggc 2520 tggaagcccc tacactgaag agatacctgc gggacaacat cagcaacatc ctgcctaaag 2580 aggtgcccgg caccagcgac gatagcacag aggaacccgt gatgaagaag aggacctact 2640 gcacctactg tcccagcaag atccggcgga aggccaacgc cagctgcaaa aagtgcaaga 2700 aagtgatctg ccgcgagcac aacatcgata tgtgccagag ctgcttctga tgagatgcat 2760 tcgaagcggc cgcgagctca agcttgcaat tccgataact tgtttattgc agcttataat 2820 ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 2880 tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggcg ctagcagcac 2940 ctcgcaggag gcctggccgg cctccggatt acttccggtg caggcgtcag ctgcatcttg 3000 ctggccagct cggaggactg tccccgtaac tcccgtccgc tgtgtatcaa cacagctcta 3060 gccaaattgt tgaccgaacg acggggttcg attgtttcat tcctcacatc caacacttga 3120 gtagtacaat gccttgtcta agtgcgcttg ggacccagtc tattttgttt gtgtgcacaa 3180 gacgatactc ctcgatcacg caccaagcgc aggctggccc taacgacgtg gtattctcgt 3240 attggagagc cccagattgc ataaggcact catcacctgc gtttatgacg ctggacgcct 3300 gcgtatgttg caggactcct atgatgtcgc ttgcctgatg cgttgttatg tgattgaggt 3360 ttagtacttg gcaatatcat tagatggaac taatacgcgg tctaatcgtt acaggtttcc 3420 gacgattgag aagtatcacc tgattctcgg gagcgacttg taacactact acacttattg 3480 atttggtact cctatgtgtt gctatcttga ctccgtaaat cgccgtgata cactctcttc 3540 gtttctcggc aatctatggc tctaaactat acacaggcat tctaagaata atctgacctg 3600 tccctgtagt actggtaggt tactaccagt acggcgacaa tgtgggagct acggcgtggt 3660 agaaccgggt acagacacag tccctgatcc cgatagtaac actgtgcccg tagcagtgat 3720 aatcattgcg cctcaacctg aggaagataa gggaggcagt atatcgtgct attccctcta 3780 ttctcccaca tgcgtatggc ctgaggtcaa tgttcaggta catgccgtaa tatgaggttt 3840 tacgtagccg atcacgaaaa ggttgctaaa tacttctcgt catatcccag ctcattgttg 3900 ggattatcgc taaacaggct aagttctaat gcccgtgggc atggcctcac gatctatggt 3960 gatacagaca gcccgattta gcaatgcttc agagcacagt ggtaaatatt ggttgatacg 4020 tagaaccatg atcactgctc aattcgtgat gaagttgttc aatataccta gaagccactc 4080 aaggattctc tctgagtcac taatagaggt ggtagagtgt ttggaagccg gttccacaca 4140 gatttagagt gtcacctaat tgccgtttat ctaaggaatt acgacaggag ataccgaagt 4200 aattaggcta ttgcagagat acaggctagg tgaggtggag ggtgtcttgc ggtcttcgtc 4260 cagccgcctt gaaagcgggg tttttttcaa gcatcgctgc gtcattgcgt ggtcgagact 4320 tatgcgccct acgaagttcg tctgaagtag tccaggaaag acctactttg cagttatctt 4380 cgcattccca cactcaccac tacaactact cttccctcaa tttcccggtt agtttcgcta 4440 agctccgacc ttgggttact gtgttgcatc cgactcgctg cggctttcta gtacgctgta 4500 ctgtttcatt cttctgtagg tctggttccg taagtccgaa tttccaggcc gtggtctagt 4560 cctaattatt ttctgtcccg gtagctatat ttagccgagg gtttgtccat ttgcccggcg 4620 tagagcgccg cgtttgcgaa catttgcgcc cgtaatacgt agggacaccg tcgggtaatg 4680 gatggcaaaa gccgaaaacg gcgtcttccg gcgcttggat tcagcgctct tgagccataa 4740 accgcgttgc ttctttggtt aattcgtatt aatgatccta agcgccagct tattcgttaa 4800 gaggcactag gcgcgccgcg gcatgcgatc gccagcatgg ctacgtagat aagtagcatg 4860 gcgggttaat cattaactac aaggaacccc tagtgatgga gttggccact ccctctctgc 4920 gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc 4980 gggcggcctc agtgagcgag cgagcgcgca gactagtgtc gacatcggat gccgggaccg 5040 acgagtgcag aggcgtgcaa gcgagcttgg cgtaatcatg gtcatagctg tttcctgtgt 5100 gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 5160 cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 5220 tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 5280 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 5340 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 5400 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 5460 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 5520 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 5580 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 5640 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 5700 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 5760 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 5820 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 5880 cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 5940 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 6000 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 6060 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 6120 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 6180 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 6240 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 6300 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 6360 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 6420 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 6480 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 6540 acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 6600 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 6660 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 6720 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 6780 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 6840 gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 6900 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 6960 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 7020 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 7080 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 7140 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 7200 ttccgcgcac atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga 7260 cattaaccta taaaaatagg cgtatcacga ggccctttcg tc 7302 <210> 111 <211> 2256 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 111 atgctgcggg ccaagaatca actgttcctg ctgtcccctc actacctgcg gcaagtgaaa 60 gagagcagcg gcagcagact gatccagcag agactgctgc atcagcagca gccactgcac 120 cctgaatggg ccgctctggc taagaagcag ctcaagggca agaaccccga ggacctgatc 180 tggcacacac cagagggcat cagcatcaag cccctgtact ccaagcggga cacaatggat 240 ctgcccgagg aactgcctgg cgtgaagcct tttacaagag gcccctatcc taccatgtat 300 accttcagac cctggaccat ccggcagtac gccggctttt ctaccgtgga agagagcaac 360 aagttctaca aggacaacat caaggccggc cagcagggac tgagcgtggc atttgatctg 420 gctacccaca ggggctacga cagcgacaac cctagagtgc ggggagatgt tggaatggcc 480 ggcgtggcaa tcgacacagt ggaagatacc aagatcctgt tcgacggcat ccctctggaa 540 aagatgagcg tgtccatgac catgaacggc gctgtgatcc ccgtgctggc taactttatt 600 gtgaccggcg aggaacaggg cgtgcccaaa gaaaagctga ccggcaccat ccagaacgac 660 atcctgaaag agttcatggt tcgaaacacc tacatcttcc cacctgagcc gagcatgaag 720 atcattgccg acatcttcga gtacaccgcc aagcacatgc ccaagttcaa cagcatctcc 780 atcagcggct accacatgca agaggctggc gccgatgcca tcctggaact ggcttataca 840 ctggccgacg gcctggaata ctccagaaca ggactgcaag ccggcctgac catcgatgag 900 tttgccccta gactgagctt cttctggggc atcggcatga acttctacat ggaaatcgcc 960 aagatgagag ccggcagacg gctgtgggct cacctgatcg agaagatgtt ccagcctaag 1020 aacagcaaga gcctgctcct gagagcccac tgtcagacaa gtggctggtc cctgactgag 1080 caggacccct acaacaacat cgtgcgcaca gccatcgaag ctatggccgc cgtgtttggc 1140 ggaacacaga gcctgcacac caacagcttt gacgaggctc tgggcctgcc taccgtgaag 1200 tctgccagaa tcgcccggaa cacccagatc atcatccaag aggaaagcgg catccccaag 1260 gtggcagatc cttggggcgg cagctacatg atggaatgcc tgaccaacga cgtgtacgac 1320 gccgctctga agctgatcaa cgagatcgaa gagatgggcg gcatggctaa ggctgtggcc 1380 gagggaatcc ccaagctgag aatcgaggaa tgcgccgcca gacggcaggc cagaattgat 1440 agcggaagcg aagtgatcgt gggcgtgaac aagtaccagc tcgaaaaaga ggacgccgtc 1500 gaggtcctgg ctatcgacaa taccagcgtg cggaaccggc agattgagaa gctgaagaag 1560 atcaagagca gccgcgatca ggccctggcc gaaagatgtc ttgctgccct gacagagtgt 1620 gccgccagcg gcgacggaaa tattctggct ctggccgtgg atgccagccg ggctagatgt 1680 accgtgggcg agattacaga cgccctgaag aaggtgttcg gcgagcacaa ggccaacgac 1740 agaatggtgt ctggcgccta cagacaagag tttggcgaga gcaaagagat caccagcgcc 1800 atcaagcggg tccacaagtt catggaaaga gaaggcaggc ggcccagact gctggtggct 1860 aagatgggac aagacggcca tgacagaggc gccaaagtga tcgccacagg ctttgccgat 1920 ctgggcttcg acgtggacat cggccctctg tttcagaccc ctagagaggt ggcacagcag 1980 gccgttgatg ccgatgttca cgctgtgggc gtgtctacac tggctgccgg acacaagaca 2040 ctggtgcccg aactgatcaa agagctgaac agcctgggca gacccgacat ccttgtgatg 2100 tgtggcggag tgatcccacc gcaggactac gagttcctgt ttgaagtggg cgtgtccaac 2160 gtgttcggcc ctggcacaag aatccctaaa gccgccgtgc aggttctgga cgacatcgag 2220 aagtgcctgg aaaaaaagca gcagagcgtg ggatcc 2256 <210> 112 <211> 2253 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 112 ctgcgggcca agaatcaact gttcctgctg tcccctcact acctgcggca agtgaaagag 60 agcagcggca gcagactgat ccagcagaga ctgctgcatc agcagcagcc actgcaccct 120 gaatgggccg ctctggctaa gaagcagctc aagggcaaga accccgagga cctgatctgg 180 cacacaccag agggcatcag catcaagccc ctgtactcca agcgggacac aatggatctg 240 cccgaggaac tgcctggcgt gaagcctttt acaagaggcc cctatcctac catgtatacc 300 ttcagaccct ggaccatccg gcagtacgcc ggcttttcta ccgtggaaga gagcaacaag 360 ttctacaagg acaacatcaa ggccggccag cagggactga gcgtggcatt tgatctggct 420 acccacaggg gctacgacag cgacaaccct agagtgcggg gagatgttgg aatggccggc 480 gtggcaatcg acacagtgga agataccaag atcctgttcg acggcatccc tctggaaaag 540 atgagcgtgt ccatgaccat gaacggcgct gtgatccccg tgctggctaa ctttattgtg 600 accggcgagg aacagggcgt gcccaaagaa aagctgaccg gcaccatcca gaacgacatc 660 ctgaaagagt tcatggttcg aaacacctac atcttcccac ctgagccgag catgaagatc 720 attgccgaca tcttcgagta caccgccaag cacatgccca agttcaacag catctccatc 780 agcggctacc acatgcaaga ggctggcgcc gatgccatcc tggaactggc ttatacactg 840 gccgacggcc tggaatactc cagaacagga ctgcaagccg gcctgaccat cgatgagttt 900 gcccctagac tgagcttctt ctggggcatc ggcatgaact tctacatgga aatcgccaag 960 atgagagccg gcagacggct gtgggctcac ctgatcgaga agatgttcca gcctaagaac 1020 agcaagagcc tgctcctgag agcccactgt cagacaagtg gctggtccct gactgagcag 1080 gacccctaca acaacatcgt gcgcacagcc atcgaagcta tggccgccgt gtttggcgga 1140 acacagagcc tgcacaccaa cagctttgac gaggctctgg gcctgcctac cgtgaagtct 1200 gccagaatcg cccggaacac ccagatcatc atccaagagg aaagcggcat ccccaaggtg 1260 gcagatcctt ggggcggcag ctacatgatg gaatgcctga ccaacgacgt gtacgacgcc 1320 gctctgaagc tgatcaacga gatcgaagag atgggcggca tggctaaggc tgtggccgag 1380 ggaatcccca agctgagaat cgaggaatgc gccgccagac ggcaggccag aattgatagc 1440 ggaagcgaag tgatcgtggg cgtgaacaag taccagctcg aaaaagagga cgccgtcgag 1500 gtcctggcta tcgacaatac cagcgtgcgg aaccggcaga ttgagaagct gaagaagatc 1560 aagagcagcc gcgatcaggc cctggccgaa agatgtcttg ctgccctgac agagtgtgcc 1620 gccagcggcg acggaaatat tctggctctg gccgtggatg ccagccgggc tagatgtacc 1680 gtgggcgaga ttacagacgc cctgaagaag gtgttcggcg agcacaaggc caacgacaga 1740 atggtgtctg gcgcctacag acaagagttt ggcgagagca aagagatcac cagcgccatc 1800 aagcgggtcc acaagttcat ggaaagagaa ggcaggcggc ccagactgct ggtggctaag 1860 atgggacaag acggccatga cagaggcgcc aaagtgatcg ccacaggctt tgccgatctg 1920 ggcttcgacg tggacatcgg ccctctgttt cagaccccta gagaggtggc acagcaggcc 1980 gttgatgccg atgttcacgc tgtgggcgtg tctacactgg ctgccggaca caagacactg 2040 gtgcccgaac tgatcaaaga gctgaacagc ctgggcagac ccgacatcct tgtgatgtgt 2100 ggcggagtga tcccaccgca ggactacgag ttcctgtttg aagtgggcgt gtccaacgtg 2160 ttcggccctg gcacaagaat ccctaaagcc gccgtgcagg ttctggacga catcgagaag 2220 tgcctggaaa aaaagcagca gagcgtggga tcc 2253 <210> 113 <211> 2250 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 113 atgctgcggg ccaagaatca actgttcctg ctgtcccctc actacctgcg gcaagtgaaa 60 gagagcagcg gcagcagact gatccagcag agactgctgc atcagcagca gccactgcac 120 cctgaatggg ccgctctggc taagaagcag ctcaagggca agaaccccga ggacctgatc 180 tggcacacac cagagggcat cagcatcaag cccctgtact ccaagcggga cacaatggat 240 ctgcccgagg aactgcctgg cgtgaagcct tttacaagag gcccctatcc taccatgtat 300 accttcagac cctggaccat ccggcagtac gccggctttt ctaccgtgga agagagcaac 360 aagttctaca aggacaacat caaggccggc cagcagggac tgagcgtggc atttgatctg 420 gctacccaca ggggctacga cagcgacaac cctagagtgc ggggagatgt tggaatggcc 480 ggcgtggcaa tcgacacagt ggaagatacc aagatcctgt tcgacggcat ccctctggaa 540 aagatgagcg tgtccatgac catgaacggc gctgtgatcc ccgtgctggc taactttatt 600 gtgaccggcg aggaacaggg cgtgcccaaa gaaaagctga ccggcaccat ccagaacgac 660 atcctgaaag agttcatggt tcgaaacacc tacatcttcc cacctgagcc gagcatgaag 720 atcattgccg acatcttcga gtacaccgcc aagcacatgc ccaagttcaa cagcatctcc 780 atcagcggct accacatgca agaggctggc gccgatgcca tcctggaact ggcttataca 840 ctggccgacg gcctggaata ctccagaaca ggactgcaag ccggcctgac catcgatgag 900 tttgccccta gactgagctt cttctggggc atcggcatga acttctacat ggaaatcgcc 960 aagatgagag ccggcagacg gctgtgggct cacctgatcg agaagatgtt ccagcctaag 1020 aacagcaaga gcctgctcct gagagcccac tgtcagacaa gtggctggtc cctgactgag 1080 caggacccct acaacaacat cgtgcgcaca gccatcgaag ctatggccgc cgtgtttggc 1140 ggaacacaga gcctgcacac caacagcttt gacgaggctc tgggcctgcc taccgtgaag 1200 tctgccagaa tcgcccggaa cacccagatc atcatccaag aggaaagcgg catccccaag 1260 gtggcagatc cttggggcgg cagctacatg atggaatgcc tgaccaacga cgtgtacgac 1320 gccgctctga agctgatcaa cgagatcgaa gagatgggcg gcatggctaa ggctgtggcc 1380 gagggaatcc ccaagctgag aatcgaggaa tgcgccgcca gacggcaggc cagaattgat 1440 agcggaagcg aagtgatcgt gggcgtgaac aagtaccagc tcgaaaaaga ggacgccgtc 1500 gaggtcctgg ctatcgacaa taccagcgtg cggaaccggc agattgagaa gctgaagaag 1560 atcaagagca gccgcgatca ggccctggcc gaaagatgtc ttgctgccct gacagagtgt 1620 gccgccagcg gcgacggaaa tattctggct ctggccgtgg atgccagccg ggctagatgt 1680 accgtgggcg agattacaga cgccctgaag aaggtgttcg gcgagcacaa ggccaacgac 1740 agaatggtgt ctggcgccta cagacaagag tttggcgaga gcaaagagat caccagcgcc 1800 atcaagcggg tccacaagtt catggaaaga gaaggcaggc ggcccagact gctggtggct 1860 aagatgggac aagacggcca tgacagaggc gccaaagtga tcgccacagg ctttgccgat 1920 ctgggcttcg acgtggacat cggccctctg tttcagaccc ctagagaggt ggcacagcag 1980 gccgttgatg ccgatgttca cgctgtgggc atctctacac tggctgccgg acacaagaca 2040 ctggtgcccg aactgatcaa agagctgaac agcctgggca gacccgacat ccttgtgatg 2100 tgtggcggag tgatcccacc gcaggactac gagttcctgt ttgaagtggg cgtgtccaac 2160 gtgttcggcc ctggcacaag aatccctaaa gccgccgtgc aggttctgga cgacatcgag 2220 aagtgcctgg aaaaaaagca gcagagcgtg 2250 <210> 114 <211> 2247 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 114 ctgcgggcca agaatcaact gttcctgctg tcccctcact acctgcggca agtgaaagag 60 agcagcggca gcagactgat ccagcagaga ctgctgcatc agcagcagcc actgcaccct 120 gaatgggccg ctctggctaa gaagcagctc aagggcaaga accccgagga cctgatctgg 180 cacacaccag agggcatcag catcaagccc ctgtactcca agcgggacac aatggatctg 240 cccgaggaac tgcctggcgt gaagcctttt acaagaggcc cctatcctac catgtatacc 300 ttcagaccct ggaccatccg gcagtacgcc ggcttttcta ccgtggaaga gagcaacaag 360 ttctacaagg acaacatcaa ggccggccag cagggactga gcgtggcatt tgatctggct 420 acccacaggg gctacgacag cgacaaccct agagtgcggg gagatgttgg aatggccggc 480 gtggcaatcg acacagtgga agataccaag atcctgttcg acggcatccc tctggaaaag 540 atgagcgtgt ccatgaccat gaacggcgct gtgatccccg tgctggctaa ctttattgtg 600 accggcgagg aacagggcgt gcccaaagaa aagctgaccg gcaccatcca gaacgacatc 660 ctgaaagagt tcatggttcg aaacacctac atcttcccac ctgagccgag catgaagatc 720 attgccgaca tcttcgagta caccgccaag cacatgccca agttcaacag catctccatc 780 agcggctacc acatgcaaga ggctggcgcc gatgccatcc tggaactggc ttatacactg 840 gccgacggcc tggaatactc cagaacagga ctgcaagccg gcctgaccat cgatgagttt 900 gcccctagac tgagcttctt ctggggcatc ggcatgaact tctacatgga aatcgccaag 960 atgagagccg gcagacggct gtgggctcac ctgatcgaga agatgttcca gcctaagaac 1020 agcaagagcc tgctcctgag agcccactgt cagacaagtg gctggtccct gactgagcag 1080 gacccctaca acaacatcgt gcgcacagcc atcgaagcta tggccgccgt gtttggcgga 1140 acacagagcc tgcacaccaa cagctttgac gaggctctgg gcctgcctac cgtgaagtct 1200 gccagaatcg cccggaacac ccagatcatc atccaagagg aaagcggcat ccccaaggtg 1260 gcagatcctt ggggcggcag ctacatgatg gaatgcctga ccaacgacgt gtacgacgcc 1320 gctctgaagc tgatcaacga gatcgaagag atgggcggca tggctaaggc tgtggccgag 1380 ggaatcccca agctgagaat cgaggaatgc gccgccagac ggcaggccag aattgatagc 1440 ggaagcgaag tgatcgtggg cgtgaacaag taccagctcg aaaaagagga cgccgtcgag 1500 gtcctggcta tcgacaatac cagcgtgcgg aaccggcaga ttgagaagct gaagaagatc 1560 aagagcagcc gcgatcaggc cctggccgaa agatgtcttg ctgccctgac agagtgtgcc 1620 gccagcggcg acggaaatat tctggctctg gccgtggatg ccagccgggc tagatgtacc 1680 gtgggcgaga ttacagacgc cctgaagaag gtgttcggcg agcacaaggc caacgacaga 1740 atggtgtctg gcgcctacag acaagagttt ggcgagagca aagagatcac cagcgccatc 1800 aagcgggtcc acaagttcat ggaaagagaa ggcaggcggc ccagactgct ggtggctaag 1860 atgggacaag acggccatga cagaggcgcc aaagtgatcg ccacaggctt tgccgatctg 1920 ggcttcgacg tggacatcgg ccctctgttt cagaccccta gagaggtggc acagcaggcc 1980 gttgatgccg atgttcacgc tgtgggcatc tctacactgg ctgccggaca caagacactg 2040 gtgcccgaac tgatcaaaga gctgaacagc ctgggcagac ccgacatcct tgtgatgtgt 2100 ggcggagtga tcccaccgca ggactacgag ttcctgtttg aagtgggcgt gtccaacgtg 2160 ttcggccctg gcacaagaat ccctaaagcc gccgtgcagg ttctggacga catcgagaag 2220 tgcctggaaa aaaagcagca gagcgtg 2247 <210> 115 <211> 2253 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 115 atgctgagag ccaaaaacca gctgttcctg ctgagccccc actatctgag acaggtcaaa 60 gaaagttccg ggagtagact gatccagcag agactgctgc accagcagca gccactgcat 120 cctgagtggg ccgctctggc caagaaacag ctgaagggca aaaacccaga agacctgatc 180 tggcacactc cagaggggat ttcaatcaag cccctgtaca gcaaaaggga cactatggat 240 ctgccagagg aactgccagg agtgaagcct ttcacccgcg gaccttaccc aactatgtat 300 acctttcgac cctggacaat tcggcagtac gccggcttca gtactgtgga ggaatcaaac 360 aagttttata aggacaacat caaggctgga cagcagggcc tgagtgtggc attcgatctg 420 gccacacatc gcggctatga ctcagataat cccagagtca ggggggacgt gggaatggca 480 ggagtcgcta tcgacacagt ggaagatact aagattctgt tcgatggaat ccctctggag 540 aaaatgtctg tgagtatgac aatgaacggc gctgtcattc ccgtgctggc aaacttcatc 600 gtcactggcg aggaacaggg ggtgcctaag gaaaaactga ccggcacaat tcagaacgac 660 atcctgaagg agttcatggt gcggaatact tacatttttc cccctgaacc atccatgaaa 720 atcattgccg atatcttcga gtacaccgct aagcacatgc ccaagttcaa ctcaattagc 780 atctccgggt atcatatgca ggaagcagga gccgacgcta ttctggagct ggcttacacc 840 ctggcagatg gcctggaata ttctcgaacc ggactgcagg caggcctgac aatcgacgag 900 ttcgctccta gactgagttt cttttgggga attggcatga acttttacat ggagatcgcc 960 aagatgaggg ctggccggag actgtgggca cacctgatcg agaagatgtt ccagcctaag 1020 aactctaaga gtctgctgct gcgggcccat tgccagacat ccggctggtc tctgactgaa 1080 caggacccat ataacaatat tgtcagaacc gcaatcgagg caatggcagc cgtgttcgga 1140 ggaacccaga gcctgcacac aaactccttt gatgaggccc tggggctgcc taccgtgaag 1200 tctgctagga ttgcacgcaa tacacagatc attatccagg aggaatccgg aatcccaaag 1260 gtggccgatc cctggggagg ctcttacatg atggagtgcc tgacaaacga cgtgtatgat 1320 gctgcactga agctgattaa tgaaatcgag gaaatggggg gaatggcaaa ggccgtggct 1380 gagggcattc caaaactgag gatcgaggaa tgtgcagcta ggcgccaggc acgaattgac 1440 tcaggaagcg aagtgatcgt cggggtgaat aagtaccagc tggagaaaga agacgcagtc 1500 gaagtgctgg ccatcgataa cacaagcgtg cgcaatcgac agattgagaa gctgaagaaa 1560 atcaaaagct cccgcgatca ggcactggcc gaacgatgcc tggcagccct gactgagtgt 1620 gctgcaagcg gggacggaaa cattctggct ctggcagtcg atgcctcccg ggctagatgc 1680 actgtggggg aaatcaccga cgccctgaag aaagtcttcg gagagcacaa ggccaatgat 1740 cggatggtga gcggcgctta tagacaggag ttcggggaat ctaaagagat taccagtgcc 1800 atcaagaggg tgcacaagtt catggagaga gaagggcgac ggcccaggct gctggtggca 1860 aagatgggac aggacggaca tgatcgcgga gcaaaagtca ttgccaccgg gttcgctgac 1920 ctgggatttg acgtggatat cggccctctg ttccagacac cacgagaggt cgcacagcag 1980 gcagtcgacg ctgatgtgca cgcagtcgga gtgtccactc tggcagctgg ccataagacc 2040 ctggtgcctg aactgatcaa agagctgaac tctctgggca gaccagacat cctggtcatg 2100 tgcggcggcg tgatcccacc ccaggattac gaattcctgt ttgaggtcgg ggtgagcaac 2160 gtgttcggac caggaaccag gatccctaag gccgcagtgc aggtcctgga tgatattgaa 2220 aagtgtctgg aaaagaaaca gcagtcagtg taa 2253 <210> 116 <211> 2250 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 116 ctgagagcca aaaaccagct gttcctgctg agcccccact atctgagaca ggtcaaagaa 60 agttccggga gtagactgat ccagcagaga ctgctgcacc agcagcagcc actgcatcct 120 gagtgggccg ctctggccaa gaaacagctg aagggcaaaa acccagaaga cctgatctgg 180 cacactccag aggggatttc aatcaagccc ctgtacagca aaagggacac tatggatctg 240 ccagaggaac tgccaggagt gaagcctttc acccgcggac cttacccaac tatgtatacc 300 tttcgaccct ggacaattcg gcagtacgcc ggcttcagta ctgtggagga atcaaacaag 360 ttttataagg acaacatcaa ggctggacag cagggcctga gtgtggcatt cgatctggcc 420 acacatcgcg gctatgactc agataatccc agagtcaggg gggacgtggg aatggcagga 480 gtcgctatcg acacagtgga agatactaag attctgttcg atggaatccc tctggagaaa 540 atgtctgtga gtatgacaat gaacggcgct gtcattcccg tgctggcaaa cttcatcgtc 600 actggcgagg aacagggggt gcctaaggaa aaactgaccg gcacaattca gaacgacatc 660 ctgaaggagt tcatggtgcg gaatacttac atttttcccc ctgaaccatc catgaaaatc 720 attgccgata tcttcgagta caccgctaag cacatgccca agttcaactc aattagcatc 780 tccgggtatc atatgcagga agcaggagcc gacgctattc tggagctggc ttacaccctg 840 gcagatggcc tggaatattc tcgaaccgga ctgcaggcag gcctgacaat cgacgagttc 900 gctcctagac tgagtttctt ttggggaatt ggcatgaact tttacatgga gatcgccaag 960 atgagggctg gccggagact gtgggcacac ctgatcgaga agatgttcca gcctaagaac 1020 tctaagagtc tgctgctgcg ggcccattgc cagacatccg gctggtctct gactgaacag 1080 gacccatata acaatattgt cagaaccgca atcgaggcaa tggcagccgt gttcggagga 1140 acccagagcc tgcacacaaa ctcctttgat gaggccctgg ggctgcctac cgtgaagtct 1200 gctaggattg cacgcaatac acagatcatt atccaggagg aatccggaat cccaaaggtg 1260 gccgatccct ggggaggctc ttacatgatg gagtgcctga caaacgacgt gtatgatgct 1320 gcactgaagc tgattaatga aatcgaggaa atggggggaa tggcaaaggc cgtggctgag 1380 ggcattccaa aactgaggat cgaggaatgt gcagctaggc gccaggcacg aattgactca 1440 ggaagcgaag tgatcgtcgg ggtgaataag taccagctgg agaaagaaga cgcagtcgaa 1500 gtgctggcca tcgataacac aagcgtgcgc aatcgacaga ttgagaagct gaagaaaatc 1560 aaaagctccc gcgatcaggc actggccgaa cgatgcctgg cagccctgac tgagtgtgct 1620 gcaagcgggg acggaaacat tctggctctg gcagtcgatg cctcccgggc tagatgcact 1680 gtgggggaaa tcaccgacgc cctgaagaaa gtcttcggag agcacaaggc caatgatcgg 1740 atggtgagcg gcgcttatag acaggagttc ggggaatcta aagagattac cagtgccatc 1800 aagagggtgc acaagttcat ggagagagaa gggcgacggc ccaggctgct ggtggcaaag 1860 atgggacagg acggacatga tcgcggagca aaagtcattg ccaccgggtt cgctgacctg 1920 ggatttgacg tggatatcgg ccctctgttc cagacaccac gagaggtcgc acagcaggca 1980 gtcgacgctg atgtgcacgc agtcggagtg tccactctgg cagctggcca taagaccctg 2040 gtgcctgaac tgatcaaaga gctgaactct ctgggcagac cagacatcct ggtcatgtgc 2100 ggcggcgtga tcccacccca ggattacgaa ttcctgtttg aggtcggggt gagcaacgtg 2160 ttcggaccag gaaccaggat ccctaaggcc gcagtgcagg tcctggatga tattgaaaag 2220 tgtctggaaa agaaacagca gtcagtgtaa 2250 <210> 117 <211> 2253 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 117 atgttaagag ctaagaatca gcttttttta ctttcacctc attacctgag gcaggtaaaa 60 gaatcatcag gctccaggct catacagcaa cgacttctac accagcaaca gccccttcac 120 ccagaatggg ctgccctggc taaaaagcag ctgaaaggca aaaacccaga agacctaata 180 tggcacaccc cggaagggat ctctataaaa cccttgtatt ccaagagaga tactatggac 240 ttacctgaag aacttccagg agtgaagcca ttcacacgtg gaccatatcc taccatgtat 300 acctttaggc cctggaccat ccgccagtat gctggtttta gtactgtgga agaaagcaat 360 aagttctata aggacaacat taaggctggt cagcagggat tatcagttgc ctttgatctg 420 gcgacacatc gtggctatga ttcagacaac cctcgagttc gtggtgatgt tggaatggct 480 ggagttgcta ttgacactgt ggaagatacc aaaattcttt ttgatggaat tcctttagaa 540 aaaatgtcag tttccatgac tatgaatgga gcagttattc cagttcttgc aaattttata 600 gtaactggag aagaacaagg tgtacctaaa gagaagctta ctggtaccat ccaaaatgat 660 atactaaagg aatttatggt tcgaaataca tacatttttc ctccagaacc atccatgaaa 720 attattgctg acatatttga atatacagca aagcacatgc caaaatttaa ttcaatttca 780 attagtggat accatatgca ggaagcaggg gctgatgcca ttctggagct ggcctatact 840 ttagcagatg gattggagta ctctagaact ggactccagg ctggcctgac aattgatgaa 900 tttgcaccaa ggttgtcttt cttctgggga attggaatga atttctatat ggaaatagca 960 aagatgagag ctggtagaag actctgggct cacttaatag agaaaatgtt tcagcctaaa 1020 aactcaaaat ctcttcttct aagagcacac tgtcagacat ctggatggtc acttactgag 1080 caggatccct acaataatat tgtccgtact gcaatagaag caatggcagc agtatttgga 1140 gggactcagt ctttgcacac aaattctttt gatgaagctt tgggtttgcc aactgtgaaa 1200 agtgctcgaa ttgccaggaa cacacaaatc atcattcaag aagaatctgg gattcccaaa 1260 gtggctgatc cttggggagg ttcttacatg atggaatgtc tcacaaatga tgtttatgat 1320 gctgctttaa agctcattaa tgaaattgaa gaaatgggtg gaatggccaa agctgtagct 1380 gagggaatac ctaaacttcg aattgaagaa tgtgctgccc gaagacaagc tagaatagat 1440 tctggttctg aagtaattgt tggagtaaat aagtaccagt tggaaaaaga agacgctgta 1500 gaagttctgg caattgataa tacttcagtg cgaaacaggc agattgaaaa acttaagaag 1560 atcaaatcca gcagggatca agctttggct gaacgttgtc ttgctgcact aaccgaatgt 1620 gctgctagcg gagatggaaa tatcctggct cttgcagtgg atgcatctcg ggcaagatgt 1680 acagtgggag aaatcacaga tgccctgaaa aaggtatttg gtgaacataa agcgaatgat 1740 cgaatggtga gtggagcata tcgccaggaa tttggagaaa gtaaagagat aacatctgct 1800 atcaagaggg ttcataaatt catggaacgt gaaggtcgca gacctcgtct tcttgtagca 1860 aaaatgggac aagatggcca tgacagagga gcaaaagtta ttgctacagg atttgctgat 1920 cttggttttg atgtggacat aggccctctt ttccagactc ctcgtgaagt ggcccagcag 1980 gctgtggatg cggatgtgca tgctgtgggc ataagcaccc tcgctgctgg tcataaaacc 2040 ctagttcctg aactcatcaa agaacttaac tcccttggac ggccagatat tcttgtcatg 2100 tgtggagggg tgataccacc tcaggattat gaatttctgt ttgaagttgg tgtttccaat 2160 gtatttggtc ctgggactcg aattccaaag gctgccgttc aggtgcttga tgatattgag 2220 aagtgtttgg aaaagaagca gcaatctgta taa 2253 <210> 118 <211> 2250 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 118 ttaagagcta agaatcagct ttttttactt tcacctcatt acctgaggca ggtaaaagaa 60 tcatcaggct ccaggctcat acagcaacga cttctacacc agcaacagcc ccttcaccca 120 gaatgggctg ccctggctaa aaagcagctg aaaggcaaaa acccagaaga cctaatatgg 180 cacaccccgg aagggatctc tataaaaccc ttgtattcca agagagatac tatggactta 240 cctgaagaac ttccaggagt gaagccattc acacgtggac catatcctac catgtatacc 300 tttaggccct ggaccatccg ccagtatgct ggttttagta ctgtggaaga aagcaataag 360 ttctataagg acaacattaa ggctggtcag cagggattat cagttgcctt tgatctggcg 420 acacatcgtg gctatgattc agacaaccct cgagttcgtg gtgatgttgg aatggctgga 480 gttgctattg acactgtgga agataccaaa attctttttg atggaattcc tttagaaaaa 540 atgtcagttt ccatgactat gaatggagca gttattccag ttcttgcaaa ttttatagta 600 actggagaag aacaaggtgt acctaaagag aagcttactg gtaccatcca aaatgatata 660 ctaaaggaat ttatggttcg aaatacatac atttttcctc cagaaccatc catgaaaatt 720 attgctgaca tatttgaata tacagcaaag cacatgccaa aatttaattc aatttcaatt 780 agtggatacc atatgcagga agcaggggct gatgccattc tggagctggc ctatacttta 840 gcagatggat tggagtactc tagaactgga ctccaggctg gcctgacaat tgatgaattt 900 gcaccaaggt tgtctttctt ctggggaatt ggaatgaatt tctatatgga aatagcaaag 960 atgagagctg gtagaagact ctgggctcac ttaatagaga aaatgtttca gcctaaaaac 1020 tcaaaatctc ttcttctaag agcacactgt cagacatctg gatggtcact tactgagcag 1080 gatccctaca ataatattgt ccgtactgca atagaagcaa tggcagcagt atttggaggg 1140 actcagtctt tgcacacaaa ttcttttgat gaagctttgg gtttgccaac tgtgaaaagt 1200 gctcgaattg ccaggaacac acaaatcatc attcaagaag aatctgggat tcccaaagtg 1260 gctgatcctt ggggaggttc ttacatgatg gaatgtctca caaatgatgt ttatgatgct 1320 gctttaaagc tcattaatga aattgaagaa atgggtggaa tggccaaagc tgtagctgag 1380 ggaataccta aacttcgaat tgaagaatgt gctgcccgaa gacaagctag aatagattct 1440 ggttctgaag taattgttgg agtaaataag taccagttgg aaaaagaaga cgctgtagaa 1500 gttctggcaa ttgataatac ttcagtgcga aacaggcaga ttgaaaaact taagaagatc 1560 aaatccagca gggatcaagc tttggctgaa cgttgtcttg ctgcactaac cgaatgtgct 1620 gctagcggag atggaaatat cctggctctt gcagtggatg catctcgggc aagatgtaca 1680 gtgggagaaa tcacagatgc cctgaaaaag gtatttggtg aacataaagc gaatgatcga 1740 atggtgagtg gagcatatcg ccaggaattt ggagaaagta aagagataac atctgctatc 1800 aagagggttc ataaattcat ggaacgtgaa ggtcgcagac ctcgtcttct tgtagcaaaa 1860 atgggacaag atggccatga cagaggagca aaagttattg ctacaggatt tgctgatctt 1920 ggttttgatg tggacatagg ccctcttttc cagactcctc gtgaagtggc ccagcaggct 1980 gtggatgcgg atgtgcatgc tgtgggcata agcaccctcg ctgctggtca taaaacccta 2040 gttcctgaac tcatcaaaga acttaactcc cttggacggc cagatattct tgtcatgtgt 2100 ggaggggtga taccacctca ggattatgaa tttctgtttg aagttggtgt ttccaatgta 2160 tttggtcctg ggactcgaat tccaaaggct gccgttcagg tgcttgatga tattgagaag 2220 tgtttggaaa agaagcagca atctgtataa 2250 <210> 119 <211> 2250 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 119 atgctgcggg ccaagaacca gctgttcctg ctgagccctc actacctgcg gcaggtgaag 60 gagagcagcg gcagccggct gatccagcag cggctgctgc accagcagca gcccctgcac 120 cccgagtggg ccgccctggc caagaagcag ctgaagggca agaaccccga ggacctgatc 180 tggcacacgc ccgagggcat cagcatcaag cccctgtaca gcaagcggga caccatggac 240 ctgcccgagg agctgcccgg cgtgaagccc ttcacccggg gcccctaccc caccatgtac 300 accttccggc cctggaccat ccggcagtac gccggcttca gcaccgtgga ggagagcaac 360 aagttctaca aggacaacat caaggccggc cagcagggcc tgagcgtggc cttcgacctg 420 gccacccacc ggggctacga cagcgacaac ccacgggtgc ggggcgacgt gggcatggcc 480 ggcgtggcca tcgacaccgt ggaggacacc aagatcctgt tcgacggcat ccctctggag 540 aagatgagcg tgagcatgac catgaacggc gccgtgatcc ccgtgctggc caacttcatc 600 gtgaccggcg aggagcaggg cgtgcccaag gagaagctga ccggcaccat ccagaacgac 660 atcctgaagg agttcatggt gcggaacacc tacatcttcc ctcccgagcc cagcatgaag 720 atcatcgccg acatcttcga gtacaccgcc aagcacatgc ccaagttcaa cagcatcagc 780 atcagcggct accacatgca ggaggccggc gccgacgcca tcctggagct ggcctacacc 840 ctggccgacg gcctggagta cagccggacc ggcctgcagg ccggcctgac catcgacgag 900 ttcgcgcccc ggctgagctt cttctggggc atcggcatga acttctacat ggagatcgcc 960 aagatgcggg ccggccggcg gctgtgggcc cacctgatcg agaagatgtt ccagcccaag 1020 aacagcaaga gcctgctgct gcgggcccac tgccagacca gcggctggag cctgaccgag 1080 caggacccct acaacaacat cgtgcggacc gccatcgagg ccatggccgc cgtgttcggc 1140 ggcacccaga gcctgcacac caacagcttc gacgaggccc tgggcctgcc caccgtgaag 1200 agcgcccgga tcgcccggaa cacccagatc atcatccagg aggagagcgg catccccaag 1260 gtggccgacc cctggggcgg cagctacatg atggagtgcc tgaccaacga cgtgtacgac 1320 gccgccctga agctgatcaa cgagatcgag gagatgggcg gcatggccaa ggccgtggcc 1380 gagggcatcc ccaagctgcg gatcgaggag tgcgccgccc ggcggcaggc ccggatcgac 1440 agcggcagcg aggtgatcgt gggcgtgaac aagtaccagc tggagaagga ggacgccgtg 1500 gaggtgctgg ccatcgacaa caccagcgtg cggaaccggc agatcgagaa gctgaagaag 1560 atcaagagca gccgggacca ggccctggcc gagcggtgcc tggccgccct gaccgagtgc 1620 gccgccagcg gcgacggcaa catcctggcc ctggccgtgg acgccagccg ggcccggtgc 1680 accgtgggcg agatcaccga cgccctgaag aaggtgttcg gcgagcacaa ggccaacgac 1740 cggatggtga gcggcgccta ccggcaggag ttcggcgaga gcaaggagat caccagcgcc 1800 atcaagcggg tgcacaagtt catggagcgg gagggccggc ggccccggct gctggtggcc 1860 aagatgggcc aggacggcca cgaccggggc gccaaggtga tcgccaccgg cttcgccgac 1920 ctgggcttcg acgtggacat cggcccactg ttccagacgc cccgggaggt ggcccagcag 1980 gccgtggacg ccgacgtgca cgccgtgggc gtgagcaccc tggccgccgg ccacaagacc 2040 ctggtgcccg agctgatcaa ggagctgaac agcctgggcc ggcccgacat cctggtgatg 2100 tgcggcggcg tgatcccgcc ccaggactac gagttcctgt tcgaggtggg cgtgagcaac 2160 gtgttcggcc ccggcacccg gatccccaag gccgccgtgc aggtgctgga cgacatcgag 2220 aagtgcctgg agaagaagca gcagagcgtg 2250 <210> 120 <211> 2247 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 120 ctgcgggcca agaaccagct gttcctgctg agccctcact acctgcggca ggtgaaggag 60 agcagcggca gccggctgat ccagcagcgg ctgctgcacc agcagcagcc cctgcacccc 120 gagtgggccg ccctggccaa gaagcagctg aagggcaaga accccgagga cctgatctgg 180 cacacgcccg agggcatcag catcaagccc ctgtacagca agcgggacac catggacctg 240 cccgaggagc tgcccggcgt gaagcccttc acccggggcc cctaccccac catgtacacc 300 ttccggccct ggaccatccg gcagtacgcc ggcttcagca ccgtggagga gagcaacaag 360 ttctacaagg acaacatcaa ggccggccag cagggcctga gcgtggcctt cgacctggcc 420 acccaccggg gctacgacag cgacaaccca cgggtgcggg gcgacgtggg catggccggc 480 gtggccatcg acaccgtgga ggacaccaag atcctgttcg acggcatccc tctggagaag 540 atgagcgtga gcatgaccat gaacggcgcc gtgatccccg tgctggccaa cttcatcgtg 600 accggcgagg agcagggcgt gcccaaggag aagctgaccg gcaccatcca gaacgacatc 660 ctgaaggagt tcatggtgcg gaacacctac atcttccctc ccgagcccag catgaagatc 720 atcgccgaca tcttcgagta caccgccaag cacatgccca agttcaacag catcagcatc 780 agcggctacc acatgcagga ggccggcgcc gacgccatcc tggagctggc ctacaccctg 840 gccgacggcc tggagtacag ccggaccggc ctgcaggccg gcctgaccat cgacgagttc 900 gcgccccggc tgagcttctt ctggggcatc ggcatgaact tctacatgga gatcgccaag 960 atgcgggccg gccggcggct gtgggcccac ctgatcgaga agatgttcca gcccaagaac 1020 agcaagagcc tgctgctgcg ggcccactgc cagaccagcg gctggagcct gaccgagcag 1080 gacccctaca acaacatcgt gcggaccgcc atcgaggcca tggccgccgt gttcggcggc 1140 acccagagcc tgcacaccaa cagcttcgac gaggccctgg gcctgcccac cgtgaagagc 1200 gcccggatcg cccggaacac ccagatcatc atccaggagg agagcggcat ccccaaggtg 1260 gccgacccct ggggcggcag ctacatgatg gagtgcctga ccaacgacgt gtacgacgcc 1320 gccctgaagc tgatcaacga gatcgaggag atgggcggca tggccaaggc cgtggccgag 1380 ggcatcccca agctgcggat cgaggagtgc gccgcccggc ggcaggcccg gatcgacagc 1440 ggcagcgagg tgatcgtggg cgtgaacaag taccagctgg agaaggagga cgccgtggag 1500 gtgctggcca tcgacaacac cagcgtgcgg aaccggcaga tcgagaagct gaagaagatc 1560 aagagcagcc gggaccaggc cctggccgag cggtgcctgg ccgccctgac cgagtgcgcc 1620 gccagcggcg acggcaacat cctggccctg gccgtggacg ccagccgggc ccggtgcacc 1680 gtgggcgaga tcaccgacgc cctgaagaag gtgttcggcg agcacaaggc caacgaccgg 1740 atggtgagcg gcgcctaccg gcaggagttc ggcgagagca aggagatcac cagcgccatc 1800 aagcgggtgc acaagttcat ggagcgggag ggccggcggc cccggctgct ggtggccaag 1860 atgggccagg acggccacga ccggggcgcc aaggtgatcg ccaccggctt cgccgacctg 1920 ggcttcgacg tggacatcgg cccactgttc cagacgcccc gggaggtggc ccagcaggcc 1980 gtggacgccg acgtgcacgc cgtgggcgtg agcaccctgg ccgccggcca caagaccctg 2040 gtgcccgagc tgatcaagga gctgaacagc ctgggccggc ccgacatcct ggtgatgtgc 2100 ggcggcgtga tcccgcccca ggactacgag ttcctgttcg aggtgggcgt gagcaacgtg 2160 ttcggccccg gcacccggat ccccaaggcc gccgtgcagg tgctggacga catcgagaag 2220 tgcctggaga agaagcagca gagcgtg 2247 <210> 121 <211> 750 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 121 Met Leu Arg Ala Lys Asn Gln Leu Phe Leu Leu Ser Pro His Tyr Leu 1 5 10 15 Arg Gln Val Lys Glu Ser Ser Gly Ser Arg Leu Ile Gln Gln Arg Leu 20 25 30 Leu His Gln Gln Gln Pro Leu His Pro Glu Trp Ala Ala Leu Ala Lys 35 40 45 Lys Gln Leu Lys Gly Lys Asn Pro Glu Asp Leu Ile Trp His Thr Pro 50 55 60 Glu Gly Ile Ser Ile Lys Pro Leu Tyr Ser Lys Arg Asp Thr Met Asp 65 70 75 80 Leu Pro Glu Glu Leu Pro Gly Val Lys Pro Phe Thr Arg Gly Pro Tyr 85 90 95 Pro Thr Met Tyr Thr Phe Arg Pro Trp Thr Ile Arg Gln Tyr Ala Gly 100 105 110 Phe Ser Thr Val Glu Glu Ser Asn Lys Phe Tyr Lys Asp Asn Ile Lys 115 120 125 Ala Gly Gln Gln Gly Leu Ser Val Ala Phe Asp Leu Ala Thr His Arg 130 135 140 Gly Tyr Asp Ser Asp Asn Pro Arg Val Arg Gly Asp Val Gly Met Ala 145 150 155 160 Gly Val Ala Ile Asp Thr Val Glu Asp Thr Lys Ile Leu Phe Asp Gly 165 170 175 Ile Pro Leu Glu Lys Met Ser Val Ser Met Thr Met Asn Gly Ala Val 180 185 190 Ile Pro Val Leu Ala Asn Phe Ile Val Thr Gly Glu Glu Gln Gly Val 195 200 205 Pro Lys Glu Lys Leu Thr Gly Thr Ile Gln Asn Asp Ile Leu Lys Glu 210 215 220 Phe Met Val Arg Asn Thr Tyr Ile Phe Pro Pro Glu Pro Ser Met Lys 225 230 235 240 Ile Ile Ala Asp Ile Phe Glu Tyr Thr Ala Lys His Met Pro Lys Phe 245 250 255 Asn Ser Ile Ser Ile Ser Gly Tyr His Met Gln Glu Ala Gly Ala Asp 260 265 270 Ala Ile Leu Glu Leu Ala Tyr Thr Leu Ala Asp Gly Leu Glu Tyr Ser 275 280 285 Arg Thr Gly Leu Gln Ala Gly Leu Thr Ile Asp Glu Phe Ala Pro Arg 290 295 300 Leu Ser Phe Phe Trp Gly Ile Gly Met Asn Phe Tyr Met Glu Ile Ala 305 310 315 320 Lys Met Arg Ala Gly Arg Arg Leu Trp Ala His Leu Ile Glu Lys Met 325 330 335 Phe Gln Pro Lys Asn Ser Lys Ser Leu Leu Leu Arg Ala His Cys Gln 340 345 350 Thr Ser Gly Trp Ser Leu Thr Glu Gln Asp Pro Tyr Asn Asn Ile Val 355 360 365 Arg Thr Ala Ile Glu Ala Met Ala Ala Val Phe Gly Gly Thr Gln Ser 370 375 380 Leu His Thr Asn Ser Phe Asp Glu Ala Leu Gly Leu Pro Thr Val Lys 385 390 395 400 Ser Ala Arg Ile Ala Arg Asn Thr Gln Ile Ile Ile Gln Glu Glu Ser 405 410 415 Gly Ile Pro Lys Val Ala Asp Pro Trp Gly Gly Ser Tyr Met Met Glu 420 425 430 Cys Leu Thr Asn Asp Val Tyr Asp Ala Ala Leu Lys Leu Ile Asn Glu 435 440 445 Ile Glu Glu Met Gly Gly Met Ala Lys Ala Val Ala Glu Gly Ile Pro 450 455 460 Lys Leu Arg Ile Glu Glu Cys Ala Ala Arg Arg Gln Ala Arg Ile Asp 465 470 475 480 Ser Gly Ser Glu Val Ile Val Gly Val Asn Lys Tyr Gln Leu Glu Lys 485 490 495 Glu Asp Ala Val Glu Val Leu Ala Ile Asp Asn Thr Ser Val Arg Asn 500 505 510 Arg Gln Ile Glu Lys Leu Lys Lys Ile Lys Ser Ser Arg Asp Gln Ala 515 520 525 Leu Ala Glu Arg Cys Leu Ala Ala Leu Thr Glu Cys Ala Ala Ser Gly 530 535 540 Asp Gly Asn Ile Leu Ala Leu Ala Val Asp Ala Ser Arg Ala Arg Cys 545 550 555 560 Thr Val Gly Glu Ile Thr Asp Ala Leu Lys Lys Val Phe Gly Glu His 565 570 575 Lys Ala Asn Asp Arg Met Val Ser Gly Ala Tyr Arg Gln Glu Phe Gly 580 585 590 Glu Ser Lys Glu Ile Thr Ser Ala Ile Lys Arg Val His Lys Phe Met 595 600 605 Glu Arg Glu Gly Arg Arg Pro Arg Leu Leu Val Ala Lys Met Gly Gln 610 615 620 Asp Gly His Asp Arg Gly Ala Lys Val Ile Ala Thr Gly Phe Ala Asp 625 630 635 640 Leu Gly Phe Asp Val Asp Ile Gly Pro Leu Phe Gln Thr Pro Arg Glu 645 650 655 Val Ala Gln Gln Ala Val Asp Ala Asp Val His Ala Val Gly Val Ser 660 665 670 Thr Leu Ala Ala Gly His Lys Thr Leu Val Pro Glu Leu Ile Lys Glu 675 680 685 Leu Asn Ser Leu Gly Arg Pro Asp Ile Leu Val Met Cys Gly Gly Val 690 695 700 Ile Pro Pro Gln Asp Tyr Glu Phe Leu Phe Glu Val Gly Val Ser Asn 705 710 715 720 Val Phe Gly Pro Gly Thr Arg Ile Pro Lys Ala Ala Val Gln Val Leu 725 730 735 Asp Asp Ile Glu Lys Cys Leu Glu Lys Lys Gln Gln Ser Val 740 745 750 <210> 122 <211> 749 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Nucleic Acid <400> 122 Leu Arg Ala Lys Asn Gln Leu Phe Leu Leu Ser Pro His Tyr Leu Arg 1 5 10 15 Gln Val Lys Glu Ser Ser Gly Ser Arg Leu Ile Gln Gln Arg Leu Leu 20 25 30 His Gln Gln Gln Pro Leu His Pro Glu Trp Ala Ala Leu Ala Lys Lys 35 40 45 Gln Leu Lys Gly Lys Asn Pro Glu Asp Leu Ile Trp His Thr Pro Glu 50 55 60 Gly Ile Ser Ile Lys Pro Leu Tyr Ser Lys Arg Asp Thr Met Asp Leu 65 70 75 80 Pro Glu Glu Leu Pro Gly Val Lys Pro Phe Thr Arg Gly Pro Tyr Pro 85 90 95 Thr Met Tyr Thr Phe Arg Pro Trp Thr Ile Arg Gln Tyr Ala Gly Phe 100 105 110 Ser Thr Val Glu Glu Ser Asn Lys Phe Tyr Lys Asp Asn Ile Lys Ala 115 120 125 Gly Gln Gln Gly Leu Ser Val Ala Phe Asp Leu Ala Thr His Arg Gly 130 135 140 Tyr Asp Ser Asp Asn Pro Arg Val Arg Gly Asp Val Gly Met Ala Gly 145 150 155 160 Val Ala Ile Asp Thr Val Glu Asp Thr Lys Ile Leu Phe Asp Gly Ile 165 170 175 Pro Leu Glu Lys Met Ser Val Ser Met Thr Met Asn Gly Ala Val Ile 180 185 190 Pro Val Leu Ala Asn Phe Ile Val Thr Gly Glu Glu Gln Gly Val Pro 195 200 205 Lys Glu Lys Leu Thr Gly Thr Ile Gln Asn Asp Ile Leu Lys Glu Phe 210 215 220 Met Val Arg Asn Thr Tyr Ile Phe Pro Pro Glu Pro Ser Met Lys Ile 225 230 235 240 Ile Ala Asp Ile Phe Glu Tyr Thr Ala Lys His Met Pro Lys Phe Asn 245 250 255 Ser Ile Ser Ile Ser Gly Tyr His Met Gln Glu Ala Gly Ala Asp Ala 260 265 270 Ile Leu Glu Leu Ala Tyr Thr Leu Ala Asp Gly Leu Glu Tyr Ser Arg 275 280 285 Thr Gly Leu Gln Ala Gly Leu Thr Ile Asp Glu Phe Ala Pro Arg Leu 290 295 300 Ser Phe Phe Trp Gly Ile Gly Met Asn Phe Tyr Met Glu Ile Ala Lys 305 310 315 320 Met Arg Ala Gly Arg Arg Leu Trp Ala His Leu Ile Glu Lys Met Phe 325 330 335 Gln Pro Lys Asn Ser Lys Ser Leu Leu Leu Arg Ala His Cys Gln Thr 340 345 350 Ser Gly Trp Ser Leu Thr Glu Gln Asp Pro Tyr Asn Asn Ile Val Arg 355 360 365 Thr Ala Ile Glu Ala Met Ala Ala Val Phe Gly Gly Thr Gln Ser Leu 370 375 380 His Thr Asn Ser Phe Asp Glu Ala Leu Gly Leu Pro Thr Val Lys Ser 385 390 395 400 Ala Arg Ile Ala Arg Asn Thr Gln Ile Ile Ile Gln Glu Glu Ser Gly 405 410 415 Ile Pro Lys Val Ala Asp Pro Trp Gly Gly Ser Tyr Met Met Glu Cys 420 425 430 Leu Thr Asn Asp Val Tyr Asp Ala Ala Leu Lys Leu Ile Asn Glu Ile 435 440 445 Glu Glu Met Gly Gly Met Ala Lys Ala Val Ala Glu Gly Ile Pro Lys 450 455 460 Leu Arg Ile Glu Glu Cys Ala Ala Arg Arg Gln Ala Arg Ile Asp Ser 465 470 475 480 Gly Ser Glu Val Ile Val Gly Val Asn Lys Tyr Gln Leu Glu Lys Glu 485 490 495 Asp Ala Val Glu Val Leu Ala Ile Asp Asn Thr Ser Val Arg Asn Arg 500 505 510 Gln Ile Glu Lys Leu Lys Lys Ile Lys Ser Ser Arg Asp Gln Ala Leu 515 520 525 Ala Glu Arg Cys Leu Ala Ala Leu Thr Glu Cys Ala Ala Ser Gly Asp 530 535 540 Gly Asn Ile Leu Ala Leu Ala Val Asp Ala Ser Arg Ala Arg Cys Thr 545 550 555 560 Val Gly Glu Ile Thr Asp Ala Leu Lys Lys Val Phe Gly Glu His Lys 565 570 575 Ala Asn Asp Arg Met Val Ser Gly Ala Tyr Arg Gln Glu Phe Gly Glu 580 585 590 Ser Lys Glu Ile Thr Ser Ala Ile Lys Arg Val His Lys Phe Met Glu 595 600 605 Arg Glu Gly Arg Arg Pro Arg Leu Leu Val Ala Lys Met Gly Gln Asp 610 615 620 Gly His Asp Arg Gly Ala Lys Val Ile Ala Thr Gly Phe Ala Asp Leu 625 630 635 640 Gly Phe Asp Val Asp Ile Gly Pro Leu Phe Gln Thr Pro Arg Glu Val 645 650 655 Ala Gln Gln Ala Val Asp Ala Asp Val His Ala Val Gly Val Ser Thr 660 665 670 Leu Ala Ala Gly His Lys Thr Leu Val Pro Glu Leu Ile Lys Glu Leu 675 680 685 Asn Ser Leu Gly Arg Pro Asp Ile Leu Val Met Cys Gly Gly Val Ile 690 695 700 Pro Pro Gln Asp Tyr Glu Phe Leu Phe Glu Val Gly Val Ser Asn Val 705 710 715 720 Phe Gly Pro Gly Thr Arg Ile Pro Lys Ala Ala Val Gln Val Leu Asp 725 730 735 Asp Ile Glu Lys Cys Leu Glu Lys Lys Gln Gln Ser Val 740 745 <210> 123 <211> 354 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 123 Met Leu Ser Asn Leu Arg Ile Leu Leu Asn Asn Ala Ala Leu Arg Lys 1 5 10 15 Gly His Thr Ser Val Val Arg His Phe Trp Cys Gly Lys Pro Val Gln 20 25 30 Asn Lys Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe 35 40 45 Thr Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu Lys 50 55 60 Phe Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln Gly Lys 65 70 75 80 Ser Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg Leu Ser 85 90 95 Thr Glu Thr Gly Phe Ala Leu Leu Gly Gly His Pro Cys Phe Leu Thr 100 105 110 Thr Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu Thr Asp Thr Ala 115 120 125 Arg Val Leu Ser Ser Met Ala Asp Ala Val Leu Ala Arg Val Tyr Lys 130 135 140 Gln Ser Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser Ile Pro Ile Ile 145 150 155 160 Asn Gly Leu Ser Asp Leu Tyr His Pro Ile Gln Ile Leu Ala Asp Tyr 165 170 175 Leu Thr Leu Gln Glu His Tyr Ser Ser Leu Lys Gly Leu Thr Leu Ser 180 185 190 Trp Ile Gly Asp Gly Asn Asn Ile Leu His Ser Ile Met Met Ser Ala 195 200 205 Ala Lys Phe Gly Met His Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu 210 215 220 Pro Asp Ala Ser Val Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn 225 230 235 240 Gly Thr Lys Leu Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly 245 250 255 Gly Asn Val Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu 260 265 270 Glu Lys Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr Met 275 280 285 Lys Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His Cys Leu 290 295 300 Pro Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr Ser Pro Arg 305 310 315 320 Ser Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile Met Ala 325 330 335 Val Met Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys Pro 340 345 350 Lys Phe <210> 124 <211> 353 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 124 Leu Ser Asn Leu Arg Ile Leu Leu Asn Asn Ala Ala Leu Arg Lys Gly 1 5 10 15 His Thr Ser Val Val Arg His Phe Trp Cys Gly Lys Pro Val Gln Asn 20 25 30 Lys Val Gln Leu Lys Gly Arg Asp Leu Leu Thr Leu Lys Asn Phe Thr 35 40 45 Gly Glu Glu Ile Lys Tyr Met Leu Trp Leu Ser Ala Asp Leu Lys Phe 50 55 60 Arg Ile Lys Gln Lys Gly Glu Tyr Leu Pro Leu Leu Gln Gly Lys Ser 65 70 75 80 Leu Gly Met Ile Phe Glu Lys Arg Ser Thr Arg Thr Arg Leu Ser Thr 85 90 95 Glu Thr Gly Phe Ala Leu Leu Gly Gly His Pro Cys Phe Leu Thr Thr 100 105 110 Gln Asp Ile His Leu Gly Val Asn Glu Ser Leu Thr Asp Thr Ala Arg 115 120 125 Val Leu Ser Ser Met Ala Asp Ala Val Leu Ala Arg Val Tyr Lys Gln 130 135 140 Ser Asp Leu Asp Thr Leu Ala Lys Glu Ala Ser Ile Pro Ile Ile Asn 145 150 155 160 Gly Leu Ser Asp Leu Tyr His Pro Ile Gln Ile Leu Ala Asp Tyr Leu 165 170 175 Thr Leu Gln Glu His Tyr Ser Ser Leu Lys Gly Leu Thr Leu Ser Trp 180 185 190 Ile Gly Asp Gly Asn Asn Ile Leu His Ser Ile Met Met Ser Ala Ala 195 200 205 Lys Phe Gly Met His Leu Gln Ala Ala Thr Pro Lys Gly Tyr Glu Pro 210 215 220 Asp Ala Ser Val Thr Lys Leu Ala Glu Gln Tyr Ala Lys Glu Asn Gly 225 230 235 240 Thr Lys Leu Leu Leu Thr Asn Asp Pro Leu Glu Ala Ala His Gly Gly 245 250 255 Asn Val Leu Ile Thr Asp Thr Trp Ile Ser Met Gly Gln Glu Glu Glu 260 265 270 Lys Lys Lys Arg Leu Gln Ala Phe Gln Gly Tyr Gln Val Thr Met Lys 275 280 285 Thr Ala Lys Val Ala Ala Ser Asp Trp Thr Phe Leu His Cys Leu Pro 290 295 300 Arg Lys Pro Glu Glu Val Asp Asp Glu Val Phe Tyr Ser Pro Arg Ser 305 310 315 320 Leu Val Phe Pro Glu Ala Glu Asn Arg Lys Trp Thr Ile Met Ala Val 325 330 335 Met Val Ser Leu Leu Thr Asp Tyr Ser Pro Gln Leu Gln Lys Pro Lys 340 345 350 Phe <210> 125 <211> 175 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 125 tgttttatcg gtctgtatat cgaggtttat ttattaattt gaatagatat taagttttat 60 tatatttaca cttacatact aataataaat tcaacaaaca atttatttat gtttatttat 120 ttattaaaaa aaaacaaaaa ctcaaaattt cttctataaa gtaacaaaac tttta 175 <210> 126 <211> 255 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 126 tgtttgctgc ttgcaatgtt tgcccatttt agggtggaca caggacgctg tggtttctga 60 gccagggggc gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac 120 tggggtgacc ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg 180 cttaaatacg gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg 240 ggacagtgaa tcgca 255 <210> 127 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 127 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc t 141 <210> 128 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 128 taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 60 tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 120 tt 122 <210> 129 <211> 1445 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 129 tttcctggac tacttcagac gaacttcgta gggcgcataa gtctcgacca cgcaatgacg 60 cagcgatgct tgaaaaaaac accgctttca aggcggctgg acgaagaccg caagacaccc 120 tccacctcac ctagcctgta tctctgcaat agcctaatta cttcggaatc tcctgtcgta 180 attccttaga taaacggcaa ttaggtgaca ctctaaatct gtgtggaacc ggcttccaaa 240 cactctacca cctctattag tgacacagag agaatccttg agtggcttct aggtatattg 300 aacaacttca tcacgaattg agcagtgatc atggttctac gtatcaacca atattaacca 360 ctgtgctctg tagcattgct aaatcgggct gtctgtttca ccatagatcg tgaggccatg 420 cccacgggca ttagaactta gcctgtttag cgataatccc aacaatgagc tgggatatga 480 cgagaagtat ttagcaacct tttcgtgatc ggctacgtaa aacctcatat tacggcatgt 540 acctgatcat tgacctcagg ccatacgcat gtgggagaat agagggaata gcacgatata 600 ctgcctccct tatcttcctc aggttgaggc gcaatgatta tcactgctac gggcacagtg 660 ttactatcgg gatcagggac tgtgtctgta cccggttcta ccacgccgta gctcccacat 720 tgtcgccgta ctggtagtaa cctaccagta ctacagggac aggtcagatt attcttagaa 780 tgcctgtgta tagtttagag ccatagattg ccgagaaacg aagagagtgt atcacggcga 840 tttacggagt caagatagca acacatagga gtaccaaatc aataagtgta gtagagttac 900 aagtcgctcc cgagaatcag gtgatacttc tcaatcgtcg gaaacctgta acgattagac 960 cgcgtattag ttccatctaa tgatattgcc aagtactaaa cctcaatcac ataacaacgc 1020 atcaggctag cgacatcata ggagtcctgc aacatacgca ggcgtccagc gtcataaacg 1080 caggtgatga gtgccttatg caatctgggg cacaccaata cgagaatacc acgtcgttag 1140 ggccagcctg cgcttggtac gtgatcgagg agtatcgtct tgtgcacaca aacaaaatag 1200 actgggtccc aagcgcactt agacaaggca ttgtactact caagtgttgg atgtgaggaa 1260 tgatacaatc gaaccccgtc gttcggtcaa caatttggct agagctgtgt tgatacacag 1320 cggacgggag ttacggggac agtcctccga gctggccagc aagatgcagc tgacgcctgc 1380 accggaagta atccggaggc cggccaggcc tcctgcgagg gggcgcctcg agaccttgcg 1440 gccgc 1445 <210> 130 <211> 1445 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 130 tttcctggac tacttcagac gaacttcgta gggcgcataa gtctcgacca cgcaatgacg 60 cagcgatgct tgaaaaaaac cccgctttca aggcggctgg acgaagaccg caagacaccc 120 tccacctcac ctagcctgta tctctgcaat agcctaatta cttcggaatc tcctgtcgta 180 attccttaga taaacggcaa ttaggtgaca ctctaaatct gtgtggaacc ggcttccaaa 240 cactctacca cctctattag tgacacagag agaatccttg agtggcttct aggtatattg 300 aacaacttca tcacgaattg agcagtgatc atggttctac gtatcaacca atattaacca 360 ctgtgctctg tagcattgct aaatcgggct gtctgtttca ccatagatcg tgaggccatg 420 cccacgggca ttagaactta gcctgtttag cgataatccc aacaatgagc tgggatatga 480 cgagaagtat ttagcaacct tttcgtgatc ggctacgtaa aacctcatat tacggcatgt 540 acctgatcat tgacctcagg ccatacgcat gtgggagaat agagggaata gcacgatata 600 ctgcctccct tatcttcctc aggttgaggc gcaatgatta tcactgctac gggcacagtg 660 ttactatcgg gatcagggac tgtgtctgta cccggttcta ccacgccgta gctcccacat 720 tgtcgccgta ctggtagtaa cctaccagta ctacagggac aggtcagatt attcttagaa 780 tgcctgtgta tagtttagag ccatagattg ccgagaaacg aagagagtgt atcacggcga 840 tttacggagt caagatagca acacatagga gtaccaaatc aataagtgta gtagagttac 900 aagtcgctcc cgagaatcag gtgatacttc tcaatcgtcg gaaacctgta acgattagac 960 cgcgtattag ttccatctaa tgatattgcc aagtactaaa cctcaatcac ataacaacgc 1020 atcaggctag cgacatcata ggagtcctgc aacatacgca ggcgtccagc gtcataaacg 1080 caggtgatga gtgccttatg caatctgggg cacaccaata cgagaatacc acgtcgttag 1140 ggccagcctg cgcttggtac gtgatcgagg agtatcgtct tgtgcacaca aacaaaatag 1200 actgggtccc aagcgcactt agacaaggca ttgtactact caagtgttgg atgtgaggaa 1260 tgatacaatc gaaccccgtc gttcggtcaa caatttggct agagctgtgt tgatacacag 1320 cggacgggag ttacggggac agtcctccga gctggccagc aagatgcagc tgacgcctgc 1380 accggaagta atccggaggc cggccaggcc tcctgcgagg gggcgcctcg agaccttgcg 1440 gccgc 1445 <210> 131 <211> 927 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 131 tttcctgtcg acggaggcat gtacctgatc attgacctca ggccatacgc atgtgggaga 60 atagagggaa tagcacgata tactgcctcc cttatcttcc tcaggttgag gcgcaatgat 120 tatcactgct acgggcacag tgttactatc gggatcaggg actgtgtctg tacccggttc 180 taccacgccg tagctcccac attgtcgccg tactggtagt aacctaccag tactacaggg 240 acaggtcaga ttattcttag aatgcctgtg tatagtttag agccatagat tgccgagaaa 300 cgaagagagt gtatcacggc gatttacgga gtcaagatag caacacatag gagtaccaaa 360 tcaataagtg tagtagagtt acaagtcgct cccgagaatc aggtgatact tctcaatcgt 420 cggaaacctg taacgattag accgcgtatt agttccatct aatgatattg ccaagtacta 480 aacctcaatc acataacaac gcatcaggct agcgacatca taggagtcct gcaacatacg 540 caggcgtcca gcgtcataaa cgcaggtgat gagtgcctta tgcaatctgg ggcacaccaa 600 tacgagaata ccacgtcgtt agggccagcc tgcgcttggt acgtgatcga ggagtatcgt 660 cttgtgcaca caaacaaaat agactgggtc ccaagcgcac ttagacaagg cattgtacta 720 ctcaagtgtt ggatgtgagg aatgatacaa tcgaaccccg tcgttcggtc aacaatttgg 780 ctagagctgt gttgatacac agcggacggg agttacgggg acagtcctcc gagctggcca 840 gcaagatgca gctgacgcct gcaccggaag taatccggag gccggccagg cctcctgcga 900 gggggcgcct cgagaccttg cggccgc 927 <210> 132 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 132 aaacattgca agcagcaaac agcaaacaca cagccctccc tgcctgctga ccttggagct 60 ggggcagagg tcagagacct ctctgggccc atgccacctc caacatccac tcgacccctt 120 ggaatttcgg tggagaggag cagaggttgt cctggcgtgg tttaggtagt gtgagagggg 180 aatgactcct ttcggtaagt gcagtggaag ctgtacactg cccaggcaaa gcgtccgggc 240 agcgtaggcg ggcgactcag atcccagcca gtggacttag cccctgtttg ctcctccgat 300 aactggggtg accttggtta atattcacca gcagcctccc ccgttgcccc tctggatcca 360 ctgcttaaat acggacgagg acagggccct gtctcctcag cttcaggcac caccactgac 420 ctgggacagt gaatc 435 <210> 133 <211> 717 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 133 atggtttcca agggcgaaga actgtttacc ggcgtggtgc ccatcctggt ggaactggat 60 ggcgacgtta acggacacaa gttcagcgtc agcggagaag gcgaaggcga cgccacatac 120 ggaaagctga cactgaagtt tatctgcacc accggcaagc tgcccgtgcc ttggcctaca 180 ctggtcacca cactgacata cggcgtgcag tgcttcagca gataccccga ccacatgaag 240 cagcacgatt tcttcaagag cgccatgcct gagggctacg tgcaagagcg gaccatcttc 300 ttcaaggacg acgggaacta caagaccaga gccgaagtga agttcgaggg cgacaccctc 360 gtgaaccgga tcgagctgaa gggcatcgac ttcaaagagg acggaaacat cctgggccac 420 aaacttgagt acaactacaa cagccacaac gtctacatca tggccgacaa gcagaaaaac 480 ggcatcaaag tgaacttcaa gatccggcac aacatcgagg acggctctgt gcagctggct 540 gaccactacc agcagaacac acccatcgga gatggccctg tgctgctgcc cgataaccac 600 tacctgagca cacagagcgc cctgagcaag gaccccaacg agaagaggga tcacatggtg 660 ctgctggaat ttgtgaccgc tgccggcatc accctcggca tggatgaact gtacaag 717 <210> 134 <211> 628 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 134 atggtcttta ccctggaaga tttcgtcggc gactggcggc agacagccgg ctataatctg 60 gaccaggtgc tggaacaagg cggagtgtcc agcctgttcc agaatctggg agtgtccgtg 120 acacccatcc agcggattgt gctgtctggc gagaacggcc tgaagatcga catccacgtg 180 atcatccctt acgagggcct gagcggcgat cagatgggac agatcgagaa gattttcaag 240 gtggtgtacc ccgtggacga ccaccacttc aaagtgatcc tgcactacgg caccctggtc 300 atcgatggcg tgacccctaa catgatcgac tacttcggca gaccctacga gggaatcgcc 360 gtgttcgacg gcaagaaaat caccgtgacc ggcacactgt ggaacgggaa caagatcatc 420 gacgagcggc tgatcaaccc cgatggcagc ctgctgttca gagtgaccat taacggcgtg 480 acaggctggc ggctgtgcga aaggattctg gcctgatgat ctagagatct catatgcctt 540 taattaaaca ctagttctat agtgtcacct aaattccctt tagtgagggt taatggccgt 600 aggccgccag aattgggtcc agacatga 628 <210> 135 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 135 ggatccggag aaggacgggg aagcctgctt acatgcggag atgtggagga gaatcctggt 60 ccc 63 <210> 136 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 136 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 60 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 120 ta 122 <210> 137 <211> 1906 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 137 cctcgcagga ggcctggccg gcctccggat tacttccggt gcaggcgtca gctgcatctt 60 gctggccagc tcggaggact gtccccgtaa ctcccgtccg ctgtgtatca acacagctct 120 agccaaattg ttgaccgaac gacggggttc gattgtatca ttcctcacat ccaacacttg 180 agtagtacaa tgccttgtct aagtgcgctt gggacccagt ctattttgtt tgtgtgcaca 240 agacgatact cctcgatcac gtaccaagcg caggctggcc ctaacgacgt ggtattctcg 300 tattggtgtg ccccagattg cataaggcac tcatcacctg cgtttatgac gctggacgcc 360 tgcgtatgtt gcaggactcc tatgatgtcg ctagcctgat gcgttgttat gtgattgagg 420 tttagtactt ggcaatatca ttagatggaa ctaatacgcg gtctaatcgt tacaggtttc 480 cgacgattga gaagtatcac ctgattctcg ggagcgactt gtaactctac tacacttatt 540 gatttggtac tcctatgtgt tgctatcttg actccgtaaa tcgccgtgat acactctctt 600 cgtttctcgg caatctatgg ctctaaacta tacacaggca ttctaagaat aatctgacct 660 gtccctgtag tactggtagg ttactaccag tacggcgaca atgtgggagc tacggcgtgg 720 tagaaccggg tacagacaca gtccctgatc ccgatagtaa cactgtgccc gtagcagtga 780 taatcattgc gcctcaacct gaggaagata agggaggcag tatatcgtgc tattccctct 840 attctcccac atgcgtatgg cctgaggtca atgatcaggt acatgccgta atatgaggtt 900 ttacgtagcc gatcacgaaa aggttgctaa atacttctcg tcatatccca gctcattgtt 960 gggattatcg ctaaacaggc taagttctaa tgcccgtggg catggcctca cgatctatgg 1020 tgaaacagac agcccgattt agcaatgcta cagagcacag tggttaatat tggttgatac 1080 gtagaaccat gatcactgct caattcgtga tgaagttgtt caatatacct agaagccact 1140 caaggattct ctctgtgtca ctaatagagg tggtagagtg tttggaagcc ggttccacac 1200 agatttagag tgtcacctaa ttgccgttta tctaaggaat tacgacagga gattccgaag 1260 taattaggct attgcagaga tacaggctag gtgaggtgga gggtgtcttg cggtcttcgt 1320 ccagccgcct tgaaagcggg gtttttttca agcatcgctg cgtcattgcg tggtcgagac 1380 ttatgcgccc tacgaagttc gtctgaagta gtccaggaaa gacctacttt gcagttatct 1440 tcgcattccc acactcacca ctacaactac tcttccctca atttcccggt tagtttcgct 1500 aagctccgac cttgggttac tgtgttgcat ccgactcgct gcggctttct agtacgctgt 1560 actgtttcat tcttctgtag gtctggttcc gtaagtccga atttccaggc cgtggtctag 1620 tcctaattat tttctgtccc ggtagctata tttagccgag ggtttgtcca tttgcccggc 1680 gtagagcgcc gcgtttgcga acatttgcgc ccgtaatacg tagggacacc gtcgggtaat 1740 ggatggcaaa agccgaaaac ggcgtcttcc ggcgcttgga ttcagcgctc ttgagccata 1800 aaccgcgttg cttctttggt taattcgtat taatgatcct aagcgccagc ttattcgtta 1860 agaggcacta ggcgcgccgc ggcatgcgat cgccagcatg gctacg 1906 <210> 138 <211> 4596 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 138 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct gcggccgcga agactcttaa ccctagaaag ataatcatat tgtgacgtac 180 gttaaagata atcatgcgta aaattgacgc atgtgtttta tcggtctgta tatcgaggtt 240 tatttattaa tttgaataga tattaagttt tattatattt acacttacat actaataata 300 aattcaacaa acaatttatt tatgtttatt tatttattaa aaaaaaacaa aaactcaaaa 360 tttcttctat aaagtaacaa aacttttatc aaatacctgc agcccggggg atgcagaggg 420 acagcccccc cccaaagccc ccagggatgt aattacgtcc ctcccccgct agggggcagc 480 agcgagccgc ccggggctcc gctccggtcc ggcgctcccc ccgcatcccc gagccggcag 540 cgtgcgggga cagcccgggc acggggaagg tggcacggga tcgctttcct ctgaacgctt 600 ctcgctgctc tttgagcctg cagacacctg gggggatacg gggaaaagtt gactgtgcct 660 ttcgatcgag tactcctagg cgcgtgtttg ctgcttgcaa tgtttgccca ttttagggtg 720 gacacaggac gctgtggttt ctgagccagg gggcgactca gatcccagcc agtggactta 780 gcccctgttt gctcctccga taactggggt gaccttggtt aatattcacc agcagcctcc 840 cccgttgccc ctctggatcc actgcttaaa tacggacgag gacagggccc tgtctcctca 900 gcttcaggca ccaccactga cctgggacag tgaatcgcaa agcttattgg acgtcgctta 960 gcggtaccgc caccatgctg ttcaacctgc gcatcctgct gaacaacgcc gccttcagaa 1020 acggccacaa cttcatggtt cgaaacttca gatgcggcca gcctctccag aacaaggtgc 1080 agctgaaagg cagggacctg ctgaccctga agaacttcac cggcgaagag atcaagtaca 1140 tgctgtggct gtccgccgac ctgaagttca gaatcaagca gaagggcgag tacctgcctc 1200 tgctccaggg aaagtctctg ggcatgatct tcgagaagcg gagcaccaga accagactga 1260 gcaccgagac aggctttgcc ctgctcggag gacacccctg ctttctgaca acccaggaca 1320 tccacctggg cgtgaacgag agcctgaccg atacagccag agtgctgtcc tctatggccg 1380 atgccgtgct ggctagagtg tataagcaga gcgacctgga caccctggct aaagaggcca 1440 gcattcccat catcaacggc ctgtccgacc tgtatcaccc catccagatc ctggccgact 1500 acctgacact gcaagagcac tacagcagcc tgaagggact gaccctgtct tggatcggcg 1560 acggcaacaa catcctgcac agcattatga tgagcgccgc caagttcgga atgcacctcc 1620 aggccgctac acccaagggc tatgaacctg atgccagcgt gacaaagctg gccgagcagt 1680 acgccaaaga gaacggcaca aagctgctgc tgaccaacga tcccctggaa gctgctcacg 1740 gcggcaatgt gctgatcacc gatacctgga tcagcatggg ccaagaggaa gagaagaaga 1800 agcggctgca agccttccag ggctaccaag tgaccatgaa gacagccaag gtggccgcca 1860 gcgattggac ctttctgcac tgcctgcctc ggaagcctga agaggtggac gacgaggtgt 1920 tctacagccc tagaagcctg gtgttccccg aggccgagaa cagaaagtgg accatcatgg 1980 ctgtgatggt gtctctgctg accgactact cccctcagct ccagaagcct aagttctaat 2040 gaagatctca tatgccttta attaaacact agttctatag tgtcacctaa attcccttta 2100 gtgagggtta atggccgtag gccgccagaa ttgggtccag acatgataag atacattgat 2160 gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt 2220 gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat 2280 tgcattcatt ttatgtttca ggttcagggg gaggtgtggg aggttttttc ggactctagg 2340 acctgcgcat gcgcttggcg taatcatggt catagctgtt tcctgttttc cccgtatccc 2400 cccaggtgtc tgcaggctca aagagcagcg agaagcgttc agaggaaagc gatcccgtgc 2460 caccttcccc gtgcccgggc tgtccccgca cgctgccggc tcggggatgc ggggggagcg 2520 ccggaccgga gcggagcccc gggcggctcg ctgctgcccc ctagcggggg agggacgtaa 2580 ttacatccct gggggctttg ggggggggct gtccctctca ccgcggtgga gctccagctt 2640 ttgttcgaat tggggccccc cctcgagggt atcgatgata tctataacaa gaaaatatat 2700 atataataag ttatcacgta agtagaacat gaaataacaa tataattatc gtatgagtta 2760 aatcttaaaa gtcacgtaaa agataatcat gcgtcatttt gactcacgcg gtcgttatag 2820 ttcaaaatca gtgacactta ccgcattgac aagcacgcct cacgggagct ccaagcggcg 2880 actgagatgt cctaaatgca cagcgacgga ttcgcgctat ttagaaagag agagcaatat 2940 ttcaagaatg catgcgtcaa ttttacgcag actatctttc tagggttaat ctagctagcc 3000 ttaagggcgc tttcctggac tacttcagac gaacttcgta gggcgcataa gtctcgacca 3060 cgcaatgacg cagcgatgct tgaaaaaaac accgctttca aggcggctgg acgaagaccg 3120 caagacaccc tccacctcac ctagcctgta tctctgcaat agcctaatta cttcggaatc 3180 tcctgtcgta attccttaga taaacggcaa ttaggtgaca ctctaaatct gtgtggaacc 3240 ggcttccaaa cactctacca cctctattag tgacacagag agaatccttg agtggcttct 3300 aggtatattg aacaacttca tcacgaattg agcagtgatc atggttctac gtatcaacca 3360 atattaacca ctgtgctctg tagcattgct aaatcgggct gtctgtttca ccatagatcg 3420 tgaggccatg cccacgggca ttagaactta gcctgtttag cgataatccc aacaatgagc 3480 tgggatatga cgagaagtat ttagcaacct tttcgtgatc ggctacgtaa aacctcatat 3540 tacggcatgt acctgatcat tgacctcagg ccatacgcat gtgggagaat agagggaata 3600 gcacgatata ctgcctccct tatcttcctc aggttgaggc gcaatgatta tcactgctac 3660 gggcacagtg ttactatcgg gatcagggac tgtgtctgta cccggttcta ccacgccgta 3720 gctcccacat tgtcgccgta ctggtagtaa cctaccagta ctacagggac aggtcagatt 3780 attcttagaa tgcctgtgta tagtttagag ccatagattg ccgagaaacg aagagagtgt 3840 atcacggcga tttacggagt caagatagca acacatagga gtaccaaatc aataagtgta 3900 gtagagttac aagtcgctcc cgagaatcag gtgatacttc tcaatcgtcg gaaacctgta 3960 acgattagac cgcgtattag ttccatctaa tgatattgcc aagtactaaa cctcaatcac 4020 ataacaacgc atcaggctag cgacatcata ggagtcctgc aacatacgca ggcgtccagc 4080 gtcataaacg caggtgatga gtgccttatg caatctgggg cacaccaata cgagaatacc 4140 acgtcgttag ggccagcctg cgcttggtac gtgatcgagg agtatcgtct tgtgcacaca 4200 aacaaaatag actgggtccc aagcgcactt agacaaggca ttgtactact caagtgttgg 4260 atgtgaggaa tgatacaatc gaaccccgtc gttcggtcaa caatttggct agagctgtgt 4320 tgatacacag cggacgggag ttacggggac agtcctccga gctggccagc aagatgcagc 4380 tgacgcctgc accggaagta atccggaggc cggccaggcc tcctgcgagg gggcgcctcg 4440 agaccttgcg gccgcaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc 4500 gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg 4560 cctcagtgag cgagcgagcg cgcagctgcc tgcagg 4596 <210> 139 <211> 4790 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 139 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct gcggccgcga agactcttaa ccctagaaag ataatcatat tgtgacgtac 180 gttaaagata atcatgcgta aaattgacgc atgtgtttta tcggtctgta tatcgaggtt 240 tatttattaa tttgaataga tattaagttt tattatattt acacttacat actaataata 300 aattcaacaa acaatttatt tatgtttatt tatttattaa aaaaaaacaa aaactcaaaa 360 tttcttctat aaagtaacaa aacttttatc aaatacctgc agcccggggg atgcagaggg 420 acagcccccc cccaaagccc ccagggatgt aattacgtcc ctcccccgct agggggcagc 480 agcgagccgc ccggggctcc gctccggtcc ggcgctcccc ccgcatcccc gagccggcag 540 cgtgcgggga cagcccgggc acggggaagg tggcacggga tcgctttcct ctgaacgctt 600 ctcgctgctc tttgagcctg cagacacctg gggggatacg gggaaaagtt gactgtgcct 660 ttcgatcgag tactcctagg cgcgccccta aaatgggcaa acattgcaag cagcaaacag 720 caaacacaca gccctccctg cctgctgacc ttggagctgg ggcagaggtc agagacctct 780 ctgggcccat gccacctcca acatccactc gaccccttgg aatttcggtg gagaggagca 840 gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc 900 agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat 960 cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 1020 attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac 1080 agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atcaagctta 1140 ttggacgtcg cttagcggta ccgccaccat gctgttcaac ctgcgcatcc tgctgaacaa 1200 cgccgccttc agaaacggcc acaacttcat ggttcgaaac ttcagatgcg gccagcctct 1260 ccagaacaag gtgcagctga aaggcaggga cctgctgacc ctgaagaact tcaccggcga 1320 agagatcaag tacatgctgt ggctgtccgc cgacctgaag ttcagaatca agcagaaggg 1380 cgagtacctg cctctgctcc agggaaagtc tctgggcatg atcttcgaga agcggagcac 1440 cagaaccaga ctgagcaccg agacaggctt tgccctgctc ggaggacacc cctgctttct 1500 gacaacccag gacatccacc tgggcgtgaa cgagagcctg accgatacag ccagagtgct 1560 gtcctctatg gccgatgccg tgctggctag agtgtataag cagagcgacc tggacaccct 1620 ggctaaagag gccagcattc ccatcatcaa cggcctgtcc gacctgtatc accccatcca 1680 gatcctggcc gactacctga cactgcaaga gcactacagc agcctgaagg gactgaccct 1740 gtcttggatc ggcgacggca acaacatcct gcacagcatt atgatgagcg ccgccaagtt 1800 cggaatgcac ctccaggccg ctacacccaa gggctatgaa cctgatgcca gcgtgacaaa 1860 gctggccgag cagtacgcca aagagaacgg cacaaagctg ctgctgacca acgatcccct 1920 ggaagctgct cacggcggca atgtgctgat caccgatacc tggatcagca tgggccaaga 1980 ggaagagaag aagaagcggc tgcaagcctt ccagggctac caagtgacca tgaagacagc 2040 caaggtggcc gccagcgatt ggacctttct gcactgcctg cctcggaagc ctgaagaggt 2100 ggacgacgag gtgttctaca gccctagaag cctggtgttc cccgaggccg agaacagaaa 2160 gtggaccatc atggctgtga tggtgtctct gctgaccgac tactcccctc agctccagaa 2220 gcctaagttc taatgaagat ctcatatgcc tttaattaaa cactagttct atagtgtcac 2280 ctaaattccc tttagtgagg gttaatggcc gtaggccgcc agaattgggt ccagacatga 2340 taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 2400 tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 2460 ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt 2520 tttcggactc taggacctgc gcatgcgctt ggcgtaatca tggtcatagc tgtttcctgt 2580 tttccccgta tccccccagg tgtctgcagg ctcaaagagc agcgagaagc gttcagagga 2640 aagcgatccc gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc cggctcgggg 2700 atgcgggggg agcgccggac cggagcggag ccccgggcgg ctcgctgctg ccccctagcg 2760 ggggagggac gtaattacat ccctgggggc tttggggggg ggctgtccct ctcaccgcgg 2820 tggagctcca gcttttgttc gaattggggc cccccctcga gggtatcgat gatatctata 2880 acaagaaaat atatatataa taagttatca cgtaagtaga acatgaaata acaatataat 2940 tatcgtatga gttaaatctt aaaagtcacg taaaagataa tcatgcgtca ttttgactca 3000 cgcggtcgtt atagttcaaa atcagtgaca cttaccgcat tgacaagcac gcctcacggg 3060 agctccaagc ggcgactgag atgtcctaaa tgcacagcga cggattcgcg ctatttagaa 3120 agagagagca atatttcaag aatgcatgcg tcaattttac gcagactatc tttctagggt 3180 taatctagct agccttaagg gcgctttcct ggactacttc agacgaactt cgtagggcgc 3240 ataagtctcg accacgcaat gacgcagcga tgcttgaaaa aaaccccgct ttcaaggcgg 3300 ctggacgaag accgcaagac accctccacc tcacctagcc tgtatctctg caatagccta 3360 attacttcgg aatctcctgt cgtaattcct tagataaacg gcaattaggt gacactctaa 3420 atctgtgtgg aaccggcttc caaacactct accacctcta ttagtgacac agagagaatc 3480 cttgagtggc ttctaggtat attgaacaac ttcatcacga attgagcagt gatcatggtt 3540 ctacgtatca accaatatta accactgtgc tctgtagcat tgctaaatcg ggctgtctgt 3600 ttcaccatag atcgtgaggc catgcccacg ggcattagaa cttagcctgt ttagcgataa 3660 tcccaacaat gagctgggat atgacgagaa gtatttagca accttttcgt gatcggctac 3720 gtaaaacctc atattacggc atgtacctga tcattgacct caggccatac gcatgtggga 3780 gaatagaggg aatagcacga tatactgcct cccttatctt cctcaggttg aggcgcaatg 3840 attatcactg ctacgggcac agtgttacta tcgggatcag ggactgtgtc tgtacccggt 3900 tctaccacgc cgtagctccc acattgtcgc cgtactggta gtaacctacc agtactacag 3960 ggacaggtca gattattctt agaatgcctg tgtatagttt agagccatag attgccgaga 4020 aacgaagaga gtgtatcacg gcgatttacg gagtcaagat agcaacacat aggagtacca 4080 aatcaataag tgtagtagag ttacaagtcg ctcccgagaa tcaggtgata cttctcaatc 4140 gtcggaaacc tgtaacgatt agaccgcgta ttagttccat ctaatgatat tgccaagtac 4200 taaacctcaa tcacataaca acgcatcagg ctagcgacat cataggagtc ctgcaacata 4260 cgcaggcgtc cagcgtcata aacgcaggtg atgagtgcct tatgcaatct ggggcacacc 4320 aatacgagaa taccacgtcg ttagggccag cctgcgcttg gtacgtgatc gaggagtatc 4380 gtcttgtgca cacaaacaaa atagactggg tcccaagcgc acttagacaa ggcattgtac 4440 tactcaagtg ttggatgtga ggaatgatac aatcgaaccc cgtcgttcgg tcaacaattt 4500 ggctagagct gtgttgatac acagcggacg ggagttacgg ggacagtcct ccgagctggc 4560 cagcaagatg cagctgacgc ctgcaccgga agtaatccgg aggccggcca ggcctcctgc 4620 gagggggcgc ctcgagacct tgcggccgca ggaaccccta gtgatggagt tggccactcc 4680 ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg 4740 ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 4790 <210> 140 <211> 4700 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 140 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct gcggccgcga agactcttaa ccctagaaag ataatcatat tgtgacgtac 180 gttaaagata atcatgcgta aaattgacgc atgtgtttta tcggtctgta tatcgaggtt 240 tatttattaa tttgaataga tattaagttt tattatattt acacttacat actaataata 300 aattcaacaa acaatttatt tatgtttatt tatttattaa aaaaaaacaa aaactcaaaa 360 tttcttctat aaagtaacaa aacttttatc aaatacctgc agcccggggg atgcagaggg 420 acagcccccc cccaaagccc ccagggatgt aattacgtcc ctcccccgct agggggcagc 480 agcgagccgc ccggggctcc gctccggtcc ggcgctcccc ccgcatcccc gagccggcag 540 cgtgcgggga cagcccgggc acggggaagg tggcacggga tcgctttcct ctgaacgctt 600 ctcgctgctc tttgagcctg cagacacctg gggggatacg gggaaaagtt gactgtgcct 660 ttcgatcgag tactcctagg agctagcagg ttaattttta aaaagcagtc aaaagtccaa 720 gtggcccttg gcagcattta ctctctctgt ttgctctggt taataatctc aggagcacaa 780 acattccaga tccaggttaa tttttaaaaa gcagtcaaaa gtccaagtgg cccttggcag 840 catttactct ctctgtttgc tctggttaat aatctcagga gcacaaacat tccagatccg 900 gcgcgccagg gctggaagct acctttgaca tcatttcctc tgcgaatgca tgtataattt 960 ctacagaacc tattagaaag gatcacccag cctctgcttt tgtacaactt tcccttaaaa 1020 aactgccaat tccactgctg tttggcccaa tagtgagaac tttttcctgc tgcctcttgg 1080 tgcttttgcc tatggcccct attctgcctg ctgaagacac tcttgccagc atggacttaa 1140 acccctccag ctctgacaat cctctttctc ttttgtttta catgaagggt ctggcagcca 1200 aagcaatcac tcaaagttca aaccttatca ttttttgctt tgttcctctt ggccttggtt 1260 ttgtacatca gctttgaaaa taccatccca gggttaatgc tggggttaat ttataactaa 1320 gagtgctcta gttttgcaat acaggacatg ctataaaaat ggaaagatgt tgctttctga 1380 gagactgcag aagttggtcg tgaggcactg ggcaggtaag tatcaaggtt acaagacagg 1440 tttaaggaga ccaatagaaa ctgggcttgt cgagacagag aagactcttg cgtttctgat 1500 aggcacctat tggtcttact gacatccact ttgcctttct ctccacaggt gtccagtggc 1560 aaagcttatt ggacgtcgct tagcggtacc gccaccatgc tgttcaacct gcgcatcctg 1620 ctgaacaacg ccgccttcag aaacggccac aacttcatgg ttcgaaactt cagatgcggc 1680 cagcctctcc agaacaaggt gcagctgaaa ggcagggacc tgctgaccct gaagaacttc 1740 accggcgaag agatcaagta catgctgtgg ctgtccgccg acctgaagtt cagaatcaag 1800 cagaagggcg agtacctgcc tctgctccag ggaaagtctc tgggcatgat cttcgagaag 1860 cggagcacca gaaccagact gagcaccgag acaggctttg ccctgctcgg aggacacccc 1920 tgctttctga caacccagga catccacctg ggcgtgaacg agagcctgac cgatacagcc 1980 agagtgctgt cctctatggc cgatgccgtg ctggctagag tgtataagca gagcgacctg 2040 gacaccctgg ctaaagaggc cagcattccc atcatcaacg gcctgtccga cctgtatcac 2100 cccatccaga tcctggccga ctacctgaca ctgcaagagc actacagcag cctgaaggga 2160 ctgaccctgt cttggatcgg cgacggcaac aacatcctgc acagcattat gatgagcgcc 2220 gccaagttcg gaatgcacct ccaggccgct acacccaagg gctatgaacc tgatgccagc 2280 gtgacaaagc tggccgagca gtacgccaaa gagaacggca caaagctgct gctgaccaac 2340 gatcccctgg aagctgctca cggcggcaat gtgctgatca ccgatacctg gatcagcatg 2400 ggccaagagg aagagaagaa gaagcggctg caagccttcc agggctacca agtgaccatg 2460 aagacagcca aggtggccgc cagcgattgg acctttctgc actgcctgcc tcggaagcct 2520 gaagaggtgg acgacgaggt gttctacagc cctagaagcc tggtgttccc cgaggccgag 2580 aacagaaagt ggaccatcat ggctgtgatg gtgtctctgc tgaccgacta ctcccctcag 2640 ctccagaagc ctaagttcta atgaagatct catatgcctt taattaaaca ctagttctat 2700 agtgtcacct aaattccctt tagtgagggt taatggccgt aggccgccag aattgggtcc 2760 agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa 2820 atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 2880 taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg 2940 ggaggttttt tcggactcta ggacctgcgc atgcgcttgg cgtaatcatg gtcatagctg 3000 tttcctgttt tccccgtatc cccccaggtg tctgcaggct caaagagcag cgagaagcgt 3060 tcagaggaaa gcgatcccgt gccaccttcc ccgtgcccgg gctgtccccg cacgctgccg 3120 gctcggggat gcggggggag cgccggaccg gagcggagcc ccgggcggct cgctgctgcc 3180 ccctagcggg ggagggacgt aattacatcc ctgggggctt tggggggggg ctgtccctct 3240 caccgcggtg gagctccagc ttttgttcga attggggccc cccctcgagg gtatcgatga 3300 tatctataac aagaaaatat atatataata agttatcacg taagtagaac atgaaataac 3360 aatataatta tcgtatgagt taaatcttaa aagtcacgta aaagataatc atgcgtcatt 3420 ttgactcacg cggtcgttat agttcaaaat cagtgacact taccgcattg acaagcacgc 3480 ctcacgggag ctccaagcgg cgactgagat gtcctaaatg cacagcgacg gattcgcgct 3540 atttagaaag agagagcaat atttcaagaa tgcatgcgtc aattttacgc agactatctt 3600 tctagggtta atctagctag ccttaagggc gctttcctgt cgacggaggc atgtacctga 3660 tcattgacct caggccatac gcatgtggga gaatagaggg aatagcacga tatactgcct 3720 cccttatctt cctcaggttg aggcgcaatg attatcactg ctacgggcac agtgttacta 3780 tcgggatcag ggactgtgtc tgtacccggt tctaccacgc cgtagctccc acattgtcgc 3840 cgtactggta gtaacctacc agtactacag ggacaggtca gattattctt agaatgcctg 3900 tgtatagttt agagccatag attgccgaga aacgaagaga gtgtatcacg gcgatttacg 3960 gagtcaagat agcaacacat aggagtacca aatcaataag tgtagtagag ttacaagtcg 4020 ctcccgagaa tcaggtgata cttctcaatc gtcggaaacc tgtaacgatt agaccgcgta 4080 ttagttccat ctaatgatat tgccaagtac taaacctcaa tcacataaca acgcatcagg 4140 ctagcgacat cataggagtc ctgcaacata cgcaggcgtc cagcgtcata aacgcaggtg 4200 atgagtgcct tatgcaatct ggggcacacc aatacgagaa taccacgtcg ttagggccag 4260 cctgcgcttg gtacgtgatc gaggagtatc gtcttgtgca cacaaacaaa atagactggg 4320 tcccaagcgc acttagacaa ggcattgtac tactcaagtg ttggatgtga ggaatgatac 4380 aatcgaaccc cgtcgttcgg tcaacaattt ggctagagct gtgttgatac acagcggacg 4440 ggagttacgg ggacagtcct ccgagctggc cagcaagatg cagctgacgc ctgcaccgga 4500 agtaatccgg aggccggcca ggcctcctgc gagggggcgc ctcgagacct tgcggccgca 4560 ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4620 cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg 4680 agcgcgcagc tgcctgcagg 4700 <210> 141 <211> 4531 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 141 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct gcggccgcga agactcttaa ccctagaaag ataatcatat tgtgacgtac 180 gttaaagata atcatgcgta aaattgacgc atgtgtttta tcggtctgta tatcgaggtt 240 tatttattaa tttgaataga tattaagttt tattatattt acacttacat actaataata 300 aattcaacaa acaatttatt tatgtttatt tatttattaa aaaaaaacaa aaactcaaaa 360 tttcttctat aaagtaacaa aacttttatc aaatacctgc agcccggggg atgcagaggg 420 acagcccccc cccaaagccc ccagggatgt aattacgtcc ctcccccgct agggggcagc 480 agcgagccgc ccggggctcc gctccggtcc ggcgctcccc ccgcatcccc gagccggcag 540 cgtgcgggga cagcccgggc acggggaagg tggcacggga tcgctttcct ctgaacgctt 600 ctcgctgctc tttgagcctg cagacacctg gggggatacg gggaaaagtt gactgtgcct 660 ttcgatcgag tactcctagg cgcgtgtttg ctgcttgcaa tgtttgccca ttttagggtg 720 gacacaggac gctgtggttt ctgagccagg gggcgactca gatcccagcc agtggactta 780 gcccctgttt gctcctccga taactggggt gaccttggtt aatattcacc agcagcctcc 840 cccgttgccc ctctggatcc actgcttaaa tacggacgag gacagggccc tgtctcctca 900 gcttcaggca ccaccactga cctgggacag tgaatcgcaa agcttattgg acgtcgctta 960 gcggtaccgc caccatgctg ttcaacctgc gcatcctgct gaacaacgcc gccttcagaa 1020 acggccacaa cttcatggtt cgaaacttca gatgcggcca gcctctccag aacaaggtgc 1080 agctgaaagg cagggacctg ctgaccctga agaacttcac cggcgaagag atcaagtaca 1140 tgctgtggct gtccgccgac ctgaagttca gaatcaagca gaagggcgag tacctgcctc 1200 tgctccaggg aaagtctctg ggcatgatct tcgagaagcg gagcaccaga accagactga 1260 gcaccgagac aggctttgcc ctgctcggag gacacccctg ctttctgaca acccaggaca 1320 tccacctggg cgtgaacgag agcctgaccg atacagccag agtgctgtcc tctatggccg 1380 atgccgtgct ggctagagtg tataagcaga gcgacctgga caccctggct aaagaggcca 1440 gcattcccat catcaacggc ctgtccgacc tgtatcaccc catccagatc ctggccgact 1500 acctgacact gcaagagcac tacagcagcc tgaagggact gaccctgtct tggatcggcg 1560 acggcaacaa catcctgcac agcattatga tgagcgccgc caagttcgga atgcacctcc 1620 aggccgctac acccaagggc tatgaacctg atgccagcgt gacaaagctg gccgagcagt 1680 acgccaaaga gaacggcaca aagctgctgc tgaccaacga tcccctggaa gctgctcacg 1740 gcggcaatgt gctgatcacc gatacctgga tcagcatggg ccaagaggaa gagaagaaga 1800 agcggctgca agccttccag ggctaccaag tgaccatgaa gacagccaag gtggccgcca 1860 gcgattggac ctttctgcac tgcctgcctc ggaagcctga agaggtggac gacgaggtgt 1920 tctacagccc tagaagcctg gtgttccccg aggccgagaa cagaaagtgg accatcatgg 1980 ctgtgatggt gtctctgctg accgactact cccctcagct ccagaagcct aagttcggat 2040 ccggcgaagg cagaggctca ctgcttactt gtggcgacgt ggaggagaac cccggaccta 2100 tggtttccaa gggcgaagaa ctgtttaccg gcgtggtgcc catcctggtg gaactggatg 2160 gcgacgttaa cggacacaag ttcagcgtca gcggagaagg cgaaggcgac gccacatacg 2220 gaaagctgac actgaagttt atctgcacca ccggcaagct gcccgtgcct tggcctacac 2280 tggtcaccac actgacatac ggcgtgcagt gcttcagcag ataccccgac cacatgaagc 2340 agcacgattt cttcaagagc gccatgcctg agggctacgt gcaagagcgg accatcttct 2400 tcaaggacga cgggaactac aagaccagag ccgaagtgaa gttcgagggc gacaccctcg 2460 tgaaccggat cgagctgaag ggcatcgact tcaaagagga cggaaacatc ctgggccaca 2520 aacttgagta caactacaac agccacaacg tctacatcat ggccgacaag cagaaaaacg 2580 gcatcaaagt gaacttcaag atccggcaca acatcgagga cggctctgtg cagctggctg 2640 accactacca gcagaacaca cccatcggag atggccctgt gctgctgccc gataaccact 2700 acctgagcac acagagcgcc ctgagcaagg accccaacga gaagagggat cacatggtgc 2760 tgctggaatt tgtgaccgct gccggcatca ccctcggcat ggatgaactg tacaagggct 2820 ccggagaagg acggggaagc ctgcttacat gcggagatgt ggaggagaat cctggtccca 2880 tggtctttac cctggaagat ttcgtcggcg actggcggca gacagccggc tataatctgg 2940 accaggtgct ggaacaaggc ggagtgtcca gcctgttcca gaatctggga gtgtccgtga 3000 cacccatcca gcggattgtg ctgtctggcg agaacggcct gaagatcgac atccacgtga 3060 tcatccctta cgagggcctg agcggcgatc agatgggaca gatcgagaag attttcaagg 3120 tggtgtaccc cgtggacgac caccacttca aagtgatcct gcactacggc accctggtca 3180 tcgatggcgt gacccctaac atgatcgact acttcggcag accctacgag ggaatcgccg 3240 tgttcgacgg caagaaaatc accgtgaccg gcacactgtg gaacgggaac aagatcatcg 3300 acgagcggct gatcaacccc gatggcagcc tgctgttcag agtgaccatt aacggcgtga 3360 caggctggcg gctgtgcgaa aggattctgg cctgatgatc tagagatctc atatgccttt 3420 aattaaacac tagttctata gtgtcaccta aattcccttt agtgagggtt aatggccgta 3480 ggccgccaga attgggtcca gacatgataa gatacattga tgagtttgga caaaccacaa 3540 ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt gctttatttg 3600 taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat tttatgtttc 3660 aggttcaggg ggaggtgtgg gaggtttttt cggactctag gacctgcgca tgcgcttggc 3720 gtaatcatgg tcatagctgt ttcctgtttt ccccgtatcc ccccaggtgt ctgcaggctc 3780 aaagagcagc gagaagcgtt cagaggaaag cgatcccgtg ccaccttccc cgtgcccggg 3840 ctgtccccgc acgctgccgg ctcggggatg cggggggagc gccggaccgg agcggagccc 3900 cgggcggctc gctgctgccc cctagcgggg gagggacgta attacatccc tgggggcttt 3960 gggggggggc tgtccctctc accgcggtgg agctccagct tttgttcgaa ttggggcccc 4020 ccctcgaggg tatcgatgat atctataaca agaaaatata tatataataa gttatcacgt 4080 aagtagaaca tgaaataaca atataattat cgtatgagtt aaatcttaaa agtcacgtaa 4140 aagataatca tgcgtcattt tgactcacgc ggtcgttata gttcaaaatc agtgacactt 4200 accgcattga caagcacgcc tcacgggagc tccaagcggc gactgagatg tcctaaatgc 4260 acagcgacgg attcgcgcta tttagaaaga gagagcaata tttcaagaat gcatgcgtca 4320 attttacgca gactatcttt ctagggttaa tctagctagc cttaagggcg cctcgagacc 4380 ttgcggccgc aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 4440 ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 4500 gtgagcgagc gagcgcgcag ctgcctgcag g 4531 <210> 142 <211> 4725 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 142 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct gcggccgcga agactcttaa ccctagaaag ataatcatat tgtgacgtac 180 gttaaagata atcatgcgta aaattgacgc atgtgtttta tcggtctgta tatcgaggtt 240 tatttattaa tttgaataga tattaagttt tattatattt acacttacat actaataata 300 aattcaacaa acaatttatt tatgtttatt tatttattaa aaaaaaacaa aaactcaaaa 360 tttcttctat aaagtaacaa aacttttatc aaatacctgc agcccggggg atgcagaggg 420 acagcccccc cccaaagccc ccagggatgt aattacgtcc ctcccccgct agggggcagc 480 agcgagccgc ccggggctcc gctccggtcc ggcgctcccc ccgcatcccc gagccggcag 540 cgtgcgggga cagcccgggc acggggaagg tggcacggga tcgctttcct ctgaacgctt 600 ctcgctgctc tttgagcctg cagacacctg gggggatacg gggaaaagtt gactgtgcct 660 ttcgatcgag tactcctagg cgcgccccta aaatgggcaa acattgcaag cagcaaacag 720 caaacacaca gccctccctg cctgctgacc ttggagctgg ggcagaggtc agagacctct 780 ctgggcccat gccacctcca acatccactc gaccccttgg aatttcggtg gagaggagca 840 gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc 900 agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat 960 cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 1020 attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac 1080 agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atcaagctta 1140 ttggacgtcg cttagcggta ccgccaccat gctgttcaac ctgcgcatcc tgctgaacaa 1200 cgccgccttc agaaacggcc acaacttcat ggttcgaaac ttcagatgcg gccagcctct 1260 ccagaacaag gtgcagctga aaggcaggga cctgctgacc ctgaagaact tcaccggcga 1320 agagatcaag tacatgctgt ggctgtccgc cgacctgaag ttcagaatca agcagaaggg 1380 cgagtacctg cctctgctcc agggaaagtc tctgggcatg atcttcgaga agcggagcac 1440 cagaaccaga ctgagcaccg agacaggctt tgccctgctc ggaggacacc cctgctttct 1500 gacaacccag gacatccacc tgggcgtgaa cgagagcctg accgatacag ccagagtgct 1560 gtcctctatg gccgatgccg tgctggctag agtgtataag cagagcgacc tggacaccct 1620 ggctaaagag gccagcattc ccatcatcaa cggcctgtcc gacctgtatc accccatcca 1680 gatcctggcc gactacctga cactgcaaga gcactacagc agcctgaagg gactgaccct 1740 gtcttggatc ggcgacggca acaacatcct gcacagcatt atgatgagcg ccgccaagtt 1800 cggaatgcac ctccaggccg ctacacccaa gggctatgaa cctgatgcca gcgtgacaaa 1860 gctggccgag cagtacgcca aagagaacgg cacaaagctg ctgctgacca acgatcccct 1920 ggaagctgct cacggcggca atgtgctgat caccgatacc tggatcagca tgggccaaga 1980 ggaagagaag aagaagcggc tgcaagcctt ccagggctac caagtgacca tgaagacagc 2040 caaggtggcc gccagcgatt ggacctttct gcactgcctg cctcggaagc ctgaagaggt 2100 ggacgacgag gtgttctaca gccctagaag cctggtgttc cccgaggccg agaacagaaa 2160 gtggaccatc atggctgtga tggtgtctct gctgaccgac tactcccctc agctccagaa 2220 gcctaagttc ggatccggcg aaggcagagg ctcactgctt acttgtggcg acgtggagga 2280 gaaccccgga cctatggttt ccaagggcga agaactgttt accggcgtgg tgcccatcct 2340 ggtggaactg gatggcgacg ttaacggaca caagttcagc gtcagcggag aaggcgaagg 2400 cgacgccaca tacggaaagc tgacactgaa gtttatctgc accaccggca agctgcccgt 2460 gccttggcct acactggtca ccacactgac atacggcgtg cagtgcttca gcagataccc 2520 cgaccacatg aagcagcacg atttcttcaa gagcgccatg cctgagggct acgtgcaaga 2580 gcggaccatc ttcttcaagg acgacgggaa ctacaagacc agagccgaag tgaagttcga 2640 gggcgacacc ctcgtgaacc ggatcgagct gaagggcatc gacttcaaag aggacggaaa 2700 catcctgggc cacaaacttg agtacaacta caacagccac aacgtctaca tcatggccga 2760 caagcagaaa aacggcatca aagtgaactt caagatccgg cacaacatcg aggacggctc 2820 tgtgcagctg gctgaccact accagcagaa cacacccatc ggagatggcc ctgtgctgct 2880 gcccgataac cactacctga gcacacagag cgccctgagc aaggacccca acgagaagag 2940 ggatcacatg gtgctgctgg aatttgtgac cgctgccggc atcaccctcg gcatggatga 3000 actgtacaag ggctccggag aaggacgggg aagcctgctt acatgcggag atgtggagga 3060 gaatcctggt cccatggtct ttaccctgga agatttcgtc ggcgactggc ggcagacagc 3120 cggctataat ctggaccagg tgctggaaca aggcggagtg tccagcctgt tccagaatct 3180 gggagtgtcc gtgacaccca tccagcggat tgtgctgtct ggcgagaacg gcctgaagat 3240 cgacatccac gtgatcatcc cttacgaggg cctgagcggc gatcagatgg gacagatcga 3300 gaagattttc aaggtggtgt accccgtgga cgaccaccac ttcaaagtga tcctgcacta 3360 cggcaccctg gtcatcgatg gcgtgacccc taacatgatc gactacttcg gcagacccta 3420 cgagggaatc gccgtgttcg acggcaagaa aatcaccgtg accggcacac tgtggaacgg 3480 gaacaagatc atcgacgagc ggctgatcaa ccccgatggc agcctgctgt tcagagtgac 3540 cattaacggc gtgacaggct ggcggctgtg cgaaaggatt ctggcctgat gatctagaga 3600 tctcatatgc ctttaattaa acactagttc tatagtgtca cctaaattcc ctttagtgag 3660 ggttaatggc cgtaggccgc cagaattggg tccagacatg ataagataca ttgatgagtt 3720 tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc 3780 tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat 3840 tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttcggact ctaggacctg 3900 cgcatgcgct tggcgtaatc atggtcatag ctgtttcctg ttttccccgt atccccccag 3960 gtgtctgcag gctcaaagag cagcgagaag cgttcagagg aaagcgatcc cgtgccacct 4020 tccccgtgcc cgggctgtcc ccgcacgctg ccggctcggg gatgcggggg gagcgccgga 4080 ccggagcgga gccccgggcg gctcgctgct gccccctagc gggggaggga cgtaattaca 4140 tccctggggg ctttgggggg gggctgtccc tctcaccgcg gtggagctcc agcttttgtt 4200 cgaattgggg ccccccctcg agggtatcga tgatatctat aacaagaaaa tatatatata 4260 ataagttatc acgtaagtag aacatgaaat aacaatataa ttatcgtatg agttaaatct 4320 taaaagtcac gtaaaagata atcatgcgtc attttgactc acgcggtcgt tatagttcaa 4380 aatcagtgac acttaccgca ttgacaagca cgcctcacgg gagctccaag cggcgactga 4440 gatgtcctaa atgcacagcg acggattcgc gctatttaga aagagagagc aatatttcaa 4500 gaatgcatgc gtcaatttta cgcagactat ctttctaggg ttaatctagc tagccttaag 4560 ggcgcctcga gaccttgcgg ccgcaggaac ccctagtgat ggagttggcc actccctctc 4620 tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 4680 cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct gcagg 4725 <210> 143 <211> 4363 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 143 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct gcggccgcga agactcttaa ccctagaaag ataatcatat tgtgacgtac 180 gttaaagata atcatgcgta aaattgacgc atgtgtttta tcggtctgta tatcgaggtt 240 tatttattaa tttgaataga tattaagttt tattatattt acacttacat actaataata 300 aattcaacaa acaatttatt tatgtttatt tatttattaa aaaaaaacaa aaactcaaaa 360 tttcttctat aaagtaacaa aacttttatc aaatacctgc agcccggggg atgcagaggg 420 acagcccccc cccaaagccc ccagggatgt aattacgtcc ctcccccgct agggggcagc 480 agcgagccgc ccggggctcc gctccggtcc ggcgctcccc ccgcatcccc gagccggcag 540 cgtgcgggga cagcccgggc acggggaagg tggcacggga tcgctttcct ctgaacgctt 600 ctcgctgctc tttgagcctg cagacacctg gggggatacg gggaaaagtt gactgtgcct 660 ttcgatcgag tactcctagg agctagcagg ttaattttta aaaagcagtc aaaagtccaa 720 gtggcccttg gcagcattta ctctctctgt ttgctctggt taataatctc aggagcacaa 780 acattccaga tccaggttaa tttttaaaaa gcagtcaaaa gtccaagtgg cccttggcag 840 catttactct ctctgtttgc tctggttaat aatctcagga gcacaaacat tccagatccg 900 gcgcgccagg gctggaagct acctttgaca tcatttcctc tgcgaatgca tgtataattt 960 ctacagaacc tattagaaag gatcacccag cctctgcttt tgtacaactt tcccttaaaa 1020 aactgccaat tccactgctg tttggcccaa tagtgagaac tttttcctgc tgcctcttgg 1080 tgcttttgcc tatggcccct attctgcctg ctgaagacac tcttgccagc atggacttaa 1140 acccctccag ctctgacaat cctctttctc ttttgtttta catgaagggt ctggcagcca 1200 aagcaatcac tcaaagttca aaccttatca ttttttgctt tgttcctctt ggccttggtt 1260 ttgtacatca gctttgaaaa taccatccca gggttaatgc tggggttaat ttataactaa 1320 gagtgctcta gttttgcaat acaggacatg ctataaaaat ggaaagatgt tgctttctga 1380 gagactgcag aagttggtcg tgaggcactg ggcaggtaag tatcaaggtt acaagacagg 1440 tttaaggaga ccaatagaaa ctgggcttgt cgagacagag aagactcttg cgtttctgat 1500 aggcacctat tggtcttact gacatccact ttgcctttct ctccacaggt gaagcttatt 1560 ggacgtcgct tagcggtacc gccaccatgc tgttcaacct gcgcatcctg ctgaacaacg 1620 ccgccttcag aaacggccac aacttcatgg ttcgaaactt cagatgcggc cagcctctcc 1680 agaacaaggt gcagctgaaa ggcagggacc tgctgaccct gaagaacttc accggcgaag 1740 agatcaagta catgctgtgg ctgtccgccg acctgaagtt cagaatcaag cagaagggcg 1800 agtacctgcc tctgctccag ggaaagtctc tgggcatgat cttcgagaag cggagcacca 1860 gaaccagact gagcaccgag acaggctttg ccctgctcgg aggacacccc tgctttctga 1920 caacccagga catccacctg ggcgtgaacg agagcctgac cgatacagcc agagtgctgt 1980 cctctatggc cgatgccgtg ctggctagag tgtataagca gagcgacctg gacaccctgg 2040 ctaaagaggc cagcattccc atcatcaacg gcctgtccga cctgtatcac cccatccaga 2100 tcctggccga ctacctgaca ctgcaagagc actacagcag cctgaaggga ctgaccctgt 2160 cttggatcgg cgacggcaac aacatcctgc acagcattat gatgagcgcc gccaagttcg 2220 gaatgcacct ccaggccgct acacccaagg gctatgaacc tgatgccagc gtgacaaagc 2280 tggccgagca gtacgccaaa gagaacggca caaagctgct gctgaccaac gatcccctgg 2340 aagctgctca cggcggcaat gtgctgatca ccgatacctg gatcagcatg ggccaagagg 2400 aagagaagaa gaagcggctg caagccttcc agggctacca agtgaccatg aagacagcca 2460 aggtggccgc cagcgattgg acctttctgc actgcctgcc tcggaagcct gaagaggtgg 2520 acgacgaggt gttctacagc cctagaagcc tggtgttccc cgaggccgag aacagaaagt 2580 ggaccatcat ggctgtgatg gtgtctctgc tgaccgacta ctcccctcag ctccagaagc 2640 ctaagttcgg atccggagaa ggacggggaa gcctgcttac atgcggagat gtggaggaga 2700 atcctggtcc catggtcttt accctggaag atttcgtcgg cgactggcgg cagacagccg 2760 gctataatct ggaccaggtg ctggaacaag gcggagtgtc cagcctgttc cagaatctgg 2820 gagtgtccgt gacacccatc cagcggattg tgctgtctgg cgagaacggc ctgaagatcg 2880 acatccacgt gatcatccct tacgagggcc tgagcggcga tcagatggga cagatcgaga 2940 agattttcaa ggtggtgtac cccgtggacg accaccactt caaagtgatc ctgcactacg 3000 gcaccctggt catcgatggc gtgaccccta acatgatcga ctacttcggc agaccctacg 3060 agggaatcgc cgtgttcgac ggcaagaaaa tcaccgtgac cggcacactg tggaacggga 3120 acaagatcat cgacgagcgg ctgatcaacc ccgatggcag cctgctgttc agagtgacca 3180 ttaacggcgt gacaggctgg cggctgtgcg aaaggattct ggcctgatga tctagagatc 3240 tcatatgcct ttaattaaac actagttcta tagtgtcacc taaattccct ttagtgaggg 3300 ttaatggccg taggccgcca gaattgggtc cagacatgat aagatacatt gatgagtttg 3360 gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta 3420 ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc 3480 attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttcggactct aggacctgcg 3540 catgcgcttg gcgtaatcat ggtcatagct gtttcctgtt ttccccgtat ccccccaggt 3600 gtctgcaggc tcaaagagca gcgagaagcg ttcagaggaa agcgatcccg tgccaccttc 3660 cccgtgcccg ggctgtcccc gcacgctgcc ggctcgggga tgcgggggga gcgccggacc 3720 ggagcggagc cccgggcggc tcgctgctgc cccctagcgg gggagggacg taattacatc 3780 cctgggggct ttgggggggg gctgtccctc tcaccgcggt ggagctccag cttttgttcg 3840 aattggggcc ccccctcgag ggtatcgatg atatctataa caagaaaata tatatataat 3900 aagttatcac gtaagtagaa catgaaataa caatataatt atcgtatgag ttaaatctta 3960 aaagtcacgt aaaagataat catgcgtcat tttgactcac gcggtcgtta tagttcaaaa 4020 tcagtgacac ttaccgcatt gacaagcacg cctcacggga gctccaagcg gcgactgaga 4080 tgtcctaaat gcacagcgac ggattcgcgc tatttagaaa gagagagcaa tatttcaaga 4140 atgcatgcgt caattttacg cagactatct ttctagggtt aatctagcta gccttaaggg 4200 cgcctcgaga ccttgcggcc gcaggaaccc ctagtgatgg agttggccac tccctctctg 4260 cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc 4320 cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc agg 4363 <210> 144 <211> 4651 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 144 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tatcgatggc gcgcctccag atatcataca ctcgagcaac 180 tttgtataga aaagttggcg cgtgtttgct gcttgcaatg tttgcccatt ttagggtgga 240 cacaggacgc tgtggtttct gagccagggg gcgactcaga tcccagccag tggacttagc 300 ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag cagcctcccc 360 cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg tctcctcagc 420 ttcaggcacc accactgacc tgggacagtg aatcgcaaga attcacgcgt caattgctcg 480 aggccaccat ggctcccaag aagaagcgga aagttggcgg cggaggcagc agcctggatg 540 atgagcatat tctgagcgcc ctgctgcaga gcgacgatga actcgtgggc gaagatagcg 600 acagcgaggt gtccgatcac gtgtccgagg atgacgtgca gtccgatacc gaggaagcct 660 tcatcgacga ggtgcacgaa gtgcagccta caagcagcgg cagcgagatc ctggacgagc 720 agaatgtgat cgagcagcca ggatctagcc tggccagcaa cagaatcctg acactgcccc 780 agagaaccat ccggggcaag aacaagcact gctggtccac cagcaagagc accagacggt 840 ctagagtgtc tgccctgaac atcgtgcgaa gccagagggg ccctaccaga atgtgccgga 900 acatctacga ccctctgctg tgcttcaagc tgttcttcac cgacgagatc atctccgaga 960 tcgtgaagtg gaccaacgcc gagatcagcc tgaagcggag agaatccatg accagcgcca 1020 ccttcagaga caccaacgag gacgagatct acgccttctt cggcatcctg gtcatgacag 1080 ccgtgcggaa ggacaaccac atgagcaccg acgacctgtt cgaccgcagc ctgtctatgg 1140 tgtacgtgtc cgtgatgagc cgggacagat tcgacttcct gatccggtgc ctgcggatgg 1200 acgacaagtc catcagaccc acactgcgcg agaacgacgt gttcacacct gtgcggaaga 1260 tctgggacct gttcatccac cagtgcatcc agaactacac ccctggcgct cacctgacca 1320 tcgacgaaca gctgctgggc ttcagaggca gatgcccctt cagagtgtac atccccaaca 1380 agccctctaa gtacggcatc aagatcctga tgatgtgcga cagcggcacc aagtacatga 1440 tcaacggcat gccctacctc ggcagaggca cccaaacaaa tggcgtgcca ctgggcgagt 1500 actacgtgaa agaactgagc aagcctgtgc acggcagctg cagaaacatc acctgtgaca 1560 actggtttac cagcattccc ctggccaaga acctgctgca agaaccctac aagctgacaa 1620 tcgtgggcac cgtgcggagc aacaagaggg aaattcccga ggtgctgaag aactctcgga 1680 gcagacctgt gggcaccagc atgttctgct tcgacggacc tctgacactg gtgtcctaca 1740 agcccaagcc tgccaagatg gtgtacctgc tgagcagctg tgacgaggac gccagcatca 1800 atgagagcac cggcaagccc cagatggtca tgtactacaa ccagaccaaa ggcggcgtgg 1860 acaccctgga tcagatgtgc agcgtgatga cctgcagcag aaagaccaac agatggccca 1920 tggctctgct gtacggcatg atcaatatcg cctgcatcaa cagcttcatc atctacagcc 1980 acaacgtgtc cagcaagggc gagaaggtgc agagccggaa gaaattcatg cggaacctgt 2040 acatgagcct gaccagcagc ttcatgagaa agcggctgga agcccctaca ctgaagagat 2100 acctgcggga caacatcagc aacatcctgc ctaaagaggt gcccggcacc agcgacgata 2160 gcacagagga acccgtgatg aagaagagga cctactgcac ctactgtccc agcaagatcc 2220 ggcggaaggc caacgccagc tgcaaaaagt gcaagaaagt gatctgccgc gagcacaaca 2280 tcgatatgtg ccagagctgc ttctgatgag atgcattcga agcggccgcg agctcaagct 2340 tgcaattccg ataacttgtt tattgcagct tataatggtt acaaataaag caatagcatc 2400 acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 2460 atcaatgtat cttatcatgt ctggcgctag cagcacaagt ttgtacaaaa aagcaggctc 2520 ctcgcaggag gcctggccgg cctccggatt acttccggtg caggcgtcag ctgcatcttg 2580 ctggccagct cggaggactg tccccgtaac tcccgtccgc tgtgtatcaa cacagctcta 2640 gccaaattgt tgaccgaacg acggggttcg attgtatcat tcctcacatc caacacttga 2700 gtagtacaat gccttgtcta agtgcgcttg ggacccagtc tattttgttt gtgtgcacaa 2760 gacgatactc ctcgatcacg taccaagcgc aggctggccc taacgacgtg gtattctcgt 2820 attggtgtgc cccagattgc ataaggcact catcacctgc gtttatgacg ctggacgcct 2880 gcgtatgttg caggactcct atgatgtcgc tagcctgatg cgttgttatg tgattgaggt 2940 ttagtacttg gcaatatcat tagatggaac taatacgcgg tctaatcgtt acaggtttcc 3000 gacgattgag aagtatcacc tgattctcgg gagcgacttg taactctact acacttattg 3060 atttggtact cctatgtgtt gctatcttga ctccgtaaat cgccgtgata cactctcttc 3120 gtttctcggc aatctatggc tctaaactat acacaggcat tctaagaata atctgacctg 3180 tccctgtagt actggtaggt tactaccagt acggcgacaa tgtgggagct acggcgtggt 3240 agaaccgggt acagacacag tccctgatcc cgatagtaac actgtgcccg tagcagtgat 3300 aatcattgcg cctcaacctg aggaagataa gggaggcagt atatcgtgct attccctcta 3360 ttctcccaca tgcgtatggc ctgaggtcaa tgatcaggta catgccgtaa tatgaggttt 3420 tacgtagccg atcacgaaaa ggttgctaaa tacttctcgt catatcccag ctcattgttg 3480 ggattatcgc taaacaggct aagttctaat gcccgtgggc atggcctcac gatctatggt 3540 gaaacagaca gcccgattta gcaatgctac agagcacagt ggttaatatt ggttgatacg 3600 tagaaccatg atcactgctc aattcgtgat gaagttgttc aatataccta gaagccactc 3660 aaggattctc tctgtgtcac taatagaggt ggtagagtgt ttggaagccg gttccacaca 3720 gatttagagt gtcacctaat tgccgtttat ctaaggaatt acgacaggag attccgaagt 3780 aattaggcta ttgcagagat acaggctagg tgaggtggag ggtgtcttgc ggtcttcgtc 3840 cagccgcctt gaaagcgggg tttttttcaa gcatcgctgc gtcattgcgt ggtcgagact 3900 tatgcgccct acgaagttcg tctgaagtag tccaggaaag acctactttg cagttatctt 3960 cgcattccca cactcaccac tacaactact cttccctcaa tttcccggtt agtttcgcta 4020 agctccgacc ttgggttact gtgttgcatc cgactcgctg cggctttcta gtacgctgta 4080 ctgtttcatt cttctgtagg tctggttccg taagtccgaa tttccaggcc gtggtctagt 4140 cctaattatt ttctgtcccg gtagctatat ttagccgagg gtttgtccat ttgcccggcg 4200 tagagcgccg cgtttgcgaa catttgcgcc cgtaatacgt agggacaccg tcgggtaatg 4260 gatggcaaaa gccgaaaacg gcgtcttccg gcgcttggat tcagcgctct tgagccataa 4320 accgcgttgc ttctttggtt aattcgtatt aatgatccta agcgccagct tattcgttaa 4380 gaggcactag gcgcgccgcg gcatgcgatc gccagcatgg ctacgaccca gctttcttgt 4440 acaaagtggt gatggccggc cgcttcgagt taattaatcc aaccggttac cgcctaggat 4500 cgatagatct aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 4560 ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 4620 gtgagcgagc gagcgcgcag ctgcctgcag g 4651 <210> 145 <211> 689 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 145 cgaaccatgg gaattgtacc gcgggggagg ctgctggtga atattaacca aggtcacccc 60 agttatcgga ggagcaaaca ggggctaagt ccaccggggg aggctgctgg tgaatattaa 120 ccaaggtcac cccagttatc ggaggagcaa acaggggcta agtccaccgg gggaggctgc 180 tggtgaatat taaccaaggt caccccagtt atcggaggag caaacagggg ctaagtccac 240 ggatcccact gggaggatgt tgagtaagat ggaaaactac tgatgaccct tgcagagaca 300 gagtattagg acatgtttga acaggggccg ggcgatcagc aggtagctct agaggatccc 360 cgtctgtctg cacatttcgt agagcgagtg ttccgatact ctaatctccc taggcaaggt 420 tcatatttgt gtaggttact tattctcctt ttgttgacta agtcaataat cagaatcagc 480 aggtttggag tcagcttggc agggatcagc agcctgggtt ggaaggaggg ggtataaaag 540 ccccttcacc aggagaagcc gtcacacaga tccacaagct cctgaagagg taagggttta 600 agggatggtt ggttggtggg gtattaatgt ttaattacct ggagcacctg cctgaaatca 660 ctttttttca ggttggacgc gtcgccacc 689 <210> 146 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Sequence <400> 146 gtctgtctgc acatttcgta gagcgagtgt tccgatactc taatctccct aggcaaggtt 60 catattgact taggttactt attctccttt tgttgactaa gtcaataatc agaatcagca 120 ggtttggagt cagcttggca gggatcagca gcctgggttg gaaggagggg gtataaaagc 180 cccttcacca ggagaagccg tcacacagat ccacaagctc ctgctagcag gtaagtgccg 240 tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg ccttgaatta 300 ctgacactga catccacttt ttctttttct ccacag 336

Claims (24)

  1. 5'에서 3' 방향으로:
    a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열;
    b) 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열;
    c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체(insulator) 서열;
    d) 서열번호: 126의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
    e) 서열번호: 22의 핵산 서열을 포함하는 적어도 하나의 이식유전자 서열;
    f) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열;
    g) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열;
    h) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열;
    i) 서열번호: 129의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및
    j) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
    을 포함하는 아데노 관련 바이러스(AAV) piggyBac 트랜스포존 뉴클레오타이드.
  2. 제1항에 있어서, 서열번호: 138의 핵산 서열을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
  3. 5'에서 3' 방향으로:
    a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열;
    b) 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열;
    c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열;
    d) 서열번호: 132의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
    e) 서열번호: 22의 핵산 서열을 포함하는 적어도 하나의 이식유전자 서열;
    f) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열;
    g) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열;
    h) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열;
    i) 서열번호: 130의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및
    j) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
    을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
  4. 제3항에 있어서, 서열번호: 139의 핵산 서열을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
  5. 5'에서 3' 방향으로:
    a) 서열번호: 3의 핵산 서열을 포함하는 제1 AAV ITR 서열;
    b) 서열번호: 125의 핵산 서열을 포함하는 제1 piggyBac ITR 서열;
    c) 서열번호: 7의 핵산 서열을 포함하는 제1 절연체 서열;
    d) 서열번호: 13의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열;
    e) 서열번호: 22의 핵산 서열을 포함하는 적어도 하나의 이식유전자 서열;
    f) 서열번호: 97의 핵산 서열을 포함하는 폴리A 서열;
    g) 서열번호: 8의 핵산 서열을 포함하는 제2 절연체 서열;
    h) 서열번호: 96의 핵산 서열을 포함하는 제2 piggyBac ITR 서열;
    i) 서열번호: 131의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및
    j) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
    을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
  6. 제5항에 있어서, 서열번호: 140의 핵산 서열을 포함하는 AAV piggyBac 트랜스포존 폴리뉴클레오타이드.
  7. 제1항 내지 제6항 중 어느 한 항의 AAV piggyBac 트랜스포존 폴리뉴클레오타이드를 포함하는 벡터.
  8. 제7항에 있어서, 벡터는 바이러스 벡터이고, 바람직하게는 바이러스 벡터는 AAV 바이러스 벡터인 벡터.
  9. 제8항에 있어서, AAV 바이러스 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11 바이러스 벡터인 벡터.
  10. 제8항에 있어서, AAV 바이러스 벡터는 AAV-KP-1 또는 AAV-NP59 바이러스 벡터이고, 바람직하게는 AAV 바이러스 벡터는 AAV-KP-1 바이러스 벡터인 벡터.
  11. 제7항 내지 제10항 중 어느 한 항의 벡터를 포함하는 조성물.
  12. 5'에서 3' 방향으로:
    a) 서열번호: 127의 핵산 서열을 포함하는 제1 AAV ITR 서열;
    b) 서열번호: 126의 핵산 서열을 포함하는 적어도 하나의 프로모터 서열 적어도 하나의 프로모터 서열;
    c) 서열번호: 48의 핵산 서열을 포함하는 적어도 하나의 트랜스포사제 서열;
    d) 서열번호: 136의 핵산 서열을 포함하는 폴리A 서열;
    e) 서열번호: 137의 핵산 서열을 포함하는 적어도 하나의 DNA 스페이서 서열; 및
    f) 서열번호: 4의 핵산 서열을 포함하는 제2 AAV ITR 서열
    을 포함하는 AAV 트랜스포사제 폴리뉴클레오타이드.
  13. 제12항에 있어서, 서열번호: 144의 핵산 서열을 포함하는 AAV 트랜스포사제 폴리뉴클레오타이드.
  14. 제12항 또는 제13항의 AAV 트랜스포사제 폴리뉴클레오타이드를 포함하는 벡터.
  15. 제14항에 있어서, 벡터는 바이러스 벡터이고, 바람직하게는 바이러스 벡터는 AAV 바이러스 벡터인 벡터.
  16. 제15항에 있어서, AAV 바이러스 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 또는 AAV11 바이러스 벡터인 벡터.
  17. 제15항에 있어서, AAV 바이러스 벡터는 AAV-KP-1 또는 AAV-NP59 바이러스 벡터이고, 바람직하게는 AAV 바이러스 벡터는 AAV-KP-1 바이러스 벡터인 벡터.
  18. 제14항 내지 제17항 중 어느 한 항의 벡터를 포함하는 조성물.
  19. 제1항 내지 제18항 중 어느 한 항의 폴리뉴클레오타이드, 벡터 또는 조성물의 적어도 하나의 치료적 유효량을 대상체에게 투여하는 단계를 포함하는, 적어도 하나의 대사성 간 장애(MLD)의 치료를 필요로 하는 대상체에서 적어도 하나의 대사성 간 장애(MLD)를 치료하는 방법.
  20. a) 제1항 내지 제6항 중 어느 한 항의 폴리뉴클레오타이드, 제7항 내지 제10항 중 어느 한 항의 벡터 또는 제11항의 조성물; 및
    b) 제12항 또는 제13항의 폴리뉴클레오타이드, 제14항 내지 제17항 중 어느 한 항의 벡터 또는 제18항의 조성물
    을 대상체에게 투여하는 단계를 포함하는, 적어도 하나의 MLD의 치료를 필요로 하는 대상체에서 적어도 하나의 MLD를 치료하는 방법.
  21. 적어도 하나의 MLD의 치료를 필요로 하는 대상체에서 적어도 하나의 MLD의 치료를 위한 제1항 내지 제20항 중 어느 한 항의 폴리뉴클레오타이드, 벡터 또는 조성물의 용도로서, 여기서 폴리뉴클레오타이드, 벡터 또는 조성물은 적어도 하나의 치료적 유효량으로 대상체에 투여하기 위한 것인 용도.
  22. 적어도 하나의 MLD의 치료를 필요로 하는 대상체에서 적어도 하나의 MLD의 치료에 사용하기 위한
    a) 제1항 내지 제6항 중 어느 한 항의 폴리뉴클레오타이드, 제7항 내지 제10항 중 어느 한 항의 벡터 또는 제11항의 조성물; 및
    b) 제12항 또는 제13항의 폴리뉴클레오타이드, 제14항 내지 제17항 중 어느 한 항의 벡터 또는 제18항의 조성물
    의 조합.
  23. 제19항 내지 제22항 중 어느 한 항에 있어서, 적어도 하나의 MLD는 N-아세틸글루타메이트 신테타제(NAGS) 결핍, 카르바모일포스페이트 신테타제 I 결핍(CPSI 결핍), 오르니틴 트랜스카르바밀라제(OTC) 결핍, 아르기니노석시네이트 신테타제 결핍(ASSD)(시트룰린혈증 I), 시트린 결핍(시트룰린혈증 II), 아르기니노석시네이트 리아제 결핍(아르기노석신산 뇨증), 아르기나제 결핍(고아르기닌혈증), 오르니틴 트랜스로카제 결핍(HHH 증후군), 메틸말론산혈증(MMA), 진행성 가족성 간내 담즙정체 1형(PFIC1), 진행성 가족성 간내 담즙정체 1형(PFIC2), 진행성 가족성 간내 담즙정체 1형(PFIC3) 또는 이들의 임의의 조합인 방법 또는 용도.
  24. 제23항에 있어서, MLD는 OTC 결핍인 방법 또는 용도.
KR1020227034141A 2020-03-04 2021-03-04 대사성 간 장애의 치료를 위한 조성물 및 방법 KR20220149588A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202062985047P 2020-03-04 2020-03-04
US62/985,047 2020-03-04
US202063121488P 2020-12-04 2020-12-04
US63/121,488 2020-12-04
PCT/US2021/020929 WO2021178707A1 (en) 2020-03-04 2021-03-04 Compositions and methods for the treatment of metabolic liver disorders

Publications (1)

Publication Number Publication Date
KR20220149588A true KR20220149588A (ko) 2022-11-08

Family

ID=75267602

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227034141A KR20220149588A (ko) 2020-03-04 2021-03-04 대사성 간 장애의 치료를 위한 조성물 및 방법

Country Status (8)

Country Link
US (1) US20230104091A1 (ko)
EP (1) EP4114469A1 (ko)
JP (1) JP2023515692A (ko)
KR (1) KR20220149588A (ko)
CN (1) CN115515646A (ko)
AU (1) AU2021230361A1 (ko)
CA (1) CA3169529A1 (ko)
WO (1) WO2021178707A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230383278A1 (en) * 2020-09-18 2023-11-30 The United States Of America,As Represented By The Secretary,Department Of Health And Human Services Novel adeno-associated viral (aav) vectors to treat hereditary methylmalonic acidemia (mma) caused by methylmalonyl-coa mutase (mmut) deficiency
CA3094859A1 (en) * 2020-10-01 2022-04-01 Entos Pharmaceuticals Inc. Proteolipid vesicles formulated with fusion associated small transmembrane proteins
WO2022187671A1 (en) * 2021-03-04 2022-09-09 Poseida Therapeutics, Inc. Compositions and methods for the treatment of hemophilia
GB202205606D0 (en) * 2022-04-14 2022-06-01 Genespire S R L Lentiviral vector

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3773919A (en) 1969-10-23 1973-11-20 Du Pont Polylactide-drug mixtures
US4309989A (en) 1976-02-09 1982-01-12 The Curators Of The University Of Missouri Topical application of medication by ultrasound with coupling agent
FR2374910A1 (fr) 1976-10-23 1978-07-21 Choay Sa Preparation a base d'heparine, comprenant des liposomes, procede pour l'obtenir et medicaments contenant de telles preparations
US4554101A (en) 1981-01-09 1985-11-19 New York Blood Center, Inc. Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity
US4656134A (en) 1982-01-11 1987-04-07 Board Of Trustees Of Leland Stanford Jr. University Gene amplification in eukaryotic cells
US5168062A (en) 1985-01-30 1992-12-01 University Of Iowa Research Foundation Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4766067A (en) 1985-05-31 1988-08-23 President And Fellows Of Harvard College Gene amplification
GB8601597D0 (en) 1986-01-23 1986-02-26 Wilson R H Nucleotide sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US4767402A (en) 1986-07-08 1988-08-30 Massachusetts Institute Of Technology Ultrasound enhancement of transdermal drug delivery
EP0318512B1 (en) 1986-08-18 1998-06-17 Emisphere Technologies, Inc. Delivery systems for pharmacological agents
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US4921794A (en) 1987-01-14 1990-05-01 President And Fellows Of Harvard College T7 DNA polymerase
US4795699A (en) 1987-01-14 1989-01-03 President And Fellows Of Harvard College T7 DNA polymerase
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
US5066584A (en) 1988-09-23 1991-11-19 Cetus Corporation Methods for generating single stranded dna by the polymerase chain reaction
US5091310A (en) 1988-09-23 1992-02-25 Cetus Corporation Structure-independent dna amplification by the polymerase chain reaction
US5142033A (en) 1988-09-23 1992-08-25 Hoffmann-La Roche Inc. Structure-independent DNA amplification by the polymerase chain reaction
US4994370A (en) 1989-01-03 1991-02-19 The United States Of America As Represented By The Department Of Health And Human Services DNA amplification technique
US5266491A (en) 1989-03-14 1993-11-30 Mochida Pharmaceutical Co., Ltd. DNA fragment and expression plasmid containing the DNA fragment
US5580575A (en) 1989-12-22 1996-12-03 Imarx Pharmaceutical Corp. Therapeutic drug delivery systems
US5580734A (en) 1990-07-13 1996-12-03 Transkaryotic Therapies, Inc. Method of producing a physical map contigous DNA sequences
US5968502A (en) 1991-11-05 1999-10-19 Transkaryotic Therapies, Inc. Protein production and protein delivery
US5641670A (en) 1991-11-05 1997-06-24 Transkaryotic Therapies, Inc. Protein production and protein delivery
US5643252A (en) 1992-10-28 1997-07-01 Venisect, Inc. Laser perforator
US5849695A (en) 1993-01-13 1998-12-15 The Regents Of The University Of California Parathyroid hormone analogues useful for treatment of osteoporosis and disorders of calcium meatabolism in mammals
ATE453709T1 (de) 1993-02-12 2010-01-15 Univ Leland Stanford Junior Regulierte transkription von zielgerichteten genen und andere biologische ereignisse
US5514670A (en) 1993-08-13 1996-05-07 Pharmos Corporation Submicron emulsions for delivery of peptides
US5814599A (en) 1995-08-04 1998-09-29 Massachusetts Insitiute Of Technology Transdermal delivery of encapsulated drugs
US5730723A (en) 1995-10-10 1998-03-24 Visionary Medical Products Corporation, Inc. Gas pressured needle-less injection device and method
US6218185B1 (en) 1996-04-19 2001-04-17 The United States Of America As Represented By The Secretary Of Agriculture Piggybac transposon-based genetic transformation system for insects
US5827729A (en) 1996-04-23 1998-10-27 Advanced Tissue Sciences Diffusion gradient bioreactor and extracorporeal liver device using a three-dimensional liver tissue
US5879681A (en) 1997-02-07 1999-03-09 Emisphere Technolgies Inc. Compounds and compositions for delivering active agents
IL120943A (en) 1997-05-29 2004-03-28 Univ Ben Gurion A system for administering drugs through the skin
US6309663B1 (en) 1999-08-17 2001-10-30 Lipocine Inc. Triglyceride-free compositions and methods for enhanced absorption of hydrophilic therapeutic agents
US6962810B2 (en) 2000-10-31 2005-11-08 University Of Notre Dame Du Lac Methods and compositions for transposition using minimal segments of the eukaryotic transformation vector piggyBac
CA2692501C (en) 2007-07-04 2017-10-10 Max-Delbrueck-Centrum Fuer Molekulare Medizin Hyperactive variants of the transposase protein of the transposon system sleeping beauty
WO2010099296A1 (en) 2009-02-26 2010-09-02 Transposagen Biopharmaceuticals, Inc. Hyperactive piggybac transposases
EP2621957B1 (en) * 2010-09-28 2021-06-02 University of Notre Dame du Lac Chimeric spider silk and uses thereof
WO2012074758A1 (en) * 2010-11-16 2012-06-07 Transposagen Bioharmaceuticals, Inc. Hyperactive piggybac transposases
WO2015138357A2 (en) * 2014-03-09 2015-09-17 The Trustees Of The University Of Pennsylvania Compositions useful in treatment of otc deficency
WO2015139093A1 (en) * 2014-03-21 2015-09-24 The Sydney Children's Hospitals Network (Randwick And Westmead) (Incorporating The Royal Alexandra Hospital For Children) Stable gene transfer to proliferating cells
US10927384B2 (en) 2014-04-09 2021-02-23 Dna Twopointo Inc. DNA vectors, transposons and transposases for eukaryotic genome modification
WO2017070428A1 (en) * 2015-10-22 2017-04-27 Hera Testing Laboratories, Inc. Genetically modified non-human mammals having modified liver cells and/or tissue and methods of making same
JP6747517B2 (ja) 2017-09-05 2020-08-26 東レ株式会社 繊維強化熱可塑性樹脂成形品
CN112601583A (zh) 2018-03-07 2021-04-02 波赛达治疗公司 CARTyrin组合物和使用方法

Also Published As

Publication number Publication date
JP2023515692A (ja) 2023-04-13
US20230104091A1 (en) 2023-04-06
EP4114469A1 (en) 2023-01-11
CN115515646A (zh) 2022-12-23
WO2021178707A1 (en) 2021-09-10
CA3169529A1 (en) 2021-09-10
AU2021230361A1 (en) 2022-09-08

Similar Documents

Publication Publication Date Title
KR20220149588A (ko) 대사성 간 장애의 치료를 위한 조성물 및 방법
KR102049161B1 (ko) 치료적 단백질을 조건부로 발현하는 벡터,상기 벡터를 포함하는 숙주 세포 및 이의 용도
KR20220022107A (ko) 유전자 전달을 위한 재조합 아데노-연관 바이러스 벡터
KR20200044793A (ko) Aav의 전달을 위한 조성물 및 방법
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
KR20170121745A (ko) 선택적 스플라이싱의 앱타머 매개 조절에 의한 유전자 발현의 조절
KR20210068068A (ko) 조작된 프로모터를 갖는 프라탁신 발현 구축물 및 그의 사용 방법
KR20210092755A (ko) 신경원성 세로이드 리포푸신증에 대한 유전자 요법
CN111733174B (zh) 一种分离的核酸分子及其用途
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
CN110944674A (zh) 高活性调控元件
KR20200095462A (ko) Hbb 유전자 기능 회복을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
KR20210049833A (ko) Mma의 치료를 위한 비-붕괴적 유전자 요법
KR20210144696A (ko) 라민병증 치료용 조성물 및 치료 방법
TW202221125A (zh) 用於治療與葡萄糖神經醯胺酶β缺陷相關之神經病症的組合物及方法
CN112639108A (zh) 治疗非综合征性感觉神经性听力损失的方法
CN116157514A (zh) 新颖omni-59、61、67、76、79、80、81和82crispr核酸酶
CN114402075A (zh) 乌谢尔综合征(ush2a)的基因疗法
CN111902164A (zh) 用于恢复pah基因功能的腺相关病毒组合物及其使用方法
CN115768901A (zh) 腺病毒的大负载整合
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
CN117247973A (zh) 一种用于遗传性凝血因子缺乏病治疗的核酸构建体及其用途
CN113874512A (zh) 诱导毛细胞分化的组合物和方法
CN114364440B (zh) Aav介导的rpgr x连锁视网膜变性的基因编辑治疗
CN111296364B (zh) 一种基因改造的小鼠动物模型基因改造方法及其应用

Legal Events

Date Code Title Description
A201 Request for examination