KR20230066615A - 폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도 - Google Patents

폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도 Download PDF

Info

Publication number
KR20230066615A
KR20230066615A KR1020237012572A KR20237012572A KR20230066615A KR 20230066615 A KR20230066615 A KR 20230066615A KR 1020237012572 A KR1020237012572 A KR 1020237012572A KR 20237012572 A KR20237012572 A KR 20237012572A KR 20230066615 A KR20230066615 A KR 20230066615A
Authority
KR
South Korea
Prior art keywords
seq
nucleic acid
itr
cedna vector
acid sequence
Prior art date
Application number
KR1020237012572A
Other languages
English (en)
Inventor
리아 유 류
러셀 몬즈
매튜 제임스 치오코
나다니엘 실버
필립 사마요아
더글러스 앤서니 커
제시카 린 키넌
Original Assignee
제너레이션 바이오 컴퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 제너레이션 바이오 컴퍼니 filed Critical 제너레이션 바이오 컴퍼니
Publication of KR20230066615A publication Critical patent/KR20230066615A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0016Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/16Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced pteridine as one donor, and incorporation of one atom of oxygen (1.14.16)
    • C12Y114/16001Phenylalanine 4-monooxygenase (1.14.16.1)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • A01K2267/0318Animal model for neurodegenerative disease, e.g. non- Alzheimer's
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14111Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
    • C12N2710/14141Use of virus, viral particle or viral elements as a vector
    • C12N2710/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14111Nucleopolyhedrovirus, e.g. autographa californica nucleopolyhedrovirus
    • C12N2710/14141Use of virus, viral particle or viral elements as a vector
    • C12N2710/14144Chimeric viral vector comprising heterologous viral elements for production of another viral vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/103Plasmid DNA for invertebrates
    • C12N2800/105Plasmid DNA for invertebrates for insects
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Epidemiology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Obesity (AREA)
  • Diabetes (AREA)
  • Virology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

전이유전자의 전달 및 발현을 위한 선형 및 연속 구조를 갖는 ceDNA 벡터가 본원에 기재되어 있다. ceDNA 벡터는 2개의 ITR 서열이 플랭킹된 발현 카세트를 포함하며, 여기서 발현 카세트는 특정 프로모터 서열 및 시스-조절 요소와 조합된 PAH 단백질을 인코딩하는 코돈 최적화된 핵산 서열을 포함한다. ceDNA 벡터를 사용하여 시험관내, 생체외생체내에서 PAH 단백질의 신뢰할 수 있는 유전자 발현을 위한 방법 및 세포주가 본원에 추가로 제공된다. 세포, 조직 또는 대상에서 PAH 단백질의 발현에 유용한 ceDNA 벡터를 포함하는 방법 및 조성물, 및 PAH 단백질을 발현하는 상기 ceDNA 벡터로 질환을 치료하는 방법이 또한 본원에 제공된다. 이러한 PAH 단백질은 질환, 예를 들어 페닐케톤뇨증(PKU)의 치료를 위해 발현될 수 있다.

Description

폐쇄형 DNA 벡터 및 페닐알라닌 히드록실라아제(PAH) 발현을 위한 이의 용도
관련 출원
본 출원은 2020년 9월 16일자 출원된 미국 임시 출원 제63/078,954호에 대한 우선권을 주장하며, 상기 문헌의 전체 내용은 그 전문이 본원에 참조로 인용된다.
서열목록
본 출원은 ASCII 형식으로 전자문서로 제출된 서열목록을 포함하며, 이러한 서열목록은 그 전체가 본원에 참조로서 인용된다. 2021년 9월 16일자 생성된 상기 ASCII 사본의 명칭은 131698-08120_SL.txt이고, 크기는 633,329바이트이다.
기술분야
본 개시내용은 대상 또는 세포에서 전이유전자(transgene) 또는 단리된 폴리뉴클레오타이드를 발현시키기 위한 비(non)바이러스성 벡터를 포함하는 유전자 치료 분야에 관한 것이다. 본 개시내용은 또한 상기 폴리뉴클레오타이드를 포함하는 핵산 작제물, 프로모터, 벡터 및 숙주세포뿐 아니라, 표적 세포, 조직, 기관 또는 유기체로 외인성 DNA 서열을 전달하는 방법에 관한 것이다. 예를 들어, 본 개시내용은 질환의 치료를 필요로 하는 대상의 세포 또는 조직에서 페닐알라닌 히드록실라아제(PAH: phenylalanine hydroxylase)를 발현시키는 방식으로 질환의 치료를 위해 PAH를 발현시키기 위해 비바이러스성 폐쇄형 DNA(ceDNA) 벡터를 사용하는 방법을 제공한다.
유전자 치료는 유전자 발현 프로파일의 이상으로 인한 유전자 돌연변이 또는 후천성 질환을 앓고 있는 환자의 임상 결과를 개선시키는 것을 목표로 한다. 유전자 치료는 장애, 질환, 악성종양 등을 초래할 수 있는, 결함이 있는 유전자, 또는 비정상적인 조절 또는 발현, 예를 들어 과소발현(underexpression) 또는 과발현으로 인한 의학적 병태의 치료 또는 예방을 포함한다. 예를 들어, 결함이 있는 유전자로 인한 질환 또는 장애는 교정(corrective) 유전 물질을 환자에게 전달하여 환자 내에서 유전 물질의 치료적 발현을 유도하거나, 또는 예를 들어 교정 유전 물질을 이용하여 결함 유전자를 변경하거나 침묵시켜 환자 내에서 유전 물질의 치료적 발현을 유도하는 방식으로 치료, 예방 또는 개선될 수 있다.
유전자 치료의 기초는, 예를 들어 긍정적인 기능획득 효과, 부정적인 기능손실 효과 또는 또 다른 결과를 유도할 수 있는 활성 유전자 산물(때때로 전이유전자로 지칭됨)을 전사 카세트에 공급하는 것이다. 이러한 결과는 항체, 기능성 효소 또는 융합 단백질과 같은 치료용 단백질의 발현에 기인한 것일 수 있다. 유전자 치료는 또한 다른 인자로 인한 질환 또는 악성종양을 치료하는 데 사용될 수 있다. 인간 단일유전 장애는 정상 유전자를 표적세포에 전달하여 발현시키는 방식으로 치료될 수 있다. 교정 유전자를 환자의 표적세포에 전달하여 발현시키는 것은 조작된 바이러스 및 바이러스성 유전자 전달 벡터의 사용을 포함하는 다양한 방법을 통해 수행될 수 있다. 다수의 이용 가능한 바이러스 유래 벡터(예를 들어, 재조합 레트로바이러스, 재조합 렌티바이러스, 재조합 아데노바이러스 등) 중에서, 재조합 아데노연관바이러스(rAAV: recombinant adeno-associated virus)는 유전자 치료에서 다목적 벡터로서 인기를 얻고 있다.
아데노연관바이러스(AAV: adeno-associated virus)는 파르보바이러스과에 속하며, 더욱 구체적으로는 데펜도파르보바이러스(dependoparvovirus) 속을 구성한다. AAV 유래 벡터(즉, 재조합 AAV(rAVV) 또는 AAV 벡터)는 다음과 같은 이유로 유전 물질의 전달에 매력적이다: (i) 이는 근세포와 뉴런을 포함하는 다양한 비(non)분열 및 분열 세포 유형을 감염(형질도입)시킬 수 있는 능력이 있음; (ii) 이는 바이러스 구조 유전자가 없기 때문에, 바이러스 감염에 대한 숙주세포 반응, 예를 들어 인터페론 매개 반응을 감소시킬 수 있음; (iii) 야생형 바이러스는 인간에서 비(non)병적으로 간주됨; (iv) 숙주세포 게놈에 통합될 수 있는 야생형 AAV와 대조적으로, 복제불능 AAV 벡터에는 rep 유전자가 결여되어 있고 일반적으로 에피솜으로 지속되기 때문에, 삽입 돌연변이유발 또는 유전독성의 위험을 제한할 수 있음; 및 (v) 다른 벡터 시스템과 비교하여, AAV 벡터는 일반적으로 상대적으로 불량한 면역원인 것으로 여겨져 중요한 면역 반응((ii) 참조)을 촉발시키지 않기 때문에, 벡터 DNA의 지속, 및 잠재적으로 치료용 전이유전자의 장기 발현을 얻을 수 있음.
하지만, 유전자 전달 벡터로서 AAV 입자를 사용하는 데에는 몇 가지 주요 결함이 있다. rAAV와 관련된 하나의 주요 단점은 약 4.5 kb로 제한된 이종 DNA 바이러스 패키징 용량으로(Dong 등의 문헌(1996); Athanasopoulos 등의 문헌(2004); Lai 등의 문헌(2010)), 그 결과, AAV 벡터의 사용은 150,000 Da 단백질 코딩 용량 미만으로 제한되어 있다. 두 번째 단점은, 집단에서 야생형 AAV 감염의 유병률로 인해, rAAV 유전자 치료 후보가 환자에서 벡터를 제거하는 중화 항체의 존재에 대해 스크리닝되어야 한다는 점이다. 세 번째 단점은, 초기 치료에서 제외되지 않았던 환자에게의 재투여를 막는 캡시드 면역원성과 관련이 있다. 환자의 면역계는 향후 치료를 방해하는 높은 역가의 항-AAV 항체를 생성하는 면역계를 자극하기 위해 "부스터(booster)" 주사로서 효과적으로 작용하는 벡터에 반응할 수 있다. 일부 최근 보고서는, 고용량 조건에서 면역원성에 대한 우려를 나타낸다. 또 다른 주목할 만한 단점은, 단일가닥 AAV DNA가 이종 유전자 발현 전 이중가닥 DNA로 전환되어야 한다는 점을 고려할 때, AAV 매개 유전자 발현의 개시가 상대적으로 느리다는 점이다.
또한, 캡시드를 갖는 통상적인 AAV 비리온은 AAV 게놈, rep 유전자 및 cap 유전자를 함유하는 플라스미드 또는 플라스미드들의 도입을 통해 생성된다(Grimm 등의 문헌(1998)). 하지만, 이러한 캡시드화된 AAV 바이러스 벡터는 특정 세포 및 조직 유형을 비효율적으로 형질도입하는 것으로 확인되었으며, 캡시드 또한 면역반응을 유도한다.
따라서, 유전자 치료를 위한 아데노연관바이러스(AAV) 벡터의 사용은 (환자 면역 반응으로 인해) 환자에게의 단회 투여, 최소 바이러스 패키징 용량(약 4.5 kb)으로 인한 AAV 벡터에서 전달에 적합한 전이유전자 유전 물질의 제한된 범위, 및 느린 AAV 매개 유전자 발현으로 인해 제한된다.
페닐케톤뇨증(PKU: phenylketonuria)은 PAH 유전자의 돌연변이에 의해 유발되는 희귀한 선천성 대사 이상이다. 페닐케톤뇨증(PKU)은 아미노산 페닐알라닌의 대사를 감소시킨다. 치료되지 않은 PKU는 지적 장애, 발작, 행동 문제 및 정신 장애로 이어질 수 있다. 이는 또한 퀴퀴한 냄새와 보다 옅은 색의 피부를 생성할 수 있다. PKU가 제대로 치료되지 않은 산모에서 태어난 아기는 심장 문제, 작은 머리 및 출생 시 저체중이 있을 수 있다. PKU는 효소 페닐알라닌 히드록실라아제(PAH)의 수준을 낮추는 PAH 유전자의 돌연변이로 인해 발생하며, 즉, PKU를 앓고 있는 대상은 이의 효소 활성 결핍을 유도하는 PAH의 돌연변이를 갖는다. PKU는 상염색체 열성으로, 이는 병태가 발생하기 위해서는 유전자의 두 개의 카피가 모두 돌연변이되어야 함을 의미한다. 효소 기능이 남아있는 지 여부에 따라, 전형적 PKU와 변이형 PKU의 2가지 주요 유형이 존재한다. 돌연변이된 PAH 유전자 카피가 1개 있는 사람들은 전형적으로 증상이 없다.
PAH는 통상적으로 간에서 발현되며, 식이(dietary) 페닐알라닌(phe)을 신경전달물질의 생성을 담당하는 아미노산인 티로신으로 대사시키는 데 필요한 효소이다. PAH는 페닐알라닌의 티로신으로의 히드록실화를 촉진시킨다. 결함이 있는 PAH 효소는 식이 페닐알라닌을 잠재적 독성 수준까지 축적시킨다.
PKU는 혈청 phe 수준을 상승시키는 효소 페닐알라닌 히드록실라아제(PAH)의 단일 유전자 결함에 의해 유발될 수 있다. PAH는 척추동물에서 phe을 티로신으로 전환시킨다. PAH의 부재 하에서, Phe을 제거하는 유일한 다른 메커니즘은 단백질 합성과, 알라닌 측쇄의 탈아미노화 및 산화적 탈카르복실화를 포함하는 부수적인 분해 경로이며, 이는 PKU 환자의 소변에서 확인되는 특징적인 페닐락테이트와 페닐아세테이트를 생성한다. 불행하게도, 전형적인 식이는 PAH의 부재 하에서 제거될 수 있는 것보다 더 많은 Phe를 함유한다. 결과적으로 PKU 환자에서 Phe가 축적되면, 비정상적인 뇌 발달 및 중증 정신지체를 포함하는 다수의 증상이 나타난다. (문헌[Kaufman, Proc Nat'l Acad Sci USA 96: 3160-3164, 1999]).
현재 표준 치료는 고도로 제한된 식이(페닐알라닌 (Phe)의 제한)이지만, 이러한 식이 제한은 유지하기가 어렵고 근본적인 결함을 교정하지 못하기 때문에 항상 효과적인 것이 아니다. 현재 PKU 치료법은 페닐알라닌을 함유한 식품을 적게 섭취하고 특수 보충제를 이용하는 것이다. 엄격한 식이요법은 출생 후 가능한 빨리 시작해야 하며, 평생은 아니더라도 적어도 10년 동안 계속되어야 한다. 치료되지 않은 채로 방치되면, PKU는 진행성 및 중증 신경계 장애를 초래할 수 있다. 미국에는 PKU를 앓고 있는 사람이 대략 16,500명 정도 살고 있으며, 현재까지 PKU의 유전적 결함을 해결할 수 있는 치료는 없다.
PKU의 생화학, 분자생물학 및 유전학을 이해하는 데 있어서의 엄청난 발전에도 불구하고, 이러한 장애에 대한 새로운 치료법을 개발하는 데에는 거의 진전이 없었다. PKU의 질환 변형(disease-modifying) 치료법에 대한 상당한 충족되지 않은 요구가 존재한다. 첫 번째로, 현재 치료법은 질환 변형이 아니며 일부 환자에서만 효과적이고, 여전히 엄격한 식이 제한을 필요로 하며, 순응하지 않으면 신경 손상을 유발할 수 있다. 두 번째로, PKU에 대해 승인된 유전자 치료법이 존재하지 않으며, 기존 항체로 인해 환자의 25% 내지 40%는 AAV 기반 치료를 사용할 수 없다. 나아가, AAV는 한 번만 투여될 수 있으며, 결과적인 PAH 수준은 효과적일 만큼 충분히 높지 않거나, 정상보다 높을 수 있으며, 용량 수준은 적정이 불가하다.
따라서, PKU의 치료를 위해 세포, 조직 또는 대상에서 치료용 PAH 단백질의 발현을 가능하게 하는 기술이 해당 분야에 필요하다.
본원에 기재된 기술은 공유결합으로 폐쇄된 말단을 갖는 캡시드 미함유(capsid-free)(예를 들어, 비바이러스성) DNA 벡터(본원에서 "폐쇄형 DNA 벡터" 또는 "ceDNA 벡터"로 지칭됨)(여기서 ceDNA 벡터는 코돈 최적화되고, PKU의 마우스 모델에서 페닐알라닌 수준(예를 들어, 발현 및 지속기간)의 최적 교정에 대해 시험된 특정 시스-요소(예를 들어, 특정 프로모터, 특정 인핸서, 및 특정 프로모터와 인핸서 조합)와 조합된 PAH 핵산 서열을 포함함)로부터 효소 페닐알라닌 히드록실라아제(PAH)를 발현시키는 방식으로 페닐케톤뇨증(PKU)을 치료하기 위한 방법 및 조성물에 관한 것이다. 일부 구현예에 따르면, 특정 코돈 최적화된 PAH 핵산 서열은 특정 프로모터 서열 및/또는 특정 인핸서 서열과 조합된 경우, 또 다른 프로모터 서열 및/또는 특정 인핸서 서열과 조합된 동일한 코돈 최적화된 PAH 핵산 서열에 비해 더 양호한 성능을 나타낸다. 본 개시내용에 기재된 바와 같이, 코돈 최적화된 서열을 포함하는 작제물은 본래 hPAH cDNA 서열보다 상당히 더 우수한 성능을 나타내었고, 코돈 최적화된 서열과 특정 시스-작용 요소를 포함하는 특정 작제물은 28일 연구 기간에 걸쳐 연장된 교정을 나타내어 발현과 효능의 지속성을 입증하였다. 놀랍게도, 특정 프로모터(예를 들어, hAAT CpG 최소화된 프로모터)를 포함하는 작제물이 PAHenu2 마우스 모델에서 생체내에서 특정 오픈리딩프레임(ORF)(ceDNA412 codop 2 ORF)을 이용한 경우 더 우수한 성능을 나타내는 것으로 확인되었지만, hAAT 프로모터는 일반적으로 시험관내에서 VD 프로모터(VD) 또는 3X VD보다, 또는 다른 ORF(예를 들어, 루시퍼라아제)를 이용한 경우보다 우위를 나타냈다.
이러한 ceDNA 벡터는 치료, 모니터링 및 진단을 위한 PAH 단백질의 생산에 사용될 수 있다. PKU의 치료를 위해 PAH를 발현하는 ceDNA 벡터를 대상에게 적용하는 것은, 다음과 같은 측면에서 유용하다: (i) 질환 변형 수준의 PAH 효소를 제공함, (ii) 최소 침습성으로 전달이 이루어짐, (iii) 반복 가능하고 용량 반응성임, (iv) 치료 효과의 개시가 신속함, (v) 간에서 교정 PAH 효소의 발현을 지속시킴, (vi) 페닐알라닌 대사가 기능하도록 요소 회로 기능을 회복시킴, 및/또는 (vii) 결함 효소의 적절한 약리학적 수준이 달성되도록 적정할 수 있음.
따라서, 본원에 기재된 개시내용은 세포에서 PAH 치료 단백질의 발현을 가능하게 하기 위해, 코돈 최적화되고 특정 시스-작용 요소(예를 들어, 특정 프로모터, 특정 인핸서, 및 특정 프로모터와 인핸서 조합)와 조합된 PAH 핵산 서열을 포함하는 공유결합으로 폐쇄된 말단을 갖는 캡시드 미함유(예를 들어, 비바이러스성) DNA 벡터(본원에서 "폐쇄형 DNA 벡터" 또는 "ceDNA 벡터"로 지칭됨)에 관한 것이다.
하나의 양태에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열(여기서 적어도 하나의 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 90% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 코돈 최적화되며, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(hAAT(979) 프로모터와 적어도 96%, 97%, 98%, 99% 또는 100% 동일성을 갖는 서열(hAAT_core_C10), 또는 다른 CpG 최소화(CpGmin)_hAAT 프로모터, 예컨대 hAAT_core_C06; hAAT_core_C07; hAAT_core_C08 및 hAAT_core_C09 포함) 및 트랜스티레틴(TTR: transthyretin) 간(liver) 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터가 본원에 개시되어 있다.
하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 95% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 96% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 97% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 98% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나와 적어도 99% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 어느 하나를 포함하는 서열에서 선택된다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 95% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 96% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 97% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 98% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
또 다른 양태에 따르면, 본 개시내용은 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 99% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과, 적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 폐쇄형 DNA(ceDNA) 벡터를 제공한다.
하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 382로 제시된 서열과 적어도 98% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 382로 제시된 서열과 적어도 99% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 382를 포함하거나 서열번호 382로 이루어진다.
하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 425로 제시된 서열과 적어도 99% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 425로 제시된 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 431로 제시된 서열과 적어도 99% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 431로 제시된 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 435로 제시된 서열과 적어도 99% 동일성을 갖는 서열이다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 서열번호 435로 제시된 서열이다.
하나의 구현예에서, 프로모터는 서열번호 441 내지 448 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 441 내지 448 중 어느 하나를 포함하거나, 또는 서열번호 441 내지 448 중 어느 하나로 이루어진 서열, 및/또는 표 7A에 제시된 서열을 포함한다.
하나의 구현예에서, 프로모터는 서열번호 191과 적어도 85% 동일성, 적어도 90% 동일성, 적어도 95% 동일성, 적어도 96% 동일성, 적어도 97% 동일성, 적어도 98% 동일성, 적어도 99% 동일성을 갖는 핵산 서열을 포함하거나, 서열번호 191을 포함한다.
본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 443과 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 444와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 445와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 446과 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 447과 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 462와 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 467과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 470과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 470과 적어도 90% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다. 본원의 양태 및 구현예의 하나의 구현예에서, 프로모터는 서열번호 470과 적어도 95% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트이다.
하나의 구현예에서, ceDNA 벡터는 인핸서를 추가로 포함한다. 하나의 구현예에서, 인핸서는 서열번호 449 내지 461 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 449 내지 461 중 어느 하나를 포함하거나, 또는 서열번호 449 내지 461 중 어느 하나로 이루어진 서열, 및/또는 표 8A에 제시된 서열을 포함한다. 하나의 구현예에서, 인핸서는 세르핀 인핸서, 3xHNF1-4_ProEnh_10mer 및 5xHNF1_ProEnh_10mer로 이루어지는 군에서 선택된다. 하나의 구현예에서, 인핸서는 서열번호 450과 적어도 85% 동일성을 갖는 핵산 서열을 포함한다. 하나의 구현예에서, 인핸서는 서열번호 586과 적어도 85% 동일성을 갖는 핵산 서열을 포함한다. 하나의 구현예에서, 인핸서는 서열번호 587과 적어도 85% 동일성을 갖는 핵산 서열을 포함한다.
하나의 구현예에서, ceDNA 벡터는 하나 이상의 인트론을 추가로 포함한다. 하나의 구현예에서, 하나 이상의 인트론은 서열번호 509 내지 516 및 1000 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 509 내지 516 및 1000 중 어느 하나를 포함하거나, 또는 서열번호 509 내지 516 및 1000 중 어느 하나로 이루어진 서열, 및/또는 표 11A에 제시된 서열을 포함한다. 하나의 구현예에서, 하나 이상의 인트론은 미세생쥐바이러스(MVM:minute virus of mice)이다.
하나의 구현예에서, ceDNA 벡터는 3' 미번역 영역(3' UTR)을 포함한다. 하나의 구현예에서, 3' UTR은 서열번호 517 내지 525 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 517 내지 525 중 어느 하나를 포함하거나, 또는 서열번호 517 내지 525 중 어느 하나로 이루어진 서열, 및/또는 표 12에 제시된 서열을 포함한다.
하나의 구현예에서, ceDNA 벡터는 5' 미번역 영역(5' UTR)을 포함한다. 하나의 구현예에서, 5' UTR은 서열번호 482 내지 508 중 어느 하나와 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일하거나, 서열번호 482 내지 508 중 어느 하나를 포함하거나, 또는 서열번호 482 내지 508 중 어느 하나로 이루어진 서열, 및/또는 표 10에 제시된 서열을 포함한다.
하나의 구현예에서, ceDNA 벡터는 적어도 하나의 polyA 서열을 포함한다.
하나의 구현예에서, VD 프로모터는 SERP 인핸서를 포함한다. 하나의 구현예에서, VD 프로모터는 3xSERP 인핸서를 포함한다.
하나의 구현예에서, 프로모터는 TTR 간 프로모터이고, ceDNA는 MVM 인트론을 추가로 포함한다.
하나의 구현예에서, ceDNA 벡터는 서열번호 194, 서열번호 195, 서열번호 196, 서열번호 197, 서열번호 198, 서열번호 199, 서열번호 200, 서열번호 201, 서열번호 202, 서열번호 203, 서열번호 204, 서열번호 205, 서열번호 206, 서열번호 207, 서열번호 208, 서열번호 209, 서열번호 210, 서열번호 211, 서열번호 212, 서열번호 213, 서열번호 541, 서열번호 542, 서열번호 543, 서열번호 544, 서열번호 545, 서열번호 546, 서열번호 547, 서열번호 548, 서열번호 549, 서열번호 550, 서열번호 551, 서열번호 552, 서열번호 553, 서열번호 554, 서열번호 555, 서열번호 556, 서열번호 557, 서열번호 558, 서열번호 559, 서열번호 560, 서열번호 561, 서열번호 562, 서열번호 563, 서열번호 564, 서열번호 565, 서열번호 566, 서열번호 567, 서열번호 570, 서열번호 571, 서열번호 572, 서열번호 573, 서열번호 574, 서열번호 575, 서열번호 576, 서열번호 577, 서열번호 578, 서열번호 579, 서열번호 580, 서열번호 581, 서열번호 582, 서열번호 583 및 서열번호 584로 이루어지는 군에서 선택되는 핵산 서열과 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 동일하거나, 이러한 서열을 포함하거나, 또는 이러한 서열로 이루어진 핵산 서열을 포함한다.
하나의 구현예에서, 적어도 하나의 핵산 서열은 PAH에 대한 cDNA이다.
하나의 구현예에서, 적어도 하나의 ITR은 기능성 말단 분해 부위(TRS)와 Rep 결합 부위를 포함한다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 파르보바이러스, 데펜도바이러스 및 아데노연관바이러스(AAV)에서 선택되는 바이러스이다. 하나의 구현예에서, 플랭킹 ITR은 대칭 또는 비대칭이다. 하나의 구현예에서, 플랭킹 ITR은 대칭 또는 실질적으로 대칭이다. 하나의 구현예에서, 플랭킹 ITR은 비대칭이다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 야생형이거나, 두 개의 ITR이 모두 야생형이다. 하나의 구현예에서, 플랭킹 ITR은 상이한 바이러스 혈청형에서 유래한 것이다. 하나의 구현예에서, 플랭킹 ITR은 표 2에 제시된 한 쌍의 바이러스 혈청형에서 유래한 것이다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 표 3, 표 5A, 표 5B 또는 표 6의 서열에서 선택되는 서열을 포함한다.
하나의 구현예에서, ITR 중 적어도 하나는 ITR의 전반적인 3차원 입체형태에 영향을 미치는 결실, 부가 또는 치환에 의해 야생형 AAV ITR 서열로부터 변경된다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12에서 선택되는 AAV 혈청형에서 유도된다.
하나의 구현예에서, ITR 중 하나 또는 둘 모두는 합성이다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 야생형 ITR이 아니거나, 두 개의 ITR이 모두 야생형이 아니다.
하나의 구현예에서, ITR 중 하나 또는 둘 모두는 A, A', B, B', C, C', D 및 D'에서 선택되는 ITR 영역 중 적어도 하나에서 결실, 삽입 및/또는 치환에 의해 변형된다. 하나의 구현예에서, 상기 결실, 삽입 및/또는 치환은 통상적으로 A, A', B, B' C, 또는 C' 영역으로 형성된 스템-루프 구조의 전부 또는 일부를 결실시킨다.
하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 일부 및/또는 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조의 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템-루프 구조를 포함한다. 하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 2개의 루프를 포함한다.
하나의 구현예에서, ITR 중 하나 또는 둘 모두는 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 단일 루프를 포함한다.
하나의 구현예에서, ITR이 서로에 대해 역전될 때, 두 개의 ITR은 모두 전반적인 3차원 대칭을 이루는 방식으로 변경된다.
하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 90% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 95% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 96% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 97% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 98% 동일한 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 382 내지 440 또는 서열번호 1011 내지 1015와 적어도 99% 동일한 핵산 서열을 포함한다.
또 다른 양태에서, 세포에서 PAH 단백질을 발현시키는 방법으로서, 세포를 본원에 개시된 ceDNA 벡터와 접촉시키는 단계를 포함하는 방법이 본원에 개시되어 있다. 하나의 구현예에서, 세포는 광수용체 또는 RPE 세포이다. 하나의 구현예에서, 세포는 시험관내 또는 생체내에서 접촉된다.
또 다른 양태에서, 페닐케톤뇨증(PKU)을 앓고 있는 대상을 치료하는 방법으로서, 본원에 개시된 ceDNA 벡터를 상기 대상에게 투여하는 단계를 포함하는 방법이 본원에 개시되어 있다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 표 1A에 제시된 서열 중 임의의 것과 적어도 90% 동일성을 갖는 서열에서 선택된다. 하나의 구현예에서, 대상은 투여 전 대상의 혈청 페닐알라닌 수준과 비교하여 혈청 페닐알라닌 수준의 적어도 약 50% 감소를 나타낸다. 하나의 구현예에서, 대상은 투여 전 PAH 활성 수준과 비교하여 투여 후 PAH 활성의 적어도 약 10%의 증가를 나타낸다.
하나의 구현예에서, ceDNA 벡터는 지질 나노입자로 제형화된다. 하나의 구현예에서, ceDNA 벡터는 정맥내로 투여된다. 하나의 구현예에서, ceDNA 벡터는 근육내로 투여된다. 하나의 구현예에서, ceDNA 벡터는 주입을 통해 투여된다.
또 다른 양태에서, ceDNA 벡터를 포함하는 약학적 조성물이 본원에 개시되어 있다.
또 다른 양태에서, ceDNA 벡터와 지질을 포함하는 조성물이 본원에 개시되어 있다. 하나의 구현예에서, 지질은 지질 나노입자(LNP)이다.
또 다른 양태에서, 본원에 개시된 ceDNA 벡터, 본원에 개시된 약학적 조성물 또는 본원에 개시된 조성물을 포함하는 키트가 본원에 개시되어 있다. 하나의 구현예에서, 키트는 사용 설명서를 포함한다.
본 개시내용의 이러한 및 다른 양태는 하기에 보다 상세하게 기재되어 있다.
본 특허 또는 출원 파일은 컬러로 작성된 적어도 하나의 도면을 포함한다. 컬러 도면(들)을 포함하는 본 특허 또는 특허 출원 공개의 카피는 요청 및 필요한 수수료 지불 시 해당 관청에서 제공받을 수 있다.
상기 간략하게 개략되어 있고 하기 보다 상세하게 논의되는 본 개시내용의 구현예는, 첨부된 도면에 도시된 본 개시내용의 예시적인 구현예를 참조로 이해될 수 있다. 하지만, 첨부된 도면은 본 개시내용의 단지 전형적인 구현예를 예시하는 것으로, 본 개시내용의 범위를 제한하는 것으로 간주되어서는 안 되며, 본 개시내용은 다른 동등하게 효과적인 구현예를 허용할 수 있다.
도 1a는, A-A' 아암, B-B' 아암, C-C' 아암, 2개의 Rep 결합 부위(RBE 및 RBE')가 확인되는 AAV2의 야생형 좌측 ITR(서열번호 52)의 T-형 스템-루프 구조를 제공하고, 또한 말단 분해 부위(TRS)를 보여준다. RBE는 Rep 78 또는 Rep 68과 상호작용하는 것으로 여겨지는 일련의 4개의 이중체 사량체를 함유한다. 나아가, RBE'는 또한 작제물 내 야생형 ITR 또는 돌연변이된 ITR 상에 어셈블링된 Rep 복합체와 상호작용하는 것으로 여겨진다. D 및 D' 영역은 전사인자 결합 부위와 다른 보존된 구조를 함유한다. 도 1b는, A-A' 아암, B-B' 아암, C-C' 아암, 2개의 Rep 결합 부위(RBE 및 RBE')가 확인되는 AAV2의 야생형 좌측 ITR의 T-형 스템-루프 구조를 포함하는 야생형 좌측 ITR(서열번호 53)에서의 제안된 Rep 촉매화된 닉킹 및 결찰 활성을 보여주고, 또한 말단 분해 부위(TRS), 및 몇몇 전사인자 결합 부위와 다른 보존된 구조를 포함하는 D 및 D' 영역을 보여준다.
도 2a는, 야생형 좌측 AAV2 ITR(서열번호 54)의 A-A' 아암의 RBE 함유 부분과 C-C' 및 B-B' 아암의 1차 구조(폴리핵산 서열)(좌측)와 2차 구조(우측)를 보여준다. 도 2b는, 좌측 ITR에 대한 예시적인 돌연변이된 ITR(변형된 ITR로도 지칭됨) 서열을 보여준다. 예시적인 돌연변이된 좌측 ITR(ITR-1, 좌측)(서열번호 113)의 A-A' 아암의 RBE 부분과 C 아암 및 B-B' 아암의 1차 구조(좌측)와 예측된 2차 구조(우측)가 제시되어 있다. 도 2c는, 야생형 우측 AAV2 ITR(서열번호 55)의 A-A' 루프의 RBE 함유 부분과 B-B' 및 C-C' 아암의 1차 구조(좌측)와 2차 구조(우측)를 보여준다. 도 2d는, 예시적인 우측 변형된 ITR을 보여준다. 예시적인 돌연변이 우측 ITR(ITR-1, 우측)(서열번호 114)의 A-A' 아암의 RBE 함유 부분과 B-B' 및 C 아암의 1차 구조(좌측)와 예측된 2차 구조(우측)가 제시되어 있다. 좌측 및 우측 ITR(예를 들어, AAV2 ITR, 또는 다른 바이러스 혈청형 또는 합성 ITR)의 임의의 조합이 본원에 교시된 바와 같이 사용될 수 있다. 도 2a 내지 도 2d 각각에서, 폴리뉴클레오타이드 서열은 본원에 기재된 바와 같은 ceDNA를 생산하는 데 사용되는 플라스미드 또는 박미드/바큘로바이러스 게놈에 사용된 서열을 나타낸다. 또한, 도 2a 내지 도 2d 각각에는, 플라스미드 또는 박미드/바큘로바이러스 게놈의 ceDNA 벡터 구성 및 예측된 깁스 자유 에너지 값에서 추론된 상응하는 ceDNA 2차 구조가 포함되어 있다.
도 3a는, 도 3b의 개략도에 기재된 공정에서 본원에 개시된 바와 같은 PAH의 발현을 위한 ceDNA 벡터의 생산에 유용한 바큘로바이러스 감염된 곤충 세포(BIIC)를 제조하는 업스트림 공정을 예시하는 개략도이다. 도 3b는 예시적인 ceDNA 생산 방법의 개략도이고, 도 3c는 ceDNA 벡터 생산을 확인하기 위한 생화학적 방법 및 공정을 예시한다. 도 3d도 3e는, 도 3b의 ceDNA 생산 공정 동안 수득된 세포 펠릿에서 수거된 DNA에서 ceDNA의 존재를 식별하는 공정을 설명하는 개략도이다. 도 3d는, 절단되지 않은 채로 유지되거나 제한 엔도뉴클레아제로 소화된 후, 미변성 겔 또는 변성 겔 상에서 전기영동에 적용된 예시적인 ceDNA에 대한 개략적인 예상 밴드를 보여준다. 가장 좌측의 개략도는 미변성 겔이며, 이는 이중체 및 절단되지 않은 형태에서 ceDNA가, 더 빠르게 이동하는 더 작은 단량체와 단량체 크기의 2배인 더 느리게 이동하는 이량체로 보이는, 적어도 단량체와 이량체 상태로 존재함을 시사한다. 좌측에서 두 번째 개략도는, ceDNA가 제한 엔도뉴클레아제로 절단되는 경우, 본래 밴드가 사라지고, 절단 후 남아있는 예상 단편 크기에 상응하는 더 빠르게 이동하는(예를 들어, 더 작은) 밴드가 나타남을 보여준다. 변성 조건 하에서, 본래 이중체 DNA는 단일가닥이며, 이는 상보적 가닥이 공유결합으로 연결되어 있기 때문에, 미변성 겔 상에서 관찰된 것 보다 2배 더 큰 종으로 이동한다. 따라서, 우측에서 두 번째 개략도에서, 소화된 ceDNA는 미변성 겔에서 관찰된 것과 유사한 밴딩 분포를 보여주지만, 밴드는 미변성 겔 대응물의 2배 크기의 단편으로 이동한다. 가장 우측의 개략도는, 변성 조건 하에서 절단되지 않은 ceDNA가 단일가닥 개방형 고리로 이동하기 때문에, 관찰된 밴드는 고리가 개방되지 않은 미변성 조건에서 관찰된 것의 2배 크기임을 보여준다. 이러한 도면에서, "kb"는, 문맥에 따라, 뉴클레오타이드 사슬 길이(예를 들어, 변성 조건에서 관찰된 단일가닥 분자의 경우) 또는 염기쌍의 수(예를 들어, 미변성 조건에서 관찰된 이중가닥 분자의 경우)를 기반으로 뉴클레오타이드 분자의 상대적인 크기를 나타내는 데 사용된다. 도 3e는, 비연속 구조를 갖는 DNA를 보여준다. ceDNA는 ceDNA 벡터 상에 단일 인식 부위를 갖는 제한 엔도뉴클레아제에 의해 절단되어, 중성 및 변성 조건 모두에서 상이한 크기(1 kb 및 2 kb)를 갖는 2개의 DNA 단편을 생성할 수 있다. 도 3e는, 선형 및 연속 구조를 갖는 ceDNA를 또한 보여준다. ceDNA 벡터는 제한 엔도뉴클레아제에 의해 절단되어, 중성 조건에서는 1 kb 및 2 kb로 이동하는 2개의 DNA 단편을 생성할 수 있지만, 변성 조건에서는 가닥이 연결된 채로 유지되어 2 kb 및 4 kb로 이동하는 단일 가닥을 생성할 수 있다.
도 4는, 엔도뉴클레아제로 소화되거나(+) 소화되지 않은(-) ceDNA 벡터의 변성 겔 전개 예들의 예시적인 도면이다(ceDNA 작제물 1 및 2의 경우 EcoRI; ceDNA 작제물 3 및 4의 경우 BamH1; ceDNA 작제물 5 및 6의 경우 SpeI; 및 ceDNA 작제물 7 및 8의 경우 XhoI). 작제물 1 내지 8은 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로 인용됨)의 실시예 1에 기재되어 있다. 별표로 강조된 밴드의 크기를 결정하고 도면의 하단에 제공하였다.
도 5a 내지 도 5e는, 실시예 6에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA412; hPAH_codop_ORF_v2), 또는 3xHS-CRM8_SERP_Enhancer, TTR-promoter-d5pUTR 및 MVM_intron을 갖는 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA1530; hPAH-r5-s29)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 21일에 걸쳐 개별 마우스에서 평가하였다.
도 6a도 6b는, 실시예 7에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1132, ceDNA1274 및 ceDNA1527)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 개별 마우스에서 평가하였고, 각 군의 모든 5마리 마우스에 대한 평균 교정을 도 6a도 6b의 그래프에 제시하였다. PHE 농도는 대조군 동물(PAHenu2: 비히클)에서 감소하지 않았다.
도 7a 내지 도 7g는, 개별 마우스에 대한 실시예 7에 기재된 실험 결과를 도시한 그래프이다.
도 8a도 8b는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1528 및 ceDNA1414)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였고, 각 군의 모든 5마리 마우스에 대한 평균 교정을 도 8a도 8b의 그래프에 제시하였다. PHE 농도는 대조군 동물(PAHenu2: 비히클)에서 감소하지 않았다.
도 9a 내지 도 9e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 0.5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였다.
도 10a 내지 도 10e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였다.
도 11a도 11b는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 0.5 ㎍ 및 5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였고, 각 군의 모든 5마리 마우스에 대한 평균 교정을 도 11a도 11b의 그래프에 제시하였다. PHE 농도는 대조군 동물(PAHenu2: 비히클)에서 감소하지 않았다.
도 12a 내지 도 12e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 13a 내지 도 13e는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA1416, ceDNA1428, ceDNA1414 및 ceDNA1528)의 영향을 5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 14a 내지 도 14i는, 실시예 8에 기재된 실험 결과를 도시한 그래프이다. 페닐알라닌 농도("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1430, ceDNA1432, ceDNA1473, ceDNA1474, ceDNA1436, ceDNA1471, ceDNA1472)의 영향을 5 ㎍ 유체역학적 용량으로 7일 후 개별 마우스에서 평가하였다.
도 15a 내지 도 15i는, 실시예 9에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1476, ceDNA1479, ceDNA1939, ceDNA1940, ceDNA1941, ceDNA1942, ceDNA1943, ceDNA1944)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 16a 내지 도 16d는, 실시예 10에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA1939, ceDNA1955, ceDNA62)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 17a 내지 도 17h는, 실시예 11에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA2409, ceDNA2410, ceDNA2415, ceDNA2418, ceDNA2416, ceDNA2419, ceDNA2420)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 18a 내지 도 18d는, 실시예 11에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA2415, ceDNA2418)의 영향을 0.1 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 19a 내지 도 19f는, 실시예 12에 기재된 실험 결과를 도시한 그래프이다. 혈청 페닐알라닌 수준("PHE μM") 교정에 대한 코돈 최적화된 PAH 핵산 서열을 포함하는ceDNA 벡터(ceDNA412, ceDNA34, ceDNA36, ceDNA41, ceDNA42, ceDNA43)의 영향을 0.5 ㎍ 유체역학적 용량으로 28일 후 개별 마우스에서 평가하였다.
도 20a도 20b는, PAH CDS로의 인트론의 예시적인 삽입에 대한 개략도이다. 기능성 스플라이스 공여 및 수용 부위를 갖는 키메라 PAH 인트론을 PAH CDS의 인트론 1의 본래 위치에 삽입하였다. PAH CDS에서 코돈 최적화된 서열이 PAH cDNA 서열에서 유도된 인트론 플랭킹 영역(33 bp)으로 치환되었다. 도면은 서열번호 1022를 개시한다.
도 21은, PAH CDS로의 인트론의 예시적인 삽입에 대한 개략도이다. 기능성 스플라이스 공여 및 수용 부위를 갖는 키메라 PAH 인트론을 PAH CDS의 인트론 1의 본래 위치에 삽입하였다. 인트론 스플라이스 부위를 플랭킹하는 영역의 서열이 공통 서열과 더 잘 일치하도록 변경되었다. 도면은, 제시된 순서대로, 각각, 서열번호 1023과 서열번호 1024를 개시한다.
PAH 치료 단백질 또는 이의 단편을 인코딩하는 하나 이상의 코돈 최적화된 핵산을 포함하는 ceDNA 벡터를 사용하여 페닐케톤뇨증(PKU)을 치료하는 방법이 본원에 제공된다. 또한, PAH 단백질 또는 이의 단편을 인코딩하는 하나 이상의 코돈 최적화된 핵산을 포함하는, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 본원에 제공된다. PAH 치료 단백질 또는 이의 단편을 인코딩하는 코돈 최적화된 핵산이, 특정 시스-작용 요소(예들 들어, 특정 프로모터 및/또는 조절 요소)와 조합될 때, 대상에서 페닐알라닌 수준(예를 들어, 발현 및 지속기간)의 최적 교정을 제공한다는 것은 본 개시내용의 놀라운 발견이다.
일부 구현예에 따르면, 페닐알라닌 수준의 최적 교정은 페닐알라닌 히드록실라아제(PAH)의 결핍으로 인한 질환 또는 장애를 치료하는 데 치료적으로 유효한 수준이다. 본 개시내용에 기재된 바와 같이, 코돈 최적화된 서열을 포함하는 작제물은 본래 hPAH cDNA 서열보다 상당히 더 우수한 성능을 나타내었고, 코돈 최적화된 서열과 특정 시스-작용 요소를 포함하는 특정 작제물은 연장된 발현과 페닐알라닌 수준의 교정을 나타냈다. 일부 구현예에서, PAH 단백질의 발현은 치료용 단백질이 이것이 발현되는 세포 외부로 분비되는 것을 포함할 수 있거나, 대안적으로는, 일부 구현예에서, 발현된 PAH 단백질은 이것이 발현되는 세포 내에서 작용하거나 기능할 수 있다(예를 들어, 이의 효과를 발휘함). 일부 구현예에서, ceDNA 벡터는 대상의 간, 근육(예를 들어, 골격근), 또는 PAH 치료 단백질 생산 및 다수의 전신 구획으로의 분비를 위한 데포로서 작용할 수 있는 다른 신체 부위에서 PAH 단백질을 발현시킨다.
I. 정의
본원에서 달리 정의되지 않는 한, 본 출원과 관련하여 사용된 과학 및 기술 용어는 본 개시내용이 속하는 당업자가 통상적으로 이해하는 의미를 가질 것이다. 본 개시내용이 본원에 기재된 특정 방법론, 프로토콜 및 시약 등에 제한되지 않고, 달라질 수 있다는 것을 이해해야 한다. 본원에 사용된 용어는 단지 특정 구현예를 설명하기 위한 목적이며, 청구범위에 의해서만 한정되는 본 개시내용의 범위를 제한하고자 하는 것이 아니다. 면역학 및 분자생물학에서의 상용 용어 정의는, 하기 문헌에서 확인할 수 있다: 문헌[The Merck Manual of Diagnosis and Therapy, 19th Edition, Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3)]; 문헌[Robert S. Porter et al. (eds.), Fields Virology, 6th Edition, Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013)]; 문헌[Knipe, D.M. and Howley, P.M. (ed.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908)]; 문헌[Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8)]; 문헌[Immunology by Werner Luttmann, Elsevier, 2006]; 문헌[Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (eds.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305)]; 문헌[Lewin's Genes XI, Jones & Bartlett Publishers, 2014 (ISBN-1449659055)]; 문헌[Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414)]; 문헌[Davis et al., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X)]; 문헌[Laboratory Methods in Enzymology: DNA, Jon Lorsch (ed.) Elsevier, 2013 (ISBN 0124199542)]; 문헌[Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN 047150338X, 9780471503385)]; 문헌[Current Protocols in Protein Science (CPPS), John E. Coligan (ed.), John Wiley and Sons, Inc., 2005]; 및 문헌[Current Protocols in Immunology (CPI), John E. Coligan, ADA M Kruisbeek, David H Margulies, Ethan M Shevach, Warren Strobe, (eds.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737)](상기 문헌들의 내용은 모두 그 전문이 본원에 참조로서 인용됨).
본원에 사용된 "투여", "투여하는"이라는 용어 및 이의 변형은, 대상에게 조성물 또는 작용제(예를 들어, 본원에 기재된 바와 같은 치료 핵산 또는 면역억제제)를 도입하는 것을 나타내며, 하나 이상의 조성물 또는 작용제의 동시 및 순차적 도입을 포함한다. "투여"는, 예를 들어 치료, 약동학, 진단, 연구, 위약 및 실험 방법을 나타낼 수 있다. "투여"는 또한 시험관내생체외 처리를 포함한다. 대상으로의 조성물 또는 작용제의 도입은, 경구, 폐, 비강, 비경구(정맥내, 근육내, 복강내 또는 피하), 직장, 림프내, 종양내 또는 국소를 포함하는 임의의 적합한 경로로 이루어진다. 대상으로의 조성물 또는 작용제의 도입은 전기천공을 통해 이루어진다. 투여는 자가 투여와 다른 이에 의한 투여를 포함한다. 투여는 임의의 적합한 경로로 수행될 수 있다. 적합한 투여 경로는 조성물 또는 작용제가 이의 의도된 기능을 수행하는 것을 가능하게 한다. 예를 들어, 적합한 경로가 정맥내인 경우, 조성물은 조성물 또는 작용제를 대상의 정맥에 도입하는 방식으로 투여된다.
본원에 사용된 "핵산 치료제", "치료용 핵산" 및 "TNA"라는 구절은 상호교환적으로 사용되며, 질환 또는 장애를 치료하기 위한 치료제의 활성 성분으로서 핵산을 사용하는 임의의 치료 양식을 나타낸다. 본원에 사용된 이러한 구절은 RNA 기반 치료제와 DNA 기반 치료제를 나타낸다. RNA 기반 치료제의 비제한적인 예에는, mRNA, 안티센스 RNA 및 올리고뉴클레오타이드, 리보자임, 압타머, 간섭 RNA(RNAi), 다이서-기질 dsRNA, 소형 헤어핀 RNA(shRNA), 비대칭 간섭 RNA(aiRNA), 가이드 RNA(gRNA) 및 마이크로RNA(miRNA)가 포함된다. DNA 기반 치료제의 비제한적인 예에는, 미니서클 DNA, 미니유전자, 바이러스성 DNA(예를 들어, 렌티바이러스 또는 AAV 게놈) 또는 비바이러스성 합성 DNA 벡터, 폐쇄형 선형 이중체 DNA(ceDNA/CELiD), 플라스미드, 박미드, 개뼈형(dbDNA™) DNA 벡터, 최소한으로 면역학적으로 정의된 유전자 발현(MIDGE) 벡터, 비바이러스성 미니스트링 DNA 벡터(선형의 공유결합으로 폐쇄된 DNA 벡터) 또는 덤벨형 DNA 최소 벡터("덤벨 DNA")가 포함된다.
본원에 사용된 PAH 치료 단백질 또는 이의 단편과 같은 치료제의 "유효량" 또는 "치료적 유효량"이란, 목적하는 효과를 생성하는 데, 예를 들어 질환 변형 수준의 PAH 효소를 제공하고/하거나, 간에서 교정 PAH 효소의 발현 지속시키고/시키거나, 요소 회로 기능과 페닐알라닌 대사를 회복시키고/시키거나, 결함 효소의 적절한 약리학적 수준을 달성하는 데 충분한 양이다. 표적 유전자 또는 표적 서열의 발현을 측정하는 데 적합한 검정에는, 예를 들어 도트 블롯(dot blot), 노던 블롯(northern blot), 제자리 혼성화, ELISA, 면역침강, 효소 기능과 같은 당업자에게 알려진 기술뿐 아니라, 당업자에게 알려진 표현형 검정을 사용하는 단백질 또는 RNA 수준의 검사가 포함된다. 하지만, 투여량 수준은 질환의 유형, 환자의 연령, 체중, 성별 및 의학적 상태, 병태의 중증도, 투여 경로, 및 이용되는 특정 활성제를 포함하는 다양한 인자를 기반으로 한다. 따라서, 투여 요법은 광범위하게 달라질 수 있으나, 의사가 표준 방법을 사용하여 통상적으로 결정할 수 있다. 또한, "치료량", "치료적 유효량" 및 "약학적 유효량"이라는 용어는, 상기 기재된 개시내용의 조성물의 예방적 또는 예방용 양을 포함한다. 상기 기재된 개시내용의 예방적 또는 예방용 적용에서, 약학적 조성물 또는 약제는 질환, 장애 또는 병태에 걸리기 쉽거나 다르게는 이의 위험이 있는 환자에게, 질환, 장애 또는 병태, 이의 합병증, 및 질환, 장애 또는 병태의 발달 동안 나타나는 중간 병리학적 표현형의 생화학적, 조직학적 및/또는 거동적 증상을 포함하는, 질환, 장애 또는 병태의 위험을 제거 또는 감소시키거나, 이의 중증도를 감소시키거나, 또는 이의 발병을 지연시키는 데 충분한 양으로 투여된다. 최대 용량, 즉, 일부 의학적 판단에 따라 가장 안전한 용량이 사용되는 것이 일반적으로 바람직하다. 일부 구현예에 따르면, 질환, 장애 또는 병태는 PKU이다. "용량" 및 "투여량"이라는 용어는 본원에서 상호교환적으로 사용된다.
본원에 사용된 "치료 효과"라는 용어는, 바람직하고 유익한 것으로 판단되는 치료 결과를 나타낸다. 치료 효과는, 직접적으로 또는 간접적으로, 질환 발현의 억제, 감소 또는 제거를 포함할 수 있다. 치료 효과는 또한, 직접적으로 또는 간접적으로, 질환 발현 진행의 억제, 감소 또는 제거를 포함할 수 있다.
본원에 기재된 임의의 치료제의 경우, 치료적 유효량은 초기에 예비 시험관내 연구 및/또는 동물 모델에서 결정될 수 있다. 치료적 유효 용량은 또한 인간 데이터로부터 결정될 수 있다. 적용되는 용량은 투여된 화합물의 상대적인 생체이용률 및 효능을 기반으로 조정될 수 있다. 상기 기재된 방법 및 다른 널리 알려진 방법을 기반으로 최대 효능을 달성하기 위해 용량을 조정하는 것은, 당업자의 능력에 속한다. 문헌[Goodman and Gilman's The Pharmacological Basis of Therapeutics, 10th Edition, McGraw-Hill (New York) (2001)](이는 본원에 참조로서 인용됨)의 챕터 1에서 확인할 수 있는 치료 효과를 결정하는 일반 원리가 하기에 요약되어 있다.
약동학적 원리는, 허용 가능하지 않은 부작용을 최소화하면서 목적하는 정도의 치료 효능을 얻기 위해 투여 요법을 변경하는 기반을 제공한다. 약물의 혈장 농도가 측정될 수 있고 이것이 치료 범위와 관련이 있는 상황에서, 투여량 변경을 위한 추가 지침을 얻을 수 있다.
본원에 사용된 "이종 뉴클레오타이드 서열" 및 "전이유전자"라는 용어는 상호교환적으로 사용되며, 본원에 개시된 바와 같은 ceDNA 벡터에 혼입되고, 이에 의해 전달 및 발현될 수 있는 (캡시드 폴리펩타이드를 인코딩하는 핵산 이외의) 관심 핵산을 나타낸다. 하나의 구현예에서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열은 이종 핵산 서열이다.
본원에 사용된 "발현 카세트" 및 "전사 카세트"라는 용어는 상호교환적으로 사용되며, 하나 이상의 프로모터, 또는 전이유전자의 전사를 지시하는 데 충분한 다른 조절 서열에 작동 가능하게 연결되어 있는 전이유전자를 포함하지만, 캡시드 인코딩 서열, 다른 벡터 서열 또는 역말단반복 영역을 포함하지 않는 핵산의 선형 스트레치를 나타낸다. 발현 카세트는 하나 이상의 시스-작용 서열(예를 들어, 프로모터, 인핸서 또는 억제제), 하나 이상의 인트론 및 하나 이상의 전사 후 조절 요소를 추가로 포함할 수 있다.
본원에서 상호교환적으로 사용되는 "폴리뉴클레오타이드" 및 "핵산"이라는 용어는, 임의의 길이의 뉴클레오타이드, 리보뉴클레오타이드 또는 데옥시리보뉴클레오타이드의 중합체 형태를 나타낸다. 따라서, 이러한 용어에는, 단일가닥, 이중가닥 또는 다중가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 혼성체, 또는 퓨린 및 피리미딘 염기, 또는 다른 천연, 화학적 또는 생화학적으로 변형된, 비천연 또는 유도체화된 뉴클레오타이드 염기를 포함하는 중합체가 포함된다. "올리고뉴클레오타이드"는 일반적으로 단일가닥 또는 이중가닥 DNA의 약 5개 내지 약 100개 뉴클레오타이드의 폴리뉴클레오타이드를 나타낸다. 하지만, 본 개시내용을 목적을 위해, 올리고뉴클레오타이드의 길이에는 상한이 없다. 올리고뉴클레오타이드는 "올리고머" 또는 "올리고"로도 알려져 있으며, 유전자에서 단리되거나, 당업계에 알려진 방법에 따라 화학적으로 합성될 수 있다. "폴리뉴클레오타이드" 및 "핵산"이라는 용어는, 기재되는 구현예에 적용되는 바에 따라, 단일가닥(예컨대 센스 및 안티센스) 및 이중가닥 폴리뉴클레오타이드를 포함한다는 것을 이해해야 한다. DNA는, 예를 들어 안티센스 분자, 플라스미드 DNA, DNA-DNA 이중체, 사전 축합된 DNA, PCR 산물, 벡터(P1, PAC, BAC, YAC, 인공 염색체), 발현 카세트, 키메라 서열, 염색체 DNA, 또는 이러한 그룹의 유도체 및 조합의 형태일 수 있다. DNA는 미니서클, 플라스미드, 박미드, 미니유전자, 미니스트링 DNA(선형의 공유결합으로 폐쇄된 DNA 벡터), 폐쇄형 선형 이중체 DNA(CELiD 또는 ceDNA), 개뼈형(dbDNA™) DNA, 덤벨형 DNA, 최소한으로 면역학적으로 정의된 유전자 발현(MIDGE) 벡터, 바이러스성 벡터 또는 비바이러스성 벡터의 형태일 수 있다. RNA는 소형 간섭 RNA(siRNA), 다이서-기질 dsRNA, 소형 헤어핀 RNA(shRNA), 비대칭 간섭 RNA(aiRNA), 마이크로RNA(miRNA), mRNA, gRNA, rRNA, tRNA, 바이러스성 RNA(vRNA) 및 이들의 조합의 형태일 수 있다. 핵산에는, 합성, 자연 발생 및 비자연 발생이고, 참조 핵산과 유사한 결합 특성을 갖는, 알려진 뉴클레오타이드 유사체, 또는 변형된 백본 잔기 또는 연결을 함유하는 핵산이 포함된다. 이러한 유사체 및/또는 변형된 잔기의 예에는, 비제한적으로, 포스포로티오에이트, 포스포로디아미데이트 모르폴리노 올리고머(모르폴리노), 포스포르아미데이트, 메틸 포스포네이트, 키랄-메틸 포스포네이트, 2'-O-메틸 리보뉴클레오타이드, 잠금 핵산(LNA™) 및 펩타이드 핵산(PNA)이 포함된다. 구체적으로 제한되지 않는 한, 상기 용어는 참조 핵산과 유사한 결합 특성을 갖는 천연 뉴클레오타이드의 알려진 유사체를 함유하는 핵산을 포함한다. 달리 지시되지 않는 한, 특정 핵산 서열은 또한 이의 보존적으로 변형된 변이체(예를 들어, 퇴화 코돈 치환), 대립유전자, 동원체(ortholog), SNP 및 상보적 서열뿐 아니라, 명백하게 제시된 서열을 암시적으로 포함한다.
"뉴클레오타이드"는, 당 옥시리보오스(DNA) 또는 리보오스(RNA), 염기 및 포스페이트기를 함유한다. 뉴클레오타이드는 포스페이트기를 통해 함께 연결된다.
"염기"에는, 퓨린 및 피리미딘(이에는 천연 화합물인 아데닌, 티민, 구아닌, 시토신, 우라실, 이노신, 및 천연 유사체가 추가로 포함됨) 및 퓨린 및 피리미딘의 합성 유도체(이에는, 비제한적으로, 아민, 알코올, 티올, 카르복실레이트 및 알킬할라이드와 같은 새로운 반응성기가 대체된 변형이 포함됨)가 포함된다.
본원에 사용된 "간섭 RNA" 또는 "RNAi" 또는 "간섭 RNA 서열"이라는 용어는, 간섭 RNA가 표적 유전자 또는 서열과 동일한 세포에 존재하는 경우 (예를 들어, 간섭 RNA 서열에 상보적인 mRNA의 번역을 저해하거나 분해를 매개하는 방식으로) 표적 유전자 또는 서열의 발현을 감소시키거나 저해할 수 있는, 단일가닥 RNA(예를 들어, 성숙 miRNA, ssRNAi 올리고뉴클레오타이드, ssDNAi 올리고뉴클레오타이드), 이중가닥 RNA(즉, 듀플렉스 RNA, 예컨대 siRNA, 다이서-기질 dsRNA, shRNA, aiRNA 또는 pre-miRNA), DNA-RNA 혼성체(예를 들어, 국제 특허 출원 공개 WO 2004/078941 참조) 또는 DNA-DNA 혼성체(예를 들어, PCT 공개 WO 2004/104199 참조)를 포함한다. 따라서, 간섭 RNA는 표적 mRNA 서열에 상보적인 단일가닥 RNA, 또는 2개의 상보적 가닥 또는 단일의 자가 상보적 가닥으로 형성된 이중가닥 RNA를 나타낸다. 간섭 RNA는 표적 유전자 또는 서열과 실질적으로 또는 완전히 동일할 수 있거나, 미스매치(mismatch) 영역(즉, 미스매치 모티프)를 포함할 수 있다. 간섭 RNA의 서열은 전장 표적 유전자, 또는 이의 하위서열에 상응할 수 있다. 바람직하게는, 간섭 RNA 분자는 화학적으로 합성된다. 상기 특허 문헌 각각의 개시내용은 모든 목적을 위해 그 전문이 본원에 참조로서 인용된다.
간섭 RNA에는, "작은 간섭 RNA" 또는 "siRNA", 예를 들어 약 15개 내지 60개, 15개 내지 50개 또는 15개 내지 40개(이중체) 뉴클레오타이드 길이, 보다 전형적으로 약 15개 내지 30개, 15개 내지 25개 또는 19개 내지 25개(이중체) 뉴클레오타이드 길이, 바람직하게는 약 20개 내지 24개, 21개 내지 22개 또는 21개 내지 23개(이중체) 뉴클레오타이드 길이의 간섭 RNA가 포함된다(예를 들어, 이중가닥 siRNA의 각각의 상보적 서열은 15개 내지 60개, 15개 내지 50개, 15개 내지 40개, 15개 내지 30개, 15개 내지 25개 또는 19개 내지 25개 뉴클레오타이드 길이, 바람직하게는 약 20개 내지 24개, 21개 내지 22개 또는 21개 내지 23개 뉴클레오타이드 길이이고, 이중가닥 siRNA는 약 15개 내지 60개, 15개 내지 50개, 15개 내지 40개, 15개 내지 30개, 15개 내지 25개 또는 19개 내지 25개 염기쌍 길이, 바람직하게는 약 18개 내지 22개, 19개 내지 20개 또는 19개 내지 21개 염기쌍 길이임). siRNA 이중체는 약 1개 내지 약 4개 뉴클레오타이드 또는 약 2개 내지 약 3개 뉴클레오타이드의 3' 돌출부와, 5' 포스페이트 말단을 포함할 수 있다. siRNA의 예에는, 비제한적으로, 2개의 별개의 가닥 분자에서 어셈블링된 이중가닥 폴리뉴클레오타이드 분자(여기서 하나의 가닥은 센스 가닥이고, 다른 하나는 상보적 안티센스 가닥임); 단일가닥 분자에서 어셈블링된 이중가닥 폴리뉴클레오타이드 분자(여기서 센스 및 안티센스 영역은 핵산 기반 또는 비핵산 기반 링커로 연결되어 있음); 자가 상보적 센스 및 안티센스 영역을 갖는 헤어핀 2차 구조를 갖는 이중가닥 폴리뉴클레오타이드 분자; 및 2개 이상의 루프 구조와 자가 상보적 센스 및 안티센스 영역을 갖는 스템을 갖는 원형 단일가닥 폴리뉴클레오타이드 분자(여기서 원형 폴리뉴클레오타이드는 생체내 또는 시험관내에서 처리되어 활성 이중가닥 siRNA 분자를 생성할 수 있음)가 포함된다. 본원에 사용된 "siRNA"라는 용어는, RNA-RNA 이중체뿐 아니라, DNA-RNA 혼성체를 포함한다(예를 들어, PCT 공개 WO 2004/078941(이는 그 전문이 본원에 참조로서 인용됨)).
본원에 사용된 "핵산 작제물"이라는 용어는, 자연 발생 유전자에서 단리되거나, 자연에 달리 존재하지 않을 수 있는 방식으로 핵산의 분절을 함유하도록 변형되거나 또는 합성된, 단일가닥 또는 이중가닥의 핵산 분자를 나타낸다. 핵산 작제물이라는 용어는, 핵산 작제물이 본 개시내용의 코딩 서열의 발현에 필요한 제어 서열을 함유하는 경우, "발현 카세트"라는 용어와 동의어이다. "발현 카세트"는 프로모터에 작동 가능하게 연결된 DNA 코딩 서열을 포함한다.
"혼성화 가능한" 또는 "상보적인" 또는 "실질적으로 상보적인"이란, 핵산(예를 들어, RNA)이 이에 대한 비공유결합을 가능하게 하는, 즉, 왓슨-크릭(Watson-Crick) 염기 쌍 및/또는 G/U 염기 쌍을 형성하거나, 온도 및 용액 이온 강도의 적절한 시험관내 및/또는 생체내 조건 하에서 서열 특이적인 역평행 방식으로 또 다른 핵산(즉, 상보적인 핵산에 특이적으로 결합하는 핵산)에 "어닐링", 또는 "혼성화"하는 뉴클레오타이드의 서열을 포함한다는 것을 의미한다. 당업계에 알려진 바와 같이, 표준 왓슨-크릭 염기 짝짓기에는, 아데닌(A)과 티미딘(T)의 짝짓기, 아데닌(A)과 우라실(U)의 짝짓기, 및 구아닌(G)과 시토신(C)의 짝짓기가 포함된다. 또한, 당업계에는 2개의 RNA 분자(예를 들어, dsRNA) 사이의 혼성화, 구아닌(G)과 우라실(U)의 염기 쌍에 대해서도 알려져 있다. 예를 들어, G/U 염기 짝짓기는 tRNA 안티코돈과 mRNA 코돈의 염기 짝짓기의 맥락에서 유전자 코드의 축퇴(즉, 중복)에 부분적으로 관여한다. 본 개시내용의 맥락에서, 대상 DNA 표적화 RNA 분자의 단백질-결합 분절(dsRNA 이중체)의 구아닌(G)은 우라실(U)에 상보적인 것으로 간주되며, 그 반대도 마찬가지이다. 이와 같이, G/U 염기쌍이 소정의 뉴클레오타이드 위치에서 대상 DNA 표적화 RNA 분자의 단백질-결합 분절(dsRNA 이중체)로 만들어질 수 있는 경우, 해당 위치는 비상보적인 것으로 간주되지 않고, 대신 상보적인 것으로 간주된다.
"펩타이드", "폴리펩타이드" 및 "단백질"은 본원에서 상호교환적으로 사용되며, 코딩된 및 비코딩된 아미노산, 화학적으로 또는 생화학적으로 변형된 또는 유도체화된 아미노산, 및 변형된 펩타이드 백본을 갖는 폴리펩타이드를 포함할 수 있는 임의의 길이의 아미노산의 중합체 형태를 나타낸다.
특정 PAH 단백질을 "인코딩하는" DNA 서열은 특정 RNA 및/또는 단백질로 전사되는 DNA 핵산 서열이다. DNA 폴리뉴클레오타이드는 단백질로 번역되는 RNA(mRNA)를 인코딩할 수 있거나, DNA 폴리뉴클레오타이드는 단백질로 번역되지 않는 RNA(예를 들어, tRNA, rRNA 또는 DNA 표적화 RNA; "비코딩" RNA 또는 "ncRNA"로도 불림)를 인코딩할 수 있다.
본원에 사용된 "융합 단백질"이라는 용어는, 적어도 2개의 상이한 단백질로부터의 단백질 도메인을 포함하는 폴리펩타이드를 나타낸다. 예를 들어, 융합 단백질은 (i) PAH 또는 이의 단편과, (ii) 적어도 하나의 비(non)GOI 단백질을 포함할 수 있다. 본원에 포함되는 융합 단백질에는, 비제한적으로, 항체, 또는 PAH 단백질에 융합된 항체의 Fc 또는 항원 결합 단편, 예를 들어 수용체, 리간드, 효소 또는 펩타이드의 세포외 도메인이 포함된다. 융합 단백질의 일부인 PAH 단백질 또는 이의 단편은 단일특이적 항체, 또는 이중특이적 또는 다중특이적 항체일 수 있다.
본원에 사용된 "게놈 세이프 하버(safe harbor) 유전자" 또는 "세이프 하버 유전자"라는 용어는, 암의 촉진 또는 내인성 유전자 활성에 대한 유의한 부정적인 결과 없이, 서열이 예측 가능한 방식으로 통합 및 기능할 수 있도록(예를 들어, 관심 단백질을 발현시킴) 핵산 서열이 삽입될 수 있는 유전자 또는 유전좌위를 나타낸다. 일부 구현예에서, 세이프 하버 유전자는 또한 삽입된 핵산 서열이 비(non)세이프 하버 부위보다 더 높은 수준으로 효율적으로 발현될 수 있는 유전좌위 또는 유전자이다.
본원에 사용된 "유전자 전달"이라는 용어는, 유전자 치료의 적용을 위해 외래 DNA가 숙주세포에 전달되는 과정을 의미한다.
본원에 사용된 "말단반복서열" 또는 "TR"이라는 용어는, 적어도 하나의 최소 필수 복제 기점과 회문 헤어핀 구조를 포함하는 영역을 포함하는, 임의의 바이러스 말단반복 또는 합성 서열을 포함한다. Rep-결합 서열("RBS")(RBE(Rep-결합 요소)로도 지칭됨)과 말단 분해 부위("TRS")는 함께 "최소 필수 복제 기점"을 구성하기 때문에, TR은 적어도 하나의 RBS와 적어도 하나의 TRS를 포함한다. 폴리뉴클레오타이드 서열의 소정의 스트레치 내에서 서로 역 보체인 TR은, 전형적으로 "역말단반복" 또는 "ITR"로 지칭된다. 바이러스의 맥락에서, ITR은 복제, 바이러스 패키징, 통합 및 프로바이러스 회수를 매개한다. 본원의 개시내용에서 예상치 못하게 발견된 바와 같이, 전체 길이에 걸쳐 역 보체가 아닌 TR은 여전히 야생형 ITR의 전형적인 기능을 수행할 수 있기 때문에, 본원에 사용된 ITR이라는 용어는 ceDNA 벡터의 복제를 매개할 수 있는 ceDNA 게놈 또는 ceDNA 벡터 내 TR을 나타낸다. 당업자는, 복잡한 ceDNA 벡터 구성에서, 2개 초과의 ITR 또는 비대칭 ITR 쌍이 존재할 수 있다는 것을 이해할 것이다. ITR은 AAV ITR 또는 비(non)AAV ITR일 수 있거나, AAV ITR 또는 비AAV ITR에서 유도될 수 있다. 예를 들어, ITR은 파르보바이러스 및 데펜도바이러스(예를 들어, 개 파르보바이러스, 소 파르보바이러스, 마우스 파르보바이러스, 돼지 파르보바이러스, 인간 파르보바이러스 B-19)를 포함하는 파르보바이러스과에서 유도될 수 있거나, 또는 SV40 복제 기점으로 작용하는 SV40 헤어핀(이는 절단, 치환, 결실, 삽입 및/또는 부가에 의해 추가로 변형될 수 있음)이 ITR로서 사용될 수 있다. 파르보바이러스과 바이러스는 척추동물을 감염시키는 파르보바이러스아과(Parvovirinae)와 무척추동물을 감염시키는 덴소바이러스아과(Densovirinae)의 2개의 아과로 이루어진다. 데펜도파르보바이러스에는, 비제한적으로, 인간, 영장류, 소, 개, 말 및 양 종을 포함하는 척추동물 숙주에서 복제 가능한 아데노연관바이러스(AAV)의 바이러스과가 포함된다. 본원에서 편의를 위해, ceDNA 벡터 내 발현 카세트(의 업스트림) 5'에 위치한 ITR은 "5' ITR" 또는 "좌측 ITR"로 지칭되고, ceDNA 벡터 내 발현 카세트(의 다운스트림) 3'에 위치한 ITR은 "3' ITR" 또는 "우측 ITR"로 지칭된다.
"야생형 ITR" 또는 "WT-ITR"은, 예를 들어 Rep 결합 활성 및 Rep 닉킹 능력을 보유하는, AAV 또는 다른 데펜도바이러스 내 자연 발생 ITR 서열의 서열을 나타낸다. 임의의 AAV 혈청형의 WT-ITR의 뉴클레오타이드 서열은 유전자 코드 또는 드리프트의 축퇴로 인해 기본형 자연 발생 서열에서 약간 달라질 수 있기 때문에, 본원에의 사용을 위해 포함된 WT-ITR 서열은 생산 과정 동안 일어나는 자연적으로 발생하는 변화(예를 들어, 복제 오류)의 결과로서의 WT-ITR 서열을 포함한다.
본원에 사용된 "실질적으로 대칭인 WT-ITR" 또는 "실질적으로 대칭인 WT-ITR 쌍"이라는 용어는, 둘 모두 이의 전체 길이에 걸쳐 역 보체 서열을 갖는 야생형 ITR인, 단일 ceDNA 게놈 또는 ceDNA 벡터 내 WT-ITR의 쌍을 나타낸다. 예를 들어, ITR은, 기본형 자연 발생 서열에서 벗어난 하나 이상의 뉴클레오타이드를 갖더라도, 변화가 서열의 특성 및 전체 3차원 구조에 영향을 미치지 않는 한, 야생형 서열인 것으로 간주될 수 있다. 일부 양태에서, 벗어난 뉴클레오타이드는 보존적 서열 변화를 나타낸다. 하나의 비제한적인 예로서, 기본형 서열과 적어도 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖고(기본 설정으로 예를 들어, BLAST를 사용하여 측정 시), 또한 기하학적 공간에서의 3D 구조가 동일한 형상이 되도록 다른 WT-ITR에 대칭인 3차원 공간 구성을 갖는 서열. 실질적으로 대칭인 WT-ITR은 3D 공간에 동일한 A, C-C' 및 B-B' 루프를 갖는다. 실질적으로 대칭인 WT-ITR은, 이것이 적절한 Rep 단백질과 쌍을 이루는 작동 가능한 Rep 결합 부위(RBE 또는 RBE')와 말단 분해 부위(TRS)를 가지고 있음을 결정하는 방식으로 WT로서 기능적으로 확인될 수 있다. 선택적으로, 허용 조건 하에서의 전이유전자 발현을 포함하는 다른 기능을 시험할 수 있다.
본원에 사용된 "변형된 ITR" 또는 "mod-ITR" 또는 "돌연변이 ITR"이라는 구절은 본원에서 상호교환적으로 사용되며, 동일한 혈청형의 WT-ITR과 비교하여 적어도 하나 또는 그 이상의 뉴클레오타이드에 돌연변이를 갖는 ITR을 나타낸다. 돌연변이는 ITR 내 A 영역, C 영역, C' 영역, B 영역, B' 영역 중 하나 이상을 변경시킬 수 있으며, 동일한 혈청형의 WT-ITR의 3D 공간 구성과 비교하여 3차원 공간 구성(즉, 기하학적 공간에서의 3D 구조)을 변경시킬 수 있다.
본원에 사용된 "비대칭인 ITR"이라는 용어(이는 "비대칭인 ITR 쌍"으로도 지칭됨)는, 전체 길이에 걸쳐 역 보체가 아닌 단일 ceDNA 게놈 또는 ceDNA 벡터 내 ITR의 쌍을 나타낸다. 하나의 비제한적인 예로서, 비대칭인 ITR 쌍은 3D 구조가 기하학적 공간에서 상이한 형상이 되도록 이의 동족 ITR과 대칭인 3차원 공간 구성을 갖지 않는다. 달리 말하면, 비대칭인 ITR 쌍은 전체적인 기하 구조가 상이하며, 즉, 이들은 3D 공간에서 A, C-C' 및 B-B' 루프의 구성이 상이하다(예를 들어, 하나의 ITR은 동족 ITR과 비교하여 짧은 C-C' 아암 및/또는 짧은 B-B' 아암을 가질 수 있음). 2개의 ITR 사이의 서열 차이는 뉴클레오타이드 부가, 결실, 절단 또는 점 돌연변이 중 하나 이상으로 인한 것일 수 있다. 하나의 구현예에서, 비대칭인 ITR 쌍 중 하나의 ITR은 야생형 AAV ITR 서열일 수 있고, 다른 하나의 ITR은 본원에 정의된 바와 같이 변형된 ITR(예를 들어, 비야생형 또는 합성 ITR 서열)일 수 있다. 또 다른 구현예에서, 비대칭인 ITR 쌍 중 어느 ITR도 야생형 AAV 서열이 아니며, 2개의 ITR은 기하학적 공간에서 상이한 형상을 갖는(즉, 전체 기하 구조가 상이한) 변형된 ITR이다. 일부 구현예에서, 비대칭인 ITR 쌍 중 하나의 mod-ITR은 짧은 C-C' 아암을 가질 수 있고, 다른 하나의 ITR은 동족 비대칭인 mod-ITR과 비교하여 상이한 3차원 공간 구성을 갖도록 상이한 변형(예를 들어, 단일 또는 짧은 B-B' 아암 등)을 가질 수 있다.
본원에 사용된 "대칭인 ITR"이라는 용어는, 야생형 또는 돌연변이된(예를 들어, 야생형에 비해 변형된) 데펜도바이러스 ITR 서열이고 전체 길이에 걸쳐 역 보체인, 단일 ceDNA 게놈 또는 ceDNA 벡터 내 ITR의 쌍을 나타낸다. 하나의 비제한적인 예에서, 두 개의 ITR은 모두 AAV2 유래의 야생형 ITR 서열이다. 또 다른 예에서, ITR 중 어느 것도 야생형 ITR AAV2 서열이 아니며(즉, 이는 변형된 ITR이며, 돌연변이 ITR로도 지칭됨), 뉴클레오타이드 부가, 결실, 치환, 절단 또는 점 돌연변이로 인해 야생형 ITR의 서열과 차이가 있을 수 있다. 본원에서 편의를 위해, ceDNA 벡터 내 발현 카세트(의 업스트림) 5'에 위치한 ITR은 "5' ITR" 또는 "좌측 ITR"로 지칭되고, ceDNA 벡터 내 발현 카세트(의 다운스트림) 3'에 위치한 ITR은 "3' ITR" 또는 "우측 ITR"로 지칭된다.
본원에 사용된 "실질적으로 대칭인 변형된 ITR" 또는 "실질적으로 대칭인 mod-ITR 쌍"이라는 용어는, 둘 모두 이의 전체 길이에 걸쳐 역 보체 서열을 갖는 단일 ceDNA 게놈 또는 ceDNA 벡터 내 변형된 ITR의 쌍을 나타낸다. 예를 들어, 변형된 ITR은, 역 보체 서열에서 벗어난 일부 뉴클레오타이드 서열을 갖더라도, 변화가 특성 및 전체 형상에 영향을 미치지 않는 한, 실질적으로 대칭인 것으로 간주될 수 있다. 하나의 비제한적인 예로서, 기본형 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖고(기본 설정으로 BLAST를 사용하여 측정 시), 또한 기하학적 공간에서의 3D 구조가 동일한 형상이 되도록 동족 변형된 ITR에 대칭인 3차원 공간 구성을 갖는 서열. 달리 말하면, 실질적으로 대칭인 변형된 ITR 쌍은 3D 공간에 구성된 동일한 A, C-C' 및 B-B' 루프를 갖는다. 일부 구현예에서, mod-ITR 쌍으로부터의 ITR은 상이한 역 보체 뉴클레오타이드 서열을 갖지만, 여전히 동일한 대칭인 3차원 공간 구성을 가질 수 있으며, 즉, 두 개의 ITR은 동일한 전체 3D 형상을 생성하는 돌연변이를 갖는다. 예를 들어, mod-ITR 쌍에서 하나의 ITR(예를 들어, 5' ITR)은 하나의 혈청형에서 유래할 수 있고, 다른 하나의 ITR(예를 들어, 3' ITR)은 상이한 혈청형에서 유래할 수 있지만, 두 가지 모두 동일한 상응하는 돌연변이를 가질 수 있으므로(예를 들어, 5' ITR이 C 영역에 결실을 갖는 경우, 상이한 혈청형으로부터의 동족의 변형된 3' ITR은 C' 영역의 상응하는 위치에 결실을 가짐), 변형된 ITR 쌍은 동일한 대칭인 3차원 공간 구성을 갖는다. 이러한 구현예에서, 변형된 ITR 쌍의 각각의 ITR은 상이한 혈청형(예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12), 예컨대 AAV2와 AAV6의 조합에서 유래할 수 있으며, 여기서 하나의 ITR에서의 변형은 상이한 혈청형의 동족 ITR 내 상응하는 위치에 반영된다. 하나의 구현예에서, 실질적으로 대칭인 변형된 ITR 쌍은, ITR 사이의 뉴클레오타이드 서열 차이가 특성 또는 전체 형상에 영향을 미치지 않고 이들이 3D 공간에서 실질적으로 동일한 형상을 갖는 한, 변형된 ITR(mod-ITR)의 쌍을 나타낸다. 비제한적인 예로서, mod-ITR은 BLAST(Basic Local Alignment Search Tool) 또는 기본 설정의 BLASTN과 같은 당업계에 널리 알려진 표준 수단에 의해 측정 시 기본형 mod-ITR과 적어도 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖고, 또한 기하학적 공간에서의 3D 구조가 동일한 형상이 되도록 대칭인 3차원 공간 구성을 갖는다. 실질적으로 대칭인 mod-ITR 쌍은 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 가지며, 예를 들어 실질적으로 대칭인 mod-ITR 쌍에서 변형된 ITR이 C-C' 아암의 결실을 갖는 경우, 동족 mod-ITR은 C-C' 루프의 상응하는 결실을 갖고, 또한 이의 동족 mod-ITR의 기하학적 공간에서 동일한 형상으로 나머지 A 및 B-B' 루프의 유사한 3D 구조를 갖는다.
"플랭킹"이라는 용어는, 또 다른 핵산 서열에 대한 하나의 핵산 서열의 상대적인 위치를 나타낸다. 일반적으로, 서열 ABC에서, B에는 A와 C가 플랭킹되어 있다. 이는 배열 AxBxC에 대해서도 동일하게 적용된다. 따라서, 플랭킹 서열은 플랭킹된 서열의 앞에 있거나 뒤에 있지만, 플랭킹된 서열에 인접하거나 바로 근접할 필요는 없다. 하나의 구현예에서, 플랭킹이라는 용어는, 선형 이중체 ceDNA 벡터의 각 말단에 있는 말단반복을 나타낸다.
본원에 사용된 "치료하다", "치료하는" 및/또는 "치료"라는 용어는, 병태의 진행을 중단시키거나, 실질적으로 저해하거나, 느리게 하거나 또는 역전시키는 것; 병태의 임상 증상을 실질적으로 개선하는 것; 또는 병태의 임상 증상의 출현을 실질적으로 예방하는 것을 통해 유익하거나 목적하는 임상 결과를 수득하는 것을 포함한다. 일부 구현예에 따르면, 병태는 PKU이다. 치료는 나아가 다음 중 하나 이상을 달성하는 것을 나타낸다: (a) 장애의 중증도를 감소시키는 것; (b) 치료하고자 하는 장애(들)의 특징적인 증상의 발달을 제한하는 것; (c) 치료하고자 하는 장애(들)의 특징적인 증상의 악화를 제한하는 것; (d) 이전에 장애(들)를 앓았던 환자에서 장애(들)의 재발을 제한하는 것; 및 (e) 장애(들)에 대해 이전에 증상이 없었던 환자에서 증상의 재발을 제한하는 것. 약리학적 및/또는 생리학적 효과와 같은 유익하거나 목적하는 임상 결과에는, 비제한적으로, 질환, 장애 또는 병태에 걸리기 쉬울 수 있지만, 질환의 증상을 아직 경험하지 않았거나 나타내지 않은 대상에서 질환, 장애 또는 병태의 발생을 예방하는 것(예방적 치료), 질환, 장애 또는 병태의 증상 경감, 질환, 장애 또는 병태의 정도 감소, 질환, 장애 또는 병태의 안정화(즉, 악화시키지 않음), 질환, 장애 또는 병태의 확산 예방, 질환, 장애 또는 병태 진행의 지연 또는 늦추기, 질환, 장애 또는 병태의 개선 또는 완화, 및 이들의 조합뿐 아니라, 치료를 받지 않은 경우 예상되는 생존기간에 비해 생존기간을 연장시키는 것.
본원에 사용된 "증가시키다", "증강시키다", "상승시키다"(및 유사 용어)라는 용어는, 일반적으로, 본래 값, 예측 값 또는 평균 값에 비해, 또는 대조군 조건에 비해, 농도, 수준, 기능, 활성 또는 거동을, 직접적으로 또는 간접적으로, 증가시키는 작용을 나타낸다.
본원에 사용된 "최소화시키다", "저하시키다", "감소시키다" 및/또는 "저해하다"(및 유사 용어)라는 용어는, 일반적으로, 본래 값, 예측 값 또는 평균 값에 비해, 또는 대조군 조건에 비해, 농도, 수준, 기능, 활성 또는 거동을, 직접적으로 또는 간접적으로, 감소시키는 작용을 나타낸다.
본원에 사용된 "ceDNA 게놈"이라는 용어는, 적어도 하나의 역말단반복 영역을 추가로 포함하는 발현 카세트를 나타낸다. ceDNA 게놈은 하나 이상의 스페이서 영역을 추가로 포함할 수 있다. 일부 구현예에서, ceDNA 게놈은 DNA의 분자간 이중체 폴리뉴클레오타이드로서 플라스미드 또는 바이러스 게놈에 혼입된다.
본원에 사용된 "ceDNA 스페이서 영역"이라는 용어는, ceDNA 벡터 또는 ceDNA 게놈에서 기능성 요소를 분리하는 개재 서열을 나타낸다. 일부 구현예에서, ceDNA 스페이서 영역은 최적의 기능을 위해 2개의 기능성 요소를 목적하는 거리로 유지시킨다. 일부 구현예에서, ceDNA 스페이서 영역은, 예를 들어 플라스미드 또는 바큘로바이러스 내에 ceDNA 게놈의 유전적 안정성을 제공하거나 부가한다. 일부 구현예에서, ceDNA 스페이서 영역은, 클로닝 부위 등에 대한 편리한 위치를 제공하는 방식으로, ceDNA 게놈의 준비된 유전자 조작을 용이하게 한다. 예를 들어, 특정 양태에서, 몇몇 제한 엔도뉴클레아제 부위를 함유하는 올리고뉴클레오타이드 "폴리링커", 또는 알려진 단백질(예를 들어, 전사인자) 결합 부위를 갖지 않도록 설계된 비(non)오픈리딩프레임 서열은, 시스-작용 인자를 분리하기 위해, 예를 들어 말단 분해 부위와 업스트림 전사 조절 요소 사이에 2량체, 3량체, 5량체, 6량체, 10량체, 11량체, 12량체, 18량체, 24량체, 30량체, 48량체, 86량체, 176량체 등을 삽입하는 방식으로, ceDNA 게놈에 배치될 수 있다. 유사하게, 스페이서는 폴리아데닐화 신호 서열과 3'-말단 분해 부위 사이에 혼입될 수 있다.
본원에 사용된 "Rep 결합 부위", "Rep 결합 요소", "RBE" 및 "RBS"라는 용어는 상호교환적으로 사용되며, Rep 단백질에 의해 결합될 때, Rep 단백질이 RBS를 포함하는 서열에서 이의 부위 특이적 엔도뉴클레아제 활성을 수행할 수 있게 하는 Rep 단백질(예를 들어, AAV Rep 78 또는 AAV Rep 68)에 대한 결합 부위를 나타낸다. RBS 서열과 이의 역 보체는 함께 단일 RBS를 형성한다. RBS 서열은 당업계에 알려져 있으며, 예를 들어 AAV2에서 식별된 RBS 서열인 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60)를 포함한다. 다른 알려진 AAV RBS 서열, 및 다른 자연적으로 알려진 또는 합성 RBS 서열을 포함하는, 임의의 알려진 RBS 서열이 본 개시내용의 구현예에서 사용될 수 있다. 이론에 구애됨 없이, Rep 단백질의 뉴클레아제 도메인은 이중체 뉴클레오타이드 서열 GCTC에 결합하기 때문에, 2개의 알려진 AAV Rep 단백질이 이중체 올리고뉴클레오타이드인 5'-(GCGC)(GCTC)(GCTC)(GCTC)-3'(서열번호 60) 상에 직접 결합하여 안정적으로 어셈블링된다고 여겨진다. 또한, 가용성 응집된 이형태체(conformer)(즉, 정의되지 않은 수의 상호연관된 Rep 단백질)는 해리되어, Rep 결합 부위를 함유하는 올리고뉴클레오타이드에 결합한다. 각각의 Rep 단백질은 각 가닥에서 질소성 염기 및 포스포디에스테르 백본과 상호작용한다. 질소성 염기와의 상호작용은 서열 특이성을 제공하지만, 포스포디에스테르 백본과의 상호작용은 비(non)서열 특이적 또는 덜 서열 특이적이며, 단백질-DNA 복합체를 안정화시킨다.
본원에 사용된 "말단 분해 부위" 및 "TRS"는 본원에서 상호교환적으로 사용되며, Rep가 5' 티미딘과 티로신-포스포디에스테르 결합을 형성하여, 세포 DNA 폴리머라아제, 예를 들어 DNA pol 델타 또는 DNA pol 엡실론을 통해 DNA 연장을 위한 기질로서 작용하는 3' OH를 생성하는 영역을 나타낸다. 대안적으로, Rep-티미딘 복합체는 조정된 결찰 반응에 참여할 수 있다. 일부 구현예에서, TRS는 염기쌍을 이루지 않은 티미딘을 최소한으로 포함한다. 일부 구현예에서, TRS의 닉킹 효율은 RBS로부터의 동일한 분자 내 거리에 의해 적어도 부분적으로 제어될 수 있다. 수용체 기질이 상보적 ITR인 경우, 생성되는 산물은 분자내 이중체이다. TRS 서열은 당업계에 알려져 있으며, 예를 들어 AAV2로 식별된 헥사뉴클레오타이드 서열인 5'-GGTTGA-3'(서열번호 61)을 포함한다. 다른 알려진 AAV TRS 서열 및 다른 자연적으로 알려진 또는 합성 TRS 서열, 예컨대 AGTT(서열번호 62), GGTTGG(서열번호 63), AGTTGG(서열번호 64), AGTTGA(서열번호 65), 및 RRTTRR(서열번호 66)과 같은 다른 모티프를 포함하는, 임의의 알려진 TRS 서열이 본 개시내용의 구현예에서 사용될 수 있다.
본원에 사용된 "ceDNA-플라스미드"라는 용어는, 분자간 이중체로서 ceDNA 게놈을 포함하는 플라스미드를 나타내다.
본원에 사용된 "ceDNA-박미드"라는 용어는, 플라스미드로서 대장균에서 증식할 수 있고, 따라서 바큘로바이러스에 대한 셔틀 벡터로서 작용할 수 있는 분자간 이중체로서 ceDNA 게놈을 포함하는 감염성 바큘로바이러스 게놈을 나타낸다.
본원에 사용된 "ceDNA-바큘로바이러스"라는 용어는, 바큘로바이러스 게놈 내에 분자간 이중체로서 ceDNA 게놈을 포함하는 바큘로바이러스를 나타낸다.
본원에 사용된 "ceDNA-바큘로바이러스 감염된 곤충 세포" 및 "ceDNA-BIIC"라는 용어는 상호교환적으로 사용되며, ceDNA-바큘로바이러스로 감염된 무척추동물 숙주세포(비제한적으로, 곤충 세포(예를 들어, Sf9 세포) 포함)를 나타낸다.
본원에 사용된 "ceDNA"라는 용어는, 합성 또는 그 이외의 다른 비바이러스성 유전자 전달을 위한 캡시드 미함유 폐쇄형 선형 이중가닥(ds) 이중체 DNA를 나타낸다. ceDNA에 대한 상세한 설명은, 2017년 3월 3일자 출원된 국제 특허 출원 PCT/US2017/020828에 기재되어 있으며, 상기 문헌의 전체 내용은 명백하게 본원에 참조로 인용된다. 세포 기반 방법을 사용하여 다양한 역말단반복(ITR) 서열 및 구성을 포함하는 ceDNA의 생산을 위한 특정 방법은, 2018년 9월 7일자 출원된 국제 특허 출원 PCT/US18/49996 및 2018년 12월 6일자 출원된 PCT/US2018/064242의 실시예 1에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로 인용된다. 다양한 ITR 서열 및 구성을 포함하는 합성 ceDNA 벡터의 생산을 위한 특정 방법은, 예를 들어 2019년 1월 18일자 출원된 국제 특허 출원 PCT/US2019/14122에 기재되어 있으며, 상기 문헌의 전체 내용은 본원에 참조로 인용된다.
본원에 사용된 "폐쇄형 DNA 벡터"라는 용어는, 적어도 하나의 공유결합으로 폐쇄된 말단을 갖고 벡터의 적어도 일부가 분자내 이중체 구조를 갖는 캡시드 미함유 DNA 벡터를 나타낸다.
본원에 사용된 "ceDNA 벡터" 및 "ceDNA"라는 용어는 상호교환적으로 사용되며, 적어도 하나의 말단 회문구조를 포함하는 폐쇄형 DNA 벡터를 나타낸다. 일부 구현예에서, ceDNA는 2개의 공유결합으로 폐쇄된 말단을 포함한다.
본원에 사용된 "neDNA" 또는 "닉킹된(nicked) ceDNA"라는 용어는, 오픈리딩프레임(예를 들어, 발현시키고자 하는 프로모터와 전이유전자)의 스템 영역 또는 스페이서 영역 5' 업스트림에 1개 내지 100개 염기쌍의 닉 또는 갭을 갖는 폐쇄형 DNA를 나타낸다.
본원에 사용된 "갭(gap)" 및 "닉(nick)"이라는 용어는 상호교환적으로 사용되며, 본 개시내용의 합성 DNA 벡터의 중단된 부분으로, 다르게는 이중가닥 ceDNA에서 단일가닥 DNA 부분의 스트레치를 형성하는 중단된 부분을 나타낸다. 갭은 이중체 DNA의 하나의 가닥에서 1개 염기쌍 내지 100개 염기쌍 길이일 수 있다. 본원에 기재된 방법에 의해 설계되고 형성된 전형적인 갭, 및 이러한 방법에 의해 생성된 합성 벡터는, 예를 들어 길이가 1 bp, 2 bp, 3 bp, 4 bp, 5 bp, 6 bp, 7 bp, 8 bp, 9 bp, 10 bp, 11 bp, 12 bp, 13 bp, 14 bp, 15 bp, 16 bp, 17 bp, 18 bp, 19 bp, 20 bp, 21 bp, 22 bp, 23 bp, 24 bp, 25 bp, 26 bp, 27 bp, 28 bp, 29 bp, 30 bp, 31 bp, 32 bp, 33 bp, 34 bp, 35 bp, 36 bp, 37 bp, 38 bp, 39 bp, 40 bp, 41 bp, 42 bp, 43 bp, 44 bp, 45 bp, 46 bp, 47 bp, 48 bp, 49 bp, 50 bp, 51 bp, 52 bp, 53 bp, 54 bp, 55 bp, 56 bp, 57 bp, 58 bp, 59 bp 또는 60 bp일 수 있다. 본 개시내용에 예시된 갭은 길이가 1 bp 내지 10 bp, 1 bp 내지 20 bp, 1 bp 내지 30 bp일 수 있다.
본원에 정의된 "리포터"란, 검출 가능한 판독물을 제공하는 데 사용될 수 있는 단백질을 나타낸다. 리포터는 일반적으로 형광, 색상 또는 발광과 같은 측정 가능한 신호를 생성한다. 리포터 단백질 코딩 서열은 세포 또는 유기체에서의 존재가 용이하게 관찰되는 단백질을 인코딩한다. 예를 들어, 형광 단백질은 특정 파장의 빛으로 여기될 때 세포가 형광을 나타내게 하고, 루시퍼라아제는 세포가 빛을 생성하는 반응을 촉진시키게 하며, β-갈락토시다아제와 같은 효소는 기질을 착색된 산물로 전환시킨다. 실험 또는 진단 목적에 유용한 예시적인 리포터 폴리펩타이드에는, 비제한적으로 β-락타마아제, β -갈락토시다아제(LacZ), 알칼리성 포스파타아제(AP), 티미딘 키나아제(TK), 녹색 형광 단백질(GFP) 및 다른 형광 단백질, 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제, 및 당업계에 널리 알려진 다른 것들이 포함된다.
본원에 사용된 "센스" 및 "안티센스"라는 용어는, 폴리뉴클레오타이드에서의 구조 요소의 배향을 나타낸다. 요소의 센스 및 안티센스 버전은 서로 역 보체이다.
본원에 사용된 "합성 AAV 벡터" 및 "AAV 벡터의 합성 생산"이라는 용어는, 완전한 무세포 환경에서의 AAV 벡터 및 이의 합성 생산 방법을 나타낸다.
본원에 사용된 "리포터"란, 검출 가능한 판독물을 제공하는 데 사용될 수 있는 단백질을 나타낸다. 리포터는 일반적으로 형광, 색상 또는 발광과 같은 측정 가능한 신호를 생성한다. 리포터 단백질 코딩 서열은 세포 또는 유기체에서의 존재가 용이하게 관찰되는 단백질을 인코딩한다. 예를 들어, 형광 단백질은 특정 파장의 빛으로 여기될 때 세포가 형광을 나타내게 하고, 루시퍼라아제는 세포가 빛을 생성하는 반응을 촉진시키게 하며, β-갈락토시다아제와 같은 효소는 기질을 착색된 산물로 전환시킨다. 실험 또는 진단 목적에 유용한 예시적인 리포터 폴리펩타이드에는, 비제한적으로 β-락타마아제, β -갈락토시다아제(LacZ), 알칼리성 포스파타아제(AP), 티미딘 키나아제(TK), 녹색 형광 단백질(GFP) 및 다른 형광 단백질, 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제, 및 당업계에 널리 알려진 다른 것들이 포함된다.
본원에 사용된 "이펙터(effector) 단백질"이라는 용어는, 예를 들어 리포터 폴리펩타이드, 또는 보다 적절하게는, 세포를 사멸시키는 폴리펩타이드, 예를 들어 독소, 또는 세포가 선택된 작용제 또는 이의 결여로 인해 사멸하기 쉽게 만드는 작용제로서 검출 가능한 판독물을 제공하는 폴리펩타이드를 나타낸다. 이펙터 단백질에는, 숙주세포의 DNA 및/또는 RNA를 직접 표적으로 하거나 이를 손상시키는 임의의 단백질 또는 펩타이드가 포함된다. 예를 들어, 이펙터 단백질은, 비제한적으로, 숙주세포 DNA 서열(게놈 요소인지 또는 염색체외 요소인지에 관계없이)을 표적으로 하는 제한 엔도뉴클레아제, 세포 생존에 필요한 폴리펩타이드 표적을 분해하는 프로테아제, DNA 자이라아제(gyrase) 저해제 및 리보뉴클레아제 유형 독소를 포함할 수 있다. 일부 구현예에서, 본원에 기재된 바와 같은 합성 생물학적 회로에 의해 제어되는 이펙터 단백질의 발현은, 또 다른 합성 생물학적 회로에 인자로 참여하여, 생물학적 회로 시스템의 반응성의 범위 및 복잡성을 확장시킬 수 있다.
전사 조절인자는 PAH와 같은 관심 유전자의 전사를 활성화시키거나 억제하는 전사 활성화제 및 억제인자를 나타낸다. 프로모터는 특정 유전자의 전사를 개시하는 핵산의 영역이다. 전사 활성화제는 전형적으로 전사 프로모터 근처에 결합하고 RNA 폴리머라아제를 동원하여, 직접 전사를 개시한다. 억제제는 전사 프로모터에 결합하여, RNA 폴리머라아제에 의한 전사 개시를 입체적으로 방해한다. 다른 전사 조절인자는 이들의 결합하는 위치, 및 세포 및 환경 조건에 따라 활성화제 또는 억제제로 작용할 수 있다. 전사 조절인자 부류의 비제한적인 예에는, 비제한적으로, 호메오도메인(homeodomain) 단백질, 아연-핑거 단백질, 날개있는 나선형(winged-helix)(포크헤드(forkhead)) 단백질 및 류신-지퍼 단백질이 포함된다.
본원에 사용된 "억제 단백질" 또는 "유도 단백질"은, 조절 서열 요소에 결합하여, 조절 서열 요소에 작동적으로 연결된 서열의 전사를, 각각, 억제 또는 활성화시키는 단백질이다. 본원에 기재된 바와 같은 바람직한 억제 및 유도 단백질은 적어도 하나의 입력물질 또는 환경 입력의 존재 또는 부재에 민감하다. 본원에 기재된 바와 같은 바람직한 단백질은, 예를 들어 분리 가능한 DNA-결합 및 입력물질-결합, 또는 반응성 요소 또는 도메인을 포함하는 형태의 모듈이다.
본원에 사용된 "담체"에는, 임의의 및 모든 용매, 분산 매질, 비히클, 코팅제, 희석제, 항균제 및 항진균제, 등장화제 및 흡수지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등이 포함된다. 약학적 활성 물질에 대한 이러한 매질 및 작용제의 사용은 당업계에 알려져 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. "약학적으로 허용 가능한"이라는 구절은, 숙주에게 투여될 때 독성, 알레르기 또는 유사한 유해 반응을 생성하지 않는 분자 엔티티 및 조성물을 나타낸다.
본원에 사용된 "입력물질 반응성 도메인"은, 연결된 DNA 결합 융합 도메인을 해당 조건 또는 입력의 존재에 대해 반응성으로 만드는 방식으로 조건 또는 입력물질에 결합하거나 다르게는 이에 반응하는 전사인자의 도메인이다. 하나의 구현예에서, 조건 또는 입력의 존재는 입력물질 반응성 도메인 또는 이와 융합되는 단백질에서 입체형태 변화를 유도하여, 전사인자의 전사 조절 활성을 변형시킨다.
"생체내"라는 용어는, 다세포 동물과 같은 유기체에서 또는 유기체 내에서 일어나는 검정 또는 과정을 나타낸다. 본원에 기재된 일부 양태에서, 방법 또는 용도는, 박테리아와 같은 단세포 유기체가 사용될 때, "생체내"에서 일어난다고 할 수 있다. "생체외"라는 용어는, 다세포 동물 또는 식물의 체외, 예를 들어 특히 외식편, 배양된 세포(1차 세포 및 세포주 포함), 형질전환된 세포주 및 추출된 조직 또는 세포(혈액 세포 포함)에 있는 온전한 막을 갖는 살아있는 세포를 사용하여 수행되는 방법 및 용도를 나타낸다. "시험관내"라는 용어는, 세포 추출물과 같은 온전한 막을 갖는 세포의 존재를 필요로 하지 않는 검정 및 방법을 나타내며, 세포를 포함하지 않는 배지와 같은 비(non)세포 시스템, 또는 세포 추출물과 같은 세포 시스템에 프로그래밍 가능한 합성 생물학적 회로를 도입하는 것을 나타낼 수 있다.
본원에 사용된 "프로모터"라는 용어는, 단백질 또는 RNA를 인코딩하는 표적 유전자, 예를 들어 이종 표적 유전자일 수 있는 핵산 서열의 전사를 유도하는 방식으로 또 다른 핵산 서열의 발현을 조절하는 임의의 핵산 서열을 나타낸다. 프로모터는 구성적, 유도성, 억제성, 조직 특이적 또는 이들의 임의의 조합일 수 있다. 프로모터는 핵산 서열의 나머지 부분의 전사 개시 및 속도가 제어되는 핵산 서열의 제어 영역이다. 프로모터는 또한 RNA 폴리머라아제 및 다른 전사인자와 같은, 조절 단백질 및 분자에 결합할 수 있는 유전 요소를 함유할 수 있다. 본원에 기재된 양태의 일부 구현예에서, 프로모터는 프로모터 자체의 발현을 조절하는 전사인자의 발현을 유도할 수 있다. 프로모터 서열 내에는 전사 개시 부위뿐 아니라, RNA 폴리머라아제의 결합을 담당하는 단백질 결합 도메인이 발견될 것이다. 진핵생물 프로모터는 종종, 항상은 아니지만, "TATA" 박스와 "CAT" 박스를 함유할 것이다. 유도성 프로모터를 비롯한 다양한 프로모터는, 본원에 개시된 ceDNA 벡터의 전이유전자의 발현을 유도하는 데 사용될 수 있다. 프로모터 서열은 이의 3' 말단에서 전사 개시 부위에 의해 결합될 수 있으며, 배경 위에서 검출 가능한 수준으로 전사를 개시하는 데 필요한 최소한의 염기 또는 요소의 수를 포함하도록 업스트림(5' 방향)으로 연장된다. 일부 구현예에 따르면, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(hAAT(979) 프로모터 및 CpGmin_hAAT 프로모터, 예컨대 hAAT_core_C06; hAAT_core_C07; hAAT_core_C08; hAAT_core_C09; hAAT_core_C10 또는 hAAT_core truncated 포함) 및 트랜스티레틴(TTR) 간 특이적 프로모터(최소 TTR(TTRm) 포함)로 이루어지는 군에서 선택된다.
본원에 사용된 "인핸서"라는 용어는, 핵산 서열의 전사 활성화를 증가시키기 위해 하나 이상의 단백질(예를 들어, 활성화 단백질 또는 전사인자)과 결합하는 시스-작용 조절 서열(예를 들어, 50개 내지 1,500개 염기쌍)을 나타낸다. 인핸서는 이들이 조절하는 유전자 시작 부위의 업스트림 또는 유전자 시작 부위의 다운스트림에 최대 1,000,000개 염기쌍으로 배치될 수 있다. 인핸서는 인트론 영역 내, 또는 관련없는 유전자의 엑손 영역에 배치될 수 있다. 일부 구현예에 따르면, 인핸서는 인간 기원, 또는 부시베이비(bushbaby) 또는 중국 나무 두더지(Chinese tree shrew)와 같은 다른 포유류 기원의 세르핀 인핸서(SerpEnh), TTR 인핸서(TTRe), 간 핵인자 1 결합 부위(HNF1), 간 핵인자 4 결합 부위(HNF4), 인간 아포지질단백질 E/C-I 간 특이적 인핸서(ApoE Enh), 프로알부민 유전자의 인핸서 영역(ProEnh), CpG 최소화된 ApoE 인핸서(예를 들어, 본원에 기재된 바와 같은 ApoE 인핸서 C03, ApoE 인핸서 C04, ApoE 인핸서 C09 또는 ApoE 인핸서 C10), HCR1 footprint123(Embedded HCR1 footprint123), 간 핵인자 인핸서 어레이(Embedded enhancer HNF array), 및 인간 아포지질단백질 E/C-I 간 특이적 인핸서의 유도체(예를 들어, ApoE Enh v2)로 이루어지는 군에서 선택된다. 일부 구현예에 따르면, 인핸서는 다수(예를 들어, 탠덤 반복)의 단일 인핸서 요소, 또는 3xHNF1-4_Pro-Albumin Enhancer(인핸서가 TTR 프로모터에 연결된 ceDNA1471에서와 같이) 또는 5xHNF1_Pro-Albumin Enhancer(인핸서가 TTR 프로모터에 연결된 ceDNA1473에서와 같이)와 같은 상이한 유형의 인핸서일 수 있다. 일부 구현예에 따르면, HNF1 및/또는 HNF4와 같은 다수의 인핸서는 2개 인핸서 요소마다 스페이서 영역, 예를 들어 1개 내지 20개 뉴클레오타이드, 또는 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 뉴클레오타이드를 함유할 수 있다.
프로모터는 이것이 조절하는 핵산 서열의 발현을 유도하거나 전사를 유도한다고 할 수 있다. "작동 가능하게 연결된", "작동적으로 배치된", "작동적으로 연결된", "제어 하에 있는" 및 "전사 제어 하에 있는"이라는 구절은, 프로모터가 해당 서열의 전사 개시 및/또는 발현을 제어하기 위해 조절하는 핵산 서열에 대해 정확한 기능적 위치 및/또는 배향으로 존재한다는 것을 나타낸다. 본원에 사용된 "역 프로모터"는, 코딩 가닥이 비코딩 가닥이 되고, 그 반대로도 되도록, 핵산 서열이 역 배향으로 존재하는 프로모터를 나타낸다. 역 프로모터 서열은 다양한 구현예에서 스위치의 상태를 조절하는 데 사용될 수 있다. 또한, 다양한 구현예에서, 프로모터는 인핸서와 함께 사용될 수 있다.
프로모터는 소정의 유전자 또는 서열의 코딩 분절 및/또는 엑손의 업스트림에 위치한 5' 비코딩 서열을 단리하여 얻을 수 있는 바와 같이 유전자 또는 서열과 자연적으로 연관된 것일 수 있다. 이러한 프로모터는 "내인성"으로 지칭될 수 있다. 유사하게, 일부 구현예에서, 인핸서는 해당 서열의 다운스트림 또는 업스트림에 위치한, 핵산 서열과 자연적으로 연관된 것일 수 있다.
일부 구현예에서, 코딩 핵산 분절은 "재조합 프로모터" 또는 "이종 프로모터"의 제어 하에 배치되며, 여기서 두 가지 프로모터는 모두 자연 환경에서 작동 가능하게 연결된 인코딩된 핵산 서열과 통상적으로 연관되지 않은 프로모터를 나타낸다. 재조합 또는 이종 인핸서는, 자연 환경에서 소정의 핵산 서열과 통상적으로 연관되지 않은 인핸서를 나타낸다. 이러한 프로모터 또는 인핸서는, 다른 유전자의 프로모터 또는 인핸서; 임의의 다른 원핵생물, 바이러스 또는 진핵생물 세포에서 단리된 프로모터 또는 인핸서; 및 "자연 발생"이 아닌, 즉, 상이한 전사조절 영역의 상이한 요소, 및/또는 당업계에 알려진 유전자 조작 방법을 통해 발현을 변경시키는 돌연변이를 포함하는 합성 프로모터 또는 인핸서를 포함할 수 있다. 프로모터와 인핸서의 핵산 서열을 합성적으로 생성하는 것에 더하여, 프로모터 서열은 본원에 개시된 합성 생물학적 회로 및 모듈과 관련하여, 재조합 클로닝 및/또는 핵산 증폭 기술(PCR 포함)을 사용하여 생성될 수 있다(예를 들어, 미국 특허 제4,683,202호, 미국 특허 제5,928,906호(이들은 각각 본원에 참조로서 인용됨) 참조). 나아가, 미토콘드리아, 엽록체 등과 같은 비(non)핵 세포소기관 내 서열의 전사 및/또는 발현을 지시하는 제어 서열이 또한 이용될 수 있다고 고려된다. 이러한 재조합 또는 이종 프로모터/인핸서의 비제한적인 예에는, TTR 프로모터를 갖는 세르핀 인핸서("Vandendriessche 프로모터"(VD) 또는 Vandendriesche(VD) 프로모터 세트로 지칭됨(예를 들어, 미국 특허 제10,149,914호(이는 본원에 참조로 인용됨) 참조)) 또는 TTR 프로모터를 갖는 3X 세르핀 인핸서("3X VD" 프로모터 세트로 지칭됨; 예를 들어, 미국 특허 출원 공개 US 2018/0071406A1(이는 본원에 참조로 인용됨) 참조)가 포함된다.
일부 구현예에서, 프로모터는 프로모터 세트일 수 있다. 본원에 사용된 "프로모터 세트"라는 용어는, 본원에 정의된 바와 같은 하나 이상의 프로모터(또는 프로모터 서열)와 본원에 정의된 바와 같은 하나 이상의 인핸서(또는 인핸서 서열)를 포함하는 시스템을 나타낸다. 본원에 사용된 "프로모터 세트"라는 용어는, 프로모터 및 인핸서 요소 또는 서열이 길이가 약 1개 내지 50개 뉴클레오타이드, 예를 들어 약 2개, 5개, 7개, 8개, 10개, 11개, 12개, 13개, 15개, 17개, 18개, 20개, 22개, 23개, 25개, 27개, 28개, 30개, 32개, 33개, 35개, 37개, 38개, 40개, 42개, 43개, 45개, 47개, 48개 또는 50개 뉴클레오타이드인 스페이서 영역 또는 서열에 의해 분리되어 있는 서열을 포함한다.
본원에서 교환가능하게 사용되는 "DNA 조절 서열", "제어 요소" 및 "조절 요소"라는 용어는, 비코딩 서열(예를 들어, DNA 표적화 RNA) 또는 코딩 서열(예를 들어, 부위 지정 변형 폴리펩타이드 또는 Cas9/Csn1 폴리펩타이드)을 제공하고/하거나 이의 전사를 조절하고/하거나, 인코딩된 폴리펩타이드의 전사를 조절하는, 프로모터, 인핸서, 폴리아데닐화 신호, 종결인자, 단백질 분해 신호 등과 같은 전사 및 번역 제어 서열을 나타낸다.
"작동 가능하게 연결된"이란, 기재된 바와 같은 구성요소가 의도된 방식으로 기능할 수 있도록 하는 관계에 있는 근접부위(juxtaposition)를 나타낸다. 예를 들어, 프로모터가 전사 또는 발현에 영향을 미치는 경우 프로모터는 코딩 서열에 작동 가능하게 연결되어 있다. "발현 카세트"는, ceDNA 벡터에서 전이유전자의 전사를 지시하는 데 충분한 프로모터 또는 다른 조절 서열에 작동 가능하게 연결된 DNA 서열, 예를 들어 이종 DNA 서열을 포함한다. 적합한 프로모터에는, 예를 들어 조직 특이적 프로모터가 포함된다. 프로모터는 또한 AAV 기원일 수 있다.
본원에 사용된 "대상"이라는 용어는, 본 개시내용에 따른 ceDNA 벡터로 치료(예방적 치료 포함)가 제공되는 인간 또는 동물을 나타낸다. 통상적으로, 동물은, 비제한적으로, 영장류, 설치류, 가축 또는 사냥감 동물과 같은 척추동물이다. 영장류에는, 비제한적으로, 침팬지, 시노몰구스 원숭이, 스파이더 원숭이 및 마카크(macaque), 예를 들어 레서스(Rhesus)가 포함된다. 설치류에는, 마우스, 래트, 마멋(woodchuck), 페럿(ferret), 토끼 및 햄스터가 포함된다. 가축 및 사냥감 동물에는, 비제한적으로, 소, 말, 돼지, 사슴, 들소, 버팔로, 고양이과 종류(예를 들어, 집고양이), 갯과 종류(예를 들어, 개, 여우, 늑대), 조류(예를 들어, 닭, 에뮤, 타조) 및 어류(송어, 메기 및 연어)가 포함된다. 본원에 기재된 양태의 특정 구현예에서, 대상은 포유류, 예를 들어 영장류 또는 인간이다. 대상은 남성 또는 여성일 수 있다. 또한, 대상은 유아 또는 어린이일 수 있다. 일부 구현예에서, 대상은 신생아 또는 태어나지 않은 대상, 예를 들어 자궁에 있는 대상일 수 있다. 바람직하게는, 대상은 포유류이다. 포유류는 인간, 비인간 영장류, 마우스, 래트, 개, 고양이, 말 또는 소일 수 있지만, 이러한 예에 제한되지 않는다. 인간 이외의 포유류는 질환 및 장애의 동물 모델을 나타내는 대상으로 유리하게 사용될 수 있다. 또한, 본원에 기재된 방법 및 조성물은 가축 및/또는 애완동물에 대해 사용될 수 있다. 인간 대상은 임의의 연령, 성별, 인종 또는 민족, 예를 들어 코카시안(백인), 아시아인, 아프리카인, 흑인, 아프리카계 미국인, 아프리카계 유럽인, 히스패닉계, 중동인 등일 수 있다. 일부 구현예에서, 대상은 임상 설정에서의 환자 또는 다른 대상일 수 있다. 일부 구현예에서, 대상은 이미 치료를 받고 있다. 일부 구현예에서, 대상은 배아, 태아, 신생아, 유아, 아동, 청소년 또는 성인이다. 일부 구현예에서, 대상은 인간 태아, 인간 신생아, 인간 유아, 인간 아동, 인간 청소년 또는 인간 성인이다. 일부 구현예에서, 대상은 동물 배아, 또는 비인간 배아 또는 비인간 영장류 배아이다. 일부 구현예에서, 대상은 인간 배아이다.
본원에 사용된 "숙주세포"라는 용어는, 본 개시내용의 핵산 작제물 또는 ceDNA 발현 벡터를 이용한 형질전환, 트랜스펙션, 형질도입 등에 민감한 임의의 세포 유형을 나타낸다. 비제한적인 예로서, 숙주세포는 단리된 1차 세포, 다능성줄기세포, CD34+ 세포), 유도된 다능성줄기세포, 또는 다수의 불멸화된 세포주 중 임의의 것(예를 들어, HepG2 세포)일 수 있다. 대안적으로, 숙주세포는 조직, 기관 또는 유기체의 제자리 또는 생체내 세포일 수 있다.
"외인성"라는 용어는, 천연 공급원 이외의 세포에 존재하는 물질을 나타낸다. 본원에 사용된 "외인성"이라는 용어는, 인간의 손이 관여하는 과정에 의해 세포 또는 유기체와 같은 생물학적 시스템에 도입된 핵산(예를 들어, 폴리펩타이드를 인코딩하는 핵산) 또는 폴리펩타이드로서, 통상적으로 발견되지 않으며 인간이 이러한 세포 또는 유기체에 도입하고자 하는 핵산 또는 폴리펩타이드를 나타낼 수 있다. 대안적으로, "외인성"은, 인간의 손이 관여하는 과정에 의해 세포 또는 유기체와 같은 생물학적 시스템에 도입된 핵산 또는 폴리펩타이드로서, 비교적 낮은 수준으로 발견되며, 인간이, 예를 들어 이소성(ectopic) 발현 또는 수준을 생성하도록 이러한 세포 또는 유기체 내 핵산 또는 폴리펩타이드의 양을 증가시키기 위해 도입하고자 하는 핵산 또는 폴리펩타이드를 나타낼 수 있다. 대조적으로, "내인성"이라는 용어는, 생물학적 시스템 또는 세포에 고유한 물질을 나타낸다.
"서열 동일성"이라는 용어는, 2개의 핵산 서열 사이의 관련성을 나타낸다. 본 개시내용의 목적을 위해, 2개의 데옥시리보뉴클레오타이드 서열 사이의 서열 동일성 정도는 EMBOSS 패키지(EMBOSS: The European Molecular Biology Open Software Suite, 상기 Rice 등의 문헌(2000) 참조)의 니들(Needle) 프로그램(바람직하게는 버전 3.0.0 이상)에서 구현된 바와 같이 니들만 브니쉬(Needleman-Wunsch) 알고리즘(상기 Needleman 및 Wunsch의 문헌(1970) 참조)을 사용하여 결정된다. 사용되는 선택적 매개변수는 갭 오픈 페널티 10, 갭 연장 페널티 0.5 및 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스이다. 니들 표지된 "최장 동일성"의 출력(-nobrief 옵션을 사용하여 수득됨)은 동일성%로 사용되며, 이는 다음과 같이 계산된다: (동일한 데옥시뉴클레오타이드 x 100)/(정렬 길이 - 정렬의 총 갭 수). 정렬의 길이는 바람직하게는 적어도 10개 뉴클레오타이드, 바람직하게는 적어도 25개 뉴클레오타이드, 더욱 바람직하게는 적어도 50개 뉴클레오타이드 및 가장 바람직하게는 적어도 100개 뉴클레오타이드이다.
본원에 사용된 "상동성" 또는 "상동"이라는 용어는, 최대 서열 동일성%를 달성하기 위해, 필요한 경우, 서열을 정렬하고 갭을 도입한 후, 표적 염색체 상의 상응하는 서열의 뉴클레오타이드 잔기와 동일한 뉴클레오타이드 잔기의 백분율로 정의된다. 뉴클레오타이드 서열 상동성%를 결정하기 위한 정렬은, 예를 들어 BLAST, BLAST-2, ALIGN, ClustalW2 또는 Megalign(DNASTAR) 소프트웨어와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여, 당업계의 기술 내에서 다양한 방법으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하여, 서열 정렬을 위한 적절한 매개변수를 결정할 수 있다. 일부 구현예에서, 예를 들어 상동성 아암의 핵산 서열(예를 들어, DNA 서열)은, 서열이 숙주세포의 상응하는 천연 또는 미편집된 핵산 서열(예를 들어, 게놈 서열)과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 이상 동일한 경우, "상동"인 것으로 간주된다.
본원에 사용된 "이종"이라는 용어는, 각각, 천연 핵산 또는 단백질에서 발견되지 않는 핵산 또는 폴리펩타이드 서열을 의미한다. 이종 핵산 서열은 (예를 들어, 유전자 조작에 의해) 자연 발생 핵산 서열(또는 이의 변이체)에 연결되어, 키메라 폴리펩타이드를 인코딩하는 키메라 핵산 서열을 생성할 수 있다. 이종 핵산 서열은 (예를 들어, 유전자 조작에 의해) 변이형 폴리펩타이드에 연결되어, 융합 변이형 폴리펩타이드를 인코딩하는 핵산 서열을 생성할 수 있다.
본원에 사용된 "벡터" 또는 "발현 벡터"는, 세포 내 부착된 분절의 복제를 야기하도록, 또 다른 DNA 분절, 즉, "삽입물"에 부착될 수 있는, 플라스미드, 박미드, 파지, 바이러스, 비리온 또는 코스미드(cosmid)와 같은 레플리콘이다. 벡터는 숙주세포로의 전달, 또는 상이한 숙주세포 사이에서의 전달을 위해 설계된 핵산 작제물일 수 있다. 본원에 사용된 벡터는 본래 및/또는 최종 형태가 바이러스성 또는 비바이러스성일 수 있지만, 본 개시내용의 목적을 위해, "벡터"는 일반적으로 본원에 사용된 바와 같은 용어로서의 ceDNA 벡터를 나타낸다. "벡터"라는 용어는, 적절한 제어 요소와 결합될 때 복제 가능하고, 유전자 서열을 세포로 전달할 수 있는 임의의 유전 요소를 포함한다. 일부 구현예에서, 벡터는 발현 벡터 또는 재조합 벡터일 수 있다.
본원에 사용된 "발현 벡터"라는 용어는, 벡터 상의 전사 조절 서열에 연결된 서열로부터 RNA 또는 폴리펩타이드의 발현을 지시하는 벡터를 나타낸다. 발현된 서열은 종종, 반드시는 아니지만, 세포에 대해 이종성일 수 있다. 발현 벡터는 추가 요소를 포함할 수 있으며, 예를 들어 발현 벡터는 2개의 복제 시스템을 가질 수 있기 때문에, 2가지 유기체에서, 예를 들어 인간 세포에서 발현을 위해, 원핵 숙주에서 클로닝 및 증폭을 위해 유지될 수 있다. "발현"이라는 용어는, 적용 가능한 경우, 비제한적으로, 예를 들어 전사, 전사체 처리, 번역 및 단백질 폴딩, 변형 및 처리를 포함하는, RNA 및 단백질의 생산, 및 적절한 경우, 단백질 분비에 관여하는 세포 과정을 나타낸다. "발현 산물"에는, 유전자에서 전사된 RNA, 및 유전자에서 전사된 mRNA의 번역에 의해 수득된 폴리펩타이드가 포함된다. "유전자"라는 용어는, 적절한 조절 서열에 작동 가능하게 연결될 때 시험관내 또는 생체내에서 RNA에 전사되는 핵산 서열(DNA)을 의미한다. 유전자는 코딩 영역의 앞뒤 영역, 예를 들어 5' 미번역(5' UTR) 또는 "리더(leader)" 서열과 3' UTR 또는 "트레일러(trailer)" 서열뿐 아니라, 개별 코딩 분절(엑손) 사이의 개재 서열(인트론)을 포함할 수도 포함하지 않을 수도 있다.
"재조합 벡터"란, 핵산 서열, 예를 들어 이종 핵산, 또는 생체내에서 발현 가능한 "전이유전자"를 포함하는 벡터를 의미한다. 본원에 기재된 벡터가, 일부 구현예에서, 다른 적합한 조성물 및 요법과 조합될 수 있다는 것을 이해해야 한다. 일부 구현예에서, 벡터는 에피솜 상태이다. 적합한 에피솜 벡터의 사용은 대상에서 관심 뉴클레오타이드를 염색체외 DNA에 높은 카피수로 유지하여, 염색체 통합의 잠재적인 영향을 제거하는 수단을 제공한다.
본원에 사용된 "유전 질환"이라는 구절은, 부분적으로 또는 완전히, 직접적으로 또는 간접적으로, 게놈 내 하나 이상의 비정상에 의해 유발된 질환, 특히 출생 시부터 존재한 병태를 나타낸다. 비정상은 돌연변이, 삽입 또는 결실일 수 있다. 비정상은 유전자의 코딩 서열 또는 이의 조절 서열에 영향을 미칠 수 있다. 유전 질환은, 비제한적으로, PKU, DMD, 혈우병, 낭성섬유증, 헌팅턴 무도병(Huntington's chorea), 가족성 고콜레스테롤혈증(LDL 수용체 결함), 간모세포종, 윌슨병(Wilson's disease), 선천성 간 포르피린증, 유전성 간 대사장애, 레쉬 니한 증후군(Lesch Nyhan syndrome), 낫적혈구빈혈, 지중해빈혈, 색소성 건피증, 판코니 빈혈(Fanconi's anemia), 색소성망막염, 모세혈관확장성 운동실조증, 블룸 증후군(Bloom's syndrome), 망막모세포종 및 테이-삭스병(Tay-Sachs disease)일 수 있다.
본원에 사용된 "포함하는" 또는 "포함하다"라는 용어는, 방법 또는 조성물에 필수적이지만, 필수적인지 여부에 관계없이 명시되지 않은 요소를 포함할 수도 있는, 조성물, 방법, 및 이의 각 구성요소(들)에 관하여 사용된다.
본원에 사용된 "~로 본질적으로 이루어진"이라는 용어는, 소정의 구현예에 필요한 요소를 나타낸다. 상기 용어는, 해당 구현예의 기본적인 및 신규한 또는 기능적인 특징(들)에 실질적으로 영향을 미치지 않는 요소의 존재를 허용한다. "포함하는"이라는 용어의 사용은 제한이 아닌 포함을 나타낸다.
"~로 이루어진"이라는 용어는, 구현예의 설명에 언급되지 않은 임의의 요소를 배제하는, 본원에 기재된 바와 같은 조성물, 방법 및 이의 각 구성요소를 나타낸다.
본원에 사용된 "~로 본질적으로 이루어진"이라는 용어는, 소정의 구현예에 필요한 요소를 나타낸다. 상기 용어는, 본 개시내용의 구현예의 기본적인 및 신규한 또는 기능적 특징(들)에 실질적으로 영향을 미치지 않는 추가 요소의 존재를 허용한다.
본 명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태의 표현은, 문맥에서 달리 명백하게 지시하지 않는 한, 복수의 언급 대상을 포함한다. 따라서, 예를 들어, "방법"에 대한 언급은 본원에 기재된 및/또는 본 개시내용 등을 읽을 때 당업자에게 명백해 질 수 있는 유형의 하나 이상의 방법 및/또는 단계를 포함한다. 유사하게, "또는"이라는 단어는, 문맥에서 달리 명백하게 지시되지 않는 한, "및"을 포함한다. 본원에 기재된 바와 유사하거나 동등한 방법 및 재료가 본 개시내용의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 재료가 하기에 기재된다. "e.g."라는 약어는, 라틴어 예를 들어(exempli gratia)에서 유도된 것이며, 이는 본원에서 비제한적인 예를 나타내기 위해 사용된다. 따라서, "e.g."라는 약어는, "예를 들어"라는 용어와 동의어이다.
본원에 개시된 본 개시내용의 대안적인 요소 또는 구현예의 그룹화는 제한으로 해석되어서는 안 된다. 각각의 그룹 구성원은 개별적으로, 또는 그룹의 다른 구성원 또는 본원에서 확인되는 다른 요소와 조합으로 참조되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의성 및/또는 특허성의 이유로 그룹에 포함되거나, 그룹에서 결실될 수 있다. 임의의 이러한 포함 또는 결실이 발생하는 경우, 본 명세서는 본원에 변형된 그룹을 포함하는 것으로 간주되어 첨부된 청구범위에 사용된 모든 마쿠쉬(Markush) 그룹에 대한 서면 기재를 충족시킨다.
임의의 양태의 일부 구현예에서, 본원에 기재된 개시내용은 인간을 클로닝하는 방법, 인간의 생식계열 유전자 정체성을 변형시키는 방법, 산업적 또는 상업적 목적을 위한 인간 배아의 사용, 또는 인간 또는 동물에게의 임의의 실질적인 의학적 유익 없이 고통을 야기할 수 있는 동물의 유전적 정체성을 변형시키는 방법, 및 또한 이러한 방법의 결과로서의 동물에 관한 것이 아니다.
다른 용어는 본 개시내용의 다양한 양태의 설명 내에서 본원에 정의된 바와 같다.
본 출원 전반에 걸쳐 인용된 모든 특허 및 다른 간행물(문헌 참조, 등록된 특허, 공개된 특허 출원 및 동시 계류중인 특허 출원 포함)은, 예를 들어 본원에 기재된 기술과 관련하여 사용될 수 있는 이러한 간행물에 기재된 방법론을 설명 및 개시하기 위한 목적으로 명백하게 본원에 참조로서 인용된다. 이러한 간행물은 본 출원의 출원일 이전의 개시내용에 대해서만 제공된다. 이와 관련하여, 선행 개시내용으로 인해 또는 임의의 다른 이유로, 본 발명자가 그러한 개시내용보다 선행할 자격이 없다는 것을 인정하는 것으로 해석되어서는 안 된다. 이러한 문서의 내용에 대한 날짜 또는 표현에 대한 모든 진술은 출원인이 이용 가능한 정보를 기반으로 하며, 이러한 문헌의 날짜 또는 내용의 정확성에 대한 승인을 구성하는 것으로 여겨지지 않는다.
본 개시내용의 구현예의 설명은 개시된 정확한 형태로 본 개시내용을 제한하거나, 완전한 것으로서 의도되지 않는다. 본 개시내용의 특정 구현예 및 이에 대한 예는 예시의 목적으로 본원에 기재되었으며, 당업자가 이해하는 바와 같이 본 개시내용의 범위 내에서 다양한 등가의 변형이 이루어질 수 있다. 예를 들어, 방법 단계 또는 기능이 소정의 순서로 제시되어 있지만, 대안적인 구현예는 상이한 순서로 기능을 수행할 수 있거나, 기능들이 실질적으로 동시에 수행될 수 있다. 본원에 제공된 개시내용의 교시는 적절하게 다른 절차 또는 방법에 적용될 수 있다. 본원에 기재된 다양한 구현예는 조합되어 추가 구현예를 제공할 수 있다. 본 개시내용의 양태는, 필요한 경우, 본 개시내용의 추가의 구현예를 제공하기 위해 상기 참고문헌 및 적용의 조성물, 기능 및 개념을 이용하도록 변형될 수 있다. 나아가, 생물학적 기능 동등성을 고려할 때, 생물학적 또는 화학적 작용의 종류 또는 양에 영향을 미치지 않는 한 단백질 구조에 약간의 변경이 이루어질 수 있다. 이러한 및 다른 변경은 상세한 설명을 고려하여 이루어질 수 있다. 모든 이러한 변형은 첨부된 청구범위의 범위 내에 포함되는 것으로 의도된다.
전술한 구현예 중 임의의 것의 특정 요소는 조합되거나, 다른 구현예의 요소로 치환될 수 있다. 나아가, 본 개시내용의 특정 구현예와 관련된 이점이 이러한 구현예의 맥락에서 기재되어 있지만, 다른 구현예 또한 이러한 이점을 나타낼 수 있으며, 모든 구현예가 본 개시내용의 범위 내에 속하기 위해 반드시 이러한 이점을 나타낼 필요가 있는 것은 아니다.
본원에 기재된 기술은 하기 예에 의해 추가로 예시되며, 이러한 예는 어떠한 방식으로든 추가적인 제한으로 해석되어서는 안 된다. 본 개시내용이 본원에 기재된 특정 방법론, 프로토콜 및 시약 등에 제한되지 않고, 달라질 수 있다는 것을 이해해야 한다. 본원에 사용된 용어는 단지 특정 구현예를 설명하기 위한 목적이며, 청구범위에 의해서만 한정되는 본 개시내용의 범위를 제한하고자 하는 것이 아니다.
II. 폐쇄형 DNA(ceDNA) 벡터로부터 PAH 단백질의 발현
본원에 기재된 기술은 일반적으로 비바이러스성 DNA 벡터, 예를 들어 본원에 기재된 바와 같은 ceDNA 벡터로부터의 세포 내 PAH 단백질의 발현 및/또는 생산에 관한 것이다. PAH 단백질의 발현을 위한 ceDNA 벡터는 본원의 "ceDNA 벡터 전반"이라는 제목의 섹션에 기재되어 있다. 특히, PAH 단백질의 발현을 위한 ceDNA 벡터는 (예를 들어, 본원에 기재된 바와 같은 대칭 또는 비대칭인) ITR 쌍과, ITR 쌍 사이에, 프로모터 또는 조절 서열에 작동적으로 연결된 본원에 기재된 바와 같은 PAH 단백질을 인코딩하는 핵산(여기서 핵산은 코돈 최적화됨)을 포함한다. 전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 PAH 단백질의 발현을 위한 ceDNA 벡터의 뚜렷한 이점은, 목적하는 단백질을 인코딩하는 핵산 서열에 크기 제한이 없다는 점이다. 따라서, 심지어 전장 6.8 kb PAH 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다. 따라서, 본원에 기재된 ceDNA 벡터는 이를 필요로 하는 대상, 예를 들어 PKU를 앓고 있는 대상에서 치료용 PAH 단백질을 발현시키는 데 사용될 수 있다.
당업자가 이해하는 바와 같이, 본원에 기재된 ceDNA 벡터 기술은 임의의 복잡성 수준에 맞게 조정될 수 있거나, PAH 단백질의 상이한 구성요소의 발현이 독립적인 방식으로 제어될 수 있는 모듈 방식으로 사용될 수 있다. 예를 들어, 구체적으로, 본원에 설계된 ceDNA 벡터 기술은 단일 유전자 서열(예를 들어, PAH 단백질)을 발현시키기 위해 단일 ceDNA 벡터를 사용하는 바와 같이 간단할 수 있거나, 다중 ceDNA 벡터를 사용(여기서 각각의 벡터는 상이한 프로모터에 의해 각각 독립적으로 제어되는 다수의 PAH 단백질, 또는 관련 보조인자 또는 부속 단백질을 발현시킴)하는 바와 같이 복잡할 수 있다고 고려된다. 하기 구현예는 본원에서 구체적으로 고려되며, 목적하는 바대로 당업자에 의해 조정될 수 있다.
하나의 구현예에서, 단일 ceDNA 벡터를 사용하여 PAH 단백질의 단일 구성요소를 발현시킬 수 있다. 대안적으로, 단일 ceDNA 벡터를 사용하여 단일 프로모터(예를 들어, 강력한 프로모터)의 제어 하에서 PAH 단백질의 다수의 구성요소(예를 들어, 적어도 2개)를 발현시킬 수 있으며, 선택적으로 IRES 서열(들)을 사용하여, 구성요소, 예를 들어 보조인자 또는 부속 단백질 각각의 적합한 발현을 보장할 수 있다.
본 개시내용에 따르면, 인간 PAH 단백질을 인코딩하는 핵산은 코돈 최적화된다.
당업자에 의해 ceDNA 벡터 기술의 추가적인 변형이 구상될 수 있거나, 통상적인 벡터를 사용하는 단백질 생산 방법이 조정될 수 있다.
A. 핵산
가능성 있는 치료용 핵산 분자의 특징분석 및 개발이 본원에 제공된다. 본원에 사용된 치료용 핵산은 PAH 단백질을 인코딩하며, 여기서 핵산은 코돈 최적화된다. 일부 구현예에서, 생체내 특성(전달, 안정성, 수명, 폴딩, 표적 특이성)의 변경 및 개선을 위한 올리고뉴클레오타이드의 화학적 변형뿐 아니라, 적절한 경우, 치료적 적용과 직접적인 상관관계가 있는 이의 생물학적 기능 및 메커니즘이 본원에 기재되어 있다.
면역자극성이며 본원에 개시된 면역억제제의 사용을 필요로 할 수 있는 본 개시내용의 예시적인 치료용 핵산은, 비제한적으로, 미니유전자, 플라스미드, 미니서클, 소형 간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오타이드(ASO), 리보자임, 폐쇄형 이중가닥 DNA(예를 들어, ceDNA, CELiD, 선형의 공유결합으로 폐쇄된 DNA("미니스트링"), 개뼈형(dbDNA™), 프로텔로미어 폐쇄형 DNA 또는 덤벨 선형 DNA), 다이서-기질 dsRNA, 소형 헤어핀 RNA(shRNA), 비대칭 간섭 RNA(aiRNA), 가이드 RNA(gRNA), 마이크로RNA(miRNA), mRNA, tRNA, rRNA, 및 DNA 바이러스성 벡터, 바이러스성 RNA 벡터, 및 이들의 임의의 조합을 포함할 수 있다.
일부 구현예에 따르면, 치료용 핵산은 폐쇄형 이중가닥 DNA, 예를 들어 ceDNA이다. 일부 구현예에 따르면, 세포 내 치료용 단백질의 발현 및/또는 생산은 비바이러스성 DNA 벡터, 예를 들어 ceDNA 벡터에서 유래한 것이다. 전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 치료용 단백질의 발현을 위한 ceDNA 벡터의 뚜렷한 이점은, 목적하는 단백질을 인코딩하는 핵산 서열, 예를 들어 이종 핵산 서열에 크기 제한이 없다는 점이다. 따라서, 심지어 거대한 치료용 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다. 따라서, ceDNA 벡터는 이를 필요로 하는 대상에서 치료용 단백질을 발현시키는 데 사용될 수 있다.
일반적으로, 본원에 개시된 바와 같은 치료용 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 핵산 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함한다. ITR 서열은, (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(mod-ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택된다.
일부 구현예에서, PAH 단백질을 인코딩하는 전이유전자는 또한 PAH 단백질이 골지체 및 소포체로 향하도록 분비 서열을 인코딩할 수 있으며, 여기서 PAH 단백질은 ER을 통과하여 세포 밖으로 나올 때 샤페론 분자에 의해 정확한 형태로 폴딩된다. 예시적인 분비 서열에는, 비제한적으로, VH-02(서열번호 88) 및 VK-A26(서열번호 89) 및 Igĸ 신호 서열(서열번호 126)뿐 아니라, 태그된 단백질이 시토졸 외부로 분비되게 하는 Gluc 분비 신호(서열번호 188), 태그된 단백질이 골지로 향하게 하는 TMD-ST 분비 서열(서열번호 189)이 포함된다.
조절 스위치는 또한, PAH 단백질이 목적하는 대로 발현되도록(비제한적으로, 목적하는 발현 수준 또는 양으로PAH 단백질이 발현되는 것을 포함함), 또는 대안적으로, 세포 신호전달 사건을 포함하는 특정 신호의 존재 또는 부재 하에 있을 때, PAH 단백질의 발현을 미세 조정하는 데 사용될 수 있다. 예를 들어, 본원에 기재된 바와 같이, ceDNA 벡터로부터 PAH 단백질의 발현은 조절 스위치라는 제목의 섹션에 본원에 기재된 바와 같이, 특정 조건이 발생하는 경우, 켜지거나 꺼질 수 있다.
예를 들어, 단지 예시의 목적으로, PAH 단백질은 PAH 단백질의 너무 높은 생산 수준과 같은 바람직하지 않은 반응을 차단하는 데 사용될 수 있다. PAH 유전자는 PAH 단백질을 목적하는 세포로 가져오기 위한 신호 펩타이드 마커를 함유할 수 있다. 하지만, 어느 상황에서도, PAH 단백질의 발현을 조절하는 것이 바람직할 수 있다. ceDNA 벡터는 조절 스위치의 사용을 용이하게 수용한다.
전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 ceDNA 벡터의 뚜렷한 이점은, PAH 단백질을 인코딩하는 핵산 서열, 예를 들어 이종 핵산 서열에 대한 크기 제한이 없다는 점이다. 따라서, 심지어 전장 PAH뿐 아니라, 선택적으로 임의의 보조인자 또는 부속 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다. 또한, 필요한 화학량론에 따라, 동일한 PAH 단백질의 다수의 분절을 발현시킬 수 있고, 동일하거나 상이한 프로모터를 사용할 수 있고, 각각의 영역의 발현을 미세 조정하기 위해 조절 스위치를 사용할 수도 있다. 예를 들어, 실시예에 제시된 바와 같이, PAH 단백질의 각각의 도메인에 대해 상이한 프로모터가 사용되는, 이중 프로모터 시스템을 포함하는 ceDNA 벡터가 사용될 수 있다. PAH 단백질의 생산을 위한 ceDNA 플라스미드의 사용은, 기능성 PAH 단백질의 형성을 위한 각각의 도메인의 적절한 비를 유도하는, PAH 단백질의 도메인의 발현을 위한 프로모터의 고유한 조합을 포함할 수 있다. 따라서, 일부 구현예에서, ceDNA 벡터는 (예를 들어, 상이한 프로모터의 제어 하에서) PAH 단백질의 상이한 영역을 개별적으로 발현시키는 데 사용될 수 있다.
또 다른 구현예에서, ceDNA 벡터로부터 발현된 PAH 단백질은 형광, 효소 활성, 분비 신호 또는 면역세포 활성화제와 같은 추가 기능을 추가로 포함한다.
일부 구현예에서, PAH 단백질을 인코딩하는 ceDNA는, 예를 들어 링커 도메인을 추가로 포함할 수 있다. 본원에 사용된 "링커 도메인"이란, 본원에 기재된 바와 같은 PAH 단백질의 임의의 도메인/영역을 함께 연결하는, 약 2개 내지 100개 아미노산 길이의 올리고- 또는 폴리펩타이드 영역을 나타낸다. 일부 구현예에서, 링커는 인접한 단백질 도메인이 서로 자유롭게 이동할 수 있도록, 글리세린 및 세린과 같은 가요성(flexible) 잔기를 포함하거나 이로 구성될 수 있다. 2개의 인접한 도메인이 서로 입체적으로 간섭하지 않도록 보장하는 것이 바람직한 경우, 보다 긴 링커가 사용될 수 있다. 링커는 절단 가능하거나 절단 가능하지 않을 수 있다. 절단 가능한 링커의 예에는, 2A 링커(예를 들어, T2A), 2A 유사 링커 또는 이들의 기능성 등가물, 및 이들의 조합이 포함된다. 링커는 토세아 아시그나(Thosea asigna) 바이러스에서 유도된 T2A 링커 영역일 수 있다.
예를 들어 PAH 등의 알려지고/알려지거나 공개적으로 이용 가능한 단백질 서열을 취하고, 이러한 단백질을 인코딩하기 위해 cDNA 서열을 역으로 조작하는 것은 당업자의 능력 범위 내에 있다. 따라서, cDNA는 의도된 숙주세포와 매칭되도록 코돈 최적화되고 본원에 기재된 바와 같은 ceDNA 벡터에 삽입될 수 있다.
B. PAH 단백질을 발현하는 ceDNA 벡터
목적하는 PAH를 인코딩하는 하나 이상의 서열을 갖는 PAH 단백질의 발현을 위한 ceDNA 벡터는, 프로모터, 분비 신호, polyA 영역 및 인핸서와 같은 조절 서열을 포함할 수 있다. 최소한, ceDNA 벡터는 PAH 단백질을 인코딩하는 하나 이상의 핵산 서열, 예를 들어 이종 핵산 서열을 포함하며, 여기서 핵산 서열은 코돈 최적화된다. 일부 구현예에 따르면, 코돈 최적화된 핵산은 최적 전이유전자 발현 및 지속기간을 달성하기 위해 특정 시스-작용 요소(예를 들어, 특정 프로모터 및/또는 특정 인핸서)와 조합된다.
일부 구현예에 따르면, PAH 단백질은 이를 단백질 폴딩이 일어나는 ER로 향하게 하는 소포체 ER 리더 서열을 포함한다. 예를 들어, 폴딩을 위해 발현된 단백질(들)을 ER로 향하게 하는 서열.
일부 구현예에서, ceDNA 벡터에는, PAH 단백질이 세포내 표적(들)(예를 들어, 인트라바디) 또는 세포외 표적(들)에 결합될 수 있도록 PAH의 분비 또는 목적하는 세포하 국소화를 지시하는, 세포 또는 세포외 국소화 신호(예를 들어, 분비 신호, 핵 국소화 신호, 미토콘드리아 국소화 신호 등)가 포함되어 있다.
일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 모듈 방식으로 임의의 목적하는 PAH 단백질의 어셈블리 및 발현을 가능하게 한다. 본원에 사용된 "모듈(형)"이라는 용어는, 작제물로부터 쉽게 제거될 수 있는 ceDNA 발현 플라스미드의 요소를 나타낸다.
일부 구현예에서, PAH 발현을 위한 ceDNA 벡터는 전장 PAH 단백질을 인코딩하는 서열을 가질 수 있다. 일부 다른 구현예에서, PAH 발현을 위한 ceDNA 벡터는 절단된 PAH 단백질을 인코딩하는 서열을 가질 수 있다. 예를 들어, 절단된 PAH는 PAH의 자가조절 영역(예를 들어, 전장 PAH의 아미노산 1번 내지 19번)을 제거하기 위해 N-말단에 결실을 가질 수 있다. 하나의 구현예에서, PAH 발현을 위한 ceDNA 벡터는 아미노산 1번 내지 19번의 N-말단 절단을 갖는다.
일부 구현예에서, ceDNA 벡터는 기능성 PAH의 오픈리딩프레임 내부에 인트론이 있는 PAH 서열을 가질 수 있다. 일부 다른 구현예에서, ceDNA는 이종 신호 서열(SS)을 갖는 PAH 서열을 가질 수 있다. 또 다른 일부 구현예에서, ceDNA는 DNA 핵 표적화 서열을 갖는 PAH 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 5' UTR 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 인트론 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 3' UTR 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 하나 이상의 인핸서 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 프로모터 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 Kozak 서열을 가질 수 있다. 또 다른 일부 구현예에서, 코돈 최적화된 PAH의 ceDNA 벡터는 2개의 시스-작용 요소(예를 들어, 인핸서 요소) 사이 또는 시스-작용 요소와 오픈리딩프레임(ORF) 사이에 링커/스페이서 서열을 가질 수 있다.
C. ceDNA 벡터에 의해 발현되는 예시적인 PAH 단백질
특히, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 페닐케톤뇨증(PKU)의 하나 이상의 증상의 치료, 예방 및/또는 개선에 사용되는, 예를 들어 PAH 단백질뿐 아니라, 이의 변이체 및/또는 활성 단편을 인코딩할 수 있다. 하나의 양태에서, 페닐케톤뇨증(PKU)은 인간 페닐케톤뇨증(PKU)이다.
(i) PAH 치료 단백질 및 이의 단편
본 개시내용은 코돈 최적화된 핵산에 의해 인코딩되고, 본원에 기재된 바와 같은 ceDNA 벡터에서 및 이로부터 발현되는 PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 제공한다. 당업자는, PAH 치료 단백질이 PAH 단백질의 모든 스플라이스 변이체 및 이종상동체(ortholog)를 포함한다는 것을 이해할 것이다. PAH 치료 단백질에는, 온전한 분자뿐 아니라, 이의 절단된 단편(예를 들어, 기능성 단편)이 포함된다.
전형적인 AAV 벡터, 및 심지어 렌티바이러스 벡터에 비해 ceDNA 벡터의 뚜렷한 이점은, 목적하는 단백질을 인코딩하는 핵산 서열, 예를 들어 이종 핵산 서열에 대한 크기 제한이 없다는 점이다. 따라서, 다수의 전장 PAH 치료 단백질도 단일 ceDNA 벡터로부터 발현될 수 있다.
PAH 단백질 및 유전자: PAH 유전자는 12q22-q24.2 밴드에서 12번 염색체 상에 위치한다. 2000년 현재, 대략 400가지 질환 유발 돌연변이가 PAH 유전자에서 확인되었다. 페닐알라닌 히드록실라아제(PAH)는 페닐알라닌 4-모노옥시게나아제, 페닐알라닌-4-히드록실라아제, Phe-4-모노옥시게나아제, EC 1.14.16.1, EC 1.14.16, PKU1, PKU 또는 PH로도 지칭될 수 있다.
PAH의 단백질 서열은 다음과 같다: 호모 사피엔스 PAH 효소 번역(450개 아미노산), 수탁번호 NM_000277.3.
MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQK (서열번호 1025)
PAH는 간에서 우세하게 발현되며, 신장 및 담낭에서는 중간 정도로 발현된다. 낮은 수준의 PAH 발현은 또한 전립선, 부신에서도 검출될 수 있다. 태아 발달 동안, PAH는 부신, 심장, 장, 폐 및 위에서 발현될 수 있다. 따라서, PAH를 발현하는 ceDNA 벡터는 간, 신장, 담낭, 전립선, 부신에서 선택되는 임의의 하나 이상의 조직에 투여될 수 있다. 일부 구현예에서, PAH를 발현하는 ceDNA 벡터가 유아에게 투여되거나 대상의 자궁에 투여되는 경우, PAH를 발현하는 ceDNA 벡터는 간, 부신, 심장, 장, 폐 및 위에서 선택되는 임의의 하나 이상의 조직에 투여될 수 있다.
ceDNA 벡터로부터의 PAH 치료 단백질 또는 이의 단편의 발현은 본원에 기재된 바와 같은 하나 이상의 프로모터를 사용하여 공간적으로 및 시간적으로 달성될 수 있다. 일부 구현예에서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(hAAT(979) 프로모터 및 CpGmin_hAAT 프로모터 포함) 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택된다.
일부 구현예에 따르면, PAH 단백질을 인코딩하는 핵산은 코돈 최적화되고, 본원에 기재된 바와 같은 ceDNA 벡터에 삽입된다.
본원에 사용된 "코돈 최적화된" 또는 "코돈 최적화"라는 용어는, 관심 척추동물, 예를 들어 마우스 또는 인간의 세포에서 발현 증강을 위해 핵산 서열을 변경하는 과정으로서, 천연 서열(예를 들어, 원핵생물 서열) 중 적어도 하나, 하나 초과 또는 유의한 수의 코돈을, 해당 척추동물의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하는 과정을 나타낸다. 다양한 종은 특정 아미노산의 특정 코돈에 대해 특정 편향을 나타낸다. 전형적으로, 코돈 최적화는 원래 번역된 단백질의 아미노산 서열을 변경시키지 않는다. 최적화된 코돈은, 예를 들어 Aptagen's GENE FORGE® 코돈 최적화 및 맞춤형 유전자 합성 플랫폼(Aptagen, Inc., 2190 Fox Mill Rd. Suite 300, Herndon, Va. 20171), 또는 또 다른 공개적으로 이용 가능한 데이터베이스를 사용하여 결정될 수 있다. 일부 구현예에서 PAH 단백질을 인코딩하는 핵산은 인간 발현을 위해 최적화된 것이고/것이거나, 인간 PAH 또는 이의 기능성 단편이다. 다양한 시스-작용 요소와 함께 ceDNA 발현을 위해 변경된 예시적인 PAH 서열이 본원에 개시되어 있다.
(ii) ceDNA 벡터를 발현하는 PAH 치료 단백질
본원에 기재된 바와 같은 ceDNA 벡터는 PAH 치료 단백질 또는 이의 기능성 단편을 인코딩하는 하나 이상의 코돈 최적화된 핵산 서열, 예를 들어 이종 핵산 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 본원의 표 1A에 열거된 것들에서 선택되는 PAH 서열을 인코딩하는 코돈 최적화된 핵산 서열을 포함한다.
[표 1A]
Figure pct00001
Figure pct00002
Figure pct00003
[표 1B]
Figure pct00004
하나의 구현예에서, ceDNA 벡터는 본원의 표 1A에 열거된 코돈 최적화된 인간 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 90% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 91% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 PAH 서열과 적어도 92% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 93% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 94% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 95% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 96% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 97% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 98% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 표 1A에 열거된 서열과 적어도 99% 동일성을 갖는 코돈 최적화된 PAH 서열을 포함한다.
하나의 구현예에서, PAH 서열은 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393, 서열번호 394, 서열번호 395, 서열번호 396, 서열번호 397, 서열번호 398, 서열번호 399, 서열번호 400, 서열번호 401, 서열번호 402, 서열번호 403, 서열번호 404, 서열번호 405, 서열번호 406, 서열번호 407, 서열번호 408, 서열번호 409, 서열번호 410, 서열번호 411, 서열번호 412, 서열번호 413, 서열번호 414, 서열번호 415, 서열번호 416, 서열번호 417, 서열번호 418, 서열번호 419, 서열번호 420, 서열번호 421, 서열번호 422, 서열번호 423, 서열번호 424, 서열번호 425, 서열번호 426, 서열번호 427, 서열번호 428, 서열번호 429, 서열번호 430, 서열번호 431, 서열번호 432, 서열번호 433, 서열번호 434, 서열번호 435, 서열번호 436, 서열번호 437, 서열번호 438, 서열번호 439, 서열번호 440, 서열번호 1011, 서열번호 1012, 서열번호 1013, 서열번호 1014 또는 서열번호 1015와 적어도 90% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 91% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 92% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 93% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 94% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 95% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 96% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 97% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 98% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 중 어느 하나와 적어도 99% 동일성을 갖는다. 하나의 구현예에서, PAH 서열은 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393, 서열번호 394, 서열번호 395, 서열번호 396, 서열번호 397, 서열번호 398, 서열번호 399, 서열번호 400, 서열번호 401, 서열번호 402, 서열번호 403, 서열번호 404, 서열번호 405, 서열번호 406, 서열번호 407, 서열번호 408, 서열번호 409, 서열번호 410, 서열번호 411, 서열번호 412, 서열번호 413, 서열번호 414, 서열번호 415, 서열번호 416, 서열번호 417, 서열번호 418, 서열번호 419, 서열번호 420, 서열번호 421, 서열번호 422, 서열번호 423, 서열번호 424, 서열번호 425, 서열번호 426, 서열번호 427, 서열번호 428, 서열번호 429, 서열번호 430, 서열번호 431, 서열번호 432, 서열번호 433, 서열번호 434, 서열번호 435, 서열번호 436, 서열번호 437, 서열번호 438, 서열번호 439, 서열번호 440, 서열번호 1011, 서열번호 1012, 서열번호 1013, 서열번호 1014 및 서열번호 1015로 이루어지는 군에서 선택되는 서열을 포함한다. 하나의 구현예에서, PAH 서열은 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385, 서열번호 386, 서열번호 387, 서열번호 389, 서열번호 390, 서열번호 391, 서열번호 392, 서열번호 393, 서열번호 394, 서열번호 395, 서열번호 396, 서열번호 397, 서열번호 398, 서열번호 399, 서열번호 400, 서열번호 401, 서열번호 402, 서열번호 403, 서열번호 404, 서열번호 405, 서열번호 406, 서열번호 407, 서열번호 408, 서열번호 409, 서열번호 410, 서열번호 411, 서열번호 412, 서열번호 413, 서열번호 414, 서열번호 415, 서열번호 416, 서열번호 417, 서열번호 418, 서열번호 419, 서열번호 420, 서열번호 421, 서열번호 422, 서열번호 423, 서열번호 424, 서열번호 425, 서열번호 426, 서열번호 427, 서열번호 428, 서열번호 429, 서열번호 430, 서열번호 431, 서열번호 432, 서열번호 433, 서열번호 434, 서열번호 435, 서열번호 436, 서열번호 437, 서열번호 438, 서열번호 439, 서열번호 440, 서열번호 1011, 서열번호 1012, 서열번호 1013, 서열번호 1014 또는 서열번호 1015로 이루어진다.
(iii) PAH 치료 단백질 및 PKU의 치료를 위한 이의 용도
본원에 기재된 ceDNA 벡터는 PAH 단백질의 부적절한 발현 및/또는 PAH 단백질 내 돌연변이와 관련된 PKU의 치료를 위한 치료용 PAH 단백질을 전달하는 데 사용될 수 있다.
본원에 기재된 바와 같은 ceDNA 벡터는 임의의 목적하는 PAH 치료 단백질을 발현시키는 데 사용될 수 있다. 예시적인 치료용 PAH 치료 단백질에는, 비제한적으로, 본원의 표 1A에 제시된 서열에 의해 발현되는 임의의 PAH 단백질이 포함된다.
하나의 구현예에서, 발현된 PAH 치료 단백질은 페닐케톤뇨증(PKU)의 치료에 기능성이 있다. 일부 구현예에서, PAH 치료 단백질은 면역계 반응을 야기하기 않는다.
일부 구현예에서, ceDNA 벡터는 절단된 PAH(단편)를 인코딩하는 코돈 최적화된 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 N-말단 자가조절 영역, 예를 들어 전장 PAH 단백질의 아미노산 1번 내지 29번의 결실을 갖는 절단된 PAH를 인코딩하는 코돈 최적화된 서열을 포함한다. 하나의 구현예에서, ceDNA 벡터는 서열번호 394를 포함한다.
또 다른 구현예에서, PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 인코딩하는 ceDNA 벡터는 키메라 단백질을 생성하는 데 사용될 수 있다. 따라서, 구체적으로는, 키메라 단백질을 발현하는 ceDNA 벡터가, 예를 들어 간, 신장, 담낭, 전립선, 부신에서 선택되는 임의의 하나 이상의 조직에 투여될 수 있다고 본원에서 고려된다. 일부 구현예에서, PAH를 발현하는 ceDNA 벡터가 유아에게 투여되거나 대상의 자궁에 투여되는 경우, PAH를 발현하는 ceDNA 벡터는 페닐케톤뇨증(PKU)의 생체내 또는 생체외 치료를 위해, 간, 부신, 심장, 장, 폐 및 위에서 선택되는 임의의 하나 이상의 조직, 또는 이의 간 줄기세포 전구체에 투여될 수 있다.
PKU: PKU는 PAH 유전자의 돌연변이에 의해 유발되는 희귀한 선천성 대사 이상이다. PAH는 통상적으로 간에서 발현되며, 식이(dietary) 페닐알라닌을 신경전달물질의 생성을 담당하는 아미노산인 티로신으로 대사시키는 데 필요한 효소이다. PKU는 PAH의 효소 활성이 결핍되게 하는 PAH의 돌연변이로 인해 발생한다. 따라서, PAH 단백질을 발현하는 ceDNA 벡터는 간에서 PAH를 발현시킬 수 있다. 일부 구현예에서, ceDNA 벡터는 간세포에서 적어도 하나의 PAH 단백질을 발현시킨다.
PAH는 통상적으로 PR 및 RPE 세포 유형 둘 모두에서 내인성으로 발현된다. 또한, RPE에서 낮은 수준의 PAH 발현은 정상적인 망막 기능에도 필요할 수 있다고 보고되어 있다. 따라서, PR 및 또한, 선택적으로 RPE 세포에서 ceDNA 벡터에 의한 PAH 단백질의 낮은 수준 또는 높은 수준의 발현은, 때때로 망막 변성을 예방하기 위해 필요할 수 있다. 이러한 발현 수준은 본원에 기재된 바와 같은 프로모터 및/또는 조절 스위치에 의해 미세 조정될 수 있다.
따라서, 일부 구현예에서, ceDNA 벡터는 광수용체와 RPE 둘 모두에서 정상적인 레티노이드 처리를 회복시키기 위해, 내인성 프로모터(약 1 kb)로부터 6.8 kb 단백질인 PAH 단백질의 발현에 사용된다. 일부 구현예에서, PAH 단백질을 발현하는 ceDNA 벡터는 망막의 더 넓은 영역을 치료하기 위해 맥락막상 또는 유리체내 투여 경로를 통해 투여된다. 일부 구현예에서, ceDNA 벡터는 망막하 주사, 맥락막상 주사 또는 유리체내 주사 중 임의의 하나 이상을 통해 투여된다.
상기 방법은 본원에 기재된 바와 같은 PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 인코딩하는 ceDNA 벡터를 포함하는 조성물의 유효량을 대상에게 투여하는 단계를 포함한다. 당업자가 이해하는 바와 같이, "유효량"이라는 용어는, 질환 또는 장애의 치료를 위한 "치료적 유효량"으로 단백질의 발현을 유도하는, 투여되는 ceDNA 조성물의 양을 나타낸다.
PAH 치료 단백질 또는 이의 단편(예를 들어, 기능성 단편)을 인코딩하는 ceDNA 벡터를 포함하는 조성물의 투여량 범위는, 역가(예를 들어, 프로모터의 효율)에 따라 달라지며, 페닐케톤뇨증(PKU)의 치료를 위해 목적하는 효과, 예를 들어 목적하는 PAH 치료 단백질의 발현을 생성하는 데 충분히 큰 양을 포함한다. 투여량은 허용 가능하지 않은 부작용을 야기할 정도로 커서는 안 된다. 일반적으로, 투여량은 ceDNA 벡터의 특정한 특징, 발현 효율, 및 환자의 연령, 병태 및 성별에 따라 달라진다. 투여량은 당업자에 의해 결정될 수 있으며, 전형적인 AAV 벡터와 달리, ceDNA 벡터가 반복 투여를 방해하는 면역 활성화 캡시드 단백질을 포함하지 않기 때문에, 임의의 합병증 사례에서 개별 의사에 의해 조정될 수도 있다.
본원에 기재된 ceDNA 조성물의 투여는 제한된 기간 동안 반복될 수 있다. 일부 구현예에서, 용량은 주기적으로 또는 간헐적 투여로 제공된다. 바람직한 구현예에서, 상기 언급된 용량은 수개월에 걸쳐 투여된다. 치료 지속기간은 대상의 임상 진행과 치료에 대한 반응성에 따라 달라진다. 시간 경과에 따른 부스터 치료도 고려된다. 나아가, 발현 수준은 대상이 성장함에 따라 적정될 수 있다.
PAH 치료 단백질은 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 6개월, 적어도 12개월/1년, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 15년, 적어도 20년, 적어도 30년, 적어도 40년, 적어도 50년 또는 그 이상 동안 대상에서 발현될 수 있다. 장기 발현은 선결된 또는 목적하는 간격으로 본원에 기재된 ceDNA 벡터를 반복 투여하는 방식으로 달성될 수 있다.
본원에 사용된 "치료적 유효량"이라는 용어는, 질환 바이오마커 발현의 통계적으로 유의하고 측정 가능한 변화, 또는 소정의 질환 증상의 감소를 생성하는 데 충분한(하기 "효능 측정" 섹션 참조), 발현된 PAH 치료 단백질 또는 이의 기능성 단편의 양이다. 이러한 유효량은 소정의 ceDNA 조성물에 대한 임상 시험 및 동물 연구에서 추정될 수 있다.
투여에 필요한 ceDNA 벡터의 정확한 양은 의사의 판단에 따라 달라지며, 각 개체마다 특정하다. 적합한 투여 방식 또한 가변적이지만, 초기 투여 후, 후속 주사 또는 다른 투여가 하나 이상의 간격으로 반복 투여되는 것이 전형적이다. 대안적으로, 특히 급성 질환/장애 치료의 경우, 생체내 치료법에 대해 명시된 범위로 혈중 농도를 유지하는 데 충분한 연속 정맥내 주입이 고려된다.
본원에 기재된 방법 및 조성물에 유용한 작용제는 국소적으로, 정맥내로(볼루스 또는 연속 주입으로), 세포내 주사로, 조직내 주사로, 경구로, 흡입으로, 복강내로, 근육내로, 피하로, 공동내로 투여될 수 있으며, 목적하는 경우, 연동 수단을 통해, 또는 당업자에게 알려진 다른 수단을 통해 전달될 수 있다. 작용제는, 목적하는 경우, 전신으로 투여될 수 있다. 이는 또한 자궁에 투여될 수 있다.
페닐케톤뇨증(PKU)에 대한 소정의 치료의 효능은 숙련된 임상의에 의해 결정될 수 있다. 하지만, 질환 또는 장애의 징후 또는 증상 중 어느 하나 또는 전부가 유익한 방식으로 변경되거나, 다른 임상적으로 허용되는 질환의 증상 또는 마커가, 예를 들어 PAH 또는 이의 기능성 단편을 인코딩하는 ceDNA 벡터로의 치료 후 적어도 10% 정도 호전되거나 개선되는 경우, 치료는 본원에 사용된 용어로 "유효한 치료"로 간주된다. 효능은 또한 질환의 안정화 또는 의학적 개입의 필요성에 의해 평가되는 바와 같이 개체의 악화 실패로 측정될 수 있다(즉, 질환의 진행이 중단되거나 적어도 느려짐). 이러한 지표의 측정 방법은 당업자에게 알려져 있고/있거나 본원에 기재되어 있다. 치료는 개체 또는 동물(일부 비제한적인 예에는, 인간 또는 포유류가 포함됨)에서의 질환의 임의의 치료를 포함하며, 이에는 (1) 질환을 저해하는 것, 예를 들어 질환 또는 장애의 진행을 중단시키거나 느리게 하는 것; 또는 (2) 질환을 완화시키는 것, 예를 들어 증상의 퇴행을 유발하는 것; 및 (3) 질환의 발달 가능성을 예방하거나 감소시키는 것, 또는 간부전 또는 신부전과 같은 질환과 관련된 2차 질환/장애를 예방하는 것을 포함한다. 질환의 치료를 위한 유효량은, 이를 필요로 하는 포유류에 투여되는 경우, 해당 질환에 대한 유효한 치료(이러한 용어는 본원에 정의된 바와 같음)를 유도하는 데 충분한 양을 의미한다.
작용제의 효능은 페닐케톤뇨증(PKU)에 대해 특정한 물리적 지표를 평가하는 방식으로 결정될 수 있다. PKU 지표의 표준 분석 방법은 당업계에 알려져 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 또한, ceDNA로부터 발현된 PAH 단백질과 함께 사용될 수 있는, 보조인자 또는 다른 폴리펩타이드, 센스 또는 안티센스 올리고뉴클레오타이드, 또는 RNA(코딩 또는 비코딩; 예를 들어, siRNA, shRNA, gRNA, 마이크로RNA, 및 이들의 안티센스 대응물(예를 들어, antagoMiR))를 인코딩할 수 있다. 또한, PAH 단백질을 인코딩하는 서열을 포함하는 발현 카세트는 또한, β-락타마아제, β-갈락토시다아제(LacZ), 알칼리성 포스파타아제, 티미딘 키나아제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제 및 당업계에 널리 알려진 다른 것들과 같은, 실험 또는 진단 목적으로 사용되는 리포터 단백질을 인코딩하는 외인성 서열을 포함할 수 있다.
하나의 구현예에서, ceDNA 벡터는 PKU의 치료에 기능성이 있는 PAH 단백질을 발현시키는 핵산 서열을 포함한다. 바람직한 구현예에서, 치료용 PAH 단백질은, 목적하지 않는 경우, 면역계 반응을 야기하지 않는다.
III. PAH 치료 단백질의 생산에 사용되는 ceDNA 벡터 전반
본 개시내용의 구현예는 PAH 전이유전자를 발현시킬 수 있는 폐쇄형 선형 이중체화된(ceDNA) 벡터를 포함하는 방법 및 조성물을 기반으로 한다. 일부 구현예에서, 전이유전자는 PAH 단백질을 인코딩하는 코돈 최적화된 서열이다(예를 들어, 서열번호 382 내지 440 또는 서열번호 1011 내지 1015 참조). 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 크기 제한이 없기 때문에, 예를 들어 단일 벡터로부터 전이유전자의 발현에 필요한 모든 구성요소의 발현을 가능하게 한다. PAH 단백질의 발현을 위한 ceDNA 벡터는 바람직하게는 이중체이며, 예를 들어 발현 카세트와 같은 분자의 적어도 일부에 걸쳐 자가 상보적이다(예를 들어, ceDNA는 이중가닥 원형 분자가 아님). ceDNA 벡터는 공유결합으로 폐쇄된 말단을 갖기 때문에, 예를 들어 37℃에서 1시간 초과 동안 엑소뉴클레아제 소화(예를 들어, 엑소뉴클레아제 I 또는 엑소뉴클레아제 III)에 대한 내성이 있다.
일반적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 핵산 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함한다. ITR 서열은, (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(mod-ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택된다. PAH 단백질의 발현을 위한 ceDNA 벡터는 세포 기반(예를 들어, Sf9 또는 HEK293) 생산을 통해 또는 무세포 환경에서 복수의 올리고뉴클레오타이드를 사용하여 합성적으로 제작될 수 있다.
리포좀 나노입자 전달 시스템과 같은 전달 시스템을 추가로 포함할 수 있는, PAH 단백질 생산을 위한 ceDNA 벡터를 포함하는 방법 및 조성물이 본원에 포함된다. 비제한적인 예시적인 리포좀 나노입자 시스템이 본원에 개시되어 있다. 일부 양태에서, 본 개시내용은 ceDNA와 이온화 가능한 지질을 포함하는 지질 나노입자를 제공한다. 예를 들어, 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042와 2020년 9월 3일자 출원된 국제 출원 PCT/US2020/049266(이들은 각각 그 전문이 본원에 참조로서 인용됨)에 기재된 바와 같은 방법으로 수득된 ceDNA 벡터로 제조되고 로딩되는 지질 나노입자 제형.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 바이러스 캡시드 내 제한적인 공간에 의해 부과되는 패키징 제약이 없다. ceDNA 벡터는, 캡슐화된 AAV 게놈과 대조적으로, 원핵생물에서 생산된 플라스미드 DNA 벡터에 대한 실행 가능한 진핵생물에서 생산된 대안을 나타낸다. 이는, 제어 요소, 예를 들어 본원에 개시된 바와 같은 조절 스위치, 대형 전이유전자, 다중 전이유전자 등의 삽입을 허용한다.
PAH 단백질의 발현을 위한 ceDNA 벡터는 캡시드를 함유하지 않으며, 제1 ITR, 전이유전자를 포함하는 발현 카세트 및 제2 ITR을 이러한 순서로 인코딩하는 플라스미드에서 수득될 수 있다. 발현 카세트는 전이유전자의 발현을 가능하게 하고/하거나 제어하는 하나 이상의 조절 서열을 포함할 수 있으며, 예를 들어 여기서 발현 카세트는 인핸서/프로모터, ORF(PAH를 인코딩하는 전이유전자), 전사 후 조절 요소(예를 들어, WPRE), 및 폴리아데닐화 및 종결 신호(예를 들어, BGH polyA) 중 하나 이상을 이러한 순서로 포함할 수 있다.
발현 카세트는 또한 내부 리보솜 진입 부위(IRES) 및/또는 2A 요소를 포함할 수 있다. 시스-조절 요소에는, 비제한적으로, 프로모터, 리보스위치, 절연인자, mir-조절 요소, 전사 후 조절 요소, 조직 및 세포 유형 특이적 프로모터, 및 인핸서가 포함된다. 일부 구현예에서, ITR은 전이유전자, 예를 들어 PAH 단백질을 위한 프로모터로서 작용할 수 있다. 일부 구현예에서, ceDNA 벡터는 PAH 단백질의 발현을 조절하기 위한 추가의 구성요소, 예를 들어 PAH 단백질의 발현을 제어하고 조절하기 위한 "조절 스위치"라는 제목의 섹션에 본원에 기재된 조절 스위치를 포함하며, 목적하는 경우, ceDNA 벡터를 포함하는 세포의 제어된 세포 사멸을 가능하게 하는 사멸 스위치인 조절 스위치를 포함할 수 있다.
발현 카세트는 4000개 초과의 뉴클레오타이드, 5000개 뉴클레오타이드, 10,000개 뉴클레오타이드 또는 20,000개 뉴클레오타이드, 또는 30,000 뉴클레오타이드, 또는 40,000개 뉴클레오타이드 또는 50,000개 뉴클레오타이드, 또는 약 4000개 내지 10,000개 뉴클레오타이드, 또는 10,000개 내지 50,000개 뉴클레오타이드 사이의 임의의 범위, 또는 50,000개 초과의 뉴클레오타이드를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 50,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 75,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 10,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 1000개 내지 10,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. 일부 구현예에서, 발현 카세트는 길이가 500개 내지 5,000개 뉴클레오타이드 범위인 전이유전자를 포함할 수 있다. ceDNA 벡터는 캡시드화된 AAV 벡터의 크기 제한이 없기 때문에, 대형 발현 카세트를 전달하여 효율적인 전이유전자 발현을 제공할 수 있다. 일부 구현예에서, ceDNA 벡터에는 원핵생물 특이적 메틸화가 없다.
ceDNA 발현 카세트는, 예를 들어 수용 대상에 존재하지 않거나, 이에서 불활성이거나 불충분한 활성을 갖는 단백질을 인코딩하는 발현 가능한 외인성 서열(예를 들어, 오픈리딩프레임) 또는 전이유전자, 또는 목적하는 생물학적 또는 치료 효과를 갖는 단백질을 인코딩하는 유전자를 포함할 수 있다. 전이유전자는 결함 유전자 또는 전사체의 발현을 교정하는 기능을 할 수 있는 유전자 산물을 인코딩할 수 있다. 원칙적으로, 발현 카세트는 돌연변이로 인해 존재하지 않거나 감소된 단백질, 폴리펩타이드 또는 RNA를 인코딩하거나, 과발현될 때 치료적 유익을 전달하는 것이 본 개시내용의 범위에 속하는 것으로 간주되는 임의의 유전자를 포함할 수 있다.
발현 카세트는 임의의 전이유전자(예를 들어, PAH 단백질을 인코딩함), 예를 들어 대상에서 PKU의 치료에 유용한 PAH 단백질, 즉, 치료용 PAH 단백질을 포함할 수 있다. 본원에 기재된 개시내용의 양태에 따르면, 발현 카세트는 코돈 최적화된 전이유전자를 포함한다. 추가 구현예에 따르면, 코돈 최적화된 전이유전자는 표 1A에 제시된 핵산 서열에서 선택된다.
ceDNA 벡터는 단독으로, 또는 폴리펩타이드를 인코딩하는 핵산 또는 비코딩 핵산(예를 들어, RNAi, miR 등)뿐 아니라, 대상의 게놈에 있는 바이러스 서열, 예를 들어 HIV 바이러스 서열 등을 포함하는 핵산 서열 및 외인성 유전자와 조합으로, 대상에서 임의의 관심 PAH 단백질을 전달하고 발현시키는 데 사용될 수 있다. 바람직하게는, 본원에 개시된 ceDNA 벡터는 치료 목적을 위해(예를 들어, 의학적, 진단적 또는 수의학적 용도로) 또는 면역원성 폴리펩타이드를 위해 사용된다. 특정 구현예에서, ceDNA 벡터는 하나 이상의 폴리펩타이드, 펩타이드, 리보자임, 펩타이드 핵산, siRNA, RNAi, 안티센스 올리고뉴클레오타이드, 안티센스 폴리뉴클레오타이드, 또는 RNA(코딩 또는 비코딩; 예를 들어 siRNA, shRNA, gRNA, 마이크로RNA, 및 이들의 안티센스 대응물(예를 들어, antagoMiR)), 항체, 융합 단백질, 또는 이들의 임의의 조합을 포함하는, 대상의 임의의 관심 유전자를 발현시키는 데 유용하다.
발현 카세트는 또한 폴리펩타이드, 센스 또는 안티센스 올리고뉴클레오타이드, 또는 RNA(코딩 또는 비코딩; 예를 들어, siRNA, shRNA, gRNA, 마이크로RNA, 및 이들의 안티센스 대응물(예를 들어, antagoMiR))를 인코딩할 수 있다. 발현 카세트는 또한, β-락타마아제, β-갈락토시다아제(LacZ), 알칼리성 포스파타아제, 티미딘 키나아제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제 및 당업계에 널리 알려진 다른 것들과 같은, 실험 또는 진단 목적으로 사용되는 리포터 단백질을 인코딩하는 외인성 서열을 포함할 수 있다.
본원에 제공된 방법에 의해 생산된 PAH 단백질의 발현을 위한 ceDNA 벡터는 바람직하게는 제한 효소 소화 검정으로 측정 시, 비연속 구조라기보다는 선형 및 연속 구조이다(도 3d). 선형 및 연속 구조는 세포 엔도뉴클레아제에 의한 공격으로부터 보다 안정적일 뿐 아니라, 재조합되어 돌연변이를 유발할 가능성이 적은 것으로 여겨진다. 따라서, 선형 및 연속 구조의 ceDNA 벡터가 바람직한 구현예이다. 연속, 선형, 단일가닥 분자내 이중체 ceDNA 벡터는, AAV 캡시드 단백질을 인코딩하는 서열 없이, 공유결합으로 결합된 말단을 가질 수 있다. 이러한 ceDNA 벡터는 박테리아 기원의 원형 이중체 핵산 분자인 플라스미드(본원에 기재된 ceDNA 플라스미드 포함)와 구조적으로 구별된다. 플라스미드의 상보적 가닥은 변성 후 분리되어 2개의 핵산 분자를 생성하지만, 대조적으로, 상보적 가닥을 갖는 ceDNA 벡터는, 단일 DNA 분자이기 때문에, 변성되더라도 단일 분자로 남아있다. 일부 구현예에서, 본원에 기재된 바와 같은 ceDNA 벡터는, 플라스미드와 달리, 원핵생물 유형의 DNA 염기 메틸화 없이 생산될 수 있다. 따라서, ceDNA 벡터와 ceDNA-플라스미드는 구조(특히, 선형 대 원형)의 측면에서, 또한 이러한 상이한 목적물을 생산하고 정제하는 데 사용되는 방법(하기 참조)의 측면에서, 또한 ceDNA-플라스미드의 경우 원핵생물 유형이고 ceDNA 벡터의 경우 진핵생물 유형인 이의 DNA 메틸화의 측면에서 모두 상이하다.
플라스미드 기반 발현 벡터에 비해 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 사용하는 데에는 몇 가지 이점이 존재하며, 이러한 이점에는, 비제한적으로, 하기가 포함된다: 1) 플라스미드는 박테리아 DNA 서열을 함유하고 원핵생물 특이적 메틸화, 예를 들어 6-메틸 아데노신 및 5-메틸 시토신 메틸화에 적용되지만, 캡시드 미함유 AAV 벡터 서열은 진핵생물 기원으로 원핵생물 특이적 메틸화를 거치지 않으며; 그 결과, 캡시드 미함유 AAV 벡터는 플라스미드에 비해 염증 및 면역 반응을 유도할 가능성이 적음; 2) 플라스미드는 생산 과정 동안 내성 유전자의 존재를 필요로 하지만, ceDNA 벡터는 그렇지 않음; 3) 원형 플라스미드는 세포에의 도입 시 핵으로 전달되지 않고 세포 뉴클레아제에 의한 분해를 우회하기 위해서는 과부하가 필요하지만, ceDNA 벡터는 뉴클레아제에 대한 내성을 부여하는 바이러스성 시스-요소, 즉, ITR을 함유하고, 핵을 표적으로 하여 이에 전달되도록 설계될 수 있음. ITR 기능에 없어서는 안 될 최소 정의 요소를, Rep-결합 부위(RBS; AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60))와 말단 분해 부위(TRS; AAV2의 경우 5'-AGTTGG-3'(서열번호 64)), 그리고 헤어핀 형성을 가능하게 하는 가변 회문구조 서열; 및 4) ceDNA 벡터가 T세포 매개 면역반응을 유발하는 톨유사(Toll-like) 수용체 패밀리의 멤버와 결합하는 것으로 보고된 원핵생물 유래 플라스미드에서 종종 발견되는 CpG 디뉴클레오타이드의 과대표현(over-representation)을 갖지 않는 것이라고 가정하였다. 대조적으로, 본원에 개시된 캡시드 미함유 AAV 벡터로의 형질도입은, 다양한 전달 시약을 사용하여 통상적인 AAV 비리온으로 형질도입하기 곤란한 세포 및 조직 유형을 효율적으로 표적화할 수 있다.
IV. 역말단반복서열(ITR)
본원에 개시된 바와 같은, PAH 단백질의 발현을 위한 ceDNA 벡터는 2개의 역말단반복서열(ITR) 사이에 배치된 핵산, 예를 들어 전이유전자 또는 이종 핵산 서열(예를 들어, 코돈 최적화된 이종 핵산 서열)을 함유하며, 여기서 ITR 서열은 비대칭인 ITR 쌍, 또는 대칭 또는 실질적으로 대칭인 ITR 쌍(이러한 용어는 본원에 정의된 바와 같음)일 수 있는 ceDNA 벡터가 본원에 정의된다. 본원에 개시된 바와 같은 ceDNA 벡터는, (i) 적어도 하나의 WT ITR과 적어도 하나의 변형된 AAV 역말단반복서열(mod-ITR)(예를 들어, 비대칭인 변형된 ITR); (ii) 2개의 변형된 ITR(여기서 mod-ITR 쌍은 서로에 대해 상이한 3차원 공간 구성을 가짐)(예를 들어, 비대칭인 변형된 ITR), 또는 (iii) 대칭 또는 실질적으로 대칭인 WT-WT ITR 쌍(여기서 각각의 WT-ITR은 동일한 3차원 공간 구성을 가짐), 또는 (iv) 대칭 또는 실질적으로 대칭인 변형된 ITR 쌍(여기서 각각의 mod-ITR은 동일한 3차원 공간 구성을 가짐) 중 임의의 것에서 선택되는 ITR 서열을 포함할 수 있으며, 여기서 본 개시내용의 방법은, 비제한적으로, 리포좀 나노입자 전달 시스템과 같은 전달 시스템을 추가로 포함할 수 있다.
일부 구현예에서, ITR 서열은 척추동물을 감염시키는 파르보바이러스아과와 곤충을 감염시키는 덴소바이러스아과의 2개의 아과를 포함하는 파르보바이러스과의 바이러스에서 유래할 수 있다. 파르보바이러스아과(파르보바이러스로 지칭됨)에는, 대부분의 조건 하에서, 생산적인 감염을 위해 아데노바이러스 또는 헤르페스바이러스와 같은 헬퍼 바이러스로의 동시감염을 필요로 하는 구성원인 데펜도바이러스속이 포함된다. 데펜도바이러스속에는, 통상적으로 인간(예를 들어, 혈청형 2, 3A, 3B, 5 및 6) 또는 영장류(예를 들어, 혈청형 1 및 4)를 감염시키는 아데노연관바이러스(AAV), 및 다른 온혈동물을 감염시키는 관련 바이러스(예를 들어, 소, 개, 말 및 양 아데노연관바이러스)가 포함된다. 파르보바이러스 및 파르보바이러스과의 다른 구성원은 일반적으로 문헌[Kenneth I. Berns, "Parvoviridae: The Viruses and Their Replication", Chapter 69 in FIELDS VIROLOGY (3d Ed. 1996)]에 기재되어 있다.
본원의 명세서 및 실시예에 예시된 ITR이 AAV2 WT-ITR이지만, 당업자는 상기 언급된 바와 같이 임의의 알려진 파르보바이러스, 예를 들어 AAV(예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV 5, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAVrh8, AAVrh10, AAV-DJ 및 AAV-DJ8 게놈; 예를 들어 NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261)와 같은 데펜도바이러스 유래의 ITR, 키메라 ITR, 또는 임의의 합성 AAV 유래의 ITR을 사용할 수 있다는 것을 알고 있다. 일부 구현예에서, AAV는 온혈동물, 예를 들어 조류(AAAV), 소(BAAV), 개, 말 및 양 아데노연관바이러스를 감염시킬 수 있다. 일부 구현예에서, ITR은 B19 파르보바이러스(GenBank 수탁번호: NC 000883), 마우스 유래 미세생쥐바이러스(MVM)(GenBank 수탁번호 NC 001510); 거위 파르보바이러스(GenBank 수탁번호: NC 001701); 뱀 파르보바이러스 1(GenBank 수탁번호 NC 006148)에서 유래한 것이다. 일부 구현예에서, 본원에 논의된 바와 같이, 5' WT-ITR은 하나의 혈청형에서 유래할 수 있고, 3' WT-ITR은 상이한 혈청형에서 유래할 수 있다.
당업자는, ITR 서열이 전형적으로 T-형 또는 Y-형 헤어핀 구조인 이중가닥 홀리데이 접합의 공통 구조를 갖고, 여기서 각각의 WT-ITR은 보다 큰 회문구조 아암(A-A')에 삽입된 2개의 회문구조 아암 또는 루프(B-B' 및 C-C'), 및 단일가닥 D 서열로 형성된다(여기서, 이러한 회문구조 서열의 순서는 ITR의 플립 또는 플랍 배향을 정의함)는 것을 알고 있다. 예를 들어, 상이한 AAV 혈청형(AAV1 내지 AAV6) 유래의 ITR의 구조 분석 및 서열 비교는 문헌[Grimm et al., J. Virology, 2006; 80(1); 426-439]; 문헌[Yan et al., J. Virology, 2005; 364-379]; 문헌[Duan et al., Virology 1999; 261; 8-14]에 기재된 것을 참조한다. 당업자는, 본원에 제공된 예시적인 AAV2 ITR 서열에 기반하여 ceDNA 벡터 또는 ceDNA-플라스미드에 사용되는 임의의 AAV 혈청형 유래의 WT-ITR 서열을 용이하게 결정할 수 있다. 예를 들어, 다른 혈청형 유래의 좌측 ITR에 대한 AAV2의 좌측 ITR의 동일성%: AAV-1(84%), AAV-3(86%), AAV-4(79%), AAV-5(58%), AAV-6(좌측 ITR)(100%) 및 AAV-6(우측 ITR)(82%)을 보여주는, 문헌[Grimm et al., J. Virology, 2006; 80(1); 426-439]에 기재된 상이한 AAV 혈청형 유래 ITR의 서열 비교(AAV1 내지 AAV6, 및 조류 AAV(AAAV) 및 소 AAV(BAAV)) 참조.
A. 대칭인 ITR
일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 핵산 서열(예를 들어, 본원에 기재된 바와 같은 발현 카세트) 및 제2 AAV ITR을 포함하고, 여기서 제1 ITR(5' ITR)과 제2 ITR(3' ITR)은 서로에 대해 대칭이거나 실질적으로 대칭이며, 즉, ceDNA 벡터는, 이의 구조가 기하학적 공간에서 동일한 형상이거나, 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 갖도록, 대칭인 3차원 공간 구성을 갖는 ITR 서열을 포함할 수 있다. 이러한 구현예에서, 대칭인 ITR 쌍 또는 실질적으로 대칭인 ITR 쌍은, 야생형 ITR이 아닌 변형된 ITR(예를 들어, mod-ITR)일 수 있다. mod-ITR 쌍은 야생형 ITR로부터 하나 이상의 변형을 갖고, 서로 역 보체(역상)인 동일한 서열을 가질 수 있다. 대안적인 구현예에서, 변형된 ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 변형된 ITR 쌍은 상이한 서열을 갖지만, 상응하거나 동일한 대칭인 3차원 형상을 가질 수 있다.
(i) 야생형 ITR
일부 구현예에서, 대칭인 ITR 또는 실질적으로 대칭인 ITR은 본원에 기재된 바와 같은 야생형(WT-ITR)이다. 즉, 2개의 ITR은 야생형 서열을 갖지만, 반드시 동일한 AAV 혈청형의 WT-ITR일 필요는 없다. 즉, 일부 구현예에서, 하나의 WT-ITR은 하나의 AAV 혈청형에서 유래할 수 있고, 다른 하나는 WT-ITR은 상이한 AAV 혈청형에서 유래할 수 있다. 이러한 구현예에서, WT-ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 이들은 대칭인 3차원 공간 구성을 여전히 유지하면서, 하나 이상의 보존적 뉴클레오타이드 변형을 가질 수 있다.
따라서, 본원에 개시된 바와 같이, ceDNA 벡터는 서로 역 보체(역상)이거나, 또는 대안적으로, 서로에 대해 실질적으로 대칭이며, 즉, WT-ITR 쌍이 대칭인 3차원 공간 구성을 갖는, 2개의 플랭킹 야생형 역말단반복서열(WT-ITR) 사이에 배치된 핵산 서열, 예를 들어 전이유전자 또는 이종 핵산 서열을 함유한다. 일부 구현예에서, 야생형 ITR 서열(예를 들어, AAV WT-ITR)은 기능성 Rep 결합 부위(RBS; 예를 들어 AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3', 서열번호 60)와 기능성 말단 분해 부위(TRS; 예를 들어 5'-AGTT-3', 서열번호 62)를 포함한다.
하나의 양태에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 2개의 WT 역말단반복서열(WT-ITR)(예를 들어, AAV WT-ITR) 사이에 작동적으로 배치된 핵산, 예를 들어 이종 핵산을 인코딩하는 벡터 폴리뉴클레오타이드에서 수득될 수 있다. 즉, 2개의 ITR은 야생형 서열을 갖지만, 반드시 동일한 AAV 혈청형의 WT-ITR일 필요는 없다. 즉, 일부 구현예에서, 하나의 WT-ITR은 하나의 AAV 혈청형에서 유래할 수 있고, 다른 하나는 WT-ITR은 상이한 AAV 혈청형에서 유래할 수 있다. 이러한 구현예에서, WT-ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 이들은 대칭인 3차원 공간 구성을 여전히 유지하면서, 하나 이상의 보존적 뉴클레오타이드 변형을 가질 수 있다. 일부 구현예에서, 5' WT-ITR은 하나의 AAV 혈청형에서 유래한 것이고, 3' WT-ITR은 동일하거나 상이한 AAV 혈청형에서 유래한 것이다. 일부 구현예에서, 5' WT-ITR과 3' WT-ITR은 서로 거울상이며, 즉, 이들은 대칭이다. 일부 구현예에서, 5' WT-ITR과 3' WT-ITR은 동일한 AAV 혈청형에서 유래한 것이다.
WT ITR은 널리 알려져 있다. 하나의 구현예에서, 2개의 ITR은 동일한 AAV2 혈청형에서 유래한 것이다. 특정 구현예에서, 다른 혈청형에서 유래한 WT를 사용할 수 있다. 다수의 상동인 혈청형, 예를 들어 AAV2, AAV4, AAV6, AAV8이 존재한다. 하나의 구현예에서, 거의 상동인 ITR(예를 들어, 유사한 루프 구조를 갖는 ITR)이 사용될 수 있다. 또 다른 구현예에서, 보다 다양한 AAV WT ITR, 예를 들어 AAV2와 AAV5가 사용될 수 있으며, 또 다른 구현예에서는, 실질적으로 WT인, 즉, WT의 기본 루프 구조를 갖지만, 특성을 변경시키거나 이에 영향을 미치지 않는 일부 보존적 뉴클레오타이드 변경을 갖는 ITR이 사용될 수도 있다. 동일한 바이러스 혈청형 유래의 WT-ITR이 사용되는 경우, 하나 이상의 조절 서열이 추가로 사용될 수 있다. 특정 구현예에서, 조절 서열은 ceDNA의 활성, 예를 들어 인코딩된 PAH 단백질의 발현을 조절할 수 있는 조절 스위치이다.
일부 구현예에서, 본원에 기재된 기술의 하나의 양태는 PAH 단백질의 발현을 위한 ceDNA 벡터에 관한 것으로, 여기서 ceDNA 벡터는 2개의 야생형 역말단반복서열(WT-ITR) 사이에 작동 가능하게 배치된 PAH 단백질을 인코딩하는 적어도 하나의 뉴클레오타이드 서열, 예를 들어 이종 핵산 서열을 포함하고, 여기서 WT-ITR은 동일한 혈청형, 상이한 혈청형에서 유래하거나, 또는 서로에 대해 실질적으로 대칭일 수 있다(즉, 기하학적 공간에서의 구조가 동일한 형상이 되도록 대칭인 3차원 공간 구성을 갖거나, 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 가짐). 일부 구현예에서, 대칭인 WT-ITR은 기능성 말단 분해 부위와 Rep 결합 부위를 포함한다. 일부 구현예에서, 핵산, 예를 들어 이종 핵산 서열은 전이유전자를 인코딩하고, 여기서 벡터는 바이러스 캡시드 내에 존재하지 않는다.
일부 구현예에서, WT-ITR은 동일하지만, 서로 역 보체이다. 예를 들어, 5' ITR에서 서열 AACG은 상응하는 부위의 3' ITR에서 CGTT(즉, 역 보체)일 수 있다. 하나의 예에서, 5' WT-ITR 센스 가닥은 ATCGATCG(서열번호 605)의 서열을 포함하고, 상응하는 3' WT-ITR 센스 가닥은 CGATCGAT(서열번호 606)(즉, ATCGATCG의 역 보체(서열번호 607))의 서열을 포함한다. 일부 구현예에서, WT-ITR ceDNA는 말단 분해 부위와 복제 단백질 결합 부위(RPS)(때때로 복제성 단백질 결합 부위로 지칭됨), 예를 들어 Rep 결합 부위를 추가로 포함한다.
WT-ITR을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 예시적인 WT-ITR 서열은 본원의 표 3에 제시되어 있으며, 이는 WT-ITR의 쌍(5' WT-ITR과 3' WT-ITR)으로 나타나 있다.
일부 구현예에서, 플랭킹 WT-ITR은 동일하고 서로에 대해 대칭이다. 일부 다른 구현예에서, 플랭킹 WT-ITR은 서로에 대해 실질적으로 대칭이다. 이러한 구현예에서, 5' WT-ITR은 AAV의 하나의 혈청형에서 유래할 수 있고, 3' WT-ITR은 AAV의 상이한 혈청형에서 유래할 수 있기 때문에, WT-ITR은 동일한 역 보체가 아니다. 예를 들어, 5' WT-ITR은 AAV2에서 유래할 수 있고, 3' WT-ITR은 상이한 혈청형(예를 들어, AAV1, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12)에서 유래할 수 있다. 일부 구현예에서, WT-ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, 뱀 파르보바이러스(예를 들어, 공비단뱀 파르보바이러스), 소 파르보바이러스, 염소 파르보바이러스, 조류 파르보바이러스, 개 파르보바이러스, 말 파르보바이러스, 새우 파르보바이러스, 돼지 파르보바이러스 또는 곤충 AAV 중 임의의 것에서 선택되는 2개의 상이한 파르보바이러스에서 선택될 수 있다. 일부 구현예에서, WT ITR의 이러한 조합은 AAV2와 AAV6에서 유래한 WT-ITR의 조합이다. 하나의 구현예에서, 실질적으로 대칭인 WT-ITR은, 하나가 다른 하나의 ITR에 대해 역상인 경우, 적어도 90% 동일, 적어도 95% 동일, 적어도 96%...97%... 98%... 99%....99.5%(및 이러한 동일성% 사이의 모든 지점 포함) 동일하며, 동일한 대칭인 3차원 공간 구성을 갖는다. 일부 구현예에서, WT-ITR 쌍은 대칭인 3차원 공간 구성, 예를 들어 A, C-C', B-B' 및 D 아암의 동일한 3D 구성을 갖기 때문에 실질적으로 대칭이다. 하나의 구현예에서, 실질적으로 대칭인 WT-ITR 쌍은 다른 하나에 대해 역상이며, 서로 적어도 95% 동일, 적어도 96%...97%... 98%... 99%....99.5% 동일(이러한 동일성% 사이의 모든 지점 포함)하고, 하나의 WT-ITR은 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60)의 Rep-결합 부위(RBS)와 말단 분해 부위(trs)를 보유한다. 일부 구현예에서, 실질적으로 대칭인 WT-ITR 쌍은 서로에 대해 역상이며, 서로 적어도 95% 동일, 적어도 96%...97%... 98%... 99%....99.5% 동일(이러한 동일성% 사이의 모든 지점 포함)하고, 하나의 WT-ITR은 5'-GCGCGCTCGCTCGCTC-3' (서열번호 60)의 Rep-결합 부위(RBS)와 말단 분해 부위(trs), 및 헤어핀 2차 구조 형성을 가능하게 하는 가변 회문구조 서열을 보유한다. 상동성은 기본 설정의 BLAST(Basic Local Alignment Search Tool)(BLASTN)와 같은 당업계에 널리 알려진 표준 수단에 의해 결정될 수 있다.
일부 구현예에서, ITR의 구조 요소는 ITR과 큰 Rep 단백질(예를 들어, Rep 78 또는 Rep 68)의 기능적 상호작용에 관여하는 임의의 구조 요소일 수 있다. 특정 구현예에서, 구조 요소는 ITR과 큰 Rep 단백질의 상호작용에 대한 선택성을 제공하며, 즉, 적어도 부분적으로 어느 Rep 단백질이 ITR과 기능적으로 상호작용하는 지를 결정한다. 다른 구현예에서, 구조 요소는, Rep 단백질이 ITR에 결합될 때, 큰 Rep 단백질과 물리적으로 상호작용한다. 각각의 구조 요소는, 예를 들어 ITR의 2차 구조, ITR의 핵산 서열, 둘 이상의 요소 사이의 간격, 또는 상기 중 임의의 것의 조합일 수 있다. 하나의 구현예에서, 구조 요소는 A 및 A' 아암, B 및 B' 아암, C 및 C' 아암, D 아암, Rep 결합 부위(RBE) 및 RBE'(즉, 상보적 RBE 서열), 및 말단 분해 부위(trs)로 이루어지는 군에서 선택된다.
단지 예로서, 표 2는 WT-ITR의 예시적인 조합을 나타낸다.
[표 2] 동일한 혈청형 또는 상이한 혈청형, 또는 상이한 파르보바이러스 유래의 WT-ITR의 예시적인 조합. 표시된 순서는 ITR 위치의 위치를 나타내지 않으며, 예를 들어 "AAV1, AAV2"는, ceDNA가 5' 위치에 WT-AAV1 ITR을 3' 위치에 WT-AAV2 ITR을 포함할 수 있거나, 그 반대로, 5' 위치에 WT-AAV2 ITR을 3' 위치WT-AAV1 ITR을 포함할 수 있음을 나타낸다. 약어: AAV 혈청형 1(AAV1), AAV 혈청형 2(AAV2), AAV 혈청형 3(AAV3), AAV 혈청형 4(AAV4), AAV 혈청형 5(AAV5), AAV 혈청형 6(AAV6), AAV 혈청형 7(AAV7), AAV 혈청형 8(AAV8), AAV 혈청형 9(AAV9), AAV 혈청형 10(AAV10), AAV 혈청형 11(AAV11) 또는 AAV 혈청형 12(AAV12); AAVrh8, AAVrh10, AAV-DJ 및 AAV-DJ8 게놈(예를 들어, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261), 온혈동물 유래의 ITR(조류 AAV(AAAV), 소 AAV(BAAV), 개, 말 및 양 AAV), B19 파르보바이러스 유래의 ITR(GenBank 수탁번호: NC 000883), 마우스 유래 미세생쥐바이러스(MVM)(GenBank 수탁번호: NC 001510); 거위: 거위 파르보바이러스(GenBank 수탁번호: NC 001701); 뱀: 뱀 파르보바이러스 1(GenBank 수탁번호: NC 006148).
[표 2]
Figure pct00005
Figure pct00006
Figure pct00007
단지 예로서, 표 3은 일부 상이한 AAV 혈청형 유래의 예시적인 WT-ITR의 서열을 보여준다.
[표 3]
Figure pct00008
일부 구현예에서, WT-ITR 서열의 핵산 서열은 변형될 수 있으며(예를 들어, 1개, 2개, 3개, 4개 또는 5개, 또는 그 이상의 뉴클레오타이드, 또는 그 안의 임의의 범위의 뉴클레오타이드 변형), 여기서 변형은 상보적 뉴클레오타이드로, 예를 들어 C의 경우 G, 및 그 반대로, 및 A의 경우 T, 및 그 반대로의 치환이다.
본 개시내용의 특정 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 서열번호 1, 서열번호 2, 서열번호 5 내지 서열번호 14 중 어느 하나에서 선택되는 핵산 서열로 이루어진 WT-ITR을 갖지 않는다. 본 개시내용의 대안적인 구현예에서, ceDNA 벡터가 서열번호 1, 서열번호 2, 서열번호 5 내지 서열번호 14 중 어느 하나에서 선택되는 핵산 서열을 포함하는 WT-ITR을 갖는 경우, 플랭킹 ITR은 또한 WT이고, ceDNA 벡터는, 예를 들어 본원 및 국제 특허 출원 PCT/US18/49996(예를 들어, PCT/US18/49996(이는 그 전문이 본원에 참조로 인용됨)의 표 11 참조)에 개시된 바와 같은 조절 스위치를 포함한다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 개시된 바와 같은 조절 스위치와, 서열번호 1, 2, 5 내지 14 중 어느 하나에서 선택되는 핵산 서열을 갖는 선택된 WT-ITR을 포함한다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 작동 가능한 RBE, trs 및 RBE´ 부분을 보유하는 WT-ITR 구조를 포함할 수 있다. 도 1a도 1b는, 예시 목적으로 야생형 ITR을 사용하여, ceDNA 벡터의 야생형 ITR 구조 부분 내에서 trs 부위의 작동을 위한 하나의 가능한 메커니즘을 보여준다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 Rep-결합 부위(예를 들어, RBS; AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60))와 말단 분해 부위(TRS; 예를 들어, 5'-AGTT(서열번호 62))를 포함하는 하나 이상의 기능성 WT-ITR 폴리뉴클레오타이드 서열을 함유한다. 일부 구현예에서, 적어도 하나의 WT-ITR은 기능성이다. 대안적인 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터가 서로 실질적으로 대칭인 2개의 WT-ITR을 포함하는 경우, 적어도 하나의 WT-ITR은 기능성이고, 적어도 하나의 WT-ITR은 비기능성이다.
B. 비대칭인 ITR 쌍 또는 대칭인 ITR 쌍을 포함하는 ceDNA 벡터에 대한 변형된 ITR(mod-ITR) 전반
본원에 논의된 바와 같이, PAH 단백질의 발현을 위한 ceDNA 벡터는 대칭인 ITR 쌍 또는 비대칭인 ITR 쌍을 포함할 수 있다. 두 경우 모두, ITR 중 하나 또는 둘 모두는 변형된 ITR일 수 있으며, 여기서 차이점은, 첫 번째 경우(즉, 대칭인 mod-ITR), mod-ITR은 동일한 3차원 공간 구성을 갖지만(즉, 동일한 A-A', C-C' 및 B-B' 아암 구성을 가짐), 두 번째 경우(즉, 비대칭인 mod-ITR), mod-ITR은 상이한 3차원 공간 구성을 갖는다(즉, 상이한 A-A', C-C' 및 B-B' 아암 구성을 가짐)는 점이다.
일부 구현예에서, 변형된 ITR은 야생형 ITR 서열(예를 들어, AAV ITR)과 비교하여 결실, 삽입 및/또는 치환에 의해 변형된 ITR이다. 일부 구현예에서, ceDNA 벡터에서 ITR 중 적어도 하나는 기능성 Rep 결합 부위(RBS; 예를 들어 AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3', 서열번호 60)와 기능성 말단 분해 부위(TRS; 예를 들어 5'-AGTT-3', 서열번호 62)를 포함한다. 하나의 구현예에서, ITR 중 적어도 하나는 비기능성 ITR이다. 하나의 구현예에서, 상이한 또는 변형된 ITR은 각각 상이한 혈청형 유래의 야생형 ITR이 아니다.
ITR의 특정 변경 및 돌연변이가 본원에 상세하게 설명되어 있지만, ITR의 맥락에서, "변경된" 또는 "돌연변이된" 또는 "변형된"은 뉴클레오타이드가 야생형, 참조 또는 본래 ITR 서열에 비해 삽입, 결실 및/또는 치환된 것을 나타낸다. 변경된 또는 돌연변이된 ITR은 조작된 ITR일 수 있다. 본원에 사용된 "조작된"은, 인간의 손에 의해 조작된 양태를 나타낸다. 예를 들어, 폴리펩타이드는, 폴리펩타이드의 적어도 하나의 양태, 예를 들어 이의 서열이, 자연에 존재하는 양태와 상이하도록 인간의 손에 의해 조작된 경우, "조작된" 것으로 간주된다.
일부 구현예에서, mod-ITR은 합성일 수 있다. 하나의 구현예에서, 합성 ITR은 하나 초과의 AAV 혈청형에서 유래한 ITR 서열을 기반으로 한다. 또 다른 구현예에서, 합성 ITR은 AAV 기반 서열을 포함하지 않는다. 또 다른 구현예에서, 합성 ITR은 AAV 유래 서열을 갖지 않거나 일부만 갖지만, 상기 기재된 ITR 구조를 보존한다. 일부 양태에서, 합성 ITR은 야생형 Rep 또는 특정 혈청형의 Rep와 우선적으로 상호작용할 수 있거나, 또는 일부 경우에, 야생형 Rep에 의해 인식되지 않고 돌연변이된 Rep에 의해서만 인식될 수 있다.
당업자는 알려진 수단을 통해 다른 혈청형에서 상응하는 서열을 결정할 수 있다. 예를 들어, A, A', B, B', C, C' 또는 D 영역에 변경이 존재하는 지 여부를 결정하고, 또 다른 혈청형에서 상응하는 영역을 결정한다. 기본 설정의 BLAST®(Basic Local Alignment Search Tool) 또는 다른 상동성 정렬 프로그램을 사용하여 상응하는 서열을 결정할 수 있다. 본 개시내용은 나아가 상이한 AAV 혈청형의 조합인 mod-ITR, 즉, 하나의 mod-ITR은 하나의 AAV 혈청형에서 유래할 수 있고 다른 하나의 mod-ITR은 상이한 혈청형에서 유래할 수 있는 mod-ITR을 포함하는 ceDNA 벡터의 집단 및 복수의 ceDNA 벡터를 제공한다. 이론에 구애됨 없이, 하나의 구현예에서, ceDNA 벡터의 하나의 ITR은 AAV2 ITR 서열에서 유래하거나 이를 기반으로 할 수 있고, 다른 하나의 ITR은 AAV 혈청형1(AAV1), AAV 혈청형 4(AAV4), AAV 혈청형 5(AAV5), AAV 혈청형 6(AAV6), AAV 혈청형 7(AAV7), AAV 혈청형 8(AAV8), AAV 혈청형 9(AAV9), AAV 혈청형 10(AAV10), AAV 혈청형 11(AAV11) 또는 AAV 혈청형 12(AAV12) 중 임의의 하나 이상의 ITR 서열에서 유래하거나 이를 기반으로 할 수 있다.
임의의 파르보바이러스 ITR이 ITR로서 또는 변형을 위한 기본 ITR로서 사용될 수 있다. 바람직하게는, 파르보바이러스는 데펜도바이러스이다. 더욱 바람직하게는, AAV이다. 선택된 혈청형은 혈청형의 조직 친화성을 기반으로 할 수 있다. AAV2는 폭넓은 조직 친화성을 갖고, AAV1은 뉴런 및 골격근을 우선적으로 표적화하고, AAV5는 뉴런, 망막색소 상피세포 및 광수용체를 우선적으로 표적화한다. AAV6은 골격근 및 폐를 우선적으로 표적화한다. AAV8은 간, 골격근, 심장 및 췌장 조직을 우선적으로 표적화한다. AAV9는 간, 골격 및 폐 조직을 우선적으로 표적화한다. 하나의 구현예에서, 변형된 ITR은 AAV2 ITR을 기반으로 한다.
보다 구체적으로, 특정 대형 Rep 단백질과 기능적으로 상호작용하는 구조 요소의 능력은 구조 요소의 변형을 통해 변경될 수 있다. 예를 들어, 구조 요소의 핵산 서열은 ITR의 야생형 서열과의 비교를 통해 변형시킬 수 있다. 하나의 구현예에서, ITR의 구조 요소(예를 들어, A 아암, A' 아암, B 아암, B' 아암, C 아암, C' 아암, D 아암, RBE, RBE' 및 trs)는 제거되어, 상이한 파르보바이러스의 야생형 구조 요소로 대체될 수 있다. 예를 들어, 대체 구조는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, 뱀 파르보바이러스(예를 들어, 공비단뱀 파르보바이러스), 소 파르보바이러스, 염소 파르보바이러스, 조류 파르보바이러스, 개 파르보바이러스, 말 파르보바이러스, 새우 파르보바이러스, 돼지 파르보바이러스 또는 곤충 AAV에서 유래할 수 있다. 예를 들어, ITR은 AAV2 ITR일 수 있고, A 또는 A' 아암, 또는 RBE는 AAV5의 구조 요소로 대체될 수 있다. 또 다른 예에서, ITR은 AAV5 ITR일 수 있고, C 또는 C' 아암, RBE, 및 trs는 AAV2의 구조 요소로 대체될 수 있다. 또 다른 예에서, AAV ITR은 B 및 B' 아암이 AAV2 ITR B 및 B' 아암으로 대체된 AAV5 ITR일 수 있다.
단지 예로서, 표 4는 변형된 ITR 영역 내 적어도 하나의 뉴클레오타이드의 예시적인 변형(예를 들어, 결실, 삽입 및/또는 치환)을 나타내며, 여기서 X는 상응하는 야생형 ITR에 대한 해당 섹션에서의 적어도 하나의 핵산의 변형(예를 들어, 결실, 삽입 및/또는 치환)을 나타낸다. 일부 구현예에서, C 및/또는 C' 및/또는 B 및/또는 B'의 임의의 영역 내 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 적어도 하나의 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 보유한다. 예를 들어, 변형이 단일 아암 ITR(예를 들어, 단일 C-C' 아암 또는 단일 B-B' 아암), 또는 변형된 C-B' 아암 또는 C'-B 아암, 또는 적어도 하나의 절단된 아암(예를 들어, 절단된 C-C' 아암 및/또는 절단된 B-B' 아암)을 갖는 2개의 아암 ITR 중 임의의 것을 생성하는 경우, 적어도 단일 아암, 또는 2개의 아암 ITR 중 적어도 하나의 아암(여기서 하나의 아암은 절단될 수 있음)은 적어도 하나의 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 보유한다. 일부 구현예에서, 절단된 C-C' 아암 및/또는 절단된 B-B' 아암은 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 갖는다.
[표 4]
Figure pct00009
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 mod-ITR은 본원에 개시된 바와 같은 비대칭인 ITR 쌍 또는 대칭인 mod-ITR 쌍을 포함하며, 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A'와 C 사이, C와 C' 사이, C'와 B 사이, B와 B' 사이, 및 B'와 A 사이에서 선택되는 영역 중 임의의 하나 이상에서의 적어도 하나의 뉴클레오타이드의 변형을 포함할 수 있다. 일부 구현예에서, C 또는 C' 또는 B 또는 B' 영역 내 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 여전히 스템-루프의 말단 루프를 보존한다. 일부 구현예에서, C 및 C' 및/또는 B 및 B' 영역 내 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 적어도 하나의 말단 루프에 3개의 순차적 T 뉴클레오타이드(즉, TTT)를 보유한다. 대안적인 구현예에서, C와 C' 사이 및/또는 B와 B' 사이의 적어도 하나의 뉴클레오타이드의 임의의 변형(예를 들어, 결실, 삽입 및/또는 치환)은, 적어도 하나의 말단 루프에 3개의 순차적 A 뉴클레오타이드(즉, AAA)를 보유한다. 일부 구현예에서, 본원에 사용하기 위한 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A', A 및/또는 D에서 선택되는 영역 중 임의의 하나 이상에서의 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용되는 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용하기 위한 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A' 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용되는 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 A 및/또는 A' 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다. 예를 들어, 일부 구현예에서, 본원에 사용되는 변형된 ITR은 표 4에 제시된 변형의 조합 중 어느 하나, 및 또한 D 영역 내 적어도 하나의 뉴클레오타이드 변형(예를 들어, 결실, 삽입 및/또는 치환)을 포함할 수 있다.
하나의 구현예에서, 구조 요소의 뉴클레오타이드 서열을 변형시켜(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 이상(또는 상기 제시된 개수 내 임의의 범위)의 뉴클레오타이드를 변형시켜) 변형된 구조 요소를 생성할 수 있다. 하나의 구현예에서, ITR에 대한 특정 변형은 본원에 예시된 것(예를 들어, 서열번호 3, 4, 15 내지 47, 101 내지 116 또는 165 내지 187), 또는 2018년 12월 6일자 출원된 PCT/US2018/064242의 도 7a 및 도 7b에 제시된 것이다(예를 들어, PCT/US2018/064242의 서열번호 97 및 98, 101 내지 103, 105 내지 108, 111 및 112, 117 내지 134, 545 내지 54). 일부 구현예에서, ITR을 변형시킬 수 있다(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 이상(또는 상기 제시된 개수 내 임의의 범위)의 뉴클레오타이드를 변형시킴). 다른 구현예에서, ITR은 서열번호 3, 서열번호 4, 서열번호 15 내지 서열번호 47, 서열번호 101 내지 서열번호 116 또는 서열번호 165 내지 서열번호 187의 변형된 ITR 중 하나, 또는 서열번호 3, 서열번호 4, 서열번호 15 내지 서열번호 47, 서열번호 101 내지 서열번호 116 또는 서열번호 165 내지 서열번호 187의 A-A' 아암의 RBE 함유 섹션, 및 C-C' 및 B-B' 아암, 또는 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2 내지 표 9(즉, 서열번호 110 내지 서열번호 112, 서열번호 115 내지 서열번호 190, 서열번호 200 내지 서열번호 468)에 제시된 바와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 그 이상의 서열 동일성을 가질 수 있다.
일부 구현예에서, 변형된 ITR은, 예를 들어 특정 아암의 전부, 예를 들어 A-A' 아암의 전부 또는 일부, 또는 B-B' 아암의 전부 또는 일부, 또는 C-C' 아암의 전부 또는 일부의 제거 또는 결실, 또는 대안적으로, 스템(예를 들어, 단일 아암)을 캡핑하는 최종 루프가 여전히 존재하는 한, 루프의 스템을 형성하는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다(예를 들어, 2018년 12월 6일자 출원된 국제 특허 출원 PCT/US2018/064242(이는 그 전문이 본원에 참조로서 인용됨)의 도 7a의 ITR-21 참조). 일부 구현예에서, 변형된 ITR은 B-B' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다. 일부 구현예에서, 변형된 ITR은 C-C' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다(예를 들어, 2018년 12월 6일자 출원된 국제 특허 출원 PCT/US2018/064242(이는 그 전문이 본원에 참조로서 인용됨)의 도 3b의 ITR-1 또는 도 7a의 ITR-45 참조). 일부 구현예에서, 변형된 ITR은 C-C' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거, 및 B-B' 아암으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 그 이상의 염기쌍의 제거를 포함할 수 있다. 염기쌍의 제거의 임의의 조합이 고려되며, 예를 들어 C-C' 아암에서 6개의 염기쌍이 제거되고 B-B' 아암에서 2개의 염기쌍이 제거될 수 있다. 예시적인 예로서, 도 3b는, C 부분과 C' 부분 각각에서 적어도 7개의 염기쌍 결실, C 영역과 C' 영역 사이의 루프에서 뉴클레오타이드의 치환, 및 변형된 ITR이 2개의 아암을 포함하며 이 중 적어도 하나의 아암(예를 들어, C-C')이 절단되도록 B 영역과 B' 영역 각각에서의 적어도 하나의 염기쌍 결실을 갖는 예시적인 변형된 ITR을 보여준다. 일부 구현예에서, 변형된 ITR은 또한 B-B' 아암이 또한 WT ITR에 비해 절단되도록 B 영역과 B' 영역 각각에서의 적어도 하나의 염기쌍 결실을 포함한다.
일부 구현예에서, 변형된 ITR은 전장 야생형 ITR 서열에 비해 1개 내지 50개(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개 또는 50개)의 뉴클레오타이드 결실을 가질 수 있다. 일부 구현예에서, 변형된 ITR은 전장 WT ITR 서열에 비해 1개 내지 30개의 뉴클레오타이드 결실을 가질 수 있다. 일부 구현예에서, 변형된 ITR은 전장 야생형 ITR 서열에 비해 2개 내지 20개의 뉴클레오타이드 결실을 갖는다.
일부 구현예에서, 변형된 ITR은, DNA 복제(예를 들어, Rep 단백질에 의한 RBE에의 결합, 또는 말단 분해 부위에서의 닉킹)를 방해하지 않도록, A 또는 A' 영역의 RBE 함유 부분에서 임의의 뉴클레오타이드 결실을 함유하지 않는다. 일부 구현예에서, 본원에의 사용을 위해 포함된 변형된 ITR은 본원에 기재된 바와 같은 B, B', C, 및/또는 C 영역에 하나 이상의 결실을 갖는다.
일부 구현예에서, 대칭인 ITR 쌍 또는 비대칭인 ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터는, 본원에 개시된 바와 같은 조절 스위치와, 서열번호 3, 4, 15 내지 47, 101 내지 116 또는 165 내지 187로 이루어지는 군 중 어느 하나에서 선택되는 뉴클레오타이드 서열을 갖는 선택된 적어도 하나의 변형된 ITR을 포함한다.
또 다른 구현예에서, 구조 요소의 구조는 변형될 수 있다. 예를 들어, 구조 요소는 스템의 높이 및/또는 루프 내 뉴클레오타이드 수가 변경된다. 예를 들어, 스템의 높이는 약 2개, 3개, 4개, 5개, 6개, 7개, 8개 또는 9개 뉴클레오타이드 또는 그 이상, 또는 상기 개수 내 임의의 범위의 뉴클레오타이드일 수 있다. 하나의 구현예에서, 스템의 높이는 약 5개 뉴클레오타이드 내지 약 9개 뉴클레오타이드일 수 있으며, Rep와 기능적으로 상호작용한다. 또 다른 구현예에서, 스템의 높이는 약 7개 뉴클레오타이드일 수 있으며, Rep와 기능적으로 상호작용한다. 또 다른 예에서, 루프는 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개 뉴클레오타이드 또는 그 이상, 또는 상기 개수 내 임의의 범위의 뉴클레오타이드를 가질 수 있다.
또 다른 구현예에서, RBE 또는 연장된 RBE 내 GAGY 결합 부위 또는 GAGY 관련 결합 부위의 수가 증가 또는 감소할 수 있다. 하나의 예에서, RBE 또는 연장된 RBE는, 1개, 2개, 3개, 4개, 5개 또는 6개, 또는 그 이상의 GAGY 결합 부위, 또는 상기 개수 내 임의의 범위의 GAGY 결합 부위를 포함할 수 있다. 각각의 GAGY 결합 부위는, 서열이 Rep 단백질에 결합하는 데 충분하다면, 독립적으로 정확한 GAGY 서열 또는 GAGY에 유사한 서열일 수 있다.
또 다른 구현예에서, 2개의 요소(예컨대, 비제한적으로, RBE와 헤어핀) 사이의 간격을 변경시켜(예를 들어, 증가 또는 감소시켜), 큰 Rep 단백질과의 기능적 상호작용을 변경시킬 수 있다. 예를 들어, 상기 간격은 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개 또는 21개 뉴클레오타이드 또는 그 이상, 또는 상기 개수 내 임의의 범위의 뉴클레오타이드일 수 있다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 개시된 야생형 AAV2 ITR 구조에 대해 변형된 ITR 구조를 포함할 수 있지만, 작동 가능한 RBE, trs 및 RBE' 부분은 여전히 보유한다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 Rep-결합 부위(예를 들어, RBS; AAV2의 경우 5'-GCGCGCTCGCTCGCTC-3'(서열번호 60))와 말단 분해 부위(TRS; 예를 들어, 5'-AGTT(서열번호 62))를 포함하는 하나 이상의 기능성 ITR 폴리뉴클레오타이드 서열을 함유한다. 일부 구현예에서, 적어도 하나의 ITR(wt 또는 변형된 ITR)은 기능성이다. 대안적인 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터가 서로 상이하거나 비대칭인 2개의 변형된 ITR을 포함하는 경우, 적어도 하나의 변형된 ITR은 기능성이고, 적어도 하나의 변형된 ITR은 비기능성이다.
일부 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 변형된 ITR(예를 들어, 좌측 또는 우측 ITR)은, 루프 아암, 절단된 아암 또는 스페이서 내에 변형을 갖는다. 루프 아암, 절단된 아암 또는 스페이서 내에 변형을 갖는 ITR의 예시적인 서열은 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2(즉, 서열번호 135 내지 190, 200 내지 233); 표 3(예를 들어, 서열번호 234 내지 263); 표 4(예를 들어, 서열번호 264 내지 293); 표 5(예를 들어, 본원의 서열번호 294 내지 318); 표 6(예를 들어, 서열번호 319 내지 468; 및 표 7 내지 표 9(예를 들어, 서열번호 101 내지 110, 111 및 112, 115 내지 134) 또는 표 10A 또는 표 10B(예를 들어, 서열번호 9, 100, 469 내지 483, 484 내지 499)에 열거되어 있다.
일부 구현예에서, 비대칭인 ITR 쌍 또는 대칭인 mod-ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 변형된 ITR은, 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2, 표 3, 표 4, 표 5, 표 6, 표 7, 표 8, 표 9, 및 표 10A 및 표 10B에 제시된 것들 중 임의의 것 또는 이들의 조합에서 선택된다.
비대칭인 ITR 쌍 또는 대칭인 mod-ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 상기 각 부류의 추가의 예시적인 변형된 ITR은 표 5A표 5B에 제공되어 있다. 표 5A의 우측 변형된 ITR의 예측된 2차 구조는 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242의 도 7a에 제시되어 있고, 표 5B의 좌측 변형된 ITR의 예측된 2차 구조는 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242의 도 7b에 제시되어 있으며, 상기 문헌은 그 전문이 본원에 참조로서 인용된다.
표 5A표 5B는 예시적인 우측 및 좌측 변형된 ITR을 보여준다.
[표 5A]
Figure pct00010
[표 5B]
Figure pct00011
하나의 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 5'→3' 방향으로, 제1 아데노연관바이러스(AAV) 역말단반복서열(ITR), 관심 핵산 서열(예를 들어, 본원에 기재된 바와 같은 코돈 변형된 핵산을 포함하는 발현 카세트) 및 제2 AAV ITR을 포함하고, 여기서 제1 ITR(5' ITR)과 제2 ITR(3' ITR)은 서로에 대해 비대칭이며, 즉, 이들은 서로 상이한 3D 공간 구성을 갖는다. 예시적인 구현예로서, 제1 ITR은 야생형 ITR이고, 제2 ITR은 돌연변이되거나 변형된 ITR일 수 있거나, 또는 그 반대로 제1 ITR은 돌연변이되거나 변형된 ITR이고, 제2 ITR은 야생형 ITR일 수 있다. 일부 구현예에서, 제1 ITR과 제2 ITR은 모두 mod-ITR이지만, 상이한 서열을 갖거나 상이한 변형을 갖기 때문에, 동일한 변형된 ITR이 아니고, 상이한 3D 공간 구성을 갖는다. 달리 말하면, 비대칭인 ITR을 갖는 ceDNA 벡터는, WT-ITR과 비교하여 하나의 ITR에서의 임의의 변화가 다른 하나의 ITR에 반영되지 않거나; 또는 대안적으로, 비대칭인 ITR이 변형된 비대칭인 ITR 쌍을 갖고 서로에 대해 상이한 서열과 상이한 3차원 형상을 가질 수 있는 ITR을 포함한다. PAH 단백질의 발현 및 ceDNA-플라스미드를 생성에 사용하기 위한 ceDNA 벡터의 예시적인 비대칭인 ITR은 표 5A표 5B에 제시되어 있다.
대안적인 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 2개의 대칭인 mod-ITR을 포함하며, 즉, 두 개의 ITR은 동일한 서열을 갖지만, 서로 역 보체(역상)이다. 일부 구현예에서, 대칭인 mod-ITR 쌍은 동일한 AAV 혈청형의 야생형 ITR 서열에 대한 결실, 삽입 또는 치환 중 적어도 하나 또는 이들의 임의의 조합을 포함한다. 대칭인 ITR에서 부가, 결실 또는 치환은 동일하지만, 서로 역 보체이다. 예를 들어, 5' ITR의 C 영역에의 3개의 뉴클레오타이드의 삽입은 3' ITR의 C' 영역 내 상응하는 섹션에의 3개의 역 보체 뉴클레오타이드의 삽입으로 반영될 것이다. 단지 예시의 목적으로, 부가가 5' ITR에의 AACG인 경우, 이러한 부가는 상응하는 부위의 3' ITR에의 CGTT이다. 예를 들어, 5' ITR 센스 가닥이 ATCGATCG(서열번호 608)인 경우, G와 A 사이에 AACG가 부가되면 ATCG AACG ATCG(서열번호 51)의 서열이 생성된다. 상응하는 3' ITR 센스 가닥은 CGATCGAT(서열번호 606)(ATCGATCG의 역 보체(서열번호 607))이고, T와 C 사이에 CGTT(즉, AACG의 역 보체)가 부가되어, CGAT CGTT CGAT(서열번호 49)(ATCG AACG ATCG의 역 보체)(서열번호 51) 서열이 생성된다.
대안적인 구현예에서, 변형된 ITR 쌍은 본원에 정의된 바와 같이 실질적으로 대칭이며, 즉, 변형된 ITR 쌍은 상이한 서열을 갖지만, 상응하거나 동일한 대칭인 3차원 형상을 가질 수 있다. 예를 들어, 하나의 변형된 ITR은 하나의 혈청형에서 유래할 수 있고, 다른 하나의 변형된 ITR은 상이한 혈청형에서 유래할 수 있지만, 동일한 영역에 동일한 돌연변이(예를 들어, 뉴클레오타이드 삽입, 결실 또는 치환)를 가질 수 있다. 달리 말하면, 단지 예시의 목적으로, 5' mod-ITR은 AAV2에 유래할 수 있고 C 영역에 결실을 가질 수 있으며, 3' mod-ITR은 AAV5에서 유래할 수 있고 C' 영역에 상응하는 결실을 가질 수 있으며, 단, 5' mod-ITR과 3' mod-ITR은 동일하거나 대칭인 3차원 공간 구성을 갖고, 이들은 변형된 ITR 쌍으로서 본원에의 사용을 위해 포함된다.
일부 구현예에서, 실질적으로 대칭인 mod-ITR 쌍은 3D 공간에서 동일한 A, C-C' 및 B-B' 루프를 가지며, 예를 들어 실질적으로 대칭인 mod-ITR 쌍에서 변형된 ITR이 C-C' 아암의 결실을 갖는 경우, 동족 mod-ITR은 C-C' 루프의 상응하는 결실을 갖고, 또한 이의 동족 mod-ITR의 기하학적 공간에서 동일한 형상으로 나머지 A 및 B-B' 루프의 유사한 3D 구조를 갖는다. 단지 예로서, 실질적으로 대칭인 ITR은 기하학적 공간에서 동일한 형상이 되도록 대칭인 공간 구성을 가질 수 있다. 이는, G-C 쌍이, 예를 들어 C-G 쌍으로, 또는 그 반대로 변형되거나, A-T 쌍이 T-A 쌍으로, 또는 그 반대로 변형되는 경우에 일어날 수 있다. 따라서, ATCG AACG ATCG(서열번호 51)로서의 변형된 5' ITR과 CGAT CGTT CGAT(서열번호 49)로서의 변형된 3' ITR(즉, ATCG AACG ATCG(서열번호 51)의 역 보체)의 상기 예시적인 예를 사용하면, 이러한 변형된 ITR은, 예를 들어 5' ITR이 ATCG AAC C ATCG(서열번호 50)의 서열(여기서, 추가의 G가 C로 변형됨)을 갖고, 실질적으로 대칭인 3' ITR이 A에 더하여 T의 상응하는 변형 없이 CGAT CGTT CGAT(서열번호 49)의 서열을 갖는 경우, 여전히 대칭일 수 있다. 일부 구현예에서, 이러한 변형된 ITR 쌍은 대칭인 입체화학을 갖기 때문에 실질적으로 대칭이다.
표 6은, PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 예시적인 대칭인 변형된 ITR 쌍(즉, 좌측 변형된 ITR과 대칭인 우측 변형된 ITR)을 보여준다. 서열의 볼드체 부분은 부분 ITR 서열(즉, A-A', C-C' 및 B-B' 루프의 서열)을 식별한다. 이러한 예시적인 변형된 ITR은 GCGCGCTCGCTCGCTC-3'(서열번호 60)의 RBE, ACTGAGGC(서열번호 69)의 스페이서, 스페이서 보체 GCCTCAGT(서열번호 70) 및 GAGCGAGCGAGCGCGC(서열번호 71)의 RBE'(즉, RBE에 대한 보체)를 포함할 수 있다.
[표 6]
Figure pct00012
Figure pct00013
일부 구현예에서, 비대칭인 ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원의 표 5A표 5B 중 임의의 하나 이상에 제시된 ITR 서열 또는 ITR 부분 서열, 또는 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242(이는 그 전문이 본원에 참조로서 인용됨)의 도 7a 및 도 7b에 제시된, 또는 2018년 9월 7일자 출원된 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 2, 표 3, 표 4, 표 5, 표 6, 표 7, 표 8, 표 9, 또는 표 10A 및 표 10B에 개시된 서열에서의 임의의 변형에 상응하는 변형을 갖는 ITR을 포함할 수 있다.
V. 예시적인 ceDNA 벡터
상기 기재된 바와 같이, 본 개시내용은 본원에 기재된 바와 같은 비대칭인 ITR 쌍, 대칭인 ITR 쌍 또는 실질적으로 대칭인 ITR 쌍 중 어느 하나를 포함하는, 재조합 ceDNA 발현 벡터 및 PAH 단백질을 인코딩하는 코돈 변형된 핵산을 포함하는 ceDNA 벡터에 관한 것이다. 특정 구현예에서, 본 개시내용은 플랭킹 ITR 서열과 전이유전자를 갖는 PAH 단백질의 발현을 위한 재조합 ceDNA 벡터로서, 여기서 ITR 서열은 본원에 정의된 바와 같이 서로에 대해 비대칭, 대칭 또는 실질적으로 대칭이고, ceDNA는 플랭킹 ITR 사이에 위치한 관심 핵산 서열(예를 들어, 전이유전자의 핵산을 포함하는 발현 카세트)을 추가로 포함하며, 여기서 상기 핵산 분자에는 바이러스 캡시드 단백질 코딩 서열이 없는 재조합 ceDNA 벡터에 관한 것이다.
PAH 단백질의 발현을 위한 ceDNA 발현 벡터는, 적어도 하나의 ITR이 변경된 본원에 기재된 바와 같은 핵산 서열(들)을 포함하는 재조합 DNA 절차에 편리하게 적용될 수 있는 임의의 ceDNA 벡터일 수 있다. 본 개시내용의 PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA 벡터가 도입되는 숙주세포와 양립 가능하다. 특정 구현예에서, ceDNA 벡터는 선형일 수 있다. 특정 구현예에서, ceDNA 벡터는 염색체외 엔티티로서 존재할 수 있다. 특정 구현예에서, 본 개시내용의 ceDNA 벡터는 숙주세포의 게놈으로의 공여체 서열의 통합을 가능하게 하는 요소(들)을 함유할 수 있다. 본원에 사용된 "전이유전자"와 "이종 핵산 서열"은 동의어이며, 본원에 기재된 바와 같이 PAH 단백질을 인코딩할 수 있다.
A. 조절 요소.
본원에 정의된 바와 같은 비대칭인 ITR 쌍 또는 대칭인 ITR 쌍을 포함하는 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 시스-조절 요소의 특정 조합을 추가로 포함할 수 있다.
코돈 최적화되고, 페닐알라닌 수준(예를 들어, 발현 및 지속기간)의 최적 교정에 대해 시험된 특정 시스-작용 요소(예를 들어, 특정 프로모터, 특정 인핸서, 및 특정 프로모터와 인핸서 조합)와 조합된 PAH 핵산 서열을 포함하는 ceDNA 벡터가 본원에 기재되어 있다. 일부 구현예에 따르면, 특정 코돈 최적화된 PAH 핵산 서열은 특정 프로모터 서열 및/또는 특정 인핸서 서열과 조합된 경우, 예를 들어 또 다른 프로모터 서열 및/또는 특정 인핸서 서열과 조합된 동일한 코돈 최적화된 PAH 핵산 서열에 비해 더 양호한 성능을 나타낸다.
특정 구현예에서, 프로모터의 효능을 증가시키기 위해 인핸서 서열이 프로모터의 업스트림에 제공된다.
특정 구현예에서, 인트론 서열이 코돈 최적화된 핵산 서열의 업스트림에 제공된다.
(i) 프로모터:
당업자는, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 사용되는 프로모터가 이들이 촉진시키는 조직 또는 세포의 유형 및 특정 서열에 적절하게 조정되어야 한다는 것을 이해할 것이다.
PAH 단백질의 발현을 위한 ceDNA 벡터의 발현 카세트는 전체 발현 수준 및 세포 특이성에 영향을 미칠 수 있는 프로모터를 포함한다. 전이유전자 발현, 예를 들어 PAH 단백질의 발현을 위해, 이는 고도로 활성인 바이러스 유래의 극초기 프로모터를 포함할 수 있다. 발현 카세트는 특정 세포 유형에 대한 전이유전자 발현을 제한하고, 조절되지 않은 이소성 발현으로 인한 독성 효과 및 면역 반응을 감소시키기 위해 조직 특이적 진핵생물 프로모터를 함유할 수 있다. 표 7A표 7B에는 ceDNA PAH 치료제에서 구현될 수 있는 코어 프로모터 서열이 열거되어 있다.
[표 7A]
Figure pct00014
[표 7B]
Figure pct00015
특정 구현예에 따르면, 프로모터는 하기로 이루어지는 군에서 선택된다: VD("VanD"로도 지칭됨) 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(CpG 최소화된 hAAT(979) 프로모터(CpGmin hAAT_core_C10), 및 hAAT_core_C06; hAAT_core_C07; hAAT_core_C08 및 hAAT_core_C09와 같은 다른 CpGmin_hAAT 프로모터 포함) 및 트랜스티레틴(TTR) 간 특이적 프로모터.
일부 구현예에서, VD 프로모터는 미세생쥐바이러스(MVM) 인트론, 최소 트랜스티레틴 프로모터(TTRm), 세르핀 인핸서(72 bp) 및 TTRm 5' UTR을 포함한다.
일부 구현예에 따르면, TTRm은 하기 제시되는 바와 같은 서열번호 442를 포함한다:
GTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTC (서열번호 442).
일부 구현예에 따르면, 세르핀 인핸서는 하기 제시되는 바와 같은 서열번호 449를 포함한다:
GGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCAC (서열번호 449).
일부 구현예에 따르면, TTRm 5' UTR은 하기 제시되는 바와 같은 서열번호 498을 포함한다:
ACACAGATCCACAAGCTCCTG (서열번호 498).
추가 구현예에 따르면, VD 프로모터는 하기 제시되는 바와 같은 서열번호 191을 포함한다:
CCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTG (서열번호 191)
일부 구현예에 따르면, hAAT(979) 프로모터는 서열번호 447을 포함한다. hAAT(979) 함유 프로모터 세트는 서열번호 479에 예시되어 있다.
일부 구현예에 따르면, CpGmin_hAAT 프로모터는 서열번호 443 내지 447에서 선택되는 서열을 포함한다. 일부 구현예에 따르면, CpGmin_hAAT 프로모터 세트는 서열번호 475이다. 일부 구현예에 따르면, CpGmin_hAAT 프로모터 세트는 서열번호 479이다. 일부 구현예에 따르면, 트랜스티레틴(TTR) 간 특이적 프로모터는 표 7A에 제시된 서열(서열번호 442)을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 191과 적어도 95% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 95% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 96% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 97% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 98% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에 따르면, 프로모터는 서열번호 443과 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 444와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 445와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 446과 적어도 99% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 447과 적어도 99% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에서, 본원에 기재된 프로모터 서열과 인핸서 서열을 포함하는 프로모터 세트. 일부 구현예에 따르면, 프로모터 세트는 서열번호 475와 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 475와 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 475와 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 475와 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 475와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다.
일부 구현예에서, 본원에 기재된 프로모터 서열과 인핸서 서열을 포함하는 프로모터 세트. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 95% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 96% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 97% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 98% 동일성을 갖는 핵산 서열을 포함한다. 일부 구현예에 따르면, 프로모터는 서열번호 479와 적어도 99% 동일성을 갖는 핵산 서열을 포함한다.
(ii) 인핸서
일부 구현예에서, 코돈 최적화된 PAH를 발현하는 ceDNA는 하나 이상의 인핸서를 포함한다. 일부 구현예에서, 인핸서 서열은 프로모터 서열의 5'에 위치한다. 일부 구현예에서, 인핸서 서열은 프로모터 서열의 3'에 위치한다. 일부 구현예에 따르면, 인핸서는 세르핀 인핸서, 3xHNF1-4_ProEnh_10mer 및 5xHNF1_ProEnh_10mer로 이루어지는 군에서 선택된다.
[표 8A]
Figure pct00016
[표 8B]
Figure pct00017
Figure pct00018
일부 구현예에 따르면, TTR 프로모터에 융합된 3xHNF1-4_ProEnh(프로알부민 인핸서) 인핸서는 서열번호 462에 제시된 서열을 포함한다. 일부 구현예에 따르면, 3x VanD-TTRe 및 TTR 프로모터에 융합된 3xHNF1-4_ProEnh(프로알부민 인핸서) 인핸서는 서열번호 463에 제시된 서열을 포함한다.
일부 구현예에 따르면, TTR 프로모터에 융합된 5xHNF1_ProEnh_enhancer는 서열번호 464에 제시된 서열을 포함한다. 일부 구현예에 따르면, 3xVanD-TTRe 및 TTR 프로모터에 융합된 5xHNF1_ProEnh_enhancer는 서열번호 465에 제시된 서열을 포함한다.
일부 구현예에 따르면, 세르핀 인핸서(SerpEnh)는 하기에 제시된 서열을 포함한다:
GGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCAC (서열번호 449).
일부 다른 구현예에서, 인핸서는 다수의 탠덤 또는 반복 서열에 사용될 수 있다. 비제한적인 예에는, 서열번호 587 내지 601에 기재된 인핸서 서열이 포함된다.
[표 9A]
Figure pct00019
[표 9B]
Figure pct00020
[표 9C]
Figure pct00021
(iii) 5' UTR 서열 및 인트론 서열
일부 구현예에서, ceDNA 벡터는 5' UTR 서열 및/또는 5' ITR 서열의 3'에 위치한 인트론 서열을 포함한다. 일부 구현예에서, 5' UTR은 전이유전자, 예를 들어 PAH 단백질을 인코딩하는 서열의 5'에 위치한다. 예시적인 5' UTR 서열은 하기 표 10 또는 국제 특허 출원 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 9A에 열거되어 있다.
[표 10]
Figure pct00022
[표 10B]
Figure pct00023
Figure pct00024
일부 구현예에서, ceDNA 벡터는 ORF의 5'에 위치한 인트론을 포함한다. 일부 다른 구현예에서, ceDNA 벡터는 ORF 서열 내에 있는 인트론을 포함한다. 사용될 수 있는 적합한 인트론 서열은 하기 표 11A에 열거되어 있다.
[표 11A]
Figure pct00025
[표 11B]
Figure pct00026
일부 구현예에 따르면, MVM 인트론은 또한 (예를 들어, 5' UTR의 일부로서) PAH 오픈리딩프레임의 5'에서 구현될 수 있다. MVM 인트론은 하기 제시되는 바와 같은 서열번호 1026을 포함한다:
AAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTG (서열번호 1026)
(iv) 3' UTR 서열
일부 구현예에서, ceDNA 벡터는 3' ITR 서열 5'에 위치한 3' UTR 서열을 포함한다. 일부 구현예에서, 3' UTR은 전이유전자, 예를 들어 PAH 단백질을 인코딩하는 서열의 3'에 위치한다. 예시적인 3' UTR 서열은 하기 표 12 또는 국제 출원 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 9B에 열거되어 있다.
[표 12]
Figure pct00027
PAH 단백질의 발현을 위한 ceDNA 벡터는 전사 후 조절 요소(WPRE)와 BGH polyA를 추가로 포함할 수 있다.
(v) 폴리아데닐화 서열
ceDNA 벡터로부터 발현되는 mRNA를 안정화시키고, 핵 방출 및 번역을 돕기 위해, PAH 단백질의 발현을 위한 ceDNA 벡터에 폴리아데닐화 서열을 인코딩하는 서열을 포함시킬 수 있다. 하나의 구현예에서, ceDNA 벡터는 폴리아데닐화 서열을 포함하지 않는다. 다른 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 40개, 적어도 45개, 적어도 50개 또는 그 이상의 아데닌 디뉴클레오타이드를 포함한다. 일부 구현예에서, 폴리아데닐화 서열은 약 43개의 뉴클레오타이드, 약 40 내지 50개의 뉴클레오타이드, 약 40개 내지 55개의 뉴클레오타이드, 약 45개 내지 50개의 뉴클레오타이드, 약 35개 내지 50개의 뉴클레오타이드, 또는 상기 개시된 범위 사이의 임의의 범위의 뉴클레오타이드를 포함한다.
발현 카세트는 당업계에 알려진 임의의 폴리아데닐화 서열 또는 이의 변형을 포함할 수 있다. 일부 구현예에서, 폴리아데닐화(polyA) 서열은 국제 특허 출원 PCT/US2020/021328(이는 그 전문이 본원에 참조로서 인용됨), 예를 들어 표 10에 열거된 것 중 임의의 것에서 선택된다. 예를 들어, 비제한적으로, 소 BGHpA(예를 들어, 서열번호 68) 또는 바이러스 SV40pA(예를 들어, 서열번호 86)에서 단리된 자연 발생 서열, 또는 합성 서열(예를 들어, 서열번호 87)을 포함하는, 당업계에 일반적으로 알려진 다른 polyA 서열이 또한 사용될 수 있다. 일부 발현 카세트는 또한 SV40 후기 polyA 신호 업스트림 인핸서(USE) 서열을 포함할 수 있다. 일부 구현예에서, USE 서열은 SV40pA 또는 이종 polyA 신호와 조합으로 사용될 수 있다. PolyA 서열은 PAH 단백질을 인코딩하는 전이유전자의 3'에 위치한다.
발현 카세트는 또한 전이유전자의 발현을 증가시키기 위해 전사 후 요소를 포함할 수 있다. 일부 구현예에서, 우드척 간염바이러스(WHP) 전사 후 조절 요소(WPRE)(예를 들어, 서열번호 67)가 전이유전자의 발현을 증가시키기 위해 사용된다. 단순헤르페스바이러스의 티미딘 키나아제 유전자, 또는 B형 간염 바이러스(HBV)로부터의 전사 후 요소와 같은 다른 전사 후 처리 요소가 사용될 수 있다. 분비 서열은 전이유전자, 예를 들어 VH-02 및 VK-A26 서열, 예를 들어 서열번호 88 및 서열번호 89에 연결될 수 있다.
(vi) 핵 국소화 서열 및 DNA 핵 표적화 서열
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 하나 이상의 핵 국소화 서열(NLS), 예를 들어 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 이상의 NLS를 포함한다. 일부 구현예에서, 하나 이상의 NLS는 아미노 말단에 또는 그 근처에, 카르복시 말단에 또는 그 근처에, 또는 이들의 조합에 위치한다(예를 들어, 아미노 말단에 있는 하나 이상의 NLS 및/또는 카르복시 말단에 있는 하나 이상의 NLS). 하나 초과의 NLS가 존재하는 경우, 각각은 서로 독립적으로, 단일 NLS가 하나 초과의 카피에 존재하고/하거나 하나 이상의 카피에 존재하는 하나 이상의 다른 NLS와 조합으로 존재하도록 선택될 수 있다. NLS의 비제한적인 예는 표 13A에 제시되어 있다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA가 표적 세포의 핵으로 들어가는 것을 촉진시키기 위해 하나 이상의 DNA 핵 표적화 서열(DTS)을 포함한다. 표 13B에는, PAH 단백질을 발현하는 ceDNA 벡터에서 구현될 수 있는 DTS의 비제한적인 예가 열거되어 있다.
[표 13A]
Figure pct00028
[표 13B]
Figure pct00029
[표 13C]
Figure pct00030
B. ceDNA 벡터의 추가 구성요소
본 개시내용의 PAH 단백질의 발현을 위한 ceDNA 벡터는, 비제한적으로, Kozak 서열(표 14A), 미세생쥐바이러스(MVM) 인트론, 스페이서, CpG 모티프와 같은 다른 구성요소를 함유할 수 있다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 면역 반응 또는 간 항상성에 관여하는 하나 이상의 마이크로RNA(MIR) 서열(표 14B)을 포함할 수 있다.
[표 14A]
Figure pct00031
[표 14B]
Figure pct00032
C. 요소들과 ORF의 조합
일부 구현예에 따르면, 특정 코돈 최적화된 핵산 서열은 특정 프로모터, 인핸서 또는 다른 시스-요소의 하나 이상의 조합과 쌍을 이룬다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이룬다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이루며, 여기서 VD 프로모터(예를 들어, TTRm)는 SERP 인핸서를 추가로 포함한다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이루며, 여기서 VD 프로모터(예를 들어, TTRm)는 3x SERP 인핸서를 포함한다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이루며, 여기서 VD 프로모터는 3x SERP 인핸서를 포함하고 MVM 인트론을 추가로 포함한다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 hAAT(979)_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이룬다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 TTR 간 특이적 프로모터를 인코딩하는 핵산 서열과 쌍을 이루며, ProEnh_10mer와 MVM 인트론을 추가로 포함한다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 트랜스티레틴(TTR) 간 특이적 프로모터를 인코딩하는 핵산 서열과 쌍을 이룬다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 트랜스티레틴(TTR) 간 특이적 프로모터를 인코딩하는 핵산 서열과 쌍을 이루며, MVM 인트론을 추가로 포함한다. 일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2를 포함하고, 본원에 기재된 바와 같은 최소 트랜스티레틴(TTRm) 간 특이적 프로모터를 인코딩하는 핵산 서열과 쌍을 이룬다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH_codop_ORF_v2 delta1-29aa를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet 또는 CpG 최소화된 hAAT를 인코딩하는 핵산 서열과 쌍을 이룬다.
일부 구현예에 따르면, 코돈 최적화된 서열은 hPAH-r5-s29를 포함하고, 본원에 기재된 바와 같은 VD_PromoterSet를 인코딩하는 핵산 서열과 쌍을 이루며, 여기서 VD 프로모터는 3x SERP 인핸서를 포함한다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 Left-ITR_v1 : spacer_left-ITR_v1 : VD_Promoter Set : PmeI_site : Consensus_Kozak : hPAH_cDNA_ORF_v3 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 Left-ITR_v1 : spacer_left-ITR_v1 : VD_Promoter Set : PmeI_site : Consensus_Kozak : hPAH_cDNA_ORF_v3 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xSerpEnh-TTRe-TTRm, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xSerpEnh-TTRe-TTRm, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_delta1-29aa, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_delta1-29aa, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다.일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_mIVS-intron1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_mIVS-intron1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_modified_Intron1_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_modified_Intron1_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, hAAT(979)_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, hAAT(979)_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv2_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv2_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv3_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv3_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, HBBv2_3pUTR, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, HBBv2_3pUTR, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGmin_hAAT_Promoter_Set, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, CpGmin_hAAT_Promoter_Set, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r3-s34, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r3-s34, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다. 일부 구현예에 따르면, ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1로 이루어진다.
일부 구현예에 따르면, ceDNA 작제물은 서열번호 194, 서열번호 195, 서열번호 196, 서열번호 197, 서열번호 198, 서열번호 199, 서열번호 200, 서열번호 201, 서열번호 202, 서열번호 203, 서열번호 204, 서열번호 205, 서열번호 206, 서열번호 207, 서열번호 208, 서열번호 209, 서열번호 210, 서열번호 211, 서열번호 212 및 서열번호 213으로 이루어지는 군에서 선택되는 서열과 적어도 90% 동일한 핵산 서열을 포함한다.
D. 조절 스위치
분자 조절 스위치는 신호에 반응하여 측정 가능한 상태 변화를 생성하는 스위치이다. 이러한 조절 스위치는 ceDNA 벡터로부터 PAH 단백질 발현의 출력을 제어하기 위해 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와 유용하게 조합될 수 있다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 PAH 단백질의 발현을 미세조정하는 역할을 하는 조절 스위치를 포함한다. 예를 들어, 이는 ceDNA 벡터의 생물학적 봉쇄(biocontainment) 기능으로 작용할 수 있다. 일부 구현예에서, 상기 스위치는 제어 가능하고 조절 가능한 방식으로 ceDNA 벡터에서 PAH 단백질의 발현을 개시 또는 중단(즉, 셧다운)하도록 설계된 "ON/OFF" 스위치이다. 일부 구현예에서, 상기 스위치는 스위치가 활성화되면 ceDNA 벡터를 포함하는 세포가 세포의 프로그래밍된 사멸을 거치도록 지시할 수 있는 "사멸 스위치"를 포함할 수 있다. PAH 단백질의 발현을 위한 ceDNA 벡터에 사용하기 위해 포함된 예시적인 조절 스위치는, 전이유전자의 발현을 조절하는 데 사용될 수 있으며, 이는 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)에 보다 충분히 논의되어 있다.
(i) 이원 조절 스위치
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 PAH 단백질의 발현을 제어 가능하게 조절하는 역할을 할 수 있는 조절 스위치를 포함한다. 예를 들어, ceDNA 벡터의 ITR 사이에 위치한 발현 카세트는 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 조절 영역, 예를 들어 프로모터, 시스-요소, 억제인자, 인핸서 등을 추가로 포함할 수 있으며, 여기서 조절 영역은 하나 이상의 보조인자 또는 외인성 작용제에 의해 조절된다. 단지 예로서, 조절 영역은 소분자 스위치, 또는 유도성 또는 억제성 프로모터에 의해 조절될 수 있다. 유도성 프로모터 비제한적인 예는, 호르몬 유도성 또는 금속 유도성 프로모터이다. 다른 예시적인 유도성 프로모터/인핸서 요소에는, 비제한적으로, RU486-유도성 프로모터, 엑디손-유도성 프로모터, 라파마이신-유도성 프로모터 및 메탈로티오네인 프로모터가 포함된다.
(ii) 소분자 조절 스위치
다양한 업계 공지의 소분자 기반 조절 스위치가 당업계에 알려져 있으며, 이는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와 조합되어 조절 스위치 제어된 ceDNA 벡터를 형성할 수 있다. 일부 구현예에서, 조절 스위치는, 문헌[Taylor, et al. BMC Biotechnology 10 (2010): 15]에 개시된 바와 같은 작동적으로 연결된 전이유전자의 발현을 제어하는 인공 프로모터와 함께인, 직교 리간드/핵 수용체 쌍, 예를 들어 레티노이드 수용체 변이체/LG335 및 GRQCIMFI; 조작된 스테로이드 수용체, 예를 들어 프로게스테론에 결합할 수 없지만 RU486(미페프리스톤(mifepristone))에 결합하는 C-말단 절단을 갖는 변형된 프로게스테론 수용체(미국 특허 제5,364,791호); 초파리의 엑디손 수용체 및 이의 엑디스테로이드 리간드(문헌[Saez, et al., PNAS, 97(26)(2000), 14512-14517]); 또는 문헌[Sando R 3rd; Nat Methods. 2013, 10(11):1085-8]에 개시된 바와 같은 항생제 트리메토프림(TMP: trimethoprim)에 의해 제어되는 스위치 중 어느 하나 또는 이들의 조합에서 선택될 수 있다. 일부 구현예에서, 전이유전자를 제어하거나 ceDNA 벡터에 의해 발현되는 조절 스위치는, 미국 특허 제8,771,679호 및 제6,339,070호(이들은 그 전문이 본원에 참조로서 인용됨)에 개시된 것들과 같은 전구약물 활성화 스위치이다.
(iii) "패스코드" 조절 스위치
일부 구현예에서, 조절 스위치는 "패스코드 스위치" 또는 "패스코드 회로"일 수 있다. 패스코드 스위치는, 특정 조건이 발생하는 경우에 ceDNA 벡터로부터의 전이유전자 발현 제어를 미세 조정하는 것을 가능하게 하며, 즉, 전이유전자 발현 및/또는 억제가 일어나기 위해서는 조건의 조합이 존재해야 한다. 예를 들어, 전이유전자의 발현이 일어나기 위해서는, 적어도 조건 A 및 B가 발생해야 한다. 패스코드 조절 스위치는, 전이유전자의 발현이 일어나기 위해 존재하는 임의의 수의 조건, 예를 들어 적어도 2개, 또는 적어도 3개, 또는 적어도 4개, 또는 적어도 5개, 또는 적어도 6개, 또는 적어도 7개, 또는 그 이상의 조건일 수 있다. 일부 구현예에서는, 적어도 2개의 조건(예를 들어, 조건 A, B)이 발생해야 하고, 일부 구현예에서는, 적어도 3개의 조건(예를 들어, A, B 및 C, 또는 A, B 및 D)이 발생해야 한다. 단지 예로서, 패스코드 "ABC" 조절 스위치를 갖는 ceDNA에서 유전자 발현이 일어나기 위해서는, 조건 A, B 및 C가 존재해야 한다. 조건 A, B 및 C는 다음과 같을 수 있다: 조건 A는 병태 또는 질환의 존재이고, 조건 B는 호르몬 반응이고, 조건 C는 전이유전자 발현에 대한 반응이다. 예를 들어, 전이유전자가 결함이 있는 EPO 유전자를 편집하는 경우, 조건 A는 만성신장질환(CKD)의 존재이고, 조건 B는 대상의 신장이 저산소 상태인 경우에 발생하고, 조건 C는 신장에서 에리트로포이에틴 생산 세포(EPC) 동원이 손상되거나; 또는 대안적으로, HIF-2 활성화가 손상되는 경우이다. 산소 수준이 증가하거나 목적하는 EPO 수준에 도달하는 경우, 전이유전자는 다시 3가지 조건이 발생할 때까지 꺼지고, 다시 켜지게 된다.
일부 구현예에서, ceDNA 벡터에의 사용을 위해 포함된 패스코드 조절 스위치 또는 "패스코드 회로"는, 생물학적 봉쇄 조건을 정의하는 데 사용되는 환경 신호의 범위 및 복잡성을 확장시키기 위해 하이브리드 전사인자(TF)를 포함한다. 선결된 조건의 존재 하에서 세포 사멸을 촉발시키는 데드맨 스위치와 반대로, "패스코드 회로"는 특정 "패스코드"의 존재 하에서 세포 생존 또는 전이유전자 발현을 가능하게 하며, 선결된 환경 조건 또는 패스코드가 존재하는 경우에만 전이유전자 발현 및/또는 세포 생존을 가능하게 하도록 용이하게 재프로그래밍될 수 있다.
본원에 개시된 조절 스위치의 임의의 및 모든 조합, 예를 들어 소분자 스위치, 핵산 기반 스위치, 소분자-핵산 하이브리드 스위치, 전사 후 전이유전자 조절 스위치, 번역 후 조절, 방사선 제어 스위치, 저산소증 매개 스위치, 및 본원에 개시된 바와 같은 당업자에게 알려진 다른 조절 스위치가, 본원에 개시된 바와 같은 패스코드 조절 스위치에 사용될 수 있다. 사용을 위해 포함된 조절 스위치는 또한 리뷰 논문인 문헌[Kis et al., J R Soc Interface. 12: 20141000 (2015)]에 논의되어 있고, Kis의 표 1에 요약되어 있다. 일부 구현예에서, 패스코드 시스템에 사용되는 조절 스위치는 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 표 11에 개시된 스위치 중 임의의 것 또는 스위치의 조합에서 선택될 수 있다.
(iv) 전이유전자 발현을 제어하는 핵산 기반 조절 스위치
일부 구현예에서, ceDNA에 의한 PAH 단백질의 발현을 제어하는 조절 스위치는 핵산 기반 제어 메커니즘을 기반으로 한다. 예시적인 핵산 제어 메커니즘은 당업계에 알려져 있으며, 사용을 위해 고려된다. 예를 들어, 이러한 메커니즘은, 예를 들어 US2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, 미국 특허 제9,222,093호 및 EP 출원 EP288071에 개시된 것들, 및 문헌[Villa JK et al., Microbiol Spectr. 2018 May;6(3)]에 개시된 것과 같은 리보스위치를 포함한다. WO2018/075486 및 WO2017/147585에 개시된 것들과 같은 대사산물 반응성 전사 바이오센서가 또한 포함된다. 사용을 위해 고려되는 다른 업계 공지의 메커니즘에는, siRNA 또는 RNAi 분자(예를 들어, miR, shRNA)를 이용한 전이유전자의 침묵(silencing)이 포함된다. 예를 들어, ceDNA 벡터는 ceDNA 벡터에 의해 발현되는 전이유전자의 부분에 상보적인 RNAi 분자를 인코딩하는 조절 스위치를 포함할 수 있다. 전이유전자(예를 들어, PAH 단백질)가 ceDNA 벡터에 의해 발현되는 경우라도 이러한 RNAi가 발현되면, 상보적 RNAi 분자에 의해 침묵하게 되고, 전이유전자가 ceDNA 벡터에 의해 발현될 때 RNAi가 발현되지 않으면, 전이유전자(예를 들어, PAH 단백질)는 RNAi에 의해 침묵하게 되지 않는다.
일부 구현예에서, 조절 스위치는, 예를 들어 US2002/0022018에 개시된 바와 같은 조직 특이적 자가 불활성화 조절 스위치이며, 이에 의해 조절 스위치는 전이유전자 발현이 달리 불리할 수 있는 부위에서 전이유전자(예를 들어, PAH 단백질)를 의도적으로 차단한다. 일부 구현예에서, 조절 스위치는, 예를 들어 US2014/0127162 및 미국 특허 제8,324,436호에 개시된 바와 같은 재조합효소 가역적 유전자 발현 시스템이다.
(v) 전사 후 및 번역 후 조절 스위치.
일부 구현예에서, ceDNA 벡터에 의한 PAH 단백질의 발현을 제어하는 조절 스위치는 전사 후 변형 시스템이다. 예를 들어, 이러한 조절 스위치는 US2018/0119156, GB201107768, WO2001/064956A3, EP 특허 제2707487호 및 문헌[Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534]; 문헌[Zhong et al., Elife. 2016 Nov 2;5. pii: e18858]에 개시된 바와 같은, 테트라시클린 또는 테오필린에 민감한 압타자임(aptazyme) 리보스위치일 수 있다. 일부 구현예에서, 당업자는 리간드 민감성(OFF-스위치) 압타머를 함유하는 저해성 siRNA와 전이유전자를 모두 인코딩할 수 있으며, 최종 결과는 리간드 민감성 ON-스위치가 되는 것으로 예상된다.
(vi) 다른 예시적인 조절 스위치
환경 변화에 의해 촉발되는 것들을 포함하는 임의의 알려진 조절 스위치가, ceDNA 벡터에 의한 PAH 단백질의 발현을 제어하기 위해 ceDNA 벡터에 사용될 수 있다. 추가의 예에는, 비제한적으로, 문헌[Suzuki et al., Scientific Reports 8; 10051 (2018)]의 BOC 방법; 유전 코드 확장 및 비(non)생리학적 아미노산; 방사선 제어 또는 초음파 제어 온/오프 스위치(예를 들어, 문헌[Scott S et al., Gene Ther. 2000 Jul;7(13):1121-5]; 미국 특허 제5,612,318호; 제5,571,797호; 제5,770,581호; 제5,817,636호; 및 WO1999/025385A1 참조)가 포함된다. 일부 구현예에서, 조절 스위치는, 예를 들어 미국 특허 제7,840,263호; US2007/0190028A1에 개시된 바와 같은 이식 가능한 시스템에 의해 제어되며, 여기서 유전자 발현은 ceDNA 벡터 내 전이유전자에 작동적으로 연결된 프로모터를 활성화시키는 전자기 에너지를 포함하는 하나 이상의 에너지 형태에 의해 제어된다.
일부 구현예에서, ceDNA 벡터에의 사용을 위해 고려되는 조절 스위치는, 저산소증 매개 또는 스트레스 활성화 스위치, 예를 들어 WO1999060142A2, 미국 특허 제5,834,306호; 제6,218,179호; 제6,709,858호; US2015/0322410; 문헌[Greco et al., (2004) Targeted Cancer Therapies 9, S368](이들은 그 전문이 본원에 참조로서 인용됨)에 개시된 바와 같은 것들뿐 아니라, 예를 들어 미국 특허 제9,394,526호(이는 그 전문이 본원에 참조로서 인용됨)에 개시된 바와 같은, FROG, TOAD 및 NRSE 요소, 및 조건부 유도성 침묵 요소(저산소증 반응 요소(HRE), 염증 반응 요소(IRE) 및 전단 응력 활성화 요소(SSAE) 포함)이다. 이러한 구현예는, 허혈 후, 허혈 조직 및/또는 종양에서 ceDNA 벡터로부터의 전이유전자의 발현을 조정하는 데 유용하다.
(vii) 사멸 스위치
본원에 기재된 다른 구현예는 사멸 스위치를 포함하는 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 관한 것이다. 본원에 개시된 바와 같은 사멸 스위치는, 대상의 시스템으로부터 도입된 ceDNA 벡터를 영구적으로 제거하는 수단으로서, ceDNA 벡터를 포함하는 세포를 사멸시키거나 프로그래밍된 세포 사멸에 거치게 할 수 있다. 당업자는, PAH 단백질의 발현을 위한 ceDNA 벡터에서의 사멸 스위치의 사용이, 전형적으로 대상이 수용 가능하게 손실할 수 있는 제한된 수의 세포, 또는 세포자멸사가 바람직한 세포 유형(예를 들어, 암 세포)에 대한 ceDNA 벡터의 표적화와 결합될 수 있다는 것을 이해할 것이다. 모든 양태에서, 본원에 개시된 바와 같은 "사멸 스위치"는, 입력 생존 신호 또는 다른 명시된 조건의 부재 하에서 ceDNA 벡터를 포함하는 세포의 신속하고 강력한 세포 사멸을 제공하도록 설계된다. 달리 말하면, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 의해 인코딩된 사멸 스위치는 ceDNA 벡터를 포함하는 세포의 세포 생존을 특정한 입력 신호에 의해 정의된 환경으로 제한할 수 있다. 이러한 사멸 스위치는, 대상에서 PAH 단백질의 발현을 위한 ceDNA 벡터를 제거하거나, 인코딩된 PAH 단백질을 발현하지 않도록 보장하는 것이 바람직한 경우에 생물학적 생물봉쇄(biocontainment) 기능으로 작용한다.
당업자에게 알려진 다른 사멸 스위치, 예를 들어 US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568에 개시된 것뿐 아니라, 문헌[Jusiak et al, Reviews in Cell Biology and molecular Medicine; 2014; 1-56]; 문헌[Kobayashi et al., PNAS, 2004; 101; 8419-9]; 문헌[Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319]; 및 문헌[Reinshagen et al., Science Translational Medicine, 2018, 11]에 개시된 사멸 스위치가, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에의 사용을 위해 포함되며, 상기 모든 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
따라서, 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 이펙터 독소 또는 리포터 단백질을 인코딩하는 핵산을 포함하는 사멸 스위치 핵산 작제물을 포함할 수 있으며, 여기서 이펙터 독소(예를 들어, 사멸 단백질) 또는 리포터 단백질의 발현은 선결된 조건에 의해 제어된다. 예를 들어, 선결된 조건은 환경 작용제, 예를 들어 외인성 작용제의 존재일 수 있으며, 그렇지 않으면 세포는 이펙터 독소(예를 들어, 사멸 단백질)의 발현이 기본 설정이 되어 사멸되게 된다. 대안적인 구현예에서, 선결된 조건은 2개 이상의 환경 작용제의 존재이며, 예를 들어 세포는 2개 이상의 필요한 외인성 작용제가 공급되는 경우에만 생존할 것이고, 둘 중 어느 하나가 없는 경우에, ceDNA를 포함하는 세포는 사멸된다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA 벡터에 의해 발현되는 전이유전자의 생체내 발현(예를 들어, PAH 단백질의 발현)을 효과적으로 종결시키는 ceDNA 벡터를 포함하는 세포를 파괴하기 위해 사멸 스위치를 혼입하도록 변형된다. 구체적으로, ceDNA 벡터는 정상적인 생리학적 조건 하의 포유류 세포에서 기능성이 아닌 스위치-단백질을 발현하도록 추가로 유전자 조작된다. 이러한 스위치-단백질을 특이적으로 표적화하는 환경 조건 또는 약물의 투여 시에만, 스위치-단백질을 발현하는 세포가 파괴되어 치료용 단백질 또는 펩타이드의 발현이 종결될 것이다. 예를 들어, HSV-티미딘 키나아제를 발현하는 세포는 간시클로버(ganciclovir) 및 시토신 데아미나아제와 같은 약물의 투여 시 사멸될 수 있다고 보고되었다. 예를 들어 문헌[Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), in Targets in Gene Therapy, edited by You (2011)]; 및 문헌[Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699-8704 (1999)] 참조. 일부 구현예에서 ceDNA 벡터는 DISE(생존 유전자 제거로 인해 유도된 사멸(Death Induced by Survival gene Elimination))로 지칭되는 siRNA 사멸 스위치를 포함할 수 있다(문헌[Murmann et al., Oncotarget. 2017; 8:84643-84658, Induction of DISE in ovarian cancer cells in vivo]).
VI. ceDNA 벡터의 생산 방법
일반적인 생산 방법
본원에 정의된 바와 같은 비대칭인 ITR 쌍 또는 대칭인 ITR 쌍을 포함하는 PAH 단백질의 발현을 위한 ceDNA 벡터의 생산을 위한 특정 방법은, 2018년 9월 7일자 출원된 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 섹션 IV에 기재되어 있다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 기재된 바와 같이 곤충 세포를 사용하여 생산될 수 있다. 대안적인 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 합성적으로, 일부 구현예에서 2019년 1월 18일자 출원된 국제 출원 PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)에 개시된 바와 같은 무세포 방법으로 생산될 수 있다.
본원에 기재된 바와 같이, 하나의 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 하기 단계를 포함하는 공정에 따라 수득될 수 있다: a) 바이러스 캡시드 코딩 서열이 없는 폴리뉴클레오타이드 발현 작제물 주형(예를 들어, ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큘로바이러스)을 보유하는 숙주세포(예를 들어, 곤충 세포) 집단을, Rep 단백질의 존재 하에서, 숙주세포 내에서 ceDNA 벡터의 생산을 유도하는 데 효과적인 조건 하에서 충분한 시간 동안 인큐베이션하는 단계로서, 여기서 숙주세포는 바이러스 캡시드 코딩 서열을 포함하지 않는 단계; 및 b) 숙주세포에서 ceDNA 벡터를 수거하고 단리하는 단계. Rep 단백질의 존재는 변형된 ITR을 갖는 벡터 폴리뉴클레오타이드의 복제를 유도하여, 숙주세포에서 ceDNA 벡터를 생산한다. 하지만, 바이러스 입자(예를 들어, AAV 비리온)는 발현되지 않는다. 따라서, AAV 또는 다른 바이러스 기반 벡터에 자연적으로 부과되는 것과 같은 크기 제한이 없다.
숙주세포에서 단리된 ceDNA 벡터의 존재는, 숙주세포에서 단리된 DNA를 ceDNA 벡터 상에 단일 인식 부위를 갖는 제한 효소로 소화시키고, 소화된 DNA 물질을 미변성 겔 상에서 분석하여, 선형 및 비연속 DNA와 비교하여 선형 및 연속 DNA의 특징적인 밴드의 존재를 확인하는 방식으로 확인될 수 있다.
또 다른 양태에서, 본 개시내용은, 예를 들어 문헌[Lee, L. et al. (2013) Plos One 8(8): e69879]에 기재된 바와 같이, 비바이러스성 DNA 벡터의 생산에서 DNA 벡터 폴리뉴클레오타이드 발현 주형(ceDNA 주형)을 이의 자체 게놈에 안정적으로 통합시킨 숙주 세포주의 용도를 제공한다. 바람직하게는, Rep는 약 3의 MOI에서 숙주 세포에 첨가된다. 숙주 세포주가 포유류 세포주, 예를 들어 HEK293 세포인 경우, 상기 세포주는 안정적으로 통합된 폴리뉴클레오타이드 벡터 주형을 가질 수 있고, 헤르페스바이러스와 같은 제2 벡터를 사용하여 Rep 단백질을 세포에 도입하여, Rep 및 헬퍼 바이러스의 존재 하에서 ceDNA의 절제 및 증폭을 가능하게 할 수 있다.
하나의 구현예에서, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 제조하는 데 사용되는 숙주세포는 곤충 세포이고, 바큘로바이러스는 Rep 단백질을 인코딩하는 폴리뉴클레오타이드, 및 예를 들어 도 3a 내지 도 3c 및 실시예 1에 기재된 바와 같은 ceDNA에 대한 비바이러스성 DNA 벡터 폴리뉴클레오타이드 발현 작제물 주형을 전달하는 데 사용된다. 일부 구현예에서, 숙주세포는 Rep 단백질을 발현하도록 조작된다.
이어서, 숙주세포에서 ceDNA 벡터를 수거하고 단리한다. 상기 세포에서 본원에 기재된 ceDNA 벡터를 수거하고 수집하는 시간은, ceDNA 벡터의 고수율 생산을 달성하기 위해 선택 및 최적화될 수 있다. 예를 들어, 수거 시간은 세포 생존율, 세포 형태, 세포 성장 등의 관점에서 선택될 수 있다. 하나의 구현예에서, 세포를 충분한 조건 하에서 성장시키고, ceDNA 벡터를 생산하기 위한 바큘로바이러스 감염 후, 하지만 바큘로바이러스 독성으로 인해 세포의 대부분이 사멸되기 시작하기 전에 충분한 시간 동안 수거한다. DNA 벡터는 Qiagen Endo-Free Plasmid 키트와 같은 플라스미드 정제 키트를 사용하여 단리될 수 있다. 플라스미드 단리를 위해 개발된 다른 방법이 또한 DNA 벡터에 적용될 수 있다. 일반적으로, 임의의 핵산 정제 방법이 채택될 수 있다.
DNA 벡터는 DNA의 정제에 대해 당업자에게 알려진 임의의 수단을 통해 정제될 수 있다. 하나의 구현예에서, ceDNA 벡터는 DNA 분자로 정제된다. 또 다른 구현예에서, ceDNA 벡터는 엑소좀 또는 미세입자로 정제된다.
PAH 단백질의 발현을 위한 ceDNA 벡터의 존재는, 세포에서 단리된 벡터 DNA를 DNA 벡터 상에 단일 인식 부위를 갖는 제한 효소로 소화시키고, 소화 및 미소화된 DNA 물질을 겔 전기영동을 사용하여 분석하여, 선형 및 비연속 DNA와 비교하여 선형 및 연속 DNA의 특징적인 밴드의 존재를 확인하는 방식으로 확인될 수 있다. 도 3c도 3d는, 본원의 공정에 의해 생산된 폐쇄형 ceDNA 벡터의 존재를 확인하는 하나의 구현예를 예시한다.
VII. 약학적 조성물
또 다른 양태에서, 약학적 조성물이 제공된다. 약학적 조성물은 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와, 약학적으로 허용 가능한 담체 또는 희석제를 포함한다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 세포, 조직 또는 기관으로의 생체내 전달을 위해 대상에게의 투여에 적합한 약학적 조성물에 혼입될 수 있다. 전형적으로, 약학적 조성물은 본원에 개시된 바와 같은 ceDNA 벡터와 약학적으로 허용 가능한 담체를 포함한다. 예를 들어, 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 치료용 투여(예를 들어, 비경구 투여)의 목적하는 경로에 적합한 약학적 조성물에 혼입될 수 있다. 고압 정맥내 또는 동맥내 주입뿐 아니라, 핵내 미세주사 또는 세포질내 주사와 같은 세포내 주사를 통한 수동적 조직 전달이 또한 고려된다. 치료 목적의 약학적 조성물은 용액, 마이크로에멀젼, 분산액, 리포좀, 또는 높은 ceDNA 벡터 농도에 적합한 다른 정렬된 구조로 제형화될 수 있다. 멸균 주사액은, 필요한 경우 상기 열거된 성분 중 하나 또는 이들의 조합을 갖는 적절한 완충액 중에 필요한 양의 ceDNA 벡터 화합물을 혼입시켜 제조할 수 있고, 이어서 ceDNA 벡터를 포함하는 여과 멸균된 것을 제형화하여 핵산의 전이유전자를 수용자의 세포에 전달함으로써, 그 안의 전이유전자 또는 공여체 서열의 치료적 발현을 유도할 수 있다. 상기 조성물은 또한 약학적으로 허용 가능한 담체를 포함할 수 있다.
PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 약학적 활성 조성물은 다양한 목적을 위한 전이유전자를 세포, 예를 들어 대상의 세포에 전달하도록 제형화될 수 있다.
치료 목적을 위한 약학적 조성물은 전형적으로 제조 및 저장 조건 하에서 멸균되고 안정해야 한다. 상기 조성물은 용액, 마이크로에멀젼, 분산액, 리포좀, 또는 높은 ceDNA 벡터 농도에 적합한 다른 정렬된 구조로 제형화될 수 있다. 멸균 주사액은, 필요한 경우 상기 열거된 성분 중 하나 또는 이들의 조합을 갖는 적절한 완충액 중에 필요한 양의 ceDNA 벡터 화합물을 혼입시킨 후, 여과 멸균하는 방식으로 제조될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 국소, 전신, 양막내, 경막내, 두개내, 동맥내, 정맥내, 림프내, 복강내, 피하, 기관, 조직내(예를 들어, 근육내, 심장내, 간내, 신장내, 뇌내), 경막내, 방광내, 결막(예를 들어, 안와외, 안와내, 안와후방, 망막내, 망막하, 맥락막, 맥락막하, 간질내, 전방내 및 유리체내), 달팽이관내 및 점막(예를 들어, 구강, 설하, 비강) 투여에 적합한 약학적 조성물에 혼입될 수 있다. 고압 정맥내 또는 동맥내 주입뿐 아니라, 핵내 미세주사 또는 세포질내 주사와 같은 세포내 주사를 통한 수동적 조직 전달이 또한 고려된다.
일부 양태에서, 본원에 제공된 방법은 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 하나 이상의 ceDNA 벡터를 숙주세포에 전달하는 것을 포함한다. 또한, 이러한 방법에 의해 생산된 세포, 및 이러한 세포로부터 생산되거나 이러한 세포를 포함하는 유기체(예컨대, 동물, 식물 또는 진균)가 본원에 제공된다.핵산의 전달 방법은 리포펙션, 뉴클레오펙션, 미세주사, 유전자총, 리포좀, 면역리포좀(immunoliposome), 다가양이온 또는 지질:핵산 접합체, 네이키드 DNA, 및 DNA의 작용제 증강된 흡수를 포함할 수 있다. 리포펙션은, 예를 들어 미국 특허 제5,049,386호, 제4,946,787호 및 제4,897,355호(이들은 그 전문이 본원에 참조로서 인용됨)에 기재되어 있으며, 리포펙션 시약은 상업적으로 시판되고 있다(예를 들어, Transfectam™ 및 Lipofectin™). 전달은 세포(예를 들어, 시험관내 또는 생체외 투여) 또는 표적 조직(예를 들어, 생체내 투여)으로 이루어질 수 있다.
핵산을 세포에 전달하는 다양한 기술 및 방법이 당업계에 알려져 있다. 예를 들어, PAH 단백질의 발현을 위한 ceDNA와 같은 핵산은 지질 나노입자(LNP), 리피도이드, 리포좀, 지질 나노입자, 리포플렉스 또는 코어-쉘 나노입자로 제형화될 수 있다. 전형적으로, LNP는 핵산(예를 들어, ceDNA) 분자, 하나 이상의 이온화 가능하거나 양이온성인 지질(또는 이의 염), 하나 이상의 비이온성 또는 중성 지질(예를 들어, 인지질), 응집을 방지하는 분자(예를 들어, PEG 또는 PEG-지질 접합체), 및 선택적으로 스테롤(예를 들어, 콜레스테롤)로 구성된다.
PAH 단백질의 발현을 위한 ceDNA와 같은 핵산을 세포에 전달하는 또 다른 방법은, 핵산을 세포에 의해 내재화된 리간드와 접합시키는 것이다. 예를 들어, 리간드는 세포 표면 상의 수용체에 결합하여 세포내이입을 통해 내재화될 수 있다. 리간드는 핵산의 뉴클레오타이드에 공유결합으로 연결될 수 있다. 핵산을 세포에 전달하기 위한 예시적인 접합체는, 예를 들어 국제 특허 출원 공개 WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO2004/090108, WO2004/091515 및 WO2017/177326에 기재되어 있으며, 상기 모든 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
PAH 단백질의 발현을 위한 ceDNA 벡터와 같은 핵산은 또한 트랜스펙션에 의해 세포에 전달될 수 있다. 유용한 트랜스펙션 방법에는, 비제한적으로, 지질 매개 트랜스펙션, 양이온성 중합체 매개 트랜스펙션 또는 인산칼슘 침전이 포함된다. 트랜스펙션 시약은 당업계에 널리 알려져 있으며, 이에는, 비제한적으로, TurboFect 트랜스펙션 시약(Thermo Fisher Scientific), Pro-Ject 시약(Thermo Fisher Scientific), TRANSPASS™ P 단백질 트랜스펙션 시약(New England Biolabs), CHARIOT™ 단백질 전달 시약(Active Motif), PROTEOJUICE™ 단백질 트랜스펙션 시약(EMD Millipore), 293fectin, LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000(Thermo Fisher Scientific), LIPOFECTAMINE™(Thermo Fisher Scientific), LIPOFECTIN™(Thermo Fisher Scientific), DMRIE-C, CELLFECTIN™(Thermo Fisher Scientific), OLIGOFECTAMINE™(Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™(Roche, Basel, Switzerland), FUGENE™ HD(Roche), TRANSFECTAM™(Transfectam, Promega, Madison, Wis.), TFX-10™(Promega), TFX-20™(Promega), TFX-50™(Promega), TRANSFECTIN™(BioRad, Hercules, Calif.), SILENTFECT™(Bio-Rad), Effectene™(Qiagen, Valencia, Calif.), DC-chol(Avanti Polar Lipids), GENEPORTER™(Gene Therapy Systems, San Diego, Calif.), DHARMAFECT 1™(Dharmacon, Lafayette, Colo.), DHARMAFECT 2™(Dharmacon), DHARMAFECT 3™(Dharmacon), DHARMAFECT 4™(Dharmacon), ESCORT™ III(Sigma, St. Louis, Mo.) 및 ESCORT™ IV(Sigma Chemical Co.)가 포함된다. ceDNA와 같은 핵산은, 또한 당업자에게 알려진 미세유체 방법을 통해 세포에 전달될 수 있다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 또한 생체내 세포의 형질도입을 위해 유기체에 직접 투여될 수 있다. 투여는, 비제한적으로, 주사, 주입, 국소 적용 및 전기천공을 포함하는, 분자를 혈액 또는 조직 세포와의 궁극적 접촉에 도입하는 데 통상적으로 사용되는 경로 중 임의의 것에 의해 이루어져 있다. 이러한 핵산을 투여하는 적합한 방법이 이용 가능하고 당업자에 널리 알려져 있으며, 하나 초과의 경로가 특정 조성물을 투여하는 데 사용될 수 있지만, 특정 경로가 종종 또 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.
핵산 벡터의 도입 방법에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 미국 특허 제5,928,638호(이는 그 전문이 본원에 참조로서 인용됨)에 기재된 방법에 따라 조혈줄기세포에 전달될 수 있다.
본 개시내용에 따른 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 세포 또는 표적 기관으로의 전달을 위해 리포좀에 첨가될 수 있다. 리포좀은 적어도 하나의 지질 이중층을 보유하는 소포이다. 리포좀은 의약품 개발의 맥락에서 약물/치료제 전달을 위한 담체로서 전형적으로 사용된다. 이는, 세포막과 융합하고 지질 구조를 재배치하여 약물 또는 활성 약학 성분(API)을 전달하는 방식으로 작동한다. 이러한 전달을 위한 리포좀 조성물은 인지질, 특히 포스파티딜콜린기를 갖는 화합물로 구성되지만, 이러한 조성물은 다른 지질을 또한 포함할 수 있다. 예시적인 리포좀 및 리포좀 제형(비제한적으로, 폴리에틸렌 글리콜(PEG) 관능기 함유 화합물을 포함함)은, 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042 및 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242(예를 들어, "약학적 제형"이라는 제목의 섹션 참조)에 개시되어 있으며, 상기 문헌 각각의 내용은 그 전문이 본원에 참조로서 인용된다.
당업계에 알려진 다양한 전달 방법 또는 이의 변형을 사용하여 시험관내 또는 생체내에서 ceDNA 벡터를 전달할 수 있다. 예를 들어, 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 표적화된 세포로의 DNA 유입이 용이하도록 기계적, 전기적, 초음파, 유체역학적 또는 레이저 기반 에너지에 의해 세포막에 일시적으로 침투하는 방식으로 전달된다. 예를 들어, ceDNA 벡터는 세포막을 일시적으로 파괴하거나, 크기 제한 채널을 통해 세포를 밀어넣거나, 또는 당업계에 알려진 다른 수단에 의해 전달될 수 있다. 일부 경우에, ceDNA 벡터만 네이키드 DNA로서 간, 신장, 담낭, 전립선, 부신, 심장, 장, 폐 및 위, 피부, 흉선, 심장근 또는 골격근에서 선택되는 임의의 하나 이상의 조직에 직접 주사된다. 일부 경우에, ceDNA 벡터는 유전자 총에 의해 전달된다. 캡시드 미함유 AAV 벡터로 코팅된 금 또는 텅스텐 구형 입자(직경 1 μm 내지 3 μm)는 가압 가스에 의해 고속으로 가속화되어 표적 조직세포에 침투할 수 있다.
PAH 단백질의 발현을 위한 ceDNA 벡터와 약학적으로 허용 가능한 담체를 포함하는 조성물이 구체적으로 본원에서 고려된다. 일부 구현예에서, ceDNA 벡터는 지질 전달 시스템, 예를 들어 본원에 기재된 바와 같은 리포좀을 이용하여 제형화된다. 일부 구현예에서, 이러한 조성물은 숙련된 의사에 의해 임의의 목적하는 경로로 투여된다. 상기 조성물은 경구, 비경구, 설하, 경피, 직장, 경점막, 국소, 흡입, 협측 투여, 흉막내, 정맥내, 동맥내, 복강내, 피하, 근육내, 비강내, 경막내 및 관절내, 또는 이들의 조합을 포함하는 상이한 경로로 대상에게 투여될 수 있다. 수의학적 사용을 위해, 상기 조성물은 통상의 수의학적 관행에 따라 적합하게 허용 가능한 제형으로 투여될 수 있다. 수의사는 특정 동물에 가장 적절한 투여 방식 및 투여 경로를 용이하게 결정할 수 있다. 상기 조성물은 전형적인 시린지, 무바늘 주사 장치, "미세사출법(microprojectile bombardment) 유전자 총", 또는 전기천공("EP"), 유체역학적 방법 또는 초음파와 같은 다른 물리적 방법에 의해 투여될 수 있다.
일부 경우에, PAH 단백질의 발현을 위한 ceDNA 벡터는 유체역학적 주사에 의해 전달되는데, 이는 임의의 수용성 화합물 및 입자를 사지 전체의 내부 기관 및 골격근에 직접 세포내 전달하기 위한 간단하고 매우 효율적인 방법이다.
일부 경우에, PAH 단백질의 발현을 위한 ceDNA 벡터는 DNA 입자의 내부 기관 또는 종양 세포로의 세포내 전달을 용이하게 하기 위해 막 내에 나노범위 공극을 만들어 초음파를 통해 전달되므로, 플라스미드 DNA의 크기 및 농도는 상기 시스템의 효율에 큰 역할을 한다. 일부 경우에, ceDNA 벡터는 핵산을 함유하는 입자를 표적세포 내로 농축시키기 위해 자기장을 사용하는 자기주입법(magnetofection)을 통해 전달된다.
일부 경우에, 양이온성 리포좀/미셀 또는 양이온성 중합체에 속하는 다가양이온성 나노머 입자에 의한 음으로 하전된 핵산의 압축을 포함하는, 예를 들어 나노머 복합체를 사용하는 화학적 전달 시스템이 사용될 수 있다. 전달 방법에 사용되는 양이온성 지질에는, 비제한적으로, 1가 양이온성 지질, 다가 양이온성 지질, 구아닌 함유 화합물, 콜레스테롤 유도체 화합물, 양이온성 중합체(예를 들어, 폴리(에틸렌이민), 폴리-L-리신, 프로타민, 다른 양이온성 중합체) 및 지질-중합체 하이브리드가 포함된다.
A. 엑소좀:
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 엑소좀에 패키징되는 방식으로 전달된다. 엑소좀은 다소포체와 원형질막의 융합 후 세포외 환경으로 방출되는 세포내이입 기원의 작은 막 소포이다. 이의 표면은 공여체 세포의 세포막 유래의 지질 이중층으로 이루어져 있으며, 엑소좀을 생산한 세포의 세포질을 함유하고, 표면에 모세포(parental cell)의 막 단백질을 나타낸다. 엑소좀은 상피세포, B 및 T 림프구, 비만세포(MC)뿐 아니라, 수지상세포(DC)를 포함하는 다양한 세포 유형에 의해 생성된다. 일부 구현예에서, 직경이 10 nm 내지 1 μm, 20 nm 내지 500 nm, 30 nm 내지 250 nm, 50 nm 내지 100 nm인 엑소좀이 사용을 위해 고려된다. 엑소좀은 이의 공여체 세포를 사용하거나 특정 핵산을 도입하는 방식으로 표적세포로의 전달을 위해 단리될 수 있다. 당업계에 알려진 다양한 접근법을 사용하여 본 개시내용의 캡시드 미함유 AAV 벡터를 함유하는 엑소좀을 생성할 수 있다.
A. 미세입자/나노입자
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 지질 나노입자에 의해 전달된다. 일반적으로, 지질 나노입자는, 예를 들어 문헌[Tam et al. (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507]에 개시된 바와 같은, 이온화 가능한 아미노 지질(예를 들어, 헵타트리아콘타-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노에이트, DLin-MC3-DMA, 포스파티딜콜린(1,2-디스테아로일-sn-글리세로-3-포스포콜린, DSPC), 콜레스테롤 및 코트 지질(폴리에틸렌 글리콜-디미리스톨글리세롤, PEG-DMG)을 포함한다.
일부 구현예에서, 지질 나노입자의 평균 직경은 약 10 nm 내지 약 1000 nm이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 300 nm 미만이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 약 10 nm 내지 약 300 nm이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 200 nm 미만이다. 일부 구현예에서, 지질 나노입자의 평균 직경은 약 25 nm 내지 약 200 nm이다. 일부 구현예에서, 지질 나노입자 제제(예를 들어, 복수의 지질 나노입자를 포함하는 조성물)는, 평균 크기(예를 들어, 직경)가 약 70 nm 내지 약 200 nm이고, 전형적으로 평균 크기가 약 100 nm 이하인 크기 분포를 갖는다.
당업계에 알려진 다양한 지질 나노입자를 사용하여 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 전달할 수 있다. 예를 들어, 지질 나노입자를 사용하는 다양한 전달 방법은 미국 특허 제9,404,127호, 제9,006,417호 및 제9,518,272호에 기재되어 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 금 나노입자에 의해 전달된다. 일반적으로, 핵산은, 예를 들어 문헌[Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083]에 기재된 바와 같이, 금 나노입자에 공유결합으로 결합되거나, 금 나노입자에 비공유결합으로 결합될 수 있다(예를 들어, 전하-전하 상호작용에 의해 결합됨). 일부 구현예에서, 금 나노입자-핵산 접합체는, 예를 들어 미국 특허 제6,812,334호에 기재된 방법을 사용하여 생성된다.
B. 접합체
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 세포 흡수를 증가시키는 작용제에 접합된다(예를 들어, 공유결합으로 결합됨). "세포 흡수를 증가시키는 작용제"는 지질 막을 통한 핵산의 수송을 용이하게 하는 분자이다. 예를 들어, 핵산은 친유성 화합물(예를 들어, 콜레스테롤, 토코페롤 등), 세포 침투 펩타이드(CPP)(예를 들어, 페네트라틴(penetratin), TAT, Syn1B, 등) 및 폴리아민(예를 들어, 스페르민(spermine))에 접합될 수 있다. 세포 흡수를 증가시키는 작용제의 추가 예는, 예를 들어 문헌[Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809]에 개시되어 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 중합체(예를 들어, 중합체 분자) 또는 폴레이트 분자(예를 들어, 엽산 분자)에 접합된다. 일반적으로, 중합체에 접합된 핵산의 전달은 당업계에 알려져 있으며, 예를 들어 WO2000/34343 및 WO2008/022309에 기재되어 있다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 미국 특허 제8,987,377호에 기재된 바와 같이 폴리(아미드) 중합체에 접합된다. 일부 구현예에서, 본 개시내용에 기재된 핵산은 미국 특허 제8,507,455호에 기재된 바와 같이 엽산 분자에 접합된다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 미국 특허 제8,450,467호 기재된 바와 같이 탄수화물에 접합된다.
C. 나노캡슐
대안적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 나노캡슐 제형이 사용될 수 있다. 나노캡슐은 일반적으로 안정적이고 재현 가능한 방식으로 물질을 포획할 수 있다. 세포내 중합체 과부하로 인한 부작용을 회피하기 위해, 이러한 초미세 입자(크기 약 0.1 μm)는 생체내에서 분해될 수 있는 중합체를 사용하여 설계되어야 한다. 이러한 요건을 충족시키는 생분해성 폴리알킬-시아노아크릴레이트 나노입자가 사용을 위해 고려된다.
D. 리포좀
본 개시내용에 따른 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 세포 또는 표적 기관으로의 전달을 위해 리포좀에 첨가될 수 있다. 리포좀은 적어도 하나의 지질 이중층을 보유하는 소포이다. 리포좀은 의약품 개발의 맥락에서 약물/치료제 전달을 위한 담체로서 전형적으로 사용된다. 이는, 세포막과 융합하고 지질 구조를 재배치하여 약물 또는 활성 약학 성분(API)을 전달하는 방식으로 작동한다. 이러한 전달을 위한 리포좀 조성물은 인지질, 특히 포스파티딜콜린기를 갖는 화합물로 구성되지만, 이러한 조성물은 다른 지질을 또한 포함할 수 있다.
리포좀의 형성 및 사용은 일반적으로 당업자에게 알려져 있다. 리포좀은 개선된 혈청 안정성 및 순환 반감기를 갖도록 개발되었다(미국 특허 제5,741,516호). 나아가, 잠재적인 약물 담체로서의 리포좀 및 리포좀 유사 제제의 다양한 방법이 기재되어 있다(미국 특허 제5,567,434호; 제5,552,157호; 제5,565,213호; 제5,738,868호 및 제5,795,587호(이들은 그 전문이 본원에 참조로서 인용됨)).
E. 예시적인 리포좀 및 지질 나노입자(LNP) 조성물
본 개시내용에 따른 PAH 단백질의 발현을 위한 ceDNA 벡터는 세포, 예를 들어 전이유전자의 발현을 필요로 하는 세포로의 전달을 위해 리포좀에 첨가될 수 있다. 리포좀은 적어도 하나의 지질 이중층을 보유하는 소포이다. 리포좀은 의약품 개발의 맥락에서 약물/치료제 전달을 위한 담체로서 전형적으로 사용된다. 이는, 세포막과 융합하고 지질 구조를 재배치하여 약물 또는 활성 약학 성분(API)을 전달하는 방식으로 작동한다. 이러한 전달을 위한 리포좀 조성물은 인지질, 특히 포스파티딜콜린기를 갖는 화합물로 구성되지만, 이러한 조성물은 다른 지질을 또한 포함할 수 있다.
ceDNA를 포함하는 지질 나노입자(LNP)는 2018년 9월 7일자 출원된 국제 출원 PCT/US2018/050042 및 2018년 12월 6일자 출원된 국제 출원 PCT/US2018/064242(이들은 그 전문이 본원에 참조로서 인용됨)에 개시되어 있으며, 이는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 위한 방법 및 조성물에의 사용을 위해 고려된다.
일부 양태에서, 본 개시내용은 면역원성/항원성을 감소시키고, 화합물(들)에 친수성 및 소수성을 제공하고, 투여 빈도를 감소시킬 수 있는 폴리에틸렌 글리콜(PEG) 관능기(소위 "PEG화 화합물")를 갖는 하나 이상의 화합물을 포함하는 리포좀 제형을 제공한다. 또는, 리포좀 제형은 단순히 추가 구성요소로서 폴리에틸렌 글리콜(PEG) 중합체를 포함한다. 이러한 양태에서, PEG 또는 PEG 관능기의 분자량은 62 Da 내지 약 5,000 Da일 수 있다.
일부 양태에서, 본 개시내용은 수시간 내지 수주의 기간에 걸쳐 연장 방출 또는 제어 방출 프로파일로 API를 전달하는 리포좀 제형을 제공한다. 일부 관련 양태에서, 리포좀 제형은 지질 이중층에 의해 결합된 수성 챔버를 포함할 수 있다. 다른 관련 양태에서, 리포좀 제형은 수시간 내지 수주의 기간에 걸쳐 API를 방출하는 승온에서 물리적 전이를 거치는 구성요소로 API를 캡슐화한다.
일부 양태에서, 리포좀 제형은 스핑고미엘린과, 본원에 개시된 하나 이상의 지질을 포함한다. 일부 양태에서, 리포좀 제형은 옵티좀을 포함한다.
일부 양태에서, 본 개시내용은 N-(카르보닐-메톡시폴리에틸렌 글리콜 2000)-1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민 소듐 염, (디스테아로일-sn-글리세로-포스포에탄올아민), MPEG(메톡시 폴리에틸렌 글리콜)-접합된 지질, HSPC(수소첨가된 대두 포스파티딜콜린); PEG(폴리에틸렌 글리콜); DSPE(디스테아로일-sn-글리세로-포스포에탄올아민); DSPC(디스테아로일포스파티딜콜린); DOPC(디올레오일포스파티딜콜린); DPPG(디팔미토일포스파티딜글리세롤); EPC(달걀 포스파티딜콜린); DOPS(디올레오일포스파티딜세린); POPC(팔미토일올레오일포스파티딜콜린); SM(스핑고미엘린); MPEG(메톡시 폴리에틸렌 글리콜); DMPC(디미리스토일 포스파티딜콜린); DMPG(디미리스토일 포스파티딜글리세롤); DSPG(디스테아로일포스파티딜글리세롤); DEPC(디에루코일포스파티딜콜린); DOPE(디올레오일-sn-글리세로-포스포에탄올아민), 콜레스테릴 설페이트(CS), 디팔미토일포스파티딜글리세롤(DPPG), DOPC(디올레오일-sn-글리세로-포스파티딜콜린) 또는 이들의 임의의 조합에서 선택되는 하나 이상의 지질을 포함하는 리포좀 제형을 제공한다.
일부 양태에서, 본 개시내용은 인지질, 콜레스테롤 및 PEG화 지질을 56:38:5의 몰비로 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 리포좀 제형의 전체 지질 함량은 2 mg/mL 내지 16 mg/mL이다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 에탄올아민 관능기를 함유하는 지질 및 PEG화 지질을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 에탄올아민 관능기를 함유하는 지질 및 PEG화 지질을, 각각, 3:0.015:2의 몰비로 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 콜레스테롤 및 PEG화 지질을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질과 콜레스테롤을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, PEG화 지질은 PEG-2000-DSPE이다. 일부 양태에서, 본 개시내용은 DPPG, 대두 PC, MPEG-DSPE 지질 접합체 및 콜레스테롤을 포함하는 리포좀 제형을 제공한다.
일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 하나 이상의 지질과 에탄올아민 관능기를 함유하는 하나 이상의 지질을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 포스파티딜콜린 관능기를 함유하는 지질, 에탄올아민 관능기를 함유하는 지질, 및 스테롤, 예를 들어 콜레스테롤 중 하나 이상을 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 리포좀 제형은 DOPC/ DEPC; 및 DOPE를 포함한다.
일부 양태에서, 본 개시내용은 하나 이상의 약학적 부형제, 예를 들어 수크로오스 및/또는 글리신을 추가로 포함하는 리포좀 제형을 제공한다.
일부 양태에서, 본 개시내용은 단일라멜라 또는 다중라멜라 구조의 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 다소포성 입자 및/또는 발포체 기반 입자를 포함하는 리포좀 제형을 제공한다. 일부 양태에서, 본 개시내용은 통상의 나노입자에 비해 크기가 크고, 크기가 약 150 nm 내지 250 nm인 리포좀 제형을 제공한다. 일부 양태에서, 리포좀 제형은 동결건조된 분말이다.
일부 양태에서, 본 개시내용은 리포좀 외부에 단리된 ceDNA를 갖는 혼합물에 약염기를 첨가하여, 본원에 개시 또는 기재된 ceDNA 벡터로 제조되고 로딩되는 리포좀 제형을 제공한다. 이러한 첨가는 리포좀 외부의 pH를 대략 7.3으로 증가시키고, API를 리포좀으로 유도한다. 일부 양태에서, 본 개시내용은 리포좀 내부에서 산성인 pH를 갖는 리포좀 제형을 제공한다. 이러한 경우에, 리포좀의 내부는 pH 4 내지 6.9, 더욱 바람직하게는 pH 6.5일 수 있다. 다른 양태에서, 본 개시내용은 리포좀내 약물 안정화 기술을 사용하여 제조된 리포좀 제형을 제공한다. 이러한 경우에, 중합체성 또는 비중합체성의 고도로 하전된 음이온과, 리포좀내 포획제, 예를 들어 폴리포스페이트 또는 수크로오스 옥타설페이트가 이용된다.
일부 양태에서, 본 개시내용은 ceDNA와 이온화 가능한 지질을 포함하는 지질 나노입자를 제공한다. 예를 들어, 2018년 9월 7일자 출원된 국제 특허 PCT/US2018/050042(이는 본원에 참조로서 인용됨)에 기재된 바와 같은 방법으로 수득된 ceDNA로 제조되고 로딩되는 지질 나노입자 제형. 이는, 이온화 가능한 지질을 양성자화하고 ceDNA/지질 회합 및 입자의 핵형성에 유용한 에너지를 제공하는, 낮은 pH에서의 에탄올성 지질과 수성 ceDNA의 고에너지 혼합에 의해 달성될 수 있다. 상기 입자는 수성 희석 및 유기 용매의 제거를 통해 추가로 안정화될 수 있다. 상기 입자는 목적하는 수준으로 농축될 수 있다.
일반적으로, 지질 입자는 약 10:1 내지 30:1의 총 지질 대 ceDNA의 (질량 또는 중량)비로 제조된다. 일부 구현예에서, 지질 대 ceDNA 비(질량/질량 비; w/w 비)는 약 1:1 내지 약 25:1, 약 10:1 내지 약 14:1, 약 3:1 내지 약 15:1, 약 4:1 내지 약 10:1, 약 5:1 내지 약 9:1, 또는 약 6:1 내지 약 9:1의 범위일 수 있다. 지질과 ceDNA의 양은 목적하는 N/P 비, 예를 들어 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 N/P 비를 제공하도록 조정될 수 있다. 일반적으로, 지질 입자 제형의 전체 지질 함량은 약 5 mg/ml 내지 약 30 mg/mL 범위일 수 있다.
이온화 가능한 지질은 전형적으로 낮은 pH에서 핵산 카고, 예를 들어 ceDNA를 응축시키고, 막 회합과 융합원성(fusogenicity)을 유도하는 데 이용된다. 일반적으로, 이온화 가능한 지질은 산성 조건 하에서, 예를 들어 6.5 이하의 pH에서 양으로 하전되거나 양성자화되는 적어도 하나의 아미노기를 포함하는 지질이다. 이온화 가능한 지질은 또한 본원에서 양이온성 지질로 지칭된다.
예시적인 이온화 가능한 지질은 국제 특허 공개 WO2015/095340, WO2015/199952, WO2018/011633, WO2017/049245, WO2015/061467, WO2012/040184, WO2012/000104, WO2015/074085, WO2016/081029, WO2017/004143, WO2017/075531, WO2017/117528, WO2011/022460, WO2013/148541, WO2013/116126, WO2011/153120, WO2012/044638, WO2012/054365, WO2011/090965, WO2013/016058, WO2012/162210, WO2008/042973, WO2010/129709, WO2010/144740, WO2012/099755, WO2013/049328, WO2013/086322, WO2013/086373, WO2011/071860, WO2009/132131, WO2010/048536, WO2010/088537, WO2010/054401, WO2010/054406, WO2010/054405, WO2010/054384, WO2012/016184, WO2009/086558, WO2010/042877, WO2011/000106, WO2011/000107, WO2005/120152, WO2011/141705, WO2013/126803, WO2006/007712, WO2011/038160, WO2005/121348, WO2011/066651, WO2009/127060, WO2011/141704, WO2006/069782, WO2012/031043, WO2013/006825, WO2013/033563, WO2013/089151, WO2017/099823, WO2015/095346 및 WO2013/086354, 및 미국 특허 공개 US2016/0311759, US2015/0376115, US2016/0151284, US2017/0210697, US2015/0140070, US2013/0178541, US2013/0303587, US2015/0141678, US2015/0239926, US2016/0376224, US2017/0119904, US2012/0149894, US2015/0057373, US2013/0090372, US2013/0274523, US2013/0274504, US2013/0274504, US2009/0023673, US2012/0128760, US2010/0324120, US2014/0200257, US2015/0203446, US2018/0005363, US2014/0308304, US2013/0338210, US2012/0101148, US2012/0027796, US2012/0058144, US2013/0323269, US2011/0117125, US2011/0256175, US2012/0202871, US2011/0076335, US2006/0083780, US2013/0123338, US2015/0064242, US2006/0051405, US2013/0065939, US2006/0008910, US2003/0022649, US2010/0130588, US2013/0116307, US2010/0062967, US2013/0202684, US2014/0141070, US2014/0255472, US2014/0039032, US2018/0028664, US2016/0317458 및 US2013/0195920에 기재되어 있으며, 모든 상기 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 하기 구조를 갖는 MC3 (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일-4-(디메틸아미노)부타노에이트(DLin-MC3-DMA 또는 MC3)이다:
Figure pct00033
.
지질 DLin-MC3-DMA는 문헌[Jayaraman et al., Angew. Chem. Int. Ed Engl. (2012), 51(34): 8529-8533]에 기재되어 있으며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 WO2015/074085에 기재된 바와 같은 지질 ATX-002이며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 이온화 가능한 지질은 국제 특허 출원 공개 WO2012/040184에 기재된 바와 같은 (13Z,16Z)-N,N-디메틸-3-노닐도코사-13,16-디엔-1-아민(화합물 32)이며, 상기 문헌의 내용은 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, 이온화 가능한 지질은 국제 특허 출원 공개 WO2015/199952에 기재된 바와 같은 화합물 6 또는 화합물 22이며, 상기 문헌의 내용은 그 전문이 본원에 참조로 인용된다.
비제한적으로, 이온화 가능한 지질은 지질 나노입자에 존재하는 총 지질의 20% 내지 90%(몰)를 차지할 수 있다. 예를 들어, 이온화 가능한 지질 몰 함량은 지질 나노입자에 존재하는 총 지질의 20% 내지 70%(몰), 30% 내지 60%(몰) 또는 40% 내지 50%(몰)일 수 있다. 일부 구현예에서, 이온화 가능한 지질은 지질 나노입자에 존재하는 총 지질의 약 50 mol% 내지 약 90 mol%를 차지한다.
일부 양태에서, 지질 나노입자는 비양이온성 지질을 추가로 포함할 수 있다. 비이온성 지질에는, 양친매성 지질, 중성 지질 및 음이온성 지질이 포함된다. 따라서, 비양이온성 지질은 중성의 하전되지 않은 지질, 쯔비터이온성(zwitterionic) 지질 또는 음이온성 지질일 수 있다. 비양이온성 지질은 전형적으로 융합원성을 증강시키는 데 이용된다.
본원에 개시된 바와 같은 방법 및 조성물에 사용하기 위해 고려되는 예시적인 비양이온성 지질은 2018년 9월 7일자 출원된 국제 특허 출원 PCT/US2018/050042 및 2018년 12월 6일자 출원된 PCT/US2018/064242에 기재되어 있으며, 상기 문헌들은 각각 그 전문이 본원에 참조로서 인용된다. 예시적인 비양이온성 지질은 국제 출원 공개 WO2017/099823 및 미국 특허 공개 US2018/0028664에 기재되어 있으며, 상기 문헌의 내용은 모두 그 전문이 본원에 참조로서 인용된다.
비양이온성 지질은 지질 나노입자에 존재하는 총 지질의 0 내지 30%(몰)를 차지할 수 있다. 예를 들어, 비양이온성 지질 함량은 지질 나노입자에 존재하는 총 지질의 5% 내지 20%(몰) 또는 10% 내지 15%(몰)이다. 다양한 구현예에서, 이온화 가능한 지질 대 중성 지질의 몰비는 약 2:1 내지 약 8:1 범위이다.
일부 구현예에서, 지질 나노입자는 임의의 인지질을 포함하지 않는다. 일부 양태에서, 지질 나노입자는 막 온전성을 제공하기 위해 스테롤과 같은 구성요소를 추가로 포함할 수 있다.
지질 나노입자에 사용될 수 있는 하나의 예시적인 스테롤은 콜레스테롤 및 이의 유도체이다. 예시적인 콜레스테롤 유도체는 국제 특허 출원 공개 WO2009/127060 및 미국 특허 출원 공개 US2010/0130588에 기재되어 있으며, 상기 문헌들의 내용은 그 전문이 본원에 참조로 인용된다.
스테롤과 같은 막 온전성을 제공하는 구성요소는, 지질 나노입자에 존재하는 총 지질의 0 내지 50%(몰)를 차지할 수 있다. 일부 구현예에서, 이러한 구성요소는 지질 나노입자의 총 지질 함량의 20% 내지 50%(몰) 또는 30% 내지 40%(몰)이다.
일부 양태에서, 지질 나노입자는 폴리에틸렌 글리콜(PEG) 또는 접합된 지질 분자를 추가로 포함할 수 있다. 일반적으로, 이들은 지질 나노입자의 응집을 저해하고/하거나 입체 안정화를 제공하기 위해 사용된다. 예시적인 접합된 지질에는, 비제한적으로, PEG-지질 접합체, 폴리옥사졸린(POZ)-지질 접합체, 폴리아미드-지질 접합체(예컨대, ATTA-지질 접합체), 양이온성 중합체-지질(CPL) 접합체, 및 이들의 혼합물이 포함된다. 일부 구현예에서, 접합된 지질 분자는 PEG-지질 접합체, 예를 들어 (메톡시 폴리에틸렌 글리콜)-접합된 지질이다. 예시적인 PEG-지질 접합체에는, 비제한적으로, PEG-디아실글리세롤(DAG)(예컨대, 1-(모노메톡시-폴리에틸렌글리콜)-2,3-디미리스토일글리세롤(PEG-DMG)), PEG-디알킬옥시프로필(DAA), PEG-인지질, PEG-세라미드(Cer), peg화 포스파티딜에탄올아민(PEG-PE), PEG 숙시네이트 디아실글리세롤(PEGS-DAG)(예컨대, 4-O-(2',3'-디(테트라데카노일옥시)프로필-1-O-(w-메톡시(폴리에톡시)에틸) 부탄디오에이트(PEG-S-DMG)), PEG 디알콕시프로필카르밤, N-(카르보닐-메톡시폴리에틸렌 글리콜 2000)-1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민 소듐 염, 또는 이들의 혼합물이 포함된다. 추가의 예시적인 PEG-지질 접합체는, 예를 들어 미국 특허 또는 특허 출원 공개 US5,885,613, US6,287,591, US2003/0077829, US2003/0077829, US2005/0175682, US2008/0020058, US2011/0117125, US2010/0130588, US2016/0376224 및 US2017/0119904에 기재되어 있으며, 모든 상기 문헌들의 내용은 그 전문이 본원에 참조로 인용된다.
일부 구현예에서, PEG-지질은 특허 출원 공개 US2018/0028664에 정의된 바와 같은 화합물이며, 상기 문헌의 내용은 그 전문이 본원에 참조로 인용된다. 일부 구현예에서, PEG-지질은 특허 출원 공개 US2015/0376115 또는 US2016/0376224에 개시되어 있으며, 상기 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
PEG-DAA 접합체는, 예를 들어 PEG-디라우릴옥시프로필, PEG-디미리스틸옥시프로필, PEG-디팔미틸옥시프로필 또는 PEG-디스테아릴옥시프로필일 수 있다. PEG-지질은 PEG-DMG, PEG-디라우릴글리세롤, PEG-디팔미토일글리세롤, PEG-디스테릴글리세롤, PEG-디라우릴글리카미드, PEG-디미리스틸글리카미드, PEG-디팔미토일글리카미드, PEG-디스테릴글리카미드, PEG-콜레스테롤(1-[8'-(콜레스트-5-엔-3[베타]-옥시)카르복사미도-3',6'-디옥사옥타닐]카르바모일-[오메가]-메틸-폴리(에틸렌 글리콜), PEG-DMB(3,4-디테트라데콕실벤질-[오메가]-메틸-폴리(에틸렌 글리콜)에테르) 및 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000] 중 하나 이상일 수 있다. 일부 예에서, PEG-지질은 PEG-DMG, 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000]으로 이루어진 군으로부터 선택될 수 있다.
PEG 이외의 분자와 접합된 지질이 또한 PEG-지질 대신 사용될 수 있다. 예를 들어, 폴리옥사졸린(POZ)-지질 접합체, 폴리아미드-지질 접합체(예컨대, ATTA-지질 접합체) 및 양이온성 중합체-지질(CPL) 접합체가 PEG-지질 대신 또는 이에 더하여 사용될 수 있다. 예시적인 접합된 지질, 즉, PEG-지질, (POZ)-지질 접합체, ATTA-지질 접합체 및 양이온성 중합체-지질은, 국제 특허 출원 공개 WO1996/010392, WO1998/051278, WO2002/087541, WO2005/026372, WO2008/147438, WO2009/086558, WO2012/000104, WO2017/117528, WO2017/099823, WO2015/199952, WO2017/004143, WO2015/095346, WO2012/000104, WO2012/000104 및 WO2010/006282; 미국 특허 출원 공개 US2003/0077829, US2005/0175682, US2008/0020058, US2011/0117125, US2013/0303587, US2018/0028664, US2015/0376115, US2016/0376224, US2016/0317458, US2013/0303587, US2013/0303587 및 US20110123453; 및 US 특허 US5,885,613, US6,287,591, US6,320,017 및 US6,586,559에 기재되어 있으며, 상기 모든 문헌들의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 구현예에서, 하나 이상의 추가 화합물은 치료제일 수 있다. 치료제는 치료 목적에 적합한 임의의 부류에서 선택될 수 있다. 다시 말해서, 치료제는 치료 목적에 적합한 임의의 부류에서 선택될 수 있다. 다시 말해서, 치료제는 치료 목적 및 목적하는 생물학적 작용에 따라 선택될 수 있다. 예를 들어, LNP 내 ceDNA가 PKU 치료에 유용한 경우, 추가 화합물은 항-PKU 작용제(예를 들어, 화학요법제 또는 다른 PKU 치료제(비제한적으로, 소분자 또는 항체를 포함함)일 수 있다. 또 다른 예에서, ceDNA를 함유하는 LNP이 감염의 치료에 유용한 경우, 추가 화합물은 항미생물제(예를 들어, 항생제 또는 항바이러스 화합물)일 수 있다. 또 다른 예에서, ceDNA를 함유하는 LNP이 면역 질환 또는 장애의 치료에 유용한 경우, 추가 화합물은 면역 반응을 조절하는 화합물(예를 들어, 면역억제제, 면역자극 화합물 또는 하나 이상의 특정 면역 경로를 조절하는 화합물)일 수 있다. 일부 구현예에서, 상이한 단백질 또는 상이한 화합물, 예컨대 치료제를 인코딩하는 ceDNA와 같은 상이한 화합물을 함유하는 상이한 지질 나노입자의 상이한 칵테일이, 본 개시내용의 조성물 및 방법에 사용될 수 있다.
일부 구현예에서, 추가 화합물은 면역 조절제이다. 예를 들어, 추가 화합물은 면역억제제이다. 일부 구현예에서, 추가 화합물은 면역자극제이다. 또한, 지질 나노입자 캡슐화된 곤충 세포에서 생산된 또는 합성적으로 생산된 본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터와, 약학적으로 허용 가능한 담체 또는 희석제를 포함하는 약학적 조성물이 본원에 제공된다.
일부 양태에서, 본 개시내용은 하나 이상의 약학적 부형제를 추가로 포함하는 지질 나노입자 제형을 제공한다. 일부 구현예에서, 지질 나노입자 제형은 수크로오스, 트리스, 트레할로오스 및/또는 글리신을 추가로 포함한다.
ceDNA 벡터는 입자의 지질 부분과 복합체화되거나, 지질 나노입자의 지질 위치에서 캡슐화될 수 있다. 일부 구현예에서, ceDNA는 지질 나노입자의 지질 위치에서 완전히 캡슐화되어, 예를 들어 수용액에서 뉴클레아제에 의한 분해로부터 보호될 수 있다. 일부 구현예에서, 지질 나노입자 내 ceDNA는 지질 나노입자를 37℃에서 적어도 약 20분, 30분, 45분 또는 60분 동안 뉴클레아제에 노출시킨 후 실질적으로 분해되지 않는다. 일부 구현예에서, 지질 나노입자 내 ceDNA는 상기 입자를 혈청에서 37℃에서 적어도 약 30분, 45분 또는 60분, 또는 적어도 약 2시간, 3시간, 4시간, 5시간, 6시간, 7시간, 8시간, 9시간, 10시간, 12시간, 14시간, 16시간, 18시간, 20시간, 22시간, 24시간, 26시간, 28시간, 30시간, 32시간, 34시간 또는 36시간 동안 인큐베이션한 후 실질적으로 분해되지 않는다.
특정 구현예에서, 지질 나노입자는 대상, 예를 들어 인간과 같은 포유류에 실질적으로 비독성이다. 일부 양태에서, 지질 나노입자 제형은 동결건조된 분말이다.
일부 구현예에서, 지질 나노입자는 적어도 하나의 지질 이중층을 보유하는 고체 코어 입자이다. 다른 구현예에서, 지질 나노입자는 비(non)이중층 구조, 즉, 비(non)라멜라(즉, 비이중층) 형태를 갖는다. 비제한적으로, 비이중층 형태는, 예를 들어 3차원 튜브, 막대, 입방 대칭 등을 포함할 수 있다. 예를 들어, 지질 나노입자의 형태(라멜라 대 비라멜라)는, 예를 들어 US2010/0130588에 기재된 바와 같은 Cryo-TEM 분석을 사용하여 용이하게 평가 및 특징분석될 수 있으며, 상기 문헌의 내용은 그 전문이 본원에 참조로서 인용된다.
일부 추가의 구현예에서, 비라멜라 형태를 갖는 지질 나노입자는 전자 밀도가 높다. 일부 양태에서, 본 개시내용은 단일라멜라 또는 다중라멜라 구조의 지질 나노입자를 제공한다. 일부 양태에서, 본 개시내용은 다소포성 입자 및/또는 발포체 기반 입자를 포함하는 지질 나노입자 제형을 제공한다.
지질 구성요소의 조성 및 농도를 제어하는 방식으로, 지질 접합체가 지질 입자로부터 교환되는 속도, 및 결국, 지질 나노입자가 융합원성이 되는 속도를 제어할 수 있다. 또한, 예를 들어 pH, 온도 또는 이온 강도를 포함하는 다른 변수를 사용하여, 지질 나노입자가 융합원성이 되는 속도를 변화시키고/시키거나 제어할 수 있다. 지질 나노입자가 융합원성이 되는 속도를 제어하는 데 사용될 수 있는 다른 방법이, 본 개시내용을 기반으로 당업자에게 명백할 것이다. 지질 접합체의 조성 및 농도를 제어하여 지질 입자 크기를 제어할 수 있다는 것이 또한 명백할 것이다.
제형화된 양이온성 지질의 pKa는 핵산의 전달을 위한 LNP의 효과와 상관관계가 있을 수 있다(문헌[Jayaraman et al, Angewandte Chemie, International Edition (2012), 51(34), 8529-8533]; 문헌[Semple et al, Nature Biotechnology 28, 172-176 (2010)] 참조, 상기 문헌들은 모두 그 전문이 본원에 참조로서 인용됨). pKa의 바람직한 범위는 약 5 내지 약 7이다. 양이온성 지질의 pKa는 2-(p-톨루이디노)-6-나프탈렌 설폰산(TNS)의 형광을 기반으로 하는 검정을 사용하여 지질 나노입자에서 결정될 수 있다.
VIII. 사용 방법
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 또한 관심 핵산 서열(예를 들어, PAH 단백질을 인코딩함)을 표적세포(예를 들어, 숙주 세포)로 전달하는 방법에 사용될 수 있다. 상기 방법은 특히 PAH 단백질을 이를 필요로 하는 대상의 세포에 전달하여 PKU를 치료하는 방법일 수 있다. 본 개시내용은 PAH 단백질 발현의 치료 효과가 발생하도록, 대상의 세포에서 ceDNA 벡터에 인코딩된 PAH 단백질의 생체내 발현을 가능하게 한다. 이러한 결과는 ceDNA 벡터 전달의 생체내시험관내 모델 모두에서 확인되었다.
또한, 본 개시내용은 PAH 단백질을 이를 필요로 하는 대상의 세포에 전달하는 방법으로서, 상기 PAH 단백질을 인코딩하는 본 개시내용의 ceDNA 벡터의 다회 투여를 포함하는 방법을 제공한다. 본 개시내용의 ceDNA 벡터는 캡시드화된 바이러스 벡터에 대해 통상적으로 관찰되는 바와 같은 면역반응을 유도하지 않기 때문에, 이러한 다회 투여 전략은 ceDNA 기반 시스템에서 큰 성공을 거둘 가능성이 높다. ceDNA 벡터는 목적하는 조직의 세포를 트랜스펙션시키고, 과도한 부작용 없이 충분한 수준의 유전자 전달 및 PAH 단백질의 발현을 제공하는 데 충분한 양으로 투여된다. 전형적인 및 약학적으로 허용 가능한 투여 경로에는, 비제한적으로, 망막 투여(예를 들어, 망막하 주사, 맥락막상 주사 또는 유리체내 주사), 정맥내(예를 들어, 리포좀 제형), 선택된 기관(예를 들어, 간, 신장, 담낭, 전립선, 부신, 심장, 장, 폐 및 위에서 선택되는 임의의 하나 이상의 조직)으로의 직접 전달, 근육내 및 다른 비경구 투여 경로가 포함된다. 투여 경로는, 목적하는 경우, 조합될 수 있다.
본원에 기재된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 전달은 발현된 PAH 단백질의 전달에 제한되지 않는다. 예를 들어, 본원에 기재된 바와 같이 통상적으로 생산된(예를 들어, 세포 기반 생산 방법(예를 들어, 곤충세포 생산 방법)을 사용하여) 또는 합성적으로 생산된 ceDNA 벡터는, 유전자 치료의 일부를 제공하기 위해 제공된 다른 전달 시스템과 함께 사용될 수 있다. 본 개시내용에 따른 ceDNA 벡터와 조합될 수 있는 시스템의 하나의 비제한적인 예에는, PAH 단백질을 발현하는 ceDNA 벡터의 효과적인 유전자 발현을 위한 하나 이상의 보조인자 또는 면역억제제를 별도로 전달하는 시스템이 포함된다.
본 개시내용은 또한 대상에서 PKU를 치료하는 방법으로서, 선택적으로 약학적으로 허용 가능한 담체를 포함하는 치료적 유효량의 ceDNA 벡터를, 대상의 이를 필요로 하는 표적세포(특히, 근육 세포 또는 조직)에 도입하는 단계를 포함하는 방법을 제공한다. ceDNA 벡터는 담체의 존재 하에서 도입될 수 있지만, 이러한 담체는 필요하지 않다. 선택된 ceDNA 벡터는 PKU의 치료에 유용한 PAH 단백질을 인코딩하는 핵산 서열을 포함한다. 특히, ceDNA 벡터는, 대상에게 도입될 때, 외인성 DNA 서열에 의해 인코딩된 목적하는 PAH 단백질의 전사를 지시할 수 있는 제어 요소에 작동 가능하게 연결된 목적하는 PAH 단백질 서열을 포함할 수 있다. ceDNA 벡터는 상기 및 본원의 다른 곳에 제공된 임의의 적합한 경로를 통해 투여될 수 있다.
본원에 제공된 조성물 및 벡터는 다양한 목적을 위해 PAH 단백질을 전달하는 데 사용될 수 있다. 일부 구현예에서, 전이유전자는, 예를 들어 PAH 단백질 산물의 기능을 연구하기 위해, 예를 들어 전이유전자를 보유하는 체세포 유전자도입 동물 모델을 생성하기 위해, 연구 목적으로 사용되는 PAH 단백질을 인코딩한다. 또 다른 예에서, 전이유전자는 PKU의 동물 모델을 생성하는 데 사용되는 PAH 단백질을 인코딩한다. 일부 구현예에서, 인코딩된 PAH 단백질은 포유류 대상에서 PKU 상태의 치료 또는 예방에 유용하다. PAH 단백질은 유전자의 발현 감소, 발현 결여 또는 기능장애와 연관된 PKU를 치료하는 데 충분한 양으로 환자에게 전달(예를 들어, 환자에서 발현)될 수 있다.
원칙적으로, 발현 카세트는 돌연변이로 인해 존재하지 않거나 감소된 PAH 단백질을 인코딩하거나, 과발현될 때 치료적 유익을 전달하는 것이 본 개시내용의 범위에 속하는 것으로 간주되는 핵산 또는 임의의 전이유전자를 포함할 수 있다. 바람직하게는, 삽입되지 않은 박테리아 DNA는 존재하지 않으며, 바람직하게는 본원에 제공된 ceDNA 조성물에는 박테리아 DNA가 존재하지 않는다.
ceDNA 벡터는 한 종의 ceDNA 벡터에 제한되지 않는다. 이와 같이, 또 다른 양태에서, 상이한 단백질 또는 동일한 PAH 단백질을 발현하지만, 상이한 프로모터 또는 시스-조절 요소에 작동적으로 연결된 다수의 ceDNA 벡터는, 표적 세포, 조직, 기관 또는 대상에게 동시에 또는 순차적으로 전달될 수 있다. 따라서, 이러한 전략은 동시에 다수의 단백질의 유전자 치료 또는 유전자 전달을 가능하게 할 수 있다. PAH 단백질의 상이한 부분을, 동시에 또는 상이한 시간에 투여될 수 있으며 별도로 조절될 수 있는 별개의 ceDNA 벡터(예를 들어, PAH 단백질의 기능에 필요한 상이한 도메인 및/또는 보조인자)로 분리하는 것이 가능할 수 있으며, 이를 통해 PAH 단백질의 발현 제어에 추가적인 수준을 부가할 수 있다. 바이러스 캡시드의 부재로 인한 항캡시드 숙주 면역 반응의 결여를 고려할 때, 전달은 또한 중요하게는, 임상 설정에서 유전자 치료를 위해, 후속으로 용량을 증가시키거나 감소시키면서 다회 수행될 수 있다. 캡시드가 존재하지 않기 때문에 항-캡시드 반응이 일어나지 않을 것으로 예상된다.
본 개시내용은 또한 대상에서 PKU를 치료하는 방법으로서, 선택적으로 약학적으로 허용 가능한 담체를 포함하는 치료적 유효량의 본원에 개시된 바와 같은 ceDNA 벡터를, 대상의 이를 필요로 하는 표적세포(특히, 근육 세포 또는 조직)에 도입하는 단계를 포함하는 방법을 제공한다. ceDNA 벡터는 담체의 존재 하에서 도입될 수 있지만, 이러한 담체는 필요하지 않다. 구현된 ceDNA 벡터는 PKU를 치료하는 데 유용한 관심 핵산 서열을 포함한다. 특히, ceDNA 벡터는, 대상에게 도입될 때 외인성 DNA 서열에 의해 인코딩된 목적하는 폴리펩타이드, 단백질 또는 올리고뉴클레오타이드의 전사를 지시할 수 있는 제어 요소에 작동 가능하게 연결된 목적하는 외인성 DNA 서열을 포함할 수 있다. ceDNA 벡터는 상기 및 본원의 다른 곳에 제공된 임의의 적합한 경로를 통해 투여될 수 있다.
IX. PAH 단백질 생산을 위한 ceDNA 벡터의 전달 방법
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 다양한 적합한 방법에 의해 시험관내 또는 생체내 표적세포에 전달될 수 있다. ceDNA 벡터만 적용되거나 주사될 수 있다. ceDNA 벡터는 트랜스펙션 시약 또는 다른 물리적 수단의 도움 없이 세포에 전달될 수 있다. 대안적으로, PAH 단백질의 발현을 위한 ceDNA 벡터는 DNA의 세포에의 진입을 용이하게 하는 임의의 업계 공지의 트랜스펙션 시약 또는 다른 업계 공지의 물리적 수단, 예를 들어 리포좀, 알코올, 폴리리신 풍부 화합물, 아르기닌 풍부 화합물, 인산칼슘, 미세소포, 미세주사, 전기천공 등을 사용하여 전달될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 통상적으로 다양한 전달 시약을 사용하여 통상적인 AAV 비리온으로 형질도입하기 곤란한 세포 및 조직 유형을 효율적으로 표적화할 수 있다.
본원에 기재된 기술의 하나의 양태는, PAH 단백질을 세포에 전달하는 방법에 관한 것이다. 전형적으로, 생체내시험관내 방법의 경우, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 본원에 개시된 바와 같은 방법뿐 아니라, 당업계에 알려진 다른 방법을 사용하여 세포에 도입될 수 있다. 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 바람직하게는 생물학적 유효량으로 세포에 투여된다. ceDNA 벡터가 생체내 세포(예를 들어, 대상)에 투여되는 경우, ceDNA 벡터의 생물학적 유효량은 표적세포에서 PAH 단백질의 형질도입 및 발현을 유도하는 데 충분한 양이다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 예시적인 투여 방식에는, 경구, 직장, 경점막, 비강내, 흡입(예를 들어, 에어로졸을 통해), 협측(예를 들어, 설하), 질, 경막내, 안구내, 경피, 내피내, 자궁내(또는 알내(in ovo)), 비경구(예를 들어, 정맥내, 피하, 피내, 두개내, 근육내[골격근, 횡격막근 및/또는 심장근에의 투여 포함], 흉막내, 뇌내 및 관절내)가 포함된다. 투여는 전신적으로 이루어지거나, 간 또는 다른 곳(예를 들어, 임의의 신장, 담낭, 전립선, 부신, 심장, 장, 폐 및 위)으로 직접 전달될 수 있다.
투여는 국소(예를 들어, 기도 표면을 포함한 피부 및 점막 표면, 및 경피 투여), 림프내 등뿐 아니라, 직접적인 조직 또는 기관 주사(예를 들어, 비제한적으로, 간뿐 아니라, 눈, 골격근, 심장근, 횡격막근을 포함하는 근육, 또는 뇌)로 이루어질 수 있다.
ceDNA 벡터의 투여는, 비제한적으로, 간 및/또는 또한 눈, 뇌, 골격근, 평활근, 심장, 횡격막, 기도 상피, 신장, 비장, 췌장, 피부로 이루어지는 군에서 선택되는 부위를 포함하는 대상의 임의의 부위에 이루어질 수 있다.
임의의 소정의 경우에서 가장 적합한 경로는 치료, 개선 및/또는 예방하고자 하는 병태의 특성 및 중증도에 따라, 및 사용되는 특정 ceDNA 벡터의 특성에 따라 달라질 것이다. 또한, ceDNA는 하나 초과의 PAH 단백질을 단일 벡터 또는 다수의 ceDNA 벡터(예를 들어, ceDNA 칵테일)로 투여하는 것을 가능하게 한다.
A. ceDNA 벡터의 근육내 투여
일부 구현예에서, 대상에서 질환을 치료하는 방법은, 치료적 유효량의 PAH 단백질을 인코딩하는 ceDNA 벡터를 선택적으로 약학적으로 허용 가능한 담체와 함께, 대상의 이를 필요로 하는 표적세포(특히, 근육 세포 또는 조직)에 도입하는 것을 포함한다. 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 대상의 근육 조직에 투여된다.
일부 구현예에서, ceDNA 벡터의 투여는, 비제한적으로, 골격근, 평활근, 심장, 횡격막 또는 눈의 근육으로 이루어지는 군에서 선택되는 부위를 포함하는 대상의 임의의 부위에 이루어질 수 있다.
본 개시내용에 따른 골격근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 비제한적으로, 사지(예를 들어, 상완(upper arm), 하완(lower arm), 상각(upper leg) 및/또는 하각(lower leg)), 등, 목, 머리(예를 들어, 혀), 흉곽, 복부, 골반/회음 및/또는 손(발)가락의 골격근에의 투여를 포함한다. 본원에 개시된 바와 같은 ceDNA 벡터는 정맥내 투여, 동맥내 투여, 복강내 투여, 사지 관류(선택적으로, 다리 및/또는 팔의 격리된 사지 관류; 예를 들어[Arruda et al., (2005) Blood 105: 3458-3464] 참조), 및/또는 직접 근육내 주사에 의해 골격근에 전달될 수 있다. 특정 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터는 사지 관류, 선택적으로 격리된 사지 관류에 의해(예를 들어, 정맥내 또는 관절내 투여에 의해), 대상(예를 들어, DMD와 같은 근디스트로피를 앓고 있는 대상)의 간, 눈, 사지(팔 및/또는 다리)에 투여된다. 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터는 "유체역학적" 기술을 이용하지 않고 투여될 수 있다.
예를 들어, 통상적인 바이러스 벡터의 (예를 들어, 망막으로의) 조직 전달은 종종 혈관구조의 압력을 증가시키고, 내피세포 장벽을 가로지르는 바이러스 벡터의 능력을 촉진시키는 유체역학적 기술(예를 들어, 대량의 정맥내/정맥내 투여)에 의해 증강된다. 특정 구현예에서, 본원에 기재된 ceDNA 벡터는 고용량 주입 및/또는 상승된 혈관내압(예를 들어, 정상 수축기압 초과, 예를 들어 정상 수축기압보다 혈관내압의 5%, 10%, 15%, 20%, 25% 이하의 증가)과 같은 유체역학적 기술의 부재 하에서 투여될 수 있다. 이러한 방법은 부종, 신경 손상 및/또는 구획 증후군과 같은 유체역학적 기술과 관련된 부작용을 감소시키거나 회피할 수 있다.
나아가, 골격근에 투여되는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은, 사지(예를 들어, 상완, 하완, 상각 및/또는 하각), 등, 목, 머리(예를 들어, 혀), 흉곽, 복부, 골반/회음 및/또는 손(발)가락의 골격근에 투여될 수 있다. 적합한 골격근에는, 비제한적으로, 새끼벌림근(손), 새끼벌림근(발), 엄지벌림근, 새끼중족골벌림근(abductor ossis metatarsi quinti), 짧은엄지벌림근, 긴엄지벌림근, 짧은모음근, 엄지모음근(adductor hallucis), 긴모음근, 큰모음근, 엄지모음근(adductor pollicis), 팔꿈치근, 목갈비근, 무릎관절근, 위팔두갈래근, 넙다리두갈래근, 상완근, 상완요골근, 협근, 부리위팔근, 눈썹주름근, 삼각근, 입꼬리내림근, 아래입술내림근, 이복근, 배측골간근(손), 배측골간근(발), 짧은노쪽손목폄근, 긴노쪽손목폄근, 자쪽손목폄근, 새끼폄근, 손가락폄근, 짧은발가락폄근, 긴발가락폄근, 짧은엄지폄근(extensor hallucis brevis), 긴엄지폄근(extensor hallucis longus), 집게폄근, 짧은엄지폄근(extensor pollicis brevis), 긴엄지폄근(extensor pollicis longus), 노쪽손목굽힘근, 자쪽손목굽힘근, 짧은새끼굽힘근(손), 짧은새끼굽힘근(발), 짧은발가락굽힘근, 긴발가락굽힘근, 깊은손가락굽힘근, 얕은손가락굽힘근, 짧은엄지굽힘근(flexor hallucis brevis), 긴엄지굽힘근(flexor hallucis longus), 짧은엄지굽힘근(flexor pollicis brevis), 긴엄지굽힘근(flexor pollicis longus), 전두근, 장딴지근, 턱끝목뿔근, 큰볼기근, 중간볼기근, 작은볼기근, 두덩정강근, 엉덩갈비근, 허리엉덩갈비근, 등엉덩갈비근, 엉덩근, 아래쌍동이근, 하사근, 하직근, 가시아래근, 가시사이근, 가시돌기사이근, 가쪽날개근, 가쪽곧은근, 넓은등근, 입꼬리올림근, 위입술올림근, 위입술콧방울올림근, 눈꺼풀올림근, 어깨올림근, 긴회전근, 머리가장긴근, 목가장긴근, 등가장긴근, 긴머리근, 긴목근, 충양근(손), 충양근(손), 깨물근, 안쪽날개근, 안쪽곧은근, 중사각근, 뭇갈래근, 턱목뿔근, 아래머리빗근, 위머리빗근, 바깥폐쇄근, 속폐쇄근, 후두근, 어깨목뿔근, 새끼맞섬근, 엄지맞섬근, 눈둘레근, 입둘레근, 배측골간근, 짧은손바닥근, 긴손바닥근, 두덩근, 큰가슴근, 작은가슴근, 짧은종아리근, 긴종아리근, 셋째종아리근, 궁둥구멍근, 척측골간근, 장딴지빗근, 넓은목근, 오금근, 뒤경추늑골근, 네모엎침근, 원엎침근, 큰허리근, 넙다리네모근, 발바닥네모근, 앞머리곧은근, 가쪽머리곧은근, 큰뒤머리곧은근, 작은뒤머리곧은근, 넙다리곧은근, 큰마름근, 작은마름근, 입꼬리당김근, 넙다리빗근, 최소목갈비근, 반막모양근, 반가시근, 목반가시근, 등반가시근, 반힘줄모양근, 앞톱니근, 짧은회전근, 가자미근, 머리가시근, 목가시근, 등가시근, 머리널판근, 목널판근, 흉쇄유돌근, 복장목뿔근, 복장방패근, 붓목뿔근, 빗장밑근, 어깨밑근, 위쌍동이근, 상사근, 상직근, 손뒤침근, 가시위근, 관자근, 넙다리근막긴장근, 큰원근, 작은원근, 흉부근, 갑상선골근, 앞정강근, 뒤정강근, 승모근, 위팔세갈래근, 중간넓은근, 가쪽넓은근, 안쪽넓은근, 큰광대근 및 작은광대근, 및 당업계에 알려진 임의의 다른 적합한 골격근이 포함된다.
횡격막근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 정맥내 투여, 동맥내 투여 및/또는 복강내 투여를 포함하는 임의의 적합한 방법에 의해 이루어질 수 있다. 일부 구현예에서, ceDNA 벡터로부터 발현된 전이유전자의 표적조직으로의 전달은 또한 ceDNA 벡터를 포함하는 합성 데포를 전달하는 방식(여기서 ceDNA 벡터를 포함하는 데포가 골격근, 평활근, 심장근 및/또는 횡격막근 조직에 이식됨)으로 달성될 수 있거나, 또는 근육조직을 본원에 기재된 바와 같은 ceDNA 벡터를 포함하는 필름 또는 다른 매트릭스와 접촉시킬 수 있다. 이러한 이식 가능한 매트릭스 또는 기재는 미국 특허 제7,201,898호(이는 그 전문이 본원에 참조로서 인용됨)에 기재되어 있다.
심장근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 좌심방, 우심방, 좌심실, 우심실 및/또는 격막에의 투여를 포함한다. 본원에 기재된 바와 같은 ceDNA 벡터는 정맥내 투여, 대동맥내 투여와 같은 동맥내 투여, 직접 심장 주사(예를 들어, 좌심방, 우심방, 좌심실, 우심실에) 및/또는 관상동맥 관류에 의해 심장근에 전달될 수 있다.
평활근에의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여는, 정맥내 투여, 동맥내 투여 및/또는 복강내 투여를 포함하는 임의의 적합한 방법에 의해 이루어질 수 있다. 하나의 구현예에서, 투여는 평활근에, 근처에 및/또는 위에 존재하는 내피세포에 이루어질 수 있다. 평활근의 비제한적인 예에는, 눈의 홍채, 폐의 세기관지, 후두근(성대), 위의 근육층, 식도, 위장관의 소장 및 대장, 요관, 요도의 배뇨근, 자궁근층, 음경 또는 전립선이 포함된다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 골격근, 횡격막근 및/또는 심장근에 투여된다. 대표적인 구현예에서, 본 개시내용에 따른 ceDNA 벡터는 골격근, 심장근 및/또는 횡격막근의 장애를 치료 및/또는 예방하는 데 사용된다.
구체적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은, 눈근육(예를 들어, 외직근, 내직근, 상직근, 하직근, 상사근, 하사근), 얼굴근육(예를 들어, 뒤통수이마근, 관자마루근, 눈살근, 코근, 비중격내림근, 눈둘레근, 눈썹주름근, 눈썹내림근, 귓바퀴근, 입둘레근, 입꼬리내림근, 입꼬리당김근, 큰광대근, 작은광대근, 위입술올림근, 위입술콧방울올림근, 아래입술내림근, 입꼬리올림근, 협근, 턱끝근) 또는 혀근육(예를 들어, 이설근, 설골설근, 연골설근, 경상설근, 구개설근, 상종설근, 하종설근, 설수직근 및 설횡근) 중 하나 이상의 근육에 전달될 수 있다고 고려된다.
(i) 근육내 주사:
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은, 바늘을 사용하여 대상의 소정의 근육, 예를 들어 골격근(예를 들어, 삼각근, 가쪽넓은근, 둔부의 복면근, 둔부의 배면근 또는 유아의 앞가쪽 허벅지)의 하나 이상의 부위에 주사될 수 있다. ceDNA를 포함하는 조성물은 다른 근육세포 아형에 도입될 수 있다. 근육세포 아형의 비제한적인 예에는, 골격근세포, 심장근세포, 평활근세포 및/또는 횡격막근세포가 포함된다.
근육내 주사 방법은 당업자에게 알려져 있기 때문에 본원에 상세하게 기재되어 있지 않다.
일부 구현예에서, 근육내 주사는 ceDNA 벡터의 세포 흡수를 증강시키기 위해 전기천공, 전달 압력(delivery pressure) 또는 트랜스펙션 시약의 사용과 조합될 수 있다.
(ii) 트랜스펙션 시약
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 근관 또는 근육조직으로의 벡터의 흡수를 촉진시키기 위해 하나 이상의 트랜스펙션 시약을 포함하는 조성물로 제형화된다. 따라서, 하나의 구현예에서, 본원에 기재된 핵산은 본원의 다른 곳에 기재된 방법을 사용한 트랜스펙션을 통해 근육세포, 근관 또는 근육조직에 투여된다.
(iii) 전기천공
특정 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 ceDNA의 세포로의 진입을 촉진시키는 담체의 부재 하에서, 또는 생리학적으로 불활성인 약학적으로 허용 가능한 담체(즉, 캡시드 미함유 비바이러스성 벡터의 근관으로의 흡수를 개선시키거나 증강시키지 않는 임의의 담체)의 존재 하에서 투여된다. 이러한 구현예에서, 캡시드 미함유 비바이러스성 벡터의 흡수는 세포 또는 조직의 전기천공에 의해 촉진될 수 있다.
세포막은 자연적으로 세포질로의 세포외 통과에 저항한다. 이러한 저항을 일시적으로 감소시키는 하나의 방법은, 전기장을 사용하여 세포에 영구적인 손상을 야기하지 않으면서 세포에 공극을 형성하는 "전기천공"이다. 이러한 공극은 DNA 벡터, 약학적 약물, DNA 및 다른 극성 화합물이 세포의 내부에 접근할 수 있을 만큼 충분히 크다. 시간이 경과함에 따라, 세포막의 공극이 닫혀, 세포는 다시 불투과성이 된다.
전기천공은, 예를 들어 외인성 DNA를 살아있는 세포에 도입하기 위한 시험관내생체내 적용에 모두 사용될 수 있다. 시험관내 적용은 전형적으로 살아있는 세포의 샘플을, 예를 들어 DNA를 포함하는 조성물과 혼합한다. 이어서, 세포를 평행판과 같은 전극 사이에 배치하고, 세포/조성물 혼합물에 전기장을 인가한다.
다수의 생체내 전기천공 방법이 존재하며; 전극은, 예를 들어 처리하고자 하는 세포 영역 위에 놓인 표피를 잡는 캘리퍼와 같은 다양한 구성으로 제공될 수 있다. 대안적으로, 보다 깊은 곳에 위치한 세포에 접근하기 위해 바늘 모양 전극을 조직에 삽입할 수 있다. 어느 경우든, 예를 들어 핵산을 포함하는 조성물이 처리 영역에 주사되고, 전극이 해당 영역에 전기장을 인가한다. 일부 전기천공 적용에서, 이러한 전기장은 약 10 ms 내지 60 ms 지속기간 동안 100 V/cm 내지 500 V/cm 정도의 단일 구형파 펄스를 포함한다. 이러한 펄스는, 예를 들어 BTX Division of Genetronics, Inc에서 제조한 Electro Square Porator T820의 알려진 어플리케이션에서 생성될 수 있다.
전형적으로, 예를 들어 핵산의 성공적인 흡수는 근육이 즉시 전기적으로 자극되거나, 예를 들어 근육으로의 주사에 의해 조성물이 투여된 직후에만 일어난다.
특정 구현예에서, 전기천공은 전기장의 펄스를 사용하거나, 저전압/장펄스 치료 요법을 사용하여(예를 들어, 구형파 펄스 전기천공 시스템을 사용하여) 달성된다. 펄스 전기장을 생성할 수 있는 예시적인 펄스 생성기에는, 예를 들어 지수 파형을 생성할 수 있는 ECM600과 구형파 형태를 생성할 수 있는 ElectroSquarePorator(T820)(둘 모두 Genetronics, Inc(San Diego, Calif.)의 사업부인 BTX에서 입수 가능함)이 포함된다. 구형파 전기천공 시스템은 설정된 전압까지 빠르게 상승하고, 설정된 시간(펄스 길이) 동안 해당 수준을 유지한 후, 빠르게 0으로 떨어지는 제어된 전기 펄스를 전달한다.
일부 구현예에서, 본원에 기재된 바와 같은 캡시드 미함유 비바이러스성 벡터를 포함하는 조성물의 존재 하에서 조직의 전기천공과 관련이 있을 수 있는 통증을 감소시키기 위해, 예를 들어 국소 마취제가 치료 부위에 주사로 투여된다. 또한, 당업자는 근육의 섬유증, 괴사 또는 염증을 유발하는 과도한 조직 손상을 최소화 및/또는 방지하는 조성물의 용량을 선택해야 한다는 것을 이해할 것이다.
(iv) 전달 압력
일부 구현예에서, 근육 조직으로의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 전달은, 대용량과 사지로 공급하는 동맥(예를 들어, 장골동맥)으로의 신속한 주사의 조합을 사용하는 전달 압력에 의해 촉진된다. 이러한 투여 방식은, 전형적으로 혈관 클램프의 지혈대를 사용하여 근육이 전신 순환으로부터 분리되는 동안, ceDNA 벡터를 포함하는 조성물을 사지 혈관계에 주입하는 것을 포함하는 다양한 방법을 통해 달성될 수 있다. 하나의 방법에서, 상기 조성물은 사지 혈관계를 통해 순환하여 세포로의 혈관외유출을 가능하게 한다. 또 다른 방법에서, 혈관내 유체역학적 압력을 증가시켜, 혈관층을 확장시키고, 근육 세포 또는 조직으로의 ceDNA 벡터의 흡수를 증가시킨다. 하나의 구현예에서, ceDNA 조성물은 동맥 내로 투여된다.
(v) 지질 나노입자 조성물
일부 구현예에서, 근육내 전달을 위한 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 본원의 다른 곳에 기재된 바와 같은 리포좀을 포함하는 조성물로 제형화된다.
(vi) 근육 조직을 표적으로 하는 ceDNA 벡터의 전신 투여
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 간접 전달 투여를 통해 근육을 표적화하도록 제형화되며, 여기서 ceDNA는 간이 아니라 근육으로 수송된다. 따라서, 본원에 기재된 기술은, 예를 들어 전신 투여에 의한, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물의 근육 조직으로의 간접 투여를 포함한다. 이러한 조성물은 국소적으로, 정맥내로(볼루스 또는 연속 주입으로), 세포내 주사로, 조직내 주사로, 경구로, 흡입으로, 복강내로, 피하로, 공동내로 투여될 수 있으며, 목적하는 경우, 연동 수단을 통해, 또는 당업자에게 알려진 다른 수단을 통해 전달될 수 있다. 작용제는, 목적하는 경우, 예를 들어 정맥내 주입에 의해 전신으로 투여될 수 있다.
일부 구현예에서, 근육 세포/조직으로의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 흡수는, 벡터를 근육 조직으로 우선적으로 지시하는 표적화 작용제 또는 모이어티를 사용하여 증가된다. 따라서, 일부 구현예에서, 캡시드 미함유 ceDNA 벡터는 신체의 다른 세포 또는 조직에 존재하는 캡시드 미함유 ceDNA 벡터의 양과 비교하여 근육 조직에 농축될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 조성물은 근육 세포에 대한 표적화 모이어티를 추가로 포함한다. 다른 구현예에서, 발현된 유전자 산물은 작용하고자 의도된 조직에 특이적인 표적화 모이어티를 포함한다. 표적화 모이어티는 세포 또는 조직의 세포내, 세포 표면 또는 세포외 바이오마커를 표적화하고, 이와 상호작용하고, 이와 커플링하고/하거나 이와 결합할 수 있는 임의의 분자 또는 분자의 복합체를 포함할 수 있다. 바이오마커는, 예를 들어 세포 프로테아제, 키나아제, 단백질, 세포 표면 수용체, 지질 및/또는 지방산을 포함할 수 있다. 표적화 모이어티가 표적화, 상호작용, 커플링 및/또는 결합할 수 있는 바이오마커의 다른 예에는, 특정 질환과 관련된 분자가 포함된다. 예를 들어, 바이오마커는 표피 성장 인자 수용체 및 트랜스페린 수용체와 같은 암 발달과 관련이 있는 세포 표면 수용체를 포함할 수 있다. 표적화 모이어티는, 비제한적으로, 표적 근육 조직에서 발현되는 분자에 결합하는, 합성 화합물, 천연 화합물 또는 산물, 거대분자 엔티티, 생명공학적으로 조작된 분자(예를 들어, 폴리펩타이드, 지질, 폴리뉴클레오타이드, 항체, 항체 단편) 및 작은 엔티티(예를 들어, 소분자, 신경전달물질, 기질, 리간드, 호르몬 및 원소 화합물)를 포함할 수 있다.
특정 구현예에서, 표적화 모이어티는, 예를 들어 표적세포의 특정 목적하는 분자를 자연적으로 인식하는 수용체를 포함하는 수용체 분자를 추가로 포함할 수 있다. 이러한 수용체 모이어티에는, 표적 분자와의 상호작용 특이성을 증가시키도록 변형된 수용체, 해당 수용체에 의해 자연적으로 인식되지 않는 목적하는 표적 분자와 상호작용하도록 변형된 수용체, 및 이러한 수용체의 단편이 포함된다(예를 들어, 문헌[Skerra, 2000, J. Molecular Recognition, 13:167-187] 참조). 바람직한 수용체는 케모카인 수용체이다. 예시적인 케모카인 수용체는, 예를 들어 문헌[Lapidot et al, 2002, Exp Hematol, 30:973-81] 및 문헌[Onuffer et al, 2002, Trends Pharmacol Sci, 23:459-67]에 기재되어 있다.
다른 구현예에서, 추가의 표적화 모이어티는, 예를 들어 트랜스페린(Tf) 리간드와 같은, 표적세포의 특정 목적하는 수용체를 자연적으로 인식하는 리간드를 포함하는 리간드 분자를 포함할 수 있다. 이러한 리간드 분자에는, 표적 수용체와의 상호작용 특이성을 증가시키도록 변형된 리간드, 해당 리간드에 의해 자연적으로 인식되지 않는 목적하는 수용체와 상호작용하도록 변형된 리간드, 및 이러한 리간드의 단편이 포함된다.
또 다른 구현예에서, 표적화 모이어티는 압타머를 포함할 수 있다. 압타머는 표적세포의 목적하는 분자 구조에 특이적으로 결합하도록 선택된 올리고뉴클레오타이드이다. 압타머는 전형적으로 파지 디스플레이의 친화성 선별과 유사한 친화성 선별 과정(시험관내 분자 진화로도 알려짐)의 산물이다. 이러한 과정은, 예를 들어 질환이 있는 면역원에 결합하는 고체 지지체를 사용한 후, 폴리머라아제 연쇄 반응(PCR)을 사용하여 면역원이 결합된 핵산을 증폭시키는 친화성 분리의 여러 차례 탠덤 반복을 수행하는 것을 포함한다. 따라서, 각 회차의 친화성 분리는 목적하는 면역원에 성공적으로 결합하는 분자의 핵산 집단을 풍부하게 한다. 이러한 방식으로, 핵산의 랜덤 풀은 표적 분자에 특이적으로 결합하는 압타머를 생성하도록 "교육"될 수 있다. 압타머는 전형적으로 RNA이지만, 비제한적으로, 펩타이드 핵산(PNA) 및 포스포로티오에이트 핵산과 같은 DNA 또는 이의 유사체 또는 유도체일 수 있다.
일부 구현예에서, 표적화 모이어티는, 예를 들어 캡시드 미함유 비바이러스성 벡터 또는 유전자 산물이 특정 조직을 표적화하도록 집속된 광선의 빔으로부터 방출되는 광분해성 리간드(즉, '케이징된(caged)' 리간드)를 포함할 수 있다.
상기 조성물이 대상의 하나 이상의 근육 내 여러 부위로 전달되는 것이 또한 고려된다. 즉, 주사는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개의 주사 부위에 이루어질 수 있다. 이러한 부위는 단일 근육 영역에 퍼져 있을 수 있거나, 여러 근육에 분포되어 있을 수 있다.
B. 비근육 위치에의 PAH 단백질의 발현을 위한 ceDNA 벡터의 투여
또 다른 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 간에 투여된다. ceDNA 벡터는 또한 각막 및/또는 시신경과 같은 눈의 상이한 영역에 투여될 수 있다. ceDNA 벡터는 또한 척수, 뇌간(연수, 교뇌), 중뇌(시상하부, 시상, 시상상부, 뇌하수체, 흑색질, 송과체), 소뇌, 종뇌(선조체, 후두엽, 측두엽, 두정엽 및 전두엽을 포함하는 대뇌, 피질, 기저핵, 해마 및 편도체), 변연계, 신피질, 선조체, 대뇌 및 하구에 도입될 수 있다. ceDNA 벡터는 (예를 들어, 요추천자에 의해) 뇌척수액에 전달될 수 있다. PAH 단백질의 발현을 위한 ceDNA 벡터는 나아가 혈액-뇌 장벽이 교란된 상황(예를 들어, 뇌종양 또는 뇌경색)에서 CNS에 혈관내 투여될 수 있다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 비제한적으로, 경막내, 안구내, 뇌내, 심실내, 정맥내(예를 들어, 만니톨과 같은 당의 존재 하에서), 비강내, 이내, 안구내(예를 들어, 유리체내, 망막하, 전방) 및 안구주위(예를 들어, 테논낭하(sub-Tenon's region)) 전달뿐 아니라, 운동 뉴런으로의 역행 전달을 통한 근육내 전달을 포함하는, 당업계에 알려진 임의의 경로를 통해 눈의 목적하는 영역(들)에 투여될 수 있다.
일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는 직접 주사(예를 들어, 정위주사)를 통해 액체 제형으로 CNS 내 목적하는 영역 또는 구획에 투여된다. 다른 구현예에서, ceDNA 벡터는 목적하는 영역에의 국소 적용 또는 에어로졸 제형의 비강내 투여를 통해 제공될 수 있다. 눈에의 투여는 액체 방울의 국소 적용을 통해 이루어질 수 있다. 추가의 대안으로서, ceDNA 벡터는 고체 서방형 제형으로 투여될 수 있다(예를 들어, 미국 특허 제7,201,898호 참조). 추가의 구현예에서, ceDNA 벡터는 운동 뉴런과 관련된 질환 및 장애(예를 들어, 근위축성 측삭경화증(ALS); 척수성근위축(SMA) 등)를 치료, 개선 및/또는 예방하기 위한 역행 수송에 사용될 수 있다. 예를 들어, ceDNA 벡터는 뉴런으로 이동할 수 있는 근육 조직에 전달될 수 있다.
C. 생체외 치료
일부 구현예에서, 대상에서 세포가 제거되고, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 그 안에 도입된 후, 세포가 다시 대상에 배치된다. 생체외 치료를 위해 대상에서 세포를 제거한 후, 다시 대상에게 도입하는 방법은 당업계에 알려져 있다(예를 들어, 미국 특허 제5,399,346호; 상기 문헌의 개시내용은 그 전문이 본원에 참조로서 인용됨). 대안적으로, ceDNA 벡터는 또 다른 대상의 세포, 배양된 세포 또는 임의의 다른 적합한 공급원의 세포에 도입되며, 세포는 이를 필요로 하는 대상에게 투여된다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터로 형질도입된 세포는 바람직하게는 약학적 담체와 조합으로 "치료적 유효량"으로 대상에게 투여된다. 당업자는, 일부 유익이 대상에게 제공되는 한, 치료 효과가 완전하거나 치유적일 필요가 없다는 것을 이해할 것이다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 시험관내, 생체외 또는 생체내 세포에서 생산되는 본원에 기재된 바와 같은 PAH 단백질(때때로 전이유전자 또는 이종 뉴클레오타이드 서열로 지칭됨)을 인코딩할 수 있다. 예를 들어, 본원에 논의된 바와 같은 치료 방법에서의 본원에 기재된 ceDNA 벡터의 사용과 대조적으로, 일부 구현예에서, PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 항체 및 융합 단백질의 생산을 위해 배양된 세포 및 이러한 세포로부터 단리된 발현된 PAH 단백질에 도입될 수 있다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 배양된 세포는, 예를 들어 항체 또는 융합 단백질의 소규모 또는 대규모 생물제조(biomanufacturing)를 위한 세포 공급원으로서 작용하여, 항체 또는 융합 단백질의 상업적 생산을 위해 사용될 수 있다. 대안적인 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 소규모 생산뿐 아니라 상업적 대규모 PAH 단백질 생산을 포함하는 항체 또는 융합 단백질의 생체내 생산을 위해, 숙주 비인간 대상의 세포에 도입된다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 수의학적 및 의학적 적용 모두에 사용될 수 있다. 상기 기재된 바와 같은 생체외 유전자 전달 방법에 적합한 대상에는, 조류(예를 들어, 닭, 오리, 거위, 메추라기, 칠면조 및 꿩) 및 포유류(예를 들어, 인간, 소, 양, 염소, 말, 고양이, 개 및 토끼)가 모두 포함되며, 이 중 포유류가 바람직하다. 인간 대상이 가장 바람직하다. 인간 대상에는, 신생아, 유아, 청소년 및 성인이 포함된다.
D. 용량 범위
본원에 기재된 바와 같은 PAH 단백질을 인코딩하는 ceDNA 벡터를 포함하는 조성물의 유효량을 대상에게 투여하는 단계를 포함하는 치료 방법이 본원에 제공된다. 당업자가 이해하는 바와 같이, "유효량"이라는 용어는, PKU의 치료를 위한 "치료적 유효량"으로 PAH 단백질의 발현을 유도하는, 투여된 ceDNA 조성물의 양을 나타낸다.
생체내 및/또는 시험관내 검정은 선택적으로 사용을 위한 최적 투여량 범위를 확인하는 것을 돕기 위해 이용될 수 있다. 제형에 이용되는 정확한 용량은 또한 투여 경로, 및 병태의 중증도에 따라 달라질 것이며, 당업자의 판단 및 각 대상의 상황에 따라 결정되어야 한다. 유효 용량은, 예를 들어 시험관내 또는 동물 모델 시험 시스템에서 유도된 용량 반응 곡선에서 추론될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 목적하는 조직의 세포를 트랜스펙션시키고, 과도한 부작용 없이 충분한 수준의 유전자 전달 및 발현을 제공하는 데 충분한 양으로 투여된다. 통상적이고 약학적으로 허용 가능한 투여 경로에는, 비제한적으로, 선택된 기관에의 직접 전달(예를 들어, 간에의 문맥내 전달), 경구, 흡입(비강내 및 기관내 전달 포함), 안구내, 정맥내, 근육내, 피하, 피내, 종양내 및 다른 비경구 투여 경로와 같은 "투여" 섹션에 상기 기재된 것들이 포함된다. 투여 경로는, 목적하는 경우, 조합될 수 있다.
특정 "치료 효과"를 달성하는 데 필요한 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 양의 용량은, 비제한적으로, 핵산 투여 경로, 치료 효과를 달성하는 데 필요한 유전자 또는 RNA 발현 수준, 치료하고자 하는 특정 질환 또는 장애, 및 유전자(들), RNA 산물(들) 또는 생성되는 발현된 단백질(들)의 안정성을 포함하는 몇 가지 인자에 기반하여 달라질 것이다. 당업자는, 상기 언급된 인자뿐 아니라, 당업계에 널리 알려진 다른 인자를 기반으로, 특정 질환 또는 장애를 앓고 있는 환자를 치료하기 위한 ceDNA 벡터 용량 범위를 용이하게 결정할 수 있다.
투여 요법은 최적 치료 반응을 제공하도록 조정될 수 있다. 예를 들어, 올리고뉴클레오타이드는 반복적으로 투여될 수 있으며, 예를 들어 수회 용량이 매일 투여될 수 있거나, 용량이 치료 상황의 긴급성에 따라 지시된 바와 같이 비례적으로 감소될 수 있다. 당업자는 올리고뉴클레오타이드가 세포에 투여되는지 대상에 투여되는지에 관계없이, 대상 올리고뉴클레오타이드의 적절한 용량 및 투여 스케줄을 용이하게 결정할 수 있을 것이다.
"치료적 유효 용량"은 임상 시험을 통해 결정될 수 있는 비교적 넓은 범위에 속할 것이며, 특정 적용에 따라 달라질 것이다(신경세포는 매우 소량을 필요로 하지만, 전신 주사는 많은 양을 필요로 할 수 있음). 예를 들어, 인간 대상의 골격 또는 심장 근육에의 직접 생체내 주사의 경우, 치료적 유효 용량은 약 1 ㎍ 내지 100 g의 ceDNA 벡터 정도일 것이다. 엑소좀 또는 미세입자가 ceDNA 벡터를 전달하는 데 사용되는 경우, 치료적 유효 용량은 실험적으로 결정될 수 있지만, 1 ㎍ 내지 약 100 g의 벡터를 전달할 것으로 예측된다. 나아가, 치료적 유효 용량은 질환의 하나 이상의 증상의 감소를 유도하지만, 유의한 표적외 또는 유의한 부작용을 초래하지 않는, 대상에게 영향을 미치는 데 충분한 양의 전이유전자를 발현시키는 ceDNA 벡터의 양이다. 하나의 구현예에서, "치료적 유효 용량"은 PKU 바이오마커의 발현의 통계적으로 유의하고 측정 가능한 변화 또는 소정의 질환 증상의 감소를 생성하는 데 충분한 발현된 PAH 단백질의 양이다. 이러한 유효량은 소정의 ceDNA 벡터 조성물에 대한 임상 시험 및 동물 연구에서 측정될 수 있다.
약학적으로 허용 가능한 부형제와 담체 용액의 제형은, 다양한 치료 요법에서 본원에 기재된 특정 조성물을 사용하는 적합한 투여 및 치료 요법의 개발과 마찬가지로, 당업자에게 널리 알려져 있다.
시험관내 트랜스펙션의 경우, 세포(1x106개의 세포)에 전달되는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 유효량은, 0.1 ㎍ 내지 100 ㎍, 바람직하게는 1 ㎍ 내지 20 ㎍, 더욱 바람직하게는 1 ㎍ 내지 15 ㎍ 또는 8 ㎍ 내지 10 ㎍ 정도의 ceDNA 벡터일 것이다. ceDNA 벡터가 클수록 더 높은 용량이 필요할 것이다. 엑소좀 또는 미세입자가 사용되는 경우, 효과적인 시험관내 용량은 실험적으로 결정될 수 있지만, 일반적으로 동일한 양의 ceDNA 벡터를 전달하도록 의도될 것이다.
PKU의 치료를 위해, 본원에 개시된 바와 같은 PAH 단백질을 발현시키는 ceDNA 벡터의 적절한 투여량은, 치료하고자 하는 질환의 특정 유형, PAH 단백질의 유형, PKU 질환의 중증도 및 경과, 이전 치료, 환자의 임상 이력 및 항체에 대한 반응, 및 주치의의 재량에 따라 달라질 것이다. PAH 단백질을 인코딩하는 ceDNA 벡터는 한 번에 또는 일련의 치료에 걸쳐 적합하게 투여된다. 비제한적으로, 다양한 시점에 걸친 단회 또는 다회 투여, 볼루스 투여, 및 펄스 주입을 포함하는 다양한 투약 스케쥴이 본원에서 고려된다.
질환의 유형 및 중증도에 따라, ceDNA 벡터는, 인코딩된 PAH 단백질이 약 0.3 mg/㎏ 내지 100 mg/㎏(예를 들어, 15 mg/㎏ 내지 100 mg/㎏, 또는 상기 범위 내 임의의 투여량)으로 발현되는 양으로, 1회 이상의 개별 투여 또는 연속 주입으로 투여된다. ceDNA 벡터의 하나의 전형적인 1일 투여량은, 상기 언급된 인자에 따라, 인코딩된 PAH 단백질을 약 15 mg/㎏ 내지 100 mg/㎏ 또는 그 이상의 범위로 발현시키는 데 충분한 양이다. ceDNA 벡터의 하나의 예시적인 용량은, 본원에 개시된 바와 같은 인코딩된 PAH 단백질을 약 10 mg/㎏ 내지 약 50 mg/㎏의 범위로 발현시키는 데 충분한 양이다. 따라서, 인코딩된 PAH 단백질을 약 0.5 mg/㎏, 1 mg/㎏, 1.5 mg/㎏, 2.0 mg/㎏, 3 mg/㎏, 4.0 mg/㎏, 5 mg/㎏, 10 mg/㎏, 15 mg/㎏, 20 mg/㎏, 25 mg/㎏, 30 mg/㎏, 35 mg/㎏, 40 mg/㎏, 50 mg/㎏, 60 mg/㎏, 70 mg/㎏, 80 mg/㎏, 90 mg/㎏ 또는 100 mg/㎏(또는 이들의 임의의 조합)으로 발현시키는 데 충분한 양으로의 ceDNA 벡터의 1회 이상의 용량이 환자에게 투여될 수 있다. 일부 구현예에서, ceDNA 벡터는 인코딩된 PAH 단백질을 50 mg 내지 2500 mg 범위의 총 용량으로 발현시키는 데 충분한 양이다. ceDNA 벡터의 예시적인 용량은, 인코딩된 PAH 단백질을 총 약 50 mg, 약 100 mg, 200 mg, 300 mg, 400 mg, 약 500 mg, 약 600 mg, 약 700 mg, 약 720 mg, 약 1000 mg, 약 1050 mg, 약 1100 mg, 약 1200 mg, 약 1300 mg, 약 1400 mg, 약 1500 mg, 약 1600 mg, 약 1700 mg, 약 1800 mg, 약 1900 mg, 약 2000 mg, 약 2050 mg, 약 2100 mg, 약 2200 mg, 약 2300 mg, 약 2400 mg 또는 약 2500 mg(또는 이들의 임의의 조합)으로 발현시키는 데 충분한 양이다. ceDNA 벡터로부터 PAH 단백질의 발현이 본원의 조절 스위치, 또는 대안적으로 대상에게 투여된 ceDNA 벡터의 다회 용량에 의해 조심스럽게 제어될 수 있기 때문에, ceDNA 벡터로부터 PAH 단백질의 발현은, 발현된 PAH 단백질의 용량이 간헐적으로, 예를 들어 ceDNA 벡터로부터 매주, 2주마다, 3주마다, 4주마다, 매월, 2개월마다, 3개월마다 또는 6개월마다 투여될 수 있는 방식으로 제어될 수 있다. 이러한 요법의 진행은 통상적인 기술 및 검정으로 모니터링될 수 있다.
특정 구현예에서, ceDNA 벡터는 인코딩된 PAH 단백질을 15 mg/㎏, 30 mg/㎏, 40 mg/㎏, 45 mg/㎏, 50 mg/㎏, 60 mg/㎏의 용량, 또는 고정 용량, 예를 들어 300 mg, 500 mg, 700 mg, 800 mg 또는 그 이상으로 발현시키는 데 충분한 양으로 투여된다. 일부 구현예에서, ceDNA 벡터로부터 PAH 단백질의 발현은, PAH 단백질이 일정 기간 동안 매일, 2일마다, 매주, 2주마다 또는 4주마다 발현되도록 제어된다. 일부 구현예에서, ceDNA 벡터로부터 PAH 단백질의 발현은, PAH 단백질이 일정 기간 동안 2주마다 또는 4주마다 발현되도록 제어된다. 특정 구현예에서, 일정 기간은 6개월, 1년, 18개월, 2년, 5년, 10년, 15년, 20년 또는 환자의 일생이다.
치료는 단회 투여 또는 다회 투여를 포함할 수 있다. 일부 구현예에서, 1회 초과의 용량이 대상에게 투여될 수 있으며; ceDNA 벡터는 바이러스 캡시드의 부재로 인해 항캡시드 숙주 면역 반응을 일으키지 않기 때문에, 사실 필요한 경우 다회 용량이 투여될 수 있다. 이와 같이, 당업자는 적절한 용량의 횟수를 용이하게 결정할 수 있다. 투여되는 용량의 횟수는, 예를 들어 1회 내지 100회, 바람직하게는 2회 내지 20회 용량 정도일 수 있다.
임의의 특정 이론에 구애됨 없이, 본 개시내용에 기재된 바와 같은 ceDNA 벡터의 투여에 의해 유발된 전형적인 항바이러스 면역 반응의 결여는(즉, 캡시드 구성요소의 부재)는, PAH 단백질의 발현을 위한 ceDNA 벡터가 숙주에 여러 차례 투여되는 것을 가능하게 한다. 일부 구현예에서, 핵산, 예를 들어 이종 핵산이 대상에게 전달되는 경우의 횟수는, 2회 내지 10회 범위(예를 들어, 2회, 3회, 4회, 5회, 6회, 7회, 8회, 9회 또는 10회)이다. 일부 구현예에서, ceDNA 벡터는 대상에게 10회 초과로 전달된다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 용량은 대상에게 달력일(calendar day)(예를 들어, 24시간 기간)당 1회 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 2달력일, 3달력일, 4달력일, 5달력일, 6달력일 또는 7달력일당 1회 이하로 투여된다. 일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 용량은 대상에게 달력주(calendar week)(예를 들어, 7달력일)당 1회 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 2주에 1회(예를 들어, 2달력주 기간 중 1회) 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 달력달(calendar month)당 1회(예를 들어, 30달력일 중 1회) 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 6달력달당 1회 이하로 투여된다. 일부 구현예에서, ceDNA 벡터의 용량은 대상에게 달력년(예를 들어, 365일 또는 윤년의 경우 366일)당 1회 이하로 투여된다.
특정 구현예에서, 다양한 간격의 기간, 예를 들어 매일, 매주, 매월, 매년 등에 걸쳐 목적하는 수준의 유전자 발현을 달성하기 위해, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 1회 초과의 투여(예를 들어, 2회, 3회, 4회 또는 그 이상의 투여)가 이용될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터에 의해 인코딩된 치료용 PAH 단백질은, 이것이 대상에서 적어도 1시간, 적어도 2시간, 적어도 5시간, 적어도 10시간, 적어도 12시간, 적어도 18시간, 적어도 24시간, 적어도 36시간, 적어도 48시간, 적어도 72시간, 적어도 1주, 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 6개월, 적어도 12개월/1년, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 15년, 적어도 20년, 적어도 30년, 적어도 40년, 적어도 50년 또는 그 이상 동안 대상에서 발현되도록, 조절 스위치, 유도성 또는 억제성 프로모터에 의해 제어될 수 있다. 하나의 구현예에서, 발현은 선결된 또는 목적하는 간격으로 본원에 기재된 ceDNA 벡터를 반복 투여하는 방식으로 달성될 수 있다. 대안적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 질환의 실질적으로 영구적인 치료 또는 "치유"를 위해, PAH 단백질을 인코딩하는 하나 이상의 핵산 서열의 삽입을 가능하게 하는 유전자 편집 시스템의 구성요소(예를 들어, CRISPR/Cas, TALEN, 아연 핑거 엔도뉴클레아제 등)를 추가로 포함할 수 있다. 유전자 편집 구성요소를 포함하는 이러한 ceDNA 벡터는 국제 출원 PCT/US18/64242에 개시되어 있으며, PAH 단백질을 인코딩하는 핵산을 알부민 유전자 또는 CCR5 유전자를 포함하지 않는 세이프 하버 영역에 삽입하기 위해, 5' 및 3' 상동성 아암(예를 들어, 서열번호 151 내지 154, 또는 이와 적어도 40%, 50%, 60%, 70% 또는 80%의 상동성을 갖는 서열)을 포함할 수 있다. 예로서, PAH 단백질을 발현하는 ceDNA 벡터는, 2019년 3월 1일자 출원된 국제 특허 출원 PCT/US2019/020225(이는 그 전문이 본원에 참조로서 인용됨)에 개시되어 있는, PAH 전이유전자의 게놈 세이프 하버에의 삽입을 위한 적어도 하나의 게놈 세이프 하버(GSH) 특이적 상동성 아암을 포함할 수 있다.
치료 지속기간은 대상의 임상 진행과 치료에 대한 반응성에 따라 달라진다. 초기의 높은 치료 용량 후, 지속적이고 상대적으로 낮은 유지 용량이 고려된다.
E. 단위 투여 형태
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는 약학적 조성물은 편리하게 단위 투여 형태로 존재할 수 있다. 단위 투여 형태는 전형적으로 약학적 조성물의 하나 이상의 특정 투여 경로에 맞게 조정될 수 있다. 일부 구현예에서, 단위 투여 형태는 눈에 직접 투여되는 점적액으로 조정된다. 일부 구현예에서, 단위 투여 형태는 흡입에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 기화기에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 분무기에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 에어로졸 생성기에 의한 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 경구 투여, 협측 투여 또는 설하 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 정맥내, 근육내 또는 피하 투여에 맞게 조정된다. 일부 구현예에서, 단위 투여 형태는 망막하 주사, 맥락막상 주사 또는 유리체내 주사에 맞게 조정된다.
일부 구현예에서, 단위 투여 형태는 경막내 또는 뇌실내 투여에 맞게 조정된다. 일부 구현예에서, 약학적 조성물은 국소 투여용으로 제형화된다. 단일 투여 형태를 생성하기 위해 담체 물질과 조합될 수 있는 활성 성분의 양은, 일반적으로 치료 효과를 생성하는 화합물의 양일 수 있다.
X. 치료 방법
본원에 기재된 기술은 또한 상기 개시된 PAH 단백질의 발현을 위한 ceDNA 벡터를 제조하는 방법뿐 아니라, 예를 들어 생체외, 현장외, 시험관내생체내 적용, 방법론, 진단 절차 및/또는 유전자 치료 요법을 포함하는 다양한 방식으로 사용하는 방법을 나타낸다.
하나의 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터로부터 발현된 치료용 PAH 단백질은 질환의 치료에 기능성이 있다. 바람직한 구현예에서, 치료용 PAH 단백질은, 목적하지 않는 경우, 면역계 반응을 야기하지 않는다.
대상에서 PKU를 치료하는 방법으로서, 치료적 유효량의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를, 선택적으로 약학적으로 허용 가능한 담체와 함께, 대상의 이를 필요로 하는 표적세포(예를 들어, 근육 세포 또는 조직, 또는 다른 병든 세포 유형)에 도입하는 단계를 포함하는 방법이 본원에 제공된다. ceDNA 벡터는 담체의 존재 하에서 도입될 수 있지만, 이러한 담체는 필요하지 않다. 구현된 ceDNA 벡터는 질환을 치료하는 데 유용한 본원에 기재된 바와 같은 PAH 단백질을 인코딩하는 핵산 서열을 포함한다. 특히, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 대상에게 도입될 때, 외인성 DNA 서열에 의해 인코딩된 목적하는 PAH 단백질의 전사를 지시할 수 있는 제어 요소에 작동 가능하게 연결된 목적하는 PAH 단백질 DNA 서열을 포함할 수 있다. 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 상기 및 본원의 다른 곳에 제공된 임의의 적합한 경로를 통해 투여될 수 있다.
하나 이상의 본 개시내용의 ceDNA 벡터를, 하나 이상의 약학적으로 허용 가능한 완충제, 희석제 또는 부형제와 함께 포함하는, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터 조성물 및 제형이 본원에 개시된다. 이러한 조성물은 PKU의 하나 이상의 증상을 진단, 예방, 치료 또는 개선시키기 위한, 하나 이상의 진단용 또는 치료용 키트에 포함될 수 있다. 하나의 양태에서, 질환, 손상, 장애, 외상 또는 기능장애는 인간의 질환, 손상, 장애, 외상 또는 기능장애이다.
본원에 기재된 기술의 또 다른 양태는, 진단적 또는 치료적 유효량의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 이를 필요로 하는 대상에게 제공하는 방법으로서, 본원에 개시된 바와 같은 ceDNA 벡터의 양을 이를 필요로 하는 대상의 세포, 조직 또는 기관에; ceDNA 벡터로부터 PAH 단백질의 발현을 가능하게 하는 데 효과적인 시간 동안 제공하여, 대상에게 ceDNA 벡터에 의해 발현되는 진단적 또는 치료적 유효량의 PAH 단백질을 제공하는 단계를 포함하는 방법을 제공한다. 추가의 양태에서, 대상은 인간이다.
본원에 기재된 기술의 또 다른 양태는, 대상에서 PKU, 장애, 기능장애, 손상, 비정상적인 병태 또는 외상의 적어도 하나 이상의 증상을 진단, 예방, 치료 또는 개선하는 방법을 제공한다. 전반적이고 일반적인 의미에서, 상기 방법은 적어도, 하나 이상의 상기 개시된 PAH 단백질 생산을 위한 ceDNA 벡터를, 이를 필요로 하는 대상에게, 대상에서 질환, 장애, 기능장애, 손상, 비정상적인 병태 또는 외상의 하나 이상의 증상을 진단, 예방, 치료 또는 개선하는 데 충분한 양으로 충분한 시간 동안 투여하는 단계를 적어도 포함한다. 이러한 구현예에서, 대상은 PAH 단백질의 효능, 또는 대안적으로, 대상 내 PAH 단백질 또는 PAH 단백질의 조직 위치(세포 및 세포하 위치 포함) 검출을 위해 평가될 수 있다. 이와 같이, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, 예를 들어 암 또는 다른 적응증의 검출을 위한 생체내 진단 도구로서 사용될 수 있다. 추가의 양태에서, 대상은 인간이다.
또 다른 양태는, PKU 또는 질환 상태의 하나 이상의 증상을 치료하거나 감소시키는 도구로서의 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터의 용도이다. 결함이 있는 유전자가 알려진 다수의 유전 질환이 존재하며, 이는 전형적으로 2개의 부류로 분류된다: 일반적으로 열성 방식으로 유전되는 효소의 결핍 상태, 및 조절 또는 구조 단백질이 관여할 수 있으며, 전형적으로 우성 방식으로 유전되지만, 항상 우성 방식으로 유전되는 것은 아닌 불균형 상태. 불균형 질환 상태의 경우, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 모델 시스템에서 PKU 상태를 생성하기 위해 사용될 수 있으며, 이는 질환 상태에 대응하기 위한 노력으로 사용될 수 있다. 따라서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 유전 질환의 치료를 가능하게 한다. 본원에 사용된 PKU 상태는, 질환을 유발하거나 이를 더 중증으로 만드는 결핍 또는 불균형을 부분적으로 또는 전체적으로 개선하는 방식으로 치료된다.
A. 숙주세포
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 PAH 단백질 전이유전자를 대상 숙주세포로 전달한다. 일부 구현예에서, 상기 세포는 광수용체 세포이다. 일부 구현예에서, 상기 세포는 RPE 세포이다. 일부 구현예에서, 대상 숙주세포는, 예를 들어 혈액세포, 줄기세포, 조혈세포, CD34+ 세포, 간세포, 암세포, 혈관세포, 근육세포, 췌장세포, 신경세포, 안구 또는 망막 세포, 상피 또는 내피 세포, 수지상세포, 섬유아세포를 포함하는 인간 숙주세포, 또는 비제한적으로, 간의(hepatic)(즉, 간) 세포, 폐세포, 심장세포, 췌장세포, 장세포, 횡격막세포, 신장의(renal)(즉, 신장) 세포, 신경세포, 혈액세포, 골수세포, 또는 유전자 치료가 고려되는 대상의 임의의 하나 이상의 선택된 조직세포를 포함하는 포유류 기원의 임의의 다른 세포이다. 하나의 양태에서, 대상 숙주세포는 인간 숙주세포이다.
본 개시내용은 또한 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터를 포함하는, 상기 언급된 바와 같은 재조합 숙주세포에 관한 것이다. 따라서, 당업자에게 자명한 바와 같이 목적에 따라 다양한 숙주세포를 사용할 수 있다. 공여체 서열을 포함하는 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 작제물 또는 ceDNA 벡터는, 공여체 서열이 이전에 기재된 바와 같이 염색체 통합체로 유지되도록 숙주세포에 도입된다. 숙주세포라는 용어는, 복제 동안 발생하는 돌연변이로 인해 모세포와 동일하지 않은 모세포의 임의의 자손을 포함한다. 숙주세포의 선택은 공여체 서열 및 이의 공급원에 따라 크게 달라질 수 있다.
숙주세포는 또한 포유류, 곤충, 식물 또는 진균 세포와 같은 진핵생물일 수 있다. 하나의 구현예에서, 숙주세포는 인간 세포(예를 들어, 1차세포, 줄기세포 또는 불멸화된 세포주)이다. 일부 구현예에서, 숙주세포에 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터가 생체외로 투여되고, 숙주세포가 유전자 치료 후 대상에게 전달될 수 있다. 숙주세포는 임의의 세포 유형, 예를 들어 체세포 또는 줄기세포, 유도된 다능성 줄기세포 또는 혈액세포, 예를 들어 T세포 또는 B세포, 또는 골수세포일 수 있다. 특정 구현예에서, 숙주세포는 동종이계 세포이다. 예를 들어, T세포 게놈 조작은 암 면역요법, HIV 요법(예를 들어, CXCR4 및 CCR5와 같은 수용체 녹아웃)과 같은 질환 조절 및 면역결핍 치료에 유용하다. B세포의 MHC 수용체는 면역요법의 표적이 될 수 있다. 일부 구현예에서, 유전자 변형된 숙주세포, 예를 들어 골수 줄기세포, 예를 들어 CD34+ 세포 또는 유도된 다능성 줄기세포는, 치료용 단백질의 발현을 위해 환자에게 다시 이식될 수 있다.
B. 유전자 치료를 위한 추가의 질환
일반적으로, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 대상에서의 이상 단백질 발현 또는 유전자 발현과 관련된 PKU와 연관된 증상을 치료, 예방 또는 개선시키기 위해 상기 설명에 따른 임의의 PAH 단백질을 전달하는 데 사용될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는, PKU를 치료, 개선 및/또는 예방하기 위해, 혈액 내 분비 및 순환, 또는 다른 조직으로의 전신 전달을 위한 PAH 단백질의 생산을 위해, PAH 단백질을 골격근, 심장근 또는 횡격막근으로 전달하는 데 사용될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 임의의 적합한 수단에 의해, 선택적으로 대상이 흡입하는 ceDNA 벡터를 포함하는 호흡 가능한 입자의 에어로졸 현탁액을 투여하는 방식으로 대상의 폐에 투여될 수 있다. 호흡 가능한 입자는 액체 또는 고체일 수 있다. ceDNA 벡터를 포함하는 액체 입자의 에어로졸은 당업자에게 알려진 바와 같은 압력 구동 에어로졸 분무기 또는 초음파 분무기와 같은 임의의 적합한 수단에 의해 생성될 수 있다. 예를 들어, 미국 특허 제4,501,729호 참조. ceDNA 벡터를 포함하는 고체 입자의 에어로졸은 마찬가지로 약학 분야에 알려진 기술에 의해 임의의 고체 미립자 약제 에어로졸 생성기를 이용하여 생성될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 CNS의 조직(예를 들어, 뇌, 눈)에 투여될 수 있다.
본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터로 치료, 개선 또는 예방될 수 있는 안구 장애에는, 망막, 후방로 및/또는 시신경과 관련된 안과적 장애(예를 들어, 색소성망막염, 당뇨망막병증 및 다른 망막변성질환, 포도막염, 연령관련 황반변성, 녹내장)가 포함된다. 다수의 안과적 질환 및 장애는 (1) 혈관형성, (2) 염증, 및 (3) 변성의 3가지 유형의 적응증 중 하나 이상과 연관이 있다. 일부 구현예에서, 본원에 개시된 바와 같은 ceDNA 벡터는 항혈관형성 인자; 항염증 인자; 세포 변성을 지연시키거나, 세포 감축을 촉진시키거나, 세포 성장을 촉진시키는 인자, 및 이들의 조합을 전달하는 데 이용될 수 있다. 예를 들어, 당뇨망막병증은 혈관형성을 특징으로 한다. 당뇨망막병증은 하나 이상의 항혈관형성 항체 또는 융합 단백질을 안구내로(예를 들어, 유리체에) 또는 안구주위로(예를 들어, 테논낭하에) 전달하는 방식으로 치료될 수 있다. 본 개시내용의 ceDNA 벡터로 치료, 개선 또는 예방될 수 있는 추가의 안구 질환에는, 지도형위축, 혈관 또는 "습윤형" 황반변성, PKU, 레베르 선천성 흑암시(LCA), 어셔증후군, 탄성섬유가황색종(PXE), x연관 색소성망막염(XLRP), x연관 망막층간분리(XLRS), 범맥락막위축, 레베르 유전성 시신경병증(LHON), 완전색맹, 추체-간체 디스트로피, 푹스각막내피이상증, 당뇨병성 황반부종, 및 안구의 암 및 종양이 포함된다.
일부 구현예에서, 염증성 안구 질환 또는 장애(예를 들어, 포도막염)가 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터에 의해 치료, 개선 또는 예방될 수 있다. 하나 이상의 항염증 항체 또는 융합 단백질은 본원에 개시된 바와 같은 ceDNA 벡터의 안구내(예를 들어, 유리체 또는 전방) 투여에 의해 발현될 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 PAH 단백질의 발현을 위한 ceDNA 벡터는 리포터 폴리펩타이드(예를 들어, 녹색 형광 단백질 또는 알칼리성 포스파타아제와 같은 효소)를 인코딩하는 전이유전자와 관련이 있는 PAH 단백질을 인코딩할 수 있다. 일부 구현예에서, 실험 또는 진단 목적에 유용한 리포터 단백질을 인코딩하는 전이유전자는, β-락타마아제, β-갈락토시다아제(LacZ), 알칼리성 포스파타아제, 티미딘 키나아제, 녹색 형광 단백질(GFP), 클로람페니콜 아세틸트랜스퍼라아제(CAT), 루시퍼라아제 및 당업계에 널리 알려진 다른 것들 중 임의의 것에서 선택된다. 일부 양태에서, 리포터 폴리펩타이드에 연결된 PAH 단백질을 발현하는 ceDNA 벡터는 진단 목적으로 사용될 수 있을 뿐 아니라, 효율을 측정하기 위해, 또는 이것이 투여되는 대상에서 ceDNA 벡터 활성의 마커로서 사용될 수 있다.
C. ceDNA 벡터를 사용한 성공적인 유전자 발현 시험
ceDNA 벡터에 의한 PAH 단백질의 유전자 전달 효율을 시험하는 데 당업계에 널리 알려진 검정이 사용될 수 있으며, 이는 시험관내생체내 모델로 수행될 수 있다. ceDNA에 의한 PAH 단백질의 발현 수준은 PAH 단백질의 mRNA 및 단백질 수준을 측정하는 방식(예를 들어, 역전사 PCR, 웨스턴 블롯 분석 및 효소 결합 면역흡착 검정(ELISA))으로 당업자에 의해 평가될 수 있다. 하나의 구현예에서, ceDNA는, 예를 들어 형광 현미경 또는 발광 플레이트 판독기로 리포터 단백질의 발현을 평가하는 방식으로 PAH 단백질의 발현을 평가하는 데 사용될 수 있는 리포터 단백질을 포함한다. 생체내 적용의 경우, 유전자 발현이 성공적으로 일어나는 지 여부를 결정하기 위해 소정의 PAH 단백질의 기능을 시험하는 단백질 기능 검정이 사용될 수 있다. 당업자는 시험관내 또는 생체내에서 ceDNA 벡터에 의해 발현되는 PAH 단백질의 기능을 측정하는 최상의 시험을 결정할 수 있다.
세포 또는 대상에서 ceDNA 벡터로부터의 PAH 단백질의 유전자 발현 효과는 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 4개월, 적어도 5개월, 적어도 6개월, 적어도 10개월, 적어도 12개월, 적어도 18개월, 적어도 2년, 적어도 5년, 적어도 10년, 적어도 20년 동안 지속될 수 있거나, 영구적일 수 있다고 본원에서 고려된다.
일부 구현예에서, 본원에 기재된 발현 카세트, 발현 작제물 또는 ceDNA 벡터 내 PAH 단백질은 숙주세포에 대해 코돈 최적화될 수 있다. 본원에 사용된 "코돈 최적화된" 또는 "코돈 최적화"라는 용어는, 관심 척추동물, 예를 들어 마우스 또는 인간(예를 들어, 인간화)의 세포에서 발현 증강을 위해 핵산 서열을 변경하는 과정으로서, 천연 서열(예를 들어, 원핵생물 서열) 중 적어도 하나, 하나 초과 또는 유의한 수의 코돈을, 해당 척추동물의 유전자에서 보다 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하는 과정을 나타낸다. 다양한 종은 특정 아미노산의 특정 코돈에 대해 특정 편향을 나타낸다. 전형적으로, 코돈 최적화는 원래 번역된 단백질의 아미노산 서열을 변경시키지 않는다. 최적화된 코돈은, 예를 들어 Aptagen's Gene Forge® 코돈 최적화 및 맞춤형 유전자 합성 플랫폼(Aptagen, Inc.), 또는 또 다른 공개적으로 이용 가능한 데이터베이스를 사용하여 결정될 수 있다.
D. ceDNA 벡터로부터의 PAH 단백질 발현 평가를 통한 효능 결정
본질적으로, 단백질 발현을 결정하는 당업계에 알려진 임의의 방법이 ceDNA 벡터로부터 PAH 단백질의 발현을 분석하는 데 사용될 수 있다. 이러한 방법/검정의 비제한적인 예에는, 효소 결합 면역검정(ELISA), 친화성 ELISA, ELISPOT, 연속 희석, 유세포분석, 표면 플라즈몬 공명 분석, 역학적 배제 검정, 질량분석, 웨스턴 블롯, 면역침강 및 PCR이 포함된다.
생체내에서 PAH 단백질 발현을 평가하는 경우, 분석을 위해 대상에서 생물학적 샘플을 얻을 수 있다. 예시적인 생물학적 샘플에는, 생체유체 샘플, 체액 샘플, 혈액(전혈 포함), 혈청, 혈장, 소변, 타액, 생검 및/또는 조직 샘플 등이 포함된다. 생물학적 샘플 또는 조직 샘플은 또한, 비제한적으로, 종양 생검, 대변, 척수액, 흉막액, 유두 흡인물, 림프액, 피부, 호흡기, 장 및 비뇨생식기의 외부 부분, 눈물, 타액, 모유, 세포(비제한적으로, 혈액 세포 포함), 종양, 기관을 포함하는 개체로부터 단리된 조직 또는 체액의 샘플, 및 또한 시험관내 세포 배양 구성성분의 샘플을 나타낼 수 있다. 상기 용어는 또한 상기 언급된 샘플의 혼합물을 포함한다. "샘플"이라는 용어는 또한 미처리된 또는 전처리된(또는 사전 가공된) 생물학적 샘플을 포함한다. 일부 구현예에서, 본원에 기재된 검정 및 방법에 사용되는 샘플은 시험하고자 하는 대상에서 채취된 혈청 샘플을 포함한다.
E. 임상 매개변수에 의한 발현된 PAH 단백질의 효능 결정
PKU에 대한 ceDNA 벡터에 의해 발현되는 소정의 PAH 단백질의 효능(즉, 기능적 발현)은 숙련된 임상의에 의해 결정될 수 있다. 하지만, PKU의 징후 또는 증상 중 어느 하나 또는 전부가 유익한 방식으로 변경되거나, 다른 임상적으로 허용되는 질환의 증상 또는 마커가, 예를 들어 본원에 기재된 바와 같은 치료용 PAH 단백질을 인코딩하는 ceDNA 벡터로의 치료 후 적어도 10% 정도 호전되거나 개선되는 경우, 치료는 본원에 사용된 용어로 "유효한 치료"로 간주된다. 효능은 또한 PKU의 안정화 또는 의학적 개입의 필요성에 의해 평가되는 바와 같이 개체의 악화 실패로 측정될 수 있다(즉, 질환의 진행이 중단되거나 적어도 느려짐). 이러한 지표의 측정 방법은 당업자에게 알려져 있고/있거나 본원에 기재되어 있다. 치료는 개체 또는 동물(일부 비제한적인 예에는, 인간 또는 포유류가 포함됨)에서의 질환의 임의의 치료를 포함하며, 이에는 (1) PKU를 저해하는 것, 예를 들어 PKU의 진행을 중단시키거나 느리게 하는 것; 또는 (2) PKU를 완화시키는 것, 예를 들어 PKU 증상의 퇴행을 유발하는 것; 및 (3) PKU 질환의 발달 가능성을 예방하거나 감소시키는 것, 또는 PKU와 관련된 2차 질환/장애를 예방하는 것을 포함한다. 질환의 치료를 위한 유효량은, 이를 필요로 하는 포유류에 투여되는 경우, 해당 질환에 대한 유효한 치료(이러한 용어는 본원에 정의된 바와 같음)를 유도하는 데 충분한 양을 의미한다. 작용제의 효능은 PKU 질환에 대해 특정한 물리적 지표를 평가하는 방식으로 결정될 수 있다. 의사는, PKU의 임상 증상 중 임의의 하나 이상을 평가할 수 있다: **(i) 일반 식단에서 감소된 혈청 페닐알라닌(Phe) 수준. Phe의 감소는 PKU의 치료제 개발에서 핵심 바이오마커이다; (ii) 일반 식단에서 회복된 Phe 대 티로신 대사 비율. 이러한 경로는 신경전달물질의 생산을 담당한다; 및/또는 (iii) 감소된 혈청 Phe 수준의 평가.
실시예
하기 실시예는 제한이 아닌 예시로서 제공된다. 당업자는, ceDNA 벡터가 본원에 기재된 야생형 또는 변형된 ITR 중 임의의 것으로부터 작제될 수 있으며, 하기 예시적인 방법을 사용하여 이러한 ceDNA 벡터를 작제하고 이의 활성을 평가할 수 있다는 것을 이해할 것이다. 방법이 특정 ceDNA 벡터를 이용하는 것으로 예시되어 있지만, 설명에 따라 임의의 ceDNA 벡터에 적용할 수 있다.
실시예 1: 곤충 세포 기반 방법을 사용한 ceDNA 벡터의 작제
폴리뉴클레오타이드 작제물 주형을 사용한 ceDNA 벡터의 생산은 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 1에 기재되어 있다. 예를 들어, 본 개시내용의 ceDNA 벡터를 생성하는 데 사용되는 폴리뉴클레오타이드 작제물 주형은 ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큘로바이러스일 수 있다. 이론에 제한됨 없이, 허용 숙주세포에서, 예를 들어 Rep의 존재 하에서, 2개의 대칭인 ITR과 발현 작제물을 갖는 폴리뉴클레오타이드 작제물 주형(여기서, ITR 중 적어도 하나는 야생형 ITR 서열에 대해 변형됨)을 복제하여 ceDNA 벡터를 생산한다. ceDNA 벡터 생산은 다음과 같은 2단계를 거친다: 첫 번째로, Rep 단백질을 통한 주형 백본(예를 들어, ceDNA-플라스미드, ceDNA-박미드, ceDNA-바큘로바이러스 게놈 등)으로부터의 주형의 절제("회수") 단계, 및 두 번째로, 절제된 ceDNA 벡터의 Rep 매개 복제 단계.
ceDNA-박미드의 생산:
DH10Bac 적격세포(MAX EFFICIENCY® DH10Bac™ Competent Cells, Thermo Fisher)를 제조업체의 설명서에 따른 프로토콜에 따라 시험 또는 대조군 플라스미드로 형질전환시켰다. DH10Bac 세포에서 플라스미드와 바큘로바이러스 셔틀 벡터 사이의 재조합을 유도하여, 재조합 ceDNA-박미드를 생성하였다. 박미드와 트랜스포사아제 플라스미드의 형질전환체 및 유지를 위해 선택한 항생제와 함께 X-gal 및 IPTG를 함유하는 박테리아 한천 플레이트 상에서, 대장균(E. coli)에서의 청백색 스크리닝을 기반으로 하는 양성 선별을 스크리닝하여 재조합 박미드를 선별하였다(Φ80dlacZΔM15 마커는 박미드 벡터로부터의 β-갈락토시다아제 유전자의 α-상보성을 제공함). β-갈락토시드 지표 유전자를 파괴하는 전위에 의해 야기된 백색 집락을 선별하고, 10 ml 배지에서 배양하였다.
재조합 ceDNA-박미드를 대장균에서 단리하고, FugeneHD를 사용하여 Sf9 또는 Sf21 곤충 세포에 트랜스펙션시켜, 감염성 바큘로바이러스를 생산하였다. 부착성 Sf9 또는 Sf21 곤충 세포를 25℃에서 T25 플라스크 내 50 ml 배지에서 배양하였다. 4일 후, 배양 배지(P0 바이러스 함유)에서 세포를 꺼내고, 0.45 μm 필터를 통해 여과하여, 세포 또는 세포 잔해물로부터 감염성 바큘로바이러스 입자를 분리하였다.
선택적으로, 50 ml 내지 500 ml 배지에서 나이브(na
Figure pct00034
ve) Sf9 또는 Sf21 곤충 세포를 감염시켜 제1세대 바큘로바이러스(P0)를 증폭시켰다. 세포의 직경이 18 nm 내지 19 nm(본래 직경 14 nm 내지 15 nm), 밀도가 약 4.0E+6개의 세포/mL에 도달할 때까지, 세포 직경 및 생존율을 모니터링하면서, 25℃에서 130 rpm으로 오비탈 진탕기 인큐베이터에서 현탁 배양으로 세포를 유지시켰다. 감염 후 3일 내지 8일 사이에, 원심분리한 후 배지 중 P1 바큘로바이러스 입자를 수집하여 세포와 잔해물을 제거하고, 0.45 μm 필터를 통해 여과하였다.
시험 작제물을 포함하는 ceDNA-바큘로바이러스를 수집하고, 바큘로바이러스의 감염 활성 또는 역가를 측정하였다. 구체적으로, 4개 x 20 ml Sf9 세포 배양물(2.5E+6개의 세포/ml)을 1/1000, 1/10,000, 1/50,000, 1/100,000로 희석된 P1 바큘로바이러스로 처리하고, 25℃ 내지 27℃에서 인큐베이션하였다. 4일 내지 5일 동안 매일 세포 직경 증가율과 세포주기 정지율, 및 세포 생존율의 변화로 감염성을 측정하였다.
PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 도 8a에 개시된 바와 같은 "Rep-플라스미드"를, Rep78(서열번호 131 또는 133)과 Rep52(서열번호 132) 또는 Rep68(서열번호 130)과 Rep40(서열번호 129)을 포함하는 pFASTBACTM-이중 발현 벡터(ThermoFisher)에서 생산하였다. Rep-플라스미드를 제조업체가 제공한 프로토콜에 따라 DH10Bac 적격세포(MAX EFFICIENCY® DH10Bac™ Competent Cells)(Thermo Fisher)로 형질전환시켰다. DH10Bac 세포에서 Rep-플라스미드와 바큘로바이러스 셔틀 벡터 사이의 재조합을 유도하여, 재조합 박미드("Rep-박미드")를 생성하였다. X-gal 및 IPTG를 함유하는 박테리아 한천 플레이트 상에서 대장균에서의 청백색 스크리닝을 포함하는 양성 선별을 통해 재조합 박미드를 선별하였다(Φ80dlacZΔM15 마커는 박미드 벡터로부터의 β-갈락토시다아제 유전자의 α-상보성을 제공함). 단리된 백색 집락을 선별하고, 10 ml의 선택된 배지(LB 브로쓰 중의 카나마이신, 겐타마이신, 테트라시클린)에 접종하였다. 재조합 박미드(Rep-박미드)를 대장균에서 단리하고, Rep-박미드를 Sf9 또는 Sf21 곤충 세포에 트랜스펙션시켜, 감염성 바큘로바이러스를 생산하였다.
Sf9 또는 Sf21 곤충 세포를 50 ml 배지에서 4일 동안 배양하고, 감염성 재조합 바큘로바이러스("Rep-바큘로바이러스")를 배양물에서 단리하였다. 선택적으로, 나이브 Sf9 또는 Sf21 곤충 세포를 감염시켜 제1세대 바큘로바이러스(P0)를 증폭시키고, 50 ml 내지 500 ml 배지에서 배양하였다. 감염 후 3일 내지 8일 사이에, 원심분리 또는 여과 또는 또 다른 분별 과정을 통해 세포를 분리하여, 배지 내 P1 바큘로바이러스 입자를 수집하였다. Rep-바큘로바이러스를 수집하고, 바큘로바이러스의 감염 활성을 측정하였다. 구체적으로, 4개 x 20 mL Sf9 세포 배양물(2.5x106개의 세포/mL)을 1/1000, 1/10,000, 1/50,000, 1/100,000로 희석된 P1 바큘로바이러스로 처리하고, 인큐베이션하였다. 4일 내지 5일 동안 매일 세포 직경 증가율과 세포주기 정지율, 및 세포 생존율의 변화로 감염성을 측정하였다.
ceDNA 벡터 생성 및 특징분석
도 3b를 참조하여, (1) ceDNA-박미드 또는 ceDNA-바큘로바이러스를 함유하는 샘플, 및 (2) 상기 기재된 Rep-바큘로바이러스를 함유하는 Sf9 곤충 세포 배양 배지를, 각각, 1:1000 및 1:10,000의 비로, Sf9 세포의 새로운 배양물(2.5E+6개의 세포/ml, 20 ml)에 첨가하였다. 이어서, 세포를 25℃에서 130 rpm으로 배양하였다. 공동 감염 4일 내지 5일 후, 세포 직경과 생존율을 검출하였다. 세포 직경이 18 nm 내지 20 nm에 도달하고, 생존율이 약 70% 내지 80%에 도달하면, 세포 배양물을 원심분리하고, 배지를 제거하고, 세포 펠릿을 수집하였다. 세포 펠릿을 먼저 적절한 부피의 물 또는 완충액인 수성 배지에 재현탁시켰다. Qiagen MIDI PLUS™ 정제 프로토콜(Qiagen, 컬럼당 처리되는 세포 펠릿 질량 0.2 mg)을 사용하여, 세포에서 ceDNA 벡터를 단리하고 정제하였다.
Sf9 곤충 세포에서 생산되고 정제된 ceDNA 벡터의 수율을 초기에 260 nm에서의 UV 흡광도를 기반으로 측정하였다.
ceDNA 벡터는 도 3d에 예시된 미변성 또는 변성 조건 하에서 아가로오스 겔 전기영동으로 확인하여 평가할 수 있으며, 여기서 (a) 제한 엔도뉴클레아제 절단 및 겔 전기영동 분석 후 미변성 겔에 비해 변성 겔에서 2배 크기로 이동하는 특징적인 밴드의 존재, 및 (b) 절단되지 않은 물질의 경우 미변성 겔에서 단량체 및 이량체(2x) 밴드의 존재가, ceDNA 벡터 존재의 특징이다.
공동 감염된 Sf9 세포(본원에 기재된 바와 같음)에서 수득된 DNA를, a) ceDNA 벡터 내 오로지 단일 절단 부위만 존재, 및 b) 0.8% 변성 아가로오스 겔 상에서 분별 시 명확하게 확인할 수 있을 만큼 충분히 큰 생성된 단편(>800 bp)에 대해 선별된 제한 엔도뉴클레아제로 소화시켜, 단리된 ceDNA 벡터의 구조를 추가로 분석하였다. 도 3d도 3e에 예시된 바와 같이, 비연속 구조를 갖는 선형 DNA 벡터와 선형 및 연속 구조를 갖는 ceDNA 벡터를 이의 반응 생성물의 크기로 구별할 수 있다: 예를 들어 비연속 구조를 갖는 DNA 벡터는 1 kb 및 2 kb 단편을 생성할 것으로 예상되고, 연속 구조를 갖는 비캡시드화된 벡터는 2 kb 및 4 kb 단편을 생성할 것으로 예상된다.
따라서, 단리된 ceDNA 벡터가 정의에 따라 공유결합으로 폐쇄되어 있다는 것을 정성적으로 입증하기 위해, 샘플을 단일 제한 부위를 갖는 특정 DNA 벡터 서열의 맥락에서 확인된 제한 엔도뉴클레아제로 소화시켜, 바람직하게는 동일하지 않은 크기의 2개의 절단 산물(예를 들어, 1000 bp 및 2000 bp)을 수득하였다. 소화 및 변성 겔 상에서의 전기영동(이는 2개의 상보적 DNA 가닥을 분리함) 후, 선형의 비공유결합으로 폐쇄된 DNA는 1000 bp 및 2000 bp의 크기로 분리될 것이지만, 공유결합으로 폐쇄된 DNA(즉, ceDNA 벡터)는 2개의 DNA 가닥이 연결되고 언폴딩되어 (단일가닥이지만) 길이가 2배가 됨으로써, 2배 크기(2000 bp 및 4000 bp)로 분리될 것이다. 나아가, 단량체, 이량체 및 n량체 형태의 DNA 벡터의 소화는 모두 다량체 DNA 벡터의 말단 대 말단 연결로 인해 동일한 크기의 단편으로 분리될 것이다(도 3d 참조). 도 4는, 엔도뉴클레아제로 소화되거나(+) 소화되지 않은(-) ceDNA 벡터의 변성 겔 전개의 예시적인 도면이다(ceDNA 작제물 1 및 2의 경우 EcoRI; ceDNA 작제물 3 및 4의 경우 BamH1; ceDNA 작제물 5 및 6의 경우 SpeI; 및 ceDNA 작제물 7 및 8의 경우 XhoI). 작제물 1 내지 8은 국제 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로 인용됨)의 실시예 1에 기재되어 있다. 별표로 강조된 밴드의 크기를 결정하고 도면의 하단에 제공하였다.
본원에 사용된 "미변성 겔 및 변성 조건 하에서 아가로오스 겔 전기영동에 의한 DNA 벡터의 식별을 위한 검정"이라는 구절은, 제한 엔도뉴클레아제 소화, 이어서 소화 산물의 전기영동을 수행하는 방식으로 ceDNA의 폐쇄형 말단을 평가하는 검정을 나타낸다. 하나의 이러한 예시적인 검정이 하기에 이어지지만, 당업자는 이러한 예에 대한 다수의 업계 공지의 변형이 가능하다는 것을 이해할 것이다. 제한 엔도뉴클레아제는 DNA 벡터 길이의 대략 1/3x 및 2/3x인 산물을 생성하게 되는 관심 ceDNA 벡터에 대한 단일 절단 효소인 것으로 선택된다. 이는, 미변성 및 변성 겔 모두에 대한 밴드를 분리한다. 변성 전, 샘플에서 완충액을 제거하는 것이 중요하다. Qiagen PCR 클린업 키트(clean-up kit) 또는 탈염 "스핀 컬럼", 예를 들어 GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 컬럼이 엔도뉴클레아제 소화에 대한 일부 업계 공지의 옵션이다. 상기 검정은, 예를 들어 i) 적절한 제한 엔도뉴클레아제(들)를 이용하여 DNA를 소화시키는 단계, ii) 예를 들어 Qiagen PCR 클린업 키트에 적용하고, 증류수로 용리하는 단계, iii) 10x 변성 용액(10x = 0.5 M NaOH, 10 mM EDTA)을 첨가하고, 완충되지 않은 10X 염료를 첨가하고, NaOH 농도가 겔과 겔 박스에서 균일하도록 보장하기 위해 1 mM EDTA 및 200 mM NaOH와 함께 이전에 인큐베이션한 0.8% 내지 1.0% 겔 상에 10X 변성 용액을 4배로 첨가하여 제조된 DNA ladder와 함께 분석하고, 1x 변성 용액(50 mM NaOH, 1 mM EDTA)의 존재 하에서 겔에서 전개시키는 단계를 포함한다. 당업자는, 크기 및 목적하는 결과 타이밍을 기반으로 전기영동을 수행하는 데 어떤 전압을 사용해야 하는 지를 이해할 것이다. 전기영동 후, 겔을 배수하고, 1x TBE 또는 TAE에서 중화시키고, 1x SYBR Gold을 함유한 1x TBE/TAE 또는 증류수로 옮겼다. 이어서, 밴드를, 예를 들어 Thermo Fisher, SYBR® Gold Nucleic Acid Gel Stain(DMSO 중 10,000X 농축물) 및 에피형광(epifluorescent light)(청색) 또는 UV(312 nm)를 이용하여 가시화할 수 있다.
생성된 ceDNA 벡터의 순도는 임의의 업계 공지의 방법을 사용하여 평가할 수 있다. 하나의 예시적이고 비제한적인 방법으로서, ceDNA 벡터의 형광 강도를 표준과 비교하여 샘플의 전체 UV 흡광도에 대한 ceDNA-플라스미드의 기여를 추정할 수 있다. 예를 들어, UV 흡광도에 기반하여, 4 ㎍의 ceDNA 벡터가 겔 상에 로딩되고, ceDNA 벡터 형광 강도가 1 ㎍인 것으로 알려진 2 kb 밴드와 동등한 경우, 1 ㎍의 ceDNA 벡터가 존재하며, ceDNA 벡터는 총 UV 흡수 물질의 25%이다. 이어서, 겔 상의 밴드 강도를 밴드가 나타내는 계산된 입력에 대해 플롯팅한다: 예를 들어 총 ceDNA 벡터가 8 kb이고, 절제된 비교용 밴드가 2 kb인 경우, 밴드 강도는 총 입력의 25%로서 플롯팅될 것이며, 이러한 경우 1.0 ㎍ 입력에 대한 값은 0.25 ㎍일 것이다. ceDNA 벡터 플라스미드 적정을 사용하여 표준 곡선을 플롯팅한 후, 회귀선 방정식을 사용하여 ceDNA 벡터 밴드의 양을 계산한 다음, 이를 사용하여 ceDNA 벡터로 표시되는 총 입력의 % 또는 순도%를 결정할 수 있다.
비교 목적으로, 실시예 1에는 곤충 세포 기반 방법 및 폴리뉴클레오타이드 작제물 주형을 사용한 ceDNA 벡터의 생산 방법이 기재되어 있으며, 이는 또한 국제 특허 출원 PCT/US18/49996(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 1에 기재되어 있다. 예를 들어, 실시예 1에 따른 본 개시내용의 ceDNA 벡터를 생성하는 데 사용되는 폴리뉴클레오타이드 작제물 주형은 ceDNA-플라스미드, ceDNA-박미드 및/또는 ceDNA-바큘로바이러스일 수 있다. 이론에 제한됨 없이, 허용 숙주세포에서, 예를 들어 Rep의 존재 하에서, 2개의 대칭인 ITR과 발현 작제물을 갖는 폴리뉴클레오타이드 작제물 주형(여기서, ITR 중 적어도 하나는 야생형 ITR 서열에 대해 변형됨)을 복제하여 ceDNA 벡터를 생산한다. ceDNA 벡터 생산은 다음과 같은 2단계를 거친다: 첫 번째로, Rep 단백질을 통한 주형 백본(예를 들어, ceDNA-플라스미드, ceDNA-박미드, ceDNA-바큘로바이러스 게놈 등)으로부터의 주형의 절제("회수") 단계, 및 두 번째로, 절제된 ceDNA 벡터의 Rep 매개 복제 단계.
실시예 2: 이중가닥 DNA 분자로부터의 절제를 통한 합성 ceDNA 생산
ceDNA 벡터의 합성 생산은 2019년 1월 18일자 출원된 국제 특허 출원 PCT/US19/14122의 실시예 2 내지 실시예 6에 기재되어 있으며, 상기 문헌은 그 전문이 본원에 참조로서 인용된다. 이중가닥 DNA 분자의 절제를 포함하는 합성 방법을 사용하여 ceDNA 벡터를 생산하는 하나의 예시적인 방법. 간략하게, ceDNA 벡터는 이중가닥 DNA 작제물을 사용하여 생성할 수 있다(예를 들어, PCT/US19/14122의 도 7a 내지 도 8e 참조). 일부 구현예에서, 이중가닥 DNA 작제물은 ceDNA 플라스미드이다(예를 들어, 2018년 12월 6일자 출원된 국제 특허 출원 PCT/US2018/064242의 도 6 참조).
일부 구현예에서, ceDNA 벡터 제조용 작제물은 본원에 기재된 바와 같은 조절 스위치를 포함한다.
예시 목적으로, 실시예 2는 이러한 방법을 사용하여 생성된 예시적인 폐쇄형 DNA 벡터로서의 ceDNA 벡터의 생산을 설명한다. ITR과 발현 카세트(예를 들어, 핵산 서열, 예를 들어 이종 핵산 서열)를 포함하는 이중가닥 폴리뉴클레오타이드의 절제, 이어서 본원에 기재된 바와 같은 유리된 3' 및 5' 말단의 결찰에 의해 폐쇄형 DNA 벡터를 생성하는 시험관내 합성 생산 방법을 설명하는 상기 실시예에 ceDNA 벡터가 예시되어 있지만, 당업자는, 상기 예시된 바와 같이, 비제한적으로, 개뼈형 DNA, 덤벨형 DNA 등을 포함하는 임의의 목적하는 폐쇄형 DNA 벡터가 생성되도록, 이중가닥 DNA 폴리뉴클레오타이드 분자를 변형시킬 수 있다는 것을 알고 있다. 실시예 2에 기재된 합성 생산 방법에 따라 생산될 수 있는 항체 또는 융합 단백질의 생산을 위한 예시적인 ceDNA 벡터는, "III ceDNA 벡터 전반"라는 제목의 섹션에 논의되어 있다. ceDNA 벡터에 의해 발현되는 예시적인 항체 및 융합 단백질은, "IIC ceDNA 벡터에 의해 발현되는 예시적인 항체 및 융합 단백질"이라는 제목의 섹션에 논의되어 있다.
상기 방법은 (i) 이중가닥 DNA 작제물로부터 발현 카세트를 인코딩하는 서열을 절제하는 단계, (ii) ITR 중 하나 이상에서 헤어핀 구조를 형성하는 단계, 및 (iii) 유리된 5' 및 3' 말단을 결찰, 예를 들어 T4 DNA 리가아제에 의해 결합하는 단계를 포함한다.
이중가닥 DNA 작제물은, 5'→3' 순서로, 제1 제한 엔도뉴클레아제 부위; 업스트림 ITR; 발현 카세트; 다운스트림 ITR; 및 제2 제한 엔도뉴클레아제 부위를 포함한다. 이어서, 이중가닥 DNA 작제물을 하나 이상의 제한 엔도뉴클레아제와 접촉시켜, 양쪽 제한 엔도뉴클레아제 부위에 이중가닥 절단물을 생성한다. 하나의 엔도뉴클레아제는 2개의 부위를 모두 표적화할 수 있거나, 제한 부위가 ceDNA 벡터 주형에 존재하지 않는 한 각각의 부위는 상이한 엔도뉴클레아제에 의해 표적화될 수 있다. 이는 나머지 이중가닥 DNA 작제물로부터 제한 엔도뉴클레아제 부위 사이의 서열을 절제한다(PCT/US19/14122의 도 9 참조). 결찰시켜, 폐쇄형 DNA 벡터를 형성한다.
상기 방법에 사용되는 ITR 중 하나 또는 둘 모두는 야생형 ITR일 수 있다. 변형된 ITR을 또한 사용할 수 있으며, 여기서 변형은 B 및 B' 아암 및/또는 C 및 C' 아암을 형성하는 서열에서 야생형 ITR로부터 하나 이상의 뉴클레오타이드의 결실, 삽입 또는 치환을 포함하거나(예를 들어, PCT/US19/14122의 도 6 내지 도 8, 도 10 및 도 11b 참조), 2개 이상의 헤어핀 루프(예를 들어, PCT/US19/14122의 도 6 내지 도 8 및 도 11b 참조) 또는 단일 헤어핀 루프(예를 들어, PCT/US19/14122의 도 10a, 도 10b 및 도 11b 참조)를 가질 수 있다. 헤어핀 루프 변형된 ITR은 기존 올리고의 유전적 변형 또는 새로운(de novo) 생물학적 및/또는 화학적 합성으로 생성할 수 있다. 제한적인 예에서, 좌측 및 우측 ITR-6(서열번호 111 및 서열번호 112)은 AAV2의 야생형 ITR로부터 B-B' 및 C-C' 아암의 40개 뉴클레오타이드 결실을 포함한다. 변형된 ITR에 남아있는 뉴클레오타이드는 단일 헤어핀 구조를 형성할 것으로 예측된다. 상기 구조의 언폴딩 깁스 자유 에너지는 약 -54.4 kcal/mol이다. 기능성 Rep 결합 부위 또는 Trs 부위의 선택적 결실을 비롯한 ITR에 대한 다른 변형이 또한 이루어질 수 있다.
실시예 3: 올리고뉴클레오타이드 작제를 통한 ceDNA 생산
다양한 올리고뉴클레오타이드의 어셈블리를 포함하는 합성 방법을 사용하여 ceDNA 벡터를 생산하는 또 다른 예시적인 방법이, PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 3에 제공되어 있으며, 여기서 ceDNA 벡터는 5' 올리고뉴클레오타이드와 3' ITR 올리고뉴클레오타이드를 합성하는 단계, 및 ITR 올리고뉴클레오타이드를 발현 카세트를 포함하는 이중가닥 폴리뉴클레오타이드에 결찰시키는 단계를 통해 생산된다. PCT/US19/14122의 도 11b는, 5' ITR 올리고뉴클레오타이드와 3' ITR 올리고뉴클레오타이드를 발현 카세트를 포함하는 이중가닥 폴리뉴클레오타이드에 결찰시키는 예시적인 방법을 보여준다.
ITR 올리고뉴클레오타이드는 WT-ITR(예를 들어, 도 2a, 도 2c 참조) 또는 변형된 ITR(예를 들어, 도 2b도 2d 참조)을 포함할 수 있다. (PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)의 도 6a, 도 6b, 도 7a 및 도 7b 참조). 예시적인 ITR 올리고뉴클레오타이드에는, 비제한적으로, 서열번호 134 내지 145가 포함된다(예를 들어, PCT/US19/14122의 표 7 참조). 변형된 ITR은 B 및 B' 아암 및/또는 C 및 C' 아암을 형성하는 서열에서 야생형 ITR로부터 하나 이상의 뉴클레오타이드의 결실, 삽입 또는 치환을 포함할 수 있다. 무세포 합성에 사용되는 본원에 기재된 바와 같은 WT-ITR 또는 mod-ITR을 포함하는 ITR 올리고뉴클레오타이드는, 유전적 변형, 또는 생물학적 및/또는 화학적 합성으로 생성할 수 있다. ITR 올리고뉴클레오타이드는 WT-ITR, 또는 본원에 논의된 바와 같은 대칭 또는 비대칭 구성의 변형된 ITR(mod-ITR)을 포함할 수 있다.
실시예 4: 단일가닥 DNA 분자를 통한 ceDNA 생산
합성 방법을 사용하여 ceDNA 벡터를 생산하는 또 다른 예시적인 방법이 PCT/US19/14122(이는 그 전문이 본원에 참조로서 인용됨)의 실시예 4에 제공되어 있으며, 이는 센스 발현 카세트 서열을 플랭킹하고, 안티센스 발현 카세트를 플랭킹하는 2개의 안티센스 ITR에 공유결합으로 부착된 2개의 센스 ITR을 포함하는 단일가닥 선형 DNA를 사용하며, 이러한 단일가닥 선형 DNA의 말단을 결찰시켜 폐쇄형 단일가닥 분자를 형성한다. 하나의 비제한적인 예는, 단일가닥 DNA 분자를 합성 및/또는 생산하는 단계, 분자의 일부를 어닐링하여 하나 이상의 2차 구조 염기쌍 영역을 갖는 단일 선형 DNA 분자를 형성하는 단계, 및 유리된 5' 및 3' 말단을 서로 결찰시켜 폐쇄형 단일가닥 분자를 형성하는 단계를 포함한다.
ceDNA 벡터 생산을 위한 예시적인 단일가닥 DNA 분자는, 5'→3' 방향으로, 센스 제1 ITR; 센스 발현 카세트 서열; 센스 제2 ITR; 안티센스 제2 ITR; 안티센스 발현 카세트 서열; 및 안티센스 제1 ITR을 포함한다.
실시예 4의 예시적인 방법에 사용되는 단일가닥 DNA 분자는 본원에 기재된 임의의 DNA 합성 방법, 예를 들어 시험관내 DNA 합성으로 형성하거나, 뉴클레아제를 이용하여 DNA 작제물(예를 들어, 플라스미드)을 절단하고 생성된 dsDNA 단편을 용융시켜 ssDNA 단편을 제공하는 방식으로 제공할 수 있다.
센스 및 안티센스 서열 쌍의 계산된 용융 온도 미만으로 온도를 저하시켜 어닐링을 달성할 수 있다. 용융 온도는 특정 뉴클레오타이드 염기 함량과, 사용되는 용액의 특징, 예를 들어 염 농도에 따라 달라진다. 당업자는 임의의 소정의 서열 및 용액 조합에 대한 용융 온도를 쉽게 계산할 수 있다.
어닐링된 분자의 유리된 5' 및 3' 말단을 서로 결찰시키거나 헤어핀 분자에 결찰시켜, ceDNA 벡터를 형성할 수 있다. 적합한 예시적인 결찰 방법 및 헤어핀 분자는 실시예 2 및 실시예 3에 기재되어 있다.
실시예 5: ceDNA의 정제 및/또는 생산 확인
예를 들어 실시예 1에 기재된 곤충 세포 기반 생산 방법, 또는 실시예 2 내지 4에 기재된 합성 생산 방법을 포함하는 본원에 기재된 방법에 의해 생산된 임의의 DNA 벡터 산물을, 당업자에게 일반적으로 알려진 방법을 사용하여 불순물, 미사용 구성요소 또는 부산물을 제거하기 위해 정제할 수 있고/있거나; 생산된 DNA 벡터(이러한 경우, ceDNA 벡터)가 목적하는 분자인지를 확인하기 위해 분석할 수 있다. DNA 벡터, 예를 들어 ceDNA의 예시적인 정제 방법은, Qiagen Midi Plus 정제 프로토콜(Qiagen) 및/또는 겔 정제를 사용하는 것이다.
ceDNA 벡터의 정체를 확인하는 예시적인 방법은 다음과 같다.
ceDNA 벡터는 도 3d에 예시된 미변성 또는 변성 조건 하에서 아가로오스 겔 전기영동으로 확인하여 평가할 수 있으며, 여기서 (a) 제한 엔도뉴클레아제 절단 및 겔 전기영동 분석 후 미변성 겔에 비해 변성 겔에서 2배 크기로 이동하는 특징적인 밴드의 존재, 및 (b) 절단되지 않은 물질의 경우 미변성 겔에서 단량체 및 이량체(2x) 밴드의 존재가, ceDNA 벡터 존재의 특징이다.
정제된 DNA를, a) ceDNA 벡터 내 오로지 단일 절단 부위만 존재, 및 b) 0.8% 변성 아가로오스 겔 상에서 분별 시 명확하게 확인할 수 있을 만큼 충분히 큰 생성된 단편(>800 bp)에 대해 선별된 제한 엔도뉴클레아제로 소화시켜, 단리된 ceDNA 벡터의 구조를 추가로 분석하였다. 도 3c도 3d에 예시된 바와 같이, 비연속 구조를 갖는 선형 DNA 벡터와 선형 및 연속 구조를 갖는 ceDNA 벡터를 이의 반응 생성물의 크기로 구별할 수 있다: 예를 들어 비연속 구조를 갖는 DNA 벡터는 1 kb 및 2 kb 단편을 생성할 것으로 예상되고, 연속 구조를 갖는 ceDNA 벡터는 2 kb 및 4 kb 단편을 생성할 것으로 예상된다.
따라서, 단리된 ceDNA 벡터가 정의에 따라 공유결합으로 폐쇄되어 있다는 것을 정성적으로 입증하기 위해, 샘플을 단일 제한 부위를 갖는 특정 DNA 벡터 서열의 맥락에서 확인된 제한 엔도뉴클레아제로 소화시켜, 바람직하게는 동일하지 않은 크기의 2개의 절단 산물(예를 들어, 1000 bp 및 2000 bp)을 수득하였다. 소화 및 변성 겔 상에서의 전기영동(이는 2개의 상보적 DNA 가닥을 분리함) 후, 선형의 비공유결합으로 폐쇄된 DNA는 1000 bp 및 2000 bp의 크기로 분리될 것이지만, 공유결합으로 폐쇄된 DNA(즉, ceDNA 벡터)는 2개의 DNA 가닥이 연결되고 언폴딩되어 (단일가닥이지만) 길이가 2배가 됨으로써, 2배 크기(2000 bp 및 4000 bp)로 분리될 것이다. 나아가, 단량체, 이량체 및 n량체 형태의 DNA 벡터의 소화는 모두 다량체 DNA 벡터의 말단 대 말단 연결로 인해 동일한 크기의 단편으로 분리될 것이다(도 3e 참조).
본원에 사용된 "미변성 겔 및 변성 조건 하에서 아가로오스 겔 전기영동에 의한 DNA 벡터의 식별을 위한 검정"이라는 구절은, 제한 엔도뉴클레아제 소화, 이어서 소화 산물의 전기영동을 수행하는 방식으로 ceDNA의 폐쇄형 말단을 평가하는 검정을 나타낸다. 하나의 이러한 예시적인 검정이 하기에 이어지지만, 당업자는 이러한 예에 대한 다수의 업계 공지의 변형이 가능하다는 것을 이해할 것이다. 제한 엔도뉴클레아제는 DNA 벡터 길이의 대략 1/3x 및 2/3x인 산물을 생성하게 되는 관심 ceDNA 벡터에 대한 단일 절단 효소인 것으로 선택된다. 이는, 미변성 및 변성 겔 모두에 대한 밴드를 분리한다. 변성 전, 샘플에서 완충액을 제거하는 것이 중요하다. Qiagen PCR 클린업 키트(clean-up kit) 또는 탈염 "스핀 컬럼", 예를 들어 GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 컬럼이 엔도뉴클레아제 소화에 대한 일부 업계 공지의 옵션이다. 상기 검정은, 예를 들어 i) 적절한 제한 엔도뉴클레아제(들)를 이용하여 DNA를 소화시키는 단계, ii) 예를 들어 Qiagen PCR 클린업 키트에 적용하고, 증류수로 용리하는 단계, iii) 10x 변성 용액(10x = 0.5 M NaOH, 10 mM EDTA)을 첨가하고, 완충되지 않은 10X 염료를 첨가하고, NaOH 농도가 겔과 겔 박스에서 균일하도록 보장하기 위해 1 mM EDTA 및 200 mM NaOH와 함께 이전에 인큐베이션한 0.8% 내지 1.0% 겔 상에 10X 변성 용액을 4배로 첨가하여 제조된 DNA ladder와 함께 분석하고, 1x 변성 용액(50 mM NaOH, 1 mM EDTA)의 존재 하에서 겔에서 전개시키는 단계를 포함한다. 당업자는, 크기 및 목적하는 결과 타이밍을 기반으로 전기영동을 수행하는 데 어떤 전압을 사용해야 하는 지를 이해할 것이다. 전기영동 후, 겔을 배수하고, 1x TBE 또는 TAE에서 중화시키고, 1x SYBR Gold을 함유한 1x TBE/TAE 또는 증류수로 옮겼다. 이어서, 밴드를, 예를 들어 Thermo Fisher, SYBR® Gold Nucleic Acid Gel Stain(DMSO 중 10,000X 농축물) 및 에피형광(청색) 또는 UV(312 nm)를 이용하여 가시화할 수 있다. 겔 밴드에서 ceDNA 벡터를 분리하고 이를 재생시키는 방식으로 전술한 겔 기반 방법을 정제 목적에 맞게 조정할 수 있다. 생성된 ceDNA 벡터의 순도는 임의의 업계 공지의 방법을 사용하여 평가할 수 있다. 하나의 예시적이고 비제한적인 방법으로서, ceDNA 벡터의 형광 강도를 표준과 비교하여 샘플의 전체 UV 흡광도에 대한 ceDNA-플라스미드의 기여를 추정할 수 있다. 예를 들어, UV 흡광도에 기반하여, 4 ㎍의 ceDNA 벡터가 겔 상에 로딩되고, ceDNA 벡터 형광 강도가 1 ㎍인 것으로 알려진 2 kb 밴드와 동등한 경우, 1 ㎍의 ceDNA 벡터가 존재하며, ceDNA 벡터는 총 UV 흡수 물질의 25%이다. 이어서, 겔 상의 밴드 강도를 밴드가 나타내는 계산된 입력에 대해 플롯팅한다: 예를 들어 총 ceDNA 벡터가 8 kb이고, 절제된 비교용 밴드가 2 kb인 경우, 밴드 강도는 총 입력의 25%로서 플롯팅될 것이며, 이러한 경우 1.0 ㎍ 입력에 대한 값은 0.25 ㎍일 것이다. ceDNA 벡터 플라스미드 적정을 사용하여 표준 곡선을 플롯팅한 후, 회귀선 방정식을 사용하여 ceDNA 벡터 밴드의 양을 계산한 다음, 이를 사용하여 ceDNA 벡터로 표시되는 총 입력의 % 또는 순도%를 결정할 수 있다.
실시예 6: ceDNA의 IV 및 유체역학적 투여에 의한 PAH enu2 마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구
PAH 결핍의 쥣과 모델인 PAHenu2 마우스를 사용한 국제 출원 PCT/US2020/022595(이는 그 전문이 본원에 참조로 인용됨)에 이전에 제시된 바와 같이, 2개의 상이한 ceDNA 벡터(이들은 각각 야생형 좌측 ITR과 절단된 돌연변이 우측 ITR을 갖고, 인간 PAH를 인코딩하는 전이유전자 영역을 가짐)는, 유체역학적 주사로 투여될 때, 활성 PAH를 발현했으며, 이는 페닐알라닌 수준을 전신적으로 감소시킬 수 있었다. 나아가, 국제 특허 PCT/US2020/022595에서 입증된 바와 같이, 인간 PAH 코돈 최적화된 버전 2("Codop2")에 연결된 VD 프로모터를 함유하는 ceDNA의 투여는 혈청 PHE 수준을 감소시켰으며, 이는 빠르면 3일차에 쥣과 PKU에서 혈중 페닐알라닌 수준을 교정하는 데 충분한 PAH 활성을 나타냈다.
ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412).
인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 본원에 서열번호 193으로 제시되어 있으며, 이는 하기 요소를 포함한다: Left-ITR_v1 : spacer_left-ITR_v1 : VD_Promoter Set (VD) : PmeI_site : Consensus_Kozak : hPAH_cDNA_ORF_v3 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA802).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 본원에 서열번호 213으로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1530).
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, ceDNA412 및 ceDNA802의 경우 동물당(군당 5마리 동물) 0.5 ㎍ 또는 5 ㎍으로 투여하였고, ceDNA1530의 경우 동물당(군당 5마리 동물) 0.5 ㎍ 또는 1 ㎍으로 투여하였다. 21일차는 종결 시점이었다.
설치류의 간에 핵산을 도입하는 널리 알려진 방법은 유체역학적 꼬리 정맥 주사에 의한 것이다. 이러한 시스템에서, 다량의 비캡슐화된 핵산을 가압 주사하면, 세포 투과성이 일시적으로 증가하여 조직 및 세포로의 직접 전달이 이루어진다. 이는, 대식세포 전달과 같은 다수의 숙주 면역계를 우회하는 실험적 메커니즘을 제공하여, 이러한 활성의 부재 하에서 전달 및 발현을 관찰할 수 있는 기회를 제공한다.
연구 설계는 하기 표 15에 제시되어 있다.
[표 15]
Figure pct00035
시험 물품은 농축 스톡으로 공급하였고, 사용 시까지 약 4℃에서 보관하였다. 제형을 볼텍싱하거나 원심분리하지 않았다. 군을 처치실 내 환기 랙과 접촉된 침구가 있는 투명 폴리카보네이트 케이지에 수용하였다. 먹이 및 1 N HCl을 이용하여 2.5 내지 3.0의 목표 pH로 산성화시킨 여과된 수돗물을 임의로 동물에게 제공하였다.
각각, 표 16A표 16B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 16A]
Figure pct00036
[표 16B]
Figure pct00037
연구 세부사항은 하기와 같이 제공된다:
종(수, 성별, 연령): 40마리 + 예비용 2마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 5주령 내지 10주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 10주령 내지 14주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
화합물 부류: 재조합 DNA 벡터, ceDNA
체중: 모든 동물의 체중을, 해당되는 경우, -3일차, 0일차, 1일차, 2일차, 4일차, 7일차, 14일차 및 21일차(안락사 전)에 기록하였다. 필요에 따라 추가 체중을 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 사용 직전 스톡을 PBS로 희석시켰다. 투여가 즉시 수행되지 않는 경우, 준비된 재료를 약 4℃(또는 습윤한 얼음 위)에서 보관하였다.
용량 투여: 0일차에, 군 1 내지 군 7에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다. 0일차에, 군 8 및 군 9에는 동물당 설정된 부피인 5 ml/㎏을 유체역학적 IV 투여로 투여하였다.
채혈 및 검시(혈청 및 조직용) 전 금식: 모든 동물(모든 군)을 -3일차, 4일차, 7일차, 14일차 및 21일차에, 모든 채혈 및 검시 전 최소 4시간 동안 금식시켰다. 0일차에는 동물을 금식시키지 않았다.
중간 채혈: 군 1, 2, 8 및 9의 모든 동물만 0일차에 시험 물질 투여 6시간(±5%) 후에 중간 채혈을 수행하였다.
군 1 내지 군 9의 모든 동물에서 -3일차, -4일차, 0일차, 1일차, 2일차, 4 3일차, 7일차, 14일차 및 21일차에 채혈하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있다.
안락사 및 종료 시 채혈: 21일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
도 5a 내지 도 5c에 제시된 바와 같이, 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA412; hPAH_codop_ORF_v2)는 0.5 ㎍ 및 5 ㎍ 유체역학적 용량 둘 모두에서 ceDNA802(hPAH 천연 cDNA 서열)보다 더 빠른 속도로 페닐알라닌 수준("PHE μM")을 목표 농도 미만 아래로 교정하였으나, ceDNA802는 PHE 농도를 교정하지 못했다. 결과는 21일에 걸쳐 개별 마우스에 대해 제시되어 있다. ceDNA1530은 3xHS-CRM8_SERP_Enhancer, TTR-promoter-d5pUTR 및 MVM_intron을 갖는 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 벡터(ceDNA1530; hPAH-r5-s29)이다. 도 5d도 5e에 제시된 바와 같이, ceDNA1530은 0.5 ㎍ 용량에서는 PHE 농도를 교정하는 데 효과적이지 않았지만, 1 ㎍ 용량에서는 목표 PHE 수준에 도달하였다.
실시예 7: ceDNA의 유체역학적 투여에 의한 PAH enu2 마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - 자가조절 돌연변이 ceDNA1274의 시험
ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 194로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xSerpEnh-TTRe-TTRm, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1132).
특정 시스-조절 요소를 갖고 29번 아미노산이 결실된 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 195로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_delta1-29aa, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1274).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 본원에 서열번호 210으로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1527).
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, ceDNA412, ceDNA1132 및 ceDNA1527의 경우 동물당(군당 5마리 동물) 0.5 ㎍ 또는 5 ㎍으로 투여하였고, ceDNA1527의 경우 동물당(군당 5마리 동물) 5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 17에 제시되어 있다.
[표 17]
Figure pct00038
시험 물품은 농축 스톡으로 공급하였고, 사용 시까지 약 4℃에서 보관하였다. 제형을 볼텍싱하거나 원심분리하지 않았다. 군을 처치실 내 환기 랙과 접촉된 침구가 있는 투명 폴리카보네이트 케이지에 수용하였다. 동물에게 임의로 마우스 먹이 5058과, 1 N HCl을 이용하여 2.5 내지 3.0의 목표 pH로 산성화시킨 여과된 수돗물을 제공하였다.
각각, 표 18A표 18B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 18A]
Figure pct00039
[표 18B]
Figure pct00040
연구 세부사항은 하기와 같이 제공된다:
종(수, 성별, 연령): 40마리 + 예비용 2마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 5주령 내지 10주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 10주령 내지 14주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터: ceDNA
체중: 모든 동물의 체중을 -5일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다. 필요에 따라 추가 체중을 기록할 수 있다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 9에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -5일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -5일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 9의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
도 6의 우측 패널에 제시된 바와 같이, 5 ㎍으로 유체역학적으로 투여될 때, 본 연구에서 시험된 모든 작제물(ceDNA412, ceDNA1132, ceDNA1274 및 ceDNA1527)은 7일의 연구 기간에 걸쳐 평균 PHE 수준(PHE μM)을 목표 농도(350 μM 미만) 아래로 교정하였다. PHE 수준은 연구 14일차경에 다시 상승하기 시작했다. 도 6a는, 예상대로 정상 PHE 수준(목표 농도 미만)을 갖는 야생형 마우스 대조군과 역시 예상대로 비히클이 투여된 PAHenu2 마우스가 높은 수준의 PHE를 나타냈음을 보여준다. 코돈 최적화된 인간 PAH 버전 2를 갖는 ceDNA 벡터는 0.5 ㎍의 용량에서 PHE 수준을 목표 교정 수준에 근접하게 교정하였으나, 교정 수준은 목표 수준 아래에 도달하지 못했다.
ceDNA1132는 이전에 생체내 연구에서 검사되었으며, 여기서 n=2/3 동물에서 PHE가 교정되었다(데이터는 제시되지 않음). ceDNA1132는 시험관내에서 잘 발현하였기 때문에, n을 증가시키기 위해 이를 생체내에서 다시 시험하였다. 도 7d도 7e에 제시된 바와 같이, 5 ㎍ 용량에서, ceDNA1132 및 ceDNA1274 군의 모든 5마리 동물은 7일차에 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 교정을 나타냈다. ceDNA412 및 ceDNA1527 군에서 단 1마리 동물만 반응하지 않았다. 또한 도 7a, 도 7c도 7f에 제시된 바와 같이, 0.5 ㎍ 용량에서, 시험된 작제물 사이에서 PHE 교정의 구별 가능한 차이는 없었으나; ceDNA1527이, 단일 미반응 동물을 제외한 경우, 더 강력할 수 있는 것으로 간주된다. 종합하면, 데이터는 본 연구에서 시험된 모든 작제물이 유체역학적으로 5 ㎍으로 투여될 때 적어도 7일에 걸쳐 평균 PHE 수준을 목표 농도 아래로 교정하였음을 보여준다. 일부 군에서, 유체역학적으로 5 ㎍으로 투여될 때, 목표 수준 아래로의 교정이 개별 마우스에서 20일 이상의 긴 기간 동안 유지되었다.
실시예 8: ceDNA의 유체역학적 투여에 의한 PAH enu2 마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터의 영향
ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 본원에 서열번호 196으로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1414).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 본원에 서열번호 197로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1416).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 본원에 서열번호 198로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 (ceDNA1428).
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 본원에 서열번호 211로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2.1, CpGmin_hAAT_Promoter_Set, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1 1 (ceDNA1528).
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.5 ㎍ 또는 5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 19에 제시되어 있다.
[표 19]
Figure pct00041
각각, 표 20A표 20B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 20A]
Figure pct00042
[표 20B]
Figure pct00043
연구 세부사항은 하기와 같이 제공된다:
종(수, 성별, 연령): 55마리 + 예비용 2마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 5주령 내지 10주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 10주령 내지 14주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -5일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 29일차(안락사 전)에 기록하였다. 필요에 따라 추가 체중을 기록할 수 있다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 12에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -5일차, 3일차, 7일차, 14일차, 21일차 및 29일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -5일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 12의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 29일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구에서는 2개의 코돈 최적화된 인간 PAH 서열(코돈 최적화된 인간 PAH 버전 2 및 코돈 최적화된 인간 PAH 버전 2 r5-s29)을 상이한 프로모터 또는 시스-조절 요소들의 조합과 조합으로 시험하였다. 구체적으로, 각각 프로모터, 코돈 최적화된 서열, CpG 함량(예를 들어, CpGmin), 인트론 등의 상이한 조합을 갖는 하기 작제물을 시험하였다.
[표 21]
Figure pct00044
도 8a도 8b, 도 9a 내지 도 9e, 도 10a 내지 도 10e, 도 11a도 11b, 도 12a 내지 도 12e, 도 13a 내지 도 13e, 및 도 14a 내지 도 14e에 제시된 바와 같이, 5 ㎍ 용량에서, ceDNA1416, ceDNA1428 및 ceDNA1528(ceDNA1414 군은 아님)은 7일 이내에 5/5 마우스에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 도 8a도 8b도 9a 내지 도 9e에 제시된 바와 같이, 0.5 ㎍ 용량에서의 데이터는, ceDNA1416과 ceDNA1528이 ceDNA412보다 더 강력할 수 있음을 시사하였다(7일 후 ceDNA412의 경우 2/5 마우스와 비교하여, 4/5 마우스가 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 교정을 나타냄). 이러한 데이터에 기반하여, CpGmin_hAAT_Promoter_Set가 표준VD 프로모터에 비해 개선을 나타낼 수 있다는 결론을 내릴 수 있다. 3xVanD_TTRe 또한 강력한 프로모터이지만, 본 데이터 세트에서 VanD(VD) 프로모터와 비교하기 위해서는 추가의 실험이 필요하다.
도 11a도 11b, 도 12a 내지 도 12e, 및 도 13a 내지 도 13e에 제시된 바와 같이, ceDNA412 군(5 ㎍ 용량)의 모든 마우스(5/5)는 연구의 전체 28일 지속기간 동안 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 교정을 나타냈다. 이러한 결과는 이전에는 확인할 수 없었으며, 유전자 발현과 효능의 놀라운 지속성을 시사한다. 시험된 다른 코돈 최적화된 작제물은 14일차 이후에 예상되는 Phe 증가를 나타냈다(5 ㎍ 용량에서).
최종적으로, 코돈 최적화된 인간 PAH 서열을 상이한 프로모터 또는 시스-조절 요소들의 조합과 조합으로 시험하는 추가 연구를 수행하였다. 구체적으로, 각각 프로모터, 코돈 최적화된 서열, CpG 함량(예를 들어, CpGmin), 인트론 등의 상이한 조합을 갖는 하기 작제물을 시험하였다.
[표 22]
Figure pct00045
모든 동물에 유체역학적으로 5 ㎍ 용량으로 투여하였다. 놀랍게도, 도 14a 내지 도 14i에 제시된 바와 같이, 시스-조절 요소와 코돈 최적화된 서열의 특정 조합은 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 교정을 나타냈다. 특히, 3xHNF1-4 || Pro-Albumin Enh || TTR promoter 조합의 프로모터를 갖는 ceDNA1471은 5 ㎍ 용량에서 PHE 농도를 목표 값 아래로 낮추었으며, 이는 본 연구에서 ceDNA412(VD_PromoterSet || hPAH_codop_ORF_v2)보다 더 큰 효능을 나타낸다.
실시예 9: ceDNA의 유체역학적 투여에 의한 PAH enu2 마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터 또는 프로모터 세트와 상이한 ORF의 영향
ceDNA 작제물
본 연구에서는 상이한 프로모터 또는 프로모터 세트(즉, hAAT 프로모터 및 VD 프로모터 세트)와 코돈 최적화된 PAH 서열 또는 ORF(즉, CpG 최소화되거나 최소화되지 않은 인간 PAH cDNA 및 인간 PAH 버전 2)를 갖는 ceDNA 벡터를 시험하였다. ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412). ceDNA412는 실시예 9에 기재된 본 연구에서 대조군으로 작용하였다.
특정 키메라 인트론(mIVS-intron1B)과 인트론 플랭킹 영역(33bpFlanks)을 갖는 코돈 최적화된 인간 PAH 버전 2 ORF(hPAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 546으로 제시되어 있으며, 이는 프로알부민 인핸서 및 간 핵인자 1 및 4 결합 부위의 6개의 카피(3xHNF1-4)와 조합된 hAAT 프로모터를 포함한다(ceDNA1476).
특정 키메라 인트론(mIVS-intron1B)과 인트론 플랭킹 영역(33bpFlanks)을 갖는 코돈 최적화된 인간 PAH 버전 2 ORF(hPAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 549로 제시되어 있으며, 이는 프로알부민 인핸서 및 간 핵인자 1 결합 부위 HNF1의 5개의 카피(5xHNF1)와 조합된 hAAT 프로모터를 포함한다(ceDNA1479).
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 1 ORF(hPAH-cDNA_0CpG1_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 562로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1939).
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 2 ORF(hPAH-cDNA_0CpG2_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 563으로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1940).
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 3 ORF(hPAH-cDNA_0CpG3_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 564로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1941).
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 4 ORF(hPAH-cDNA_0CpG4_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 565로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1942).
CpG 최소화되지 않은 코돈 최적화된 인간 PAH cDNA 버전 1 ORF(hPAH-cDNA_1_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 566으로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1943).
CpG 최소화되지 않은(CpG = 99) 코돈 최적화된 인간 PAH cDNA 버전 2 ORF(hPAH-cDNA_2_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 567로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1944).
본 연구에 사용되고 상기 기재된 바와 같은 ceDNA 벡터의 특징은 하기 표 23에 개략되어 있다.
[표 23]
Figure pct00046
연구 설계
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 4주령 내지 6주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 24에 제시되어 있다.
[표 24]
Figure pct00047
각각, 표 25A표 25B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 25A]
Figure pct00048
[표 25B]
Figure pct00049
연구 세부사항
종(수, 성별, 연령): 55마리 + 예비용 4마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 6주령 내지 8주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 7주령 내지 9주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -4일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 12에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -4일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -4일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 11의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구에서는 2개의 코돈 최적화된 인간 PAH 서열(코돈 최적화된 인간 PAH 버전 2 및 코돈 최적화된 인간 PAH cDNA(CpG 최소화되거나 최소화되지 않음))을 상이한 프로모터 또는 시스-조절 요소들의 조합과 조합으로 시험하였다. 각각의 시험된 ceDNA 작제물에 함유된 특정 요소는 표 23에 개략되어 있다.
도 15a 내지 도 15i에 제시된 바와 같이, 0.5 ㎍ 용량에서, 본 연구에서 시험된 모든 ceDNA 벡터, 즉, ceDNA1476, ceDNA1939 및 ceDNA1941(나머지는 아님)은 7일 이내에 전체 5마리 마우스 중 적어도 한 마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 주목할 점은, ceDNA1476과 ceDNA1939에서, 각각 5마리 마우스 중 4마리가 PHE 수준의 목표 농도 아래로의 신속한 교정을 나타냈다는 점이다. ceDNA1479, ceDNA1940 및 ceDNA1942는 각각 350 μM 임계값(단, 그 아래는 아님)이었던 단일 마우스와 관련된 단일 시점이 있었으며, ceDNA1479, ceDNA1942, ceDNA1943 및 ceDNA1944는 350 μM 임계값에 근접한 시점이 없었다.
ceDNA1476과 ceDNA1479 사이의 유일한 구조적 차이는, 후자는 HNF1 결합 부위의 5개의 카피를 함유하지만(HNF1 카피 2개마다 10량체 스페이서가 있음), ceDNA1476은 HNF1과 HNF4의 조합(여기서 HNF1과 HNF4는 서로 번갈아 나타남)의 6개의 카피만 함유한다는 점이다. 본 발명자들은, HNF1과 HNF4의 조합이 개선된 PHE 수준 교정을 나타냈음을 발견하였다(도 15c도 15b와 비교함).
ceDNA1943, ceDNA1944, ceDNA1939, ceDNA1940, ceDNA1941 및 ceDNA1942 사이의 차이는, ceDNA1943과 ceDNA1944의 오픈리딩프레임이 CpG 최소화되지 않았다는 점이다. ceDNA1943 및 ceDNA1944(도 15h도 15i)와 비교하여 ceDNA1939, ceDNA1940, ceDNA1941 및ceDNA1942(도 15d 내지 도 15g)에서 개선된 PHE 수준 교정은, PAH 발현, 결과적으로 PHE 수준 교정에 대한 CpG 최소화의 중요성을 보여준다.
ceDNA1471을 이용한 실시예 8에 언급된 관찰과 유사하게, 실시예 9에서, 3xHNF1-4 || Pro-Albumin Enh || TTR promoter 조합의 프로모터를 갖는 ceDNA1476은 0.5 ㎍ 용량에서 PHE 농도를 목표 값 아래로 낮추었으며, 이는 본 연구에서 대조군 ceDNA412(1x VD_PromoterSet || hPAH_codop_ORF_v2)보다 더 큰 효능을 나타낸다.
실시예 10: ceDNA의 유체역학적 투여에 의한 PAH enu2 마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터 또는 프로모터 세트와 마우스 또는 인간 유래 PAH의 영향
ceDNA 작제물
본 연구에서는 상이한 프로모터 또는 프로모터 세트(즉, hAAT 프로모터 및 VD 프로모터 세트)와 마우스 또는 인간 유래의 코돈 최적화된 PAH 서열 또는 ORF(즉, mousePAH_codop_ORF_v2 또는 hPAH_codop_ORF_v2)를 갖는 ceDNA 벡터를 시험하였다. ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412). ceDNA412는 실시예 10에 기재된 본 연구에서 대조군으로 작용하였다.
코돈 최적화된 인간 PAH CpG 최소화 cDNA 버전 1 ORF(hPAH-cDNA_0CpG1_ORF)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 562로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1939). 실시예 9에서 이전에 연구된 ceDNA1939는 또한 실시예 10에 기재된 본 연구에서 대조군으로 작용하였다.
코돈 최적화된 마우스 PAH 버전 2 ORF(mousePAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 568로 제시되어 있으며, 이는 VD_Promoter Set를 포함한다(ceDNA1955).
코돈 최적화된 인간 PAH 버전 2 ORF(hPAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 569로 제시되어 있으며, 이는 ceDNA1476과 ceDNA1479에 존재하는 인핸서를 갖는 인간 AAT 프로모터를 포함한다(ceDNA62).
본 연구에 사용되고 상기 기재된 바와 같은 ceDNA 벡터의 특징은 하기 표 26에 개략되어 있다.
[표 26]
Figure pct00050
연구 설계
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 7주령 내지 9주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 27에 제시되어 있다.
[표 27]
Figure pct00051
각각, 표 28A표 28B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 28A]
Figure pct00052
[표 28B]
Figure pct00053
연구 세부사항
종(수, 성별, 연령): 30마리 + 예비용 3마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 6주령 내지 8주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 7주령 내지 9주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -1일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 5에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -4일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -1일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 6의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구는 2개의 코돈 최적화된 PAH 서열(즉, 마우스 또는 인간 코돈 최적화된 PAH 버전 2)을 상이한 프로모터(즉, VD 프로모터 세트 또는 인간 AAT 프로모터)와 조합으로 시험하였다. 각각의 시험된 ceDNA 작제물에 함유된 특정 요소는 표 26에 개략되어 있다.
도 16a 내지 도 16d에 제시된 바와 같이, 0.5 ㎍ 용량에서, 적어도 실시예 9에서 입증된 바와 같이, 코돈 최적화된 인간 PAH ORF 버전 2를 발현하는 ceDNA412와 ceDNA1939는 모두 7일 이내에 전체 5마리 마우스 중 적어도 한 마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 실시예 9에서 관찰된 바와 같이, ceDNA1939는 다시 7일 이내에 전체 5마리 마우스 중 4마리 마우스에서 신속한 PHE 교정을 나타냈다.
놀랍게도, 코돈 최적화된 마우스 PAH ORF 버전 2를 발현하는 ceDNA1955와 ceDNA62는 모두 ceDNA412와 ceDNA1939보다 우수했던 마우스에서 PHE 교정을 나타내지 않았다. ceDNA1955는 기껏해야, ceDNA1939 교정과 동등하거나 이보다 약간 더 열등한 PHE 교정을 나타낸다고 할 수 있다. ceDNA62는 PHE 교정을 전혀 나타내지 않았다. ceDNA62는 hAAT 프로모터를 갖지만, ceDNA1476 및 ceDNA1479와 같은 인핸서는 갖지 않으며(실시예 8에서 연구됨) ceDNA1528과 같은 CpG 최소화가 없다(실시예 7에서 연구됨). ceDNA62에서 PHE 교정의 결여는, hAAT 프로모터의 개선에 있어서 인핸서와 CpG 최소화의 중요성을 보여준다.
실시예 11: ceDNA의 유체역학적 투여에 의한 PAH enu2 마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터와 이의 시스-조절 요소, 인트론 및 UTR의 영향
ceDNA 작제물
본 연구에서는 상이한 프로모터 세트(즉, hAAT 프로모터 세트 및 TTR 프로모터 세트)와 이의 각각의 시스-조절 요소, 전사 후 조절 요소, 인트론 및 UTR과, 코돈 최적화된 인간 PAH 서열 또는 ORF(즉, hPAH-r5-s29, hPAH-r5-s29::hIVS1B_33bpFlanks 또는 hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 갖는 ceDNA 벡터를 시험하였다. ceDNA 벡터를 상기 실시예 1과 실시예 5에 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412). ceDNA412는 실시예 11에 기재된 본 연구에서 대조군으로 작용하였다.
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 570으로 제시되어 있으며, 이는 TTR 프로모터와, 다른 인핸서(즉, PromoterSet-1471), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2409).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 571로 제시되어 있으며, 이는 TTR 프로모터와, ceDNA2409에서와 동일한 인핸서(즉, PromoterSet-1471), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2410).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 572로 제시되어 있으며, 이는 hAAT 프로모터와, 다른 인핸서(즉, PromoterSet-1476), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2415).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 573으로 제시되어 있으며, 이는 hAAT 프로모터와, 다른 인핸서(즉, PromoterSet-1479), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2418). ceDNA2418은 HNF 결합 부위의 카피 수와 유형의 관점에서 ceDNA2415와 상이하다.
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 574로 제시되어 있으며, 이는 hAAT 프로모터와, ceDNA2415에서와 동일한 인핸서(즉, PromoterSet-1476), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2416).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 575로 제시되어 있으며, 이는 hAAT 프로모터와, ceDNA2418에서와 동일한 인핸서(PromoterSet-1479), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2419). ceDNA2419는 HNF 결합 부위의 카피 수와 유형의 관점에서 ceDNA2416과 상이하다.
인트론과 인트론 플랭킹 영역이 없는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 576으로 제시되어 있으며, 이는 TTR 프로모터와, ceDNA2409에서와 동일한 인핸서(즉, PromoterSet-1471), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA2420).
본 연구에 사용되고 상기 기재된 바와 같은 ceDNA 벡터의 특징은 하기 표 29에 개략되어 있다.
[표 29]
Figure pct00054
연구 설계
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 6주령 내지 11주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.1 ㎍(선택된 동물만) 또는 0.5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 30에 제시되어 있다.
[표 30]
Figure pct00055
각각, 표 31A표 31B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 31A]
Figure pct00056
[표 31B]
Figure pct00057
연구 세부사항
종(수, 성별, 연령): 70마리 + 예비용 3마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 6주령 내지 8주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 6주령 내지 11주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -6일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 14에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -6일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -6일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 10의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구는 2개의 코돈 최적화된 PAH 서열(즉, 마우스 또는 인간 코돈 최적화된 PAH 버전 2)을 상이한 프로모터(즉, VD 프로모터 세트 또는 인간 AAT 프로모터)와 조합으로 시험하였다. 각각의 시험된 ceDNA 작제물에 함유된 특정 요소는 표 26에 개략되어 있다.
도 17a 내지 도 17i는 본 연구의 결과를 보여준다. 도 17a에 제시된 바와 같이, 0.5 ㎍ 용량에서, ceDNA412는 7일 이내에 전체 5마리 마우스 중 5 마리 모두에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 특히, 마우스 중 한 마리에서, PHE 교정이 28일에 걸쳐 지속되었다. 비교하여, 실시예 8 및 실시예 9에서, ceDNA412의 경우 전체 5마리 마우스 중 4마리 마우스에서 PHE 교정이 관찰되었다.
ceDNA2409, ceDNA2410, ceDNA2415, ceDNA2418, ceDNA2416 및 ceDNA2420은 각각 7일 이내에 전체 5마리 마우스 중 적어도 1 마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 주목할 점은, ceDNA2409, ceDNA2410 및 ceDNA2415가 각각 7일 이내에 전체 5마리 마우스 중 4 마리에서, 및 3일 이내에 전체 5마리 마우스 중 적어도 1마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다는 점이다. 놀랍게도, ceDNA2415가 투여된 마우스 중 한 마리에서, 28일차까지 PHE 교정이 지속되었다.즉, 본 연구는, 적어도 hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks ORF를 발현하고, 인핸서, 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소와 함께 TTR 프로모터를 갖는 ceDNA2415가, VD 프로모터 세트와 코돈 최적화된 인간 PAH 버전 2 ORF를 보유하는 ceDNA412에 비해 우수하지는 않더라도 동등함을 보여준다. 본 연구를 도 18a 내지 도 18e에 제시된 바와 같이 0.1 ㎍의 저용량으로 반복한 경우, ceDNA2415는 현저하게 14일 이내에 전체 5마리 마우스 중 2마리에서, 및 7일 이내에 전체 5마리 마우스 중 1마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다.
HNF 결합 부위의 수와 유형은 달라지지만, 프로모터 자체를 포함한 모든 다른 구조 요소가 동일하게 유지되는 경우, ceDNA2418(5xHNF1)과 ceDNA2415(3xHNF1-4)의 비교, 및 ceDNA2419(5xHNF1)와 ceDNA2416(3xHNF1-4)의 비교에서와 같이, PHE 수준 교정은 절충되는 것으로 나타났다. 마우스에 0.1 ㎍의 ceDNA2418을(도 18d)을 투여한 경우와 0.1 ㎍의 ceDNA2415(도 18c)를 투여한 경우 유사한 관찰이 기록되었다. 실시예 11에서의 이러한 관찰은 ceDNA1476 및 ceDNA1479에 대한 실시예 8에서의 관찰과 일치한다.
ceDNA2409, ceDNA2410, ceDNA2415 및 ceDNA2416과 비교하여, ceDNA2420 PHE 교정 수준은 어느 시점에서도 목표 수준에 도달하지 못한 3마리 마우스로 열등하였다. ceDNA2409, ceDNA2410, ceDNA2415 및 ceDNA2416과 비교하여, ceDNA2420은 hPAH-r5-s29 ORF를 발현하지만, 임의의 인트론과 인트론 플랭킹 영역이 없다. 이러한 관찰은 hPAH-r5-s29 ORF를 개선시키는 데 있어서 인트론과 인트론 플랭킹 영역의 중요성을 강조한다.
실시예 12: ceDNA의 유체역학적 투여에 의한 PAH enu2 마우스 내 페닐알라닌 수준의 생화학적 교정을 평가하기 위한 약리학적 연구 - PHE 교정에 대한 상이한 프로모터와 ceDNA 생산 방법의 영향
ceDNA 작제물
본 연구에서는 상이한 프로모터 세트와 이의 각각의 시스-조절 요소, 전사 후 조절 요소, 인트론 및 UTR과, 코돈 최적화된 인간 PAH 서열 또는 ORF를 갖는 ceDNA 벡터를 시험하였다. 대조군으로 사용한 ceDNA412를 제외하고, 본 연구에서의 ceDNA 벡터는 국제 특허 출원 PCT/US2019/14122에 상기 기재된 바와 같이 제조하고 정제하였다.
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 본원에 서열번호 192로 제시되어 있으며, 이는 하기 요소를 포함한다: left-ITR_v1 : spacer_left-ITR_v2.1 : VD_Promoter Set (VD) : PmeI_site : Modified_Minimum_Consensus_Kozak : hPAH_codop_ORF_v2 : PacI_site : WPRE_3pUTR : bGH/spacer : spacer_right-ITR_v1 : right-ITR_v1 (ceDNA412). ceDNA412는 실시예 12에 기재된 본 연구에서 대조군으로 작용하였다.
코돈 최적화된 인간 PAH 버전 2(hPAH_codop_ORF_v2)를 함유하는ceDNA의 핵산 서열은 본원에 서열번호 577로 제시되어 있으며, 이는 VD 프로모터 세트, 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA34).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 581로 제시되어 있으며, 이는 hAAT 프로모터와, 다른 인핸서(즉, PromoterSet-1476), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA41).
코돈 최적화된 인간 PAH 버전 2(hPAH_codop_ORF_v2)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 579로 제시되어 있으며, 이는 TTR 프로모터와, 다른 인핸서(즉, HS-CRM8_FOXA_HNF4_consensus_v1), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA36).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 583으로 제시되어 있으며, 이는 TTR 프로모터와, 다른 인핸서(즉, HS-CRM8_FOXA_HNF4_consensus_v1), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA43).
인트론과 인트론 플랭킹 영역을 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29(hPAH-r5-s29::oIVS1B_33bpFlanks)를 함유하는 ceDNA의 핵산 서열은 본원에 서열번호 582로 제시되어 있으며, 이는 TTR 프로모터와, 다른 인핸서(즉, 3x_HNF_FOXA_v1), 인트론, UTR, 제한 엔도뉴클레아제 부위, 시스 및 전사 후 조절 요소를 포함한다(ceDNA42).
본 연구에 사용되고 상기 기재된 바와 같은 ceDNA 벡터의 특징은 하기 표 32에 개략되어 있다.
[표 32]
Figure pct00058
연구 설계
ceDNA PAH 벡터(임의의 LNP 캡슐화 없이 단독으로)와 대조군을 각각 대략 약 7주령 내지 10주령의 혼성 연령 일치 PAHenu2 마우스에 투여하였다. 네이키드 ceDNA 벡터를, 0일차에 90 ml/㎏ 내지 100 ml/㎏의 용량 부피로 측면 꼬리 정맥을 통해 유체역학적 정맥내 주사로, 동물당(군당 5마리 동물) 0.1 ㎍(선택된 동물만) 또는 0.5 ㎍으로 투여하였다. 28일차는 종결 시점이었다. 연구 설계는 하기 표 33에 제시되어 있다.
[표 33]
Figure pct00059
각각, 표 34A표 34B에 따라, 중간 및 종료 시점에서 혈액을 채취하였다.
[표 34A]
Figure pct00060
[표 34B]
Figure pct00061
연구 세부사항
종(수, 성별, 연령): 60마리 + 예비용 5마리 PAHenu2 돌연변이(MUT) 마우스(혼성, 약 6주령 내지 8주령, 도착 시 연령 일치); 5마리 야생형(WT); 혼성, 한배새끼; 연령 일치. 동물은 투여 개시 시 약 7주령 내지 10주령이었다.
케이지 사이드 관찰: 케이지 사이드 관찰은 매일 수행하였다.
임상 관찰: 0일차에 시험 물질을 투여하고 약 1시간, 약 5시간 내지 약 6시간, 및 약 24시간 후에 임상 관찰을 수행하였으며, 이는 나머지 그룹에도 적용할 수 있다.
화합물 부류: 재조합 DNA 벡터, ceDNA.
체중: 모든 동물의 체중을 -4일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차(안락사 전)에 기록하였다.
투여 제형: 시험 물품은 농축 스톡으로 공급하였다. 스톡을 실온까지 가온시키고, 사용 직전 제공된 PBS를 이용하여 희석하였다. 투여가 즉시 수행되지 않는 경우, 준비된 물질을 약 4℃에서 보관할 수 있다.
용량 투여: 0일차에, 군 1 내지 군 12에 대해 시험 물질을 측면 꼬리 정맥을 통해 동물당 설정된 부피, 90 내지 100 ml/㎏(군 내 가장 가벼운 동물에 따라 달라짐)로 유체역학적 IV 투여로 투여하였다.
채혈 전 금식: 모든 동물(모든 군)을 -4일차, 0일차, 1일차, 2일차, 3일차, 7일차, 14일차, 21일차 및 28일차에, 모든 중간 및 종료 시 채혈 전 최소 4시간 동안 금식시켰다.
먹이를 제거하고, 침구를 교체하였다. 8시간 이하의 금식 기간 동안 각각의 중간 채혈 종결 시 먹이를 다시 제공하였다.
중간 채혈: -4일차, 3일차, 7일차, 14일차 및 21일차에, 군 1 내지 군 12의 모든 동물에서 중간 채혈을 수행하였다. 동물은 공복 시 혈청 수집을 위한 전혈을 가지고 있었다. 채취 후, 동물에게 젖산 링거액 0.5 mL 내지 1.0 mL를 피하 투여하였다.
채혈: 혈청용 전혈은 복재 정맥에서 채취하였다. 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 1개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
예정되지 않은 안락사: 예정된 시점 이전에 안락사시킨 빈사 상태의 동물에서 말단 조직을 채취하였다. 가능한 경우, 죽은 채로 발견된 동물에서 조직을 채취하여 보관하였다.
안락사: 28일차에, 최소 4시간 공복 후, CO2 질식, 개흉술 및 방혈을 통해 동물을 안락사시켰다.
종료 시 혈액: 채혈로부터의 전혈을 혈전 활성화제가 포함된 혈청 분리기 튜브에 채취하고, 시설 SOP에 따라 2개의 혈청 분취량으로 처리하였다. 모든 샘플을 드라이 아이스 상에서 배송될 때까지 공칭 -70℃에서 보관하였다.
페닐알라닌(PHE) 수준: Pure Honey에서 PHE 수준에 대해 혈청 샘플을 분석하였다.
활성 수준: Pure Honey에서 활성 수준에 대해 2개의 동결된 간 샘플을 분석하였다.
결과
본 연구에서는 2개의 코돈 최적화된 PAH 서열(즉, hPAH_codop_ORF_v2 및 hPAH-r5-s29::hIVS1B_33bpFlanks)을 상이한 프로모터 또는 적어도 인핸서를 수반하는 프로모터를 갖는 프로모터 세트(즉, VD 프로모터 세트, PromoterSet-1476, 및 인핸서 중 하나로서 HS-CRM_FOXA_HNF4_consensus_v1 또는 3x_HNF4_FOXA_v1을 갖는 TTR 프로모터)와 조합으로 시험하였다. 각각의 시험된 ceDNA 작제물에 함유된 특정 요소는 표 32에 개략되어 있다.
도 19a도 19b에 제시된 바와 같이, 0.5 ㎍ 용량에서, ceDNA412와 이의 상응하는 합성적으로 생산된 대응 벡터인 ceDNA34는 동등한 PAH 활성과 PHE 교정을 나타냈다. 0.5 ㎍ 용량에서, 다른 합성적으로 생산된 벡터, 즉, ceDNA36, ceDNA41 및 ceDNA43은 3일 이내에 전체 5마리 마우스 중 적어도 1 마리에서 PHE 수준(PHE μM)의 목표 농도(350 μM 미만) 아래로의 신속한 교정을 나타냈다. 특히, ceDNA41과 ceDNA43은, 투여 3일 이내에 전체 5마리 마우스 중 최대 4마리가 목표 농도 아래인 PHE 수준을 달성했다는 점에서, 대조군 ceDNA412를 능가하였다.
ceDNA36과 ceDNA43은 각각 HS-CRM_FOXA_HNF4_consensus_v1 인핸서와 조합된 TTR 프로모터를 가졌지만, ceDNA43이 hPAH-r5-s29::hIVS1B_33bpFlanks PAH 서열(CpG 함량 = 0)을 함유하고, ceDNA41이 hPAH_codop_ORF_v2 PAH 서열(CpG 함량 = 77)을 함유한다는 점에서 PAH 서열이 다르다. ceDNA36과 비교하여 ceDNA43에서의 우수한 PHE 교정은 PAH 서열에서 CpG 최소화의 중요성을 보여준다(도 19c도 19e 참조). 유사하게, 상이한 생산 방법과는 별개로, ceDNA41과 ceDNA412는 또한 ceDNA41이 hPAH-r5-s29::hIVS1B_33bpFlanks PAH 서열을 함유하고, ceDNA412가 hPAH_codop_ORF_v2 PAH 서열을 함유한다는 점에서 PAH 서열이 다르다. ceDNA41은 ceDNA412와 비교하여 우수한 PHE 우수한 교정을 나타냈다(도 19d도 19a 참조).
인핸서로서 HS-CRM_FOXA_HNF4_consensus_v1과 조합된 TTR 프로모터를 함유하는 벡터, 즉, ceDNA43과 ceDNA36은 모두 투여 3일 이내에 전체 5마리 마우스 중 적어도 1마리에서 PHE 교정을 나타냈으며, ceDNA43은 전체 5마리 마우스 중 4마리에서 PHE 교정을 달성하였다(도 19b도 19e 참조). 놀랍게도, 동일한 TTR 프로모터와 조합으로 사용된 3x_HNF4_FOXA_v1이 HNF4 결합 부위의 3개의 카피를 함유하는 점에서 ceDNA43과 다른 ceDNA42는, 어떠한 마우스에서도 PHE 교정을 달성하지 못했다(도 19d 참조).
0.5 ㎍ 투여 연구에서 볼 수 있는 바와 같이, CpG 함량 = 0인 hPAH-r5-s29::hIVS1B_33bpFlanks PAH 서열을 발현하고, 인핸서로서HS-CRM_FOXA_HNF4_consensus_v1과 조합된 TTR 프로모터를 함유하는 합성적으로 생산된 ceDNA43은, 연구된 모든 벡터 중에서 가장 강력한 벡터였다.
따라서, 실시예 6 내지 실시예 12는, 코돈 최적화된 PAH 핵산 서열을 포함하는 ceDNA 작제물(예를 들어, ceDNA 벡터)이 페닐알라닌 수준(예를 들어, 발현 및 지속기간)의 최적 교정에 대해 시험된 특정 시스-작용 요소(예를 들어, 특정 프로모터, 특정 인핸서, 및 특정 프로모터와 인핸서 조합)와 신중하게 조합될 수 있음을 보여주었다. 나아가, 실시예 12 연구는, 합성적으로 생산된 ceDNA 작제물이 PAH 결핍 PAHenu2 마우스에서 동등하거나 더 강력한 PHE 교정을 나타냄을 입증한다.
핵산 서열:
코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 하기에 제시되어 있다(ceDNA412). 프로모터에는 밑줄이 그어져 있고(서열번호 191), 코돈 최적화된 PAH 버전 2 오픈리딩프레임(ORF)에는 이중 밑줄이 그어져 있다(서열번호 382).
AAAGTAGCCGAAGATGACGGTTTGTCACATGGAGTTGGCAGGATGTTTGATTAAAAACATAACAGGAAGAAAAATGCCCCGCTGTGGGCGGACAAAATAGTTGGGAACTGGGAGGGGTGGAAATGGAGTTTTTAAGGATTATTTAGGGAAGAGTGACAAAATAGATGGGAACTGGGTGTAGCGTCGTAAGCTAATACGAAAATTAAAAATGACAAAATAGTTTGGAACTAGATTTCACTTATCTGGTTCGGATCTCCTAGGCCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCGCGGCCGCCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACACGCGTGGTACCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGTTTAAACCGCAGCCACCATGAGCACCGCCGTGCTGGAAAATCCTGGCCTGGGCAGAAAGCTGAGCGACTTCGGCCAAGAGACAAGCTACATCGAGGACAACTGCAACCAGAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGAGACTGTTCGAAGAGAACGACGTGAACCTGACACACATCGAGAGCAGACCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCTGCTCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACAGTGCACGAACTGAGCCGGGACAAGAAAAAGGACACCGTGCCATGGTTCCCCAGAACCATCCAAGAGCTGGACAGATTCGCCAACCAGATCCTGAGCTATGGCGCCGAGCTGGACGCTGATCACCCTGGCTTTAAGGACCCCGTGTACCGGGCCAGAAGAAAGCAGTTTGCCGATATCGCCTACAACTACCGGCACGGCCAGCCTATTCCTCGGGTCGAGTACATGGAAGAGGAAAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACAAGACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTTGAGGACGTGTCCCAGTTCCTGCAGACCTGCACCGGCTTTAGACTGAGGCCAGTTGCCGGACTGCTGAGCAGCAGAGATTTTCTCGGCGGCCTGGCCTTCAGAGTGTTCCACTGTACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCTGATATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGATAGAAGCTTCGCCCAGTTCAGCCAAGAGATCGGACTGGCTTCTCTGGGAGCCCCTGACGAGTACATTGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAAGCTTATGGCGCTGGCCTGCTGTCTAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCTAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCTCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATTCCTCGGCCTTTCAGCGTCAGATACGACCCCTACACACAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGATAGTTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCGCCTCGAGCCATGGTGCTAGCAGCTGATGCATAGCATGCGGTACCGGGAGATGGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGACCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCAACCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAAGCCCTGCCATAGCCACTACGGGTACGTAGGCCAACCACTAGAACTATAGCTAGAGTCCTGGGCGAACAAACGATGCTCGCCTTCCAGAAAACCGAGGATGCGAACCACTTCATCCGGGGTCAGCACCACCGGCAAGCGCCGCGACGGCCGAGGTCTACCGATCTCCTGAAGCCAGGGCAGATCCGTGCACAGCACCTTGCCGTAGAAGAACAGCAAGGCCGCCAATGCCTGACGATGCGTGGAGACCGAAACCTTGCGCTCGTTCGCCAGCCAGGACAGAAATGCCTCGACTTCGCTGCTGCCCAAGGTTGCCGGGTGACGCACACCGTGGAAACGGATGAAGGCACGAACCCAGTTGACATAAGCCTGTTCGGTTCGTAAACTGTAATGCAAGTAGCGTATGCGCTCACGCAACTGGTCCAGAACCTTGACCGAACGCAGCGGTGGTAACGGCGCAGTGGCGGTTTTCATGGCTTGTTATGACTGTTTTTTTGTACAGTCTATGCCTCGGGCATCCAAGCAGCAAGCGCGTTACGCCGTGGGTCGATGTTTGATGTTATGGAGCAGCAACGATGTTACGCAGCAGCAACGATGTTACGCAGCAGGGCAGTCGCCCTAAAACAAAGTTAGGTGGCTCAAGTATGGGCATCATTCGCACATGTAGGCTCGGCCCTGACCAAGTCAAATCCATGCGGGCTGCTCTTGATCTTTTCGGTCGTGAGTTCGGAGACGTAGCCACCTACTCCCAACATCAGCCGGACTCCGATTACCTCGGGAACTTGCTCCGTAGTAAGACATTCATCGCGCTTGCTGCCTTCGACCAAGAAGCGGTTGTTGGCGCTCTCGCGGCTTACGTTCTGCCCAGGTTTGAGCAGCCGCGTAGTGAGATCTATATCTATGATCTCGCAGTCTCCGGCGAGCACCGGAGGCAGGGCATTGCCACCGCGCTCATCAATCTCCTCAAGCATGAGGCCAACGCGCTTGGTGCTTATGTGATCTACGTGCAAGCAGATTACGGTGACGATCCCGCAGTGGCTCTCTATACAAAGTTGGGCATACGGGAAGAAGTGATGCACTTTGATATCGACCCAAGTACCGCCACCTAACAATTCGTTCAAGCCGAGATCGGCTTCCCGGCCGCGGAGTTGTTCGGTAAATTGTCACAACGCCGCGAATATAGTCTTTACCATGCCCTTGGCCACGCCCCTCTTTAATACGACGGGCAATTTGCACTTCAGAAAATGAAGAGTTTGCTTTAGCCATAACAAAAGTCCAGTATGCTTTTTCACAGCATAACTGGACTGATTTCAGTTTACAACTATTCTGTCTAGTTTAAGACTTTATTGTCATAGTTTAGATCTATTTTGTTCAGTTTAAGACTTTATTGTCCGCCCACACCCGCTTACGCAGGGCATCCATTTATTACTCAACCGTAACCGATTTTGCCAGGTTACGCGGCTGGTCTGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGAAATTGTAAACGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAATAGGCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAATAGACCGAGATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTCCAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACCCTAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAGCCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCGAACGTGGCGAGAAAGGAAGGGAAGAAAGCGAAAGGAGCGGGCGCTAGGGCGCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCACCACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTCCCATTCGCCATTCAGGCTGCAAATAAGCGTTGATATTCAGTCAATTACAAACATTAATAACGAAGAGATGACAGAAAAATTTTCATTCTGTGACAGAGAA (서열번호 192)
상기 ceDNA 작제물은 left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1을 포함한다.
일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192를 포함한다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 85% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 90% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 91% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 92% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 93% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 94% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 95% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 96% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 97% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 98% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192와 적어도 99% 동일하다. 일부 구현예에 따르면, 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 192로 이루어져 있다.
인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열이 하기에 제시되어 있다. 프로모터에는 밑줄이 그어져 있고(서열번호 191), PAH 오픈리딩프레임(ORF)에는 이중 밑줄이 그어져 있다(서열번호 394; ceDNA802).
GGCCGGCCCCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTAGCCATGCTCTAGACGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACACGCGTGGTACCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGTTTAAACGCCGCCACCATGTCCACTGCGGTCCTGGAAAACCCAGGCTTGGGCAGGAAACTCTCTGACTTTGGACAGGAAACAAGCTATATTGAAGACAACTGCAATCAAAATGGTGCCATATCACTGATCTTCTCACTCAAAGAAGAAGTTGGTGCATTGGCCAAAGTATTGCGCTTATTTGAGGAGAATGATGTAAACCTGACCCACATTGAATCTAGACCTTCTCGTTTAAAGAAAGATGAGTATGAATTTTTCACCCATTTGGATAAACGTAGCCTGCCTGCTCTGACAAACATCATCAAGATCTTGAGGCATGACATTGGTGCCACTGTCCATGAGCTTTCACGAGATAAGAAGAAAGACACAGTGCCCTGGTTCCCAAGAACCATTCAAGAGCTGGACAGATTTGCCAATCAGATTCTCAGCTATGGAGCGGAACTGGATGCTGACCACCCTGGTTTTAAAGATCCTGTGTACCGTGCAAGACGGAAGCAGTTTGCTGACATTGCCTACAACTACCGCCATGGGCAGCCCATCCCTCGAGTGGAATACATGGAGGAAGAAAAGAAAACATGGGGCACAGTGTTCAAGACTCTGAAGTCCTTGTATAAAACCCATGCTTGCTATGAGTACAATCACATTTTTCCACTTCTTGAAAAGTACTGTGGCTTCCATGAAGATAACATTCCCCAGCTGGAAGACGTTTCTCAGTTCCTGCAGACTTGCACTGGTTTCCGCCTCCGACCTGTGGCTGGCCTGCTTTCCTCTCGGGATTTCTTGGGTGGCCTGGCCTTCCGAGTCTTCCACTGCACACAGTACATCAGACATGGATCCAAGCCCATGTATACCCCCGAACCTGACATCTGCCATGAGCTGTTGGGACATGTGCCCTTGTTTTCAGATCGCAGCTTTGCCCAGTTTTCCCAGGAAATTGGCCTTGCCTCTCTGGGTGCACCTGATGAATACATTGAAAAGCTCGCCACAATTTACTGGTTTACTGTGGAGTTTGGGCTCTGCAAACAAGGAGACTCCATAAAGGCATATGGTGCTGGGCTCCTGTCATCCTTTGGTGAATTACAGTACTGCTTATCAGAGAAGCCAAAGCTTCTCCCCCTGGAGCTGGAGAAGACAGCCATCCAAAATTACACTGTCACGGAGTTCCAGCCCCTCTATTACGTGGCAGAGAGTTTTAATGATGCCAAGGAGAAAGTAAGGAACTTTGCTGCCACAATACCTCGGCCCTTCTCAGTTCGCTACGACCCATACACCCAAAGGATTGAGGTCTTGGACAATACCCAGCAGCTTAAGATTTTGGCTGATTCCATTAACAGTGAAATTGGAATCCTTTGCAGTGCCCTCCAGAAAATAAAGTAATTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCGCCTCGAGGCATGCGGTACCAAGCTTGTCGAGAAGTACTAGAGGATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCTGATCACTGATATCGCCTAGGAGATCCGAACCAGATAAGTGAAATCTAGTTCCAAACTATTTTGTCATTTTTAATTTTCGTATTAGCTTACGACGCTACACCCAGTTCCCATCTATTTTGTCACTCTTCCCTAAATAATCCTTAAAAACTCCATTTCCACCCCTCCCAGTTCCCAACTATTTTGTCCGCCCACAGCGGGGCATTTTTCTTCCTGTTATGTTTTTAATCAAACATCCTGCCAACTCCATGTGACAAACCGTCATCTTCGGCTACTTTTTCTCTGTCACAGAATGAAAATTTTTCTGTCATCTCTTCGTTATTAATGTTTGTAATTGACTGAATATCAACGCTTATTTGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCATTGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCAGACCAGCCGCGTAACCTGGCAAAATCGGTTACGGTTGAGTAATAAATGGATGCCCTGCGTAAGCGGGTGTGGGCGGACAATAAAGTCTTAAACTGAACAAAATAGATCTAAACTATGACAATAAAGTCTTAAACTAGACAGAATAGTTGTAAACTGAAATCAGTCCAGTTATGCTGTGAAAAAGCATACTGGACTTTTGTTATGGCTAAAGCAAACTCTTCATTTTCTGAAGTGCAAATTGCCCGTCGTATTAAAGAGGGGCGTGGCCAAGGGCATGGTAAAGACTATATTCGCGGCGTTGTGACAATTTACCGAACAACTCCGCGGCCGGGAAGCCGATCTCGGCTTGAACGAATTGTTAGGTGGCGGTACTTGGGTCGATATCAAAGTGCATCACTTCTTCCCGTATGCCCAACTTTGTATAGAGAGCCACTGCGGGATCGTCACCGTAATCTGCTTGCACGTAGATCACATAAGCACCAAGCGCGTTGGCCTCATGCTTGAGGAGATTGATGAGCGCGGTGGCAATGCCCTGCCTCCGGTGCTCGCCGGAGACTGCGAGATCATAGATATAGATCTCACTACGCGGCTGCTCAAACCTGGGCAGAACGTAAGCCGCGAGAGCGCCAACAACCGCTTCTTGGTCGAAGGCAGCAAGCGCGATGAATGTCTTACTACGGAGCAAGTTCCCGAGGTAATCGGAGTCCGGCTGATGTTGGGAGTAGGTGGCTACGTCTCCGAACTCACGACCGAAAAGATCAAGAGCAGCCCGCATGGATTTGACTTGGTCAGGGCCGAGCCTACATGTGCGAATGATGCCCATACTTGAGCCACCTAACTTTGTTTTAGGGCGACTGCCCTGCTGCGTAACATCGTTGCTGCTGCGTAACATCGTTGCTGCTCCATAACATCAAACATCGACCCACGGCGTAACGCGCTTGCTGCTTGGATGCCCGAGGCATAGACTGTACAAAAAAACAGTCATAACAAGCCATGAAAACCGCCACTGCGCCGTTACCACCGCTGCGTTCGGTCAAGGTTCTGGACCAGTTGCGTGAGCGCATACGCTACTTGCATTACAGTTTACGAACCGAACAGGCTTATGTCAACTGGGTTCGTGCCTTCATCCGTTTCCACGGTGTGCGTCACCCGGCAACCTTGGGCAGCAGCGAAGTCGAGGCATTTCTGTCCTGGCTGGCGAACGAGCGCAAGGTTTCGGTCTCCACGCATCGTCAGGCATTGGCGGCCTTGCTGTTCTTCTACGGCAAGGTGCTGTGCACGGATCTGCCCTGGCTTCAGGAGATCGGAAGACCTCGGCCGTCGCGGCGCTTGCCGGTGGTGCTGACCCCGGATGAAGTGGTTCGCATCCTCGGTTTTCTGGAAGGCGAGCATCGTTTGTTCGCCCAGGACTCTAGCTATAGTTCTAGTGGTTGGCTACGTATACTCCGGAATATTAATAGATCATGGAGATAATTAAAATGATAACCATCTCGCAAATAAATAAGTATTTTACTGTTTTCGTAACAGTTTTGTAATAAAAAAACCTATAAATATTCCGGATTATTCATACCGTCCCACCATCGGGCGCGGATCTCGGTCCGAAACCATGTCGTACTACCATCACCATCACCATCACGATTACGATATCCCAACGACCGAAAACCTGTATTTTCAGGGCGCCATGGGATCC (서열번호 193)
서열번호 193은 하기 요소를 포함한다. Left-ITR_v1 : spacer_left-ITR_v1 : VD_Promoter Set : PmeI_site : Consensus_Kozak : hPAH_cDNA_ORF_v3 : PacI_site : WPRE_3pUTR : bGH : spacer_right-ITR_v1 : right-ITR_v1.
일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193을 포함한다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 85% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 90% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 91% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 92% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 93% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 94% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 95% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 96% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 97% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 98% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193과 적어도 99% 동일하다. 일부 구현예에 따르면, 인간 PAH cDNA를 함유하는 ceDNA(코돈 최적화되지 않은 hPAH cDNA에 연결된 ceDNA VD 프로모터)의 핵산 서열은 서열번호 193으로 이루어져 있다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 하기에 제시되어 있다(ceDNA1132).
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCGCGGCCGCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACGGTACCCACTGGGAGGATGTTGAGTAAGATGGAAAACTACTGATGACCCTTGCAGAGACAGAGTATTAGGACATGTTTGAACAGGGGCCGGGCGATCAGCAGGTAGCTCTAGAGGATCCCCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGGTTTAAACCGCAGCCACCATGAGCACCGCCGTGCTGGAAAATCCTGGCCTGGGCAGAAAGCTGAGCGACTTCGGCCAAGAGACAAGCTACATCGAGGACAACTGCAACCAGAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGAGACTGTTCGAAGAGAACGACGTGAACCTGACACACATCGAGAGCAGACCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCTGCTCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACAGTGCACGAACTGAGCCGGGACAAGAAAAAGGACACCGTGCCATGGTTCCCCAGAACCATCCAAGAGCTGGACAGATTCGCCAACCAGATCCTGAGCTATGGCGCCGAGCTGGACGCTGATCACCCTGGCTTTAAGGACCCCGTGTACCGGGCCAGAAGAAAGCAGTTTGCCGATATCGCCTACAACTACCGGCACGGCCAGCCTATTCCTCGGGTCGAGTACATGGAAGAGGAAAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACAAGACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTTGAGGACGTGTCCCAGTTCCTGCAGACCTGCACCGGCTTTAGACTGAGGCCAGTTGCCGGACTGCTGAGCAGCAGAGATTTTCTCGGCGGCCTGGCCTTCAGAGTGTTCCACTGTACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCTGATATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGATAGAAGCTTCGCCCAGTTCAGCCAAGAGATCGGACTGGCTTCTCTGGGAGCCCCTGACGAGTACATTGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAAGCTTATGGCGCTGGCCTGCTGTCTAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCTAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCTCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATTCCTCGGCCTTTCAGCGTCAGATACGACCCCTACACACAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGATAGTTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG (서열번호 194)
서열번호 194는 하기 요소를 포함한다. Left-ITR_v1, spacer_left-ITR_v2.1, 3xSerpEnh-TTRe-TTRm, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 194로 이루어진다.
특정 시스-조절 요소를 갖고 29번 아미노산이 결실된 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH Codop2")의 핵산 서열은 서열번호 195로 제시된 서열이다(ceDNA1274).
서열번호 195는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_delta1-29aa, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 delta1-29aa를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2_delta1-29aa")의 핵산 서열은 서열번호 195로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196으로 제시된 서열이다(ceDNA1414).
서열번호 196은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 196으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197로 제시된 서열이다(ceDNA1416).
서열번호 197은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::hIVS1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 197로 이루어진다. 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198로 제시된 서열이다(ceDNA1428).
서열번호 198은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29::mod-Intron_oIVS-v2_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 198로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199로 제시된 서열이다(ceDNA1430).
서열번호 199는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_mIVS-intron1B_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 199로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200으로 제시된 서열이다(ceDNA1432).
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCGCGGCCGCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACCGGGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCACGGTACCCACTGGGAGGATGTTGAGTAAGATGGAAAACTACTGATGACCCTTGCAGAGACAGAGTATTAGGACATGTTTGAACAGGGGCCGGGCGATCAGCAGGTAGCTCTAGAGGATCCCCGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCTAGGCAAGGTTCATATTTGTGTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGAAGAGGTAAGGGTTTAAGGGATGGTTGGTTGGTGGGGTATTAATGTTTAATTACCTGGAGCACCTGCCTGAAATCACTTTTTTTCAGGTTGGGTTTAAACCGCAGCCACCATGAGCACCGCCGTGCTGGAAAATCCTGGCTTGGGCAGGAAACTCTCTGACTTTGGACAGGTGAGCCACGGCAGCCTGAGCTGCTCAGTTAGGGGAATTTGGGCCTCCAGAGAAAGAGATCCGAAGACTGCTGGTGCTTCCTGGTTTCATAAGCTCAGTAAGAAGTCTGAATTCGTTGGAAGCTGATGATAGAAGAAAGAGTTCATGCTTGCTTTGTCCATGGAGGTTTAACAGGAATGAATTGCTAAACTGTGGAAAATGTTTTAAACAAATGCATCTTATCCTGTAGGAAACAAGCTATATTGAAGACAACTGCAATCAAAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGAGACTGTTCGAAGAGAACGACGTGAACCTGACACACATCGAGAGCAGACCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCTGCTCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACAGTGCACGAACTGAGCCGGGACAAGAAAAAGGACACCGTGCCATGGTTCCCCAGAACCATCCAAGAGCTGGACAGATTCGCCAACCAGATCCTGAGCTATGGCGCCGAGCTGGACGCTGATCACCCTGGCTTTAAGGACCCCGTGTACCGGGCCAGAAGAAAGCAGTTTGCCGATATCGCCTACAACTACCGGCACGGCCAGCCTATTCCTCGGGTCGAGTACATGGAAGAGGAAAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACAAGACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTTGAGGACGTGTCCCAGTTCCTGCAGACCTGCACCGGCTTTAGACTGAGGCCAGTTGCCGGACTGCTGAGCAGCAGAGATTTTCTCGGCGGCCTGGCCTTCAGAGTGTTCCACTGTACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCTGATATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGATAGAAGCTTCGCCCAGTTCAGCCAAGAGATCGGACTGGCTTCTCTGGGAGCCCCTGACGAGTACATTGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAAGCTTATGGCGCTGGCCTGCTGTCTAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCTAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCTCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATTCCTCGGCCTTTCAGCGTCAGATACGACCCCTACACACAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGAtagTTAATTAAGAGCATCTTACCGCCATTTATTCCCATATTTGTTCTGTTTTTCTTGATTTGGGTATACATTTAAATGTTAATAAAACAAAATGGTGGGGCAATCATTTACATTTTTAGGGATATGTAATTACTAGTTCAGGTGTATTGCCACAAGACAAACATGTTAAGAAACTTTCCCGTTATTTACGCTCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTATAGCCTCTGTATCTAGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTTAGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACACCTGCAGGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG (서열번호 200)
서열번호 200은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2_modified_Intron1_33bpFlanks, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 200으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201로 제시된 서열이다(ceDNA1436).
서열번호 202는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, hAAT(979)_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 201로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202로 제시된 서열이다(ceDNA1458).
서열번호 202는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv2_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 202로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203으로 제시된 서열이다(ceDNA1459).
서열번호 203은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, HBBv3_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 203으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204로 제시된 서열이다(ceDNA1464).
서열번호 204는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, SV40_polyA, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 204로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205로 제시된 서열이다(ceDNA1466).
서열번호 205는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, VD_PromoterSet, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, HBBv2_3pUTR, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 205로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206으로 제시된 서열이다(ceDNA1471).
서열번호 206은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 206으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207로 제시된 서열이다(ceDNA1472).
서열번호 207은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xHNF1-4_ProEnh_10mer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 207로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208로 제시된 서열이다(ceDNA1473).
서열번호 208은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, BamHI_site, TTR_liver_specific_Promoter, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 2082와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 208로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209로 제시된 서열이다(ceDNA1474).
서열번호 209는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, CpGfree20mer_1, 5xHNF1_ProEnh_10mer, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 209로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210으로 제시된 서열이다(ceDNA1527).
서열번호 210은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, 3xVanD_TTRe_PromoterSet_v2, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 210으로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211로 제시된 서열이다(ceDNA1528).
서열번호 211은 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2.1, CpGmin_hAAT_Promoter_Set, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH_codop_ORF_v2, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2를 함유하는 ceDNA(ceDNA "hPAH_codop_ORF_v2")의 핵산 서열은 서열번호 211로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212로 제시된 서열이다(ceDNA1529).
서열번호 212는 하기 요소를 포함한다. left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r3-s34, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212를 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212와 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r3-s34를 함유하는 ceDNA(ceDNA "hPAH-r3-s34")의 핵산 서열은 서열번호 212로 이루어진다.
특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213으로 제시된 서열이다(ceDNA1530).
서열번호 213은 하기 요소를 포함한다: left-ITR_v1, spacer_left-ITR_v2, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, HS-CRM8_SERP_Enhancer_nospacer, BamHI_site, TTR-promoter-d5pUTR, MVM_intron, PmeI_site, Mod_Minimum_Consensus_Kozak, hPAH-r5-s29, PacI_site, WPRE_3pUTR, bGH, spacer_right-ITR_v1, right-ITR_v1.
일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213을 포함한다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 85% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 90% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 91% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 92% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 93% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 94% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 95% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 96% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 97% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 98% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213과 적어도 99% 동일하다. 일부 구현예에 따르면, 특정 시스-조절 요소를 갖는 코돈 최적화된 인간 PAH 버전 2 r5-s29를 함유하는 ceDNA(ceDNA "hPAH-r5-s29")의 핵산 서열은 서열번호 213으로 이루어진다.
추가의 전장 ceDNA PAH 작제물 서열은 표 35에 제시되어 있다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 90% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 95% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 96% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 97% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 98% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열과 적어도 99% 동일하다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열을 포함한다. 일부 구현예에서, 전장 ceDNA PAH 작제물 서열의 핵산 서열은 표 35에 제시된 임의의 서열로 이루어진다.
[표 35]
Figure pct00062
참고문헌
본 명세서 및 본원의 실시예에 인용된, 비제한적으로, 특허 및 특허 출원을 포함하는 모든 간행물 및 참고문헌은, 각각의 개별적인 간행물 또는 참고문헌이 구체적으로 및 개별적으로 완전하게 기재된 것으로서 본원에 참조로서 인용되는 것으로 표시된 바와 같이, 그 전문이 본원에 참조로서 인용된다. 본 출원이 우선권을 주장하는 임의의 특허 출원 또한 간행물 및 참고문헌에 대해 상기 기재된 방식으로 본원에 참조로서 인용된다.
SEQUENCE LISTING <110> GENERATION BIO CO. KEENAN, Jessica Lynn <120> CLOSED-ENDED DNA VECTORS AND USES THEREOF FOR EXPRESSING PHENYLALANINE HYDROXYLASE (PAH) <130> 131698-08120 <140> <141> <150> 63/078,954 <151> 2020-09-16 <160> 1026 <170> PatentIn version 3.5 <210> 1 <211> 141 <212> DNA <213> Adeno-associated virus 2 <400> 1 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag ctgcctgcag g 141 <210> 2 <211> 141 <212> DNA <213> Adeno-associated virus 2 <400> 2 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc t 141 <210> 3 <400> 3 000 <210> 4 <400> 4 000 <210> 5 <211> 143 <212> DNA <213> Adeno-associated virus 1 <400> 5 ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc 60 agacggcaga ggtctcctct gccggcccca ccgagcgagc gacgcgcgca gagagggagt 120 gggcaactcc atcactaggg taa 143 <210> 6 <211> 144 <212> DNA <213> Adeno-associated virus 3 <400> 6 ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc 60 agacggacgt gggtttccac gtccggcccc accgagcgag cgagtgcgca tagagggagt 120 ggccaactcc atcactagag gtat 144 <210> 7 <211> 127 <212> DNA <213> Adeno-associated virus 4 <400> 7 ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc 60 agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg 120 gccaact 127 <210> 8 <211> 166 <212> DNA <213> Adeno-associated virus 5 <400> 8 tcccccctgt cgcgttcgct cgctcgctgg ctcgtttggg ggggcgacgg ccagagggcc 60 gtcgtctggc agctctttga gctgccaccc ccccaaacga gccagcgagc gagcgaacgc 120 gacagggggg agagtgccac actctcaagc aagggggttt tgtaag 166 <210> 9 <211> 144 <212> DNA <213> Adeno-associated virus 6 <400> 9 ttgcccactc cctctaatgc gcgctcgctc gctcggtggg gcctgcggac caaaggtccg 60 cagacggcag aggtctcctc tgccggcccc accgagcgag cgagcgcgca tagagggagt 120 gggcaactcc atcactaggg gtat 144 <210> 10 <211> 143 <212> DNA <213> Adeno-associated virus 1 <400> 10 ttaccctagt gatggagttg cccactccct ctctgcgcgc gtcgctcgct cggtggggcc 60 ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga 120 gcgcgcagag agggagtggg caa 143 <210> 11 <211> 144 <212> DNA <213> Adeno-associated virus 3 <400> 11 atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc 60 ggacgtggaa acccacgtcc gtctggcgac ctttggtcgc caggccccac cgagcgagcg 120 agtgcgcata gagggagtgg ccaa 144 <210> 12 <211> 127 <212> DNA <213> Adeno-associated virus 4 <400> 12 agttggccac attagctatg cgcgctcgct cactcactcg gccctggaga ccaaaggtct 60 ccagactgcc ggcctctggc cggcagggcc gagtgagtga gcgagcgcgc atagagggag 120 tggccaa 127 <210> 13 <211> 166 <212> DNA <213> Adeno-associated virus 5 <400> 13 cttacaaaac ccccttgctt gagagtgtgg cactctcccc cctgtcgcgt tcgctcgctc 60 gctggctcgt ttgggggggt ggcagctcaa agagctgcca gacgacggcc ctctggccgt 120 cgccccccca aacgagccag cgagcgagcg aacgcgacag ggggga 166 <210> 14 <211> 144 <212> DNA <213> Adeno-associated virus 6 <400> 14 atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc 60 ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga 120 gcgcgcatta gagggagtgg gcaa 144 <210> 15 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 15 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 120 <210> 16 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 16 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 120 gg 122 <210> 17 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 17 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct 120 gcctgcagg 129 <210> 18 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 18 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g 101 <210> 19 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 19 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga 120 gcgcgcagct gcctgcagg 139 <210> 20 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 20 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 120 gcgcagctgc ctgcagg 137 <210> 21 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 21 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 120 gcagctgcct gcagg 135 <210> 22 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 22 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 120 agctgcctgc agg 133 <210> 23 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 23 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga 120 gcgcgcagct gcctgcagg 139 <210> 24 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 24 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc 120 gcgcagctgc ctgcagg 137 <210> 25 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 25 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc 120 gcagctgcct gcagg 135 <210> 26 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 26 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc 120 agctgcctgc agg 133 <210> 27 <211> 131 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 27 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag 120 ctgcctgcag g 131 <210> 28 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 28 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct 120 gcctgcagg 129 <210> 29 <211> 127 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 29 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc 120 ctgcagg 127 <210> 30 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 30 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca 120 gg 122 <210> 31 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc 120 tgcctgcagg 130 <210> 32 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 32 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg 60 cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct 120 <210> 33 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 33 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc 60 ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120 ct 122 <210> 34 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 34 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc 120 ct 122 <210> 35 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 35 cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg 60 gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120 ggggttcct 129 <210> 36 <211> 101 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 36 cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc 60 gcgcagagag ggagtggcca actccatcac taggggttcc t 101 <210> 37 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 37 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120 tccatcacta ggggttcct 139 <210> 38 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 38 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120 catcactagg ggttcct 137 <210> 39 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120 tcactagggg ttcct 135 <210> 40 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 40 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120 actaggggtt cct 133 <210> 41 <211> 139 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 41 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg 60 gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac 120 tccatcacta ggggttcct 139 <210> 42 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 42 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc 60 gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc 120 catcactagg ggttcct 137 <210> 43 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 43 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga 60 cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca 120 tcactagggg ttcct 135 <210> 44 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 44 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc 60 tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc 120 actaggggtt cct 133 <210> 45 <211> 131 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 45 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt 60 tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac 120 taggggttcc t 131 <210> 46 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 46 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg 60 gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120 ggggttcct 129 <210> 47 <211> 127 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 47 cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt 60 cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg 120 ggttcct 127 <210> 48 <211> 122 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 48 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca 120 gg 122 <210> 49 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 49 cgatcgttcg at 12 <210> 50 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 50 atcgaaccat cg 12 <210> 51 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 51 atcgaacgat cg 12 <210> 52 <211> 165 <212> DNA <213> Adeno-associated virus 2 <400> 52 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc 120 gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct 165 <210> 53 <211> 140 <212> DNA <213> Adeno-associated virus 2 <400> 53 cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc 60 cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg 120 cgcagagaga tcactagggg 140 <210> 54 <211> 90 <212> DNA <213> Adeno-associated virus 2 <400> 54 gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60 tcgcccggcc tcagtgagcg agcgagcgcg 90 <210> 55 <211> 91 <212> DNA <213> Adeno-associated virus 2 <400> 55 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc 60 ccgggcggcc tcagtgagcg agcgagcgcg c 91 <210> 56 <400> 56 000 <210> 57 <400> 57 000 <210> 58 <400> 58 000 <210> 59 <400> 59 000 <210> 60 <211> 16 <212> DNA <213> Adeno-associated virus 2 <400> 60 gcgcgctcgc tcgctc 16 <210> 61 <211> 6 <212> DNA <213> Adeno-associated virus 2 <400> 61 ggttga 6 <210> 62 <211> 4 <212> DNA <213> Unknown <220> <223> Description of Unknown: TRS sequence <400> 62 agtt 4 <210> 63 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: TRS sequence <400> 63 ggttgg 6 <210> 64 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: TRS sequence <400> 64 agttgg 6 <210> 65 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: TRS sequence <400> 65 agttga 6 <210> 66 <211> 6 <212> DNA <213> Unknown <220> <223> Description of Unknown: TRS sequence <400> 66 rrttrr 6 <210> 67 <400> 67 000 <210> 68 <400> 68 000 <210> 69 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 69 actgaggc 8 <210> 70 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 70 gcctcagt 8 <210> 71 <211> 16 <212> DNA <213> Adeno-associated virus 2 <400> 71 gagcgagcga gcgcgc 16 <210> 72 <400> 72 000 <210> 73 <400> 73 000 <210> 74 <400> 74 000 <210> 75 <400> 75 000 <210> 76 <400> 76 000 <210> 77 <400> 77 000 <210> 78 <400> 78 000 <210> 79 <400> 79 000 <210> 80 <400> 80 000 <210> 81 <400> 81 000 <210> 82 <400> 82 000 <210> 83 <400> 83 000 <210> 84 <400> 84 000 <210> 85 <400> 85 000 <210> 86 <400> 86 000 <210> 87 <400> 87 000 <210> 88 <400> 88 000 <210> 89 <400> 89 000 <210> 90 <211> 7 <212> PRT <213> Simian virus 40 <400> 90 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 91 <211> 21 <212> DNA <213> Simian virus 40 <400> 91 cccaagaaga agaggaaggt g 21 <210> 92 <211> 16 <212> PRT <213> Unknown <220> <223> Description of Unknown: Nucleoplasmin peptide <400> 92 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 93 <211> 9 <212> PRT <213> Unknown <220> <223> Description of Unknown: c-myc peptide <400> 93 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 94 <211> 11 <212> PRT <213> Unknown <220> <223> Description of Unknown: c-myc peptide <400> 94 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 95 <211> 38 <212> PRT <213> Homo sapiens <400> 95 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 96 <211> 42 <212> PRT <213> Unknown <220> <223> Description of Unknown: IBB domain from importin-alpha polypeptide <400> 96 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 97 <211> 8 <212> PRT <213> Unknown <220> <223> Description of Unknown: myoma T protein peptide <400> 97 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 98 <211> 8 <212> PRT <213> Unknown <220> <223> Description of Unknown: myoma T protein peptide <400> 98 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 99 <211> 8 <212> PRT <213> Homo sapiens <400> 99 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 100 <211> 12 <212> PRT <213> Mus sp. <400> 100 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 101 <400> 101 000 <210> 102 <400> 102 000 <210> 103 <400> 103 000 <210> 104 <400> 104 000 <210> 105 <400> 105 000 <210> 106 <400> 106 000 <210> 107 <400> 107 000 <210> 108 <400> 108 000 <210> 109 <400> 109 000 <210> 110 <400> 110 000 <210> 111 <400> 111 000 <210> 112 <400> 112 000 <210> 113 <211> 79 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 113 gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct 60 cagtgagcga gcgagcgcg 79 <210> 114 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 114 gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct 60 cagtgagcga gcgagcgcgc 80 <210> 115 <400> 115 000 <210> 116 <400> 116 000 <210> 117 <211> 5 <212> PRT <213> Influenza virus <400> 117 Asp Arg Leu Arg Arg 1 5 <210> 118 <211> 7 <212> PRT <213> Influenza virus <400> 118 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 119 <211> 10 <212> PRT <213> Hepatitis virus <400> 119 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 120 <211> 10 <212> PRT <213> Mus sp. <400> 120 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 121 <211> 20 <212> PRT <213> Homo sapiens <400> 121 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 122 <211> 17 <212> PRT <213> Homo sapiens <400> 122 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 123 <400> 123 000 <210> 124 <400> 124 000 <210> 125 <400> 125 000 <210> 126 <400> 126 000 <210> 127 <400> 127 000 <210> 128 <400> 128 000 <210> 129 <400> 129 000 <210> 130 <400> 130 000 <210> 131 <400> 131 000 <210> 132 <400> 132 000 <210> 133 <400> 133 000 <210> 134 <400> 134 000 <210> 135 <400> 135 000 <210> 136 <400> 136 000 <210> 137 <400> 137 000 <210> 138 <400> 138 000 <210> 139 <400> 139 000 <210> 140 <400> 140 000 <210> 141 <400> 141 000 <210> 142 <400> 142 000 <210> 143 <400> 143 000 <210> 144 <400> 144 000 <210> 145 <400> 145 000 <210> 146 <400> 146 000 <210> 147 <400> 147 000 <210> 148 <400> 148 000 <210> 149 <400> 149 000 <210> 150 <400> 150 000 <210> 151 <400> 151 000 <210> 152 <400> 152 000 <210> 153 <400> 153 000 <210> 154 <400> 154 000 <210> 155 <400> 155 000 <210> 156 <400> 156 000 <210> 157 <400> 157 000 <210> 158 <400> 158 000 <210> 159 <400> 159 000 <210> 160 <400> 160 000 <210> 161 <400> 161 000 <210> 162 <400> 162 000 <210> 163 <400> 163 000 <210> 164 <400> 164 000 <210> 165 <400> 165 000 <210> 166 <400> 166 000 <210> 167 <400> 167 000 <210> 168 <400> 168 000 <210> 169 <400> 169 000 <210> 170 <400> 170 000 <210> 171 <400> 171 000 <210> 172 <400> 172 000 <210> 173 <400> 173 000 <210> 174 <400> 174 000 <210> 175 <400> 175 000 <210> 176 <400> 176 000 <210> 177 <400> 177 000 <210> 178 <400> 178 000 <210> 179 <400> 179 000 <210> 180 <400> 180 000 <210> 181 <400> 181 000 <210> 182 <400> 182 000 <210> 183 <400> 183 000 <210> 184 <400> 184 000 <210> 185 <400> 185 000 <210> 186 <400> 186 000 <210> 187 <400> 187 000 <210> 188 <400> 188 000 <210> 189 <400> 189 000 <210> 190 <400> 190 000 <210> 191 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 191 ccgtctgtct gcacatttcg tagagcgagt gttccgatac tctaatctcc ctaggcaagg 60 ttcatatttg tgtaggttac ttattctcct tttgttgact aagtcaataa tcagaatcag 120 caggtttgga gtcagcttgg cagggatcag cagcctgggt tggaaggagg gggtataaaa 180 gccccttcac caggagaagc cgtcacacag atccacaagc tcctg 225 <210> 192 <211> 7551 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 192 aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat 60 aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg 120 aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta 180 gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt 240 atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg 300 cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag 360 cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc 420 cgccatgcta cttatcgcgg ccgccggggg aggctgctgg tgaatattaa ccaaggtcac 480 cccagttatc ggaggagcaa acaggggcta agtccacacg cgtggtaccg tctgtctgca 540 catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt 600 aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc 660 agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 720 gagaagccgt cacacagatc cacaagctcc tgaagaggta agggtttaag ggatggttgg 780 ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact ttttttcagg 840 ttggtttaaa ccgcagccac catgagcacc gccgtgctgg aaaatcctgg cctgggcaga 900 aagctgagcg acttcggcca agagacaagc tacatcgagg acaactgcaa ccagaacggc 960 gccatcagcc tgatcttcag cctgaaagaa gaagtgggcg ccctggccaa ggtgctgaga 1020 ctgttcgaag agaacgacgt gaacctgaca cacatcgaga gcagacccag cagactgaag 1080 aaggacgagt acgagttctt cacccacctg gacaagcgga gcctgcctgc tctgaccaac 1140 atcatcaaga tcctgcggca cgacatcggc gccacagtgc acgaactgag ccgggacaag 1200 aaaaaggaca ccgtgccatg gttccccaga accatccaag agctggacag attcgccaac 1260 cagatcctga gctatggcgc cgagctggac gctgatcacc ctggctttaa ggaccccgtg 1320 taccgggcca gaagaaagca gtttgccgat atcgcctaca actaccggca cggccagcct 1380 attcctcggg tcgagtacat ggaagaggaa aagaaaacct ggggcaccgt gttcaagacc 1440 ctgaagtccc tgtacaagac ccacgcctgc tacgagtaca accacatctt cccactgctc 1500 gaaaagtact gcggcttcca cgaggacaat atccctcagc ttgaggacgt gtcccagttc 1560 ctgcagacct gcaccggctt tagactgagg ccagttgccg gactgctgag cagcagagat 1620 tttctcggcg gcctggcctt cagagtgttc cactgtaccc agtacatcag acacggcagc 1680 aagcccatgt acacccctga gcctgatatc tgccacgagc tgctgggaca tgtgcccctg 1740 ttcagcgata gaagcttcgc ccagttcagc caagagatcg gactggcttc tctgggagcc 1800 cctgacgagt acattgagaa gctggccacc atctactggt tcaccgtgga attcggcctg 1860 tgcaagcagg gcgacagcat caaagcttat ggcgctggcc tgctgtctag cttcggcgag 1920 ctgcagtact gtctgagcga gaagcctaag ctgctgcccc tggaactgga aaagaccgcc 1980 atccagaact acaccgtgac cgagttccag cctctgtact acgtggccga gagcttcaac 2040 gacgccaaag aaaaagtgcg gaacttcgcc gccaccattc ctcggccttt cagcgtcaga 2100 tacgacccct acacacagcg gatcgaggtg ctggacaaca cacagcagct gaaaattctg 2160 gccgactcca tcaacagcga gatcggcatc ctgtgcagcg ccctgcagaa aatcaagtga 2220 tagttaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt 2280 tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg 2340 gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc 2400 gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga 2460 ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc 2520 tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt 2580 tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg 2640 tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg 2700 ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc 2760 gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctgtgcctt 2820 ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 2880 ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 2940 gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 3000 atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata 3060 agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt 3120 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 3180 acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga 3240 gccatggtgc tagcagctga tgcatagcat gcggtaccgg gagatggggg aggctaactg 3300 aaacacggaa ggagacaata ccggaaggaa cccgcgctat gacggcaata aaaagacaga 3360 ataaaacgca cgggtgttgg gtcgtttgtt cataaacgcg gggttcggtc ccagggctgg 3420 cactctgtcg ataccccacc gagaccccat tgggaccaat acgcccgcgt ttcttccttt 3480 tccccacccc aacccccaag ttcgggtgaa ggcccagggc tcgcagccaa cgtcggggcg 3540 gcaagccctg ccatagccac tacgggtacg taggccaacc actagaacta tagctagagt 3600 cctgggcgaa caaacgatgc tcgccttcca gaaaaccgag gatgcgaacc acttcatccg 3660 gggtcagcac caccggcaag cgccgcgacg gccgaggtct accgatctcc tgaagccagg 3720 gcagatccgt gcacagcacc ttgccgtaga agaacagcaa ggccgccaat gcctgacgat 3780 gcgtggagac cgaaaccttg cgctcgttcg ccagccagga cagaaatgcc tcgacttcgc 3840 tgctgcccaa ggttgccggg tgacgcacac cgtggaaacg gatgaaggca cgaacccagt 3900 tgacataagc ctgttcggtt cgtaaactgt aatgcaagta gcgtatgcgc tcacgcaact 3960 ggtccagaac cttgaccgaa cgcagcggtg gtaacggcgc agtggcggtt ttcatggctt 4020 gttatgactg tttttttgta cagtctatgc ctcgggcatc caagcagcaa gcgcgttacg 4080 ccgtgggtcg atgtttgatg ttatggagca gcaacgatgt tacgcagcag caacgatgtt 4140 acgcagcagg gcagtcgccc taaaacaaag ttaggtggct caagtatggg catcattcgc 4200 acatgtaggc tcggccctga ccaagtcaaa tccatgcggg ctgctcttga tcttttcggt 4260 cgtgagttcg gagacgtagc cacctactcc caacatcagc cggactccga ttacctcggg 4320 aacttgctcc gtagtaagac attcatcgcg cttgctgcct tcgaccaaga agcggttgtt 4380 ggcgctctcg cggcttacgt tctgcccagg tttgagcagc cgcgtagtga gatctatatc 4440 tatgatctcg cagtctccgg cgagcaccgg aggcagggca ttgccaccgc gctcatcaat 4500 ctcctcaagc atgaggccaa cgcgcttggt gcttatgtga tctacgtgca agcagattac 4560 ggtgacgatc ccgcagtggc tctctataca aagttgggca tacgggaaga agtgatgcac 4620 tttgatatcg acccaagtac cgccacctaa caattcgttc aagccgagat cggcttcccg 4680 gccgcggagt tgttcggtaa attgtcacaa cgccgcgaat atagtcttta ccatgccctt 4740 ggccacgccc ctctttaata cgacgggcaa tttgcacttc agaaaatgaa gagtttgctt 4800 tagccataac aaaagtccag tatgcttttt cacagcataa ctggactgat ttcagtttac 4860 aactattctg tctagtttaa gactttattg tcatagttta gatctatttt gttcagttta 4920 agactttatt gtccgcccac acccgcttac gcagggcatc catttattac tcaaccgtaa 4980 ccgattttgc caggttacgc ggctggtctg cggtgtgaaa taccgcacag atgcgtaagg 5040 agaaaatacc gcatcaggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 5100 gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 5160 tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 5220 aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 5280 aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 5340 ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 5400 tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 5460 agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 5520 gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 5580 tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 5640 acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 5700 tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 5760 caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 5820 aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 5880 aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 5940 ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 6000 agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 6060 atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 6120 cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 6180 aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 6240 cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 6300 aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 6360 ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 6420 gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 6480 ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 6540 tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 6600 tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 6660 ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 6720 tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 6780 agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 6840 acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 6900 ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 6960 gttccgcgca catttccccg aaaagtgcca cctgaaattg taaacgttaa tattttgtta 7020 aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc 7080 aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg 7140 aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat 7200 cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc 7260 cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag 7320 ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg 7380 gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta 7440 cagggcgcgt cccattcgcc attcaggctg caaataagcg ttgatattca gtcaattaca 7500 aacattaata acgaagagat gacagaaaaa ttttcattct gtgacagaga a 7551 <210> 193 <211> 7780 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 193 ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc 60 cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg 120 agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt 180 atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc 240 cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca 300 tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag 360 gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag 420 cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga 480 gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt 540 ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt 600 ggtttaaacg ccgccaccat gtccactgcg gtcctggaaa acccaggctt gggcaggaaa 660 ctctctgact ttggacagga aacaagctat attgaagaca actgcaatca aaatggtgcc 720 atatcactga tcttctcact caaagaagaa gttggtgcat tggccaaagt attgcgctta 780 tttgaggaga atgatgtaaa cctgacccac attgaatcta gaccttctcg tttaaagaaa 840 gatgagtatg aatttttcac ccatttggat aaacgtagcc tgcctgctct gacaaacatc 900 atcaagatct tgaggcatga cattggtgcc actgtccatg agctttcacg agataagaag 960 aaagacacag tgccctggtt cccaagaacc attcaagagc tggacagatt tgccaatcag 1020 attctcagct atggagcgga actggatgct gaccaccctg gttttaaaga tcctgtgtac 1080 cgtgcaagac ggaagcagtt tgctgacatt gcctacaact accgccatgg gcagcccatc 1140 cctcgagtgg aatacatgga ggaagaaaag aaaacatggg gcacagtgtt caagactctg 1200 aagtccttgt ataaaaccca tgcttgctat gagtacaatc acatttttcc acttcttgaa 1260 aagtactgtg gcttccatga agataacatt ccccagctgg aagacgtttc tcagttcctg 1320 cagacttgca ctggtttccg cctccgacct gtggctggcc tgctttcctc tcgggatttc 1380 ttgggtggcc tggccttccg agtcttccac tgcacacagt acatcagaca tggatccaag 1440 cccatgtata cccccgaacc tgacatctgc catgagctgt tgggacatgt gcccttgttt 1500 tcagatcgca gctttgccca gttttcccag gaaattggcc ttgcctctct gggtgcacct 1560 gatgaataca ttgaaaagct cgccacaatt tactggttta ctgtggagtt tgggctctgc 1620 aaacaaggag actccataaa ggcatatggt gctgggctcc tgtcatcctt tggtgaatta 1680 cagtactgct tatcagagaa gccaaagctt ctccccctgg agctggagaa gacagccatc 1740 caaaattaca ctgtcacgga gttccagccc ctctattacg tggcagagag ttttaatgat 1800 gccaaggaga aagtaaggaa ctttgctgcc acaatacctc ggcccttctc agttcgctac 1860 gacccataca cccaaaggat tgaggtcttg gacaataccc agcagcttaa gattttggct 1920 gattccatta acagtgaaat tggaatcctt tgcagtgccc tccagaaaat aaagtaatta 1980 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2040 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2100 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2160 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2220 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2280 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2340 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2400 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2460 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2520 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2580 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2640 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2700 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 2760 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 2820 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 2880 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2940 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg 3000 cggtaccaag cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga 3060 ggttttactt gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa 3120 tgcaattgtt gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag 3180 catcacaaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa 3240 actcatcaat gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga 3300 accagataag tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt 3360 acgacgctac acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac 3420 tccatttcca cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct 3480 tcctgttatg tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg 3540 ctactttttc tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg 3600 taattgactg aatatcaacg cttatttgca gcctgaatgg cgaatgggac gcgccctgta 3660 gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 3720 gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 3780 ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 3840 acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat 3900 agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 3960 aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc 4020 cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 4080 acaaaatatt aacgtttaca atttcaggtg gcacttttcg gggaaatgtg cgcggaaccc 4140 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 4200 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 4260 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 4320 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 4380 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 4440 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 4500 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 4560 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 4620 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 4680 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 4740 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 4800 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 4860 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 4920 ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 4980 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 5040 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 5100 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 5160 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 5220 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 5280 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 5340 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 5400 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 5460 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 5520 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 5580 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 5640 gatacctaca gcgtgagcat tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 5700 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 5760 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 5820 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 5880 ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 5940 ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 6000 ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cctgatgcgg tattttctcc 6060 ttacgcatct gtgcggtatt tcacaccgca gaccagccgc gtaacctggc aaaatcggtt 6120 acggttgagt aataaatgga tgccctgcgt aagcgggtgt gggcggacaa taaagtctta 6180 aactgaacaa aatagatcta aactatgaca ataaagtctt aaactagaca gaatagttgt 6240 aaactgaaat cagtccagtt atgctgtgaa aaagcatact ggacttttgt tatggctaaa 6300 gcaaactctt cattttctga agtgcaaatt gcccgtcgta ttaaagaggg gcgtggccaa 6360 gggcatggta aagactatat tcgcggcgtt gtgacaattt accgaacaac tccgcggccg 6420 ggaagccgat ctcggcttga acgaattgtt aggtggcggt acttgggtcg atatcaaagt 6480 gcatcacttc ttcccgtatg cccaactttg tatagagagc cactgcggga tcgtcaccgt 6540 aatctgcttg cacgtagatc acataagcac caagcgcgtt ggcctcatgc ttgaggagat 6600 tgatgagcgc ggtggcaatg ccctgcctcc ggtgctcgcc ggagactgcg agatcataga 6660 tatagatctc actacgcggc tgctcaaacc tgggcagaac gtaagccgcg agagcgccaa 6720 caaccgcttc ttggtcgaag gcagcaagcg cgatgaatgt cttactacgg agcaagttcc 6780 cgaggtaatc ggagtccggc tgatgttggg agtaggtggc tacgtctccg aactcacgac 6840 cgaaaagatc aagagcagcc cgcatggatt tgacttggtc agggccgagc ctacatgtgc 6900 gaatgatgcc catacttgag ccacctaact ttgttttagg gcgactgccc tgctgcgtaa 6960 catcgttgct gctgcgtaac atcgttgctg ctccataaca tcaaacatcg acccacggcg 7020 taacgcgctt gctgcttgga tgcccgaggc atagactgta caaaaaaaca gtcataacaa 7080 gccatgaaaa ccgccactgc gccgttacca ccgctgcgtt cggtcaaggt tctggaccag 7140 ttgcgtgagc gcatacgcta cttgcattac agtttacgaa ccgaacaggc ttatgtcaac 7200 tgggttcgtg ccttcatccg tttccacggt gtgcgtcacc cggcaacctt gggcagcagc 7260 gaagtcgagg catttctgtc ctggctggcg aacgagcgca aggtttcggt ctccacgcat 7320 cgtcaggcat tggcggcctt gctgttcttc tacggcaagg tgctgtgcac ggatctgccc 7380 tggcttcagg agatcggaag acctcggccg tcgcggcgct tgccggtggt gctgaccccg 7440 gatgaagtgg ttcgcatcct cggttttctg gaaggcgagc atcgtttgtt cgcccaggac 7500 tctagctata gttctagtgg ttggctacgt atactccgga atattaatag atcatggaga 7560 taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc gtaacagttt 7620 tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca tcgggcgcgg 7680 atctcggtcc gaaaccatgt cgtactacca tcaccatcac catcacgatt acgatatccc 7740 aacgaccgaa aacctgtatt ttcagggcgc catgggatcc 7780 <210> 194 <211> 3222 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 194 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840 taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg cagaaagctg 900 agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa cggcgccatc 960 agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1020 gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1080 gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1140 aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1200 gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1260 ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1320 gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1380 cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1440 tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1500 tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1560 acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1620 ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1680 atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1740 gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1800 gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 1860 cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 1920 tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 1980 aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2040 aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2100 ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2160 tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2220 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2280 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2340 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2400 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2460 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2520 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2580 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2640 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2700 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2760 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2820 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2880 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2940 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3000 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3060 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3120 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3180 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3222 <210> 195 <211> 2883 <212> DNA <213> Homo sapiens <400> 195 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgaaccaga acggcgccat cagcctgatc ttcagcctga aagaagaagt gggcgccctg 660 gccaaggtgc tgagactgtt cgaagagaac gacgtgaacc tgacacacat cgagagcaga 720 cccagcagac tgaagaagga cgagtacgag ttcttcaccc acctggacaa gcggagcctg 780 cctgctctga ccaacatcat caagatcctg cggcacgaca tcggcgccac agtgcacgaa 840 ctgagccggg acaagaaaaa ggacaccgtg ccatggttcc ccagaaccat ccaagagctg 900 gacagattcg ccaaccagat cctgagctat ggcgccgagc tggacgctga tcaccctggc 960 tttaaggacc ccgtgtaccg ggccagaaga aagcagtttg ccgatatcgc ctacaactac 1020 cggcacggcc agcctattcc tcgggtcgag tacatggaag aggaaaagaa aacctggggc 1080 accgtgttca agaccctgaa gtccctgtac aagacccacg cctgctacga gtacaaccac 1140 atcttcccac tgctcgaaaa gtactgcggc ttccacgagg acaatatccc tcagcttgag 1200 gacgtgtccc agttcctgca gacctgcacc ggctttagac tgaggccagt tgccggactg 1260 ctgagcagca gagattttct cggcggcctg gccttcagag tgttccactg tacccagtac 1320 atcagacacg gcagcaagcc catgtacacc cctgagcctg atatctgcca cgagctgctg 1380 ggacatgtgc ccctgttcag cgatagaagc ttcgcccagt tcagccaaga gatcggactg 1440 gcttctctgg gagcccctga cgagtacatt gagaagctgg ccaccatcta ctggttcacc 1500 gtggaattcg gcctgtgcaa gcagggcgac agcatcaaag cttatggcgc tggcctgctg 1560 tctagcttcg gcgagctgca gtactgtctg agcgagaagc ctaagctgct gcccctggaa 1620 ctggaaaaga ccgccatcca gaactacacc gtgaccgagt tccagcctct gtactacgtg 1680 gccgagagct tcaacgacgc caaagaaaaa gtgcggaact tcgccgccac cattcctcgg 1740 cctttcagcg tcagatacga cccctacaca cagcggatcg aggtgctgga caacacacag 1800 cagctgaaaa ttctggccga ctccatcaac agcgagatcg gcatcctgtg cagcgccctg 1860 cagaaaatca agtgatagtt aattaagagc atcttaccgc catttattcc catatttgtt 1920 ctgtttttct tgatttgggt atacatttaa atgttaataa aacaaaatgg tggggcaatc 1980 atttacattt ttagggatat gtaattacta gttcaggtgt attgccacaa gacaaacatg 2040 ttaagaaact ttcccgttat ttacgctctg ttcctgttaa tcaacctctg gattacaaaa 2100 tttgtgaaag attgactgat attcttaact atgttgctcc ttttacgctg tgtggatatg 2160 ctgctttata gcctctgtat ctagctattg cttcccgtac ggctttcgtt ttctcctcct 2220 tgtataaatc ctggttgctg tctcttttag aggagttgtg gcccgttgtc cgtcaacgtg 2280 gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg ctggggcatt gccaccacct 2340 gtcaactcct ttctgggact ttcgctttcc ccctcccgat cgccacggca gaactcatcg 2400 ccgcctgcct tgcccgctgc tggacagggg ctaggttgct gggcactgat aattccgtgg 2460 tgttgtctgt gccttctagt tgccagccat ctgttgtttg cccctccccc gtgccttcct 2520 tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa attgcatcgc 2580 attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac agcaaggggg 2640 aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg gctctagagc 2700 atggctacgt agataagtag catggcgggt taatcattaa ctacacctgc aggaggaacc 2760 cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2820 accaaaggtc gcccgacgcc cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc 2880 agg 2883 <210> 196 <211> 4089 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 196 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840 taaaccgcag ccaccatgtc cacagctgtg ctggagaacc ctggcctggg cagaaagctg 900 tctgactttg gccaggtgag ccagggcagc ctgagctgct cagttagggg aatttgggcc 960 tccagagaaa gagatcccaa gactgctggt gcttcctggt ttcataagct cagtaagaag 1020 tctgaattgg ttggaagctg atgagaatat ccaggaagtc aacagacaaa tgtcctcaac 1080 aattgtttct aagtaggaga acatctgtcc tgggtggctt tcacaggaat gaatgaccat 1140 tgctttaggg ggttggggat ctggcctcca gaactgccac caattagctg tgtgtctttg 1200 gacaagttac tgtccctctc tgttgtctgt ttactcttct gtacactgaa ggggttccaa 1260 tccaggtctt aggattcaaa agcctgtgca tgttccattt ttagtacttt ccacactgta 1320 tttctcaatg tctttctggg acattttata aatcatatta tatcacctct aaggatcttt 1380 cagtttgtta tatatgtgtc tattaagtta gattgtgagc tcctaaaaga taaagcattg 1440 tcttattcat ctttaaattt ctcagagccc aaatagtgcc tggaacctag tagttgctca 1500 ataaaaggta ttgaatttac aggattgaat ggtgacatca atgaataatt gaagattcct 1560 taagctgata actgacccag tagcatcatt gatcatttaa ttgccctgga cttacttatt 1620 ttccaccaca ctacatattt ctgtatagaa tatatatagc tcattgtatt gcaagattta 1680 actagaagaa agagttcatg cttgctttgt ccatgtaggt ttaacaggaa tgaattgcta 1740 aactgtggaa aatgttttaa acaaatgcat cttatcctgt aggagacctc ctacattgag 1800 gacaactgca accagaatgg agccatctcc ctgatcttct ccctgaagga ggaggtggga 1860 gccctggcca aggtgctgag actgtttgag gagaatgatg tgaacctgac ccacattgag 1920 tccagaccct ccagactgaa gaaggatgag tatgagttct tcacccacct ggacaagaga 1980 tccctgcctg ccctgaccaa catcatcaag atcctgagac atgacattgg agccacagtg 2040 catgagctgt ccagagacaa gaagaaggac acagtgccct ggttccccag aaccatccag 2100 gagctggaca gatttgccaa ccagatcctg tcctatggag ctgagctgga tgctgaccac 2160 cctggcttca aggaccctgt gtacagggcc agaagaaagc agtttgctga cattgcctac 2220 aactacagac atggccagcc catccccaga gtggagtaca tggaggagga gaagaagacc 2280 tggggcacag tgttcaagac cctgaagtcc ctgtacaaga cccatgcctg ctatgagtac 2340 aaccacatct tccccctgct ggagaagtac tgtggcttcc atgaggacaa catcccccag 2400 ctggaggatg tgtcccagtt cctgcagacc tgcacaggct tcagactgag acctgtggct 2460 ggcctgctgt cctccagaga cttcctggga ggcctggcct tcagagtgtt ccactgcacc 2520 cagtacatca gacatggctc caagcccatg tacacccctg agcctgacat ctgccatgag 2580 ctgctgggcc atgtgcccct gttctctgac agatcctttg cccagttctc ccaggagatt 2640 ggcctggcct ccctgggagc ccctgatgag tacattgaga agctggccac catctactgg 2700 ttcacagtgg agtttggcct gtgcaagcag ggagactcca tcaaggccta tggagctggc 2760 ctgctgtcct cctttggaga gctgcagtac tgcctgtctg agaagcccaa gctgctgccc 2820 ctggagctgg agaagacagc catccagaac tacacagtga cagagttcca gcccctgtac 2880 tatgtggctg agtccttcaa tgatgccaag gagaaggtca gaaactttgc tgccaccatc 2940 cccagaccct tctctgtgag atatgacccc tacacccaga gaattgaggt gctggacaac 3000 acccagcagc tgaagatcct ggctgactcc atcaactctg agattggcat cctgtgctct 3060 gccctgcaga agatcaagta aaccttaatt aagagcatct taccgccatt tattcccata 3120 tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg 3180 gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca 3240 aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt 3300 acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg 3360 gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct 3420 cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc 3480 aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca 3540 ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac 3600 tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt 3660 ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 3720 cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 3780 catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 3840 agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc 3900 tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga 3960 ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4020 cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct 4080 gcctgcagg 4089 <210> 197 <211> 4089 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 197 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840 taaaccgcag ccaccatgtc cacagctgtg ctggagaacc ctggcttggg caggaaactc 900 tctgactttg gacaggtgag ccagggcagc ctgagctgct cagttagggg aatttgggcc 960 tccagagaaa gagatcccaa gactgctggt gcttcctggt ttcataagct cagtaagaag 1020 tctgaattgg ttggaagctg atgagaatat ccaggaagtc aacagacaaa tgtcctcaac 1080 aattgtttct aagtaggaga acatctgtcc tgggtggctt tcacaggaat gaatgaccat 1140 tgctttaggg ggttggggat ctggcctcca gaactgccac caattagctg tgtgtctttg 1200 gacaagttac tgtccctctc tgttgtctgt ttactcttct gtacactgaa ggggttccaa 1260 tccaggtctt aggattcaaa agcctgtgca tgttccattt ttagtacttt ccacactgta 1320 tttctcaatg tctttctggg acattttata aatcatatta tatcacctct aaggatcttt 1380 cagtttgtta tatatgtgtc tattaagtta gattgtgagc tcctaaaaga taaagcattg 1440 tcttattcat ctttaaattt ctcagagccc aaatagtgcc tggaacctag tagttgctca 1500 ataaaaggta ttgaatttac aggattgaat ggtgacatca atgaataatt gaagattcct 1560 taagctgata actgacccag tagcatcatt gatcatttaa ttgccctgga cttacttatt 1620 ttccaccaca ctacatattt ctgtatagaa tatatatagc tcattgtatt gcaagattta 1680 actagaagaa agagttcatg cttgctttgt ccatgtaggt ttaacaggaa tgaattgcta 1740 aactgtggaa aatgttttaa acaaatgcat cttatcctgt aggaaacaag ctatattgaa 1800 gacaactgca atcaaaatgg agccatctcc ctgatcttct ccctgaagga ggaggtggga 1860 gccctggcca aggtgctgag actgtttgag gagaatgatg tgaacctgac ccacattgag 1920 tccagaccct ccagactgaa gaaggatgag tatgagttct tcacccacct ggacaagaga 1980 tccctgcctg ccctgaccaa catcatcaag atcctgagac atgacattgg agccacagtg 2040 catgagctgt ccagagacaa gaagaaggac acagtgccct ggttccccag aaccatccag 2100 gagctggaca gatttgccaa ccagatcctg tcctatggag ctgagctgga tgctgaccac 2160 cctggcttca aggaccctgt gtacagggcc agaagaaagc agtttgctga cattgcctac 2220 aactacagac atggccagcc catccccaga gtggagtaca tggaggagga gaagaagacc 2280 tggggcacag tgttcaagac cctgaagtcc ctgtacaaga cccatgcctg ctatgagtac 2340 aaccacatct tccccctgct ggagaagtac tgtggcttcc atgaggacaa catcccccag 2400 ctggaggatg tgtcccagtt cctgcagacc tgcacaggct tcagactgag acctgtggct 2460 ggcctgctgt cctccagaga cttcctggga ggcctggcct tcagagtgtt ccactgcacc 2520 cagtacatca gacatggctc caagcccatg tacacccctg agcctgacat ctgccatgag 2580 ctgctgggcc atgtgcccct gttctctgac agatcctttg cccagttctc ccaggagatt 2640 ggcctggcct ccctgggagc ccctgatgag tacattgaga agctggccac catctactgg 2700 ttcacagtgg agtttggcct gtgcaagcag ggagactcca tcaaggccta tggagctggc 2760 ctgctgtcct cctttggaga gctgcagtac tgcctgtctg agaagcccaa gctgctgccc 2820 ctggagctgg agaagacagc catccagaac tacacagtga cagagttcca gcccctgtac 2880 tatgtggctg agtccttcaa tgatgccaag gagaaggtca gaaactttgc tgccaccatc 2940 cccagaccct tctctgtgag atatgacccc tacacccaga gaattgaggt gctggacaac 3000 acccagcagc tgaagatcct ggctgactcc atcaactctg agattggcat cctgtgctct 3060 gccctgcaga agatcaagta aaccttaatt aagagcatct taccgccatt tattcccata 3120 tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg 3180 gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca 3240 aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt 3300 acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg 3360 gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct 3420 cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc 3480 aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca 3540 ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac 3600 tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt 3660 ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc 3720 cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg 3780 catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca 3840 agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc 3900 tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga 3960 ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc 4020 cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct 4080 gcctgcagg 4089 <210> 198 <211> 3451 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 198 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840 taaaccgcag ccaccatgtc cacagctgtg ctggagaacc ctggcttggg caggaaactc 900 tctgactttg gacaggtgag ccagggcagc ctgagctgct cagttagggg aatttgggcc 960 tccagagaaa gagatctgaa gactgctggt gcttcctggt ttcataagct cagtaagaag 1020 tctgaattca ttggaagctg atgatagaag aaagagttca tgcttgcttt gtccatggag 1080 gtttaacagg aatgaattgc taaactgtgg aaaatgtttt aaacaaatgc atcttatcct 1140 gtaggaaaca agctatattg aagacaactg caatcaaaat ggagccatct ccctgatctt 1200 ctccctgaag gaggaggtgg gagccctggc caaggtgctg agactgtttg aggagaatga 1260 tgtgaacctg acccacattg agtccagacc ctccagactg aagaaggatg agtatgagtt 1320 cttcacccac ctggacaaga gatccctgcc tgccctgacc aacatcatca agatcctgag 1380 acatgacatt ggagccacag tgcatgagct gtccagagac aagaagaagg acacagtgcc 1440 ctggttcccc agaaccatcc aggagctgga cagatttgcc aaccagatcc tgtcctatgg 1500 agctgagctg gatgctgacc accctggctt caaggaccct gtgtacaggg ccagaagaaa 1560 gcagtttgct gacattgcct acaactacag acatggccag cccatcccca gagtggagta 1620 catggaggag gagaagaaga cctggggcac agtgttcaag accctgaagt ccctgtacaa 1680 gacccatgcc tgctatgagt acaaccacat cttccccctg ctggagaagt actgtggctt 1740 ccatgaggac aacatccccc agctggagga tgtgtcccag ttcctgcaga cctgcacagg 1800 cttcagactg agacctgtgg ctggcctgct gtcctccaga gacttcctgg gaggcctggc 1860 cttcagagtg ttccactgca cccagtacat cagacatggc tccaagccca tgtacacccc 1920 tgagcctgac atctgccatg agctgctggg ccatgtgccc ctgttctctg acagatcctt 1980 tgcccagttc tcccaggaga ttggcctggc ctccctggga gcccctgatg agtacattga 2040 gaagctggcc accatctact ggttcacagt ggagtttggc ctgtgcaagc agggagactc 2100 catcaaggcc tatggagctg gcctgctgtc ctcctttgga gagctgcagt actgcctgtc 2160 tgagaagccc aagctgctgc ccctggagct ggagaagaca gccatccaga actacacagt 2220 gacagagttc cagcccctgt actatgtggc tgagtccttc aatgatgcca aggagaaggt 2280 cagaaacttt gctgccacca tccccagacc cttctctgtg agatatgacc cctacaccca 2340 gagaattgag gtgctggaca acacccagca gctgaagatc ctggctgact ccatcaactc 2400 tgagattggc atcctgtgct ctgccctgca gaagatcaag taaaccttaa ttaagagcat 2460 cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat 2520 gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt 2580 tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt 2640 cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat 2700 gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct 2760 tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag 2820 gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc 2880 cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc 2940 ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct 3000 aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct 3060 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 3120 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 3180 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 3240 gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta 3300 atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc 3360 gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca 3420 gtgagcgagc gagcgcgcag ctgcctgcag g 3451 <210> 199 <211> 4042 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 199 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840 taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcttggg caggaaactc 900 tctgactttg gacaggtaag cctgttgggc ttccactgct aggagagaat tggttcccca 960 catgtgaaag cagtctggga aatgctggta tttccagtct cctaaggcta ctaagaaata 1020 tgactttatt tagaggcgag gaaaatgccc aggaagtcaa ctgatgagtc tagtcttaac 1080 aagttgagga tacagaaagt tggggatctg agctgctacc aacatctgtg tgtctttggg 1140 tggctcattg gtatcctctg cctattggct ttatcttctg tacactgaaa ggaaatggct 1200 ggtccttagt cacctaccca ggtcttggat ccatagccta cggatgtccc atttttattg 1260 ctttttatat tttgtctccc agtgtctttt tgaggatttt tttttttttt ttgcatcact 1320 tgctcttcct ctaagaatct cctgacttct tgtacatgtg tctgatggtc agaattttag 1380 cactgaagta tgggcgtatt tatcataatt caggtttata tcctttcaga tatgggctag 1440 ggtctggtat tagggtgctc attaaaaaat gttgattttt gtcagtgtct agtgacatca 1500 atgcataatt taaggttcta taaattgaaa gctaacccag gagtgactca tcctctcatt 1560 gttttcaact tacttatttc tgatcacact gacttccctg tggaatacac gtggttcact 1620 gtgttccaaa gcttaacgag cagaaaaagg ttatgctcgt ctcttcttga gaggttttaa 1680 gagaataatt gctaagctgt gaaaaacatt ttaaccaagt gatctaatta tgtaggaaac 1740 aagctatatt gaagacaact gcaatcaaaa cggcgccatc agcctgatct tcagcctgaa 1800 agaagaagtg ggcgccctgg ccaaggtgct gagactgttc gaagagaacg acgtgaacct 1860 gacacacatc gagagcagac ccagcagact gaagaaggac gagtacgagt tcttcaccca 1920 cctggacaag cggagcctgc ctgctctgac caacatcatc aagatcctgc ggcacgacat 1980 cggcgccaca gtgcacgaac tgagccggga caagaaaaag gacaccgtgc catggttccc 2040 cagaaccatc caagagctgg acagattcgc caaccagatc ctgagctatg gcgccgagct 2100 ggacgctgat caccctggct ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc 2160 cgatatcgcc tacaactacc ggcacggcca gcctattcct cgggtcgagt acatggaaga 2220 ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag tccctgtaca agacccacgc 2280 ctgctacgag tacaaccaca tcttcccact gctcgaaaag tactgcggct tccacgagga 2340 caatatccct cagcttgagg acgtgtccca gttcctgcag acctgcaccg gctttagact 2400 gaggccagtt gccggactgc tgagcagcag agattttctc ggcggcctgg ccttcagagt 2460 gttccactgt acccagtaca tcagacacgg cagcaagccc atgtacaccc ctgagcctga 2520 tatctgccac gagctgctgg gacatgtgcc cctgttcagc gatagaagct tcgcccagtt 2580 cagccaagag atcggactgg cttctctggg agcccctgac gagtacattg agaagctggc 2640 caccatctac tggttcaccg tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc 2700 ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag tactgtctga gcgagaagcc 2760 taagctgctg cccctggaac tggaaaagac cgccatccag aactacaccg tgaccgagtt 2820 ccagcctctg tactacgtgg ccgagagctt caacgacgcc aaagaaaaag tgcggaactt 2880 cgccgccacc attcctcggc ctttcagcgt cagatacgac ccctacacac agcggatcga 2940 ggtgctggac aacacacagc agctgaaaat tctggccgac tccatcaaca gcgagatcgg 3000 catcctgtgc agcgccctgc agaaaatcaa gtgatagtta attaagagca tcttaccgcc 3060 atttattccc atatttgttc tgtttttctt gatttgggta tacatttaaa tgttaataaa 3120 acaaaatggt ggggcaatca tttacatttt tagggatatg taattactag ttcaggtgta 3180 ttgccacaag acaaacatgt taagaaactt tcccgttatt tacgctctgt tcctgttaat 3240 caacctctgg attacaaaat ttgtgaaaga ttgactgata ttcttaacta tgttgctcct 3300 tttacgctgt gtggatatgc tgctttatag cctctgtatc tagctattgc ttcccgtacg 3360 gctttcgttt tctcctcctt gtataaatcc tggttgctgt ctcttttaga ggagttgtgg 3420 cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc 3480 tggggcattg ccaccacctg tcaactcctt tctgggactt tcgctttccc cctcccgatc 3540 gccacggcag aactcatcgc cgcctgcctt gcccgctgct ggacaggggc taggttgctg 3600 ggcactgata attccgtggt gttgtctgtg ccttctagtt gccagccatc tgttgtttgc 3660 ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa 3720 aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg 3780 gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg 3840 ggctctatgg ctctagagca tggctacgta gataagtagc atggcgggtt aatcattaac 3900 tacacctgca ggaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3960 cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc agtgagcgag 4020 cgagcgcgca gctgcctgca gg 4042 <210> 200 <211> 3451 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 200 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagctc tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840 taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcttggg caggaaactc 900 tctgactttg gacaggtgag ccacggcagc ctgagctgct cagttagggg aatttgggcc 960 tccagagaaa gagatccgaa gactgctggt gcttcctggt ttcataagct cagtaagaag 1020 tctgaattcg ttggaagctg atgatagaag aaagagttca tgcttgcttt gtccatggag 1080 gtttaacagg aatgaattgc taaactgtgg aaaatgtttt aaacaaatgc atcttatcct 1140 gtaggaaaca agctatattg aagacaactg caatcaaaac ggcgccatca gcctgatctt 1200 cagcctgaaa gaagaagtgg gcgccctggc caaggtgctg agactgttcg aagagaacga 1260 cgtgaacctg acacacatcg agagcagacc cagcagactg aagaaggacg agtacgagtt 1320 cttcacccac ctggacaagc ggagcctgcc tgctctgacc aacatcatca agatcctgcg 1380 gcacgacatc ggcgccacag tgcacgaact gagccgggac aagaaaaagg acaccgtgcc 1440 atggttcccc agaaccatcc aagagctgga cagattcgcc aaccagatcc tgagctatgg 1500 cgccgagctg gacgctgatc accctggctt taaggacccc gtgtaccggg ccagaagaaa 1560 gcagtttgcc gatatcgcct acaactaccg gcacggccag cctattcctc gggtcgagta 1620 catggaagag gaaaagaaaa cctggggcac cgtgttcaag accctgaagt ccctgtacaa 1680 gacccacgcc tgctacgagt acaaccacat cttcccactg ctcgaaaagt actgcggctt 1740 ccacgaggac aatatccctc agcttgagga cgtgtcccag ttcctgcaga cctgcaccgg 1800 ctttagactg aggccagttg ccggactgct gagcagcaga gattttctcg gcggcctggc 1860 cttcagagtg ttccactgta cccagtacat cagacacggc agcaagccca tgtacacccc 1920 tgagcctgat atctgccacg agctgctggg acatgtgccc ctgttcagcg atagaagctt 1980 cgcccagttc agccaagaga tcggactggc ttctctggga gcccctgacg agtacattga 2040 gaagctggcc accatctact ggttcaccgt ggaattcggc ctgtgcaagc agggcgacag 2100 catcaaagct tatggcgctg gcctgctgtc tagcttcggc gagctgcagt actgtctgag 2160 cgagaagcct aagctgctgc ccctggaact ggaaaagacc gccatccaga actacaccgt 2220 gaccgagttc cagcctctgt actacgtggc cgagagcttc aacgacgcca aagaaaaagt 2280 gcggaacttc gccgccacca ttcctcggcc tttcagcgtc agatacgacc cctacacaca 2340 gcggatcgag gtgctggaca acacacagca gctgaaaatt ctggccgact ccatcaacag 2400 cgagatcggc atcctgtgca gcgccctgca gaaaatcaag tgatagttaa ttaagagcat 2460 cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat 2520 gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt 2580 tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt 2640 cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat 2700 gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct 2760 tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag 2820 gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc 2880 cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc 2940 ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct 3000 aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct 3060 gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 3120 tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 3180 ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 3240 gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta 3300 atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc 3360 gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca 3420 gtgagcgagc gagcgcgcag ctgcctgcag g 3451 <210> 201 <211> 3840 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 201 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240 ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300 gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360 ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420 acctccaaca tccacttgac cccttggaat ttcagtggag aggagcagag gttgtcctgg 480 tgtggtttag gtagtgtgag agggtccagg ttcaaaacca cttgctgggt ggggagttgt 540 cagtaagtgg ctatgcccca accctgaagc ctgtttcccc atctgtacaa tggaaatgat 600 aaagaccccc atctgatagg gtttttgtgg caaataaaca tttggttttt ttgttttgtt 660 ttgttttgtt ttttgagatg gaggtttgct ctgtggccca ggctggagtg cagtgacaca 720 atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg attacaagca 780 tgtgccacca cacctggcta attttctatt tttagtagag atgggtttct ccatgttggt 840 cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc tggctaattt 900 tttctatttt tgacagggat ggggtttcac catgttggtc aggctggtct agaggtactg 960 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 1020 agtggtactc tcccagagac tgtctgactc atgccacccc ctccaccttg gacacaggac 1080 actgtggttt ctgagccagg tacaatgact ccttttggta agtgcagtgg aagctgtaca 1140 ctgcccaggc aaagtgtctg ggcagcatag gcaggtgact cagatcccag ccagtggact 1200 tagcccctgt ttgctcctct gataactggg gtgaccttgg ttaatattca ccagcagcct 1260 cccctgttgc ccctctggat ccactgctta aatacagaca aggacagggc cctgtctcct 1320 cagcttcagg caccaccact gacctgggac agtgaataat tactctaagg taaatataaa 1380 atttttaagt gtataatgtg ttaaactact gattctaatt gtttctctct tttagattcc 1440 aacctttgga actgagttta aaccgcagcc accatgagca ccgccgtgct ggaaaatcct 1500 ggcctgggca gaaagctgag cgacttcggc caagagacaa gctacatcga ggacaactgc 1560 aaccagaacg gcgccatcag cctgatcttc agcctgaaag aagaagtggg cgccctggcc 1620 aaggtgctga gactgttcga agagaacgac gtgaacctga cacacatcga gagcagaccc 1680 agcagactga agaaggacga gtacgagttc ttcacccacc tggacaagcg gagcctgcct 1740 gctctgacca acatcatcaa gatcctgcgg cacgacatcg gcgccacagt gcacgaactg 1800 agccgggaca agaaaaagga caccgtgcca tggttcccca gaaccatcca agagctggac 1860 agattcgcca accagatcct gagctatggc gccgagctgg acgctgatca ccctggcttt 1920 aaggaccccg tgtaccgggc cagaagaaag cagtttgccg atatcgccta caactaccgg 1980 cacggccagc ctattcctcg ggtcgagtac atggaagagg aaaagaaaac ctggggcacc 2040 gtgttcaaga ccctgaagtc cctgtacaag acccacgcct gctacgagta caaccacatc 2100 ttcccactgc tcgaaaagta ctgcggcttc cacgaggaca atatccctca gcttgaggac 2160 gtgtcccagt tcctgcagac ctgcaccggc tttagactga ggccagttgc cggactgctg 2220 agcagcagag attttctcgg cggcctggcc ttcagagtgt tccactgtac ccagtacatc 2280 agacacggca gcaagcccat gtacacccct gagcctgata tctgccacga gctgctggga 2340 catgtgcccc tgttcagcga tagaagcttc gcccagttca gccaagagat cggactggct 2400 tctctgggag cccctgacga gtacattgag aagctggcca ccatctactg gttcaccgtg 2460 gaattcggcc tgtgcaagca gggcgacagc atcaaagctt atggcgctgg cctgctgtct 2520 agcttcggcg agctgcagta ctgtctgagc gagaagccta agctgctgcc cctggaactg 2580 gaaaagaccg ccatccagaa ctacaccgtg accgagttcc agcctctgta ctacgtggcc 2640 gagagcttca acgacgccaa agaaaaagtg cggaacttcg ccgccaccat tcctcggcct 2700 ttcagcgtca gatacgaccc ctacacacag cggatcgagg tgctggacaa cacacagcag 2760 ctgaaaattc tggccgactc catcaacagc gagatcggca tcctgtgcag cgccctgcag 2820 aaaatcaagt gatagttaat taagagcatc ttaccgccat ttattcccat atttgttctg 2880 tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt 2940 tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta 3000 agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt 3060 gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg 3120 ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt 3180 ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg 3240 tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc 3300 aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg 3360 cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt 3420 tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 3480 ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 3540 gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 3600 attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg 3660 gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct 3720 agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc 3780 aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3840 <210> 202 <211> 2778 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 202 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 660 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 720 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 780 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 840 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 900 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 960 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1020 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1080 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1140 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1200 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1260 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1320 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1380 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1440 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1500 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1560 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1620 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1680 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1740 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1860 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1920 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gctcgctttc 1980 ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac taaactgggg 2040 gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt tattttcatt 2100 gcaatgatgt atttaaatta tttctgaata ttttactaaa aagggaatgt gggaggtcag 2160 tgcatttaaa acataaagaa atgaagagct agttcaaacc ttgggaaaat acactatatc 2220 ttaaactcca tgaaagaagg tgaggctgca aacagctaat gcacattggc aacagcccct 2280 gatgcctatg ccttattcat ccctcagaaa aggattcaag tagaggcttg atttggaggt 2340 taaagttttg ctatgctgta ttttacagac atgataagat acattgatga gtttggacaa 2400 accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 2460 ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 2520 atgtttcagg ttcaggggga gatgtgggag gttttttaaa gcaagtaaaa cctctacaaa 2580 tgtggtatct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca 2640 cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 2700 cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag 2760 cgcgcagctg cctgcagg 2778 <210> 203 <211> 2490 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 203 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 660 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 720 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 780 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 840 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 900 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 960 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1020 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1080 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1140 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1200 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1260 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1320 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1380 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1440 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1500 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1560 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1620 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1680 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1740 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1860 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1920 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gctcgctttc 1980 ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac taaactgggg 2040 gatattatga agggccttga gcatctggat tctgcctcag acatgataag atacattgat 2100 gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt 2160 gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat 2220 tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa 2280 aacctctaca aatgtggtat ctagagcatg gctacgtaga taagtagcat ggcgggttaa 2340 tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg 2400 cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag 2460 tgagcgagcg agcgcgcagc tgcctgcagg 2490 <210> 204 <211> 2964 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 204 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 660 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 720 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 780 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 840 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 900 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 960 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1020 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1080 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1140 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1200 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1260 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1320 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1380 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1440 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1500 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1560 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1620 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1680 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1740 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1860 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1920 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt ccagacatga taagatacat tgatgagttt 2580 ggacaaacca caactagaat gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct 2640 attgctttat ttgtaaccat tataagctgc aataaacaag ttaacaacaa caattgcatt 2700 cattttatgt ttcaggttca gggggagatg tgggaggttt tttaaagcaa gtaaaacctc 2760 tacaaatgtg gtatctagag catggctacg tagataagta gcatggcggg ttaatcatta 2820 actacacctg caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 2880 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg 2940 agcgagcgcg cagctgcctg cagg 2964 <210> 205 <211> 3137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 205 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 660 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 720 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 780 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 840 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 900 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 960 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1020 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1080 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1140 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1200 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1260 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1320 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1380 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1440 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1500 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1560 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1620 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1680 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1740 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1860 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1920 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt cgctcgcttt cttgctgtcc aatttctatt 2580 aaaggttcct ttgttcccta agtccaacta ctaaactggg ggatattatg aagggccttg 2640 agcatctgga ttctgcctaa taaaaaacat ttattttcat tgcaatgatg tatttaaatt 2700 atttctgaat attttactaa aaagggaatg tgggaggtca gtgcatttaa aacataaaga 2760 aatgaagagc tagttcaaac cttgggaaaa tacactatat cttaaactcc atgaaagaag 2820 gtgaggctgc aaacagctaa tgcacattgg caacagcccc tgatgcctat gccttattca 2880 tccctcagaa aaggattcaa gtagaggctt gatttggagg ttaaagtttt gctatgctgt 2940 attttatcta gagcatggct acgtagataa gtagcatggc gggttaatca ttaactacac 3000 ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 3060 actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc 3120 gcgcagctgc ctgcagg 3137 <210> 206 <211> 3117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 206 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240 acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300 tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360 caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtg gatccccgtc 420 tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 480 atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 540 ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 600 ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 660 atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 720 ttttcaggtt gggtttaaac cgcagccacc atgagcaccg ccgtgctgga aaatcctggc 780 ctgggcagaa agctgagcga cttcggccaa gagacaagct acatcgagga caactgcaac 840 cagaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc cctggccaag 900 gtgctgagac tgttcgaaga gaacgacgtg aacctgacac acatcgagag cagacccagc 960 agactgaaga aggacgagta cgagttcttc acccacctgg acaagcggag cctgcctgct 1020 ctgaccaaca tcatcaagat cctgcggcac gacatcggcg ccacagtgca cgaactgagc 1080 cgggacaaga aaaaggacac cgtgccatgg ttccccagaa ccatccaaga gctggacaga 1140 ttcgccaacc agatcctgag ctatggcgcc gagctggacg ctgatcaccc tggctttaag 1200 gaccccgtgt accgggccag aagaaagcag tttgccgata tcgcctacaa ctaccggcac 1260 ggccagccta ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg gggcaccgtg 1320 ttcaagaccc tgaagtccct gtacaagacc cacgcctgct acgagtacaa ccacatcttc 1380 ccactgctcg aaaagtactg cggcttccac gaggacaata tccctcagct tgaggacgtg 1440 tcccagttcc tgcagacctg caccggcttt agactgaggc cagttgccgg actgctgagc 1500 agcagagatt ttctcggcgg cctggccttc agagtgttcc actgtaccca gtacatcaga 1560 cacggcagca agcccatgta cacccctgag cctgatatct gccacgagct gctgggacat 1620 gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc aagagatcgg actggcttct 1680 ctgggagccc ctgacgagta cattgagaag ctggccacca tctactggtt caccgtggaa 1740 ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg gcgctggcct gctgtctagc 1800 ttcggcgagc tgcagtactg tctgagcgag aagcctaagc tgctgcccct ggaactggaa 1860 aagaccgcca tccagaacta caccgtgacc gagttccagc ctctgtacta cgtggccgag 1920 agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc tcggcctttc 1980 agcgtcagat acgaccccta cacacagcgg atcgaggtgc tggacaacac acagcagctg 2040 aaaattctgg ccgactccat caacagcgag atcggcatcc tgtgcagcgc cctgcagaaa 2100 atcaagtgat agttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt 2160 ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac 2220 atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga 2280 aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg 2340 aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt 2400 tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata 2460 aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg 2520 tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac 2580 tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct 2640 gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt 2700 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 2760 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 2820 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 2880 gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct 2940 acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt 3000 gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 3060 ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcagg 3117 <210> 207 <211> 3454 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 207 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240 acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300 tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360 caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtc aattgggggg 420 aggctgctgg tgaatattaa ccaaggtcac cccagttatc ggaggagcaa acaggggcta 480 agtccaccgg gggaggctgc tggtgaatat taaccaaggt caccccagtt atcggaggag 540 caaacagggg ctaagtccac cgggggaggc tgctggtgaa tattaaccaa ggtcacccca 600 gttatcggag gagcaaacag gggctaagtc cacggtaccc actgggagga tgttgagtaa 660 gatggaaaac tactgatgac ccttgcagag acagagtatt aggacatgtt tgaacagggg 720 ccgggcgatc agcaggtagc actagaggat ccccgtctgt ctgcacattt cgtagagcga 780 gtgttccgat actctaatct ccctaggcaa ggttcatatt tgtgtaggtt acttattctc 840 cttttgttga ctaagtcaat aatcagaatc agcaggtttg gagtcagctt ggcagggatc 900 agcagcctgg gttggaagga gggggtataa aagccccttc accaggagaa gccgtcacac 960 agatccacaa gctcctgaag aggtaagggt ttaagggatg gttggttggt ggggtattaa 1020 tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg tttaaaccgc 1080 agccaccatg agcaccgccg tgctggaaaa tcctggcctg ggcagaaagc tgagcgactt 1140 cggccaagag acaagctaca tcgaggacaa ctgcaaccag aacggcgcca tcagcctgat 1200 cttcagcctg aaagaagaag tgggcgccct ggccaaggtg ctgagactgt tcgaagagaa 1260 cgacgtgaac ctgacacaca tcgagagcag acccagcaga ctgaagaagg acgagtacga 1320 gttcttcacc cacctggaca agcggagcct gcctgctctg accaacatca tcaagatcct 1380 gcggcacgac atcggcgcca cagtgcacga actgagccgg gacaagaaaa aggacaccgt 1440 gccatggttc cccagaacca tccaagagct ggacagattc gccaaccaga tcctgagcta 1500 tggcgccgag ctggacgctg atcaccctgg ctttaaggac cccgtgtacc gggccagaag 1560 aaagcagttt gccgatatcg cctacaacta ccggcacggc cagcctattc ctcgggtcga 1620 gtacatggaa gaggaaaaga aaacctgggg caccgtgttc aagaccctga agtccctgta 1680 caagacccac gcctgctacg agtacaacca catcttccca ctgctcgaaa agtactgcgg 1740 cttccacgag gacaatatcc ctcagcttga ggacgtgtcc cagttcctgc agacctgcac 1800 cggctttaga ctgaggccag ttgccggact gctgagcagc agagattttc tcggcggcct 1860 ggccttcaga gtgttccact gtacccagta catcagacac ggcagcaagc ccatgtacac 1920 ccctgagcct gatatctgcc acgagctgct gggacatgtg cccctgttca gcgatagaag 1980 cttcgcccag ttcagccaag agatcggact ggcttctctg ggagcccctg acgagtacat 2040 tgagaagctg gccaccatct actggttcac cgtggaattc ggcctgtgca agcagggcga 2100 cagcatcaaa gcttatggcg ctggcctgct gtctagcttc ggcgagctgc agtactgtct 2160 gagcgagaag cctaagctgc tgcccctgga actggaaaag accgccatcc agaactacac 2220 cgtgaccgag ttccagcctc tgtactacgt ggccgagagc ttcaacgacg ccaaagaaaa 2280 agtgcggaac ttcgccgcca ccattcctcg gcctttcagc gtcagatacg acccctacac 2340 acagcggatc gaggtgctgg acaacacaca gcagctgaaa attctggccg actccatcaa 2400 cagcgagatc ggcatcctgt gcagcgccct gcagaaaatc aagtgatagt taattaagag 2460 catcttaccg ccatttattc ccatatttgt tctgtttttc ttgatttggg tatacattta 2520 aatgttaata aaacaaaatg gtggggcaat catttacatt tttagggata tgtaattact 2580 agttcaggtg tattgccaca agacaaacat gttaagaaac tttcccgtta tttacgctct 2640 gttcctgtta atcaacctct ggattacaaa atttgtgaaa gattgactga tattcttaac 2700 tatgttgctc cttttacgct gtgtggatat gctgctttat agcctctgta tctagctatt 2760 gcttcccgta cggctttcgt tttctcctcc ttgtataaat cctggttgct gtctctttta 2820 gaggagttgt ggcccgttgt ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca 2880 acccccactg gctggggcat tgccaccacc tgtcaactcc tttctgggac tttcgctttc 2940 cccctcccga tcgccacggc agaactcatc gccgcctgcc ttgcccgctg ctggacaggg 3000 gctaggttgc tgggcactga taattccgtg gtgttgtctg tgccttctag ttgccagcca 3060 tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc 3120 ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg 3180 gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct 3240 ggggatgcgg tgggctctat ggctctagag catggctacg tagataagta gcatggcggg 3300 ttaatcatta actacacctg caggaggaac ccctagtgat ggagttggcc actccctctc 3360 tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc 3420 tcagtgagcg agcgagcgcg cagctgcctg cagg 3454 <210> 208 <211> 3112 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 208 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaacaggt tagtttgact agcgttaatc attaacgtta atcattaacg ttaatcatta 240 acgttaatca ttaacgttaa tcattaacat cgatgcgaga acttgtgcct ccccgtgttc 300 ctgctctttg tccctctgtc ctacttagac taatatttgc cttgggtact gcaaacagga 360 aatgggggag ggacaggagt agggcggagg gtagttaaga atgtggatcc ccgtctgtct 420 gcacatttcg tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg 480 tgtaggttac ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga 540 gtcagcttgg cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac 600 caggagaagc cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt 660 tggttggtgg ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc 720 aggttgggtt taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg 780 cagaaagctg agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa 840 cggcgccatc agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct 900 gagactgttc gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact 960 gaagaaggac gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac 1020 caacatcatc aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga 1080 caagaaaaag gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc 1140 caaccagatc ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc 1200 cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca 1260 gcctattcct cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa 1320 gaccctgaag tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact 1380 gctcgaaaag tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca 1440 gttcctgcag acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag 1500 agattttctc ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg 1560 cagcaagccc atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc 1620 cctgttcagc gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg 1680 agcccctgac gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg 1740 cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg 1800 cgagctgcag tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac 1860 cgccatccag aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt 1920 caacgacgcc aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt 1980 cagatacgac ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat 2040 tctggccgac tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa 2100 gtgatagtta attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt 2160 gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt 2220 tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt 2280 tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga 2340 ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag 2400 cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc 2460 tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc 2520 tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt 2580 tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt 2640 gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg 2700 ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa 2760 ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt 2820 aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa 2880 gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta 2940 gataagtagc atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg 3000 agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 3060 cccgacgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3112 <210> 209 <211> 3449 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 209 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaacaggt tagtttgact agcgttaatc attaacgtta atcattaacg ttaatcatta 240 acgttaatca ttaacgttaa tcattaacat cgatgcgaga acttgtgcct ccccgtgttc 300 ctgctctttg tccctctgtc ctacttagac taatatttgc cttgggtact gcaaacagga 360 aatgggggag ggacaggagt agggcggagg gtagttaaga atgtcaattg gggggaggct 420 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 480 accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 540 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 600 cggaggagca aacaggggct aagtccacgg tacccactgg gaggatgttg agtaagatgg 660 aaaactactg atgacccttg cagagacaga gtattaggac atgtttgaac aggggccggg 720 cgatcagcag gtagcactag aggatccccg tctgtctgca catttcgtag agcgagtgtt 780 ccgatactct aatctcccta ggcaaggttc atatttgtgt aggttactta ttctcctttt 840 gttgactaag tcaataatca gaatcagcag gtttggagtc agcttggcag ggatcagcag 900 cctgggttgg aaggaggggg tataaaagcc ccttcaccag gagaagccgt cacacagatc 960 cacaagctcc tgaagaggta agggtttaag ggatggttgg ttggtggggt attaatgttt 1020 aattacctgg agcacctgcc tgaaatcact ttttttcagg ttgggtttaa accgcagcca 1080 ccatgagcac cgccgtgctg gaaaatcctg gcctgggcag aaagctgagc gacttcggcc 1140 aagagacaag ctacatcgag gacaactgca accagaacgg cgccatcagc ctgatcttca 1200 gcctgaaaga agaagtgggc gccctggcca aggtgctgag actgttcgaa gagaacgacg 1260 tgaacctgac acacatcgag agcagaccca gcagactgaa gaaggacgag tacgagttct 1320 tcacccacct ggacaagcgg agcctgcctg ctctgaccaa catcatcaag atcctgcggc 1380 acgacatcgg cgccacagtg cacgaactga gccgggacaa gaaaaaggac accgtgccat 1440 ggttccccag aaccatccaa gagctggaca gattcgccaa ccagatcctg agctatggcg 1500 ccgagctgga cgctgatcac cctggcttta aggaccccgt gtaccgggcc agaagaaagc 1560 agtttgccga tatcgcctac aactaccggc acggccagcc tattcctcgg gtcgagtaca 1620 tggaagagga aaagaaaacc tggggcaccg tgttcaagac cctgaagtcc ctgtacaaga 1680 cccacgcctg ctacgagtac aaccacatct tcccactgct cgaaaagtac tgcggcttcc 1740 acgaggacaa tatccctcag cttgaggacg tgtcccagtt cctgcagacc tgcaccggct 1800 ttagactgag gccagttgcc ggactgctga gcagcagaga ttttctcggc ggcctggcct 1860 tcagagtgtt ccactgtacc cagtacatca gacacggcag caagcccatg tacacccctg 1920 agcctgatat ctgccacgag ctgctgggac atgtgcccct gttcagcgat agaagcttcg 1980 cccagttcag ccaagagatc ggactggctt ctctgggagc ccctgacgag tacattgaga 2040 agctggccac catctactgg ttcaccgtgg aattcggcct gtgcaagcag ggcgacagca 2100 tcaaagctta tggcgctggc ctgctgtcta gcttcggcga gctgcagtac tgtctgagcg 2160 agaagcctaa gctgctgccc ctggaactgg aaaagaccgc catccagaac tacaccgtga 2220 ccgagttcca gcctctgtac tacgtggccg agagcttcaa cgacgccaaa gaaaaagtgc 2280 ggaacttcgc cgccaccatt cctcggcctt tcagcgtcag atacgacccc tacacacagc 2340 ggatcgaggt gctggacaac acacagcagc tgaaaattct ggccgactcc atcaacagcg 2400 agatcggcat cctgtgcagc gccctgcaga aaatcaagtg atagttaatt aagagcatct 2460 taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac atttaaatgt 2520 taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa ttactagttc 2580 aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac gctctgttcc 2640 tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc ttaactatgt 2700 tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ctattgcttc 2760 ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ttttagagga 2820 gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc 2880 cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg ctttccccct 2940 cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga caggggctag 3000 gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt 3060 tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc 3120 ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg 3180 tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga 3240 tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg gcgggttaat 3300 cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc ctctctgcgc 3360 gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt 3420 gagcgagcga gcgcgcagct gcctgcagg 3449 <210> 210 <211> 3222 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 210 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagcac tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840 taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg cagaaagctg 900 agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa cggcgccatc 960 agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1020 gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1080 gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1140 aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1200 gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1260 ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1320 gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1380 cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1440 tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1500 tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1560 acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1620 ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1680 atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1740 gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1800 gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 1860 cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 1920 tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 1980 aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2040 aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2100 ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2160 tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2220 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2280 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2340 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2400 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2460 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2520 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2580 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2640 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2700 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2760 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2820 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2880 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2940 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3000 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3060 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3120 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3180 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3222 <210> 211 <211> 3222 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 211 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagcac tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctgaagag gtaagggttt aagggatggt tggttggtgg 780 ggtattaatg tttaattacc tggagcacct gcctgaaatc actttttttc aggttgggtt 840 taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg cagaaagctg 900 agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa cggcgccatc 960 agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1020 gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1080 gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1140 aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1200 gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1260 ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1320 gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1380 cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1440 tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1500 tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1560 acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1620 ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1680 atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1740 gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1800 gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 1860 cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 1920 tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 1980 aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2040 aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2100 ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2160 tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2220 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2280 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2340 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2400 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2460 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2520 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2580 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2640 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2700 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2760 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 2820 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 2880 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 2940 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3000 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3060 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3120 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3180 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3222 <210> 212 <211> 3220 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 212 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagcac tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctaagagg taagggttta agggatggtt ggttggtggg 780 gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggttta 840 aaccgcagcc accatgagta cagcagtgtt agagaatcca ggcctaggta gaaagctgtc 900 tgactttggc caggagacct cctacattga ggacaactgc aaccagaatg gagccatcag 960 cctgatcttc agcctgaagg aggaggtggg agccctggcc aaggtgctga gactgtttga 1020 ggagaatgat gtgaacctga cccacattga gtccagaccc tccagactga agaaggatga 1080 gtatgagttc ttcacccacc tggacaagag atccctgcct gctctgacca acatcatcaa 1140 gatcctgaga catgatattg gagccacagt gcatgagctg agcagggaca agaagaagga 1200 cacagtgcct tggttcccca gaaccatcca ggagctggac aggtttgcca accagatcct 1260 gtcctatgga gctgagctgg atgctgacca ccctggattt aaggatcctg tgtacagggc 1320 cagaaggaag cagtttgctg acattgccta caactacagg catggccagc ccatccccag 1380 ggtggagtac atggaggagg agaagaagac ctggggcact gtgttcaaga ccctgaagag 1440 cctgtacaag acccatgcct gctatgagta caaccacatc ttccccctgc tggagaagta 1500 ctgtggcttc catgaggaca acatccctca gctggaggat gtgtcccagt tcctgcagac 1560 ctgcacaggc ttcagactga gacctgtggc tggcctgctg tctagcagag acttcctggg 1620 aggcctggcc ttcagagtgt tccactgcac ccagtacatc agacatggaa gcaagcccat 1680 gtacacccct gagccagaca tctgccatga gctgctgggc catgtgcccc tgttctctga 1740 tagatccttt gcccagttca gccaggagat tggcctggcc agcctgggag cccctgatga 1800 gtacattgag aagctggcca ccatctactg gttcacagtg gagtttggcc tgtgcaagca 1860 gggagactcc atcaaggcct atggagctgg actgctgtcc tcctttggag agctgcagta 1920 ctgcctgtct gagaagccca agctgctgcc cctggagctg gagaagacag ccatccagaa 1980 ctacacagtg acagagttcc agcccctgta ctatgtggct gagagcttca atgatgccaa 2040 ggagaaggtg agaaactttg ctgccaccat ccccagaccc ttctctgtga ggtatgaccc 2100 ctacacccag aggattgagg tgctggacaa cacccagcag ctgaagatcc tggctgactc 2160 catcaactct gagattggca tcctgtgctc tgccctgcag aagatcaagt aaaccttaat 2220 taagagcatc ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata 2280 catttaaatg ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta 2340 attactagtt caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta 2400 cgctctgttc ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt 2460 cttaactatg ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta 2520 gctattgctt cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct 2580 cttttagagg agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct 2640 gacgcaaccc ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc 2700 gctttccccc tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg 2760 acaggggcta ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc 2820 cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 2880 actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 2940 attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 3000 catgctgggg atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat 3060 ggcgggttaa tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc 3120 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3180 gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3220 <210> 213 <211> 3220 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 213 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg aggagcaaac 240 aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca ccccagttat 300 cggaggagca aacaggggct aagtccaccg ggggaggctg ctggtgaata ttaaccaagg 360 tcaccccagt tatcggagga gcaaacaggg gctaagtcca cggtacccac tgggaggatg 420 ttgagtaaga tggaaaacta ctgatgaccc ttgcagagac agagtattag gacatgtttg 480 aacaggggcc gggcgatcag caggtagcac tagaggatcc ccgtctgtct gcacatttcg 540 tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg tgtaggttac 600 ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga gtcagcttgg 660 cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac caggagaagc 720 cgtcacacag atccacaagc tcctaagagg taagggttta agggatggtt ggttggtggg 780 gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggttta 840 aaccgcagcc accatgtcca cagctgtgct ggagaaccct ggcctgggca gaaagctgtc 900 tgactttggc caggagacct cctacattga ggacaactgc aaccagaatg gagccatctc 960 cctgatcttc tccctgaagg aggaggtggg agccctggcc aaggtgctga gactgtttga 1020 ggagaatgat gtgaacctga cccacattga gtccagaccc tccagactga agaaggatga 1080 gtatgagttc ttcacccacc tggacaagag atccctgcct gccctgacca acatcatcaa 1140 gatcctgaga catgacattg gagccacagt gcatgagctg tccagagaca agaagaagga 1200 cacagtgccc tggttcccca gaaccatcca ggagctggac agatttgcca accagatcct 1260 gtcctatgga gctgagctgg atgctgacca ccctggcttc aaggaccctg tgtacagggc 1320 cagaagaaag cagtttgctg acattgccta caactacaga catggccagc ccatccccag 1380 agtggagtac atggaggagg agaagaagac ctggggcaca gtgttcaaga ccctgaagtc 1440 cctgtacaag acccatgcct gctatgagta caaccacatc ttccccctgc tggagaagta 1500 ctgtggcttc catgaggaca acatccccca gctggaggat gtgtcccagt tcctgcagac 1560 ctgcacaggc ttcagactga gacctgtggc tggcctgctg tcctccagag acttcctggg 1620 aggcctggcc ttcagagtgt tccactgcac ccagtacatc agacatggct ccaagcccat 1680 gtacacccct gagcctgaca tctgccatga gctgctgggc catgtgcccc tgttctctga 1740 cagatccttt gcccagttct cccaggagat tggcctggcc tccctgggag cccctgatga 1800 gtacattgag aagctggcca ccatctactg gttcacagtg gagtttggcc tgtgcaagca 1860 gggagactcc atcaaggcct atggagctgg cctgctgtcc tcctttggag agctgcagta 1920 ctgcctgtct gagaagccca agctgctgcc cctggagctg gagaagacag ccatccagaa 1980 ctacacagtg acagagttcc agcccctgta ctatgtggct gagtccttca atgatgccaa 2040 ggagaaggtc agaaactttg ctgccaccat ccccagaccc ttctctgtga gatatgaccc 2100 ctacacccag agaattgagg tgctggacaa cacccagcag ctgaagatcc tggctgactc 2160 catcaactct gagattggca tcctgtgctc tgccctgcag aagatcaagt aaaccttaat 2220 taagagcatc ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata 2280 catttaaatg ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta 2340 attactagtt caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta 2400 cgctctgttc ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt 2460 cttaactatg ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta 2520 gctattgctt cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct 2580 cttttagagg agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct 2640 gacgcaaccc ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc 2700 gctttccccc tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg 2760 acaggggcta ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc 2820 cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc 2880 actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct 2940 attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg 3000 catgctgggg atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat 3060 ggcgggttaa tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc 3120 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3180 gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3220 <210> 214 <400> 214 000 <210> 215 <400> 215 000 <210> 216 <400> 216 000 <210> 217 <400> 217 000 <210> 218 <400> 218 000 <210> 219 <400> 219 000 <210> 220 <400> 220 000 <210> 221 <400> 221 000 <210> 222 <400> 222 000 <210> 223 <400> 223 000 <210> 224 <400> 224 000 <210> 225 <400> 225 000 <210> 226 <400> 226 000 <210> 227 <400> 227 000 <210> 228 <400> 228 000 <210> 229 <400> 229 000 <210> 230 <400> 230 000 <210> 231 <400> 231 000 <210> 232 <400> 232 000 <210> 233 <400> 233 000 <210> 234 <400> 234 000 <210> 235 <400> 235 000 <210> 236 <400> 236 000 <210> 237 <400> 237 000 <210> 238 <400> 238 000 <210> 239 <400> 239 000 <210> 240 <400> 240 000 <210> 241 <400> 241 000 <210> 242 <400> 242 000 <210> 243 <400> 243 000 <210> 244 <400> 244 000 <210> 245 <400> 245 000 <210> 246 <400> 246 000 <210> 247 <400> 247 000 <210> 248 <400> 248 000 <210> 249 <400> 249 000 <210> 250 <400> 250 000 <210> 251 <400> 251 000 <210> 252 <400> 252 000 <210> 253 <400> 253 000 <210> 254 <400> 254 000 <210> 255 <400> 255 000 <210> 256 <400> 256 000 <210> 257 <400> 257 000 <210> 258 <400> 258 000 <210> 259 <400> 259 000 <210> 260 <400> 260 000 <210> 261 <400> 261 000 <210> 262 <400> 262 000 <210> 263 <400> 263 000 <210> 264 <400> 264 000 <210> 265 <400> 265 000 <210> 266 <400> 266 000 <210> 267 <400> 267 000 <210> 268 <400> 268 000 <210> 269 <400> 269 000 <210> 270 <400> 270 000 <210> 271 <400> 271 000 <210> 272 <400> 272 000 <210> 273 <400> 273 000 <210> 274 <400> 274 000 <210> 275 <400> 275 000 <210> 276 <400> 276 000 <210> 277 <400> 277 000 <210> 278 <400> 278 000 <210> 279 <400> 279 000 <210> 280 <400> 280 000 <210> 281 <400> 281 000 <210> 282 <400> 282 000 <210> 283 <400> 283 000 <210> 284 <400> 284 000 <210> 285 <400> 285 000 <210> 286 <400> 286 000 <210> 287 <400> 287 000 <210> 288 <400> 288 000 <210> 289 <400> 289 000 <210> 290 <400> 290 000 <210> 291 <400> 291 000 <210> 292 <400> 292 000 <210> 293 <400> 293 000 <210> 294 <400> 294 000 <210> 295 <400> 295 000 <210> 296 <400> 296 000 <210> 297 <400> 297 000 <210> 298 <400> 298 000 <210> 299 <400> 299 000 <210> 300 <400> 300 000 <210> 301 <400> 301 000 <210> 302 <400> 302 000 <210> 303 <400> 303 000 <210> 304 <400> 304 000 <210> 305 <400> 305 000 <210> 306 <400> 306 000 <210> 307 <400> 307 000 <210> 308 <400> 308 000 <210> 309 <400> 309 000 <210> 310 <400> 310 000 <210> 311 <400> 311 000 <210> 312 <400> 312 000 <210> 313 <400> 313 000 <210> 314 <400> 314 000 <210> 315 <400> 315 000 <210> 316 <400> 316 000 <210> 317 <400> 317 000 <210> 318 <400> 318 000 <210> 319 <400> 319 000 <210> 320 <400> 320 000 <210> 321 <400> 321 000 <210> 322 <400> 322 000 <210> 323 <400> 323 000 <210> 324 <400> 324 000 <210> 325 <400> 325 000 <210> 326 <400> 326 000 <210> 327 <400> 327 000 <210> 328 <400> 328 000 <210> 329 <400> 329 000 <210> 330 <400> 330 000 <210> 331 <400> 331 000 <210> 332 <400> 332 000 <210> 333 <400> 333 000 <210> 334 <400> 334 000 <210> 335 <400> 335 000 <210> 336 <400> 336 000 <210> 337 <400> 337 000 <210> 338 <400> 338 000 <210> 339 <400> 339 000 <210> 340 <400> 340 000 <210> 341 <400> 341 000 <210> 342 <400> 342 000 <210> 343 <400> 343 000 <210> 344 <400> 344 000 <210> 345 <400> 345 000 <210> 346 <400> 346 000 <210> 347 <400> 347 000 <210> 348 <400> 348 000 <210> 349 <400> 349 000 <210> 350 <400> 350 000 <210> 351 <400> 351 000 <210> 352 <400> 352 000 <210> 353 <400> 353 000 <210> 354 <400> 354 000 <210> 355 <400> 355 000 <210> 356 <400> 356 000 <210> 357 <400> 357 000 <210> 358 <400> 358 000 <210> 359 <400> 359 000 <210> 360 <400> 360 000 <210> 361 <400> 361 000 <210> 362 <400> 362 000 <210> 363 <400> 363 000 <210> 364 <400> 364 000 <210> 365 <400> 365 000 <210> 366 <400> 366 000 <210> 367 <400> 367 000 <210> 368 <400> 368 000 <210> 369 <400> 369 000 <210> 370 <400> 370 000 <210> 371 <400> 371 000 <210> 372 <400> 372 000 <210> 373 <400> 373 000 <210> 374 <400> 374 000 <210> 375 <400> 375 000 <210> 376 <400> 376 000 <210> 377 <400> 377 000 <210> 378 <400> 378 000 <210> 379 <400> 379 000 <210> 380 <400> 380 000 <210> 381 <400> 381 000 <210> 382 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 382 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359 <210> 383 <211> 1363 <212> DNA <213> Homo sapiens <400> 383 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120 ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180 aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240 acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300 gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360 ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420 gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540 gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600 catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660 gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 720 cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840 cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900 cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960 ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020 aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080 aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140 gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200 aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260 attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320 attggaatcc tttgcagtgc cctccagaaa ataaagtaat taa 1363 <210> 384 <211> 3359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 384 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggc tggtccctaa tgatctggga 420 tgggatgtgg aatccttcta gatttctttt gtaatattta taaagtgctc tcagcaaggt 480 atcaaaatgg caaaattgtg agtaactatc ctcctttcat tttgggaaga agatgaggca 540 tgaagagaat tcagacagaa acttactcag accaggggag gcagaaacta agcagagagg 600 aaaatgacca agagttagcc ctgggcatgg aatgtgaaag aaccctaaag gtgacttgga 660 aataatgccc aaggtatatt ccattctcct ggatttgttg gcattttctt gaggtgaaga 720 attgcagaat acattcttta atgtgaccta catatttacc catgtgagga agtctgctcc 780 tggactcttg agattcagtc ataaagccca ggccagggaa ataatgtaag tctgcaggcc 840 cctgtcatca gtaggattag ggagaagagt tctcagtaga aaacagggag gctggagaga 900 aaagaatggt taatgttaag gttaatataa ctagaaagac tgcagaactt aggactgatt 960 tttatttgaa tccttaaaaa aaaaaatttc ttatgaaaat agtacatggc tcttaggaga 1020 cagaacttat tgtacagagg aacagtgtga gagtcagagt gaattttatg tattattttt 1080 ggacttaggc taatgattta gcaaactctg gaatgtcagc cctaacccca accttggttt 1140 tctgtcacat gcatgtagta agtgctagat cctggacatt ctttgagatt tagtttaaga 1200 ctaagtttat tttctgatag gttatttgtg tactttcatg gattttgtaa ctctttttca 1260 acaattggat gtctcagatc tcagcatatg ggagcaagtt aatgcttcct gagatctttg 1320 ccaaaggtca agaggtcatt tttgtgtatt tataattttc catcattttt atatacttct 1380 caatattctt tttaaactat tcttttcctt ttttcatcct ctgaatactg ttttgacaga 1440 tcttgttatt agcatgcttt cagggatgag aaaactaaga aagctgaatg atttgcccaa 1500 agtagtccac ctggaaaatg aaagagagag gattccaatc caggtcttag gattcaaaag 1560 cctgtgcatg ttccattttt agtactttcc acactgtatt tctcaatgtc tttctgggac 1620 attttataaa tcatattata tcacctctaa ggatctttca gtttgttata tatgtgtcta 1680 ttaagttaga ttgtgagctc ctaaaagata aagcattgtc ttattcatct ttaaatttct 1740 cagagcccaa atagtgcctg gaacctagta gttgctcaat aaaaggtatt gaatttacag 1800 gattgaatgg tgacatcaat gaataattga agattcctta agctgataac tgacccagta 1860 gcatcattga tcatttaatt gccctggact tacttatttt ccaccacact acatatttct 1920 gtatagaata tatatagctc attgtattgc aagatttaac tagaagaaag agttcatgct 1980 tgctttgtcc atgtaggttt aacaggaatg aattgctaaa ctgtggaaaa tgttttaaac 2040 aaatgcatct tatcctgtag gaaacaagct atattgaaga caactgcaat caaaacggcg 2100 ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc cctggccaag gtgctgagac 2160 tgttcgaaga gaacgacgtg aacctgacac acatcgagag cagacccagc agactgaaga 2220 aggacgagta cgagttcttc acccacctgg acaagcggag cctgcctgct ctgaccaaca 2280 tcatcaagat cctgcggcac gacatcggcg ccacagtgca cgaactgagc cgggacaaga 2340 aaaaggacac cgtgccatgg ttccccagaa ccatccaaga gctggacaga ttcgccaacc 2400 agatcctgag ctatggcgcc gagctggacg ctgatcaccc tggctttaag gaccccgtgt 2460 accgggccag aagaaagcag tttgccgata tcgcctacaa ctaccggcac ggccagccta 2520 ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc 2580 tgaagtccct gtacaagacc cacgcctgct acgagtacaa ccacatcttc ccactgctcg 2640 aaaagtactg cggcttccac gaggacaata tccctcagct tgaggacgtg tcccagttcc 2700 tgcagacctg caccggcttt agactgaggc cagttgccgg actgctgagc agcagagatt 2760 ttctcggcgg cctggccttc agagtgttcc actgtaccca gtacatcaga cacggcagca 2820 agcccatgta cacccctgag cctgatatct gccacgagct gctgggacat gtgcccctgt 2880 tcagcgatag aagcttcgcc cagttcagcc aagagatcgg actggcttct ctgggagccc 2940 ctgacgagta cattgagaag ctggccacca tctactggtt caccgtggaa ttcggcctgt 3000 gcaagcaggg cgacagcatc aaagcttatg gcgctggcct gctgtctagc ttcggcgagc 3060 tgcagtactg tctgagcgag aagcctaagc tgctgcccct ggaactggaa aagaccgcca 3120 tccagaacta caccgtgacc gagttccagc ctctgtacta cgtggccgag agcttcaacg 3180 acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc tcggcctttc agcgtcagat 3240 acgaccccta cacacagcgg atcgaggtgc tggacaacac acagcagctg aaaattctgg 3300 ccgactccat caacagcgag atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 3359 <210> 385 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 385 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420 tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480 ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540 gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600 aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660 tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720 cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780 tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840 tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900 tttaaacaaa tgcatcttat cctgtaggaa acaagctata ttgaagacaa ctgcaatcaa 960 aacggcgcca tcagcctgat cttcagcctg aaagaagaag tgggcgccct ggccaaggtg 1020 ctgagactgt tcgaagagaa cgacgtgaac ctgacacaca tcgagagcag acccagcaga 1080 ctgaagaagg acgagtacga gttcttcacc cacctggaca agcggagcct gcctgctctg 1140 accaacatca tcaagatcct gcggcacgac atcggcgcca cagtgcacga actgagccgg 1200 gacaagaaaa aggacaccgt gccatggttc cccagaacca tccaagagct ggacagattc 1260 gccaaccaga tcctgagcta tggcgccgag ctggacgctg atcaccctgg ctttaaggac 1320 cccgtgtacc gggccagaag aaagcagttt gccgatatcg cctacaacta ccggcacggc 1380 cagcctattc ctcgggtcga gtacatggaa gaggaaaaga aaacctgggg caccgtgttc 1440 aagaccctga agtccctgta caagacccac gcctgctacg agtacaacca catcttccca 1500 ctgctcgaaa agtactgcgg cttccacgag gacaatatcc ctcagcttga ggacgtgtcc 1560 cagttcctgc agacctgcac cggctttaga ctgaggccag ttgccggact gctgagcagc 1620 agagattttc tcggcggcct ggccttcaga gtgttccact gtacccagta catcagacac 1680 ggcagcaagc ccatgtacac ccctgagcct gatatctgcc acgagctgct gggacatgtg 1740 cccctgttca gcgatagaag cttcgcccag ttcagccaag agatcggact ggcttctctg 1800 ggagcccctg acgagtacat tgagaagctg gccaccatct actggttcac cgtggaattc 1860 ggcctgtgca agcagggcga cagcatcaaa gcttatggcg ctggcctgct gtctagcttc 1920 ggcgagctgc agtactgtct gagcgagaag cctaagctgc tgcccctgga actggaaaag 1980 accgccatcc agaactacac cgtgaccgag ttccagcctc tgtactacgt ggccgagagc 2040 ttcaacgacg ccaaagaaaa agtgcggaac ttcgccgcca ccattcctcg gcctttcagc 2100 gtcagatacg acccctacac acagcggatc gaggtgctgg acaacacaca gcagctgaaa 2160 attctggccg actccatcaa cagcgagatc ggcatcctgt gcagcgccct gcagaaaatc 2220 aagtga 2226 <210> 386 <211> 2179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 386 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccag 60 gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120 tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180 gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240 aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300 ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360 acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420 ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480 aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540 gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600 tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660 ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720 atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780 acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840 gctgtgaaaa acattttaac caagtgatct aattatgtag gagacaagct acatcgagga 900 caactgcaac cagaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc 960 cctggccaag gtgctgagac tgttcgaaga gaacgacgtg aacctgacac acatcgagag 1020 cagacccagc agactgaaga aggacgagta cgagttcttc acccacctgg acaagcggag 1080 cctgcctgct ctgaccaaca tcatcaagat cctgcggcac gacatcggcg ccacagtgca 1140 cgaactgagc cgggacaaga aaaaggacac cgtgccatgg ttccccagaa ccatccaaga 1200 gctggacaga ttcgccaacc agatcctgag ctatggcgcc gagctggacg ctgatcaccc 1260 tggctttaag gaccccgtgt accgggccag aagaaagcag tttgccgata tcgcctacaa 1320 ctaccggcac ggccagccta ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg 1380 gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc cacgcctgct acgagtacaa 1440 ccacatcttc ccactgctcg aaaagtactg cggcttccac gaggacaata tccctcagct 1500 tgaggacgtg tcccagttcc tgcagacctg caccggcttt agactgaggc cagttgccgg 1560 actgctgagc agcagagatt ttctcggcgg cctggccttc agagtgttcc actgtaccca 1620 gtacatcaga cacggcagca agcccatgta cacccctgag cctgatatct gccacgagct 1680 gctgggacat gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc aagagatcgg 1740 actggcttct ctgggagccc ctgacgagta cattgagaag ctggccacca tctactggtt 1800 caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg gcgctggcct 1860 gctgtctagc ttcggcgagc tgcagtactg tctgagcgag aagcctaagc tgctgcccct 1920 ggaactggaa aagaccgcca tccagaacta caccgtgacc gagttccagc ctctgtacta 1980 cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc 2040 tcggcctttc agcgtcagat acgaccccta cacacagcgg atcgaggtgc tggacaacac 2100 acagcagctg aaaattctgg ccgactccat caacagcgag atcggcatcc tgtgcagcgc 2160 cctgcagaaa atcaagtga 2179 <210> 387 <211> 2179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 387 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60 gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120 tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180 gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240 aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300 ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360 acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420 ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480 aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540 gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600 tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660 ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720 atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780 acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840 gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct atattgaaga 900 caactgcaat caaaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc 960 cctggccaag gtgctgagac tgttcgaaga gaacgacgtg aacctgacac acatcgagag 1020 cagacccagc agactgaaga aggacgagta cgagttcttc acccacctgg acaagcggag 1080 cctgcctgct ctgaccaaca tcatcaagat cctgcggcac gacatcggcg ccacagtgca 1140 cgaactgagc cgggacaaga aaaaggacac cgtgccatgg ttccccagaa ccatccaaga 1200 gctggacaga ttcgccaacc agatcctgag ctatggcgcc gagctggacg ctgatcaccc 1260 tggctttaag gaccccgtgt accgggccag aagaaagcag tttgccgata tcgcctacaa 1320 ctaccggcac ggccagccta ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg 1380 gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc cacgcctgct acgagtacaa 1440 ccacatcttc ccactgctcg aaaagtactg cggcttccac gaggacaata tccctcagct 1500 tgaggacgtg tcccagttcc tgcagacctg caccggcttt agactgaggc cagttgccgg 1560 actgctgagc agcagagatt ttctcggcgg cctggccttc agagtgttcc actgtaccca 1620 gtacatcaga cacggcagca agcccatgta cacccctgag cctgatatct gccacgagct 1680 gctgggacat gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc aagagatcgg 1740 actggcttct ctgggagccc ctgacgagta cattgagaag ctggccacca tctactggtt 1800 caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg gcgctggcct 1860 gctgtctagc ttcggcgagc tgcagtactg tctgagcgag aagcctaagc tgctgcccct 1920 ggaactggaa aagaccgcca tccagaacta caccgtgacc gagttccagc ctctgtacta 1980 cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc 2040 tcggcctttc agcgtcagat acgaccccta cacacagcgg atcgaggtgc tggacaacac 2100 acagcagctg aaaattctgg ccgactccat caacagcgag atcggcatcc tgtgcagcgc 2160 cctgcagaaa atcaagtga 2179 <210> 388 <211> 1362 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 388 atgagtaccg ccgtgctgga aaaccctgga ctgggacgca aactgagtga cttcggacag 60 gaaacatcat acattgagga taattgtaac cagaatggcg ccatctctct gatcttcagc 120 ctgaaggaag aagtgggcgc cctggcaaag gtgctgcgcc tgtttgagga gaacgacgtg 180 aatctgaccc acatcgagtc ccggccttct agactgaaga aggacgagta cgagttcttt 240 acccacctgg ataagcggtc cctgccagcc ctgacaaaca tcatcaagat cctgcgccac 300 gacattggag caacagtgca cgagctgtct agagacaaga agaaggatac cgtgccctgg 360 ttccctcgga caatccagga gctggataga tttgccaacc agatcctgtc ttacggcgca 420 gagctggatg cagatcaccc tggcttcaag gacccagtgt atcgggcccg gagaaagcag 480 tttgccgata tcgcctacaa ttatagacac ggacagccaa tccctagagt ggagtatatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagagcct gtacaagaca 600 cacgcctgct acgagtataa ccacatcttc cccctgctgg agaagtattg tggctttcac 660 gaggacaata tccctcagct ggaggacgtg agccagttcc tgcagacctg cacaggcttt 720 aggctgcgcc cagtggcagg actgctgagc tccagagact tcctgggagg actggccttc 780 agagtgtttc actgcaccca gtacatcagg cacggctcca agccaatgta tacaccagag 840 cccgacatct gtcacgagct gctgggccac gtgcccctgt ttagcgatag atccttcgcc 900 cagttttccc aggagattgg actggcatct ctgggagcac ctgacgagta catcgagaag 960 ctggccacca tctattggtt cacagtggag tttggcctgt gcaagcaggg cgatagcatc 1020 aaggcctacg gcgcaggact gctgtctagc ttcggcgagc tgcagtattg tctgtccgag 1080 aagccaaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgaca 1140 gagttccagc ccctgtacta tgtggccgag tcttttaacg atgccaagga gaaggtgaga 1200 aatttcgccg ccacaatccc taggcccttc agcgtgcggt acgaccctta tacccagagg 1260 atcgaggtgc tggataatac acagcagctg aagatcctgg ccgactccat caatagcgaa 1320 atcggcatcc tgtgctcagc cctgcagaaa atcaaataat aa 1362 <210> 389 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 389 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420 tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480 ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540 gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600 aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660 tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720 cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780 tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840 tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900 tttaaacaaa tgcatcttat cctgtaggag acaagctaca tcgaggacaa ctgcaaccag 960 aacggcgcca tcagcctgat cttcagcctg aaagaagaag tgggcgccct ggccaaggtg 1020 ctgagactgt tcgaagagaa cgacgtgaac ctgacacaca tcgagagcag acccagcaga 1080 ctgaagaagg acgagtacga gttcttcacc cacctggaca agcggagcct gcctgctctg 1140 accaacatca tcaagatcct gcggcacgac atcggcgcca cagtgcacga actgagccgg 1200 gacaagaaaa aggacaccgt gccatggttc cccagaacca tccaagagct ggacagattc 1260 gccaaccaga tcctgagcta tggcgccgag ctggacgctg atcaccctgg ctttaaggac 1320 cccgtgtacc gggccagaag aaagcagttt gccgatatcg cctacaacta ccggcacggc 1380 cagcctattc ctcgggtcga gtacatggaa gaggaaaaga aaacctgggg caccgtgttc 1440 aagaccctga agtccctgta caagacccac gcctgctacg agtacaacca catcttccca 1500 ctgctcgaaa agtactgcgg cttccacgag gacaatatcc ctcagcttga ggacgtgtcc 1560 cagttcctgc agacctgcac cggctttaga ctgaggccag ttgccggact gctgagcagc 1620 agagattttc tcggcggcct ggccttcaga gtgttccact gtacccagta catcagacac 1680 ggcagcaagc ccatgtacac ccctgagcct gatatctgcc acgagctgct gggacatgtg 1740 cccctgttca gcgatagaag cttcgcccag ttcagccaag agatcggact ggcttctctg 1800 ggagcccctg acgagtacat tgagaagctg gccaccatct actggttcac cgtggaattc 1860 ggcctgtgca agcagggcga cagcatcaaa gcttatggcg ctggcctgct gtctagcttc 1920 ggcgagctgc agtactgtct gagcgagaag cctaagctgc tgcccctgga actggaaaag 1980 accgccatcc agaactacac cgtgaccgag ttccagcctc tgtactacgt ggccgagagc 2040 ttcaacgacg ccaaagaaaa agtgcggaac ttcgccgcca ccattcctcg gcctttcagc 2100 gtcagatacg acccctacac acagcggatc gaggtgctgg acaacacaca gcagctgaaa 2160 attctggccg actccatcaa cagcgagatc ggcatcctgt gcagcgccct gcagaaaatc 2220 aagtga 2226 <210> 390 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 390 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359 <210> 391 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 391 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccag 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359 <210> 392 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 392 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300 tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 360 agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 420 catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 480 caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 540 cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 600 catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 660 tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 720 cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 780 gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 840 cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 900 ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 960 agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 1020 ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 1080 ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 1140 agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 1200 ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 1260 cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 1320 gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 1380 tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 1440 caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 1500 ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 1560 gtgcagcgcc ctgcagaaaa tcaagtga 1588 <210> 393 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 393 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagaccga taccggcttt 720 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359 <210> 394 <211> 2634 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 394 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgaa tgaaccagaa cggcgccatc 1380 agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1440 gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1500 gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1560 aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1620 gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1680 ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1740 gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1800 cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1860 tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1920 tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1980 acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 2040 ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 2100 atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 2160 gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 2220 gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 2280 cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 2340 tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 2400 aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2460 aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2520 ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2580 tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtga 2634 <210> 395 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 395 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtaa 1359 <210> 396 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 396 atgagtacag cagtgttaga gaatccaggc cttggtagaa agctgtctga ctttggccag 60 gagaccagct acatcgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 120 ctgaaggagg aggtgggcgc cctggccaag gtgctgaggc tgttcgagga gaacgacgtg 180 aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta cgagttcttc 240 acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacac 300 gacatcggcg ccaccgtgca cgagctgtcc agagacaaga agaaggacac cgtgccctgg 360 ttccccagaa ccatccagga gctggacagg ttcgccaacc agatcctgtc ctacggcgcc 420 gagctggatg ccgaccaccc aggcttcaag gaccctgtgt acagggccag aaggaagcag 480 tttgctgaca tcgcctataa ctacaggcac ggccagccca tccctagagt ggagtacatg 540 gaggaggaga agaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg cggcttccac 660 gaggacaaca tccctcagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 720 agactgagac ctgtggctgg cctgctgtct agcagagact tcctgggagg cctggccttc 780 agagtgttcc actgcaccca gtacatcaga catggaagca agcccatgta cacccctgag 840 ccagacatct gccatgagct gctgggccat gtgcccctgt tctctgatag atcctttgcc 900 cagttcagcc aggagattgg cctggccagc ctgggagccc ctgatgagta cattgagaag 960 ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1020 aaggcctatg gagctggact gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080 aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1140 gagttccagc ccctgtacta tgtggctgag agcttcaatg atgccaagga gaaggtgaga 1200 aactttgctg ccaccatccc cagacccttc tctgtgaggt atgaccccta cacccagagg 1260 attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320 attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 397 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 397 atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60 gagacctcct acattgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 120 ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180 aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240 acccacctgg acaagagatc cctgcctgct ctgaccaaca tcatcaagat cctgagacat 300 gatattggag ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccttgg 360 ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 420 gagctggatg ctgaccaccc tggatttaag gatcctgtgt acagggccag aaggaagcag 480 tttgctgaca ttgcctacaa ctacaggcat ggccagccca tccccagggt ggagtacatg 540 gaggaggaga agaagacctg gggcactgtg ttcaagaccc tgaagagcct gtacaagacc 600 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660 gaggacaaca tccctcagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 720 agactgagac ctgtggctgg cctgctgtct agcagagact tcctgggcgg cctggccttc 780 agagtgttcc actgcaccca gtacatccgg cacggaagca agcccatgta cacccctgag 840 cctgacatct gccacgagct gctgggccac gtgcccctgt tctccgacag atccttcgcc 900 cagttcagcc aggagattgg cctggcctcc ctgggagccc ctgacgagta catcgagaag 960 ctggccacca tctactggtt caccgtggag tttggcctgt gcaagcaggg agactccatc 1020 aaggcctacg gcgccggcct gctgtcctcc ttcggcgagc tgcagtactg cctgtctgag 1080 aagcccaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ccctgtacta cgtggctgag tctttcaacg acgccaagga gaaggtgaga 1200 aacttcgccg ccaccatccc cagacccttc tctgtgcgct acgaccccta cacccagagg 1260 attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320 attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 398 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 398 atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60 gagacctcct acattgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 120 ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180 aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240 acccacctgg acaagagatc cctgcctgct ctgaccaaca tcatcaagat cctgagacat 300 gatattggag ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccttgg 360 ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 420 gagctggatg ctgaccaccc tggatttaag gatcctgtgt acagggccag aaggaagcag 480 tttgctgaca ttgcctacaa ctacaggcat ggccagccca tccccagggt ggagtacatg 540 gaggaggaga agaagacctg gggcactgtg ttcaagaccc tgaagagcct gtacaagacc 600 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660 gaggacaaca tccctcagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 720 agactgagac ctgtggctgg cctgctgtct agcagagact tcctgggagg cctggccttc 780 agagtgttcc actgcaccca gtacatcaga catggaagca agcccatgta cacccctgag 840 ccagacatct gccatgagct gctgggccat gtgcccctgt tctctgatag atcctttgcc 900 cagttcagcc aggagattgg cctggccagc ctgggagccc ctgatgagta cattgagaag 960 ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1020 aaggcctatg gagctggact gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080 aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1140 gagttccagc ccctgtacta tgtggctgag agcttcaatg atgccaagga gaaggtgaga 1200 aactttgctg ccaccatccc cagacccttc tctgtgaggt atgaccccta cacccagagg 1260 attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320 attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 399 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 399 atgagcaccg ccgtgctgga gaaccccggc ctgggcagaa agctgtctga ctttggccag 60 gagaccagct acatcgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 120 ctgaaggagg aggtgggcgc cctggccaag gtgctgaggc tgttcgagga gaacgacgtg 180 aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta cgagttcttc 240 acccacctgg acaagagatc cctgcctgct ctgaccaaca tcatcaagat cctgagacac 300 gacatcggcg ccaccgtgca cgagctgtcc agagacaaga agaaggacac cgtgccctgg 360 ttccccagaa ccatccagga gctggacagg ttcgccaacc agatcctgtc ctacggcgcc 420 gagctggatg ccgaccaccc aggcttcaag gaccctgtgt acagggccag aaggaagcag 480 tttgctgaca tcgcctacaa ctacaggcac ggccagccca tccctagagt ggagtacatg 540 gaggaggaga agaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg cggcttccac 660 gaggacaaca tcccccagct ggaggacgtg tcccagttcc tgcagacctg caccggcttc 720 agactgaggc cagtggccgg cctgctgtct agcagagact tcctgggcgg cctggccttc 780 agagtgttcc actgcaccca gtacatccgg cacggaagca agcccatgta cacccctgag 840 cctgacatct gccacgagct gctgggccac gtgcccctgt tctccgacag atccttcgcc 900 cagttcagcc aggagattgg cctggcctcc ctgggagccc ctgacgagta catcgagaag 960 ctggccacca tctactggtt caccgtggag tttggcctgt gcaagcaggg agactccatc 1020 aaggcctacg gcgccggcct gctgtcctcc ttcggcgagc tgcagtactg cctgtctgag 1080 aagcccaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ccctgtacta cgtggctgag tctttcaacg acgccaagga gaaggtgaga 1200 aacttcgccg ccaccatccc cagacccttc tctgtgcgct acgaccccta cacccagagg 1260 atcgaggtgc tggacaacac ccagcagctg aagatcctgg ccgactccat caactctgag 1320 atcggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 400 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 400 atgagtacag cagtgttaga gaacccaggc cttggcagaa aactgtctga ctttggccag 60 gagacctcct acattgagga caactgcaac cagaatggag ccatttctct catcttctcc 120 ctgaaagaag aagtgggggc tctggccaag gtgctgagac tgtttgagga gaatgatgtg 180 aacctgacac atatagagag cagaccttcc agactcaaaa aagatgagta tgagttcttc 240 acccacctgg ataagaggag cctgcctgcc ctcaccaaca tcatcaaaat cctcagacat 300 gacattggtg ccacagtcca tgagctgagt agagacaaga agaaggacac agtcccctgg 360 ttccccagaa ctattcagga actggacagg tttgccaatc agatcctgtc ctatggagct 420 gagcttgatg ctgaccaccc aggtttcaag gatcctgtgt acagagccag gaggaagcag 480 tttgcagata ttgcctacaa ctacaggcat ggacagccca tccccagggt ggagtacatg 540 gaggaagaga agaaaacctg gggcactgtg ttcaaaaccc tgaagagcct gtacaagacc 600 catgcctgct atgaatacaa tcacatcttt cctctgctgg agaagtactg tggcttccat 660 gaagacaata ttccccagct ggaagatgtc tcccagttcc ttcagacctg cacaggattc 720 aggctgaggc cagtggctgg cctcctgagc tccagggact tcctgggagg cctggccttc 780 agagtcttcc actgcactca gtatatcagg catggctcca agcccatgta caccccagag 840 cctgacatct gccatgagct gctgggccat gtgcccctct tcagtgacag atcctttgcc 900 cagttcagcc aagaaattgg attggcctct ctgggggccc ctgatgaata tattgaaaag 960 ctggctacca tctactggtt tacagtggaa tttgggctgt gcaaacaggg agacagcatc 1020 aaggcctatg gtgctggact gctcagcagc tttggagagc tccagtactg cctgtcagag 1080 aaacccaagc tcctgcccct ggagttggaa aaaacagcca tccagaacta tactgtcaca 1140 gaattccagc ctctctacta tgtggcagag tccttcaatg atgccaaaga gaaagtgagg 1200 aactttgctg ccaccattcc aagacccttc tctgtgagat atgaccccta cacacagaga 1260 attgaggtgt tggataacac ccagcagctc aagattctgg cagactccat caactctgag 1320 attggcatcc tgtgttctgc cctgcagaag atcaagtaa 1359 <210> 401 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 401 atgagtacag cagtgttaga gaacccaggc cttggaagaa aactgtctga ctttggccag 60 gagacctcct acatcgagga caactgcaac cagaatggag ccatttctct catcttctcc 120 ctgaaagaag aagtgggggc tctggccaag gtgctgcggc tgtttgagga gaatgatgtg 180 aacctgacac atatagagag ccgcccttcc agactcaaaa aagatgagta tgagttcttc 240 acccacctgg ataagaggag cctgcctgcc ctcaccaaca tcatcaaaat cctcagacat 300 gacattggtg ccacagtcca cgagctgagt agagacaaga agaaggacac cgtcccctgg 360 ttccccagaa ctattcagga actggacagg tttgccaatc agatcctgtc ctatggagct 420 gagcttgatg ctgaccaccc aggtttcaag gatcctgtgt acagagccag gaggaagcag 480 tttgcagata ttgcctacaa ctaccgccat ggacagccca tccccagggt ggagtacatg 540 gaggaagaga agaaaacctg gggcactgtg ttcaaaaccc tgaagagcct gtacaagacc 600 catgcctgct atgaatacaa tcacatcttt cctctgctgg agaagtactg tggcttccat 660 gaagacaata ttccccagct ggaagatgtc tcccagttcc ttcagacctg cacaggattc 720 aggctgaggc cagtggctgg cctcctgagc tccagggact tcctgggagg cctggccttc 780 agagtcttcc actgcactca gtatatcagg catggctcca agcccatgta caccccagag 840 cctgacatct gccatgagct gctgggccat gtgcccctct tcagtgacag atcctttgcc 900 cagttcagcc aagaaattgg attggcctct ctgggggccc ctgatgaata tattgaaaag 960 ctggctacca tctactggtt tacagtggaa tttgggctgt gcaaacaggg agacagcatc 1020 aaggcctatg gtgctggact gctcagcagc tttggagagc tccagtactg cctgtcagag 1080 aaacccaagc tcctgcccct ggagttggaa aaaacagcca tccagaacta tactgtcaca 1140 gaattccagc ctctctacta cgtggccgag tccttcaacg atgccaaaga gaaagtgagg 1200 aactttgctg ccaccattcc aagacccttc tctgtgagat atgaccccta cacacagaga 1260 attgaggtgt tggataacac ccagcagctc aagattctgg cagactccat caactctgag 1320 attggcatcc tgtgttctgc cctgcagaag atcaagtaa 1359 <210> 402 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 402 atgtccaccg ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60 gagacctcct acattgagga caactgcaac cagaatggag ccatctccct gatcttctcc 120 ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180 aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240 acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacat 300 gacattggag ccaccgtgca tgagctgtcc agagacaaga agaaggacac cgtgccctgg 360 ttccccagaa ccatccagga gctggacaga tttgccaacc agatcctgtc ctatggagct 420 gagctggatg ctgaccaccc tggcttcaag gaccctgtgt acagagccag aagaaagcag 480 tttgctgaca ttgcctacaa ctacagacat ggccagccca tccccagagt ggagtacatg 540 gaggaggaga agaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660 gaggacaaca tcccccagct ggaggatgtg tcccagttcc tgcagacctg caccggcttc 720 agactgagac ctgtggctgg cctgctgtcc tccagagact tcctgggagg cctggccttc 780 agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 840 cctgacatct gccatgagct gctgggccat gtgcccctgt tctctgacag atcctttgcc 900 cagttctccc aggagattgg cctggcctcc ctgggagccc ctgatgagta cattgagaag 960 ctggccacca tctactggtt caccgtggag tttggcctgt gcaagcaggg agactccatc 1020 aaggcctatg gagctggcct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080 aagcccaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ccctgtacta tgtggctgag tccttcaatg atgccaagga gaaggtcaga 1200 aactttgctg ccaccatccc cagacccttc tctgtgagat atgaccccta cacccagaga 1260 attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320 attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 403 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 403 atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60 gagacctcct acattgagga caactgcaac cagaatggag ccatctccct gatcttctcc 120 ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180 aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240 acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacat 300 gacattggag ccacagtgca tgagctgtcc agagacaaga agaaggacac agtgccctgg 360 ttccccagaa ccatccagga gctggacaga tttgccaacc agatcctgtc ctatggagct 420 gagctggatg ctgaccaccc tggcttcaag gaccctgtgt acagggccag aagaaagcag 480 tttgctgaca ttgcctacaa ctacagacat ggccagccca tccccagagt ggagtacatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagtccct gtacaagacc 600 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660 gaggacaaca tcccccagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 720 agactgagac ctgtggctgg cctgctgtcc tccagagact tcctgggagg cctggccttc 780 agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 840 cctgacatct gccatgagct gctgggccat gtgcccctgt tctctgacag atcctttgcc 900 cagttctccc aggagattgg cctggcctcc ctgggagccc ctgatgagta cattgagaag 960 ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1020 aaggcctatg gagctggcct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080 aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1140 gagttccagc ccctgtacta tgtggctgag tccttcaatg atgccaagga gaaggtcaga 1200 aactttgctg ccaccatccc cagacccttc tctgtgagat atgaccccta cacccagaga 1260 attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1320 attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 404 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 404 atgagcaccg ccgtgctgga gaacccgggg ctcggccgga agttgtccga cttcgggcag 60 gagacctcct acatcgagga taactgcaac caaaacgggg cgatcagtct catcttcagc 120 ttgaaagagg aggtcggcgc cctggcgaaa gtgctgaggc tcttcgagga gaacgacgtg 180 aacctcaccc atatcgagtc caggccgtct cggctgaaaa aggacgagta cgagttcttc 240 acccacttag acaagaggtc gctgcccgcg ctgacgaaca tcatcaagat ccttcgccac 300 gacatcgggg ccaccgtgca cgagctgagc agggacaaga agaaggatac agtcccgtgg 360 ttcccccgca ccattcagga gctcgatcgt ttcgccaacc agatcctcag ctacggtgcg 420 gaactcgacg cggatcaccc aggcttcaag gaccccgtgt accgcgcgcg ccggaaacag 480 ttcgccgata tcgcgtacaa ctaccgccat ggccagccga tcccccgggt cgaatacatg 540 gaggaggaaa agaagacgtg ggggacggtg ttcaaaacgc tgaagtcatt gtataagacc 600 cacgcgtgct acgagtataa ccacatcttc cccctgctgg aaaagtactg cggatttcac 660 gaggacaaca tcccccagct ggaggacgtg agccagttcc tccagacctg cacggggttc 720 cgcctgcggc cggtggccgg gctgctttcc tctcgcgact tcctgggcgg gttggccttc 780 cgggtgttcc actgcaccca gtacatccgc cacggctcca agccgatgta cactcccgag 840 ccggacatct gccacgagtt gctggggcac gtgcctttgt tcagcgaccg cagcttcgcc 900 cagttcagcc aggagatcgg cctcgcctca ctgggcgccc ccgatgagta catagagaaa 960 ttggcgacga tctactggtt tactgtcgag ttcgggctct gcaagcaggg cgactcgatc 1020 aaggcgtacg gcgcgggctt gctgagctct ttcggcgagc tgcagtattg cctgagcgag 1080 aagcccaagc tgttgcccct tgagctagag aagacagcaa tccagaacta cacggtcacc 1140 gagttccagc ccttgtacta cgtggccgag tccttcaatg acgccaagga gaaggtgagg 1200 aatttcgcag ccaccatccc caggcccttc tcggtgcgct acgaccccta tacccagcgc 1260 attgaggtcc tggataacac ccagcagctg aagatcttgg ccgacagcat caactccgag 1320 attggcatct tgtgctccgc actgcagaag atcaagtaa 1359 <210> 405 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 405 atgagcacag ctgtactcga aaaccctggt cttggtagaa aattgagtga ttttggtcag 60 gagacctctt acattgagga taactgtaat caaaatggag ccatttctct tattttctcc 120 cttaaagagg aggtaggagc tttagcaaaa gtactgagat tgtttgagga gaatgatgtc 180 aatcttaccc atattgaatc taggccaagc cgccttaaaa aagatgaata tgaatttttc 240 actcatcttg acaaaaggag tcttcctgca cttactaata tcataaaaat actgaggcac 300 gatattggtg ccactgttca tgaactaagt cgggataaaa agaaggatac tgttccctgg 360 ttccccagaa caattcaaga acttgacaga tttgcaaatc aaattctcag ctatggtgct 420 gaattggacg ctgaccatcc tggatttaag gaccctgttt atagggctag gagaaagcag 480 tttgctgaca tagcttacaa ctatcgccat ggtcaaccaa taccaagggt ggaatatatg 540 gaggaagaga agaaaacatg gggtactgta tttaaaactt taaagtctct ttataagacc 600 catgcttgtt acgagtataa tcatatattc ccactccttg aaaaatattg tggctttcat 660 gaggacaata tcccccaact ggaagatgta tcccaatttc ttcagacttg tactgggttc 720 aggctaagac ctgtagcagg acttctaagt agtagagatt ttcttggggg gctagctttt 780 agagtgtttc attgcactca gtacatcaga catggttcca agcctatgta cactcctgaa 840 cctgatattt gccatgaatt gcttggtcat gttcctctat tctctgatag atcatttgct 900 caattttcac aagagattgg tctggcaagt ctgggagcac ctgatgagta tattgagaag 960 ctggctacta tctattggtt tacagtagag tttggactgt gcaagcaggg tgattcaatc 1020 aaggcctatg gcgcaggttt actctcttca tttggagagt tgcagtattg cctgtcagag 1080 aagcccaagc tgttaccctt agagttggag aagactgcaa tccagaacta tacagtaaca 1140 gagtttcagc ccctctacta tgttgcagaa tcatttaatg atgctaaaga gaaagttagg 1200 aattttgctg ctacaattcc tagacccttt tcagttagat atgatcccta tacacagagg 1260 attgaggttc tggataacac acagcagctg aaaattttgg ctgattctat aaacagtgag 1320 ataggtatac tatgctctgc tctacagaag atcaagtaa 1359 <210> 406 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 406 atgagtacag cagttttaga gaacccagga ttaggcagga agctgtcaga ttttggccag 60 gaaaccagct atatagaaga caactgcaac cagaatggag ccatttctct catcttttcc 120 ctcaaggaag aagtgggggc cctggctaaa gtactcagac tttttgaaga gaatgatgtc 180 aacctgaccc atattgagag tagacccagc aggctcaaga aggatgagta tgagttcttt 240 actcacttgg acaaaaggtc acttccagct ctcaccaaca taatcaaaat cctcagacat 300 gacattggag ccactgtcca tgagctcagc agggacaaga agaaggatac tgtgccctgg 360 ttcccaagga ctattcagga gttagataga tttgccaacc agatcctgtc ctatggggct 420 gaactggatg cagaccaccc tggatttaaa gaccctgtgt acagagctag aagaaagcag 480 tttgctgata ttgcctacaa ctacaggcat gggcagccca ttcctagagt ggaatacatg 540 gaggaagaga aaaagacctg gggaacagtc ttcaaaaccc tcaagtctct gtacaagacc 600 catgcctgct atgaatataa tcacatcttc cccttgctgg aaaagtactg tggcttccat 660 gaggacaaca ttccccaact agaagatgtg tcccagttcc tgcagacctg cactgggttc 720 agattaagac ctgtggcagg acttctgtct tccagagact tcctgggtgg gcttgcattc 780 agggtgttcc actgcaccca gtacatcaga catgggagca agcccatgta cacacctgag 840 cctgatattt gccatgaact cttaggacat gttccactct tttctgacag gagttttgcc 900 cagtttagcc aggagatagg cctagcatcc ctgggagcac cagatgaata cattgaaaaa 960 ctggccacca tctactggtt cacagtggag tttgggctat gcaaacaggg agattccatc 1020 aaggcctatg gagctggcct gttatcttcc tttggagaac tccagtattg cctgagtgag 1080 aagcccaagc ttctcccact ggagctggag aagactgcca tccagaacta tactgtcact 1140 gaattccagc ccctttacta tgtggctgag agcttcaatg atgctaagga gaaggtgagg 1200 aattttgctg caaccatccc caggcccttc tctgtcaggt atgaccccta cacccagaga 1260 atagaggtgc tggacaacac ccagcagctg aagatcttgg ctgacagcat caactctgag 1320 attggcatcc tctgctctgc cttgcagaag attaagtaa 1359 <210> 407 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 407 atgagtacag cagttttaga gaacccagga ttaggcagga agctgagcga tttcggccag 60 gagaccagct atatcgagga caactgcaac cagaacgggg ccatctcgct gatcttctcc 120 ctcaaggaag aggtcggggc cctcgccaag gtcttgcgcc tgttcgagga gaacgacgtg 180 aaccttacgc acattgagag ccgccccagc aggttgaaga aggatgagta cgagttcttc 240 acccacctgg acaagcgcag cctgcccgcg ctgaccaaca tcatcaagat cttgcgccac 300 gacatcgggg cgacggtgca cgagctctcc cgggataaaa agaaggacac cgtgccctgg 360 ttcccccgca ccatccagga attggacagg ttcgccaacc agatcctctc ctacggggcg 420 gagctggacg cggaccaccc cggctttaag gaccccgtct accgcgcccg ccgcaagcag 480 ttcgccgaca tcgcctacaa ttacaggcac gggcaaccca tcccgcgggt ggagtacatg 540 gaggaggaga agaagacctg gggcaccgtc ttcaagaccc tgaagagcct ctacaagaca 600 cacgcgtgct acgagtacaa ccacatcttc cctttgctag agaagtactg cgggttccac 660 gaagacaata ttccccagtt ggaggacgtg tcccagtttc tgcagacctg cacgggcttc 720 aggttgaggc ccgtcgccgg cttgttgagc agcagggact tcctgggagg cctcgccttc 780 agggtgttcc attgcaccca gtatatcaga cacggctcga agcccatgta cacccccgag 840 cccgacatct gccatgagct gctggggcac gtgcccttgt tctccgacag gtcgttcgcc 900 cagttcagcc aggagatcgg gctggcctcc ttgggcgccc cggatgagta catcgaaaag 960 ctggccacca tctactggtt cacagtggag tttgggttgt gcaagcaggg ggacagcatc 1020 aaggcttacg gggcgggcct gctctcctcc ttcggggagc tccagtactg cctctcggag 1080 aagcccaagt tgctccccct ggagttggag aagacagcca tccaaaacta cactgtgacg 1140 gagttccagc ccttgtacta cgtcgccgag tccttcaacg atgccaagga gaaggtgagg 1200 aactttgccg ccacgatccc caggcccttc tctgtcaggt acgaccccta cacccagcgc 1260 atcgaggtgc tggacaacac gcagcagctg aagatcctgg cggactccat caactccgag 1320 attggcatct tgtgctccgc cctgcagaag atcaaataa 1359 <210> 408 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 408 atgtccactg cagtcctgga gaatccagga ctggggagga aactgtctga ctttgggcaa 60 gagacctcct atattgagga caactgtaac caaaatggag ccatctccct gatcttttcc 120 ctgaaagaag aggtgggggc cttagctaag gtgcttaggc tttttgagga gaatgatgtg 180 aatctgactc acattgagtc taggcccagt agactgaaga aggatgagta tgaattcttt 240 acccatctgg ataaaagatc cctccctgct ctgactaaca tcatcaagat cttgaggcat 300 gatataggtg ccactgtgca tgagctgtcc agagacaaga agaaggacac tgtgccatgg 360 tttccaagga caatccagga gctggacagg tttgccaatc agatcctgag ctatggggct 420 gagctggatg ctgaccaccc tggcttcaag gacccagtgt acagggccag gagaaagcag 480 tttgctgaca tagcctacaa ctatagacat gggcagccca ttcctagggt ggagtacatg 540 gaggaagaga agaagacctg ggggactgtg ttcaagaccc tcaagtccct gtacaagacc 600 catgcctgct atgagtacaa tcacatcttc cccttgctgg agaagtactg tgggttccat 660 gaggacaaca tcccccagct ggaagatgtc tcacagttcc tgcagacctg cacaggtttc 720 aggttgagac cagttgctgg cctgctgtca agcagagact tcttgggggg actggccttt 780 agagtgttcc attgtaccca gtacatcaga catggctcca agcccatgta caccccagag 840 ccagacatct gccatgagct cctggggcat gtgcccctgt tttctgatag atcctttgcc 900 cagttcagcc aggagattgg cttggccagc ttgggagccc ctgatgagta cattgagaaa 960 ctggccacca tttattggtt cacagtggaa tttggactct gcaagcaagg ggacagcatc 1020 aaggcctatg gagctggctt gctgtccagc tttggagagc tgcagtactg cctgtctgag 1080 aagcccaagc tcctgcccct ggagctggaa aagactgcca tccagaatta tacagtgact 1140 gagttccagc ccctgtacta tgtggcagag tccttcaatg atgccaagga gaaagtgagg 1200 aactttgcag ccaccatccc cagacccttc tctgtcagat atgaccccta cacccagaga 1260 attgaggtgc tggataacac ccagcagctg aagattctgg ctgacagcat caactcagag 1320 attggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 409 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 409 atgtctacag cagtcctgga aaacccagga ttgggtagga agctgtcaga ctttgggcaa 60 gagacttcct acattgaaga caactgcaac caaaatggag caatcagctt aatcttcagt 120 ttgaaagagg aggtgggtgc cctggctaaa gtcctgagac tatttgaaga gaatgatgta 180 aacctgacac atattgagag tagaccatct agactcaaaa aggatgagta tgagttcttc 240 acacacttgg ataagagaag cttaccagct ctgacaaaca tcatcaaaat actgaggcat 300 gatataggtg ccacagtaca tgaacttagc agggacaaaa agaaagatac tgtaccctgg 360 tttcctagaa ctatacagga gttagataga tttgcaaatc agattttgag ctatggggct 420 gagttggatg ctgatcaccc tggatttaaa gatcctgtct atagggcaag aagaaaacaa 480 tttgcagata tagcatataa ctacagacat ggacaaccta taccaagggt ggaatatatg 540 gaagaggaaa agaaaacatg gggtacagtt ttcaaaacac ttaaatctct atacaaaact 600 catgcttgtt atgaatataa ccacattttc cctctactgg aaaaatactg tggttttcat 660 gaggacaaca taccacagct agaagatgtc agccagtttc tccaaacatg tacaggtttt 720 aggttaagac cagttgctgg gctgctcagt agtagggact tcctgggggg tcttgctttc 780 agagtattcc actgcactca atatataaga catggcagta agccaatgta tactcctgag 840 ccagatatat gtcatgagtt gttaggacat gtacctttat tttcagacag gtcttttgca 900 cagttttctc aagaaattgg actagccagt ctaggggctc ctgatgaata tattgaaaag 960 ttagctacta tttactggtt tacagtagag tttggtcttt gtaagcaggg ggatagcatc 1020 aaagcatatg gggcaggact tttatcttcc tttggggaac tccaatactg tttaagtgaa 1080 aagcctaaac tcctaccctt agaactagag aaaactgcta tacagaacta cactgttact 1140 gaatttcagc ctctatatta tgttgctgaa tcttttaatg atgccaaaga aaaagtaagg 1200 aactttgctg ctaccatacc taggccattt tcagttaggt atgacccata cacacagagg 1260 attgaggtct tagataacac acaacaactg aagatattgg ctgacagcat aaactcagag 1320 ataggtatac tttgtagtgc tctacagaag ataaagtaa 1359 <210> 410 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 410 atgtctacag cagtcttgga aaacccagga ttgggtagga agctgtcaga ctttgggcaa 60 gagactagct acattgaaga caactgcaac caaaatggag ccatcagctt aatcttcagt 120 ttaaaagagg aggttggtgc cctggctaag gtcctgagac tgtttgaaga gaatgatgtg 180 aacctgacac acattgagag cagaccatcc agactgaaga aggatgagta tgagttcttc 240 acacacctgg ataagagaag cctgccagca ctgacaaaca tcatcaagat tctgagacat 300 gacattggtg ctactgtgca tgagctgtca agggataaga agaaggacac agtgccctgg 360 ttccccagaa ccattcagga actggataga tttgccaacc agatcctgtc ctatggggct 420 gagctggatg cagatcaccc tggattcaag gatccagtgt acagagcaag gagaaagcag 480 tttgctgaca ttgcatataa ctacagacat ggccagccaa ttcctagagt ggagtacatg 540 gaggaagaga agaagacctg gggaacagtt ttcaagacac tcaaatccct ctacaagacc 600 catgcttgct atgagtacaa tcatatcttc ccactgctgg agaagtactg tggcttccat 660 gaggacaata tcccccagct ggaagatgtg tctcagttcc tgcagacctg cacaggcttc 720 aggctgagac ctgttgctgg actgctgtcc agtagggact ttctgggagg actggctttc 780 agagtgttcc attgcaccca gtatatcaga catggaagca agcccatgta cacacctgag 840 ccagacatct gccatgagct actgggccat gtgccacttt tttcagacag atcctttgcc 900 cagtttagcc aggaaattgg actggcatct ctgggggccc cagatgagta cattgagaag 960 ctggctacca tctactggtt cacagtggag tttggactgt gcaagcaggg ggattctatc 1020 aaggcctatg gagcaggact cctgtcctct tttggagagc tgcagtactg cctgagtgag 1080 aagccaaagc tgctgccact ggagctggaa aagactgcta tccagaacta cactgtgact 1140 gagttccagc cactgtacta tgtggctgag tcattcaatg atgccaagga gaaagtcagg 1200 aactttgctg ccactatccc caggcccttc agtgtgagat atgaccctta cacacagagg 1260 attgaggtcc tggacaatac acagcagctg aaaatcctgg ctgatagcat caactctgag 1320 attggcatcc tgtgcagtgc cctgcagaag atcaagtaa 1359 <210> 411 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 411 atgtcaacag cagttttaga aaacccaggg ctaggaagaa agttgtcaga ctttggccag 60 gagacctcat acattgagga caattgtaac cagaatgggg ccatctccct gatcttttct 120 ctgaaggagg aggtgggtgc cctggctaaa gtcctgagac tgtttgaaga gaatgatgtg 180 aacctgaccc acattgagag cagaccatcc agactgaaga aggatgagta tgagttcttc 240 acacacctgg ataagagaag cctgccagca ctgacaaaca tcatcaagat tctgagacat 300 gacattggtg ctacagtgca tgagctgtca agggataaga agaaggacac agtgccctgg 360 ttccccagaa ccattcagga actggacaga tttgccaacc agatcctgtc ctatggggct 420 gagctggatg cagatcaccc aggattcaag gatccagtgt acagagcaag gagaaagcag 480 tttgctgaca ttgcatacaa ctacagacat ggccagccaa ttcctagagt ggagtacatg 540 gaggaggaga agaagacctg gggaacagtt ttcaagacac tcaaatccct ctacaagacc 600 catgcttgct atgagtacaa tcatatcttc ccactgctgg agaagtactg tggcttccat 660 gaggacaata tcccccagct ggaagatgtg tctcagttcc tgcagacctg cacaggcttc 720 aggctgagac ctgttgctgg actgctgtcc agcagggact ttctgggagg actggctttc 780 agagtgttcc actgcaccca gtatatcaga catggaagca agcccatgta cacacctgag 840 ccagacatct gccatgagct gctgggccat gtgccactgt tttcagacag atcctttgcc 900 cagtttagcc aggagattgg actggcatct ctgggagccc cagatgagta cattgagaag 960 ctggctacca tctactggtt cacagtggag tttggactgt gcaagcaggg ggattctatc 1020 aaggcctatg gagcaggact gctgtcctct tttggagagc tgcagtactg cctgagtgag 1080 aagccaaagc tgctgccact ggagctggaa aagactgcta tccagaacta cactgtgact 1140 gagttccagc cactgtacta tgtggctgag tcattcaatg atgccaagga gaaagtcagg 1200 aactttgctg ccactatccc cagacccttc tcagtgagat atgaccctta cacacagagg 1260 attgaggtcc tggacaatac acagcagctg aaaatcctgg ctgacagcat caactcagag 1320 attggcatcc tgtgcagtgc cctgcagaag atcaagtaa 1359 <210> 412 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 412 atgtctactg ctgtcttgga aaatccagga ctgggcagga aactttcaga ttttggacaa 60 gaaacaagct acattgaaga taattgtaac caaaatggag ctatttcctt aatcttcagt 120 ctcaaagagg aagtaggtgc ccttgctaag gtactaagac tatttgaaga gaatgatgta 180 aacctcactc atatagagtc aaggcctagt aggctcaaga aagatgaata tgagttcttt 240 acccatttgg ataagagatc ccttccagcc ctcactaata tcataaaaat cctgaggcat 300 gatatagggg ccactgtaca tgaactaagt agggataaga aaaaagatac tgtgccatgg 360 tttccaagga ctatacaaga actagacagg tttgcaaacc aaattttgtc ctatggtgca 420 gagctagatg ctgaccatcc aggctttaag gatccagttt atagagccag aaggaaacag 480 tttgctgaca tagcttataa ctataggcat ggtcaaccca taccaagggt tgaatacatg 540 gaggaggaaa agaagacctg gggaactgta tttaaaaccc tgaaatctct gtacaagact 600 catgcttgtt atgagtataa ccatatcttc cccttgttag aaaagtattg tggatttcat 660 gaagataata ttccccagct tgaggatgta tcacagttct tacaaacctg tactggcttt 720 aggctaagac ctgtagcagg tttactgtcc tcaagagatt ttctgggggg gctagcattt 780 agggtttttc attgtacaca atacataagg catgggagta agcccatgta tacacctgag 840 ccagatatat gccatgaact gttaggccat gtacctttat tctcagatag aagctttgca 900 caattcagtc aagaaatagg gttggcatca ctaggagccc cagatgaata cattgaaaag 960 ctagcaacca tatattggtt tacagtagaa tttggattgt gcaagcaagg agactcaatc 1020 aaagcttatg gggctggact gctatcttcc tttggagaat tacagtattg tttgtctgag 1080 aaacccaaac tcttgccatt ggagttagag aagactgcca tacagaacta tactgttact 1140 gagttccaac ctctatacta tgttgcagaa tctttcaatg atgctaaaga gaaagttaga 1200 aactttgctg ctactatacc taggccattc agtgtcaggt atgatccata tacacaaaga 1260 atagaggttt tggataacac tcaacaactg aagatactag ctgattctat aaacagtgag 1320 attgggatac tatgcagtgc ccttcaaaag ataaaatag 1359 <210> 413 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 413 atgtccacag cagttttaga gaatccaggt ttaggtagaa agctctcaga ctttggtcaa 60 gagacaagct acattgagga taactgcaac cagaatggag ccatctccct tatcttcagc 120 ttgaaggagg aagtaggtgc acttgctaag gtactgagac tatttgaaga gaatgatgtt 180 aacctaactc atatagagtc aaggcctagt aggctcaaga aagatgaata tgagttcttt 240 acccatttgg ataagaggtc cttacctgcc ttaactaata tcataaaaat tctgaggcat 300 gacatagggg ccactgtgca tgaattgagt agggataaga aaaaagatac tgtgccatgg 360 tttccaagga ctattcaaga actagatagg tttgcaaacc aaattttgtc ctatggtgca 420 gagctagatg ctgatcatcc aggctttaag gatccagttt atagagccag aaggaaacaa 480 tttgctgaca tagcttataa ctataggcat ggtcaaccca taccaagggt tgaatatatg 540 gaagaagaaa agaaaacctg gggaactgtc tttaagacct taaaaagcct atacaaaact 600 catgcttgtt atgagtataa tcatatcttc ccactgttag aaaagtattg tggatttcat 660 gaagataata ttccccagct tgaggatgta tcacagttcc tgcaaacctg tacaggcttt 720 aggctaagac ctgtagcagg tttattgtcc tcaagagatt ttctgggggg gctagcattt 780 agggtttttc attgtacaca atacataagg catgggtcta agcccatgta tacacctgag 840 ccagatatat gccatgaact gttaggccat gtacctttat tctcagatag aagctttgca 900 caattcagtc aagaaatagg gttggcatca ctaggagccc cagatgaata cattgaaaag 960 ctagcaacta tatattggtt tacagtagaa tttggattgt gcaagcaagg agactcaatc 1020 aaagcttatg gggctggact gctatcttcc tttggagaat tacagtattg tttgtctgag 1080 aaacccaaac tcttgccatt ggagttagag aaaactgcca tacagaacta tactgttact 1140 gagttccaac ctctatacta tgttgcagaa tcttttaatg atgctaaaga gaaagttaga 1200 aactttgctg ctactatacc taggccattc agtgtcaggt atgatccata tacacaaaga 1260 atagaggttt tggataacac tcaacaactg aagatactag ctgattctat aaacagtgag 1320 atagggatac tatgttcagc ccttcaaaag ataaaatag 1359 <210> 414 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 414 atgtccacag cagttttaga gaatccaggt ttaggtagaa agctctcaga ctttggtcaa 60 gagacaagct acattgaaga caactgcaac cagaatggag ccatctccct tatcttcagc 120 ttgaaagaag aggtgggtgc tttggccaag gtgctgagac tgtttgaaga aaatgatgtc 180 aacctcactc acattgagtc aaggccttca agattgaaga aagatgagta tgaattcttc 240 acacatttgg ataagaggtc cctgccagcc ctgaccaaca tcatcaaaat tctgaggcat 300 gatattgggg ccacagtcca tgaactcagc agggacaaga aaaaagatac tgtgccctgg 360 tttccaagaa ccatccagga gctggacagg tttgccaatc agatcttatc ctatggggct 420 gagttggatg cagaccaccc aggcttcaag gatcctgtgt acagagctag aaggaaacaa 480 tttgcagaca ttgcttacaa ctataggcat ggtcagccca tccccagggt ggaatacatg 540 gaggaggaaa agaagacctg gggaactgta tttaaaaccc tgaaatctct gtataaaact 600 catgcctgct atgagtacaa tcacatcttt ccactcttgg agaaatactg tgggttccat 660 gaggacaata ttccccagct ggaggatgtg tctcagttcc tgcagacctg cactggtttt 720 aggctgagac ctgtagcagg tttgctatcc tcaagagact tcctgggggg cctagcattt 780 agggttttcc actgcaccca gtacatcaga catgggtcaa aacccatgta cacccctgag 840 ccagacatct gccatgagct cctgggccat gtgcctctct tctcagacag atcttttgca 900 cagtttagcc aggaaatagg cttggcctcc ttgggtgcac cagatgaata tatagaaaaa 960 ctagctacaa tctattggtt cactgttgaa tttggcttgt gcaagcaggg agactcaatc 1020 aaggcttatg gagctggttt gcttagctcc tttggggagc tgcaatactg cctttctgag 1080 aagcccaagt tgctgccact ggaattggag aagacagcca ttcagaacta cacagtgaca 1140 gagttccagc ctctgtatta tgtagcagaa agcttcaatg atgccaaaga gaaggttaga 1200 aattttgctg ctactattcc tagaccattc agtgtcaggt atgaccccta tactcagagg 1260 atagaggtgt tggacaacac tcagcagctc aagattctgg ctgacagtat caactcagaa 1320 attggaatcc tgtgttctgc ccttcagaag ataaaatag 1359 <210> 415 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 415 atgagcacag cagtcttaga aaatccaggc ctgggaagga agttgtctga ctttggccag 60 gagacctcct acattgagga caactgcaac cagaatgggg ccatctcctt gatcttcagc 120 ctgaaggaag aagttggagc attagctaag gttctaagac tatttgagga aaatgatgtg 180 aatttgactc atatagaatc taggcccagt aggctgaaaa aagatgaata tgaatttttt 240 actcacttag acaaaagatc tctgccagct ttaactaata ttatcaagat ccttagacat 300 gacattggag ctacagtaca tgagctttca agggataaaa agaaggatac agtcccatgg 360 tttccaagaa caatacagga gctagacaga tttgcaaatc aaatcctttc atatggggct 420 gagcttgatg ctgaccaccc aggcttcaaa gaccctgttt acagggccag aaggaaacaa 480 tttgcagata tagcatacaa ctacaggcat ggtcaaccca tccctagggt ggagtacatg 540 gaggaggaaa agaagacctg gggcacagtg ttcaagacac tgaagtccct gtacaagaca 600 catgcttgct atgaatataa tcacatcttc cctctcctgg agaaatactg tggctttcat 660 gaggacaaca taccacaatt ggaagatgta agtcaattct tgcagacatg cactggcttc 720 aggctgaggc ctgtggctgg tctactgagc tccagagact tcctgggagg cttggcattc 780 agggtcttcc actgcaccca gtatataagg catggctcca agcctatgta caccccagag 840 cctgacatct gccatgagtt attgggtcat gttcctctct tctctgatag aagctttgcc 900 cagttctccc aagagatagg tttagcatca ctaggggctc cagatgagta cattgagaag 960 ctagctacca tatattggtt tacagttgaa tttggtctat gcaagcaagg tgacagcata 1020 aaggcttatg gagctggcct cttgagctcc tttggagaat tacaatattg tttgtctgaa 1080 aaacccaaac tacttccttt agaacttgag aaaacagcta tacaaaacta tactgtaaca 1140 gagttccaac ctttatatta tgttgctgaa agtttcaatg atgctaaaga gaaggtgagg 1200 aattttgcag ctacaatacc tagaccattt agtgtaaggt atgatcctta tacccaaaga 1260 attgaagttt tggataatac acaacaacta aagatcttag ctgattcaat caatagtgaa 1320 attggtatcc tatgcagtgc tttacaaaag ataaaataa 1359 <210> 416 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 416 atgagcacag ctgtcttgga aaacccaggc ctgggcagga agttgtctga ctttggccag 60 gagacctcct acattgagga caactgcaac cagaatgggg ccatctcctt gatcttcagc 120 ctgaaggagg aggtgggagc cctggccaag gtcctgaggc tgtttgagga gaatgatgtg 180 aacctgaccc acattgagtc caggcccagt aggctgaaga aggatgagta tgagttcttc 240 acccacctgg acaagagatc cctgccagct ctgaccaaca tcattaagat cctgagacat 300 gacattgggg ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccctgg 360 ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 420 gagctggatg cagaccaccc tggcttcaag gacccagtgt acagggccag aaggaagcag 480 tttgctgaca ttgcctacaa ctacaggcat ggccagccca tcccaagggt ggagtacatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagacac tgaagtccct gtacaagacc 600 catgcttgct atgagtataa ccacatcttc cctctcctgg agaaatactg tggcttccat 660 gaggacaaca tccctcagct ggaggatgtg agtcagttcc tgcagacctg cactggcttc 720 aggctgaggc ctgtggcagg actcctgagc agcagggact tcctgggagg cttggccttc 780 agggtgttcc actgcaccca gtatatcagg catggctcca agcctatgta caccccagag 840 cctgacatct gccatgagct gctggggcat gtgcccctgt tctctgacag gagctttgcc 900 cagttcagcc aggagattgg cctggcctcc ctgggggctc ctgatgagta cattgagaag 960 ctggctacca tctactggtt tacagtggag tttgggctgt gcaagcaggg ggacagcatc 1020 aaggcctatg gggctgggct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080 aagcccaagc tcctccccct ggagctggag aagactgcca tccagaacta cactgtgaca 1140 gagttccagc ccctgtacta tgtggcagag tccttcaatg atgccaagga gaaggtgagg 1200 aactttgctg ccaccatccc caggcccttc tcagtgagat atgaccccta cacccagagg 1260 attgaggtgc tggacaacac ccagcagctg aagatcctgg cagacagcat caactctgag 1320 attggaatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 417 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 417 atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420 tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480 ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540 gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600 aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660 tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720 cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780 tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840 tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900 tttaaacaaa tgcatcttat cctgtaggag acctcctaca ttgaggacaa ctgcaaccag 960 aatggagcca tcagcctgat cttcagcctg aaggaggagg tgggagccct ggccaaggtg 1020 ctgagactgt ttgaggagaa tgatgtgaac ctgacccaca ttgagtccag accctccaga 1080 ctgaagaagg atgagtatga gttcttcacc cacctggaca agagatccct gcctgctctg 1140 accaacatca tcaagatcct gagacatgat attggagcca cagtgcatga gctgagcagg 1200 gacaagaaga aggacacagt gccttggttc cccagaacca tccaggagct ggacaggttt 1260 gccaaccaga tcctgtccta tggagctgag ctggatgctg accaccctgg atttaaggat 1320 cctgtgtaca gggccagaag gaagcagttt gctgacattg cctacaacta caggcatggc 1380 cagcccatcc ccagggtgga gtacatggag gaggagaaga agacctgggg cactgtgttc 1440 aagaccctga agagcctgta caagacccat gcctgctatg agtacaacca catcttcccc 1500 ctgctggaga agtactgtgg cttccatgag gacaacatcc ctcagctgga ggatgtgtcc 1560 cagttcctgc agacctgcac aggcttcaga ctgagacctg tggctggcct gctgtctagc 1620 agagacttcc tgggaggcct ggccttcaga gtgttccact gcacccagta catcagacat 1680 ggaagcaagc ccatgtacac ccctgagcca gacatctgcc atgagctgct gggccatgtg 1740 cccctgttct ctgatagatc ctttgcccag ttcagccagg agattggcct ggccagcctg 1800 ggagcccctg atgagtacat tgagaagctg gccaccatct actggttcac agtggagttt 1860 ggcctgtgca agcagggaga ctccatcaag gcctatggag ctggactgct gtcctccttt 1920 ggagagctgc agtactgcct gtctgagaag cccaagctgc tgcccctgga gctggagaag 1980 acagccatcc agaactacac agtgacagag ttccagcccc tgtactatgt ggctgagagc 2040 ttcaatgatg ccaaggagaa ggtgagaaac tttgctgcca ccatccccag acccttctct 2100 gtgaggtatg acccctacac ccagaggatt gaggtgctgg acaacaccca gcagctgaag 2160 atcctggctg actccatcaa ctctgagatt ggcatcctgt gctctgccct gcagaagatc 2220 aagtaa 2226 <210> 418 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 418 atgagtacag cagtgttaga gaatccaggc ttgggcagga aactctctga ctttggacag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420 tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480 ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540 gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600 aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660 tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720 cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780 tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840 tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900 tttaaacaaa tgcatcttat cctgtaggaa acaagctata ttgaagacaa ctgcaatcaa 960 aatggagcca tcagcctgat cttcagcctg aaggaggagg tgggagccct ggccaaggtg 1020 ctgagactgt ttgaggagaa tgatgtgaac ctgacccaca ttgagtccag accctccaga 1080 ctgaagaagg atgagtatga gttcttcacc cacctggaca agagatccct gcctgctctg 1140 accaacatca tcaagatcct gagacatgat attggagcca cagtgcatga gctgagcagg 1200 gacaagaaga aggacacagt gccttggttc cccagaacca tccaggagct ggacaggttt 1260 gccaaccaga tcctgtccta tggagctgag ctggatgctg accaccctgg atttaaggat 1320 cctgtgtaca gggccagaag gaagcagttt gctgacattg cctacaacta caggcatggc 1380 cagcccatcc ccagggtgga gtacatggag gaggagaaga agacctgggg cactgtgttc 1440 aagaccctga agagcctgta caagacccat gcctgctatg agtacaacca catcttcccc 1500 ctgctggaga agtactgtgg cttccatgag gacaacatcc ctcagctgga ggatgtgtcc 1560 cagttcctgc agacctgcac aggcttcaga ctgagacctg tggctggcct gctgtctagc 1620 agagacttcc tgggaggcct ggccttcaga gtgttccact gcacccagta catcagacat 1680 ggaagcaagc ccatgtacac ccctgagcca gacatctgcc atgagctgct gggccatgtg 1740 cccctgttct ctgatagatc ctttgcccag ttcagccagg agattggcct ggccagcctg 1800 ggagcccctg atgagtacat tgagaagctg gccaccatct actggttcac agtggagttt 1860 ggcctgtgca agcagggaga ctccatcaag gcctatggag ctggactgct gtcctccttt 1920 ggagagctgc agtactgcct gtctgagaag cccaagctgc tgcccctgga gctggagaag 1980 acagccatcc agaactacac agtgacagag ttccagcccc tgtactatgt ggctgagagc 2040 ttcaatgatg ccaaggagaa ggtgagaaac tttgctgcca ccatccccag acccttctct 2100 gtgaggtatg acccctacac ccagaggatt gaggtgctgg acaacaccca gcagctgaag 2160 atcctggctg actccatcaa ctctgagatt ggcatcctgt gctctgccct gcagaagatc 2220 aagtaa 2226 <210> 419 <211> 2179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 419 atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60 gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120 tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180 gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240 aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300 ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360 acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420 ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480 aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540 gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600 tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660 ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720 atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780 acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840 gctgtgaaaa acattttaac caagtgatct aattatgtag gagacctcct acattgagga 900 caactgcaac cagaatggag ccatcagcct gatcttcagc ctgaaggagg aggtgggagc 960 cctggccaag gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc 1020 cagaccctcc agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc 1080 cctgcctgct ctgaccaaca tcatcaagat cctgagacat gatattggag ccacagtgca 1140 tgagctgagc agggacaaga agaaggacac agtgccttgg ttccccagaa ccatccagga 1200 gctggacagg tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc 1260 tggatttaag gatcctgtgt acagggccag aaggaagcag tttgctgaca ttgcctacaa 1320 ctacaggcat ggccagccca tccccagggt ggagtacatg gaggaggaga agaagacctg 1380 gggcactgtg ttcaagaccc tgaagagcct gtacaagacc catgcctgct atgagtacaa 1440 ccacatcttc cccctgctgg agaagtactg tggcttccat gaggacaaca tccctcagct 1500 ggaggatgtg tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg 1560 cctgctgtct agcagagact tcctgggagg cctggccttc agagtgttcc actgcaccca 1620 gtacatcaga catggaagca agcccatgta cacccctgag ccagacatct gccatgagct 1680 gctgggccat gtgcccctgt tctctgatag atcctttgcc cagttcagcc aggagattgg 1740 cctggccagc ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt 1800 cacagtggag tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggact 1860 gctgtcctcc tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct 1920 ggagctggag aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta 1980 tgtggctgag agcttcaatg atgccaagga gaaggtgaga aactttgctg ccaccatccc 2040 cagacccttc tctgtgaggt atgaccccta cacccagagg attgaggtgc tggacaacac 2100 ccagcagctg aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc 2160 cctgcagaag atcaagtaa 2179 <210> 420 <211> 2179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 420 atgagtacag cagtgttaga gaatccaggc ttgggcagga aactctctga ctttggacag 60 gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120 tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180 gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240 aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300 ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360 acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420 ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480 aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540 gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600 tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660 ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720 atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780 acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840 gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct atattgaaga 900 caactgcaat caaaatggag ccatcagcct gatcttcagc ctgaaggagg aggtgggagc 960 cctggccaag gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc 1020 cagaccctcc agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc 1080 cctgcctgct ctgaccaaca tcatcaagat cctgagacat gatattggag ccacagtgca 1140 tgagctgagc agggacaaga agaaggacac agtgccttgg ttccccagaa ccatccagga 1200 gctggacagg tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc 1260 tggatttaag gatcctgtgt acagggccag aaggaagcag tttgctgaca ttgcctacaa 1320 ctacaggcat ggccagccca tccccagggt ggagtacatg gaggaggaga agaagacctg 1380 gggcactgtg ttcaagaccc tgaagagcct gtacaagacc catgcctgct atgagtacaa 1440 ccacatcttc cccctgctgg agaagtactg tggcttccat gaggacaaca tccctcagct 1500 ggaggatgtg tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg 1560 cctgctgtct agcagagact tcctgggagg cctggccttc agagtgttcc actgcaccca 1620 gtacatcaga catggaagca agcccatgta cacccctgag ccagacatct gccatgagct 1680 gctgggccat gtgcccctgt tctctgatag atcctttgcc cagttcagcc aggagattgg 1740 cctggccagc ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt 1800 cacagtggag tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggact 1860 gctgtcctcc tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct 1920 ggagctggag aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta 1980 tgtggctgag agcttcaatg atgccaagga gaaggtgaga aactttgctg ccaccatccc 2040 cagacccttc tctgtgaggt atgaccccta cacccagagg attgaggtgc tggacaacac 2100 ccagcagctg aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc 2160 cctgcagaag atcaagtaa 2179 <210> 421 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 421 atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg agacctccta 300 cattgaggac aactgcaacc agaatggagc catcagcctg atcttcagcc tgaaggagga 360 ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420 cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480 caagagatcc ctgcctgctc tgaccaacat catcaagatc ctgagacatg atattggagc 540 cacagtgcat gagctgagca gggacaagaa gaaggacaca gtgccttggt tccccagaac 600 catccaggag ctggacaggt ttgccaacca gatcctgtcc tatggagctg agctggatgc 660 tgaccaccct ggatttaagg atcctgtgta cagggccaga aggaagcagt ttgctgacat 720 tgcctacaac tacaggcatg gccagcccat ccccagggtg gagtacatgg aggaggagaa 780 gaagacctgg ggcactgtgt tcaagaccct gaagagcctg tacaagaccc atgcctgcta 840 tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900 ccctcagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960 tgtggctggc ctgctgtcta gcagagactt cctgggaggc ctggccttca gagtgttcca 1020 ctgcacccag tacatcagac atggaagcaa gcccatgtac acccctgagc cagacatctg 1080 ccatgagctg ctgggccatg tgcccctgtt ctctgataga tcctttgccc agttcagcca 1140 ggagattggc ctggccagcc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200 ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260 agctggactg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320 gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380 cctgtactat gtggctgaga gcttcaatga tgccaaggag aaggtgagaa actttgctgc 1440 caccatcccc agacccttct ctgtgaggta tgacccctac acccagagga ttgaggtgct 1500 ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560 gtgctctgcc ctgcagaaga tcaagtaa 1588 <210> 422 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 422 atgagtacag cagtgttaga gaatccaggc ttgggcagga aactctctga ctttggacag 60 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300 tattgaagac aactgcaatc aaaatggagc catcagcctg atcttcagcc tgaaggagga 360 ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420 cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480 caagagatcc ctgcctgctc tgaccaacat catcaagatc ctgagacatg atattggagc 540 cacagtgcat gagctgagca gggacaagaa gaaggacaca gtgccttggt tccccagaac 600 catccaggag ctggacaggt ttgccaacca gatcctgtcc tatggagctg agctggatgc 660 tgaccaccct ggatttaagg atcctgtgta cagggccaga aggaagcagt ttgctgacat 720 tgcctacaac tacaggcatg gccagcccat ccccagggtg gagtacatgg aggaggagaa 780 gaagacctgg ggcactgtgt tcaagaccct gaagagcctg tacaagaccc atgcctgcta 840 tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900 ccctcagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960 tgtggctggc ctgctgtcta gcagagactt cctgggaggc ctggccttca gagtgttcca 1020 ctgcacccag tacatcagac atggaagcaa gcccatgtac acccctgagc cagacatctg 1080 ccatgagctg ctgggccatg tgcccctgtt ctctgataga tcctttgccc agttcagcca 1140 ggagattggc ctggccagcc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200 ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260 agctggactg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320 gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380 cctgtactat gtggctgaga gcttcaatga tgccaaggag aaggtgagaa actttgctgc 1440 caccatcccc agacccttct ctgtgaggta tgacccctac acccagagga ttgaggtgct 1500 ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560 gtgctctgcc ctgcagaaga tcaagtaa 1588 <210> 423 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 423 atgagtacag cagtgttaga gaatccaggc ttgggcagga aactctctga ctttggacag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300 tattgaagac aactgcaatc aaaatggagc catcagcctg atcttcagcc tgaaggagga 360 ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420 cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480 caagagatcc ctgcctgctc tgaccaacat catcaagatc ctgagacatg atattggagc 540 cacagtgcat gagctgagca gggacaagaa gaaggacaca gtgccttggt tccccagaac 600 catccaggag ctggacaggt ttgccaacca gatcctgtcc tatggagctg agctggatgc 660 tgaccaccct ggatttaagg atcctgtgta cagggccaga aggaagcagt ttgctgacat 720 tgcctacaac tacaggcatg gccagcccat ccccagggtg gagtacatgg aggaggagaa 780 gaagacctgg ggcactgtgt tcaagaccct gaagagcctg tacaagaccc atgcctgcta 840 tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900 ccctcagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960 tgtggctggc ctgctgtcta gcagagactt cctgggaggc ctggccttca gagtgttcca 1020 ctgcacccag tacatcagac atggaagcaa gcccatgtac acccctgagc cagacatctg 1080 ccatgagctg ctgggccatg tgcccctgtt ctctgataga tcctttgccc agttcagcca 1140 ggagattggc ctggccagcc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200 ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260 agctggactg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320 gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380 cctgtactat gtggctgaga gcttcaatga tgccaaggag aaggtgagaa actttgctgc 1440 caccatcccc agacccttct ctgtgaggta tgacccctac acccagagga ttgaggtgct 1500 ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560 gtgctctgcc ctgcagaaga tcaagtaa 1588 <210> 424 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 424 atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420 tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480 ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540 gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600 aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660 tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720 cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780 tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840 tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900 tttaaacaaa tgcatcttat cctgtaggag acctcctaca ttgaggacaa ctgcaaccag 960 aatggagcca tctccctgat cttctccctg aaggaggagg tgggagccct ggccaaggtg 1020 ctgagactgt ttgaggagaa tgatgtgaac ctgacccaca ttgagtccag accctccaga 1080 ctgaagaagg atgagtatga gttcttcacc cacctggaca agagatccct gcctgccctg 1140 accaacatca tcaagatcct gagacatgac attggagcca cagtgcatga gctgtccaga 1200 gacaagaaga aggacacagt gccctggttc cccagaacca tccaggagct ggacagattt 1260 gccaaccaga tcctgtccta tggagctgag ctggatgctg accaccctgg cttcaaggac 1320 cctgtgtaca gggccagaag aaagcagttt gctgacattg cctacaacta cagacatggc 1380 cagcccatcc ccagagtgga gtacatggag gaggagaaga agacctgggg cacagtgttc 1440 aagaccctga agtccctgta caagacccat gcctgctatg agtacaacca catcttcccc 1500 ctgctggaga agtactgtgg cttccatgag gacaacatcc cccagctgga ggatgtgtcc 1560 cagttcctgc agacctgcac aggcttcaga ctgagacctg tggctggcct gctgtcctcc 1620 agagacttcc tgggaggcct ggccttcaga gtgttccact gcacccagta catcagacat 1680 ggctccaagc ccatgtacac ccctgagcct gacatctgcc atgagctgct gggccatgtg 1740 cccctgttct ctgacagatc ctttgcccag ttctcccagg agattggcct ggcctccctg 1800 ggagcccctg atgagtacat tgagaagctg gccaccatct actggttcac agtggagttt 1860 ggcctgtgca agcagggaga ctccatcaag gcctatggag ctggcctgct gtcctccttt 1920 ggagagctgc agtactgcct gtctgagaag cccaagctgc tgcccctgga gctggagaag 1980 acagccatcc agaactacac agtgacagag ttccagcccc tgtactatgt ggctgagtcc 2040 ttcaatgatg ccaaggagaa ggtcagaaac tttgctgcca ccatccccag acccttctct 2100 gtgagatatg acccctacac ccagagaatt gaggtgctgg acaacaccca gcagctgaag 2160 atcctggctg actccatcaa ctctgagatt ggcatcctgt gctctgccct gcagaagatc 2220 aagtaa 2226 <210> 425 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 425 atgtccacag ctgtgctgga gaaccctggc ttgggcagga aactctctga ctttggacag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 420 tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480 ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540 gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600 aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660 tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720 cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780 tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840 tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 900 tttaaacaaa tgcatcttat cctgtaggaa acaagctata ttgaagacaa ctgcaatcaa 960 aatggagcca tctccctgat cttctccctg aaggaggagg tgggagccct ggccaaggtg 1020 ctgagactgt ttgaggagaa tgatgtgaac ctgacccaca ttgagtccag accctccaga 1080 ctgaagaagg atgagtatga gttcttcacc cacctggaca agagatccct gcctgccctg 1140 accaacatca tcaagatcct gagacatgac attggagcca cagtgcatga gctgtccaga 1200 gacaagaaga aggacacagt gccctggttc cccagaacca tccaggagct ggacagattt 1260 gccaaccaga tcctgtccta tggagctgag ctggatgctg accaccctgg cttcaaggac 1320 cctgtgtaca gggccagaag aaagcagttt gctgacattg cctacaacta cagacatggc 1380 cagcccatcc ccagagtgga gtacatggag gaggagaaga agacctgggg cacagtgttc 1440 aagaccctga agtccctgta caagacccat gcctgctatg agtacaacca catcttcccc 1500 ctgctggaga agtactgtgg cttccatgag gacaacatcc cccagctgga ggatgtgtcc 1560 cagttcctgc agacctgcac aggcttcaga ctgagacctg tggctggcct gctgtcctcc 1620 agagacttcc tgggaggcct ggccttcaga gtgttccact gcacccagta catcagacat 1680 ggctccaagc ccatgtacac ccctgagcct gacatctgcc atgagctgct gggccatgtg 1740 cccctgttct ctgacagatc ctttgcccag ttctcccagg agattggcct ggcctccctg 1800 ggagcccctg atgagtacat tgagaagctg gccaccatct actggttcac agtggagttt 1860 ggcctgtgca agcagggaga ctccatcaag gcctatggag ctggcctgct gtcctccttt 1920 ggagagctgc agtactgcct gtctgagaag cccaagctgc tgcccctgga gctggagaag 1980 acagccatcc agaactacac agtgacagag ttccagcccc tgtactatgt ggctgagtcc 2040 ttcaatgatg ccaaggagaa ggtcagaaac tttgctgcca ccatccccag acccttctct 2100 gtgagatatg acccctacac ccagagaatt gaggtgctgg acaacaccca gcagctgaag 2160 atcctggctg actccatcaa ctctgagatt ggcatcctgt gctctgccct gcagaagatc 2220 aagtaa 2226 <210> 426 <211> 2179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 426 atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60 gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120 tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180 gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240 aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300 ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360 acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420 ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480 aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540 gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600 tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660 ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720 atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780 acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840 gctgtgaaaa acattttaac caagtgatct aattatgtag gagacctcct acattgagga 900 caactgcaac cagaatggag ccatctccct gatcttctcc ctgaaggagg aggtgggagc 960 cctggccaag gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc 1020 cagaccctcc agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc 1080 cctgcctgcc ctgaccaaca tcatcaagat cctgagacat gacattggag ccacagtgca 1140 tgagctgtcc agagacaaga agaaggacac agtgccctgg ttccccagaa ccatccagga 1200 gctggacaga tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc 1260 tggcttcaag gaccctgtgt acagggccag aagaaagcag tttgctgaca ttgcctacaa 1320 ctacagacat ggccagccca tccccagagt ggagtacatg gaggaggaga agaagacctg 1380 gggcacagtg ttcaagaccc tgaagtccct gtacaagacc catgcctgct atgagtacaa 1440 ccacatcttc cccctgctgg agaagtactg tggcttccat gaggacaaca tcccccagct 1500 ggaggatgtg tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg 1560 cctgctgtcc tccagagact tcctgggagg cctggccttc agagtgttcc actgcaccca 1620 gtacatcaga catggctcca agcccatgta cacccctgag cctgacatct gccatgagct 1680 gctgggccat gtgcccctgt tctctgacag atcctttgcc cagttctccc aggagattgg 1740 cctggcctcc ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt 1800 cacagtggag tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggcct 1860 gctgtcctcc tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct 1920 ggagctggag aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta 1980 tgtggctgag tccttcaatg atgccaagga gaaggtcaga aactttgctg ccaccatccc 2040 cagacccttc tctgtgagat atgaccccta cacccagaga attgaggtgc tggacaacac 2100 ccagcagctg aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc 2160 cctgcagaag atcaagtaa 2179 <210> 427 <211> 2179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 427 atgtccacag ctgtgctgga gaaccctggc ttgggcagga aactctctga ctttggacag 60 gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120 tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180 gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240 aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300 ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360 acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 420 ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480 aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540 gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600 tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660 ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720 atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 780 acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 840 gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct atattgaaga 900 caactgcaat caaaatggag ccatctccct gatcttctcc ctgaaggagg aggtgggagc 960 cctggccaag gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc 1020 cagaccctcc agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc 1080 cctgcctgcc ctgaccaaca tcatcaagat cctgagacat gacattggag ccacagtgca 1140 tgagctgtcc agagacaaga agaaggacac agtgccctgg ttccccagaa ccatccagga 1200 gctggacaga tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc 1260 tggcttcaag gaccctgtgt acagggccag aagaaagcag tttgctgaca ttgcctacaa 1320 ctacagacat ggccagccca tccccagagt ggagtacatg gaggaggaga agaagacctg 1380 gggcacagtg ttcaagaccc tgaagtccct gtacaagacc catgcctgct atgagtacaa 1440 ccacatcttc cccctgctgg agaagtactg tggcttccat gaggacaaca tcccccagct 1500 ggaggatgtg tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg 1560 cctgctgtcc tccagagact tcctgggagg cctggccttc agagtgttcc actgcaccca 1620 gtacatcaga catggctcca agcccatgta cacccctgag cctgacatct gccatgagct 1680 gctgggccat gtgcccctgt tctctgacag atcctttgcc cagttctccc aggagattgg 1740 cctggcctcc ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt 1800 cacagtggag tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggcct 1860 gctgtcctcc tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct 1920 ggagctggag aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta 1980 tgtggctgag tccttcaatg atgccaagga gaaggtcaga aactttgctg ccaccatccc 2040 cagacccttc tctgtgagat atgaccccta cacccagaga attgaggtgc tggacaacac 2100 ccagcagctg aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc 2160 cctgcagaag atcaagtaa 2179 <210> 428 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 428 atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg agacctccta 300 cattgaggac aactgcaacc agaatggagc catctccctg atcttctccc tgaaggagga 360 ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420 cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480 caagagatcc ctgcctgccc tgaccaacat catcaagatc ctgagacatg acattggagc 540 cacagtgcat gagctgtcca gagacaagaa gaaggacaca gtgccctggt tccccagaac 600 catccaggag ctggacagat ttgccaacca gatcctgtcc tatggagctg agctggatgc 660 tgaccaccct ggcttcaagg accctgtgta cagggccaga agaaagcagt ttgctgacat 720 tgcctacaac tacagacatg gccagcccat ccccagagtg gagtacatgg aggaggagaa 780 gaagacctgg ggcacagtgt tcaagaccct gaagtccctg tacaagaccc atgcctgcta 840 tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900 cccccagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960 tgtggctggc ctgctgtcct ccagagactt cctgggaggc ctggccttca gagtgttcca 1020 ctgcacccag tacatcagac atggctccaa gcccatgtac acccctgagc ctgacatctg 1080 ccatgagctg ctgggccatg tgcccctgtt ctctgacaga tcctttgccc agttctccca 1140 ggagattggc ctggcctccc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200 ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260 agctggcctg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320 gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380 cctgtactat gtggctgagt ccttcaatga tgccaaggag aaggtcagaa actttgctgc 1440 caccatcccc agacccttct ctgtgagata tgacccctac acccagagaa ttgaggtgct 1500 ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560 gtgctctgcc ctgcagaaga tcaagtaa 1588 <210> 429 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 429 atgtccacag ctgtgctgga gaaccctggc ttgggcagga aactctctga ctttggacag 60 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300 tattgaagac aactgcaatc aaaatggagc catctccctg atcttctccc tgaaggagga 360 ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420 cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480 caagagatcc ctgcctgccc tgaccaacat catcaagatc ctgagacatg acattggagc 540 cacagtgcat gagctgtcca gagacaagaa gaaggacaca gtgccctggt tccccagaac 600 catccaggag ctggacagat ttgccaacca gatcctgtcc tatggagctg agctggatgc 660 tgaccaccct ggcttcaagg accctgtgta cagggccaga agaaagcagt ttgctgacat 720 tgcctacaac tacagacatg gccagcccat ccccagagtg gagtacatgg aggaggagaa 780 gaagacctgg ggcacagtgt tcaagaccct gaagtccctg tacaagaccc atgcctgcta 840 tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900 cccccagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960 tgtggctggc ctgctgtcct ccagagactt cctgggaggc ctggccttca gagtgttcca 1020 ctgcacccag tacatcagac atggctccaa gcccatgtac acccctgagc ctgacatctg 1080 ccatgagctg ctgggccatg tgcccctgtt ctctgacaga tcctttgccc agttctccca 1140 ggagattggc ctggcctccc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200 ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260 agctggcctg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320 gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380 cctgtactat gtggctgagt ccttcaatga tgccaaggag aaggtcagaa actttgctgc 1440 caccatcccc agacccttct ctgtgagata tgacccctac acccagagaa ttgaggtgct 1500 ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560 gtgctctgcc ctgcagaaga tcaagtaa 1588 <210> 430 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 430 atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg agacctccta 300 cattgaggac aactgcaacc agaatggagc catctccctg atcttctccc tgaaggagga 360 ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420 cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480 caagagatcc ctgcctgccc tgaccaacat catcaagatc ctgagacatg acattggagc 540 cacagtgcat gagctgtcca gagacaagaa gaaggacaca gtgccctggt tccccagaac 600 catccaggag ctggacagat ttgccaacca gatcctgtcc tatggagctg agctggatgc 660 tgaccaccct ggcttcaagg accctgtgta cagggccaga agaaagcagt ttgctgacat 720 tgcctacaac tacagacatg gccagcccat ccccagagtg gagtacatgg aggaggagaa 780 gaagacctgg ggcacagtgt tcaagaccct gaagtccctg tacaagaccc atgcctgcta 840 tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900 cccccagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960 tgtggctggc ctgctgtcct ccagagactt cctgggaggc ctggccttca gagtgttcca 1020 ctgcacccag tacatcagac atggctccaa gcccatgtac acccctgagc ctgacatctg 1080 ccatgagctg ctgggccatg tgcccctgtt ctctgacaga tcctttgccc agttctccca 1140 ggagattggc ctggcctccc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200 ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260 agctggcctg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320 gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380 cctgtactat gtggctgagt ccttcaatga tgccaaggag aaggtcagaa actttgctgc 1440 caccatcccc agacccttct ctgtgagata tgacccctac acccagagaa ttgaggtgct 1500 ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560 gtgctctgcc ctgcagaaga tcaagtaa 1588 <210> 431 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 431 atgtccacag ctgtgctgga gaaccctggc ttgggcagga aactctctga ctttggacag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300 tattgaagac aactgcaatc aaaatggagc catctccctg atcttctccc tgaaggagga 360 ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420 cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480 caagagatcc ctgcctgccc tgaccaacat catcaagatc ctgagacatg acattggagc 540 cacagtgcat gagctgtcca gagacaagaa gaaggacaca gtgccctggt tccccagaac 600 catccaggag ctggacagat ttgccaacca gatcctgtcc tatggagctg agctggatgc 660 tgaccaccct ggcttcaagg accctgtgta cagggccaga agaaagcagt ttgctgacat 720 tgcctacaac tacagacatg gccagcccat ccccagagtg gagtacatgg aggaggagaa 780 gaagacctgg ggcacagtgt tcaagaccct gaagtccctg tacaagaccc atgcctgcta 840 tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900 cccccagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960 tgtggctggc ctgctgtcct ccagagactt cctgggaggc ctggccttca gagtgttcca 1020 ctgcacccag tacatcagac atggctccaa gcccatgtac acccctgagc ctgacatctg 1080 ccatgagctg ctgggccatg tgcccctgtt ctctgacaga tcctttgccc agttctccca 1140 ggagattggc ctggcctccc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200 ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260 agctggcctg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320 gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380 cctgtactat gtggctgagt ccttcaatga tgccaaggag aaggtcagaa actttgctgc 1440 caccatcccc agacccttct ctgtgagata tgacccctac acccagagaa ttgaggtgct 1500 ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560 gtgctctgcc ctgcagaaga tcaagtaa 1588 <210> 432 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 432 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300 tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 360 agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 420 catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 480 caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 540 cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 600 catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 660 tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 720 cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 780 gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 840 cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 900 ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 960 agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 1020 ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 1080 ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 1140 agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 1200 ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 1260 cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 1320 gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 1380 tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 1440 caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 1500 ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 1560 gtgcagcgcc ctgcagaaaa tcaagtga 1588 <210> 433 <211> 2179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 433 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60 gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 120 tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 180 gccaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 240 aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 300 ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 360 acccaggtct tggatccata gcctagggat gtcccatttt tattgctttt tatattttgt 420 ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 480 aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 540 ctatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 600 tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 660 ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 720 atttctgatc acactgactt ccctgtggaa tacacctggt tcactgtgtt ccaaagctta 780 aggagcagaa aaaggttatg ctcctctctt cttgagaggt tttaagagaa taattgctaa 840 gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct atattgaaga 900 caactgcaat caaaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc 960 cctggccaag gtgctgagac tgttcgaaga gaacgacgtg aacctgacac acatcgagag 1020 cagacccagc agactgaaga aggacgagta cgagttcttc acccacctgg acaagcggag 1080 cctgcctgct ctgaccaaca tcatcaagat cctgcggcac gacatcggcg ccacagtgca 1140 cgaactgagc cgggacaaga aaaaggacac cgtgccatgg ttccccagaa ccatccaaga 1200 gctggacaga ttcgccaacc agatcctgag ctatggcgcc gagctggacg ctgatcaccc 1260 tggctttaag gaccccgtgt accgggccag aagaaagcag tttgccgata tcgcctacaa 1320 ctaccggcac ggccagccta ttcctcgggt cgagtacatg gaagaggaaa agaaaacctg 1380 gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc cacgcctgct acgagtacaa 1440 ccacatcttc ccactgctcg aaaagtactg cggcttccac gaggacaata tccctcagct 1500 tgaggacgtg tcccagttcc tgcagacctg caccggcttt agactgaggc cagttgccgg 1560 actgctgagc agcagagatt ttctcggcgg cctggccttc agagtgttcc actgtaccca 1620 gtacatcaga cacggcagca agcccatgta cacccctgag cctgatatct gccacgagct 1680 gctgggacat gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc aagagatcgg 1740 actggcttct ctgggagccc ctgacgagta cattgagaag ctggccacca tctactggtt 1800 caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg gcgctggcct 1860 gctgtctagc ttcggcgagc tgcagtactg tctgagcgag aagcctaagc tgctgcccct 1920 ggaactggaa aagaccgcca tccagaacta caccgtgacc gagttccagc ctctgtacta 1980 cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg ccaccattcc 2040 tcggcctttc agcgtcagat acgaccccta cacacagcgg atcgaggtgc tggacaacac 2100 acagcagctg aaaattctgg ccgactccat caacagcgag atcggcatcc tgtgcagcgc 2160 cctgcagaaa atcaagtga 2179 <210> 434 <211> 2226 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 434 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 240 ggagaacatc tgtcctcggt ggctttcaca ggaatgaatg accattgctt tagggggttg 300 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 360 ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttacgat 420 tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 480 ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 540 gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 600 aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 660 tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 720 cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 780 tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 840 tcatgcttgc tttgtccatg gaggtttaac aggaatgaat tgctaaactg tggaaaatgt 900 tttaaacaaa tgcatcttat cctgtaggaa acaagctata ttgaagacaa ctgcaatcaa 960 aacggcgcca tcagcctgat cttcagcctg aaagaagaag tgggcgccct ggccaaggtg 1020 ctgagactgt tcgaagagaa cgacgtgaac ctgacacaca tcgagagcag acccagcaga 1080 ctgaagaagg acgagtacga gttcttcacc cacctggaca agcggagcct gcctgctctg 1140 accaacatca tcaagatcct gcggcacgac atcggcgcca cagtgcacga actgagccgg 1200 gacaagaaaa aggacaccgt gccatggttc cccagaacca tccaagagct ggacagattc 1260 gccaaccaga tcctgagcta tggcgccgag ctggacgctg atcaccctgg ctttaaggac 1320 cccgtgtacc gggccagaag aaagcagttt gccgatatcg cctacaacta ccggcacggc 1380 cagcctattc ctcgggtcga gtacatggaa gaggaaaaga aaacctgggg caccgtgttc 1440 aagaccctga agtccctgta caagacccac gcctgctacg agtacaacca catcttccca 1500 ctgctcgaaa agtactgcgg cttccacgag gacaatatcc ctcagcttga ggacgtgtcc 1560 cagttcctgc agacctgcac cggctttaga ctgaggccag ttgccggact gctgagcagc 1620 agagattttc tcggcggcct ggccttcaga gtgttccact gtacccagta catcagacac 1680 ggcagcaagc ccatgtacac ccctgagcct gatatctgcc acgagctgct gggacatgtg 1740 cccctgttca gcgatagaag cttcgcccag ttcagccaag agatcggact ggcttctctg 1800 ggagcccctg acgagtacat tgagaagctg gccaccatct actggttcac cgtggaattc 1860 ggcctgtgca agcagggcga cagcatcaaa gcttatggcg ctggcctgct gtctagcttc 1920 ggcgagctgc agtactgtct gagcgagaag cctaagctgc tgcccctgga actggaaaag 1980 accgccatcc agaactacac cgtgaccgag ttccagcctc tgtactacgt ggccgagagc 2040 ttcaacgacg ccaaagaaaa agtgcggaac ttcgccgcca ccattcctcg gcctttcagc 2100 gtcagatacg acccctacac acagcggatc gaggtgctgg acaacacaca gcagctgaaa 2160 attctggccg actccatcaa cagcgagatc ggcatcctgt gcagcgccct gcagaaaatc 2220 aagtga 2226 <210> 435 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 435 atgtcaactg cagtgttaga gaacccaggc cttggtagaa agctttcaga ctttggacaa 60 gaaaccagct acattgaaga taactgcaac cagaatggtg ccatctccct gatcttcagc 120 ctgaaggaag aagtgggagc cctggccaag gtcctgaggc tctttgaaga gaatgatgtg 180 aacctcaccc acattgagtc cagacccagc aggctcaaga aggatgagta tgaattcttc 240 acccacctgg ataagaggtc cctccctgcc ctcaccaaca tcatcaagat cctgagacat 300 gacattgggg ccactgtcca tgaactgtcc agggacaaga agaaggacac tgtgccctgg 360 ttcccaagga ccatccagga actggacaga tttgccaacc aaatcctgtc ctatggtgct 420 gagctggatg ctgaccaccc tggattcaag gaccctgtgt acagagccag aaggaaacag 480 tttgcagaca ttgcctacaa ctacagacat gggcagccta tcccaagagt ggagtacatg 540 gaagaagaga agaaaacctg gggcactgtg ttcaagaccc ttaagtccct gtacaagacc 600 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660 gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacttg cactgggttc 720 aggctgaggc ctgtggctgg cctgctgagc tccagagact tcttgggtgg actggccttc 780 agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 840 cctgacatct gtcatgaact cctgggccat gtgcccttgt tcagtgacag aagctttgcc 900 cagttcagcc aggaaattgg ccttgcctcc ctgggagccc ctgatgagta cattgaaaag 960 ctagccacca tctactggtt cactgtggaa tttggcttgt gcaaacaggg agactccatc 1020 aaggcctatg gagctggact gctgtcctcc tttggggaac tgcagtactg cctctctgag 1080 aagcccaagc tcctgcccct ggaactggag aaaacagcca tccagaacta cactgtcact 1140 gagttccagc ccctctacta tgtggcagag agcttcaatg atgccaagga aaaagtcaga 1200 aactttgctg ccaccatccc aaggccattc tcagtcagat atgaccccta cacccaaagg 1260 attgaagtgc tggacaacac ccagcagctc aagatcttgg cagactccat aaactcagag 1320 attggaatcc tgtgctctgc cctgcaaaag attaagtaa 1359 <210> 436 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 436 atgtcaactg ctgtgctgga aaaccctgga ttaggaagaa agctctcaga ctttggtcaa 60 gaaacctcct acattgagga caactgcaac cagaatggtg ccatctccct catcttctcc 120 ctgaaagagg aagtgggagc cctggccaag gtcctgaggc tctttgagga aaatgatgtc 180 aacctgaccc acattgagtc caggcccagc agactgaaga aggatgagta tgaattcttc 240 acccacctgg acaagagaag cctccctgcc ctcaccaaca tcatcaagat cctcagacat 300 gacattggag ccactgtgca tgaactcagc agagacaaga agaaggacac tgtgccatgg 360 ttccctagga ccatccagga actggatagg tttgccaacc aaatcctctc ctatggagca 420 gagctggatg cagaccaccc tggattcaag gacccagtgt acagggccag gaggaaacag 480 tttgcagaca ttgcctacaa ctacagacat ggccagccca tccctagagt ggagtacatg 540 gaagaagaga agaaaacctg gggcactgtg ttcaagaccc tgaagtccct gtacaagacc 600 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660 gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacttg cactggattc 720 aggcttagac ctgtggctgg cctgttgagc agcagagact tcctgggagg gctggccttc 780 agagtgttcc actgtaccca gtacatcaga catggctcca agcccatgta cacccctgag 840 cctgacatct gccatgaatt gcttggccat gtgcccctgt tcagtgatag atcctttgcc 900 caattctccc aagaaattgg cctggccagc cttggagccc ctgatgagta cattgaaaag 960 cttgccacca tctactggtt cactgtggaa tttggcctgt gcaaacaggg ggactccata 1020 aaggcctatg gtgctggact gctgtcctcc tttggggaac tgcagtactg cttgtcagag 1080 aagcccaagt tgctgcccct ggaactggaa aagacagcca tccagaacta cactgtcact 1140 gagttccagc ccctctacta tgtggcagag agcttcaatg atgccaagga aaaagtcaga 1200 aactttgctg ccaccatccc aaggccattc tcagtcagat atgacccata cacccagagg 1260 attgaagtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactcagag 1320 attgggatcc tgtgctctgc cctccaaaag attaagtaa 1359 <210> 437 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 437 atgtccactg ctgtccttga aaaccctggc cttggtagaa agctctctga ttttggacaa 60 gaaaccagct acattgagga caactgcaac cagaatggtg ccatctcact aatcttcagc 120 ctgaaggaag aagtgggagc cctggccaag gtcttgagac tctttgagga aaatgatgtc 180 aacctcaccc acattgagtc caggccatcc agactcaaga aggatgagta tgaattcttc 240 acccacctgg acaagaggtc cttgcctgcc ctcacaaaca tcatcaagat cctgagacat 300 gacattgggg ccactgtgca tgagctgtcc agagacaaga aaaaggacac tgtgccttgg 360 ttcccaagaa ccatccagga actggacaga tttgccaacc aaatcctgag ctatggggct 420 gagttggatg cagaccaccc tggattcaag gacccagtgt acagggccag gagaaagcag 480 tttgcagaca ttgcctacaa ctacagacat ggccagccca tcccaagggt ggagtacatg 540 gaagaggaaa agaaaacctg gggcactgtg ttcaagaccc tgaagtccct gtacaagacc 600 catgcctgct atgagtacaa ccacatcttc cccctcctgg aaaagtactg tggcttccat 660 gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacctg tactgggttc 720 aggctgaggc ctgtggctgg actgctgagc tccagggact tcctgggtgg actggccttc 780 agggtgttcc actgcaccca gtacatcaga catggatcca agcccatgta cacccctgag 840 cctgacattt gccatgaact gctgggccat gtgcccttgt tcagtgatag aagctttgcc 900 cagttctccc aagaaattgg cctggcctcc ctgggagccc ctgatgagta cattgaaaag 960 cttgccacca tctactggtt cactgtggaa tttggcctgt gcaaacaggg agactccatc 1020 aaggcctatg gagctgggct cctgagctcc tttggagagc tccagtactg cctgtcagag 1080 aagcccaagc tcctgcccct ggaacttgaa aagactgcca tccagaacta cactgtgact 1140 gagttccagc ccctgtacta tgtggcagag tccttcaatg atgccaagga aaaagtcaga 1200 aactttgctg ccaccatccc aagacccttc tctgtgagat atgaccccta cacccaaagg 1260 attgaagtcc tggacaacac ccagcagctg aagatcctgg cagacagcat caactcagag 1320 ataggcatcc tgtgctcagc cctccaaaag attaagtaa 1359 <210> 438 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 438 atgagcactg ctgtccttga aaaccctggc cttggaagaa agctctctga ctttggacaa 60 gaaacctcct acattgagga caactgcaac cagaatggtg ccatctccct catcttctcc 120 ctgaaagagg aagtgggagc cctggccaag gtcctgaggc tctttgaaga gaatgatgtg 180 aacctcaccc acattgagtc cagacccagc aggctcaaga aagatgagta tgaattcttc 240 acccacctgg acaagagatc cttgcctgcc ctcaccaaca tcatcaagat cctgagacat 300 gacattggag ccactgtgca tgaactgtcc agggacaaga agaaggacac tgtgccctgg 360 ttcccaagga ccatccagga acttgacaga tttgccaacc aaatcctgtc ctatggtgct 420 gagctggatg cagaccaccc tggattcaag gacccagtgt acagagccag gagaaagcag 480 tttgctgaca tagcctacaa ctacagacat ggccagccca ttccaagagt ggagtacatg 540 gaagaagaga agaaaacctg ggggactgtg ttcaagaccc tgaagtccct gtacaagacc 600 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 660 gaggacaaca tcccccagct ggaagatgtg tcccagttcc tgcaaacttg cactgggttc 720 aggctcagac ctgtggctgg cttactgagc tccagggact tcctgggtgg actagccttc 780 agggtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 840 cctgatatct gccatgaact gctgggccat gtgcccttgt tcagtgacag aagctttgcc 900 cagttctccc aagaaattgg ccttgcctcc ctgggggccc ctgatgagta cattgaaaag 960 ctggccacca tctactggtt cactgtggaa tttggcttgt gcaaacaggg agactccatc 1020 aaggcctatg gggcaggact gctgagcagc tttggagagc tgcagtactg cctgtcagag 1080 aagcccaagc tcctgcccct ggaactggaa aagactgcca tccagaacta cactgtcact 1140 gagttccagc ccctctacta tgtggcagag tccttcaatg atgccaagga aaaagtcagg 1200 aactttgcag ccacaatccc tagaccattc tcagtcagat atgacccata cacccagagg 1260 attgaagtgc tggacaacac ccagcagctc aagatcttgg ctgatagcat caactcagag 1320 attggaatcc tgtgttcagc cctccaaaag attaagtaa 1359 <210> 439 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 439 atgtcaaccg ccgtgcttga aaatcctgga ctcggaagga aattgtcaga ctttggacaa 60 gaaacctcct atatcgagga caactgcaac cagaacggcg ccatctctct catcttttcg 120 ctgaaagaag aggtcggagc cctggccaag gtcctgagac tgttcgaaga gaatgacgtc 180 aacctcactc acatcgagtc ccgcccgtca cggctgaaga aagacgaata cgagttcttc 240 acccatctgg ataagcgctc gttgcctgcg ctgactaaca tcataaagat tctgcggcac 300 gacatcggcg cgactgtgca cgagctgagc cgggataaga agaaggacac tgtgccatgg 360 ttcccccgga ccattcaaga actggacaga ttcgcgaacc agattctgtc ctatggcgcc 420 gagctggacg ctgaccaccc cgggttcaag gaccctgtgt accgcgctag acgcaagcag 480 ttcgcagaca tcgcctacaa ctatcggcat gggcagccga ttccccgcgt cgagtacatg 540 gaagaagaga agaaaacctg gggtaccgtg ttcaagactc tgaagtcgct gtacaagacc 600 cacgcatgct acgagtacaa ccatatcttc ccgctcctcg agaagtactg cggtttccac 660 gaggataaca ttccccaatt ggaagatgtg tcccagttcc tgcaaacttg cacaggcttt 720 aggcttagac cggtggcggg cctcctgagc tcccgggatt tcctcggcgg actcgccttc 780 cgggtgttcc actgcactca gtacattcgg cacgggagca agccgatgta cacccccgaa 840 ccggatatct gtcatgaact tctgggacac gtgccactct tctccgaccg aagcttcgcg 900 cagttctccc aagaaatcgg actggcctcc ctgggtgccc ctgatgagta catcgaaaag 960 cttgccacca tctactggtt taccgtggag ttcggcctgt gcaaacaggg agacagcatc 1020 aaggcatacg gggccggcct gctgtcctcg ttcggagaac tgcagtactg cctgtcggag 1080 aagcccaagt tgctgcccct cgaactggag aaaacggcca tccagaacta caccgtgacc 1140 gagttccagc cgctgtacta cgtggccgaa agcttcaacg acgccaagga aaaggtccgc 1200 aactttgcgg ctaccatccc gaggcctttc tccgtgcgct acgacccata cactcagcgg 1260 atcgaagtgc tggataacac ccagcagctg aagatcctcg ccgactccat taactccgag 1320 attggaatcc tgtgttccgc tctgcaaaag attaagtga 1359 <210> 440 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 440 atgtcaaccg ccgtgctcga gaaccctgga cttggaagaa aactgtcaga cttcggacaa 60 gagacttctt acatcgagga taactgcaac cagaatggcg cgatttcgct gatattcagc 120 ctgaaggaag aggtcggagc cctggccaag gtcctgcggc ttttcgagga aaacgacgtg 180 aacctgactc acatcgagtc ccggccgagc agactcaaga aggacgaata cgaattcttc 240 acccatctcg ataagcgctc gctgccggcg cttactaaca ttatcaagat cctgcgccac 300 gatatcggag ccaccgtgca tgaactgtcg agggataaga aaaaggatac cgtgccgtgg 360 ttcccgagga ccatccagga actggaccgc ttcgctaacc aaatcttgag ctatggcgcg 420 gaactcgacg ctgaccaccc cgggttcaag gatcccgtgt accgggccag acgcaagcag 480 ttcgcagaca ttgcctacaa ctatcgacac ggccagccta ttccacgggt ggagtacatg 540 gaagaagaga aaaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagact 600 cacgcctgct acgagtacaa ccacatcttc cctctgctcg aaaagtactg cgggttccat 660 gaggacaaca tccctcagct cgaggacgtg tcacagttcc tgcaaacgtg cactggcttt 720 cggctgaggc cggtggccgg tctgctgagc tcaagggatt ttctgggcgg actggcgttc 780 cgcgtgttcc actgcaccca gtatatccgc catggtagca agcccatgta cactccggag 840 cctgacattt gccacgaact actgggacac gtgccgttgt ttagcgaccg gtcgtttgcc 900 caattctccc aagaaatcgg actggcctcc ctgggggcgc cagacgagta cattgaaaag 960 ctcgcaacca tctactggtt caccgtggaa ttcggactgt gcaaacaggg cgattcgatc 1020 aaggcctacg gcgccgggct cctgtcctcc ttcggtgaac tgcagtactg tctgtccgag 1080 aagcccaagc tcctgcccct cgagcttgaa aagacagcta tccagaacta cactgtcacc 1140 gagttccagc cactctacta cgtggccgag tccttcaatg acgccaagga aaaagtccgg 1200 aacttcgcgg caaccattcc tagacccttc tccgtgcgct acgacccgta cacccagcgg 1260 atcgaagtgc tggacaacac ccagcagttg aagatcctgg ccgactccat caactccgaa 1320 atcggtattt tgtgttccgc cctgcaaaag attaagtga 1359 <210> 441 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 441 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60 agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120 gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180 ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240 tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300 cccccgttgc ccctctggat ccactgctta aatacggacg aggacagg 348 <210> 442 <211> 202 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 442 gtctgtctgc acatttcgta gagcgagtgt tccgatactc taatctccct aggcaaggtt 60 catatttgtg taggttactt attctccttt tgttgactaa gtcaataatc agaatcagca 120 ggtttggagt cagcttggca gggatcagca gcctgggttg gaaggagggg gtataaaagc 180 cccttcacca ggagaagccg tc 202 <210> 443 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 443 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60 agtggtactc tcccagagac tgtctgactc atgccacccc ctccaccttg gacacaggac 120 actgtggttt ctgagccagg tacaatgact ccttttggta agtgcagtgg aagctgtaca 180 ctgcccaggc aaagtgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240 tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300 cccccgttgc ccctctggat ccactgctta aatacggacg aggacagg 348 <210> 444 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 444 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60 agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120 gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180 ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240 tagcccctgt ttgctcctct gataactggg gtgaccttgg ttaatattca ccagcagcct 300 cccctgttgc ccctctggat ccactgctta aatacggaca aggacagg 348 <210> 445 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 445 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60 agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120 gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180 ctgcccaggc aaagcgtctg ggcagcatag gcaggcgact cagatcccag ccagtggact 240 tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 300 cccccgttgc ccctctggat ccactgctta aatacggacg aggacagg 348 <210> 446 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 446 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60 agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 120 gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 180 ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 240 tagcccctgt ttgctcctct gataactggg gtgaccttgg ttaatattca ccagcagcct 300 cccccgttgc ccctctggat ccactgctta aatacagacg aggacagg 348 <210> 447 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 447 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 60 agtggtactc tcccagagac tgtctgactc atgccacccc ctccaccttg gacacaggac 120 actgtggttt ctgagccagg tacaatgact ccttttggta agtgcagtgg aagctgtaca 180 ctgcccaggc aaagtgtctg ggcagcatag gcaggtgact cagatcccag ccagtggact 240 tagcccctgt ttgctcctct gataactggg gtgaccttgg ttaatattca ccagcagcct 300 cccctgttgc ccctctggat ccactgctta aatacagaca aggacagg 348 <210> 448 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 448 gattctgcag tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc 60 acgccacccc ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact 120 cctttcggta agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag 180 gcgggcgact cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg 240 gtgaccttgg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta 300 aatacggacg aggacagg 318 <210> 449 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 449 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc ac 72 <210> 450 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 450 cactgggagg atgttgagta agatggaaaa ctactgatga cccttgcaga gacagagtat 60 taggacatgt ttgaacaggg gccgggcgat cagcaggtag 100 <210> 451 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 451 gttaatcatt aac 13 <210> 452 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 452 gcttgtactt tggtaca 17 <210> 453 <211> 770 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 453 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga 770 <210> 454 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 454 gcgagaactt gtgcctcccc gtgttcctgc tctttgtccc tctgtcctac ttagactaat 60 atttgccttg ggtactgcaa acaggaaatg ggggagggac aggagtaggg cggagggtag 120 <210> 455 <211> 770 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 455 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300 ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga 770 <210> 456 <211> 770 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 456 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc acttgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga 770 <210> 457 <211> 770 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 457 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720 ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga 770 <210> 458 <211> 770 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 458 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc acttgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300 ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360 taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720 ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga 770 <210> 459 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 459 ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60 tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaac 117 <210> 460 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 460 gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60 gttaatcatt aacgcttgta ctttggtaca 90 <210> 461 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 461 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg g 321 <210> 462 <211> 436 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 462 gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60 gttaatcatt aacgcttgta ctttggtaca atcgatgcga gaacttgtgc ctccccgtgt 120 tcctgctctt tgtccctctg tcctacttag actaatattt gccttgggta ctgcaaacag 180 gaaatggggg agggacagga gtagggcgga gggtagttaa gaatgtggat ccccgtctgt 240 ctgcacattt cgtagagcga gtgttccgat actctaatct ccctaggcaa ggttcatatt 300 tgtgtaggtt acttattctc cttttgttga ctaagtcaat aatcagaatc agcaggtttg 360 gagtcagctt ggcagggatc agcagcctgg gttggaagga gggggtataa aagccccttc 420 accaggagaa gccgtc 436 <210> 463 <211> 773 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 463 gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60 gttaatcatt aacgcttgta ctttggtaca atcgatgcga gaacttgtgc ctccccgtgt 120 tcctgctctt tgtccctctg tcctacttag actaatattt gccttgggta ctgcaaacag 180 gaaatggggg agggacagga gtagggcgga gggtagttaa gaatgtcaat tggggggagg 240 ctgctggtga atattaacca aggtcacccc agttatcgga ggagcaaaca ggggctaagt 300 ccaccggggg aggctgctgg tgaatattaa ccaaggtcac cccagttatc ggaggagcaa 360 acaggggcta agtccaccgg gggaggctgc tggtgaatat taaccaaggt caccccagtt 420 atcggaggag caaacagggg ctaagtccac ggtacccact gggaggatgt tgagtaagat 480 ggaaaactac tgatgaccct tgcagagaca gagtattagg acatgtttga acaggggccg 540 ggcgatcagc aggtagcact agaggatccc cgtctgtctg cacatttcgt agagcgagtg 600 ttccgatact ctaatctccc taggcaaggt tcatatttgt gtaggttact tattctcctt 660 ttgttgacta agtcaataat cagaatcagc aggtttggag tcagcttggc agggatcagc 720 agcctgggtt ggaaggaggg ggtataaaag ccccttcacc aggagaagcc gtc 773 <210> 464 <211> 431 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 464 aacaggttag tttgactagc gttaatcatt aacgttaatc attaacgtta atcattaacg 60 ttaatcatta acgttaatca ttaacatcga tgcgagaact tgtgcctccc cgtgttcctg 120 ctctttgtcc ctctgtccta cttagactaa tatttgcctt gggtactgca aacaggaaat 180 gggggaggga caggagtagg gcggagggta gttaagaatg tggatccccg tctgtctgca 240 catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt 300 aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc 360 agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 420 gagaagccgt c 431 <210> 465 <211> 768 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 465 aacaggttag tttgactagc gttaatcatt aacgttaatc attaacgtta atcattaacg 60 ttaatcatta acgttaatca ttaacatcga tgcgagaact tgtgcctccc cgtgttcctg 120 ctctttgtcc ctctgtccta cttagactaa tatttgcctt gggtactgca aacaggaaat 180 gggggaggga caggagtagg gcggagggta gttaagaatg tcaattgggg ggaggctgct 240 ggtgaatatt aaccaaggtc accccagtta tcggaggagc aaacaggggc taagtccacc 300 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 360 ggctaagtcc accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 420 aggagcaaac aggggctaag tccacggtac ccactgggag gatgttgagt aagatggaaa 480 actactgatg acccttgcag agacagagta ttaggacatg tttgaacagg ggccgggcga 540 tcagcaggta gcactagagg atccccgtct gtctgcacat ttcgtagagc gagtgttccg 600 atactctaat ctccctaggc aaggttcata tttgtgtagg ttacttattc tccttttgtt 660 gactaagtca ataatcagaa tcagcaggtt tggagtcagc ttggcaggga tcagcagcct 720 gggttggaag gagggggtat aaaagcccct tcaccaggag aagccgtc 768 <210> 466 <211> 540 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 466 gttaatcatt aacgcttgta ctttggtaca gttaatcatt aacgcttgta ctttggtaca 60 gttaatcatt aacgcttgta ctttggtaca atcgatgcga gaacttgtgc ctccccgtgt 120 tcctgctctt tgtccctctg tcctacttag actaatattt gccttgggta ctgcaaacag 180 gaaatggggg agggacagga gtagggcgga gggtagcccg gggattctgc agtgagagca 240 gagggccagc taagtggtac tctcccagag actgtctgac tcacgccacc ccctccacct 300 tggacacagg acgctgtggt ttctgagcca ggtacaatga ctcctttcgg taagtgcagt 360 ggaagctgta cactgcccag gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc 420 agccagtgga cttagcccct gtttgctcct ccgataactg gggtgacctt ggttaatatt 480 caccagcagc ctcccccgtt gcccctctgg atccactgct taaatacgga cgaggacagg 540 <210> 467 <211> 624 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 467 agcaacagat cattctatgg gttaatcatt aacaacaggt taggcttgta ctttggtaca 60 ttggctccta gttaatcatt aacttagcaa tgtgcttgta ctttggtaca tagttaccta 120 gttaatcatt aacaaacagt atggcttgta ctttggtaca agcaacagat cattctatgg 180 gcgagaactt gtgcctcccc gtgttcctgc tctttgtccc tctgtcctac ttagactaat 240 atttgccttg ggtactgcaa acaggaaatg ggggagggac aggagtaggg cggagggtag 300 caattggatt ctgcagtgag agcagagggc cagctaagtg gtactctccc agagactgtc 360 tgactcacgc caccccctcc accttggaca caggacgctg tggtttctga gccaggtaca 420 atgactcctt tcggtaagtg cagtggaagc tgtacactgc ccaggcaaag cgtccgggca 480 gcgtaggcgg gcgactcaga tcccagccag tggacttagc ccctgtttgc tcctccgata 540 actggggtga ccttggttaa tattcaccag cagcctcccc cgttgcccct ctggatccac 600 tgcttaaata cggacgagga cagg 624 <210> 468 <211> 951 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 468 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gcttaagagc aacagatcat tctatgggtt aatcattaac 360 aacaggttag gcttgtactt tggtacattg gctcctagtt aatcattaac ttagcaatgt 420 gcttgtactt tggtacatag ttacctagtt aatcattaac aaacagtatg gcttgtactt 480 tggtacaagc aacagatcat tctatgggcg agaacttgtg cctccccgtg ttcctgctct 540 ttgtccctct gtcctactta gactaatatt tgccttgggt actgcaaaca ggaaatgggg 600 gagggacagg agtagggcgg agggtagcaa ttggattctg cagtgagagc agagggccag 660 ctaagtggta ctctcccaga gactgtctga ctcacgccac cccctccacc ttggacacag 720 gacgctgtgg tttctgagcc aggtacaatg actcctttcg gtaagtgcag tggaagctgt 780 acactgccca ggcaaagcgt ccgggcagcg taggcgggcg actcagatcc cagccagtgg 840 acttagcccc tgtttgctcc tccgataact ggggtgacct tggttaatat tcaccagcag 900 cctcccccgt tgcccctctg gatccactgc ttaaatacgg acgaggacag g 951 <210> 469 <211> 535 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 469 aacaggttag tttgactagc gttaatcatt aacgttaatc attaacgtta atcattaacg 60 ttaatcatta acgttaatca ttaacatcga tgcgagaact tgtgcctccc cgtgttcctg 120 ctctttgtcc ctctgtccta cttagactaa tatttgcctt gggtactgca aacaggaaat 180 gggggaggga caggagtagg gcggagggta gcccggggat tctgcagtga gagcagaggg 240 ccagctaagt ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac 300 acaggacgct gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag 360 ctgtacactg cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca 420 gtggacttag cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca 480 gcagcctccc ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 535 <210> 470 <211> 579 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 470 agcaacagat cattctatgg gttaatcatt aacaacaggt taggttaatc attaacttgg 60 ctcctagtta atcattaaca aacagtatgg ttaatcatta acaaattctg gggttaatca 120 ttaactagtt acctagcgag aacttgtgcc tccccgtgtt cctgctcttt gtccctctgt 180 cctacttaga ctaatatttg ccttgggtac tgcaaacagg aaatggggga gggacaggag 240 tagggcggag ggtagcaatt ggattctgca gtgagagcag agggccagct aagtggtact 300 ctcccagaga ctgtctgact cacgccaccc cctccacctt ggacacagga cgctgtggtt 360 tctgagccag gtacaatgac tcctttcggt aagtgcagtg gaagctgtac actgcccagg 420 caaagcgtcc gggcagcgta ggcgggcgac tcagatccca gccagtggac ttagcccctg 480 tttgctcctc cgataactgg ggtgaccttg gttaatattc accagcagcc tcccccgttg 540 cccctctgga tccactgctt aaatacggac gaggacagg 579 <210> 471 <211> 906 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 471 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gcttaagagc aacagatcat tctatgggtt aatcattaac 360 aacaggttag gttaatcatt aacttggctc ctagttaatc attaacaaac agtatggtta 420 atcattaaca aattctgggg ttaatcatta actagttacc tagcgagaac ttgtgcctcc 480 ccgtgttcct gctctttgtc cctctgtcct acttagacta atatttgcct tgggtactgc 540 aaacaggaaa tgggggaggg acaggagtag ggcggagggt agcaattgga ttctgcagtg 600 agagcagagg gccagctaag tggtactctc ccagagactg tctgactcac gccaccccct 660 ccaccttgga cacaggacgc tgtggtttct gagccaggta caatgactcc tttcggtaag 720 tgcagtggaa gctgtacact gcccaggcaa agcgtccggg cagcgtaggc gggcgactca 780 gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt gaccttggtt 840 aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa tacggacgag 900 gacagg 906 <210> 472 <211> 286 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 472 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc acacgcgtgg taccgtctgt ctgcacattt cgtagagcga gtgttccgat 120 actctaatct ccctaggcaa ggttcatatt tgtgtaggtt acttattctc cttttgttga 180 ctaagtcaat aatcagaatc agcaggtttg gagtcagctt ggcagggatc agcagcctgg 240 gttggaagga gggggtataa aagccccttc accaggagaa gccgtc 286 <210> 473 <211> 541 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 473 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 120 aggagcaaac aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca 180 ccccagttat cggaggagca aacaggggct aagtccacgg tacccactgg gaggatgttg 240 agtaagatgg aaaactactg atgacccttg cagagacaga gtattaggac atgtttgaac 300 aggggccggg cgatcagcag gtagctctag aggatccccg tctgtctgca catttcgtag 360 agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt aggttactta 420 ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc agcttggcag 480 ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag gagaagccgt 540 c 541 <210> 474 <211> 452 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 474 cggtacgcgg gggaggctgc tggtgaatat taaccaaggt caccccagtt atcggaggag 60 caaacagggg ctaagtccac cgggggaggc tgctggtgaa tattaaccaa ggtcacccca 120 gttatcggag gagcaaacag gggctaagtc caccggggga ggctgctggt gaatattaac 180 caaggtcacc ccagttatcg gaggagcaaa caggggctaa gtccactgta caacgcgtga 240 attcgctagc gtctgtctgc acatttcgta gagcgagtgt tccgatactc taatctccct 300 aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa gtcaataatc 360 agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg gaaggagggg 420 gtataaaagc cccttcacca ggagaagccg tc 452 <210> 475 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 475 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900 gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125 <210> 476 <400> 476 000 <210> 477 <400> 477 000 <210> 478 <211> 541 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 478 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc accgggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 120 aggagcaaac aggggctaag tccaccgggg gaggctgctg gtgaatatta accaaggtca 180 ccccagttat cggaggagca aacaggggct aagtccacgg tacccactgg gaggatgttg 240 agtaagatgg aaaactactg atgacccttg cagagacaga gtattaggac atgtttgaac 300 aggggccggg cgatcagcag gtagcactag aggatccccg tctgtctgca catttcgtag 360 agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt aggttactta 420 ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc agcttggcag 480 ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag gagaagccgt 540 c 541 <210> 479 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 479 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc acttgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300 ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360 taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720 ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcatg ccaccccctc caccttggac acaggacact 900 gtggtttctg agccaggtac aatgactcct tttggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gtgtctgggc agcataggca ggtgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctctgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ctgttgcccc tctggatcca ctgcttaaat acagacaagg acagg 1125 <210> 480 <211> 3990 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 480 gtccaagcca ctctaaaggg caatctggca gcactttgtg aaattaagag tgcatgttcc 60 ctatgattca taatagcacc actcttctat cccagaaaat ttctacccca ggcctataag 120 ggaagaaaga taaggaaatt tatcacagta ttgtttgggg tggtgaaaaa ttagcaatga 180 cttagatgtc cataactgga aaataaagaa gtcaagtgtg gcaaatacac actgggatat 240 tctgaaccat ttagaaaagc aaagaactag atacatattc agcagcatgg ctggatccta 300 agaacacagt tgaaagaaaa aagaaactat gaaatctata gtacatccat agattgtagt 360 aaatctatag tgccacatca catatccatg aaaaatacat atacgcacaa acatttctat 420 gtattttaca agttcaaggc taaacatcat attagagaag ttgcctctgg ggaaaggcag 480 tgagagtgag gaattatgat aaaagagaat gaataaaaaa acaagagaag ggtcatgtag 540 gttttgtttc tgtgccatga actcatggat tatgattaac tcaaccttct gcacatgaag 600 ataaacaaga aagaactgat aaacctgcaa tggttgggta atcttcaact tccaaatcag 660 caaaggtcag ctctaagttt gccaagtaca caacttctca tcttgtgaca tgttccccac 720 ctctgtgcag tgttaaaaaa tacctcagtg gtctactgac tgactgtgga tgcttcttct 780 agatgtgcct ttttttcctc catttcctta gcacccagca ctgctctcat tatagcagca 840 cattgcattc caaccaaatt gaacaaaaag gtggcttaaa aatcatctgc aagtttatgg 900 cacaagcaat ctcttatttt tatcttagtg cataaataaa tttttccttt ttgccagaat 960 aatttttttt aaagaagcga ttagtttttc ttctctcaga tagcaatgat gtgctttcct 1020 ctcaacctag atttagggca tttttatgtg agataggatt aaaaattcca tttttgtaca 1080 accactatgg agaacagttt ggcagttccc caaaaaacta aaaatagagc tactatatga 1140 tctagtgatc ccactgctgg gtatatacct ataagaaagg aaatcagtat atcaaagaga 1200 tgtctgttct tttatgtttg ttgcagcact gttcacaata gccaagatct ggaagcaacc 1260 caagtctcca tcaacatggg ttttaaaaaa atgtggtact ttaatacaca atggagtact 1320 attcagcaat aaaaaagaat gagatcctgt tatttgcaat aacatggaca gaactggagg 1380 tcattatgtc aaatgaaata agccaggcac agaaagccaa acatcacata ttctcactca 1440 tatgtggggt ctaaaaatca aaacaatctg attcatggag ctagagagta gagagctaat 1500 taccagaggt ggggaagggt agtaggggcc tggaggggag gtggagatgg ttaataggta 1560 caaaaaaata tagaaagaat gaataagacc tagtatttga tagtacaaca gggcgaatat 1620 agtcaaaata atttaattat acatttaaaa atacctgaaa gagtataatt ggcttgtttg 1680 caacacaaaa gataaatgct tgaggggatg gatgccccat tttcaatgat gtgattatta 1740 cacattgcat gcctgtatca aaatattgca catactccat gaatgcatac atctactatg 1800 ttcccacaaa aattaaacat tagaaaaaag agttgcattt tcagctgtta tggggagaag 1860 aaagaaaagc tatcattttg ttgtcctaaa aattatgttg tcctcatttc aaacaggaaa 1920 gcaaaagtat ttgagagcca gtgcagtgcc ttggtgttgg gtgaaacata gattgaattt 1980 gggccatttg tttaaacttc ctaggcctca gtttcttgcc tattaaaagg gagtgcatag 2040 ttcatgggat tgttaagagg aagaagtgaa accatgcacg tggagagcgt ggcacagtgt 2100 ctaagacaga gtgtgcatgc aaataagtag ataatattct ttgcttttct ttattgcatg 2160 cctgtaatat ttttggagtt gtcacattca ttgccctcaa gtagcatcaa gggatgaaat 2220 tatgtttgta agaaaatcct gaggctgagg aatacaacat gttttatgtc tactacactg 2280 aaaaatgccg gagtcagata aagaatacag attctcctga ggatggaaat caagatcttc 2340 gccttcaata tttaacaaca ttgagcttcc aacttactat gggaaatatt catcaggccc 2400 ctaaaggttc cttttggaca gaaattgcac ttgttatatc tgtattctta gcagacagta 2460 gacagcctgg cacatcataa aggcttaagg aatcctaaat atcccttaaa attctcattt 2520 taaagacaaa aacaaaacaa aaaaaaaaaa caaaaaaaaa ctgaggcatg ggcttgacca 2580 aatcagtggt agaaccaaga gttaaaccac ttgttttgaa tcctaaacct gagttttatt 2640 ttacttattt atttatttat ttgtttattt attttcagat gcttggtcaa agaacagtgg 2700 gaggagaggg atgggcttcc agcaaccttt attattggct tattttctta cagcccatta 2760 ctttctcttg ggaaaatatt aagcaggcac tcaaggcttg aggcccctga gttttcacat 2820 cctttctgaa cctctgaacc tgctttccag cattctttta tactttgttt tacctcctgg 2880 tcagtaatgc ctcaccctca gtcttctcta aaagtgtggt taatggcatc ttcctgacta 2940 tttgaagacc actggccaaa tcccaccagc tcactcatag accatccccc tactttactt 3000 tcttcaaaag acttagccct acctaaactt atttatatgt ttattttctg cccaccagaa 3060 tggcagcata gctggggagg cagagtctgt tttgttcatt gctgtattcc caaagactag 3120 aacaccacca agcacacggt acaggtctca gtaattattg tcaaatttat gtggatttgc 3180 ttttaaacaa tatcttccat ttactgagtg tttatgtgga agaactgtac taaattttaa 3240 tgcatttctt tattcctatt cttaaaacct tccagcaagg tggctctacc accctctttt 3300 ccgagcttca ggagcagttg tgcgaatagc tggagaacac caggctggat ttaaacccag 3360 atcgctctta catttgctct ttacctgctg tgctcagcgt tcacgtgccc tctagctgta 3420 gttttctgaa gtcagcgcac agcaaggcag tgtgcttaga ggttaacaga agggaaaaca 3480 acaacaacaa aaatctaaat gagaatcctg actgtttcag ctgggggtaa ggggggcgga 3540 ttattcatat aattgttata ccagacggtc gcaggcttag tccaattgca gagaactcgc 3600 ttcccaggct tctgagagtc ccggaagtgc ctaaacctgt ctaatcgacg gggcttgggt 3660 ggcccgtcgc tccctggctt cttcccttta cccagggcgg gcagcgaagt ggtgcctcct 3720 gcgtccccca caccctccct cagcccctcc cctccggccc gtcctgggca ggtgacctgg 3780 agcatccggc aggctgccct ggcctcctgc gtcaggacaa cgcccacgag gggcgttact 3840 gtgcggagat gcaccacgca agagacaccc tttgtaactc tcttctcctc cctagtgcga 3900 ggttaaaacc ttcagcccca cgtgctgttt gcaaacctgc ctgtacctga ggccctaaaa 3960 agccagagac ctcactcccg gggagccagc 3990 <210> 481 <211> 3983 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 481 gtccaagcca ctctaaaggg caatctggca gcactttgtg aaattaagag tgcatgttcc 60 ctatgattca taatagcacc actcttctat cccagaaaat ttctacccca ggcctataag 120 ggaagaaaga taaggaaatt tatcacagta ttgtttgggg tggtgaaaaa ttagcaatga 180 cttagatgtc cataactgga aaataaagaa gtcaagtgtg gcaaatacac actgggatat 240 tctgaaccat ttagaaaagc aaagaactag atacatattc agcagcatgg ctggatccta 300 agaacacagt tgaaagaaaa aagaaactat gaaatctata gtacatccat agattgtagt 360 aaatctatag tgccacatca catatccatg aaaaatacat atacgcacaa acatttctat 420 gtattttaca agttcaaggc taaacatcat attagagaag ttgcctctgg ggaaaggcag 480 tgagagtgag gaattatgat aaaagagaat gaataaaaaa acaagagaag ggtcatgtag 540 gttttgtttc tgtgccatga actcatggat tatgattaac tcaaccttct gcacatgaag 600 ataaacaaga aagaactgat aaacctgcaa tggttgggta atcttcaact tccaaatcag 660 caaaggtcag ctctaagttt gccaagtaca caacttctca tcttgtgaca tgttccccac 720 ctctgtgcag tgttaaaaaa tacctcagtg gtctactgac tgactgtgga tgcttcttct 780 agatgtgcct ttttttcctc catttcctta gcacccagca ctgctctcat tatagcagca 840 cattgcattc caaccaaatt gaacaaaaag gtggcttaaa aatcatctgc aagtttatgg 900 cacaagcaat ctcttatttt tatcttagtg cataaataaa tttttccttt ttgccagaat 960 aatttttttt aaagaagcga ttagtttttc ttctctcaga tagcaatgat gtgctttcct 1020 ctcaacctag atttagggca tttttatgtg agataggatt aaaaattcca tttttgtaca 1080 accactatgg agaacagttt ggcagttccc caaaaaacta aaaatagagc tactatatga 1140 tctagtgatc ccactgctgg gtatatacct ataagaaagg aaatcagtat atcaaagaga 1200 tgtctgttct tttatgtttg ttgcagcact gttcacaata gccaagatct ggaagcaacc 1260 caagtctcca tcaacatggg ttttaaaaaa atgtggtact ttaatacaca atggagtact 1320 attcagcaat aaaaaagaat gagatcctgt tatttgcaat aacatggaca gaactggagg 1380 tcattatgtc aaatgaaata agccaggcac agaaagccaa acatcacata ttctcactca 1440 tatgtggggt ctaaaaatca aaacaatctg attcatggag ctagagagta gagagctaat 1500 taccagaggt ggggaagggt agtaggggcc tggaggggag gtggagatgg ttaataggta 1560 caaaaaaata tagaaagaat gaataagacc tagtatttga tagtacaaca gggcgaatat 1620 agtcaaaata atttaattat acatttaaaa atacctgaaa gagtataatt ggcttgtttg 1680 caacacaaaa gataaatgct tgaggggatg gatgccccat tttcaatgat gtgattatta 1740 cacattgcat gcctgtatca aaatattgca catactccat gaatgcatac atctactatg 1800 ttcccacaaa aattaaacat tagaaaaaag agttgcattt tcagctgtta tggggagaag 1860 aaagaaaagc tatcattttg ttgtcctaaa aattatgttg tcctcatttc aaacaggaaa 1920 gcaaaagtat ttgagagcca gtgcagtgcc ttggtgttgg gtgaaacata gattgaattt 1980 gggccatttg tttaaacttc ctaggcctca gtttcttgcc tattaaaagg gagtgcatag 2040 ttcatgggat tgttaagagg aagaagtgaa accatgcacg tggagagcgt ggcacagtgt 2100 ctaagacaga gtgtgcatgc aaataagtag ataatattct ttgcttttct ttattgcatg 2160 cctgtaatat ttttggagtt gtcacattca ttgccctcaa gtagcatcaa gggatgaaat 2220 tatgtttgta agaaaatcct gaggctgagg aatacaacat gttttatgtc tactacactg 2280 aaaaatgccg gagtcagata aagaatacag attctcctga ggatggaaat caagatcttc 2340 gccttcaata tttaacaaca ttgagcttcc aacttactat gggaaatatt catcaggccc 2400 ctaaaggttc cttttggaca gaaattgcac ttgttatatc tgtattctta gcagacagta 2460 gacagcctgg cacatcataa aggcttaagg aatcctaaat atcccttaaa attctcattt 2520 taaagacaaa aacaaaacaa aaaaaaaaaa caaaaaaaaa ctgaggcatg ggcttgacca 2580 aatcagtggt agaaccaaga gttaaaccac ttgttttgaa tcctaaacct gagttttatt 2640 ttacttattt atttatttat ttgtttattt attttcagat gcttggtcaa agaacagtgg 2700 gaggagaggg atgggcttcc agcaaccttt attattggct tattttctta cagcccatta 2760 ctttctcttg ggaaaatatt aagcaggcac tcaaggcttg aggcccctga gttttcacat 2820 cctttctgaa cctctgaacc tgctttccag cattctttta tactttgttt tacctcctgg 2880 tcagtaatgc ctcaccctca gtcttctcta aaagtgtggt taatggcatc ttcctgacta 2940 tttgaagacc actggccaaa tcccaccagc tcactcatag accatccccc tactttactt 3000 tcttcaaaag acttagccct acctaaactt atttatatgt ttattttctg cccaccagaa 3060 tggcagcata gctggggagg cagagtctgt tttgttcatt gctgtattcc caaagactag 3120 aacaccacca agcacacggt acaggtctca gtaattattg tcaaatttat gtggatttgc 3180 ttttaaacaa tatcttccat ttactgagtg tttatgtgga agaactgtac taaattttaa 3240 tgcatttctt tattcctatt cttaaaacct tccagcaagg tggctctacc accctctttt 3300 ccgagcttca ggagcagttg tgcgaatagc tggagaacac caggctggat ttaaacccag 3360 atcgctctta catttgctct ttacctgctg tgctcagcgt tcacgtgccc tctagctgta 3420 gttttctgaa gtcagcgcac agcaaggcag tgtgcttaga ggttaacaga agggaaaaca 3480 acaacaacaa aaatctaaat gagaatcctg actgtttcag ctgggggtaa ggggggcgga 3540 ttattcatat aattgttata ccagacggtc gcaggcttag tccaattgca gagaactcgc 3600 ttcccaggct tctgagagtc ccggaagtgc ctaaacctgt ctaatcgacg gggcttgggt 3660 ggcccgtcgc tccctggctt cttcccttta cccagggcgg gcagcgaagt ggtgcctcct 3720 gcgtccccca caccctccct cagcccctcc cctccggccc gtcctgggca ggtgacctgg 3780 agcatccggc aggctgccct ggcctcctgc gtcaggacaa cgcccacgag gggcgttact 3840 gtgcggagat gcaccacgca agagacaccc tttgtaactc tcttctcctc cctagtgcga 3900 ggttaaaacc ttcagcccca cgtgctgttt gcaaacctgc ctgtacctga ggccctaaaa 3960 agccagagac ctcactcccg ggg 3983 <210> 482 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 482 acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60 ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac 120 gccgccacc 129 <210> 483 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 483 acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60 ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tgggtttaaa 120 cgccgccacc 130 <210> 484 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 484 acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60 ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tgggttaaac 120 gccgccacc 129 <210> 485 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 485 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaat 49 <210> 486 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 486 acacagatcc acaagctcct gaagaggttg gtttaaacgc cgccacc 47 <210> 487 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 487 catttcgtgg gctaagttta agctactctc gctccgggat aagagtttca 50 <210> 488 <400> 488 000 <210> 489 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 489 gggacatcgt agagagtcgt actta 25 <210> 490 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 490 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60 ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120 cttttagatt ccaacctttg gaactgagtt taaacagcca cc 162 <210> 491 <211> 165 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 491 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60 ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120 cttttagatt ccaacctttg gaactgagtt taaaccgcag ccacc 165 <210> 492 <211> 164 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 492 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60 ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120 cttttagatt ccaacctttg gaactgagtt taaacgccgc cacc 164 <210> 493 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 493 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60 ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120 cttttagatt ccaacctttg gaactgagtt taaacgggac atcgtagaga gtcgtactta 180 catttcgtgg gctaagttta agctactctc gctccgggat aagagtttca 230 <210> 494 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 494 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaata attactctaa 60 ggtaaatata aaatttttaa gtgtataatg tgttaaacta ctgattctaa ttgtttctct 120 cttttagatt ccaacctttg gaactgaacc 150 <210> 495 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 495 acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60 ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggt 120 ttaaacgccg ccacc 135 <210> 496 <211> 136 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 496 acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60 ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg 120 tttaaacgcc gccacc 136 <210> 497 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 497 acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60 ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg 120 ttaaacgccg ccacc 135 <210> 498 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 498 acacagatcc acaagctcct g 21 <210> 499 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 499 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg tttaaaccgc 60 agccacc 67 <210> 500 <211> 131 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 500 acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60 ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tgggtttaaa 120 ccgcagccac c 131 <210> 501 <211> 195 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 501 acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60 ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac 120 gggacatcgt agagagtcgt acttacattt cgtgggctaa gtttaagcta ctctcgctcc 180 gggataagag tttca 195 <210> 502 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 502 acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60 ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tgggttaaac 120 cgcagccacc 130 <210> 503 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 503 acacagatcc acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta 60 ttaatgttta attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac 120 cgcagccacc 130 <210> 504 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 504 acacagatcc acaagctcct gaagaggttg gtttaaaccg cagccacc 48 <210> 505 <211> 137 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 505 acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60 ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg 120 tttaaaccgc agccacc 137 <210> 506 <211> 136 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 506 acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60 ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggg 120 ttaaaccgca gccacc 136 <210> 507 <211> 136 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 507 acacagatcc acaagctcct gtctagaaag aggtaagggt ttaagggatg gttggttggt 60 ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt tcaggttggt 120 ttaaaccgca gccacc 136 <210> 508 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 508 gccctgtctc ctcagcttca ggcaccacca ctgacctggg acagtgaatg tttaaacgcc 60 gccacc 66 <210> 509 <211> 867 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 509 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 120 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 180 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 240 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 300 ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttaggat 360 tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 420 ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 480 gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 540 aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 600 tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 660 cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 720 tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 780 tcatgcttgc tttgtccatg taggtttaac aggaatgaat tgctaaactg tggaaaatgt 840 tttaaacaaa tgcatcttat cctgtag 867 <210> 510 <211> 867 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 510 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 120 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 180 ggagaacatc tgtcctcggt ggctttcaca ggaatgaatg accattgctt tagggggttg 240 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 300 ctctctgttg tctgtttact cttctgtaca ctgaaggggt tccaatccag gtcttacgat 360 tcaaaagcct gtgcatgttc catttttagt actttccaca ctgtatttct caatgtcttt 420 ctgggacatt ttataaatca tattatatca cctctaagga tctttcagtt tgttatatat 480 gtgtctatta agttagattg tgagctccta aaagataaag cattgtctta ttcatcttta 540 aatttctcag agcccaaata gtgcctggaa cctagtagtt gctcaataaa aggtattgaa 600 tttacaggat tgaatggtga catcaatgaa taattgaaga ttccttaagc tgataactga 660 cccagtagca tcattgatca tttaattgcc ctggacttac ttattttcca ccacactaca 720 tatttctgta tagaatatat atagctcatt gtattgcaag atttaactag aagaaagagt 780 tcatgcttgc tttgtccatg gaggtttaac aggaatgaat tgctaaactg tggaaaatgt 840 tttaaacaaa tgcatcttat cctgtag 867 <210> 511 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 511 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 120 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 180 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtag 229 <210> 512 <211> 2000 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 512 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 120 agctgatgag aatatccagg aagtcaacag acaaatgtcc tcaacaattg tttctaagta 180 ggagaacatc tgtcctgggt ggctttcaca ggaatgaatg accattgctt tagggggttg 240 gggatctggc ctccagaact gccaccaatt agctgtgtgt ctttggacaa gttactgtcc 300 ctctctgttg tctgtttact cttctgtaca ctgaaggggc tggtccctaa tgatctggga 360 tgggatgtgg aatccttcta gatttctttt gtaatattta taaagtgctc tcagcaaggt 420 atcaaaatgg caaaattgtg agtaactatc ctcctttcat tttgggaaga agatgaggca 480 tgaagagaat tcagacagaa acttactcag accaggggag gcagaaacta agcagagagg 540 aaaatgacca agagttagcc ctgggcatgg aatgtgaaag aaccctaaag gtgacttgga 600 aataatgccc aaggtatatt ccattctcct ggatttgttg gcattttctt gaggtgaaga 660 attgcagaat acattcttta atgtgaccta catatttacc catgtgagga agtctgctcc 720 tggactcttg agattcagtc ataaagccca ggccagggaa ataatgtaag tctgcaggcc 780 cctgtcatca gtaggattag ggagaagagt tctcagtaga aaacagggag gctggagaga 840 aaagaatggt taatgttaag gttaatataa ctagaaagac tgcagaactt aggactgatt 900 tttatttgaa tccttaaaaa aaaaaatttc ttatgaaaat agtacatggc tcttaggaga 960 cagaacttat tgtacagagg aacagtgtga gagtcagagt gaattttatg tattattttt 1020 ggacttaggc taatgattta gcaaactctg gaatgtcagc cctaacccca accttggttt 1080 tctgtcacat gcatgtagta agtgctagat cctggacatt ctttgagatt tagtttaaga 1140 ctaagtttat tttctgatag gttatttgtg tactttcatg gattttgtaa ctctttttca 1200 acaattggat gtctcagatc tcagcatatg ggagcaagtt aatgcttcct gagatctttg 1260 ccaaaggtca agaggtcatt tttgtgtatt tataattttc catcattttt atatacttct 1320 caatattctt tttaaactat tcttttcctt ttttcatcct ctgaatactg ttttgacaga 1380 tcttgttatt agcatgcttt cagggatgag aaaactaaga aagctgaatg atttgcccaa 1440 agtagtccac ctggaaaatg aaagagagag gattccaatc caggtcttag gattcaaaag 1500 cctgtgcatg ttccattttt agtactttcc acactgtatt tctcaatgtc tttctgggac 1560 attttataaa tcatattata tcacctctaa ggatctttca gtttgttata tatgtgtcta 1620 ttaagttaga ttgtgagctc ctaaaagata aagcattgtc ttattcatct ttaaatttct 1680 cagagcccaa atagtgcctg gaacctagta gttgctcaat aaaaggtatt gaatttacag 1740 gattgaatgg tgacatcaat gaataattga agattcctta agctgataac tgacccagta 1800 gcatcattga tcatttaatt gccctggact tacttatttt ccaccacact acatatttct 1860 gtatagaata tatatagctc attgtattgc aagatttaac tagaagaaag agttcatgct 1920 tgctttgtcc atgtaggttt aacaggaatg aattgctaaa ctgtggaaaa tgttttaaac 1980 aaatgcatct tatcctgtag 2000 <210> 513 <211> 820 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 513 gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 60 tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 120 gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 180 aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 240 ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 300 acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt tatattttgt 360 ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 420 aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 480 gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 540 tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 600 ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 660 atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt ccaaagctta 720 acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa taattgctaa 780 gctgtgaaaa acattttaac caagtgatct aattatgtag 820 <210> 514 <211> 820 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 514 gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt gaaagcagtc 60 tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact ttatttagag 120 gccaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt gaggatacag 180 aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct cattggtatc 240 ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc ttagtcacct 300 acccaggtct tggatccata gcctagggat gtcccatttt tattgctttt tatattttgt 360 ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc ttcctctaag 420 aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg aagtatgggc 480 ctatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct ggtattaggg 540 tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca taatttaagg 600 ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt caacttactt 660 atttctgatc acactgactt ccctgtggaa tacacctggt tcactgtgtt ccaaagctta 720 aggagcagaa aaaggttatg ctcctctctt cttgagaggt tttaagagaa taattgctaa 780 gctgtgaaaa acattttaac caagtgatct aattatgtag 820 <210> 515 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 515 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 120 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 180 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtag 229 <210> 516 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 516 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 60 ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 120 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 180 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtag 229 <210> 517 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 517 tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 60 ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 120 gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 180 ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc 225 <210> 518 <211> 581 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 518 gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat 60 ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt 120 actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc 180 tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 240 aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct 300 attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 360 ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 420 gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 480 ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 540 ggggctaggt tgctgggcac tgataattcc gtggtgttgt c 581 <210> 519 <211> 222 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 519 cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 60 aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 120 ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 180 gggaggtttt ttaaagcaag taaaacctct acaaatgtgg ta 222 <210> 520 <211> 395 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 520 taaaatacag catagcaaaa ctttaacctc caaatcaagc ctctacttga atccttttct 60 gagggatgaa taaggcatag gcatcagggg ctgttgccaa tgtgcattag ctgtttgcag 120 cctcaccttc tttcatggag tttaagatat agtgtatttt cccaaggttt gaactagctc 180 ttcatttctt tatgttttaa atgcactgac ctcccacatt ccctttttag taaaatattc 240 agaaataatt taaatacatc attgcaatga aaataaatgt tttttattag gcagaatcca 300 gatgctcaag gcccttcata atatccccca gtttagtagt tggacttagg gaacaaagga 360 acctttaata gaaattggac agcaagaaag cgagc 395 <210> 521 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 521 gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60 taaactgggg gatattatga agggccttga gcatctggat tctgcct 107 <210> 522 <211> 395 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 522 gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60 taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120 tattttcatt gcaatgatgt atttaaatta tttctgaata ttttactaaa aagggaatgt 180 gggaggtcag tgcatttaaa acataaagaa atgaagagct agttcaaacc ttgggaaaat 240 acactatatc ttaaactcca tgaaagaagg tgaggctgca aacagctaat gcacattggc 300 aacagcccct gatgcctatg ccttattcat ccctcagaaa aggattcaag tagaggcttg 360 atttggaggt taaagttttg ctatgctgta tttta 395 <210> 523 <211> 107 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 523 gcttgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60 taaactgggg gatattatga agggccttga gcatctggat tctgcct 107 <210> 524 <211> 395 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 524 gcttgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60 taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120 tattttcatt gcaatgatgt atttaaatta tttctgaata ttttactaaa aagggaatgt 180 gggaggtcag tgcatttaaa acataaagaa atgaagagct agttcaaacc ttgggaaaat 240 acactatatc ttaaactcca tgaaagaagg tgaggctgca aacagctaat gcacattggc 300 aacagcccct gatgcctatg ccttattcat ccctcagaaa aggattcaag tagaggcttg 360 atttggaggt taaagttttg ctatgctgta tttta 395 <210> 525 <211> 395 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 525 taaaatacag catagcaaaa ctttaacctc caaatcaagc ctctacttga atccttttct 60 gagggatgaa taaggcatag gcatcagggg ctgttgccaa tgtgcattag ctgtttgcag 120 cctcaccttc tttcatggag tttaagatat agtgtatttt cccaaggttt gaactagctc 180 ttcatttctt tatgttttaa atgcactgac ctcccacatt ccctttttag taaaatattc 240 agaaataatt taaatacatc attgcaatga aaataaatgt tttttattag gcagaatcca 300 gatgctcaag gcccttcata atatccccca gtttagtagt tggacttagg gaacaaagga 360 acctttaata gaaattggac agcaagaaag caagc 395 <210> 526 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 526 ctggggactt tccagctggg gactttccag ctggggactt tccagg 46 <210> 527 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 527 aggattagtc ccccagtgca c 21 <210> 528 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 528 agcctgcact tagagtgtct agg 23 <210> 529 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 529 tggggacttt ccgctgggga ctttccgctg gggactttcc gctggggact ttccgctggg 60 gactttccgc 70 <210> 530 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 530 acgggtggta cagaatgttc ttttggcgtc gacacgggtg gtacagaatg ttcttttggc 60 <210> 531 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 531 tgacgtcaag atcta 15 <210> 532 <211> 840 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 532 aacaggttag tttgactagc tggttgctga ctaattgaga tgcatgcttt gcatacttct 60 gcctgctggg gagcctgggg actttccaca cctggttgct gactaattga gatgcatgct 120 ttgcatactt ctgcctgctg gggagcctgg ggactttcca caccttaaga atgtaaattc 180 tgggtggttg ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct 240 ggggactttc cacacctggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 300 gctggggagc ctggggactt tccacaccta gttacctaat ttgttagatg gttgctgact 360 aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac tttccacacc 420 tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 480 actttccaca ccaatggcac tcaaacagta tgtggttgct gactaattga gatgcatgct 540 ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt 600 gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccactt 660 ttagtcagag gttaattggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 720 gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 780 atacttctgc ctgctgggga gcctggggac tttccacacc ttggctccta ggtcatgcac 840 <210> 533 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 533 acgggaagaa cattttgtac gtttggcgtc gacacgggaa gaacattttg tacgtttggc 60 <210> 534 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 534 tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 60 actttccaca cc 72 <210> 535 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 535 tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 60 actttccaca cctggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg 120 gggagcctgg ggactttcca cacc 144 <210> 536 <211> 840 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 536 aacaggttag tttgactagc tggttgctga ctaattgaga tgcatgcttt gcatacttct 60 gcctgctggg gagcctgggg actttccaca cctggttgct gactaattga gatgcatgct 120 ttgcatactt ctgcctgctg gggagcctgg ggactttcca caccttaaga atgtaaattc 180 tgggtggttg ctgactaatt gagatgcatg ctttgcatac ttctgcctgc tggggagcct 240 ggggactttc cacacctggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 300 gctggggagc ctggggactt tccacaccta gttacctaat ttgttagatg gttgctgact 360 aattgagatg catgctttgc atacttctgc ctgctgggga gcctggggac tttccacacc 420 tggttgctga ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg 480 actttccaca ccaatggcac tcaaacagta tgtggttgct gactaattga gatgcatgct 540 ttgcatactt ctgcctgctg gggagcctgg ggactttcca cacctggttg ctgactaatt 600 gagatgcatg ctttgcatac ttctgcctgc tggggagcct ggggactttc cacaccactt 660 ttagtcagag gttaattggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 720 gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 780 atacttctgc ctgctgggga gcctggggac tttccacacc ttggctccta gatcatgcac 840 <210> 537 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 537 gccgccacc 9 <210> 538 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 538 agccacc 7 <210> 539 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 539 cgcagccacc 10 <210> 540 <211> 3 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 540 acc 3 <210> 541 <211> 6558 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 541 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgtccaag ccactctaaa gggcaatctg gcagcacttt gtgaaattaa gagtgcatgt 240 tccctatgat tcataatagc accactcttc tatcccagaa aatttctacc ccaggcctat 300 aagggaagaa agataaggaa atttatcaca gtattgtttg gggtggtgaa aaattagcaa 360 tgacttagat gtccataact ggaaaataaa gaagtcaagt gtggcaaata cacactggga 420 tattctgaac catttagaaa agcaaagaac tagatacata ttcagcagca tggctggatc 480 ctaagaacac agttgaaaga aaaaagaaac tatgaaatct atagtacatc catagattgt 540 agtaaatcta tagtgccaca tcacatatcc atgaaaaata catatacgca caaacatttc 600 tatgtatttt acaagttcaa ggctaaacat catattagag aagttgcctc tggggaaagg 660 cagtgagagt gaggaattat gataaaagag aatgaataaa aaaacaagag aagggtcatg 720 taggttttgt ttctgtgcca tgaactcatg gattatgatt aactcaacct tctgcacatg 780 aagataaaca agaaagaact gataaacctg caatggttgg gtaatcttca acttccaaat 840 cagcaaaggt cagctctaag tttgccaagt acacaacttc tcatcttgtg acatgttccc 900 cacctctgtg cagtgttaaa aaatacctca gtggtctact gactgactgt ggatgcttct 960 tctagatgtg cctttttttc ctccatttcc ttagcaccca gcactgctct cattatagca 1020 gcacattgca ttccaaccaa attgaacaaa aaggtggctt aaaaatcatc tgcaagttta 1080 tggcacaagc aatctcttat ttttatctta gtgcataaat aaatttttcc tttttgccag 1140 aataattttt tttaaagaag cgattagttt ttcttctctc agatagcaat gatgtgcttt 1200 cctctcaacc tagatttagg gcatttttat gtgagatagg attaaaaatt ccatttttgt 1260 acaaccacta tggagaacag tttggcagtt ccccaaaaaa ctaaaaatag agctactata 1320 tgatctagtg atcccactgc tgggtatata cctataagaa aggaaatcag tatatcaaag 1380 agatgtctgt tcttttatgt ttgttgcagc actgttcaca atagccaaga tctggaagca 1440 acccaagtct ccatcaacat gggttttaaa aaaatgtggt actttaatac acaatggagt 1500 actattcagc aataaaaaag aatgagatcc tgttatttgc aataacatgg acagaactgg 1560 aggtcattat gtcaaatgaa ataagccagg cacagaaagc caaacatcac atattctcac 1620 tcatatgtgg ggtctaaaaa tcaaaacaat ctgattcatg gagctagaga gtagagagct 1680 aattaccaga ggtggggaag ggtagtaggg gcctggaggg gaggtggaga tggttaatag 1740 gtacaaaaaa atatagaaag aatgaataag acctagtatt tgatagtaca acagggcgaa 1800 tatagtcaaa ataatttaat tatacattta aaaatacctg aaagagtata attggcttgt 1860 ttgcaacaca aaagataaat gcttgagggg atggatgccc cattttcaat gatgtgatta 1920 ttacacattg catgcctgta tcaaaatatt gcacatactc catgaatgca tacatctact 1980 atgttcccac aaaaattaaa cattagaaaa aagagttgca ttttcagctg ttatggggag 2040 aagaaagaaa agctatcatt ttgttgtcct aaaaattatg ttgtcctcat ttcaaacagg 2100 aaagcaaaag tatttgagag ccagtgcagt gccttggtgt tgggtgaaac atagattgaa 2160 tttgggccat ttgtttaaac ttcctaggcc tcagtttctt gcctattaaa agggagtgca 2220 tagttcatgg gattgttaag aggaagaagt gaaaccatgc acgtggagag cgtggcacag 2280 tgtctaagac agagtgtgca tgcaaataag tagataatat tctttgcttt tctttattgc 2340 atgcctgtaa tatttttgga gttgtcacat tcattgccct caagtagcat caagggatga 2400 aattatgttt gtaagaaaat cctgaggctg aggaatacaa catgttttat gtctactaca 2460 ctgaaaaatg ccggagtcag ataaagaata cagattctcc tgaggatgga aatcaagatc 2520 ttcgccttca atatttaaca acattgagct tccaacttac tatgggaaat attcatcagg 2580 cccctaaagg ttccttttgg acagaaattg cacttgttat atctgtattc ttagcagaca 2640 gtagacagcc tggcacatca taaaggctta aggaatccta aatatccctt aaaattctca 2700 ttttaaagac aaaaacaaaa caaaaaaaaa aaacaaaaaa aaactgaggc atgggcttga 2760 ccaaatcagt ggtagaacca agagttaaac cacttgtttt gaatcctaaa cctgagtttt 2820 attttactta tttatttatt tatttgttta tttattttca gatgcttggt caaagaacag 2880 tgggaggaga gggatgggct tccagcaacc tttattattg gcttattttc ttacagccca 2940 ttactttctc ttgggaaaat attaagcagg cactcaaggc ttgaggcccc tgagttttca 3000 catcctttct gaacctctga acctgctttc cagcattctt ttatactttg ttttacctcc 3060 tggtcagtaa tgcctcaccc tcagtcttct ctaaaagtgt ggttaatggc atcttcctga 3120 ctatttgaag accactggcc aaatcccacc agctcactca tagaccatcc ccctacttta 3180 ctttcttcaa aagacttagc cctacctaaa cttatttata tgtttatttt ctgcccacca 3240 gaatggcagc atagctgggg aggcagagtc tgttttgttc attgctgtat tcccaaagac 3300 tagaacacca ccaagcacac ggtacaggtc tcagtaatta ttgtcaaatt tatgtggatt 3360 tgcttttaaa caatatcttc catttactga gtgtttatgt ggaagaactg tactaaattt 3420 taatgcattt ctttattcct attcttaaaa ccttccagca aggtggctct accaccctct 3480 tttccgagct tcaggagcag ttgtgcgaat agctggagaa caccaggctg gatttaaacc 3540 cagatcgctc ttacatttgc tctttacctg ctgtgctcag cgttcacgtg ccctctagct 3600 gtagttttct gaagtcagcg cacagcaagg cagtgtgctt agaggttaac agaagggaaa 3660 acaacaacaa caaaaatcta aatgagaatc ctgactgttt cagctggggg taaggggggc 3720 ggattattca tataattgtt ataccagacg gtcgcaggct tagtccaatt gcagagaact 3780 cgcttcccag gcttctgaga gtcccggaag tgcctaaacc tgtctaatcg acggggcttg 3840 ggtggcccgt cgctccctgg cttcttccct ttacccaggg cgggcagcga agtggtgcct 3900 cctgcgtccc ccacaccctc cctcagcccc tcccctccgg cccgtcctgg gcaggtgacc 3960 tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga caacgcccac gaggggcgtt 4020 actgtgcgga gatgcaccac gcaagagaca ccctttgtaa ctctcttctc ctccctagtg 4080 cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc tgcctgtacc tgaggcccta 4140 aaaagccaga gacctcactc ccggggagcc agcgtttaaa ccgcagccac catgagcacc 4200 gccgtgctgg aaaatcctgg cctgggcaga aagctgagcg acttcggcca agagacaagc 4260 tacatcgagg acaactgcaa ccagaacggc gccatcagcc tgatcttcag cctgaaagaa 4320 gaagtgggcg ccctggccaa ggtgctgaga ctgttcgaag agaacgacgt gaacctgaca 4380 cacatcgaga gcagacccag cagactgaag aaggacgagt acgagttctt cacccacctg 4440 gacaagcgga gcctgcctgc tctgaccaac atcatcaaga tcctgcggca cgacatcggc 4500 gccacagtgc acgaactgag ccgggacaag aaaaaggaca ccgtgccatg gttccccaga 4560 accatccaag agctggacag attcgccaac cagatcctga gctatggcgc cgagctggac 4620 gctgatcacc ctggctttaa ggaccccgtg taccgggcca gaagaaagca gtttgccgat 4680 atcgcctaca actaccggca cggccagcct attcctcggg tcgagtacat ggaagaggaa 4740 aagaaaacct ggggcaccgt gttcaagacc ctgaagtccc tgtacaagac ccacgcctgc 4800 tacgagtaca accacatctt cccactgctc gaaaagtact gcggcttcca cgaggacaat 4860 atccctcagc ttgaggacgt gtcccagttc ctgcagacct gcaccggctt tagactgagg 4920 ccagttgccg gactgctgag cagcagagat tttctcggcg gcctggcctt cagagtgttc 4980 cactgtaccc agtacatcag acacggcagc aagcccatgt acacccctga gcctgatatc 5040 tgccacgagc tgctgggaca tgtgcccctg ttcagcgata gaagcttcgc ccagttcagc 5100 caagagatcg gactggcttc tctgggagcc cctgacgagt acattgagaa gctggccacc 5160 atctactggt tcaccgtgga attcggcctg tgcaagcagg gcgacagcat caaagcttat 5220 ggcgctggcc tgctgtctag cttcggcgag ctgcagtact gtctgagcga gaagcctaag 5280 ctgctgcccc tggaactgga aaagaccgcc atccagaact acaccgtgac cgagttccag 5340 cctctgtact acgtggccga gagcttcaac gacgccaaag aaaaagtgcg gaacttcgcc 5400 gccaccattc ctcggccttt cagcgtcaga tacgacccct acacacagcg gatcgaggtg 5460 ctggacaaca cacagcagct gaaaattctg gccgactcca tcaacagcga gatcggcatc 5520 ctgtgcagcg ccctgcagaa aatcaagtga tagttaatta agagcatctt accgccattt 5580 attcccatat ttgttctgtt tttcttgatt tgggtataca tttaaatgtt aataaaacaa 5640 aatggtgggg caatcattta catttttagg gatatgtaat tactagttca ggtgtattgc 5700 cacaagacaa acatgttaag aaactttccc gttatttacg ctctgttcct gttaatcaac 5760 ctctggatta caaaatttgt gaaagattga ctgatattct taactatgtt gctcctttta 5820 cgctgtgtgg atatgctgct ttatagcctc tgtatctagc tattgcttcc cgtacggctt 5880 tcgttttctc ctccttgtat aaatcctggt tgctgtctct tttagaggag ttgtggcccg 5940 ttgtccgtca acgtggcgtg gtgtgctctg tgtttgctga cgcaaccccc actggctggg 6000 gcattgccac cacctgtcaa ctcctttctg ggactttcgc tttccccctc ccgatcgcca 6060 cggcagaact catcgccgcc tgccttgccc gctgctggac aggggctagg ttgctgggca 6120 ctgataattc cgtggtgttg tctgtgcctt ctagttgcca gccatctgtt gtttgcccct 6180 cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg 6240 aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc 6300 aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct 6360 ctatggctct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca 6420 cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 6480 cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag 6540 cgcgcagctg cctgcagg 6558 <210> 542 <211> 6642 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 542 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgtccaag ccactctaaa gggcaatctg gcagcacttt gtgaaattaa gagtgcatgt 240 tccctatgat tcataatagc accactcttc tatcccagaa aatttctacc ccaggcctat 300 aagggaagaa agataaggaa atttatcaca gtattgtttg gggtggtgaa aaattagcaa 360 tgacttagat gtccataact ggaaaataaa gaagtcaagt gtggcaaata cacactggga 420 tattctgaac catttagaaa agcaaagaac tagatacata ttcagcagca tggctggatc 480 ctaagaacac agttgaaaga aaaaagaaac tatgaaatct atagtacatc catagattgt 540 agtaaatcta tagtgccaca tcacatatcc atgaaaaata catatacgca caaacatttc 600 tatgtatttt acaagttcaa ggctaaacat catattagag aagttgcctc tggggaaagg 660 cagtgagagt gaggaattat gataaaagag aatgaataaa aaaacaagag aagggtcatg 720 taggttttgt ttctgtgcca tgaactcatg gattatgatt aactcaacct tctgcacatg 780 aagataaaca agaaagaact gataaacctg caatggttgg gtaatcttca acttccaaat 840 cagcaaaggt cagctctaag tttgccaagt acacaacttc tcatcttgtg acatgttccc 900 cacctctgtg cagtgttaaa aaatacctca gtggtctact gactgactgt ggatgcttct 960 tctagatgtg cctttttttc ctccatttcc ttagcaccca gcactgctct cattatagca 1020 gcacattgca ttccaaccaa attgaacaaa aaggtggctt aaaaatcatc tgcaagttta 1080 tggcacaagc aatctcttat ttttatctta gtgcataaat aaatttttcc tttttgccag 1140 aataattttt tttaaagaag cgattagttt ttcttctctc agatagcaat gatgtgcttt 1200 cctctcaacc tagatttagg gcatttttat gtgagatagg attaaaaatt ccatttttgt 1260 acaaccacta tggagaacag tttggcagtt ccccaaaaaa ctaaaaatag agctactata 1320 tgatctagtg atcccactgc tgggtatata cctataagaa aggaaatcag tatatcaaag 1380 agatgtctgt tcttttatgt ttgttgcagc actgttcaca atagccaaga tctggaagca 1440 acccaagtct ccatcaacat gggttttaaa aaaatgtggt actttaatac acaatggagt 1500 actattcagc aataaaaaag aatgagatcc tgttatttgc aataacatgg acagaactgg 1560 aggtcattat gtcaaatgaa ataagccagg cacagaaagc caaacatcac atattctcac 1620 tcatatgtgg ggtctaaaaa tcaaaacaat ctgattcatg gagctagaga gtagagagct 1680 aattaccaga ggtggggaag ggtagtaggg gcctggaggg gaggtggaga tggttaatag 1740 gtacaaaaaa atatagaaag aatgaataag acctagtatt tgatagtaca acagggcgaa 1800 tatagtcaaa ataatttaat tatacattta aaaatacctg aaagagtata attggcttgt 1860 ttgcaacaca aaagataaat gcttgagggg atggatgccc cattttcaat gatgtgatta 1920 ttacacattg catgcctgta tcaaaatatt gcacatactc catgaatgca tacatctact 1980 atgttcccac aaaaattaaa cattagaaaa aagagttgca ttttcagctg ttatggggag 2040 aagaaagaaa agctatcatt ttgttgtcct aaaaattatg ttgtcctcat ttcaaacagg 2100 aaagcaaaag tatttgagag ccagtgcagt gccttggtgt tgggtgaaac atagattgaa 2160 tttgggccat ttgtttaaac ttcctaggcc tcagtttctt gcctattaaa agggagtgca 2220 tagttcatgg gattgttaag aggaagaagt gaaaccatgc acgtggagag cgtggcacag 2280 tgtctaagac agagtgtgca tgcaaataag tagataatat tctttgcttt tctttattgc 2340 atgcctgtaa tatttttgga gttgtcacat tcattgccct caagtagcat caagggatga 2400 aattatgttt gtaagaaaat cctgaggctg aggaatacaa catgttttat gtctactaca 2460 ctgaaaaatg ccggagtcag ataaagaata cagattctcc tgaggatgga aatcaagatc 2520 ttcgccttca atatttaaca acattgagct tccaacttac tatgggaaat attcatcagg 2580 cccctaaagg ttccttttgg acagaaattg cacttgttat atctgtattc ttagcagaca 2640 gtagacagcc tggcacatca taaaggctta aggaatccta aatatccctt aaaattctca 2700 ttttaaagac aaaaacaaaa caaaaaaaaa aaacaaaaaa aaactgaggc atgggcttga 2760 ccaaatcagt ggtagaacca agagttaaac cacttgtttt gaatcctaaa cctgagtttt 2820 attttactta tttatttatt tatttgttta tttattttca gatgcttggt caaagaacag 2880 tgggaggaga gggatgggct tccagcaacc tttattattg gcttattttc ttacagccca 2940 ttactttctc ttgggaaaat attaagcagg cactcaaggc ttgaggcccc tgagttttca 3000 catcctttct gaacctctga acctgctttc cagcattctt ttatactttg ttttacctcc 3060 tggtcagtaa tgcctcaccc tcagtcttct ctaaaagtgt ggttaatggc atcttcctga 3120 ctatttgaag accactggcc aaatcccacc agctcactca tagaccatcc ccctacttta 3180 ctttcttcaa aagacttagc cctacctaaa cttatttata tgtttatttt ctgcccacca 3240 gaatggcagc atagctgggg aggcagagtc tgttttgttc attgctgtat tcccaaagac 3300 tagaacacca ccaagcacac ggtacaggtc tcagtaatta ttgtcaaatt tatgtggatt 3360 tgcttttaaa caatatcttc catttactga gtgtttatgt ggaagaactg tactaaattt 3420 taatgcattt ctttattcct attcttaaaa ccttccagca aggtggctct accaccctct 3480 tttccgagct tcaggagcag ttgtgcgaat agctggagaa caccaggctg gatttaaacc 3540 cagatcgctc ttacatttgc tctttacctg ctgtgctcag cgttcacgtg ccctctagct 3600 gtagttttct gaagtcagcg cacagcaagg cagtgtgctt agaggttaac agaagggaaa 3660 acaacaacaa caaaaatcta aatgagaatc ctgactgttt cagctggggg taaggggggc 3720 ggattattca tataattgtt ataccagacg gtcgcaggct tagtccaatt gcagagaact 3780 cgcttcccag gcttctgaga gtcccggaag tgcctaaacc tgtctaatcg acggggcttg 3840 ggtggcccgt cgctccctgg cttcttccct ttacccaggg cgggcagcga agtggtgcct 3900 cctgcgtccc ccacaccctc cctcagcccc tcccctccgg cccgtcctgg gcaggtgacc 3960 tggagcatcc ggcaggctgc cctggcctcc tgcgtcagga caacgcccac gaggggcgtt 4020 actgtgcgga gatgcaccac gcaagagaca ccctttgtaa ctctcttctc ctccctagtg 4080 cgaggttaaa accttcagcc ccacgtgctg tttgcaaacc tgcctgtacc tgaggcccta 4140 aaaagccaga gacctcactc ccggggaaga ggtaagggtt taagggatgg ttggttggtg 4200 gggtattaat gtttaattac ctggagcacc tgcctgaaat cacttttttt caggttggtt 4260 taaaccgcag ccaccatgag caccgccgtg ctggaaaatc ctggcctggg cagaaagctg 4320 agcgacttcg gccaagagac aagctacatc gaggacaact gcaaccagaa cggcgccatc 4380 agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 4440 gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 4500 gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 4560 aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 4620 gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 4680 ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 4740 gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 4800 cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 4860 tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 4920 tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 4980 acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 5040 ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 5100 atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 5160 gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 5220 gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 5280 cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 5340 tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 5400 aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 5460 aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 5520 ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 5580 tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 5640 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 5700 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 5760 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 5820 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 5880 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 5940 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 6000 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 6060 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 6120 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 6180 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 6240 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 6300 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 6360 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 6420 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 6480 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 6540 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 6600 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 6642 <210> 543 <211> 2967 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 543 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 660 gagacctcct acattgagga caactgcaac cagaatggag ccatcagcct gatcttcagc 720 ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 780 aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 840 acccacctgg acaagagatc cctgcctgct ctgaccaaca tcatcaagat cctgagacat 900 gatattggag ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccttgg 960 ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 1020 gagctggatg ctgaccaccc tggatttaag gatcctgtgt acagggccag aaggaagcag 1080 tttgctgaca ttgcctacaa ctacaggcat ggccagccca tccccagggt ggagtacatg 1140 gaggaggaga agaagacctg gggcactgtg ttcaagaccc tgaagagcct gtacaagacc 1200 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260 gaggacaaca tccctcagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 1320 agactgagac ctgtggctgg cctgctgtct agcagagact tcctgggagg cctggccttc 1380 agagtgttcc actgcaccca gtacatcaga catggaagca agcccatgta cacccctgag 1440 ccagacatct gccatgagct gctgggccat gtgcccctgt tctctgatag atcctttgcc 1500 cagttcagcc aggagattgg cctggccagc ctgggagccc ctgatgagta cattgagaag 1560 ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1620 aaggcctatg gagctggact gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1680 aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1740 gagttccagc ccctgtacta tgtggctgag agcttcaatg atgccaagga gaaggtgaga 1800 aactttgctg ccaccatccc cagacccttc tctgtgaggt atgaccccta cacccagagg 1860 attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1920 attggcatcc tgtgctctgc cctgcagaag atcaagtaaa ccttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760 cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820 ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940 gcgagcgagc gcgcagctgc ctgcagg 2967 <210> 544 <211> 2967 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 544 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgtccacag ctgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 660 gagacctcct acattgagga caactgcaac cagaatggag ccatctccct gatcttctcc 720 ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 780 aacctgaccc acattgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 840 acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacat 900 gacattggag ccacagtgca tgagctgtcc agagacaaga agaaggacac agtgccctgg 960 ttccccagaa ccatccagga gctggacaga tttgccaacc agatcctgtc ctatggagct 1020 gagctggatg ctgaccaccc tggcttcaag gaccctgtgt acagggccag aagaaagcag 1080 tttgctgaca ttgcctacaa ctacagacat ggccagccca tccccagagt ggagtacatg 1140 gaggaggaga agaagacctg gggcacagtg ttcaagaccc tgaagtccct gtacaagacc 1200 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260 gaggacaaca tcccccagct ggaggatgtg tcccagttcc tgcagacctg cacaggcttc 1320 agactgagac ctgtggctgg cctgctgtcc tccagagact tcctgggagg cctggccttc 1380 agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 1440 cctgacatct gccatgagct gctgggccat gtgcccctgt tctctgacag atcctttgcc 1500 cagttctccc aggagattgg cctggcctcc ctgggagccc ctgatgagta cattgagaag 1560 ctggccacca tctactggtt cacagtggag tttggcctgt gcaagcaggg agactccatc 1620 aaggcctatg gagctggcct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1680 aagcccaagc tgctgcccct ggagctggag aagacagcca tccagaacta cacagtgaca 1740 gagttccagc ccctgtacta tgtggctgag tccttcaatg atgccaagga gaaggtcaga 1800 aactttgctg ccaccatccc cagacccttc tctgtgagat atgaccccta cacccagaga 1860 attgaggtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactctgag 1920 attggcatcc tgtgctctgc cctgcagaag atcaagtaaa ccttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760 cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820 ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940 gcgagcgagc gcgcagctgc ctgcagg 2967 <210> 545 <211> 3977 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 545 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240 acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300 tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360 caggaaatgg gggagggaca ggagtagggc ggagggtagc ccggggattc tgcagtgaga 420 gcagagggcc agctaagtgg tactctccca gagactgtct gactcacgcc accccctcca 480 ccttggacac aggacgctgt ggtttctgag ccaggtacaa tgactccttt cggtaagtgc 540 agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat 600 cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat 660 attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac 720 agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atgtttaaac 780 cgcagccacc atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga 840 ctttggacag gtaagcctgt tgggcttcca ctgctaggag agaattggtt ccccacatgt 900 gaaagcagtc tgggaaatgc tggtatttcc agtctcctaa ggctactaag aaatatgact 960 ttatttagag gcgaggaaaa tgcccaggaa gtcaactgat gagtctagtc ttaacaagtt 1020 gaggatacag aaagttgggg atctgagctg ctaccaacat ctgtgtgtct ttgggtggct 1080 cattggtatc ctctgcctat tggctttatc ttctgtacac tgaaaggaaa tggctggtcc 1140 ttagtcacct acccaggtct tggatccata gcctacggat gtcccatttt tattgctttt 1200 tatattttgt ctcccagtgt ctttttgagg attttttttt tttttttgca tcacttgctc 1260 ttcctctaag aatctcctga cttcttgtac atgtgtctga tggtcagaat tttagcactg 1320 aagtatgggc gtatttatca taattcaggt ttatatcctt tcagatatgg gctagggtct 1380 ggtattaggg tgctcattaa aaaatgttga tttttgtcag tgtctagtga catcaatgca 1440 taatttaagg ttctataaat tgaaagctaa cccaggagtg actcatcctc tcattgtttt 1500 caacttactt atttctgatc acactgactt ccctgtggaa tacacgtggt tcactgtgtt 1560 ccaaagctta acgagcagaa aaaggttatg ctcgtctctt cttgagaggt tttaagagaa 1620 taattgctaa gctgtgaaaa acattttaac caagtgatct aattatgtag gaaacaagct 1680 atattgaaga caactgcaat caaaacggcg ccatcagcct gatcttcagc ctgaaagaag 1740 aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg aacctgacac 1800 acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc acccacctgg 1860 acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac gacatcggcg 1920 ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg ttccccagaa 1980 ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc gagctggacg 2040 ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag tttgccgata 2100 tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg gaagaggaaa 2160 agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc cacgcctgct 2220 acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac gaggacaata 2280 tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt agactgaggc 2340 cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc agagtgttcc 2400 actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag cctgatatct 2460 gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc cagttcagcc 2520 aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag ctggccacca 2580 tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc aaagcttatg 2640 gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag aagcctaagc 2700 tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc gagttccagc 2760 ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg aacttcgccg 2820 ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg atcgaggtgc 2880 tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag atcggcatcc 2940 tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gagcatctta ccgccattta 3000 ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta ataaaacaaa 3060 atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag gtgtattgcc 3120 acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg ttaatcaacc 3180 tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg ctccttttac 3240 gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc gtacggcttt 3300 cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt tgtggcccgt 3360 tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca ctggctgggg 3420 cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc cgatcgccac 3480 ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt tgctgggcac 3540 tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg tttgcccctc 3600 ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 3660 ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 3720 ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 3780 tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca ttaactacac 3840 ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 3900 actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc 3960 gcgcagctgc ctgcagg 3977 <210> 546 <211> 4061 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 546 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggctt gtactttggt 240 acattggctc ctagttaatc attaacttag caatgtgctt gtactttggt acatagttac 300 ctagttaatc attaacaaac agtatggctt gtactttggt acaagcaaca gatcattcta 360 tgggcgagaa cttgtgcctc cccgtgttcc tgctctttgt ccctctgtcc tacttagact 420 aatatttgcc ttgggtactg caaacaggaa atgggggagg gacaggagta gggcggaggg 480 tagcaattgg attctgcagt gagagcagag ggccagctaa gtggtactct cccagagact 540 gtctgactca cgccaccccc tccaccttgg acacaggacg ctgtggtttc tgagccaggt 600 acaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 660 gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 720 ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 780 cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 840 acctgggaca gtgaatgttt aaaccgcagc caccatgagc accgccgtgc tggaaaatcc 900 tggcttgggc aggaaactct ctgactttgg acaggtaagc ctgttgggct tccactgcta 960 ggagagaatt ggttccccac atgtgaaagc agtctgggaa atgctggtat ttccagtctc 1020 ctaaggctac taagaaatat gactttattt agaggcgagg aaaatgccca ggaagtcaac 1080 tgatgagtct agtcttaaca agttgaggat acagaaagtt ggggatctga gctgctacca 1140 acatctgtgt gtctttgggt ggctcattgg tatcctctgc ctattggctt tatcttctgt 1200 acactgaaag gaaatggctg gtccttagtc acctacccag gtcttggatc catagcctac 1260 ggatgtccca tttttattgc tttttatatt ttgtctccca gtgtcttttt gaggattttt 1320 tttttttttt tgcatcactt gctcttcctc taagaatctc ctgacttctt gtacatgtgt 1380 ctgatggtca gaattttagc actgaagtat gggcgtattt atcataattc aggtttatat 1440 cctttcagat atgggctagg gtctggtatt agggtgctca ttaaaaaatg ttgatttttg 1500 tcagtgtcta gtgacatcaa tgcataattt aaggttctat aaattgaaag ctaacccagg 1560 agtgactcat cctctcattg ttttcaactt acttatttct gatcacactg acttccctgt 1620 ggaatacacg tggttcactg tgttccaaag cttaacgagc agaaaaaggt tatgctcgtc 1680 tcttcttgag aggttttaag agaataattg ctaagctgtg aaaaacattt taaccaagtg 1740 atctaattat gtaggaaaca agctatattg aagacaactg caatcaaaac ggcgccatca 1800 gcctgatctt cagcctgaaa gaagaagtgg gcgccctggc caaggtgctg agactgttcg 1860 aagagaacga cgtgaacctg acacacatcg agagcagacc cagcagactg aagaaggacg 1920 agtacgagtt cttcacccac ctggacaagc ggagcctgcc tgctctgacc aacatcatca 1980 agatcctgcg gcacgacatc ggcgccacag tgcacgaact gagccgggac aagaaaaagg 2040 acaccgtgcc atggttcccc agaaccatcc aagagctgga cagattcgcc aaccagatcc 2100 tgagctatgg cgccgagctg gacgctgatc accctggctt taaggacccc gtgtaccggg 2160 ccagaagaaa gcagtttgcc gatatcgcct acaactaccg gcacggccag cctattcctc 2220 gggtcgagta catggaagag gaaaagaaaa cctggggcac cgtgttcaag accctgaagt 2280 ccctgtacaa gacccacgcc tgctacgagt acaaccacat cttcccactg ctcgaaaagt 2340 actgcggctt ccacgaggac aatatccctc agcttgagga cgtgtcccag ttcctgcaga 2400 cctgcaccgg ctttagactg aggccagttg ccggactgct gagcagcaga gattttctcg 2460 gcggcctggc cttcagagtg ttccactgta cccagtacat cagacacggc agcaagccca 2520 tgtacacccc tgagcctgat atctgccacg agctgctggg acatgtgccc ctgttcagcg 2580 atagaagctt cgcccagttc agccaagaga tcggactggc ttctctggga gcccctgacg 2640 agtacattga gaagctggcc accatctact ggttcaccgt ggaattcggc ctgtgcaagc 2700 agggcgacag catcaaagct tatggcgctg gcctgctgtc tagcttcggc gagctgcagt 2760 actgtctgag cgagaagcct aagctgctgc ccctggaact ggaaaagacc gccatccaga 2820 actacaccgt gaccgagttc cagcctctgt actacgtggc cgagagcttc aacgacgcca 2880 aagaaaaagt gcggaacttc gccgccacca ttcctcggcc tttcagcgtc agatacgacc 2940 cctacacaca gcggatcgag gtgctggaca acacacagca gctgaaaatt ctggccgact 3000 ccatcaacag cgagatcggc atcctgtgca gcgccctgca gaaaatcaag tgatagttaa 3060 ttaagagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat 3120 acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt 3180 aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt 3240 acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat 3300 tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct 3360 agctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc 3420 tcttttagag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc 3480 tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt 3540 cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg 3600 gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg 3660 ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc 3720 cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc 3780 tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag 3840 gcatgctggg gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca 3900 tggcgggtta atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact 3960 ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 4020 ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag g 4061 <210> 547 <211> 4388 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 547 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240 ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300 gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360 ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420 acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag gttgtcctgg 480 cgtggtttag gtagtgtgag agggcttaag agcaacagat cattctatgg gttaatcatt 540 aacaacaggt taggcttgta ctttggtaca ttggctccta gttaatcatt aacttagcaa 600 tgtgcttgta ctttggtaca tagttaccta gttaatcatt aacaaacagt atggcttgta 660 ctttggtaca agcaacagat cattctatgg gcgagaactt gtgcctcccc gtgttcctgc 720 tctttgtccc tctgtcctac ttagactaat atttgccttg ggtactgcaa acaggaaatg 780 ggggagggac aggagtaggg cggagggtag caattggatt ctgcagtgag agcagagggc 840 cagctaagtg gtactctccc agagactgtc tgactcacgc caccccctcc accttggaca 900 caggacgctg tggtttctga gccaggtaca atgactcctt tcggtaagtg cagtggaagc 960 tgtacactgc ccaggcaaag cgtccgggca gcgtaggcgg gcgactcaga tcccagccag 1020 tggacttagc ccctgtttgc tcctccgata actggggtga ccttggttaa tattcaccag 1080 cagcctcccc cgttgcccct ctggatccac tgcttaaata cggacgagga cagggccctg 1140 tctcctcagc ttcaggcacc accactgacc tgggacagtg aatgtttaaa ccgcagccac 1200 catgagcacc gccgtgctgg aaaatcctgg cttgggcagg aaactctctg actttggaca 1260 ggtaagcctg ttgggcttcc actgctagga gagaattggt tccccacatg tgaaagcagt 1320 ctgggaaatg ctggtatttc cagtctccta aggctactaa gaaatatgac tttatttaga 1380 ggcgaggaaa atgcccagga agtcaactga tgagtctagt cttaacaagt tgaggataca 1440 gaaagttggg gatctgagct gctaccaaca tctgtgtgtc tttgggtggc tcattggtat 1500 cctctgccta ttggctttat cttctgtaca ctgaaaggaa atggctggtc cttagtcacc 1560 tacccaggtc ttggatccat agcctacgga tgtcccattt ttattgcttt ttatattttg 1620 tctcccagtg tctttttgag gatttttttt ttttttttgc atcacttgct cttcctctaa 1680 gaatctcctg acttcttgta catgtgtctg atggtcagaa ttttagcact gaagtatggg 1740 cgtatttatc ataattcagg tttatatcct ttcagatatg ggctagggtc tggtattagg 1800 gtgctcatta aaaaatgttg atttttgtca gtgtctagtg acatcaatgc ataatttaag 1860 gttctataaa ttgaaagcta acccaggagt gactcatcct ctcattgttt tcaacttact 1920 tatttctgat cacactgact tccctgtgga atacacgtgg ttcactgtgt tccaaagctt 1980 aacgagcaga aaaaggttat gctcgtctct tcttgagagg ttttaagaga ataattgcta 2040 agctgtgaaa aacattttaa ccaagtgatc taattatgta ggaaacaagc tatattgaag 2100 acaactgcaa tcaaaacggc gccatcagcc tgatcttcag cctgaaagaa gaagtgggcg 2160 ccctggccaa ggtgctgaga ctgttcgaag agaacgacgt gaacctgaca cacatcgaga 2220 gcagacccag cagactgaag aaggacgagt acgagttctt cacccacctg gacaagcgga 2280 gcctgcctgc tctgaccaac atcatcaaga tcctgcggca cgacatcggc gccacagtgc 2340 acgaactgag ccgggacaag aaaaaggaca ccgtgccatg gttccccaga accatccaag 2400 agctggacag attcgccaac cagatcctga gctatggcgc cgagctggac gctgatcacc 2460 ctggctttaa ggaccccgtg taccgggcca gaagaaagca gtttgccgat atcgcctaca 2520 actaccggca cggccagcct attcctcggg tcgagtacat ggaagaggaa aagaaaacct 2580 ggggcaccgt gttcaagacc ctgaagtccc tgtacaagac ccacgcctgc tacgagtaca 2640 accacatctt cccactgctc gaaaagtact gcggcttcca cgaggacaat atccctcagc 2700 ttgaggacgt gtcccagttc ctgcagacct gcaccggctt tagactgagg ccagttgccg 2760 gactgctgag cagcagagat tttctcggcg gcctggcctt cagagtgttc cactgtaccc 2820 agtacatcag acacggcagc aagcccatgt acacccctga gcctgatatc tgccacgagc 2880 tgctgggaca tgtgcccctg ttcagcgata gaagcttcgc ccagttcagc caagagatcg 2940 gactggcttc tctgggagcc cctgacgagt acattgagaa gctggccacc atctactggt 3000 tcaccgtgga attcggcctg tgcaagcagg gcgacagcat caaagcttat ggcgctggcc 3060 tgctgtctag cttcggcgag ctgcagtact gtctgagcga gaagcctaag ctgctgcccc 3120 tggaactgga aaagaccgcc atccagaact acaccgtgac cgagttccag cctctgtact 3180 acgtggccga gagcttcaac gacgccaaag aaaaagtgcg gaacttcgcc gccaccattc 3240 ctcggccttt cagcgtcaga tacgacccct acacacagcg gatcgaggtg ctggacaaca 3300 cacagcagct gaaaattctg gccgactcca tcaacagcga gatcggcatc ctgtgcagcg 3360 ccctgcagaa aatcaagtga tagttaatta agagcatctt accgccattt attcccatat 3420 ttgttctgtt tttcttgatt tgggtataca tttaaatgtt aataaaacaa aatggtgggg 3480 caatcattta catttttagg gatatgtaat tactagttca ggtgtattgc cacaagacaa 3540 acatgttaag aaactttccc gttatttacg ctctgttcct gttaatcaac ctctggatta 3600 caaaatttgt gaaagattga ctgatattct taactatgtt gctcctttta cgctgtgtgg 3660 atatgctgct ttatagcctc tgtatctagc tattgcttcc cgtacggctt tcgttttctc 3720 ctccttgtat aaatcctggt tgctgtctct tttagaggag ttgtggcccg ttgtccgtca 3780 acgtggcgtg gtgtgctctg tgtttgctga cgcaaccccc actggctggg gcattgccac 3840 cacctgtcaa ctcctttctg ggactttcgc tttccccctc ccgatcgcca cggcagaact 3900 catcgccgcc tgccttgccc gctgctggac aggggctagg ttgctgggca ctgataattc 3960 cgtggtgttg tctgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 4020 ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 4080 atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa 4140 gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggctct 4200 agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca cctgcaggag 4260 gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 4320 gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg 4380 cctgcagg 4388 <210> 548 <211> 3972 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 548 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaacaggt tagtttgact agcgttaatc attaacgtta atcattaacg ttaatcatta 240 acgttaatca ttaacgttaa tcattaacat cgatgcgaga acttgtgcct ccccgtgttc 300 ctgctctttg tccctctgtc ctacttagac taatatttgc cttgggtact gcaaacagga 360 aatgggggag ggacaggagt agggcggagg gtagcccggg gattctgcag tgagagcaga 420 gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg 480 gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg 540 aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag 600 ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca 660 ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc 720 cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatgtt taaaccgcag 780 ccaccatgag caccgccgtg ctggaaaatc ctggcttggg caggaaactc tctgactttg 840 gacaggtaag cctgttgggc ttccactgct aggagagaat tggttcccca catgtgaaag 900 cagtctggga aatgctggta tttccagtct cctaaggcta ctaagaaata tgactttatt 960 tagaggcgag gaaaatgccc aggaagtcaa ctgatgagtc tagtcttaac aagttgagga 1020 tacagaaagt tggggatctg agctgctacc aacatctgtg tgtctttggg tggctcattg 1080 gtatcctctg cctattggct ttatcttctg tacactgaaa ggaaatggct ggtccttagt 1140 cacctaccca ggtcttggat ccatagccta cggatgtccc atttttattg ctttttatat 1200 tttgtctccc agtgtctttt tgaggatttt tttttttttt ttgcatcact tgctcttcct 1260 ctaagaatct cctgacttct tgtacatgtg tctgatggtc agaattttag cactgaagta 1320 tgggcgtatt tatcataatt caggtttata tcctttcaga tatgggctag ggtctggtat 1380 tagggtgctc attaaaaaat gttgattttt gtcagtgtct agtgacatca atgcataatt 1440 taaggttcta taaattgaaa gctaacccag gagtgactca tcctctcatt gttttcaact 1500 tacttatttc tgatcacact gacttccctg tggaatacac gtggttcact gtgttccaaa 1560 gcttaacgag cagaaaaagg ttatgctcgt ctcttcttga gaggttttaa gagaataatt 1620 gctaagctgt gaaaaacatt ttaaccaagt gatctaatta tgtaggaaac aagctatatt 1680 gaagacaact gcaatcaaaa cggcgccatc agcctgatct tcagcctgaa agaagaagtg 1740 ggcgccctgg ccaaggtgct gagactgttc gaagagaacg acgtgaacct gacacacatc 1800 gagagcagac ccagcagact gaagaaggac gagtacgagt tcttcaccca cctggacaag 1860 cggagcctgc ctgctctgac caacatcatc aagatcctgc ggcacgacat cggcgccaca 1920 gtgcacgaac tgagccggga caagaaaaag gacaccgtgc catggttccc cagaaccatc 1980 caagagctgg acagattcgc caaccagatc ctgagctatg gcgccgagct ggacgctgat 2040 caccctggct ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc 2100 tacaactacc ggcacggcca gcctattcct cgggtcgagt acatggaaga ggaaaagaaa 2160 acctggggca ccgtgttcaa gaccctgaag tccctgtaca agacccacgc ctgctacgag 2220 tacaaccaca tcttcccact gctcgaaaag tactgcggct tccacgagga caatatccct 2280 cagcttgagg acgtgtccca gttcctgcag acctgcaccg gctttagact gaggccagtt 2340 gccggactgc tgagcagcag agattttctc ggcggcctgg ccttcagagt gttccactgt 2400 acccagtaca tcagacacgg cagcaagccc atgtacaccc ctgagcctga tatctgccac 2460 gagctgctgg gacatgtgcc cctgttcagc gatagaagct tcgcccagtt cagccaagag 2520 atcggactgg cttctctggg agcccctgac gagtacattg agaagctggc caccatctac 2580 tggttcaccg tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct 2640 ggcctgctgt ctagcttcgg cgagctgcag tactgtctga gcgagaagcc taagctgctg 2700 cccctggaac tggaaaagac cgccatccag aactacaccg tgaccgagtt ccagcctctg 2760 tactacgtgg ccgagagctt caacgacgcc aaagaaaaag tgcggaactt cgccgccacc 2820 attcctcggc ctttcagcgt cagatacgac ccctacacac agcggatcga ggtgctggac 2880 aacacacagc agctgaaaat tctggccgac tccatcaaca gcgagatcgg catcctgtgc 2940 agcgccctgc agaaaatcaa gtgatagtta attaagagca tcttaccgcc atttattccc 3000 atatttgttc tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt 3060 ggggcaatca tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag 3120 acaaacatgt taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg 3180 attacaaaat ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt 3240 gtggatatgc tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt 3300 tctcctcctt gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc 3360 gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg 3420 ccaccacctg tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag 3480 aactcatcgc cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata 3540 attccgtggt gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 3600 tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 3660 ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 3720 gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg 3780 ctctagagca tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca 3840 ggaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 3900 ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc agtgagcgag cgagcgcgca 3960 gctgcctgca gg 3972 <210> 549 <211> 4016 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 549 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggtta atcattaact 240 tggctcctag ttaatcatta acaaacagta tggttaatca ttaacaaatt ctggggttaa 300 tcattaacta gttacctagc gagaacttgt gcctccccgt gttcctgctc tttgtccctc 360 tgtcctactt agactaatat ttgccttggg tactgcaaac aggaaatggg ggagggacag 420 gagtagggcg gagggtagca attggattct gcagtgagag cagagggcca gctaagtggt 480 actctcccag agactgtctg actcacgcca ccccctccac cttggacaca ggacgctgtg 540 gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg tacactgccc 600 aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg gacttagccc 660 ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gcctcccccg 720 ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc tcctcagctt 780 caggcaccac cactgacctg ggacagtgaa tgtttaaacc gcagccacca tgagcaccgc 840 cgtgctggaa aatcctggct tgggcaggaa actctctgac tttggacagg taagcctgtt 900 gggcttccac tgctaggaga gaattggttc cccacatgtg aaagcagtct gggaaatgct 960 ggtatttcca gtctcctaag gctactaaga aatatgactt tatttagagg cgaggaaaat 1020 gcccaggaag tcaactgatg agtctagtct taacaagttg aggatacaga aagttgggga 1080 tctgagctgc taccaacatc tgtgtgtctt tgggtggctc attggtatcc tctgcctatt 1140 ggctttatct tctgtacact gaaaggaaat ggctggtcct tagtcaccta cccaggtctt 1200 ggatccatag cctacggatg tcccattttt attgcttttt atattttgtc tcccagtgtc 1260 tttttgagga tttttttttt ttttttgcat cacttgctct tcctctaaga atctcctgac 1320 ttcttgtaca tgtgtctgat ggtcagaatt ttagcactga agtatgggcg tatttatcat 1380 aattcaggtt tatatccttt cagatatggg ctagggtctg gtattagggt gctcattaaa 1440 aaatgttgat ttttgtcagt gtctagtgac atcaatgcat aatttaaggt tctataaatt 1500 gaaagctaac ccaggagtga ctcatcctct cattgttttc aacttactta tttctgatca 1560 cactgacttc cctgtggaat acacgtggtt cactgtgttc caaagcttaa cgagcagaaa 1620 aaggttatgc tcgtctcttc ttgagaggtt ttaagagaat aattgctaag ctgtgaaaaa 1680 cattttaacc aagtgatcta attatgtagg aaacaagcta tattgaagac aactgcaatc 1740 aaaacggcgc catcagcctg atcttcagcc tgaaagaaga agtgggcgcc ctggccaagg 1800 tgctgagact gttcgaagag aacgacgtga acctgacaca catcgagagc agacccagca 1860 gactgaagaa ggacgagtac gagttcttca cccacctgga caagcggagc ctgcctgctc 1920 tgaccaacat catcaagatc ctgcggcacg acatcggcgc cacagtgcac gaactgagcc 1980 gggacaagaa aaaggacacc gtgccatggt tccccagaac catccaagag ctggacagat 2040 tcgccaacca gatcctgagc tatggcgccg agctggacgc tgatcaccct ggctttaagg 2100 accccgtgta ccgggccaga agaaagcagt ttgccgatat cgcctacaac taccggcacg 2160 gccagcctat tcctcgggtc gagtacatgg aagaggaaaa gaaaacctgg ggcaccgtgt 2220 tcaagaccct gaagtccctg tacaagaccc acgcctgcta cgagtacaac cacatcttcc 2280 cactgctcga aaagtactgc ggcttccacg aggacaatat ccctcagctt gaggacgtgt 2340 cccagttcct gcagacctgc accggcttta gactgaggcc agttgccgga ctgctgagca 2400 gcagagattt tctcggcggc ctggccttca gagtgttcca ctgtacccag tacatcagac 2460 acggcagcaa gcccatgtac acccctgagc ctgatatctg ccacgagctg ctgggacatg 2520 tgcccctgtt cagcgataga agcttcgccc agttcagcca agagatcgga ctggcttctc 2580 tgggagcccc tgacgagtac attgagaagc tggccaccat ctactggttc accgtggaat 2640 tcggcctgtg caagcagggc gacagcatca aagcttatgg cgctggcctg ctgtctagct 2700 tcggcgagct gcagtactgt ctgagcgaga agcctaagct gctgcccctg gaactggaaa 2760 agaccgccat ccagaactac accgtgaccg agttccagcc tctgtactac gtggccgaga 2820 gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc caccattcct cggcctttca 2880 gcgtcagata cgacccctac acacagcgga tcgaggtgct ggacaacaca cagcagctga 2940 aaattctggc cgactccatc aacagcgaga tcggcatcct gtgcagcgcc ctgcagaaaa 3000 tcaagtgata gttaattaag agcatcttac cgccatttat tcccatattt gttctgtttt 3060 tcttgatttg ggtatacatt taaatgttaa taaaacaaaa tggtggggca atcatttaca 3120 tttttaggga tatgtaatta ctagttcagg tgtattgcca caagacaaac atgttaagaa 3180 actttcccgt tatttacgct ctgttcctgt taatcaacct ctggattaca aaatttgtga 3240 aagattgact gatattctta actatgttgc tccttttacg ctgtgtggat atgctgcttt 3300 atagcctctg tatctagcta ttgcttcccg tacggctttc gttttctcct ccttgtataa 3360 atcctggttg ctgtctcttt tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt 3420 gtgctctgtg tttgctgacg caacccccac tggctggggc attgccacca cctgtcaact 3480 cctttctggg actttcgctt tccccctccc gatcgccacg gcagaactca tcgccgcctg 3540 ccttgcccgc tgctggacag gggctaggtt gctgggcact gataattccg tggtgttgtc 3600 tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 3660 ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 3720 gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 3780 ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta 3840 cgtagataag tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg 3900 atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 3960 gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcagg 4016 <210> 550 <211> 4343 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 550 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240 ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300 gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360 ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420 acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag gttgtcctgg 480 cgtggtttag gtagtgtgag agggcttaag agcaacagat cattctatgg gttaatcatt 540 aacaacaggt taggttaatc attaacttgg ctcctagtta atcattaaca aacagtatgg 600 ttaatcatta acaaattctg gggttaatca ttaactagtt acctagcgag aacttgtgcc 660 tccccgtgtt cctgctcttt gtccctctgt cctacttaga ctaatatttg ccttgggtac 720 tgcaaacagg aaatggggga gggacaggag tagggcggag ggtagcaatt ggattctgca 780 gtgagagcag agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc 840 cctccacctt ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt 900 aagtgcagtg gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac 960 tcagatccca gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg 1020 gttaatattc accagcagcc tcccccgttg cccctctgga tccactgctt aaatacggac 1080 gaggacaggg ccctgtctcc tcagcttcag gcaccaccac tgacctggga cagtgaatgt 1140 ttaaaccgca gccaccatga gcaccgccgt gctggaaaat cctggcttgg gcaggaaact 1200 ctctgacttt ggacaggtaa gcctgttggg cttccactgc taggagagaa ttggttcccc 1260 acatgtgaaa gcagtctggg aaatgctggt atttccagtc tcctaaggct actaagaaat 1320 atgactttat ttagaggcga ggaaaatgcc caggaagtca actgatgagt ctagtcttaa 1380 caagttgagg atacagaaag ttggggatct gagctgctac caacatctgt gtgtctttgg 1440 gtggctcatt ggtatcctct gcctattggc tttatcttct gtacactgaa aggaaatggc 1500 tggtccttag tcacctaccc aggtcttgga tccatagcct acggatgtcc catttttatt 1560 gctttttata ttttgtctcc cagtgtcttt ttgaggattt tttttttttt tttgcatcac 1620 ttgctcttcc tctaagaatc tcctgacttc ttgtacatgt gtctgatggt cagaatttta 1680 gcactgaagt atgggcgtat ttatcataat tcaggtttat atcctttcag atatgggcta 1740 gggtctggta ttagggtgct cattaaaaaa tgttgatttt tgtcagtgtc tagtgacatc 1800 aatgcataat ttaaggttct ataaattgaa agctaaccca ggagtgactc atcctctcat 1860 tgttttcaac ttacttattt ctgatcacac tgacttccct gtggaataca cgtggttcac 1920 tgtgttccaa agcttaacga gcagaaaaag gttatgctcg tctcttcttg agaggtttta 1980 agagaataat tgctaagctg tgaaaaacat tttaaccaag tgatctaatt atgtaggaaa 2040 caagctatat tgaagacaac tgcaatcaaa acggcgccat cagcctgatc ttcagcctga 2100 aagaagaagt gggcgccctg gccaaggtgc tgagactgtt cgaagagaac gacgtgaacc 2160 tgacacacat cgagagcaga cccagcagac tgaagaagga cgagtacgag ttcttcaccc 2220 acctggacaa gcggagcctg cctgctctga ccaacatcat caagatcctg cggcacgaca 2280 tcggcgccac agtgcacgaa ctgagccggg acaagaaaaa ggacaccgtg ccatggttcc 2340 ccagaaccat ccaagagctg gacagattcg ccaaccagat cctgagctat ggcgccgagc 2400 tggacgctga tcaccctggc tttaaggacc ccgtgtaccg ggccagaaga aagcagtttg 2460 ccgatatcgc ctacaactac cggcacggcc agcctattcc tcgggtcgag tacatggaag 2520 aggaaaagaa aacctggggc accgtgttca agaccctgaa gtccctgtac aagacccacg 2580 cctgctacga gtacaaccac atcttcccac tgctcgaaaa gtactgcggc ttccacgagg 2640 acaatatccc tcagcttgag gacgtgtccc agttcctgca gacctgcacc ggctttagac 2700 tgaggccagt tgccggactg ctgagcagca gagattttct cggcggcctg gccttcagag 2760 tgttccactg tacccagtac atcagacacg gcagcaagcc catgtacacc cctgagcctg 2820 atatctgcca cgagctgctg ggacatgtgc ccctgttcag cgatagaagc ttcgcccagt 2880 tcagccaaga gatcggactg gcttctctgg gagcccctga cgagtacatt gagaagctgg 2940 ccaccatcta ctggttcacc gtggaattcg gcctgtgcaa gcagggcgac agcatcaaag 3000 cttatggcgc tggcctgctg tctagcttcg gcgagctgca gtactgtctg agcgagaagc 3060 ctaagctgct gcccctggaa ctggaaaaga ccgccatcca gaactacacc gtgaccgagt 3120 tccagcctct gtactacgtg gccgagagct tcaacgacgc caaagaaaaa gtgcggaact 3180 tcgccgccac cattcctcgg cctttcagcg tcagatacga cccctacaca cagcggatcg 3240 aggtgctgga caacacacag cagctgaaaa ttctggccga ctccatcaac agcgagatcg 3300 gcatcctgtg cagcgccctg cagaaaatca agtgatagtt aattaagagc atcttaccgc 3360 catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa atgttaataa 3420 aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta gttcaggtgt 3480 attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg ttcctgttaa 3540 tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact atgttgctcc 3600 ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg cttcccgtac 3660 ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag aggagttgtg 3720 gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg 3780 ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc ccctcccgat 3840 cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctaggttgct 3900 gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat ctgttgtttg 3960 cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 4020 aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 4080 ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 4140 gggctctatg gctctagagc atggctacgt agataagtag catggcgggt taatcattaa 4200 ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 4260 tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct cagtgagcga 4320 gcgagcgcgc agctgcctgc agg 4343 <210> 551 <211> 3916 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 551 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 660 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 720 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 780 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 840 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 900 tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 960 agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 1020 catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 1080 caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 1140 cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 1200 catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 1260 tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 1320 cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 1380 gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 1440 cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 1500 ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 1560 agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 1620 ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 1680 ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 1740 agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 1800 ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 1860 cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 1920 gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 1980 tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 2040 caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 2100 ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 2160 gtgcagcgcc ctgcagaaaa tcaagtgata gttaattaag agcatcttac cgccatttat 2220 tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa 2280 tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca 2340 caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct 2400 ctggattaca aaatttgtga aagattgact gatattctta actatgttgc tccttttacg 2460 ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc 2520 gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt 2580 gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc 2640 attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg 2700 gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact 2760 gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt ttgcccctcc 2820 cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 2880 gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 2940 gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 3000 atggccttaa gaacaggtta gtttgactag cgggaggtgg tccctgcagt tacgccaatg 3060 ataacccccg ccagaaaaat cttagtagcc ttcccttttt gttttccgtg ccccaactcg 3120 gcggattgac tcggcccctt ccggaaacac ccgaatcaac ttctagtcaa attattgttc 3180 acgccgcaat gacccacccc tggcccgcgt ctgtggaact gacccctggt gtacaggaga 3240 gttcgctgct gaaagtggtc ccaaaggggt actagttttt aagctcccaa ctccccctcc 3300 cccagcgtct ggaggattcc acaccctcgc accgcagggg cgaggaagtg ggcggagtcc 3360 ggttttggcg ccagccgctg aggctgccaa gcagaaaagc caccgctgag gagactccgg 3420 tcactgtcct cgccccgcct cccccttccc tccccttggg gaccaccggg cgccacgccg 3480 cgaacgttaa gtgccgcggt cgtcggcgcc tccgccctcc cccttgggcc ccaattccca 3540 gcgggcgcgg cgcgcggccc ctccccccgc cgggcgcgcg cccgctgccc cgcccttcgt 3600 ggccgcccgg cgtgggcggt gccacccctc cccccggcgg ccccgcgcgc agctcccggc 3660 tccctccccc ttcggatgtg gcttgagctg taggcgcgga gggccagaga cttcacaacc 3720 tagtttctag agcatggcta cgtagataag tagcatggcg ggttaatcat taactacacc 3780 tgcaggagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg 3900 cgcagctgcc tgcagg 3916 <210> 552 <211> 3916 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 552 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 660 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 720 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 780 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 840 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 900 tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 960 agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 1020 catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 1080 caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 1140 cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 1200 catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 1260 tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 1320 cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 1380 gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 1440 cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 1500 ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 1560 agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 1620 ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 1680 ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 1740 agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 1800 ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 1860 cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 1920 gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 1980 tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 2040 caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 2100 ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 2160 gtgcagcgcc ctgcagaaaa tcaagtgata gttaattaag agcatcttac cgccatttat 2220 tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa 2280 tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca 2340 caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct 2400 ctggattaca aaatttgtga aagattgact gatattctta actatgttgc tccttttacg 2460 ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc 2520 gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt 2580 gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc 2640 attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg 2700 gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact 2760 gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt ttgcccctcc 2820 cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 2880 gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 2940 gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 3000 atggccttaa gaactaggtt gtgaagtctc tggccctccg cgcctacagc tcaagccaca 3060 tccgaagggg gagggagccg ggagctgcgc gcggggccgc cggggggagg ggtggcaccg 3120 cccacgccgg gcggccacga agggcggggc agcgggcgcg cgcccggcgg ggggaggggc 3180 cgcgcgccgc gcccgctggg aattggggcc caagggggag ggcggaggcg ccgacgaccg 3240 cggcacttaa cgttcgcggc gtggcgcccg gtggtcccca aggggaggga agggggaggc 3300 ggggcgagga cagtgaccgg agtctcctca gcggtggctt ttctgcttgg cagcctcagc 3360 ggctggcgcc aaaaccggac tccgcccact tcctcgcccc tgcggtgcga gggtgtggaa 3420 tcctccagac gctgggggag ggggagttgg gagcttaaaa actagtaccc ctttgggacc 3480 actttcagca gcgaactctc ctgtacacca ggggtcagtt ccacagacgc gggccagggg 3540 tgggtcattg cggcgtgaac aataatttga ctagaagttg attcgggtgt ttccggaagg 3600 ggccgagtca atccgccgag ttggggcacg gaaaacaaaa agggaaggct actaagattt 3660 ttctggcggg ggttatcatt ggcgtaactg cagggaccac ctcccgctag tcaaactaac 3720 ctgtttctag agcatggcta cgtagataag tagcatggcg ggttaatcat taactacacc 3780 tgcaggagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg 3900 cgcagctgcc tgcagg 3916 <210> 553 <211> 3916 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 553 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaacaggt tagtttgact agcgggaggt ggtccctgca gttacgccaa tgataacccc 240 cgccagaaaa atcttagtag ccttcccttt ttgttttccg tgccccaact cggcggattg 300 actcggcccc ttccggaaac acccgaatca acttctagtc aaattattgt tcacgccgca 360 atgacccacc cctggcccgc gtctgtggaa ctgacccctg gtgtacagga gagttcgctg 420 ctgaaagtgg tcccaaaggg gtactagttt ttaagctccc aactccccct cccccagcgt 480 ctggaggatt ccacaccctc gcaccgcagg ggcgaggaag tgggcggagt ccggttttgg 540 cgccagccgc tgaggctgcc aagcagaaaa gccaccgctg aggagactcc ggtcactgtc 600 ctcgccccgc ctcccccttc cctccccttg gggaccaccg ggcgccacgc cgcgaacgtt 660 aagtgccgcg gtcgtcggcg cctccgccct cccccttggg ccccaattcc cagcgggcgc 720 ggcgcgcggc ccctcccccc gccgggcgcg cgcccgctgc cccgcccttc gtggccgccc 780 ggcgtgggcg gtgccacccc tccccccggc ggccccgcgc gcagctcccg gctccctccc 840 ccttcggatg tggcttgagc tgtaggcgcg gagggccaga gacttcacaa cctagttcat 900 atgcggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 960 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 1020 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 1080 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 1140 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 1200 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 1260 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 1320 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 1380 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 1440 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 1500 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 1560 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 1620 tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 1680 agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 1740 catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 1800 caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 1860 cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 1920 catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 1980 tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 2040 cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 2100 gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 2160 cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 2220 ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 2280 agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 2340 ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 2400 ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 2460 agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 2520 ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 2580 cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 2640 gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 2700 tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 2760 caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 2820 ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 2880 gtgcagcgcc ctgcagaaaa tcaagtgata gttaattaag agcatcttac cgccatttat 2940 tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa 3000 tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca 3060 caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct 3120 ctggattaca aaatttgtga aagattgact gatattctta actatgttgc tccttttacg 3180 ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc 3240 gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt 3300 gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc 3360 attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg 3420 gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact 3480 gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt ttgcccctcc 3540 cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 3600 gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 3660 gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 3720 atggctctag agcatggcta cgtagataag tagcatggcg ggttaatcat taactacacc 3780 tgcaggagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg 3900 cgcagctgcc tgcagg 3916 <210> 554 <211> 3916 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 554 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaactagg ttgtgaagtc tctggccctc cgcgcctaca gctcaagcca catccgaagg 240 gggagggagc cgggagctgc gcgcggggcc gccgggggga ggggtggcac cgcccacgcc 300 gggcggccac gaagggcggg gcagcgggcg cgcgcccggc ggggggaggg gccgcgcgcc 360 gcgcccgctg ggaattgggg cccaaggggg agggcggagg cgccgacgac cgcggcactt 420 aacgttcgcg gcgtggcgcc cggtggtccc caaggggagg gaagggggag gcggggcgag 480 gacagtgacc ggagtctcct cagcggtggc ttttctgctt ggcagcctca gcggctggcg 540 ccaaaaccgg actccgccca cttcctcgcc cctgcggtgc gagggtgtgg aatcctccag 600 acgctggggg agggggagtt gggagcttaa aaactagtac ccctttggga ccactttcag 660 cagcgaactc tcctgtacac caggggtcag ttccacagac gcgggccagg ggtgggtcat 720 tgcggcgtga acaataattt gactagaagt tgattcgggt gtttccggaa ggggccgagt 780 caatccgccg agttggggca cggaaaacaa aaagggaagg ctactaagat ttttctggcg 840 ggggttatca ttggcgtaac tgcagggacc acctcccgct agtcaaacta acctgttcat 900 atgcggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 960 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 1020 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 1080 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 1140 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 1200 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 1260 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 1320 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 1380 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 1440 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 1500 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 1560 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 1620 tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 1680 agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 1740 catcgagagc agacccagca gactgaagaa ggacgagtac gagttcttca cccacctgga 1800 caagcggagc ctgcctgctc tgaccaacat catcaagatc ctgcggcacg acatcggcgc 1860 cacagtgcac gaactgagcc gggacaagaa aaaggacacc gtgccatggt tccccagaac 1920 catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg agctggacgc 1980 tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt ttgccgatat 2040 cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacatgg aagaggaaaa 2100 gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg tacaagaccc acgcctgcta 2160 cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg aggacaatat 2220 ccctcagctt gaggacgtgt cccagttcct gcagacctgc accggcttta gactgaggcc 2280 agttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca gagtgttcca 2340 ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc ctgatatctg 2400 ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc agttcagcca 2460 agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc tggccaccat 2520 ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca aagcttatgg 2580 cgctggcctg ctgtctagct tcggcgagct gcagtactgt ctgagcgaga agcctaagct 2640 gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg agttccagcc 2700 tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc 2760 caccattcct cggcctttca gcgtcagata cgacccctac acacagcgga tcgaggtgct 2820 ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga tcggcatcct 2880 gtgcagcgcc ctgcagaaaa tcaagtgata gttaattaag agcatcttac cgccatttat 2940 tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa taaaacaaaa 3000 tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg tgtattgcca 3060 caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt taatcaacct 3120 ctggattaca aaatttgtga aagattgact gatattctta actatgttgc tccttttacg 3180 ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tacggctttc 3240 gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt gtggcccgtt 3300 gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac tggctggggc 3360 attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc gatcgccacg 3420 gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gctgggcact 3480 gataattccg tggtgttgtc tgtgccttct agttgccagc catctgttgt ttgcccctcc 3540 cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 3600 gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 3660 gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 3720 atggctctag agcatggcta cgtagataag tagcatggcg ggttaatcat taactacacc 3780 tgcaggagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 3840 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg cctcagtgag cgagcgagcg 3900 cgcagctgcc tgcagg 3916 <210> 555 <211> 3302 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 555 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgctcccttg ccaatagccg gtttaacttg ctataattaa ttcattggta taaactataa 240 acattccaat tgagataggg gagaaatcta gtaatcttct aagcatatgc gggggaggct 300 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 360 acacgcgtgg taccgtctgt ctgcacattt cgtagagcga gtgttccgat actctaatct 420 ccctaggcaa ggttcatatt tgtgtaggtt acttattctc cttttgttga ctaagtcaat 480 aatcagaatc agcaggtttg gagtcagctt ggcagggatc agcagcctgg gttggaagga 540 gggggtataa aagccccttc accaggagaa gccgtcacac agatccacaa gctcctgaag 600 aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta cctggagcac 660 ctgcctgaaa tcactttttt tcaggttggt ttaaaccgca gccaccatga gcaccgccgt 720 gctggaaaat cctggcttgg gcaggaaact ctctgacttt ggacaggtga gccacggcag 780 cctgagctgc tcagttaggg gaatttgggc ctccagagaa agagatccga agactgctgg 840 tgcttcctgg tttcataagc tcagtaagaa gtctgaattc gttggaagct gatgatagaa 900 gaaagagttc atgcttgctt tgtccatgga ggtttaacag gaatgaattg ctaaactgtg 960 gaaaatgttt taaacaaatg catcttatcc tgtaggaaac aagctatatt gaagacaact 1020 gcaatcaaaa cggcgccatc agcctgatct tcagcctgaa agaagaagtg ggcgccctgg 1080 ccaaggtgct gagactgttc gaagagaacg acgtgaacct gacacacatc gagagcagac 1140 ccagcagact gaagaaggac gagtacgagt tcttcaccca cctggacaag cggagcctgc 1200 ctgctctgac caacatcatc aagatcctgc ggcacgacat cggcgccaca gtgcacgaac 1260 tgagccggga caagaaaaag gacaccgtgc catggttccc cagaaccatc caagagctgg 1320 acagattcgc caaccagatc ctgagctatg gcgccgagct ggacgctgat caccctggct 1380 ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc tacaactacc 1440 ggcacggcca gcctattcct cgggtcgagt acatggaaga ggaaaagaaa acctggggca 1500 ccgtgttcaa gaccctgaag tccctgtaca agacccacgc ctgctacgag tacaaccaca 1560 tcttcccact gctcgaaaag tactgcggct tccacgagga caatatccct cagcttgagg 1620 acgtgtccca gttcctgcag acctgcaccg gctttagact gaggccagtt gccggactgc 1680 tgagcagcag agattttctc ggcggcctgg ccttcagagt gttccactgt acccagtaca 1740 tcagacacgg cagcaagccc atgtacaccc ctgagcctga tatctgccac gagctgctgg 1800 gacatgtgcc cctgttcagc gatagaagct tcgcccagtt cagccaagag atcggactgg 1860 cttctctggg agcccctgac gagtacattg agaagctggc caccatctac tggttcaccg 1920 tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt 1980 ctagcttcgg cgagctgcag tactgtctga gcgagaagcc taagctgctg cccctggaac 2040 tggaaaagac cgccatccag aactacaccg tgaccgagtt ccagcctctg tactacgtgg 2100 ccgagagctt caacgacgcc aaagaaaaag tgcggaactt cgccgccacc attcctcggc 2160 ctttcagcgt cagatacgac ccctacacac agcggatcga ggtgctggac aacacacagc 2220 agctgaaaat tctggccgac tccatcaaca gcgagatcgg catcctgtgc agcgccctgc 2280 agaaaatcaa gtgatagtta attaagagca tcttaccgcc atttattccc atatttgttc 2340 tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 2400 tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 2460 taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 2520 ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 2580 tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt 2640 gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg 2700 cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 2760 tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 2820 cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 2880 gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 2940 gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3000 ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3060 ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca 3120 tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca ggaggaaccc 3180 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3240 ccaaaggtcg cccgacgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 3300 gg 3302 <210> 556 <211> 3402 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 556 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcttctttg aatgttgtta tagagccacc ttgatgcctt gttagtgatg gttgctccta 240 tagtagtatt cctgtgatgc aaggtaaata tattgaagac ctgctgtaga catgaagcag 300 aacttgagtc ctgttgagtt aactgtgcta ctactattct gaagaaaata gtgtctacag 360 ctggaatgag ttggttgctc taccatatgc gggggaggct gctggtgaat attaaccaag 420 gtcaccccag ttatcggagg agcaaacagg ggctaagtcc acacgcgtgg taccgtctgt 480 ctgcacattt cgtagagcga gtgttccgat actctaatct ccctaggcaa ggttcatatt 540 tgtgtaggtt acttattctc cttttgttga ctaagtcaat aatcagaatc agcaggtttg 600 gagtcagctt ggcagggatc agcagcctgg gttggaagga gggggtataa aagccccttc 660 accaggagaa gccgtcacac agatccacaa gctcctgaag aggtaagggt ttaagggatg 720 gttggttggt ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt 780 tcaggttggt ttaaaccgca gccaccatga gcaccgccgt gctggaaaat cctggcttgg 840 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 900 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 960 tcagtaagaa gtctgaattc gttggaagct gatgatagaa gaaagagttc atgcttgctt 1020 tgtccatgga ggtttaacag gaatgaattg ctaaactgtg gaaaatgttt taaacaaatg 1080 catcttatcc tgtaggaaac aagctatatt gaagacaact gcaatcaaaa cggcgccatc 1140 agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1200 gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1260 gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1320 aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1380 gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1440 ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1500 gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1560 cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1620 tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1680 tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1740 acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1800 ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1860 atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1920 gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1980 gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 2040 cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 2100 tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 2160 aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2220 aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2280 ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2340 tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2400 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2460 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2520 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2580 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2640 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2700 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2760 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2820 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2880 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2940 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 3000 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 3060 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 3120 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3180 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3240 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3300 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3360 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3402 <210> 557 <211> 3402 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 557 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcctaggcc taagatcata ctgtgattag ttacatataa cccagtttaa cagtattgag 240 cttgctaagg aactttagct tcaggtatac tattttcaag ccatcagctt aataactata 300 aatataccac tgctgggtga tgatattaga attagggtct agtaaaggat agacagtggc 360 attatgacta tatttcaaaa atacatatgc gggggaggct gctggtgaat attaaccaag 420 gtcaccccag ttatcggagg agcaaacagg ggctaagtcc acacgcgtgg taccgtctgt 480 ctgcacattt cgtagagcga gtgttccgat actctaatct ccctaggcaa ggttcatatt 540 tgtgtaggtt acttattctc cttttgttga ctaagtcaat aatcagaatc agcaggtttg 600 gagtcagctt ggcagggatc agcagcctgg gttggaagga gggggtataa aagccccttc 660 accaggagaa gccgtcacac agatccacaa gctcctgaag aggtaagggt ttaagggatg 720 gttggttggt ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt 780 tcaggttggt ttaaaccgca gccaccatga gcaccgccgt gctggaaaat cctggcttgg 840 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 900 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 960 tcagtaagaa gtctgaattc gttggaagct gatgatagaa gaaagagttc atgcttgctt 1020 tgtccatgga ggtttaacag gaatgaattg ctaaactgtg gaaaatgttt taaacaaatg 1080 catcttatcc tgtaggaaac aagctatatt gaagacaact gcaatcaaaa cggcgccatc 1140 agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1200 gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1260 gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1320 aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1380 gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 1440 ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 1500 gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 1560 cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 1620 tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 1680 tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 1740 acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 1800 ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 1860 atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 1920 gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 1980 gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 2040 cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 2100 tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 2160 aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2220 aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2280 ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2340 tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 2400 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 2460 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 2520 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 2580 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 2640 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 2700 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 2760 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 2820 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 2880 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 2940 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 3000 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 3060 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 3120 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3180 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3240 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3300 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3360 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 3402 <210> 558 <211> 3602 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 558 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcttctttg aatgttgtta tagagccacc ttgatgcctt gttagtgatg gttgctccta 240 tagtagtatt cctgtgatgc aaggtaaata tattgaagac ctgctgtaga catgaagcag 300 aacttgagtc ctgttgagtt aactgtgcta ctactattct gaagaaaata gtgtctacag 360 ctggaatgag ttggttgctc tacctaggcc taagatcata ctgtgattag ttacatataa 420 cccagtttaa cagtattgag cttgctaagg aactttagct tcaggtatac tattttcaag 480 ccatcagctt aataactata aatataccac tgctgggtga tgatattaga attagggtct 540 agtaaaggat agacagtggc attatgacta tatttcaaaa atacatatgc gggggaggct 600 gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg ggctaagtcc 660 acacgcgtgg taccgtctgt ctgcacattt cgtagagcga gtgttccgat actctaatct 720 ccctaggcaa ggttcatatt tgtgtaggtt acttattctc cttttgttga ctaagtcaat 780 aatcagaatc agcaggtttg gagtcagctt ggcagggatc agcagcctgg gttggaagga 840 gggggtataa aagccccttc accaggagaa gccgtcacac agatccacaa gctcctgaag 900 aggtaagggt ttaagggatg gttggttggt ggggtattaa tgtttaatta cctggagcac 960 ctgcctgaaa tcactttttt tcaggttggt ttaaaccgca gccaccatga gcaccgccgt 1020 gctggaaaat cctggcttgg gcaggaaact ctctgacttt ggacaggtga gccacggcag 1080 cctgagctgc tcagttaggg gaatttgggc ctccagagaa agagatccga agactgctgg 1140 tgcttcctgg tttcataagc tcagtaagaa gtctgaattc gttggaagct gatgatagaa 1200 gaaagagttc atgcttgctt tgtccatgga ggtttaacag gaatgaattg ctaaactgtg 1260 gaaaatgttt taaacaaatg catcttatcc tgtaggaaac aagctatatt gaagacaact 1320 gcaatcaaaa cggcgccatc agcctgatct tcagcctgaa agaagaagtg ggcgccctgg 1380 ccaaggtgct gagactgttc gaagagaacg acgtgaacct gacacacatc gagagcagac 1440 ccagcagact gaagaaggac gagtacgagt tcttcaccca cctggacaag cggagcctgc 1500 ctgctctgac caacatcatc aagatcctgc ggcacgacat cggcgccaca gtgcacgaac 1560 tgagccggga caagaaaaag gacaccgtgc catggttccc cagaaccatc caagagctgg 1620 acagattcgc caaccagatc ctgagctatg gcgccgagct ggacgctgat caccctggct 1680 ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc tacaactacc 1740 ggcacggcca gcctattcct cgggtcgagt acatggaaga ggaaaagaaa acctggggca 1800 ccgtgttcaa gaccctgaag tccctgtaca agacccacgc ctgctacgag tacaaccaca 1860 tcttcccact gctcgaaaag tactgcggct tccacgagga caatatccct cagcttgagg 1920 acgtgtccca gttcctgcag acctgcaccg gctttagact gaggccagtt gccggactgc 1980 tgagcagcag agattttctc ggcggcctgg ccttcagagt gttccactgt acccagtaca 2040 tcagacacgg cagcaagccc atgtacaccc ctgagcctga tatctgccac gagctgctgg 2100 gacatgtgcc cctgttcagc gatagaagct tcgcccagtt cagccaagag atcggactgg 2160 cttctctggg agcccctgac gagtacattg agaagctggc caccatctac tggttcaccg 2220 tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt 2280 ctagcttcgg cgagctgcag tactgtctga gcgagaagcc taagctgctg cccctggaac 2340 tggaaaagac cgccatccag aactacaccg tgaccgagtt ccagcctctg tactacgtgg 2400 ccgagagctt caacgacgcc aaagaaaaag tgcggaactt cgccgccacc attcctcggc 2460 ctttcagcgt cagatacgac ccctacacac agcggatcga ggtgctggac aacacacagc 2520 agctgaaaat tctggccgac tccatcaaca gcgagatcgg catcctgtgc agcgccctgc 2580 agaaaatcaa gtgatagtta attaagagca tcttaccgcc atttattccc atatttgttc 2640 tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 2700 tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 2760 taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 2820 ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 2880 tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt 2940 gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg 3000 cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 3060 tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 3120 cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 3180 gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 3240 gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3300 ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3360 ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca 3420 tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca ggaggaaccc 3480 ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3540 ccaaaggtcg cccgacgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 3600 gg 3602 <210> 559 <211> 4002 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 559 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcctgtcta gctcctcttc tgtcattgca acctctgtaa gggttttagt tctccttatt 240 ttttatgtct tgctctggta gtgctgacag aagcataata gtaagagtac tgtggatgta 300 cataaagcag caggcagggc taccaacctt agcctggcaa ctcatgatac tgtctgttca 360 tggactttta agttgcataa gaggaagctt tattcctgat agtgatagta gcttcaaatg 420 ttgtaagttc agcaaaatga gccaattatc agggcataat ccactattct tcacaacaag 480 gtgctctagt gaatttaggt cctctggagc agtatttcaa tctactaata ggggctctgc 540 aagatggtgg cagaggcttt ccaactgtac tctgtgctct tgttaccagt cagcttggta 600 cactccatac aaagtccagc aattgttttt gaattagggt gggtacactc ctggcataac 660 agaatgtccc tgcaatcaaa agtcctagtc cacatgattg attgacctta tactgaagag 720 taccctgtgg accaagtcaa tctgcagatg ctacattaac aataaatgtt aattacttca 780 ctagggatta gtctgttatt ttacaccttt ttcaaacctc tggcacttgc ataccattgt 840 agctaagata tgcttctatg aaatagccac cacaggtgat aagtccccct acacagcaat 900 cttagagcaa tattatccag agattgttgc agcagaaact gctgtatgct ttttacctca 960 cacactccta atgagctttt acccatatgc gggggaggct gctggtgaat attaaccaag 1020 gtcaccccag ttatcggagg agcaaacagg ggctaagtcc acacgcgtgg taccgtctgt 1080 ctgcacattt cgtagagcga gtgttccgat actctaatct ccctaggcaa ggttcatatt 1140 tgtgtaggtt acttattctc cttttgttga ctaagtcaat aatcagaatc agcaggtttg 1200 gagtcagctt ggcagggatc agcagcctgg gttggaagga gggggtataa aagccccttc 1260 accaggagaa gccgtcacac agatccacaa gctcctgaag aggtaagggt ttaagggatg 1320 gttggttggt ggggtattaa tgtttaatta cctggagcac ctgcctgaaa tcactttttt 1380 tcaggttggt ttaaaccgca gccaccatga gcaccgccgt gctggaaaat cctggcttgg 1440 gcaggaaact ctctgacttt ggacaggtga gccacggcag cctgagctgc tcagttaggg 1500 gaatttgggc ctccagagaa agagatccga agactgctgg tgcttcctgg tttcataagc 1560 tcagtaagaa gtctgaattc gttggaagct gatgatagaa gaaagagttc atgcttgctt 1620 tgtccatgga ggtttaacag gaatgaattg ctaaactgtg gaaaatgttt taaacaaatg 1680 catcttatcc tgtaggaaac aagctatatt gaagacaact gcaatcaaaa cggcgccatc 1740 agcctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct gagactgttc 1800 gaagagaacg acgtgaacct gacacacatc gagagcagac ccagcagact gaagaaggac 1860 gagtacgagt tcttcaccca cctggacaag cggagcctgc ctgctctgac caacatcatc 1920 aagatcctgc ggcacgacat cggcgccaca gtgcacgaac tgagccggga caagaaaaag 1980 gacaccgtgc catggttccc cagaaccatc caagagctgg acagattcgc caaccagatc 2040 ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc cgtgtaccgg 2100 gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca gcctattcct 2160 cgggtcgagt acatggaaga ggaaaagaaa acctggggca ccgtgttcaa gaccctgaag 2220 tccctgtaca agacccacgc ctgctacgag tacaaccaca tcttcccact gctcgaaaag 2280 tactgcggct tccacgagga caatatccct cagcttgagg acgtgtccca gttcctgcag 2340 acctgcaccg gctttagact gaggccagtt gccggactgc tgagcagcag agattttctc 2400 ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg cagcaagccc 2460 atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc cctgttcagc 2520 gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg agcccctgac 2580 gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg cctgtgcaag 2640 cagggcgaca gcatcaaagc ttatggcgct ggcctgctgt ctagcttcgg cgagctgcag 2700 tactgtctga gcgagaagcc taagctgctg cccctggaac tggaaaagac cgccatccag 2760 aactacaccg tgaccgagtt ccagcctctg tactacgtgg ccgagagctt caacgacgcc 2820 aaagaaaaag tgcggaactt cgccgccacc attcctcggc ctttcagcgt cagatacgac 2880 ccctacacac agcggatcga ggtgctggac aacacacagc agctgaaaat tctggccgac 2940 tccatcaaca gcgagatcgg catcctgtgc agcgccctgc agaaaatcaa gtgatagtta 3000 attaagagca tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta 3060 tacatttaaa tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg 3120 taattactag ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt 3180 tacgctctgt tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata 3240 ttcttaacta tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc 3300 tagctattgc ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt 3360 ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg 3420 ctgacgcaac ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt 3480 tcgctttccc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct 3540 ggacaggggc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt 3600 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 3660 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 3720 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 3780 ggcatgctgg ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc 3840 atggcgggtt aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac 3900 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3960 gggcggcctc agtgagcgag cgagcgcgca gctgcctgca gg 4002 <210> 560 <211> 3840 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 560 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240 ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300 gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360 ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420 acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag gttgtcctgg 480 cgtggtttag gtagtgtgag agggtccggg ttcaaaacca cttgctgggt ggggagtcgt 540 cagtaagtgg ctatgccccg accccgaagc ctgtttcccc atctgtacaa tggaaatgat 600 aaagacgccc atctgatagg gtttttgtgg caaataaaca tttggttttt ttgttttgtt 660 ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca ggctggagtg cagtgacaca 720 atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg attacaagca 780 tgtgccacca cacctggcta attttctatt tttagtagag acgggtttct ccatgttggt 840 cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc cggctaattt 900 tttctatttt tgacagggac ggggtttcac catgttggtc aggctggtct agaggtactg 960 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 1020 agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 1080 gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 1140 ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 1200 tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 1260 cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 1320 cagcttcagg caccaccact gacctgggac agtgaataat tactctaagg taaatataaa 1380 atttttaagt gtataatgtg ttaaactact gattctaatt gtttctctct tttagattcc 1440 aacctttgga actgagttta aaccgcagcc accatgagta cagcagtgtt agagaatcca 1500 ggcctaggta gaaagctgtc tgactttggc caggagacct cctacattga ggacaactgc 1560 aaccagaatg gagccatcag cctgatcttc agcctgaagg aggaggtggg agccctggcc 1620 aaggtgctga gactgtttga ggagaatgat gtgaacctga cccacattga gtccagaccc 1680 tccagactga agaaggatga gtatgagttc ttcacccacc tggacaagag atccctgcct 1740 gctctgacca acatcatcaa gatcctgaga catgatattg gagccacagt gcatgagctg 1800 agcagggaca agaagaagga cacagtgcct tggttcccca gaaccatcca ggagctggac 1860 aggtttgcca accagatcct gtcctatgga gctgagctgg atgctgacca ccctggattt 1920 aaggatcctg tgtacagggc cagaaggaag cagtttgctg acattgccta caactacagg 1980 catggccagc ccatccccag ggtggagtac atggaggagg agaagaagac ctggggcact 2040 gtgttcaaga ccctgaagag cctgtacaag acccatgcct gctatgagta caaccacatc 2100 ttccccctgc tggagaagta ctgtggcttc catgaggaca acatccctca gctggaggat 2160 gtgtcccagt tcctgcagac ctgcacaggc ttcagactga gacctgtggc tggcctgctg 2220 tctagcagag acttcctggg aggcctggcc ttcagagtgt tccactgcac ccagtacatc 2280 agacatggaa gcaagcccat gtacacccct gagccagaca tctgccatga gctgctgggc 2340 catgtgcccc tgttctctga tagatccttt gcccagttca gccaggagat tggcctggcc 2400 agcctgggag cccctgatga gtacattgag aagctggcca ccatctactg gttcacagtg 2460 gagtttggcc tgtgcaagca gggagactcc atcaaggcct atggagctgg actgctgtcc 2520 tcctttggag agctgcagta ctgcctgtct gagaagccca agctgctgcc cctggagctg 2580 gagaagacag ccatccagaa ctacacagtg acagagttcc agcccctgta ctatgtggct 2640 gagagcttca atgatgccaa ggagaaggtg agaaactttg ctgccaccat ccccagaccc 2700 ttctctgtga ggtatgaccc ctacacccag aggattgagg tgctggacaa cacccagcag 2760 ctgaagatcc tggctgactc catcaactct gagattggca tcctgtgctc tgccctgcag 2820 aagatcaagt aaaccttaat taagagcatc ttaccgccat ttattcccat atttgttctg 2880 tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt 2940 tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta 3000 agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt 3060 gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg 3120 ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt 3180 ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg 3240 tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc 3300 aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg 3360 cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt 3420 tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 3480 ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 3540 gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 3600 attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg 3660 gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct 3720 agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc 3780 aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3840 <210> 561 <211> 3840 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 561 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcaggctca gaggcacaca ggagtttctg ggctcaccct gcccccttcc aacccctcag 240 ttcccatcct ccagcagctg tttgtgtgct gcctctgaag tccacactga acaaacttca 300 gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag caaacagcaa acacacagcc 360 ctccctgcct gctgaccttg gagctggggc agaggtcaga gacctctctg ggcccatgcc 420 acctccaaca tccactcgac cccttggaat ttcggtggag aggagcagag gttgtcctgg 480 cgtggtttag gtagtgtgag agggtccggg ttcaaaacca cttgctgggt ggggagtcgt 540 cagtaagtgg ctatgccccg accccgaagc ctgtttcccc atctgtacaa tggaaatgat 600 aaagacgccc atctgatagg gtttttgtgg caaataaaca tttggttttt ttgttttgtt 660 ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca ggctggagtg cagtgacaca 720 atctcatctc accacaacct tcccctgcct cagcctccca agtagctggg attacaagca 780 tgtgccacca cacctggcta attttctatt tttagtagag acgggtttct ccatgttggt 840 cagcctcagc ctcccaagta actgggatta caggcctgtg ccaccacacc cggctaattt 900 tttctatttt tgacagggac ggggtttcac catgttggtc aggctggtct agaggtactg 960 gatcttgcta ccagtggaac agccactaag gattctgcag tgagagcaga gggccagcta 1020 agtggtactc tcccagagac tgtctgactc acgccacccc ctccaccttg gacacaggac 1080 gctgtggttt ctgagccagg tacaatgact cctttcggta agtgcagtgg aagctgtaca 1140 ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact 1200 tagcccctgt ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct 1260 cccccgttgc ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct 1320 cagcttcagg caccaccact gacctgggac agtgaataat tactctaagg taaatataaa 1380 atttttaagt gtataatgtg ttaaactact gattctaatt gtttctctct tttagattcc 1440 aacctttgga actgagttta aaccgcagcc accatgtcca cagctgtgct ggagaaccct 1500 ggcctgggca gaaagctgtc tgactttggc caggagacct cctacattga ggacaactgc 1560 aaccagaatg gagccatctc cctgatcttc tccctgaagg aggaggtggg agccctggcc 1620 aaggtgctga gactgtttga ggagaatgat gtgaacctga cccacattga gtccagaccc 1680 tccagactga agaaggatga gtatgagttc ttcacccacc tggacaagag atccctgcct 1740 gccctgacca acatcatcaa gatcctgaga catgacattg gagccacagt gcatgagctg 1800 tccagagaca agaagaagga cacagtgccc tggttcccca gaaccatcca ggagctggac 1860 agatttgcca accagatcct gtcctatgga gctgagctgg atgctgacca ccctggcttc 1920 aaggaccctg tgtacagggc cagaagaaag cagtttgctg acattgccta caactacaga 1980 catggccagc ccatccccag agtggagtac atggaggagg agaagaagac ctggggcaca 2040 gtgttcaaga ccctgaagtc cctgtacaag acccatgcct gctatgagta caaccacatc 2100 ttccccctgc tggagaagta ctgtggcttc catgaggaca acatccccca gctggaggat 2160 gtgtcccagt tcctgcagac ctgcacaggc ttcagactga gacctgtggc tggcctgctg 2220 tcctccagag acttcctggg aggcctggcc ttcagagtgt tccactgcac ccagtacatc 2280 agacatggct ccaagcccat gtacacccct gagcctgaca tctgccatga gctgctgggc 2340 catgtgcccc tgttctctga cagatccttt gcccagttct cccaggagat tggcctggcc 2400 tccctgggag cccctgatga gtacattgag aagctggcca ccatctactg gttcacagtg 2460 gagtttggcc tgtgcaagca gggagactcc atcaaggcct atggagctgg cctgctgtcc 2520 tcctttggag agctgcagta ctgcctgtct gagaagccca agctgctgcc cctggagctg 2580 gagaagacag ccatccagaa ctacacagtg acagagttcc agcccctgta ctatgtggct 2640 gagtccttca atgatgccaa ggagaaggtc agaaactttg ctgccaccat ccccagaccc 2700 ttctctgtga gatatgaccc ctacacccag agaattgagg tgctggacaa cacccagcag 2760 ctgaagatcc tggctgactc catcaactct gagattggca tcctgtgctc tgccctgcag 2820 aagatcaagt aaaccttaat taagagcatc ttaccgccat ttattcccat atttgttctg 2880 tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt 2940 tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta 3000 agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt 3060 gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg 3120 ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt 3180 ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg 3240 tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc 3300 aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg 3360 cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt 3420 tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 3480 ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 3540 gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 3600 attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg 3660 gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct 3720 agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc 3780 aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3840 <210> 562 <211> 2967 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 562 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgtcaactg cagtgttaga gaacccaggc cttggtagaa agctttcaga ctttggacaa 660 gaaaccagct acattgaaga taactgcaac cagaatggtg ccatctccct gatcttcagc 720 ctgaaggaag aagtgggagc cctggccaag gtcctgaggc tctttgaaga gaatgatgtg 780 aacctcaccc acattgagtc cagacccagc aggctcaaga aggatgagta tgaattcttc 840 acccacctgg ataagaggtc cctccctgcc ctcaccaaca tcatcaagat cctgagacat 900 gacattgggg ccactgtcca tgaactgtcc agggacaaga agaaggacac tgtgccctgg 960 ttcccaagga ccatccagga actggacaga tttgccaacc aaatcctgtc ctatggtgct 1020 gagctggatg ctgaccaccc tggattcaag gaccctgtgt acagagccag aaggaaacag 1080 tttgcagaca ttgcctacaa ctacagacat gggcagccta tcccaagagt ggagtacatg 1140 gaagaagaga agaaaacctg gggcactgtg ttcaagaccc ttaagtccct gtacaagacc 1200 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260 gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacttg cactgggttc 1320 aggctgaggc ctgtggctgg cctgctgagc tccagagact tcttgggtgg actggccttc 1380 agagtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 1440 cctgacatct gtcatgaact cctgggccat gtgcccttgt tcagtgacag aagctttgcc 1500 cagttcagcc aggaaattgg ccttgcctcc ctgggagccc ctgatgagta cattgaaaag 1560 ctagccacca tctactggtt cactgtggaa tttggcttgt gcaaacaggg agactccatc 1620 aaggcctatg gagctggact gctgtcctcc tttggggaac tgcagtactg cctctctgag 1680 aagcccaagc tcctgcccct ggaactggag aaaacagcca tccagaacta cactgtcact 1740 gagttccagc ccctctacta tgtggcagag agcttcaatg atgccaagga aaaagtcaga 1800 aactttgctg ccaccatccc aaggccattc tcagtcagat atgaccccta cacccaaagg 1860 attgaagtgc tggacaacac ccagcagctc aagatcttgg cagactccat aaactcagag 1920 attggaatcc tgtgctctgc cctgcaaaag attaagtaaa ccttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760 cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820 ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940 gcgagcgagc gcgcagctgc ctgcagg 2967 <210> 563 <211> 2967 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 563 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgtcaactg ctgtgctgga aaaccctgga ttaggaagaa agctctcaga ctttggtcaa 660 gaaacctcct acattgagga caactgcaac cagaatggtg ccatctccct catcttctcc 720 ctgaaagagg aagtgggagc cctggccaag gtcctgaggc tctttgagga aaatgatgtc 780 aacctgaccc acattgagtc caggcccagc agactgaaga aggatgagta tgaattcttc 840 acccacctgg acaagagaag cctccctgcc ctcaccaaca tcatcaagat cctcagacat 900 gacattggag ccactgtgca tgaactcagc agagacaaga agaaggacac tgtgccatgg 960 ttccctagga ccatccagga actggatagg tttgccaacc aaatcctctc ctatggagca 1020 gagctggatg cagaccaccc tggattcaag gacccagtgt acagggccag gaggaaacag 1080 tttgcagaca ttgcctacaa ctacagacat ggccagccca tccctagagt ggagtacatg 1140 gaagaagaga agaaaacctg gggcactgtg ttcaagaccc tgaagtccct gtacaagacc 1200 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260 gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacttg cactggattc 1320 aggcttagac ctgtggctgg cctgttgagc agcagagact tcctgggagg gctggccttc 1380 agagtgttcc actgtaccca gtacatcaga catggctcca agcccatgta cacccctgag 1440 cctgacatct gccatgaatt gcttggccat gtgcccctgt tcagtgatag atcctttgcc 1500 caattctccc aagaaattgg cctggccagc cttggagccc ctgatgagta cattgaaaag 1560 cttgccacca tctactggtt cactgtggaa tttggcctgt gcaaacaggg ggactccata 1620 aaggcctatg gtgctggact gctgtcctcc tttggggaac tgcagtactg cttgtcagag 1680 aagcccaagt tgctgcccct ggaactggaa aagacagcca tccagaacta cactgtcact 1740 gagttccagc ccctctacta tgtggcagag agcttcaatg atgccaagga aaaagtcaga 1800 aactttgctg ccaccatccc aaggccattc tcagtcagat atgacccata cacccagagg 1860 attgaagtgc tggacaacac ccagcagctg aagatcctgg ctgactccat caactcagag 1920 attgggatcc tgtgctctgc cctccaaaag attaagtaaa ccttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760 cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820 ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940 gcgagcgagc gcgcagctgc ctgcagg 2967 <210> 564 <211> 2967 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 564 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgtccactg ctgtccttga aaaccctggc cttggtagaa agctctctga ttttggacaa 660 gaaaccagct acattgagga caactgcaac cagaatggtg ccatctcact aatcttcagc 720 ctgaaggaag aagtgggagc cctggccaag gtcttgagac tctttgagga aaatgatgtc 780 aacctcaccc acattgagtc caggccatcc agactcaaga aggatgagta tgaattcttc 840 acccacctgg acaagaggtc cttgcctgcc ctcacaaaca tcatcaagat cctgagacat 900 gacattgggg ccactgtgca tgagctgtcc agagacaaga aaaaggacac tgtgccttgg 960 ttcccaagaa ccatccagga actggacaga tttgccaacc aaatcctgag ctatggggct 1020 gagttggatg cagaccaccc tggattcaag gacccagtgt acagggccag gagaaagcag 1080 tttgcagaca ttgcctacaa ctacagacat ggccagccca tcccaagggt ggagtacatg 1140 gaagaggaaa agaaaacctg gggcactgtg ttcaagaccc tgaagtccct gtacaagacc 1200 catgcctgct atgagtacaa ccacatcttc cccctcctgg aaaagtactg tggcttccat 1260 gaggacaaca tcccccagct ggaagatgtg tcccagttcc tccaaacctg tactgggttc 1320 aggctgaggc ctgtggctgg actgctgagc tccagggact tcctgggtgg actggccttc 1380 agggtgttcc actgcaccca gtacatcaga catggatcca agcccatgta cacccctgag 1440 cctgacattt gccatgaact gctgggccat gtgcccttgt tcagtgatag aagctttgcc 1500 cagttctccc aagaaattgg cctggcctcc ctgggagccc ctgatgagta cattgaaaag 1560 cttgccacca tctactggtt cactgtggaa tttggcctgt gcaaacaggg agactccatc 1620 aaggcctatg gagctgggct cctgagctcc tttggagagc tccagtactg cctgtcagag 1680 aagcccaagc tcctgcccct ggaacttgaa aagactgcca tccagaacta cactgtgact 1740 gagttccagc ccctgtacta tgtggcagag tccttcaatg atgccaagga aaaagtcaga 1800 aactttgctg ccaccatccc aagacccttc tctgtgagat atgaccccta cacccaaagg 1860 attgaagtcc tggacaacac ccagcagctg aagatcctgg cagacagcat caactcagag 1920 ataggcatcc tgtgctcagc cctccaaaag attaagtaaa ccttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760 cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820 ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940 gcgagcgagc gcgcagctgc ctgcagg 2967 <210> 565 <211> 2967 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 565 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgagcactg ctgtccttga aaaccctggc cttggaagaa agctctctga ctttggacaa 660 gaaacctcct acattgagga caactgcaac cagaatggtg ccatctccct catcttctcc 720 ctgaaagagg aagtgggagc cctggccaag gtcctgaggc tctttgaaga gaatgatgtg 780 aacctcaccc acattgagtc cagacccagc aggctcaaga aagatgagta tgaattcttc 840 acccacctgg acaagagatc cttgcctgcc ctcaccaaca tcatcaagat cctgagacat 900 gacattggag ccactgtgca tgaactgtcc agggacaaga agaaggacac tgtgccctgg 960 ttcccaagga ccatccagga acttgacaga tttgccaacc aaatcctgtc ctatggtgct 1020 gagctggatg cagaccaccc tggattcaag gacccagtgt acagagccag gagaaagcag 1080 tttgctgaca tagcctacaa ctacagacat ggccagccca ttccaagagt ggagtacatg 1140 gaagaagaga agaaaacctg ggggactgtg ttcaagaccc tgaagtccct gtacaagacc 1200 catgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccat 1260 gaggacaaca tcccccagct ggaagatgtg tcccagttcc tgcaaacttg cactgggttc 1320 aggctcagac ctgtggctgg cttactgagc tccagggact tcctgggtgg actagccttc 1380 agggtgttcc actgcaccca gtacatcaga catggctcca agcccatgta cacccctgag 1440 cctgatatct gccatgaact gctgggccat gtgcccttgt tcagtgacag aagctttgcc 1500 cagttctccc aagaaattgg ccttgcctcc ctgggggccc ctgatgagta cattgaaaag 1560 ctggccacca tctactggtt cactgtggaa tttggcttgt gcaaacaggg agactccatc 1620 aaggcctatg gggcaggact gctgagcagc tttggagagc tgcagtactg cctgtcagag 1680 aagcccaagc tcctgcccct ggaactggaa aagactgcca tccagaacta cactgtcact 1740 gagttccagc ccctctacta tgtggcagag tccttcaatg atgccaagga aaaagtcagg 1800 aactttgcag ccacaatccc tagaccattc tcagtcagat atgacccata cacccagagg 1860 attgaagtgc tggacaacac ccagcagctc aagatcttgg ctgatagcat caactcagag 1920 attggaatcc tgtgttcagc cctccaaaag attaagtaaa ccttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760 cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820 ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940 gcgagcgagc gcgcagctgc ctgcagg 2967 <210> 566 <211> 2967 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 566 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgtcaaccg ccgtgcttga aaatcctgga ctcggaagga aattgtcaga ctttggacaa 660 gaaacctcct atatcgagga caactgcaac cagaacggcg ccatctctct catcttttcg 720 ctgaaagaag aggtcggagc cctggccaag gtcctgagac tgttcgaaga gaatgacgtc 780 aacctcactc acatcgagtc ccgcccgtca cggctgaaga aagacgaata cgagttcttc 840 acccatctgg ataagcgctc gttgcctgcg ctgactaaca tcataaagat tctgcggcac 900 gacatcggcg cgactgtgca cgagctgagc cgggataaga agaaggacac tgtgccatgg 960 ttcccccgga ccattcaaga actggacaga ttcgcgaacc agattctgtc ctatggcgcc 1020 gagctggacg ctgaccaccc cgggttcaag gaccctgtgt accgcgctag acgcaagcag 1080 ttcgcagaca tcgcctacaa ctatcggcat gggcagccga ttccccgcgt cgagtacatg 1140 gaagaagaga agaaaacctg gggtaccgtg ttcaagactc tgaagtcgct gtacaagacc 1200 cacgcatgct acgagtacaa ccatatcttc ccgctcctcg agaagtactg cggtttccac 1260 gaggataaca ttccccaatt ggaagatgtg tcccagttcc tgcaaacttg cacaggcttt 1320 aggcttagac cggtggcggg cctcctgagc tcccgggatt tcctcggcgg actcgccttc 1380 cgggtgttcc actgcactca gtacattcgg cacgggagca agccgatgta cacccccgaa 1440 ccggatatct gtcatgaact tctgggacac gtgccactct tctccgaccg aagcttcgcg 1500 cagttctccc aagaaatcgg actggcctcc ctgggtgccc ctgatgagta catcgaaaag 1560 cttgccacca tctactggtt taccgtggag ttcggcctgt gcaaacaggg agacagcatc 1620 aaggcatacg gggccggcct gctgtcctcg ttcggagaac tgcagtactg cctgtcggag 1680 aagcccaagt tgctgcccct cgaactggag aaaacggcca tccagaacta caccgtgacc 1740 gagttccagc cgctgtacta cgtggccgaa agcttcaacg acgccaagga aaaggtccgc 1800 aactttgcgg ctaccatccc gaggcctttc tccgtgcgct acgacccata cactcagcgg 1860 atcgaagtgc tggataacac ccagcagctg aagatcctcg ccgactccat taactccgag 1920 attggaatcc tgtgttccgc tctgcaaaag attaagtgaa ccttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760 cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820 ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940 gcgagcgagc gcgcagctgc ctgcagg 2967 <210> 567 <211> 2967 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 567 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atgtcaaccg ccgtgctcga gaaccctgga cttggaagaa aactgtcaga cttcggacaa 660 gagacttctt acatcgagga taactgcaac cagaatggcg cgatttcgct gatattcagc 720 ctgaaggaag aggtcggagc cctggccaag gtcctgcggc ttttcgagga aaacgacgtg 780 aacctgactc acatcgagtc ccggccgagc agactcaaga aggacgaata cgaattcttc 840 acccatctcg ataagcgctc gctgccggcg cttactaaca ttatcaagat cctgcgccac 900 gatatcggag ccaccgtgca tgaactgtcg agggataaga aaaaggatac cgtgccgtgg 960 ttcccgagga ccatccagga actggaccgc ttcgctaacc aaatcttgag ctatggcgcg 1020 gaactcgacg ctgaccaccc cgggttcaag gatcccgtgt accgggccag acgcaagcag 1080 ttcgcagaca ttgcctacaa ctatcgacac ggccagccta ttccacgggt ggagtacatg 1140 gaagaagaga aaaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagact 1200 cacgcctgct acgagtacaa ccacatcttc cctctgctcg aaaagtactg cgggttccat 1260 gaggacaaca tccctcagct cgaggacgtg tcacagttcc tgcaaacgtg cactggcttt 1320 cggctgaggc cggtggccgg tctgctgagc tcaagggatt ttctgggcgg actggcgttc 1380 cgcgtgttcc actgcaccca gtatatccgc catggtagca agcccatgta cactccggag 1440 cctgacattt gccacgaact actgggacac gtgccgttgt ttagcgaccg gtcgtttgcc 1500 caattctccc aagaaatcgg actggcctcc ctgggggcgc cagacgagta cattgaaaag 1560 ctcgcaacca tctactggtt caccgtggaa ttcggactgt gcaaacaggg cgattcgatc 1620 aaggcctacg gcgccgggct cctgtcctcc ttcggtgaac tgcagtactg tctgtccgag 1680 aagcccaagc tcctgcccct cgagcttgaa aagacagcta tccagaacta cactgtcacc 1740 gagttccagc cactctacta cgtggccgag tccttcaatg acgccaagga aaaagtccgg 1800 aacttcgcgg caaccattcc tagacccttc tccgtgcgct acgacccgta cacccagcgg 1860 atcgaagtgc tggacaacac ccagcagttg aagatcctgg ccgactccat caactccgaa 1920 atcggtattt tgtgttccgc cctgcaaaag attaagtgaa ccttaattaa gagcatctta 1980 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2040 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2100 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2160 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2220 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2280 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2340 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2400 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2460 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2520 tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2580 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2640 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2700 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2760 cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2820 ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2880 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga 2940 gcgagcgagc gcgcagctgc ctgcagg 2967 <210> 568 <211> 2970 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 568 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atggccgctg tggtgctgga aaatggcgtg ctgagcagaa agctgagcga cttcggccaa 660 gagacaagct acatcgagga caacagcaac cagaacggcg ctgtgtccct gatcttcagc 720 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgtttgagga aaacgagatc 780 aacctgacgc acatcgagag cagacccagc agactgaaca aggacgagta cgagttcttc 840 acctacctgg acaagagaag caagcccgtg ctgggcagca tcatcaagag cctgagaaac 900 gacatcggcg ccaccgtgca cgagctgagc agggacaaag aaaagaacac cgtgccatgg 960 ttccccagga ccatccaaga gctggacaga ttcgccaacc agatcctgtc ttacggcgcc 1020 gagctggacg ctgatcaccc tggctttaag gaccccgtgt acagagccag aagaaagcag 1080 ttcgccgata tcgcctacaa ctacagacac ggccagccta ttcctagagt cgagtacacc 1140 gaggaagaga gaaagacctg gggcaccgtg ttcagaaccc tgaaggccct gtacaagacc 1200 cacgcctgct acgagcacaa ccacatcttc ccactgctcg aaaagtactg cggcttccgc 1260 gaggataaca tccctcagct tgaggacgtg tcccagttcc tgcagacctg cacaggcttc 1320 agactgaggc cagttgctgg cctgctgtcc agcagagatt ttctcggcgg cctggccttc 1380 agagtgttcc actgtaccca gtacatcagg cacggcagca agcccatgta cacccctgag 1440 cctgacatct gccacgagct gctgggacat gtgcctctgt tcagcgacag aagcttcgcc 1500 cagttcagcc aagagatcgg cctggctagt ctgggcgctc ctgatgagta catcgagaag 1560 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaaagaggg cgacagcatc 1620 aaggcttatg gcgccggact gctgtctagc tttggcgagc tgcagtactg tctgagcgac 1680 aagcctaagc tgctgcccct ggaactggaa aagaccgcct gccaagagta cacagtgacc 1740 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800 accttcgccg ctacaatccc cagacctttc agcgtcagat acgaccccta cacacagcgc 1860 gtggaagtgc tggacaacac acagcagctg aagattctgg ccgactccat caacagcgaa 1920 gtgggcatcc tgtgtcacgc cctgcagaaa atcaagagct gatagttaat taagagcatc 1980 ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg 2040 ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt 2100 caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc 2160 ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg 2220 ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt 2280 cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg 2340 agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc 2400 ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc 2460 tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta 2520 ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg 2580 ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 2640 cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 2700 gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg 2760 atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa 2820 tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg 2880 cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag 2940 tgagcgagcg agcgcgcagc tgcctgcagg 2970 <210> 569 <211> 2970 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 569 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgccggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg gaggagcaaa 240 caggggctaa gtccacacgc gtggtaccgt ctgtctgcac atttcgtaga gcgagtgttc 300 cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat tctccttttg 360 ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg gatcagcagc 420 ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc acacagatcc 480 acaagctcct gaagaggtaa gggtttaagg gatggttggt tggtggggta ttaatgttta 540 attacctgga gcacctgcct gaaatcactt tttttcaggt tggtttaaac cgcagccacc 600 atggccgctg tggtgctgga aaatggcgtg ctgagcagaa agctgagcga cttcggccaa 660 gagacaagct acatcgagga caacagcaac cagaacggcg ctgtgtccct gatcttcagc 720 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgtttgagga aaacgagatc 780 aacctgacgc acatcgagag cagacccagc agactgaaca aggacgagta cgagttcttc 840 acctacctgg acaagagaag caagcccgtg ctgggcagca tcatcaagag cctgagaaac 900 gacatcggcg ccaccgtgca cgagctgagc agggacaaag aaaagaacac cgtgccatgg 960 ttccccagga ccatccaaga gctggacaga ttcgccaacc agatcctgtc ttacggcgcc 1020 gagctggacg ctgatcaccc tggctttaag gaccccgtgt acagagccag aagaaagcag 1080 ttcgccgata tcgcctacaa ctacagacac ggccagccta ttcctagagt cgagtacacc 1140 gaggaagaga gaaagacctg gggcaccgtg ttcagaaccc tgaaggccct gtacaagacc 1200 cacgcctgct acgagcacaa ccacatcttc ccactgctcg aaaagtactg cggcttccgc 1260 gaggataaca tccctcagct tgaggacgtg tcccagttcc tgcagacctg cacaggcttc 1320 agactgaggc cagttgctgg cctgctgtcc agcagagatt ttctcggcgg cctggccttc 1380 agagtgttcc actgtaccca gtacatcagg cacggcagca agcccatgta cacccctgag 1440 cctgacatct gccacgagct gctgggacat gtgcctctgt tcagcgacag aagcttcgcc 1500 cagttcagcc aagagatcgg cctggctagt ctgggcgctc ctgatgagta catcgagaag 1560 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaaagaggg cgacagcatc 1620 aaggcttatg gcgccggact gctgtctagc tttggcgagc tgcagtactg tctgagcgac 1680 aagcctaagc tgctgcccct ggaactggaa aagaccgcct gccaagagta cacagtgacc 1740 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1800 accttcgccg ctacaatccc cagacctttc agcgtcagat acgaccccta cacacagcgc 1860 gtggaagtgc tggacaacac acagcagctg aagattctgg ccgactccat caacagcgaa 1920 gtgggcatcc tgtgtcacgc cctgcagaaa atcaagagct gatagttaat taagagcatc 1980 ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg 2040 ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt 2100 caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc 2160 ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg 2220 ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt 2280 cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg 2340 agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc 2400 ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc 2460 tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta 2520 ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg 2580 ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 2640 cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 2700 gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg 2760 atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa 2820 tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg 2880 cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag 2940 tgagcgagcg agcgcgcagc tgcctgcagg 2970 <210> 570 <211> 3984 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 570 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240 acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300 tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360 caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtg gatccccgtc 420 tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 480 atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 540 ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 600 ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 660 atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 720 ttttcaggtt gggtttaaac cgcagccacc atgtccacag ctgtgctgga gaaccctggc 780 ttgggcagga aactctctga ctttggacag gtgagccagg gcagcctgag ctgctcagtt 840 aggggaattt gggcctccag agaaagagat cccaagactg ctggtgcttc ctggtttcat 900 aagctcagta agaagtctga attggttgga agctgatgag aatatccagg aagtcaacag 960 acaaatgtcc tcaacaattg tttctaagta ggagaacatc tgtcctgggt ggctttcaca 1020 ggaatgaatg accattgctt tagggggttg gggatctggc ctccagaact gccaccaatt 1080 agctgtgtgt ctttggacaa gttactgtcc ctctctgttg tctgtttact cttctgtaca 1140 ctgaaggggt tccaatccag gtcttaggat tcaaaagcct gtgcatgttc catttttagt 1200 actttccaca ctgtatttct caatgtcttt ctgggacatt ttataaatca tattatatca 1260 cctctaagga tctttcagtt tgttatatat gtgtctatta agttagattg tgagctccta 1320 aaagataaag cattgtctta ttcatcttta aatttctcag agcccaaata gtgcctggaa 1380 cctagtagtt gctcaataaa aggtattgaa tttacaggat tgaatggtga catcaatgaa 1440 taattgaaga ttccttaagc tgataactga cccagtagca tcattgatca tttaattgcc 1500 ctggacttac ttattttcca ccacactaca tatttctgta tagaatatat atagctcatt 1560 gtattgcaag atttaactag aagaaagagt tcatgcttgc tttgtccatg taggtttaac 1620 aggaatgaat tgctaaactg tggaaaatgt tttaaacaaa tgcatcttat cctgtaggaa 1680 acaagctata ttgaagacaa ctgcaatcaa aatggagcca tctccctgat cttctccctg 1740 aaggaggagg tgggagccct ggccaaggtg ctgagactgt ttgaggagaa tgatgtgaac 1800 ctgacccaca ttgagtccag accctccaga ctgaagaagg atgagtatga gttcttcacc 1860 cacctggaca agagatccct gcctgccctg accaacatca tcaagatcct gagacatgac 1920 attggagcca cagtgcatga gctgtccaga gacaagaaga aggacacagt gccctggttc 1980 cccagaacca tccaggagct ggacagattt gccaaccaga tcctgtccta tggagctgag 2040 ctggatgctg accaccctgg cttcaaggac cctgtgtaca gggccagaag aaagcagttt 2100 gctgacattg cctacaacta cagacatggc cagcccatcc ccagagtgga gtacatggag 2160 gaggagaaga agacctgggg cacagtgttc aagaccctga agtccctgta caagacccat 2220 gcctgctatg agtacaacca catcttcccc ctgctggaga agtactgtgg cttccatgag 2280 gacaacatcc cccagctgga ggatgtgtcc cagttcctgc agacctgcac aggcttcaga 2340 ctgagacctg tggctggcct gctgtcctcc agagacttcc tgggaggcct ggccttcaga 2400 gtgttccact gcacccagta catcagacat ggctccaagc ccatgtacac ccctgagcct 2460 gacatctgcc atgagctgct gggccatgtg cccctgttct ctgacagatc ctttgcccag 2520 ttctcccagg agattggcct ggcctccctg ggagcccctg atgagtacat tgagaagctg 2580 gccaccatct actggttcac agtggagttt ggcctgtgca agcagggaga ctccatcaag 2640 gcctatggag ctggcctgct gtcctccttt ggagagctgc agtactgcct gtctgagaag 2700 cccaagctgc tgcccctgga gctggagaag acagccatcc agaactacac agtgacagag 2760 ttccagcccc tgtactatgt ggctgagtcc ttcaatgatg ccaaggagaa ggtcagaaac 2820 tttgctgcca ccatccccag acccttctct gtgagatatg acccctacac ccagagaatt 2880 gaggtgctgg acaacaccca gcagctgaag atcctggctg actccatcaa ctctgagatt 2940 ggcatcctgt gctctgccct gcagaagatc aagtaaacct taattaagag catcttaccg 3000 ccatttattc ccatatttgt tctgtttttc ttgatttggg tatacattta aatgttaata 3060 aaacaaaatg gtggggcaat catttacatt tttagggata tgtaattact agttcaggtg 3120 tattgccaca agacaaacat gttaagaaac tttcccgtta tttacgctct gttcctgtta 3180 atcaacctct ggattacaaa atttgtgaaa gattgactga tattcttaac tatgttgctc 3240 cttttacgct gtgtggatat gctgctttat agcctctgta tctagctatt gcttcccgta 3300 cggctttcgt tttctcctcc ttgtataaat cctggttgct gtctctttta gaggagttgt 3360 ggcccgttgt ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca acccccactg 3420 gctggggcat tgccaccacc tgtcaactcc tttctgggac tttcgctttc cccctcccga 3480 tcgccacggc agaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctaggttgc 3540 tgggcactga taattccgtg gtgttgtctg tgccttctag ttgccagcca tctgttgttt 3600 gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 3660 aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 3720 tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg 3780 tgggctctat ggctctagag catggctacg tagataagta gcatggcggg ttaatcatta 3840 actacacctg caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 3900 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg 3960 agcgagcgcg cagctgcctg cagg 3984 <210> 571 <211> 3346 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 571 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240 acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300 tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360 caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtg gatccccgtc 420 tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 480 atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 540 ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 600 ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 660 atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 720 ttttcaggtt gggtttaaac cgcagccacc atgtccacag ctgtgctgga gaaccctggc 780 ttgggcagga aactctctga ctttggacag gtgagccagg gcagcctgag ctgctcagtt 840 aggggaattt gggcctccag agaaagagat ctgaagactg ctggtgcttc ctggtttcat 900 aagctcagta agaagtctga attcattgga agctgatgat agaagaaaga gttcatgctt 960 gctttgtcca tggaggttta acaggaatga attgctaaac tgtggaaaat gttttaaaca 1020 aatgcatctt atcctgtagg aaacaagcta tattgaagac aactgcaatc aaaatggagc 1080 catctccctg atcttctccc tgaaggagga ggtgggagcc ctggccaagg tgctgagact 1140 gtttgaggag aatgatgtga acctgaccca cattgagtcc agaccctcca gactgaagaa 1200 ggatgagtat gagttcttca cccacctgga caagagatcc ctgcctgccc tgaccaacat 1260 catcaagatc ctgagacatg acattggagc cacagtgcat gagctgtcca gagacaagaa 1320 gaaggacaca gtgccctggt tccccagaac catccaggag ctggacagat ttgccaacca 1380 gatcctgtcc tatggagctg agctggatgc tgaccaccct ggcttcaagg accctgtgta 1440 cagggccaga agaaagcagt ttgctgacat tgcctacaac tacagacatg gccagcccat 1500 ccccagagtg gagtacatgg aggaggagaa gaagacctgg ggcacagtgt tcaagaccct 1560 gaagtccctg tacaagaccc atgcctgcta tgagtacaac cacatcttcc ccctgctgga 1620 gaagtactgt ggcttccatg aggacaacat cccccagctg gaggatgtgt cccagttcct 1680 gcagacctgc acaggcttca gactgagacc tgtggctggc ctgctgtcct ccagagactt 1740 cctgggaggc ctggccttca gagtgttcca ctgcacccag tacatcagac atggctccaa 1800 gcccatgtac acccctgagc ctgacatctg ccatgagctg ctgggccatg tgcccctgtt 1860 ctctgacaga tcctttgccc agttctccca ggagattggc ctggcctccc tgggagcccc 1920 tgatgagtac attgagaagc tggccaccat ctactggttc acagtggagt ttggcctgtg 1980 caagcaggga gactccatca aggcctatgg agctggcctg ctgtcctcct ttggagagct 2040 gcagtactgc ctgtctgaga agcccaagct gctgcccctg gagctggaga agacagccat 2100 ccagaactac acagtgacag agttccagcc cctgtactat gtggctgagt ccttcaatga 2160 tgccaaggag aaggtcagaa actttgctgc caccatcccc agacccttct ctgtgagata 2220 tgacccctac acccagagaa ttgaggtgct ggacaacacc cagcagctga agatcctggc 2280 tgactccatc aactctgaga ttggcatcct gtgctctgcc ctgcagaaga tcaagtaaac 2340 cttaattaag agcatcttac cgccatttat tcccatattt gttctgtttt tcttgatttg 2400 ggtatacatt taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga 2460 tatgtaatta ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt 2520 tatttacgct ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact 2580 gatattctta actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg 2640 tatctagcta ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg 2700 ctgtctcttt tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg 2760 tttgctgacg caacccccac tggctggggc attgccacca cctgtcaact cctttctggg 2820 actttcgctt tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc 2880 tgctggacag gggctaggtt gctgggcact gataattccg tggtgttgtc tgtgccttct 2940 agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc 3000 actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt 3060 cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat 3120 agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag 3180 tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg 3240 ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 3300 gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcagg 3346 <210> 572 <211> 4108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 572 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggctt gtactttggt 240 acattggctc ctagttaatc attaacttag caatgtgctt gtactttggt acatagttac 300 ctagttaatc attaacaaac agtatggctt gtactttggt acaagcaaca gatcattcta 360 tgggcgagaa cttgtgcctc cccgtgttcc tgctctttgt ccctctgtcc tacttagact 420 aatatttgcc ttgggtactg caaacaggaa atgggggagg gacaggagta gggcggaggg 480 tagcaattgg attctgcagt gagagcagag ggccagctaa gtggtactct cccagagact 540 gtctgactca cgccaccccc tccaccttgg acacaggacg ctgtggtttc tgagccaggt 600 acaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 660 gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 720 ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 780 cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 840 acctgggaca gtgaatgttt aaaccgcagc caccatgtcc acagctgtgc tggagaaccc 900 tggcttgggc aggaaactct ctgactttgg acaggtgagc cagggcagcc tgagctgctc 960 agttagggga atttgggcct ccagagaaag agatcccaag actgctggtg cttcctggtt 1020 tcataagctc agtaagaagt ctgaattggt tggaagctga tgagaatatc caggaagtca 1080 acagacaaat gtcctcaaca attgtttcta agtaggagaa catctgtcct gggtggcttt 1140 cacaggaatg aatgaccatt gctttagggg gttggggatc tggcctccag aactgccacc 1200 aattagctgt gtgtctttgg acaagttact gtccctctct gttgtctgtt tactcttctg 1260 tacactgaag gggttccaat ccaggtctta ggattcaaaa gcctgtgcat gttccatttt 1320 tagtactttc cacactgtat ttctcaatgt ctttctggga cattttataa atcatattat 1380 atcacctcta aggatctttc agtttgttat atatgtgtct attaagttag attgtgagct 1440 cctaaaagat aaagcattgt cttattcatc tttaaatttc tcagagccca aatagtgcct 1500 ggaacctagt agttgctcaa taaaaggtat tgaatttaca ggattgaatg gtgacatcaa 1560 tgaataattg aagattcctt aagctgataa ctgacccagt agcatcattg atcatttaat 1620 tgccctggac ttacttattt tccaccacac tacatatttc tgtatagaat atatatagct 1680 cattgtattg caagatttaa ctagaagaaa gagttcatgc ttgctttgtc catgtaggtt 1740 taacaggaat gaattgctaa actgtggaaa atgttttaaa caaatgcatc ttatcctgta 1800 ggaaacaagc tatattgaag acaactgcaa tcaaaatgga gccatctccc tgatcttctc 1860 cctgaaggag gaggtgggag ccctggccaa ggtgctgaga ctgtttgagg agaatgatgt 1920 gaacctgacc cacattgagt ccagaccctc cagactgaag aaggatgagt atgagttctt 1980 cacccacctg gacaagagat ccctgcctgc cctgaccaac atcatcaaga tcctgagaca 2040 tgacattgga gccacagtgc atgagctgtc cagagacaag aagaaggaca cagtgccctg 2100 gttccccaga accatccagg agctggacag atttgccaac cagatcctgt cctatggagc 2160 tgagctggat gctgaccacc ctggcttcaa ggaccctgtg tacagggcca gaagaaagca 2220 gtttgctgac attgcctaca actacagaca tggccagccc atccccagag tggagtacat 2280 ggaggaggag aagaagacct ggggcacagt gttcaagacc ctgaagtccc tgtacaagac 2340 ccatgcctgc tatgagtaca accacatctt ccccctgctg gagaagtact gtggcttcca 2400 tgaggacaac atcccccagc tggaggatgt gtcccagttc ctgcagacct gcacaggctt 2460 cagactgaga cctgtggctg gcctgctgtc ctccagagac ttcctgggag gcctggcctt 2520 cagagtgttc cactgcaccc agtacatcag acatggctcc aagcccatgt acacccctga 2580 gcctgacatc tgccatgagc tgctgggcca tgtgcccctg ttctctgaca gatcctttgc 2640 ccagttctcc caggagattg gcctggcctc cctgggagcc cctgatgagt acattgagaa 2700 gctggccacc atctactggt tcacagtgga gtttggcctg tgcaagcagg gagactccat 2760 caaggcctat ggagctggcc tgctgtcctc ctttggagag ctgcagtact gcctgtctga 2820 gaagcccaag ctgctgcccc tggagctgga gaagacagcc atccagaact acacagtgac 2880 agagttccag cccctgtact atgtggctga gtccttcaat gatgccaagg agaaggtcag 2940 aaactttgct gccaccatcc ccagaccctt ctctgtgaga tatgacccct acacccagag 3000 aattgaggtg ctggacaaca cccagcagct gaagatcctg gctgactcca tcaactctga 3060 gattggcatc ctgtgctctg ccctgcagaa gatcaagtaa accttaatta agagcatctt 3120 accgccattt attcccatat ttgttctgtt tttcttgatt tgggtataca tttaaatgtt 3180 aataaaacaa aatggtgggg caatcattta catttttagg gatatgtaat tactagttca 3240 ggtgtattgc cacaagacaa acatgttaag aaactttccc gttatttacg ctctgttcct 3300 gttaatcaac ctctggatta caaaatttgt gaaagattga ctgatattct taactatgtt 3360 gctcctttta cgctgtgtgg atatgctgct ttatagcctc tgtatctagc tattgcttcc 3420 cgtacggctt tcgttttctc ctccttgtat aaatcctggt tgctgtctct tttagaggag 3480 ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg tgtttgctga cgcaaccccc 3540 actggctggg gcattgccac cacctgtcaa ctcctttctg ggactttcgc tttccccctc 3600 ccgatcgcca cggcagaact catcgccgcc tgccttgccc gctgctggac aggggctagg 3660 ttgctgggca ctgataattc cgtggtgttg tctgtgcctt ctagttgcca gccatctgtt 3720 gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 3780 taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 3840 ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 3900 gcggtgggct ctatggctct agagcatggc tacgtagata agtagcatgg cgggttaatc 3960 attaactaca cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4020 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg 4080 agcgagcgag cgcgcagctg cctgcagg 4108 <210> 573 <211> 4063 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 573 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggtta atcattaact 240 tggctcctag ttaatcatta acaaacagta tggttaatca ttaacaaatt ctggggttaa 300 tcattaacta gttacctagc gagaacttgt gcctccccgt gttcctgctc tttgtccctc 360 tgtcctactt agactaatat ttgccttggg tactgcaaac aggaaatggg ggagggacag 420 gagtagggcg gagggtagca attggattct gcagtgagag cagagggcca gctaagtggt 480 actctcccag agactgtctg actcacgcca ccccctccac cttggacaca ggacgctgtg 540 gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg tacactgccc 600 aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg gacttagccc 660 ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gcctcccccg 720 ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc tcctcagctt 780 caggcaccac cactgacctg ggacagtgaa tgtttaaacc gcagccacca tgtccacagc 840 tgtgctggag aaccctggct tgggcaggaa actctctgac tttggacagg tgagccaggg 900 cagcctgagc tgctcagtta ggggaatttg ggcctccaga gaaagagatc ccaagactgc 960 tggtgcttcc tggtttcata agctcagtaa gaagtctgaa ttggttggaa gctgatgaga 1020 atatccagga agtcaacaga caaatgtcct caacaattgt ttctaagtag gagaacatct 1080 gtcctgggtg gctttcacag gaatgaatga ccattgcttt agggggttgg ggatctggcc 1140 tccagaactg ccaccaatta gctgtgtgtc tttggacaag ttactgtccc tctctgttgt 1200 ctgtttactc ttctgtacac tgaaggggtt ccaatccagg tcttaggatt caaaagcctg 1260 tgcatgttcc atttttagta ctttccacac tgtatttctc aatgtctttc tgggacattt 1320 tataaatcat attatatcac ctctaaggat ctttcagttt gttatatatg tgtctattaa 1380 gttagattgt gagctcctaa aagataaagc attgtcttat tcatctttaa atttctcaga 1440 gcccaaatag tgcctggaac ctagtagttg ctcaataaaa ggtattgaat ttacaggatt 1500 gaatggtgac atcaatgaat aattgaagat tccttaagct gataactgac ccagtagcat 1560 cattgatcat ttaattgccc tggacttact tattttccac cacactacat atttctgtat 1620 agaatatata tagctcattg tattgcaaga tttaactaga agaaagagtt catgcttgct 1680 ttgtccatgt aggtttaaca ggaatgaatt gctaaactgt ggaaaatgtt ttaaacaaat 1740 gcatcttatc ctgtaggaaa caagctatat tgaagacaac tgcaatcaaa atggagccat 1800 ctccctgatc ttctccctga aggaggaggt gggagccctg gccaaggtgc tgagactgtt 1860 tgaggagaat gatgtgaacc tgacccacat tgagtccaga ccctccagac tgaagaagga 1920 tgagtatgag ttcttcaccc acctggacaa gagatccctg cctgccctga ccaacatcat 1980 caagatcctg agacatgaca ttggagccac agtgcatgag ctgtccagag acaagaagaa 2040 ggacacagtg ccctggttcc ccagaaccat ccaggagctg gacagatttg ccaaccagat 2100 cctgtcctat ggagctgagc tggatgctga ccaccctggc ttcaaggacc ctgtgtacag 2160 ggccagaaga aagcagtttg ctgacattgc ctacaactac agacatggcc agcccatccc 2220 cagagtggag tacatggagg aggagaagaa gacctggggc acagtgttca agaccctgaa 2280 gtccctgtac aagacccatg cctgctatga gtacaaccac atcttccccc tgctggagaa 2340 gtactgtggc ttccatgagg acaacatccc ccagctggag gatgtgtccc agttcctgca 2400 gacctgcaca ggcttcagac tgagacctgt ggctggcctg ctgtcctcca gagacttcct 2460 gggaggcctg gccttcagag tgttccactg cacccagtac atcagacatg gctccaagcc 2520 catgtacacc cctgagcctg acatctgcca tgagctgctg ggccatgtgc ccctgttctc 2580 tgacagatcc tttgcccagt tctcccagga gattggcctg gcctccctgg gagcccctga 2640 tgagtacatt gagaagctgg ccaccatcta ctggttcaca gtggagtttg gcctgtgcaa 2700 gcagggagac tccatcaagg cctatggagc tggcctgctg tcctcctttg gagagctgca 2760 gtactgcctg tctgagaagc ccaagctgct gcccctggag ctggagaaga cagccatcca 2820 gaactacaca gtgacagagt tccagcccct gtactatgtg gctgagtcct tcaatgatgc 2880 caaggagaag gtcagaaact ttgctgccac catccccaga cccttctctg tgagatatga 2940 cccctacacc cagagaattg aggtgctgga caacacccag cagctgaaga tcctggctga 3000 ctccatcaac tctgagattg gcatcctgtg ctctgccctg cagaagatca agtaaacctt 3060 aattaagagc atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt 3120 atacatttaa atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat 3180 gtaattacta gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat 3240 ttacgctctg ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat 3300 attcttaact atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat 3360 ctagctattg cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg 3420 tctcttttag aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt 3480 gctgacgcaa cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact 3540 ttcgctttcc ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc 3600 tggacagggg ctaggttgct gggcactgat aattccgtgg tgttgtctgt gccttctagt 3660 tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3720 cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3780 tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3840 aggcatgctg gggatgcggt gggctctatg gctctagagc atggctacgt agataagtag 3900 catggcgggt taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca 3960 ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc 4020 cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc agg 4063 <210> 574 <211> 3470 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 574 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggctt gtactttggt 240 acattggctc ctagttaatc attaacttag caatgtgctt gtactttggt acatagttac 300 ctagttaatc attaacaaac agtatggctt gtactttggt acaagcaaca gatcattcta 360 tgggcgagaa cttgtgcctc cccgtgttcc tgctctttgt ccctctgtcc tacttagact 420 aatatttgcc ttgggtactg caaacaggaa atgggggagg gacaggagta gggcggaggg 480 tagcaattgg attctgcagt gagagcagag ggccagctaa gtggtactct cccagagact 540 gtctgactca cgccaccccc tccaccttgg acacaggacg ctgtggtttc tgagccaggt 600 acaatgactc ctttcggtaa gtgcagtgga agctgtacac tgcccaggca aagcgtccgg 660 gcagcgtagg cgggcgactc agatcccagc cagtggactt agcccctgtt tgctcctccg 720 ataactgggg tgaccttggt taatattcac cagcagcctc ccccgttgcc cctctggatc 780 cactgcttaa atacggacga ggacagggcc ctgtctcctc agcttcaggc accaccactg 840 acctgggaca gtgaatgttt aaaccgcagc caccatgtcc acagctgtgc tggagaaccc 900 tggcttgggc aggaaactct ctgactttgg acaggtgagc cagggcagcc tgagctgctc 960 agttagggga atttgggcct ccagagaaag agatctgaag actgctggtg cttcctggtt 1020 tcataagctc agtaagaagt ctgaattcat tggaagctga tgatagaaga aagagttcat 1080 gcttgctttg tccatggagg tttaacagga atgaattgct aaactgtgga aaatgtttta 1140 aacaaatgca tcttatcctg taggaaacaa gctatattga agacaactgc aatcaaaatg 1200 gagccatctc cctgatcttc tccctgaagg aggaggtggg agccctggcc aaggtgctga 1260 gactgtttga ggagaatgat gtgaacctga cccacattga gtccagaccc tccagactga 1320 agaaggatga gtatgagttc ttcacccacc tggacaagag atccctgcct gccctgacca 1380 acatcatcaa gatcctgaga catgacattg gagccacagt gcatgagctg tccagagaca 1440 agaagaagga cacagtgccc tggttcccca gaaccatcca ggagctggac agatttgcca 1500 accagatcct gtcctatgga gctgagctgg atgctgacca ccctggcttc aaggaccctg 1560 tgtacagggc cagaagaaag cagtttgctg acattgccta caactacaga catggccagc 1620 ccatccccag agtggagtac atggaggagg agaagaagac ctggggcaca gtgttcaaga 1680 ccctgaagtc cctgtacaag acccatgcct gctatgagta caaccacatc ttccccctgc 1740 tggagaagta ctgtggcttc catgaggaca acatccccca gctggaggat gtgtcccagt 1800 tcctgcagac ctgcacaggc ttcagactga gacctgtggc tggcctgctg tcctccagag 1860 acttcctggg aggcctggcc ttcagagtgt tccactgcac ccagtacatc agacatggct 1920 ccaagcccat gtacacccct gagcctgaca tctgccatga gctgctgggc catgtgcccc 1980 tgttctctga cagatccttt gcccagttct cccaggagat tggcctggcc tccctgggag 2040 cccctgatga gtacattgag aagctggcca ccatctactg gttcacagtg gagtttggcc 2100 tgtgcaagca gggagactcc atcaaggcct atggagctgg cctgctgtcc tcctttggag 2160 agctgcagta ctgcctgtct gagaagccca agctgctgcc cctggagctg gagaagacag 2220 ccatccagaa ctacacagtg acagagttcc agcccctgta ctatgtggct gagtccttca 2280 atgatgccaa ggagaaggtc agaaactttg ctgccaccat ccccagaccc ttctctgtga 2340 gatatgaccc ctacacccag agaattgagg tgctggacaa cacccagcag ctgaagatcc 2400 tggctgactc catcaactct gagattggca tcctgtgctc tgccctgcag aagatcaagt 2460 aaaccttaat taagagcatc ttaccgccat ttattcccat atttgttctg tttttcttga 2520 tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt tacattttta 2580 gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta agaaactttc 2640 ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt gtgaaagatt 2700 gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg ctttatagcc 2760 tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt ataaatcctg 2820 gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc 2880 tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc aactcctttc 2940 tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc 3000 ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt tgtctgtgcc 3060 ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga ccctggaagg 3120 tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag 3180 gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg attgggaaga 3240 caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg gctacgtaga 3300 taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct agtgatggag 3360 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 3420 cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3470 <210> 575 <211> 3425 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 575 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcagcaaca gatcattcta tgggttaatc attaacaaca ggttaggtta atcattaact 240 tggctcctag ttaatcatta acaaacagta tggttaatca ttaacaaatt ctggggttaa 300 tcattaacta gttacctagc gagaacttgt gcctccccgt gttcctgctc tttgtccctc 360 tgtcctactt agactaatat ttgccttggg tactgcaaac aggaaatggg ggagggacag 420 gagtagggcg gagggtagca attggattct gcagtgagag cagagggcca gctaagtggt 480 actctcccag agactgtctg actcacgcca ccccctccac cttggacaca ggacgctgtg 540 gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg tacactgccc 600 aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg gacttagccc 660 ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gcctcccccg 720 ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc tcctcagctt 780 caggcaccac cactgacctg ggacagtgaa tgtttaaacc gcagccacca tgtccacagc 840 tgtgctggag aaccctggct tgggcaggaa actctctgac tttggacagg tgagccaggg 900 cagcctgagc tgctcagtta ggggaatttg ggcctccaga gaaagagatc tgaagactgc 960 tggtgcttcc tggtttcata agctcagtaa gaagtctgaa ttcattggaa gctgatgata 1020 gaagaaagag ttcatgcttg ctttgtccat ggaggtttaa caggaatgaa ttgctaaact 1080 gtggaaaatg ttttaaacaa atgcatctta tcctgtagga aacaagctat attgaagaca 1140 actgcaatca aaatggagcc atctccctga tcttctccct gaaggaggag gtgggagccc 1200 tggccaaggt gctgagactg tttgaggaga atgatgtgaa cctgacccac attgagtcca 1260 gaccctccag actgaagaag gatgagtatg agttcttcac ccacctggac aagagatccc 1320 tgcctgccct gaccaacatc atcaagatcc tgagacatga cattggagcc acagtgcatg 1380 agctgtccag agacaagaag aaggacacag tgccctggtt ccccagaacc atccaggagc 1440 tggacagatt tgccaaccag atcctgtcct atggagctga gctggatgct gaccaccctg 1500 gcttcaagga ccctgtgtac agggccagaa gaaagcagtt tgctgacatt gcctacaact 1560 acagacatgg ccagcccatc cccagagtgg agtacatgga ggaggagaag aagacctggg 1620 gcacagtgtt caagaccctg aagtccctgt acaagaccca tgcctgctat gagtacaacc 1680 acatcttccc cctgctggag aagtactgtg gcttccatga ggacaacatc ccccagctgg 1740 aggatgtgtc ccagttcctg cagacctgca caggcttcag actgagacct gtggctggcc 1800 tgctgtcctc cagagacttc ctgggaggcc tggccttcag agtgttccac tgcacccagt 1860 acatcagaca tggctccaag cccatgtaca cccctgagcc tgacatctgc catgagctgc 1920 tgggccatgt gcccctgttc tctgacagat cctttgccca gttctcccag gagattggcc 1980 tggcctccct gggagcccct gatgagtaca ttgagaagct ggccaccatc tactggttca 2040 cagtggagtt tggcctgtgc aagcagggag actccatcaa ggcctatgga gctggcctgc 2100 tgtcctcctt tggagagctg cagtactgcc tgtctgagaa gcccaagctg ctgcccctgg 2160 agctggagaa gacagccatc cagaactaca cagtgacaga gttccagccc ctgtactatg 2220 tggctgagtc cttcaatgat gccaaggaga aggtcagaaa ctttgctgcc accatcccca 2280 gacccttctc tgtgagatat gacccctaca cccagagaat tgaggtgctg gacaacaccc 2340 agcagctgaa gatcctggct gactccatca actctgagat tggcatcctg tgctctgccc 2400 tgcagaagat caagtaaacc ttaattaaga gcatcttacc gccatttatt cccatatttg 2460 ttctgttttt cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa 2520 tcatttacat ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca 2580 tgttaagaaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa 2640 aatttgtgaa agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata 2700 tgctgcttta tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc 2760 cttgtataaa tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg 2820 tggcgtggtg tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac 2880 ctgtcaactc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat 2940 cgccgcctgc cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt 3000 ggtgttgtct gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 3060 cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 3120 gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg 3180 ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga 3240 gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa 3300 cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg 3360 cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct 3420 gcagg 3425 <210> 576 <211> 3117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 576 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatcgcggc 180 cgcgttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240 acagttaatc attaacgctt gtactttggt acaatcgatg cgagaacttg tgcctccccg 300 tgttcctgct ctttgtccct ctgtcctact tagactaata tttgccttgg gtactgcaaa 360 caggaaatgg gggagggaca ggagtagggc ggagggtagt taagaatgtg gatccccgtc 420 tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 480 atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 540 ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 600 ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 660 atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 720 ttttcaggtt gggtttaaac cgcagccacc atgtccacag ctgtgctgga gaaccctggc 780 ctgggcagaa agctgtctga ctttggccag gagacctcct acattgagga caactgcaac 840 cagaatggag ccatctccct gatcttctcc ctgaaggagg aggtgggagc cctggccaag 900 gtgctgagac tgtttgagga gaatgatgtg aacctgaccc acattgagtc cagaccctcc 960 agactgaaga aggatgagta tgagttcttc acccacctgg acaagagatc cctgcctgcc 1020 ctgaccaaca tcatcaagat cctgagacat gacattggag ccacagtgca tgagctgtcc 1080 agagacaaga agaaggacac agtgccctgg ttccccagaa ccatccagga gctggacaga 1140 tttgccaacc agatcctgtc ctatggagct gagctggatg ctgaccaccc tggcttcaag 1200 gaccctgtgt acagggccag aagaaagcag tttgctgaca ttgcctacaa ctacagacat 1260 ggccagccca tccccagagt ggagtacatg gaggaggaga agaagacctg gggcacagtg 1320 ttcaagaccc tgaagtccct gtacaagacc catgcctgct atgagtacaa ccacatcttc 1380 cccctgctgg agaagtactg tggcttccat gaggacaaca tcccccagct ggaggatgtg 1440 tcccagttcc tgcagacctg cacaggcttc agactgagac ctgtggctgg cctgctgtcc 1500 tccagagact tcctgggagg cctggccttc agagtgttcc actgcaccca gtacatcaga 1560 catggctcca agcccatgta cacccctgag cctgacatct gccatgagct gctgggccat 1620 gtgcccctgt tctctgacag atcctttgcc cagttctccc aggagattgg cctggcctcc 1680 ctgggagccc ctgatgagta cattgagaag ctggccacca tctactggtt cacagtggag 1740 tttggcctgt gcaagcaggg agactccatc aaggcctatg gagctggcct gctgtcctcc 1800 tttggagagc tgcagtactg cctgtctgag aagcccaagc tgctgcccct ggagctggag 1860 aagacagcca tccagaacta cacagtgaca gagttccagc ccctgtacta tgtggctgag 1920 tccttcaatg atgccaagga gaaggtcaga aactttgctg ccaccatccc cagacccttc 1980 tctgtgagat atgaccccta cacccagaga attgaggtgc tggacaacac ccagcagctg 2040 aagatcctgg ctgactccat caactctgag attggcatcc tgtgctctgc cctgcagaag 2100 atcaagtaaa ccttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt 2160 ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac 2220 atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga 2280 aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg 2340 aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt 2400 tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata 2460 aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg 2520 tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac 2580 tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct 2640 gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt 2700 ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 2760 tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 2820 tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 2880 gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct 2940 acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt 3000 gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 3060 ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcagg 3117 <210> 577 <211> 2918 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 577 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120 tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggtg aatattaacc 180 aaggtcaccc cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc 240 tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 300 atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 360 ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 420 ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 480 atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 540 ttttcaggtt ggtttaaacc gcagccacca tgagcaccgc cgtgctggaa aatcctggcc 600 tgggcagaaa gctgagcgac ttcggccaag agacaagcta catcgaggac aactgcaacc 660 agaacggcgc catcagcctg atcttcagcc tgaaagaaga agtgggcgcc ctggccaagg 720 tgctgagact gttcgaagag aacgacgtga acctgacaca catcgagagc agacccagca 780 gactgaagaa ggacgagtac gagttcttca cccacctgga caagcggagc ctgcctgctc 840 tgaccaacat catcaagatc ctgcggcacg acatcggcgc cacagtgcac gaactgagcc 900 gggacaagaa aaaggacacc gtgccatggt tccccagaac catccaagag ctggacagat 960 tcgccaacca gatcctgagc tatggcgccg agctggacgc tgatcaccct ggctttaagg 1020 accccgtgta ccgggccaga agaaagcagt ttgccgatat cgcctacaac taccggcacg 1080 gccagcctat tcctcgggtc gagtacatgg aagaggaaaa gaaaacctgg ggcaccgtgt 1140 tcaagaccct gaagtccctg tacaagaccc acgcctgcta cgagtacaac cacatcttcc 1200 cactgctcga aaagtactgc ggcttccacg aggacaatat ccctcagctt gaggacgtgt 1260 cccagttcct gcagacctgc accggcttta gactgaggcc agttgccgga ctgctgagca 1320 gcagagattt tctcggcggc ctggccttca gagtgttcca ctgtacccag tacatcagac 1380 acggcagcaa gcccatgtac acccctgagc ctgatatctg ccacgagctg ctgggacatg 1440 tgcccctgtt cagcgataga agcttcgccc agttcagcca agagatcgga ctggcttctc 1500 tgggagcccc tgacgagtac attgagaagc tggccaccat ctactggttc accgtggaat 1560 tcggcctgtg caagcagggc gacagcatca aagcttatgg cgctggcctg ctgtctagct 1620 tcggcgagct gcagtactgt ctgagcgaga agcctaagct gctgcccctg gaactggaaa 1680 agaccgccat ccagaactac accgtgaccg agttccagcc tctgtactac gtggccgaga 1740 gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc caccattcct cggcctttca 1800 gcgtcagata cgacccctac acacagcgga tcgaggtgct ggacaacaca cagcagctga 1860 aaattctggc cgactccatc aacagcgaga tcggcatcct gtgcagcgcc ctgcagaaaa 1920 tcaagtgata gttaattaag agcatcttac cgccatttat tcccatattt gttctgtttt 1980 tcttgatttg ggtatacatt taaatgttaa taaaacaaaa tggtggggca atcatttaca 2040 tttttaggga tatgtaatta ctagttcagg tgtattgcca caagacaaac atgttaagaa 2100 actttcccgt tatttacgct ctgttcctgt taatcaacct ctggattaca aaatttgtga 2160 aagattgact gatattctta actatgttgc tccttttacg ctgtgtggat atgctgcttt 2220 atagcctctg tatctagcta ttgcttcccg tacggctttc gttttctcct ccttgtataa 2280 atcctggttg ctgtctcttt tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt 2340 gtgctctgtg tttgctgacg caacccccac tggctggggc attgccacca cctgtcaact 2400 cctttctggg actttcgctt tccccctccc gatcgccacg gcagaactca tcgccgcctg 2460 ccttgcccgc tgctggacag gggctaggtt gctgggcact gataattccg tggtgttgtc 2520 tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 2580 ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 2640 gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 2700 ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta 2760 cgtagataag tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg 2820 atggagttgg ccactccctc tctgcgcgct cgctcgctca actgaggccg cccgggcaaa 2880 gcccgggcgt cgggcgacct ttggtcgccc ggcctcag 2918 <210> 578 <211> 3174 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 578 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120 tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggta aacattaacc 180 aaggtcaccc cagttatcag aggagcaaac aggggcaaag tccaccgggg gaggctgctg 240 gtaaacatta accaaggtca ccccagttat cagaggagca aacaggggca aagtccaccg 300 ggggaggctg ctggtaaaca ttaaccaagg tcaccccagt tatcagagga gcaaacaggg 360 gcaaagtcca cggtacccac tgggaggatg ttgagtaaga tggaaaacta ctgatgaccc 420 ttgcagagac agagtattag gacatgtttg aacaggggcc gggcgatcag caggtagctc 480 tagaggatcc ccgtctgtct gcacatttcg tagagcgagt gttccgatac tctaatctcc 540 ctaggcaagg ttcatatttg tgtaggttac ttattctcct tttgttgact aagtcaataa 600 tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt tggaaggagg 660 gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc tcctgaagag 720 gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct 780 gcctgaaatc actttttttc aggttgggtt taaaccgcag ccaccatgag caccgccgtg 840 ctggaaaatc ctggcctggg cagaaagctg agcgacttcg gccaagagac aagctacatc 900 gaggacaact gcaaccagaa cggcgccatc agcctgatct tcagcctgaa agaagaagtg 960 ggcgccctgg ccaaggtgct gagactgttc gaagagaacg acgtgaacct gacacacatc 1020 gagagcagac ccagcagact gaagaaggac gagtacgagt tcttcaccca cctggacaag 1080 cggagcctgc ctgctctgac caacatcatc aagatcctgc ggcacgacat cggcgccaca 1140 gtgcacgaac tgagccggga caagaaaaag gacaccgtgc catggttccc cagaaccatc 1200 caagagctgg acagattcgc caaccagatc ctgagctatg gcgccgagct ggacgctgat 1260 caccctggct ttaaggaccc cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc 1320 tacaactacc ggcacggcca gcctattcct cgggtcgagt acatggaaga ggaaaagaaa 1380 acctggggca ccgtgttcaa gaccctgaag tccctgtaca agacccacgc ctgctacgag 1440 tacaaccaca tcttcccact gctcgaaaag tactgcggct tccacgagga caatatccct 1500 cagcttgagg acgtgtccca gttcctgcag acctgcaccg gctttagact gaggccagtt 1560 gccggactgc tgagcagcag agattttctc ggcggcctgg ccttcagagt gttccactgt 1620 acccagtaca tcagacacgg cagcaagccc atgtacaccc ctgagcctga tatctgccac 1680 gagctgctgg gacatgtgcc cctgttcagc gatagaagct tcgcccagtt cagccaagag 1740 atcggactgg cttctctggg agcccctgac gagtacattg agaagctggc caccatctac 1800 tggttcaccg tggaattcgg cctgtgcaag cagggcgaca gcatcaaagc ttatggcgct 1860 ggcctgctgt ctagcttcgg cgagctgcag tactgtctga gcgagaagcc taagctgctg 1920 cccctggaac tggaaaagac cgccatccag aactacaccg tgaccgagtt ccagcctctg 1980 tactacgtgg ccgagagctt caacgacgcc aaagaaaaag tgcggaactt cgccgccacc 2040 attcctcggc ctttcagcgt cagatacgac ccctacacac agcggatcga ggtgctggac 2100 aacacacagc agctgaaaat tctggccgac tccatcaaca gcgagatcgg catcctgtgc 2160 agcgccctgc agaaaatcaa gtgatagtta attaagagca tcttaccgcc atttattccc 2220 atatttgttc tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt 2280 ggggcaatca tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag 2340 acaaacatgt taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg 2400 attacaaaat ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt 2460 gtggatatgc tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt 2520 tctcctcctt gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc 2580 gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg 2640 ccaccacctg tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag 2700 aactcatcgc cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata 2760 attccgtggt gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg 2820 tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa 2880 ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca 2940 gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg 3000 ctctagagca tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca 3060 ggaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcaactg 3120 aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg tcgcccggcc tcag 3174 <210> 579 <211> 2918 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 579 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120 tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggta aacattaacc 180 aaggtcaccc cagttatcag aggagcaaac aggggcaaag tccacacgcg tggtaccgtc 240 tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 300 atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 360 ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 420 ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 480 atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 540 ttttcaggtt ggtttaaacc gcagccacca tgagcaccgc cgtgctggaa aatcctggcc 600 tgggcagaaa gctgagcgac ttcggccaag agacaagcta catcgaggac aactgcaacc 660 agaacggcgc catcagcctg atcttcagcc tgaaagaaga agtgggcgcc ctggccaagg 720 tgctgagact gttcgaagag aacgacgtga acctgacaca catcgagagc agacccagca 780 gactgaagaa ggacgagtac gagttcttca cccacctgga caagcggagc ctgcctgctc 840 tgaccaacat catcaagatc ctgcggcacg acatcggcgc cacagtgcac gaactgagcc 900 gggacaagaa aaaggacacc gtgccatggt tccccagaac catccaagag ctggacagat 960 tcgccaacca gatcctgagc tatggcgccg agctggacgc tgatcaccct ggctttaagg 1020 accccgtgta ccgggccaga agaaagcagt ttgccgatat cgcctacaac taccggcacg 1080 gccagcctat tcctcgggtc gagtacatgg aagaggaaaa gaaaacctgg ggcaccgtgt 1140 tcaagaccct gaagtccctg tacaagaccc acgcctgcta cgagtacaac cacatcttcc 1200 cactgctcga aaagtactgc ggcttccacg aggacaatat ccctcagctt gaggacgtgt 1260 cccagttcct gcagacctgc accggcttta gactgaggcc agttgccgga ctgctgagca 1320 gcagagattt tctcggcggc ctggccttca gagtgttcca ctgtacccag tacatcagac 1380 acggcagcaa gcccatgtac acccctgagc ctgatatctg ccacgagctg ctgggacatg 1440 tgcccctgtt cagcgataga agcttcgccc agttcagcca agagatcgga ctggcttctc 1500 tgggagcccc tgacgagtac attgagaagc tggccaccat ctactggttc accgtggaat 1560 tcggcctgtg caagcagggc gacagcatca aagcttatgg cgctggcctg ctgtctagct 1620 tcggcgagct gcagtactgt ctgagcgaga agcctaagct gctgcccctg gaactggaaa 1680 agaccgccat ccagaactac accgtgaccg agttccagcc tctgtactac gtggccgaga 1740 gcttcaacga cgccaaagaa aaagtgcgga acttcgccgc caccattcct cggcctttca 1800 gcgtcagata cgacccctac acacagcgga tcgaggtgct ggacaacaca cagcagctga 1860 aaattctggc cgactccatc aacagcgaga tcggcatcct gtgcagcgcc ctgcagaaaa 1920 tcaagtgata gttaattaag agcatcttac cgccatttat tcccatattt gttctgtttt 1980 tcttgatttg ggtatacatt taaatgttaa taaaacaaaa tggtggggca atcatttaca 2040 tttttaggga tatgtaatta ctagttcagg tgtattgcca caagacaaac atgttaagaa 2100 actttcccgt tatttacgct ctgttcctgt taatcaacct ctggattaca aaatttgtga 2160 aagattgact gatattctta actatgttgc tccttttacg ctgtgtggat atgctgcttt 2220 atagcctctg tatctagcta ttgcttcccg tacggctttc gttttctcct ccttgtataa 2280 atcctggttg ctgtctcttt tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt 2340 gtgctctgtg tttgctgacg caacccccac tggctggggc attgccacca cctgtcaact 2400 cctttctggg actttcgctt tccccctccc gatcgccacg gcagaactca tcgccgcctg 2460 ccttgcccgc tgctggacag gggctaggtt gctgggcact gataattccg tggtgttgtc 2520 tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct 2580 ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct 2640 gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg 2700 ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta 2760 cgtagataag tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg 2820 atggagttgg ccactccctc tctgcgcgct cgctcgctca actgaggccg cccgggcaaa 2880 gcccgggcgt cgggcgacct ttggtcgccc ggcctcag 2918 <210> 580 <211> 3069 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 580 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120 tgattaaccc gccatgctac ttatcgcggc cgcgttaatc attaacgctt gtactttggt 180 acagttaatc attaacgctt gtactttggt acagttaatc attaacgctt gtactttggt 240 acaatcgatg cgagaacttg tgcctccccg tgttcctgct ctttgtccct ctgtcctact 300 tagactaata tttgccttgg gtactgcaaa caggaaatgg gggagggaca ggagtagggc 360 ggagggtagt taagaatgtg gatccccgtc tgtctgcaca tttcgtagag cgagtgttcc 420 gatactctaa tctccctagg caaggttcat atttgtgtag gttacttatt ctccttttgt 480 tgactaagtc aataatcaga atcagcaggt ttggagtcag cttggcaggg atcagcagcc 540 tgggttggaa ggagggggta taaaagcccc ttcaccagga gaagccgtca cacagatcca 600 caagctcctg aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa 660 ttacctggag cacctgcctg aaatcacttt ttttcaggtt gggtttaaac cgcagccacc 720 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 780 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 840 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 900 aacctgacac acatcgagag cagacccagc agactgaaga aggacgagta cgagttcttc 960 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 1020 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 1080 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 1140 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 1200 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 1260 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 1320 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 1380 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 1440 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 1500 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 1560 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 1620 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 1680 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1740 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1800 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1860 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1920 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1980 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 2040 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtgat agttaattaa gagcatctta 2100 ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta 2160 ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag 2220 gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg 2280 ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg 2340 ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc 2400 gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt 2460 tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca 2520 ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc 2580 cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt 2640 tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg 2700 tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct 2760 aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg 2820 gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg 2880 cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca 2940 ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc 3000 tcgctcgctc aactgaggcc gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc 3060 cggcctcag 3069 <210> 581 <211> 4060 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 581 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120 tgattaaccc gccatgctac ttatcgcggc cgcagcaaca gatcattcta tgggttaatc 180 attaacaaca ggttaggctt gtactttggt acattggctc ctagttaatc attaacttag 240 caatgtgctt gtactttggt acatagttac ctagttaatc attaacaaac agtatggctt 300 gtactttggt acaagcaaca gatcattcta tgggcgagaa cttgtgcctc cccgtgttcc 360 tgctctttgt ccctctgtcc tacttagact aatatttgcc ttgggtactg caaacaggaa 420 atgggggagg gacaggagta gggcggaggg tagcaattgg attctgcagt gagagcagag 480 ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc tccaccttgg 540 acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa gtgcagtgga 600 agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc agatcccagc 660 cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt taatattcac 720 cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga ggacagggcc 780 ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatgttt aaaccgcagc 840 caccatgtcc acagctgtgc tggagaaccc tggcttgggc aggaaactct ctgactttgg 900 acaggtgagc cagggcagcc tgagctgctc agttagggga atttgggcct ccagagaaag 960 agatcccaag actgctggtg cttcctggtt tcataagctc agtaagaagt ctgaattggt 1020 tggaagctga tgagaatatc caggaagtca acagacaaat gtcctcaaca attgtttcta 1080 agtaggagaa catctgtcct gggtggcttt cacaggaatg aatgaccatt gctttagggg 1140 gttggggatc tggcctccag aactgccacc aattagctgt gtgtctttgg acaagttact 1200 gtccctctct gttgtctgtt tactcttctg tacactgaag gggttccaat ccaggtctta 1260 ggattcaaaa gcctgtgcat gttccatttt tagtactttc cacactgtat ttctcaatgt 1320 ctttctggga cattttataa atcatattat atcacctcta aggatctttc agtttgttat 1380 atatgtgtct attaagttag attgtgagct cctaaaagat aaagcattgt cttattcatc 1440 tttaaatttc tcagagccca aatagtgcct ggaacctagt agttgctcaa taaaaggtat 1500 tgaatttaca ggattgaatg gtgacatcaa tgaataattg aagattcctt aagctgataa 1560 ctgacccagt agcatcattg atcatttaat tgccctggac ttacttattt tccaccacac 1620 tacatatttc tgtatagaat atatatagct cattgtattg caagatttaa ctagaagaaa 1680 gagttcatgc ttgctttgtc catgtaggtt taacaggaat gaattgctaa actgtggaaa 1740 atgttttaaa caaatgcatc ttatcctgta ggaaacaagc tatattgaag acaactgcaa 1800 tcaaaatgga gccatctccc tgatcttctc cctgaaggag gaggtgggag ccctggccaa 1860 ggtgctgaga ctgtttgagg agaatgatgt gaacctgacc cacattgagt ccagaccctc 1920 cagactgaag aaggatgagt atgagttctt cacccacctg gacaagagat ccctgcctgc 1980 cctgaccaac atcatcaaga tcctgagaca tgacattgga gccacagtgc atgagctgtc 2040 cagagacaag aagaaggaca cagtgccctg gttccccaga accatccagg agctggacag 2100 atttgccaac cagatcctgt cctatggagc tgagctggat gctgaccacc ctggcttcaa 2160 ggaccctgtg tacagggcca gaagaaagca gtttgctgac attgcctaca actacagaca 2220 tggccagccc atccccagag tggagtacat ggaggaggag aagaagacct ggggcacagt 2280 gttcaagacc ctgaagtccc tgtacaagac ccatgcctgc tatgagtaca accacatctt 2340 ccccctgctg gagaagtact gtggcttcca tgaggacaac atcccccagc tggaggatgt 2400 gtcccagttc ctgcagacct gcacaggctt cagactgaga cctgtggctg gcctgctgtc 2460 ctccagagac ttcctgggag gcctggcctt cagagtgttc cactgcaccc agtacatcag 2520 acatggctcc aagcccatgt acacccctga gcctgacatc tgccatgagc tgctgggcca 2580 tgtgcccctg ttctctgaca gatcctttgc ccagttctcc caggagattg gcctggcctc 2640 cctgggagcc cctgatgagt acattgagaa gctggccacc atctactggt tcacagtgga 2700 gtttggcctg tgcaagcagg gagactccat caaggcctat ggagctggcc tgctgtcctc 2760 ctttggagag ctgcagtact gcctgtctga gaagcccaag ctgctgcccc tggagctgga 2820 gaagacagcc atccagaact acacagtgac agagttccag cccctgtact atgtggctga 2880 gtccttcaat gatgccaagg agaaggtcag aaactttgct gccaccatcc ccagaccctt 2940 ctctgtgaga tatgacccct acacccagag aattgaggtg ctggacaaca cccagcagct 3000 gaagatcctg gctgactcca tcaactctga gattggcatc ctgtgctctg ccctgcagaa 3060 gatcaagtaa accttaatta agagcatctt accgccattt attcccatat ttgttctgtt 3120 tttcttgatt tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta 3180 catttttagg gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag 3240 aaactttccc gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt 3300 gaaagattga ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct 3360 ttatagcctc tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat 3420 aaatcctggt tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg 3480 gtgtgctctg tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa 3540 ctcctttctg ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc 3600 tgccttgccc gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg 3660 tctgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 3720 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 3780 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 3840 tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc 3900 tacgtagata agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag 3960 tgatggagtt ggccactccc tctctgcgcg ctcgctcgct caactgaggc cgcccgggca 4020 aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 4060 <210> 582 <211> 4041 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 582 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120 tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggta aacattaacc 180 aaggtcaccc cagttatcag aggagcaaac aggggcaaag tccaccgggg gaggctgctg 240 gtaaacatta accaaggtca ccccagttat cagaggagca aacaggggca aagtccaccg 300 ggggaggctg ctggtaaaca ttaaccaagg tcaccccagt tatcagagga gcaaacaggg 360 gcaaagtcca cggtacccac tgggaggatg ttgagtaaga tggaaaacta ctgatgaccc 420 ttgcagagac agagtattag gacatgtttg aacaggggcc gggcgatcag caggtagctc 480 tagaggatcc ccgtctgtct gcacatttcg tagagcgagt gttccgatac tctaatctcc 540 ctaggcaagg ttcatatttg tgtaggttac ttattctcct tttgttgact aagtcaataa 600 tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt tggaaggagg 660 gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc tcctgaagag 720 gtaagggttt aagggatggt tggttggtgg ggtattaatg tttaattacc tggagcacct 780 gcctgaaatc actttttttc aggttgggtt taaaccgcag ccaccatgtc cacagctgtg 840 ctggagaacc ctggcttggg caggaaactc tctgactttg gacaggtgag ccagggcagc 900 ctgagctgct cagttagggg aatttgggcc tccagagaaa gagatcccaa gactgctggt 960 gcttcctggt ttcataagct cagtaagaag tctgaattgg ttggaagctg atgagaatat 1020 ccaggaagtc aacagacaaa tgtcctcaac aattgtttct aagtaggaga acatctgtcc 1080 tgggtggctt tcacaggaat gaatgaccat tgctttaggg ggttggggat ctggcctcca 1140 gaactgccac caattagctg tgtgtctttg gacaagttac tgtccctctc tgttgtctgt 1200 ttactcttct gtacactgaa ggggttccaa tccaggtctt aggattcaaa agcctgtgca 1260 tgttccattt ttagtacttt ccacactgta tttctcaatg tctttctggg acattttata 1320 aatcatatta tatcacctct aaggatcttt cagtttgtta tatatgtgtc tattaagtta 1380 gattgtgagc tcctaaaaga taaagcattg tcttattcat ctttaaattt ctcagagccc 1440 aaatagtgcc tggaacctag tagttgctca ataaaaggta ttgaatttac aggattgaat 1500 ggtgacatca atgaataatt gaagattcct taagctgata actgacccag tagcatcatt 1560 gatcatttaa ttgccctgga cttacttatt ttccaccaca ctacatattt ctgtatagaa 1620 tatatatagc tcattgtatt gcaagattta actagaagaa agagttcatg cttgctttgt 1680 ccatgtaggt ttaacaggaa tgaattgcta aactgtggaa aatgttttaa acaaatgcat 1740 cttatcctgt aggaaacaag ctatattgaa gacaactgca atcaaaatgg agccatctcc 1800 ctgatcttct ccctgaagga ggaggtggga gccctggcca aggtgctgag actgtttgag 1860 gagaatgatg tgaacctgac ccacattgag tccagaccct ccagactgaa gaaggatgag 1920 tatgagttct tcacccacct ggacaagaga tccctgcctg ccctgaccaa catcatcaag 1980 atcctgagac atgacattgg agccacagtg catgagctgt ccagagacaa gaagaaggac 2040 acagtgccct ggttccccag aaccatccag gagctggaca gatttgccaa ccagatcctg 2100 tcctatggag ctgagctgga tgctgaccac cctggcttca aggaccctgt gtacagggcc 2160 agaagaaagc agtttgctga cattgcctac aactacagac atggccagcc catccccaga 2220 gtggagtaca tggaggagga gaagaagacc tggggcacag tgttcaagac cctgaagtcc 2280 ctgtacaaga cccatgcctg ctatgagtac aaccacatct tccccctgct ggagaagtac 2340 tgtggcttcc atgaggacaa catcccccag ctggaggatg tgtcccagtt cctgcagacc 2400 tgcacaggct tcagactgag acctgtggct ggcctgctgt cctccagaga cttcctggga 2460 ggcctggcct tcagagtgtt ccactgcacc cagtacatca gacatggctc caagcccatg 2520 tacacccctg agcctgacat ctgccatgag ctgctgggcc atgtgcccct gttctctgac 2580 agatcctttg cccagttctc ccaggagatt ggcctggcct ccctgggagc ccctgatgag 2640 tacattgaga agctggccac catctactgg ttcacagtgg agtttggcct gtgcaagcag 2700 ggagactcca tcaaggccta tggagctggc ctgctgtcct cctttggaga gctgcagtac 2760 tgcctgtctg agaagcccaa gctgctgccc ctggagctgg agaagacagc catccagaac 2820 tacacagtga cagagttcca gcccctgtac tatgtggctg agtccttcaa tgatgccaag 2880 gagaaggtca gaaactttgc tgccaccatc cccagaccct tctctgtgag atatgacccc 2940 tacacccaga gaattgaggt gctggacaac acccagcagc tgaagatcct ggctgactcc 3000 atcaactctg agattggcat cctgtgctct gccctgcaga agatcaagta aaccttaatt 3060 aagagcatct taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac 3120 atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa 3180 ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac 3240 gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc 3300 ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag 3360 ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc 3420 ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg 3480 acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg 3540 ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga 3600 caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc 3660 agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 3720 ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta 3780 ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc 3840 atgctgggga tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg 3900 gcgggttaat cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc 3960 ctctctgcgc gctcgctcgc tcaactgagg ccgcccgggc aaagcccggg cgtcgggcga 4020 cctttggtcg cccggcctca g 4041 <210> 583 <211> 3785 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 583 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120 tgattaaccc gccatgctac ttatcgcggc cgcgggggag gctgctggta aacattaacc 180 aaggtcaccc cagttatcag aggagcaaac aggggcaaag tccacacgcg tggtaccgtc 240 tgtctgcaca tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat 300 atttgtgtag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt 360 ttggagtcag cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc 420 ttcaccagga gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg 480 atggttggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt 540 ttttcaggtt ggtttaaacc gcagccacca tgtccacagc tgtgctggag aaccctggct 600 tgggcaggaa actctctgac tttggacagg tgagccaggg cagcctgagc tgctcagtta 660 ggggaatttg ggcctccaga gaaagagatc ccaagactgc tggtgcttcc tggtttcata 720 agctcagtaa gaagtctgaa ttggttggaa gctgatgaga atatccagga agtcaacaga 780 caaatgtcct caacaattgt ttctaagtag gagaacatct gtcctgggtg gctttcacag 840 gaatgaatga ccattgcttt agggggttgg ggatctggcc tccagaactg ccaccaatta 900 gctgtgtgtc tttggacaag ttactgtccc tctctgttgt ctgtttactc ttctgtacac 960 tgaaggggtt ccaatccagg tcttaggatt caaaagcctg tgcatgttcc atttttagta 1020 ctttccacac tgtatttctc aatgtctttc tgggacattt tataaatcat attatatcac 1080 ctctaaggat ctttcagttt gttatatatg tgtctattaa gttagattgt gagctcctaa 1140 aagataaagc attgtcttat tcatctttaa atttctcaga gcccaaatag tgcctggaac 1200 ctagtagttg ctcaataaaa ggtattgaat ttacaggatt gaatggtgac atcaatgaat 1260 aattgaagat tccttaagct gataactgac ccagtagcat cattgatcat ttaattgccc 1320 tggacttact tattttccac cacactacat atttctgtat agaatatata tagctcattg 1380 tattgcaaga tttaactaga agaaagagtt catgcttgct ttgtccatgt aggtttaaca 1440 ggaatgaatt gctaaactgt ggaaaatgtt ttaaacaaat gcatcttatc ctgtaggaaa 1500 caagctatat tgaagacaac tgcaatcaaa atggagccat ctccctgatc ttctccctga 1560 aggaggaggt gggagccctg gccaaggtgc tgagactgtt tgaggagaat gatgtgaacc 1620 tgacccacat tgagtccaga ccctccagac tgaagaagga tgagtatgag ttcttcaccc 1680 acctggacaa gagatccctg cctgccctga ccaacatcat caagatcctg agacatgaca 1740 ttggagccac agtgcatgag ctgtccagag acaagaagaa ggacacagtg ccctggttcc 1800 ccagaaccat ccaggagctg gacagatttg ccaaccagat cctgtcctat ggagctgagc 1860 tggatgctga ccaccctggc ttcaaggacc ctgtgtacag ggccagaaga aagcagtttg 1920 ctgacattgc ctacaactac agacatggcc agcccatccc cagagtggag tacatggagg 1980 aggagaagaa gacctggggc acagtgttca agaccctgaa gtccctgtac aagacccatg 2040 cctgctatga gtacaaccac atcttccccc tgctggagaa gtactgtggc ttccatgagg 2100 acaacatccc ccagctggag gatgtgtccc agttcctgca gacctgcaca ggcttcagac 2160 tgagacctgt ggctggcctg ctgtcctcca gagacttcct gggaggcctg gccttcagag 2220 tgttccactg cacccagtac atcagacatg gctccaagcc catgtacacc cctgagcctg 2280 acatctgcca tgagctgctg ggccatgtgc ccctgttctc tgacagatcc tttgcccagt 2340 tctcccagga gattggcctg gcctccctgg gagcccctga tgagtacatt gagaagctgg 2400 ccaccatcta ctggttcaca gtggagtttg gcctgtgcaa gcagggagac tccatcaagg 2460 cctatggagc tggcctgctg tcctcctttg gagagctgca gtactgcctg tctgagaagc 2520 ccaagctgct gcccctggag ctggagaaga cagccatcca gaactacaca gtgacagagt 2580 tccagcccct gtactatgtg gctgagtcct tcaatgatgc caaggagaag gtcagaaact 2640 ttgctgccac catccccaga cccttctctg tgagatatga cccctacacc cagagaattg 2700 aggtgctgga caacacccag cagctgaaga tcctggctga ctccatcaac tctgagattg 2760 gcatcctgtg ctctgccctg cagaagatca agtaaacctt aattaagagc atcttaccgc 2820 catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa atgttaataa 2880 aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta gttcaggtgt 2940 attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg ttcctgttaa 3000 tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact atgttgctcc 3060 ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg cttcccgtac 3120 ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag aggagttgtg 3180 gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg 3240 ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc ccctcccgat 3300 cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctaggttgct 3360 gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat ctgttgtttg 3420 cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 3480 aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 3540 ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 3600 gggctctatg gctctagagc atggctacgt agataagtag catggcgggt taatcattaa 3660 ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3720 tcgctcaact gaggccgccc gggcaaagcc cgggcgtcgg gcgacctttg gtcgcccggc 3780 ctcag 3785 <210> 584 <211> 4015 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 584 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 60 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 120 tgattaaccc gccatgctac ttatcgcggc cgcagcaaca gatcattcta tgggttaatc 180 attaacaaca ggttaggtta atcattaact tggctcctag ttaatcatta acaaacagta 240 tggttaatca ttaacaaatt ctggggttaa tcattaacta gttacctagc gagaacttgt 300 gcctccccgt gttcctgctc tttgtccctc tgtcctactt agactaatat ttgccttggg 360 tactgcaaac aggaaatggg ggagggacag gagtagggcg gagggtagca attggattct 420 gcagtgagag cagagggcca gctaagtggt actctcccag agactgtctg actcacgcca 480 ccccctccac cttggacaca ggacgctgtg gtttctgagc caggtacaat gactcctttc 540 ggtaagtgca gtggaagctg tacactgccc aggcaaagcg tccgggcagc gtaggcgggc 600 gactcagatc ccagccagtg gacttagccc ctgtttgctc ctccgataac tggggtgacc 660 ttggttaata ttcaccagca gcctcccccg ttgcccctct ggatccactg cttaaatacg 720 gacgaggaca gggccctgtc tcctcagctt caggcaccac cactgacctg ggacagtgaa 780 tgtttaaacc gcagccacca tgtccacagc tgtgctggag aaccctggct tgggcaggaa 840 actctctgac tttggacagg tgagccaggg cagcctgagc tgctcagtta ggggaatttg 900 ggcctccaga gaaagagatc ccaagactgc tggtgcttcc tggtttcata agctcagtaa 960 gaagtctgaa ttggttggaa gctgatgaga atatccagga agtcaacaga caaatgtcct 1020 caacaattgt ttctaagtag gagaacatct gtcctgggtg gctttcacag gaatgaatga 1080 ccattgcttt agggggttgg ggatctggcc tccagaactg ccaccaatta gctgtgtgtc 1140 tttggacaag ttactgtccc tctctgttgt ctgtttactc ttctgtacac tgaaggggtt 1200 ccaatccagg tcttaggatt caaaagcctg tgcatgttcc atttttagta ctttccacac 1260 tgtatttctc aatgtctttc tgggacattt tataaatcat attatatcac ctctaaggat 1320 ctttcagttt gttatatatg tgtctattaa gttagattgt gagctcctaa aagataaagc 1380 attgtcttat tcatctttaa atttctcaga gcccaaatag tgcctggaac ctagtagttg 1440 ctcaataaaa ggtattgaat ttacaggatt gaatggtgac atcaatgaat aattgaagat 1500 tccttaagct gataactgac ccagtagcat cattgatcat ttaattgccc tggacttact 1560 tattttccac cacactacat atttctgtat agaatatata tagctcattg tattgcaaga 1620 tttaactaga agaaagagtt catgcttgct ttgtccatgt aggtttaaca ggaatgaatt 1680 gctaaactgt ggaaaatgtt ttaaacaaat gcatcttatc ctgtaggaaa caagctatat 1740 tgaagacaac tgcaatcaaa atggagccat ctccctgatc ttctccctga aggaggaggt 1800 gggagccctg gccaaggtgc tgagactgtt tgaggagaat gatgtgaacc tgacccacat 1860 tgagtccaga ccctccagac tgaagaagga tgagtatgag ttcttcaccc acctggacaa 1920 gagatccctg cctgccctga ccaacatcat caagatcctg agacatgaca ttggagccac 1980 agtgcatgag ctgtccagag acaagaagaa ggacacagtg ccctggttcc ccagaaccat 2040 ccaggagctg gacagatttg ccaaccagat cctgtcctat ggagctgagc tggatgctga 2100 ccaccctggc ttcaaggacc ctgtgtacag ggccagaaga aagcagtttg ctgacattgc 2160 ctacaactac agacatggcc agcccatccc cagagtggag tacatggagg aggagaagaa 2220 gacctggggc acagtgttca agaccctgaa gtccctgtac aagacccatg cctgctatga 2280 gtacaaccac atcttccccc tgctggagaa gtactgtggc ttccatgagg acaacatccc 2340 ccagctggag gatgtgtccc agttcctgca gacctgcaca ggcttcagac tgagacctgt 2400 ggctggcctg ctgtcctcca gagacttcct gggaggcctg gccttcagag tgttccactg 2460 cacccagtac atcagacatg gctccaagcc catgtacacc cctgagcctg acatctgcca 2520 tgagctgctg ggccatgtgc ccctgttctc tgacagatcc tttgcccagt tctcccagga 2580 gattggcctg gcctccctgg gagcccctga tgagtacatt gagaagctgg ccaccatcta 2640 ctggttcaca gtggagtttg gcctgtgcaa gcagggagac tccatcaagg cctatggagc 2700 tggcctgctg tcctcctttg gagagctgca gtactgcctg tctgagaagc ccaagctgct 2760 gcccctggag ctggagaaga cagccatcca gaactacaca gtgacagagt tccagcccct 2820 gtactatgtg gctgagtcct tcaatgatgc caaggagaag gtcagaaact ttgctgccac 2880 catccccaga cccttctctg tgagatatga cccctacacc cagagaattg aggtgctgga 2940 caacacccag cagctgaaga tcctggctga ctccatcaac tctgagattg gcatcctgtg 3000 ctctgccctg cagaagatca agtaaacctt aattaagagc atcttaccgc catttattcc 3060 catatttgtt ctgtttttct tgatttgggt atacatttaa atgttaataa aacaaaatgg 3120 tggggcaatc atttacattt ttagggatat gtaattacta gttcaggtgt attgccacaa 3180 gacaaacatg ttaagaaact ttcccgttat ttacgctctg ttcctgttaa tcaacctctg 3240 gattacaaaa tttgtgaaag attgactgat attcttaact atgttgctcc ttttacgctg 3300 tgtggatatg ctgctttata gcctctgtat ctagctattg cttcccgtac ggctttcgtt 3360 ttctcctcct tgtataaatc ctggttgctg tctcttttag aggagttgtg gcccgttgtc 3420 cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa cccccactgg ctggggcatt 3480 gccaccacct gtcaactcct ttctgggact ttcgctttcc ccctcccgat cgccacggca 3540 gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctaggttgct gggcactgat 3600 aattccgtgg tgttgtctgt gccttctagt tgccagccat ctgttgtttg cccctccccc 3660 gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 3720 attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 3780 agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 3840 gctctagagc atggctacgt agataagtag catggcgggt taatcattaa ctacacctgc 3900 aggaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcaact 3960 gaggccgccc gggcaaagcc cgggcgtcgg gcgacctttg gtcgcccggc ctcag 4015 <210> 585 <211> 1362 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 585 atggccgctg tggtgctgga aaatggcgtg ctgagcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caacagcaac cagaacggcg ctgtgtccct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgtttgagga aaacgagatc 180 aacctgacgc acatcgagag cagacccagc agactgaaca aggacgagta cgagttcttc 240 acctacctgg acaagagaag caagcccgtg ctgggcagca tcatcaagag cctgagaaac 300 gacatcggcg ccaccgtgca cgagctgagc agggacaaag aaaagaacac cgtgccatgg 360 ttccccagga ccatccaaga gctggacaga ttcgccaacc agatcctgtc ttacggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt acagagccag aagaaagcag 480 ttcgccgata tcgcctacaa ctacagacac ggccagccta ttcctagagt cgagtacacc 540 gaggaagaga gaaagacctg gggcaccgtg ttcagaaccc tgaaggccct gtacaagacc 600 cacgcctgct acgagcacaa ccacatcttc ccactgctcg aaaagtactg cggcttccgc 660 gaggataaca tccctcagct tgaggacgtg tcccagttcc tgcagacctg cacaggcttc 720 agactgaggc cagttgctgg cctgctgtcc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcagg cacggcagca agcccatgta cacccctgag 840 cctgacatct gccacgagct gctgggacat gtgcctctgt tcagcgacag aagcttcgcc 900 cagttcagcc aagagatcgg cctggctagt ctgggcgctc ctgatgagta catcgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaaagaggg cgacagcatc 1020 aaggcttatg gcgccggact gctgtctagc tttggcgagc tgcagtactg tctgagcgac 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcct gccaagagta cacagtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 accttcgccg ctacaatccc cagacctttc agcgtcagat acgaccccta cacacagcgc 1260 gtggaagtgc tggacaacac acagcagctg aagattctgg ccgactccat caacagcgaa 1320 gtgggcatcc tgtgtcacgc cctgcagaaa atcaagagct ga 1362 <210> 586 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 586 cgggggaggc tgctggtaaa cattaaccaa ggtcacccca gttatcagag gagcaaacag 60 gggcaaagtc cac 73 <210> 587 <211> 218 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 587 gggggaggct gctggtaaac attaaccaag gtcaccccag ttatcagagg agcaaacagg 60 ggcaaagtcc accgggggag gctgctggta aacattaacc aaggtcaccc cagttatcag 120 aggagcaaac aggggcaaag tccaccgggg gaggctgctg gtaaacatta accaaggtca 180 ccccagttat cagaggagca aacaggggca aagtccac 218 <210> 588 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 588 gggggaagct actggtgaat attaaccaag gtcacccagt tatcagggag caaacaggag 60 ctaagtccat 70 <210> 589 <211> 212 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 589 aggggaagct actggtgaat attaaccaag gtcacccagt tatcagggag caaacaggag 60 ctaagtccat agggggaagc tactggtgaa tattaaccaa ggtcacccag ttatcaggga 120 gcaaacagga gctaagtcca tagggggaag ctactggtga atattaacca aggtcaccca 180 gttatcaggg agcaaacagg agctaagtcc at 212 <210> 590 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 590 ggaggctgtt ggtgaatatt aaccaaggtc accccagtta tcggaggagc aaacaagggc 60 taagtccac 69 <210> 591 <211> 209 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 591 ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc aaacaagggc 60 taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc 120 aaacaagggc taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta 180 tcggaggagc aaacaagggc taagtccac 209 <210> 592 <211> 211 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 592 aggaggctgt tggtgaatat taaccaaggt cacctcagtt atcagaggag caaacaaggg 60 ctaagtccac aggaggctgt tggtgaatat taaccaaggt cacctcagtt atcagaggag 120 caaacaaggg ctaagtccac aggaggctgt tggtgaatat taaccaaggt cacctcagtt 180 atcagaggag caaacaaggg ctaagtccac a 211 <210> 593 <211> 218 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 593 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc acagggggag gctgctggtg aatattaacc aaggtcaccc cagttatcgg 120 aggagcaaac aggggctaag tccacagggg gaggctgctg gtgaatatta accaaggtca 180 ccccagttat cggaggagca aacaggggct aagtccac 218 <210> 594 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 594 aggggaagct actggtgaat attaaccaag gtcacccagt tatcagggag caaacaggag 60 ctaagtccat agggggaagc tactggtgaa tattaaccaa ggtcacccag ttatcaggga 120 gcaaacagga gctaagtcca tagggggaag ctactggtga atattaacca aggtcaccca 180 gttatcaggg agcaaacagg agctaagtcc atagggggaa gctactggtg aatattaacc 240 aaggtcaccc agttatcagg gagcaaacag gagctaagtc cataggggga agctactggt 300 gaatattaac caaggtcacc cagttatcag ggagcaaaca ggagctaagt ccat 354 <210> 595 <211> 349 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 595 ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc aaacaagggc 60 taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc 120 aaacaagggc taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta 180 tcggaggagc aaacaagggc taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc 240 acctcagtta tcggaggagc aaacaagggc taagtccacc ggaggctgtt ggtgaatatt 300 aaccaaggtc acctcagtta tcggaggagc aaacaagggc taagtccac 349 <210> 596 <211> 238 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 596 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc accattctgc tttgggggag gctgctggtg aatattaacc aaggtcaccc 120 cagttatcgg aggagcaaac aggggctaag tccacttgat taagaagggg gaggctgctg 180 gtgaatatta accaaggtca ccccagttat cggaggagca aacaggggct aagtccac 238 <210> 597 <211> 276 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 597 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc acatagaaga atttcttaca ttgtgtgaac ctgggggagg ctgctggtga 120 atattaacca aggtcacccc agttatcgga ggagcaaaca ggggctaagt ccacattgaa 180 gtgcaaagtc actaatatta agcaggggga ggctgctggt gaatattaac caaggtcacc 240 ccagttatcg gaggagcaaa caggggctaa gtccac 276 <210> 598 <211> 276 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 598 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc acattaacta ttgggacttt ggttaacaac aagggggagg ctgctggtga 120 atattaacca aggtcacccc agttatcgga ggagcaaaca ggggctaagt ccaccagaga 180 cttattgttt acagctaact atctggggga ggctgctggt gaatattaac caaggtcacc 240 ccagttatcg gaggagcaaa caggggctaa gtccac 276 <210> 599 <211> 220 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 599 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc acctggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg 120 gaggagcaaa caggggctaa gtccaccagg gggaggctgc tggtgaatat taaccaaggt 180 caccccagtt atcggaggag caaacagggg ctaagtccac 220 <210> 600 <211> 220 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 600 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc acctggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg 120 gaggagcaaa caggggctaa gtccacttgg gggaggctgc tggtgaatat taaccaaggt 180 caccccagtt atcggaggag caaacagggg ctaagtccac 220 <210> 601 <211> 220 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 601 gggggaggct gctggtgaat attaaccaag gtcaccccag ttatcggagg agcaaacagg 60 ggctaagtcc acctggggga ggctgctggt gaatattaac caaggtcacc ccagttatcg 120 gaggagcaaa caggggctaa gtccacaagg gggaggctgc tggtgaatat taaccaaggt 180 caccccagtt atcggaggag caaacagggg ctaagtccac 220 <210> 602 <211> 556 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 602 aggggaagct actggtgaat attaaccaag gtcacccagt tatcagggag caaacaggag 60 ctaagtccat agggggaagc tactggtgaa tattaaccaa ggtcacccag ttatcaggga 120 gcaaacagga gctaagtcca tagggggaag ctactggtga atattaacca aggtcaccca 180 gttatcaggg agcaaacagg agctaagtcc atggtaccca ctgggaggat gttgagtaag 240 atggaaaact actgatgacc cttgcagaga cagagtatta ggacatgttt gaacaggggc 300 cgggcgatca gcaggtagct ctagaggatc cccgtctgtc tgcacatttc gtagagcgag 360 tgttccgata ctctaatctc cctaggcaag gttcatattt gtgtaggtta cttattctcc 420 ttttgttgac taagtcaata atcagaatca gcaggtttgg agtcagcttg gcagggatca 480 gcagcctggg ttggaaggag ggggtataaa agccccttca ccaggagaag ccgtcacaca 540 gatccacaag ctcctg 556 <210> 603 <211> 553 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 603 ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc aaacaagggc 60 taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta tcggaggagc 120 aaacaagggc taagtccacc ggaggctgtt ggtgaatatt aaccaaggtc acctcagtta 180 tcggaggagc aaacaagggc taagtccacg gtacccactg ggaggatgtt gagtaagatg 240 gaaaactact gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg 300 gcgatcagca ggtagctcta gaggatcccc gtctgtctgc acatttcgta gagcgagtgt 360 tccgatactc taatctccct aggcaaggtt catatttgtg taggttactt attctccttt 420 tgttgactaa gtcaataatc agaatcagca ggtttggagt cagcttggca gggatcagca 480 gcctgggttg gaaggagggg gtataaaagc cccttcacca ggagaagccg tcacacagat 540 ccacaagctc ctg 553 <210> 604 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 604 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc acttgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300 ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360 taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720 ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900 gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125 <210> 605 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 605 atcgatcg 8 <210> 606 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 606 cgatcgat 8 <210> 607 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 607 atcgatcg 8 <210> 608 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 608 atcgatcg 8 <210> 609 <400> 609 000 <210> 610 <400> 610 000 <210> 611 <400> 611 000 <210> 612 <400> 612 000 <210> 613 <400> 613 000 <210> 614 <400> 614 000 <210> 615 <400> 615 000 <210> 616 <400> 616 000 <210> 617 <400> 617 000 <210> 618 <400> 618 000 <210> 619 <400> 619 000 <210> 620 <400> 620 000 <210> 621 <400> 621 000 <210> 622 <400> 622 000 <210> 623 <400> 623 000 <210> 624 <400> 624 000 <210> 625 <400> 625 000 <210> 626 <400> 626 000 <210> 627 <400> 627 000 <210> 628 <400> 628 000 <210> 629 <400> 629 000 <210> 630 <400> 630 000 <210> 631 <400> 631 000 <210> 632 <400> 632 000 <210> 633 <400> 633 000 <210> 634 <400> 634 000 <210> 635 <400> 635 000 <210> 636 <400> 636 000 <210> 637 <400> 637 000 <210> 638 <400> 638 000 <210> 639 <400> 639 000 <210> 640 <400> 640 000 <210> 641 <400> 641 000 <210> 642 <400> 642 000 <210> 643 <400> 643 000 <210> 644 <400> 644 000 <210> 645 <400> 645 000 <210> 646 <400> 646 000 <210> 647 <400> 647 000 <210> 648 <400> 648 000 <210> 649 <400> 649 000 <210> 650 <400> 650 000 <210> 651 <400> 651 000 <210> 652 <400> 652 000 <210> 653 <400> 653 000 <210> 654 <400> 654 000 <210> 655 <400> 655 000 <210> 656 <400> 656 000 <210> 657 <400> 657 000 <210> 658 <400> 658 000 <210> 659 <400> 659 000 <210> 660 <400> 660 000 <210> 661 <400> 661 000 <210> 662 <400> 662 000 <210> 663 <400> 663 000 <210> 664 <400> 664 000 <210> 665 <400> 665 000 <210> 666 <400> 666 000 <210> 667 <400> 667 000 <210> 668 <400> 668 000 <210> 669 <400> 669 000 <210> 670 <400> 670 000 <210> 671 <400> 671 000 <210> 672 <400> 672 000 <210> 673 <400> 673 000 <210> 674 <400> 674 000 <210> 675 <400> 675 000 <210> 676 <400> 676 000 <210> 677 <400> 677 000 <210> 678 <400> 678 000 <210> 679 <400> 679 000 <210> 680 <400> 680 000 <210> 681 <400> 681 000 <210> 682 <400> 682 000 <210> 683 <400> 683 000 <210> 684 <400> 684 000 <210> 685 <400> 685 000 <210> 686 <400> 686 000 <210> 687 <400> 687 000 <210> 688 <400> 688 000 <210> 689 <400> 689 000 <210> 690 <400> 690 000 <210> 691 <400> 691 000 <210> 692 <400> 692 000 <210> 693 <400> 693 000 <210> 694 <400> 694 000 <210> 695 <400> 695 000 <210> 696 <400> 696 000 <210> 697 <400> 697 000 <210> 698 <400> 698 000 <210> 699 <400> 699 000 <210> 700 <400> 700 000 <210> 701 <400> 701 000 <210> 702 <400> 702 000 <210> 703 <400> 703 000 <210> 704 <400> 704 000 <210> 705 <400> 705 000 <210> 706 <400> 706 000 <210> 707 <400> 707 000 <210> 708 <400> 708 000 <210> 709 <400> 709 000 <210> 710 <400> 710 000 <210> 711 <400> 711 000 <210> 712 <400> 712 000 <210> 713 <400> 713 000 <210> 714 <400> 714 000 <210> 715 <400> 715 000 <210> 716 <400> 716 000 <210> 717 <400> 717 000 <210> 718 <400> 718 000 <210> 719 <400> 719 000 <210> 720 <400> 720 000 <210> 721 <400> 721 000 <210> 722 <400> 722 000 <210> 723 <400> 723 000 <210> 724 <400> 724 000 <210> 725 <400> 725 000 <210> 726 <400> 726 000 <210> 727 <400> 727 000 <210> 728 <400> 728 000 <210> 729 <400> 729 000 <210> 730 <400> 730 000 <210> 731 <400> 731 000 <210> 732 <400> 732 000 <210> 733 <400> 733 000 <210> 734 <400> 734 000 <210> 735 <400> 735 000 <210> 736 <400> 736 000 <210> 737 <400> 737 000 <210> 738 <400> 738 000 <210> 739 <400> 739 000 <210> 740 <400> 740 000 <210> 741 <400> 741 000 <210> 742 <400> 742 000 <210> 743 <400> 743 000 <210> 744 <400> 744 000 <210> 745 <400> 745 000 <210> 746 <400> 746 000 <210> 747 <400> 747 000 <210> 748 <400> 748 000 <210> 749 <400> 749 000 <210> 750 <400> 750 000 <210> 751 <400> 751 000 <210> 752 <400> 752 000 <210> 753 <400> 753 000 <210> 754 <400> 754 000 <210> 755 <400> 755 000 <210> 756 <400> 756 000 <210> 757 <400> 757 000 <210> 758 <400> 758 000 <210> 759 <400> 759 000 <210> 760 <400> 760 000 <210> 761 <400> 761 000 <210> 762 <400> 762 000 <210> 763 <400> 763 000 <210> 764 <400> 764 000 <210> 765 <400> 765 000 <210> 766 <400> 766 000 <210> 767 <400> 767 000 <210> 768 <400> 768 000 <210> 769 <400> 769 000 <210> 770 <400> 770 000 <210> 771 <400> 771 000 <210> 772 <400> 772 000 <210> 773 <400> 773 000 <210> 774 <400> 774 000 <210> 775 <400> 775 000 <210> 776 <400> 776 000 <210> 777 <400> 777 000 <210> 778 <400> 778 000 <210> 779 <400> 779 000 <210> 780 <400> 780 000 <210> 781 <400> 781 000 <210> 782 <400> 782 000 <210> 783 <400> 783 000 <210> 784 <400> 784 000 <210> 785 <400> 785 000 <210> 786 <400> 786 000 <210> 787 <400> 787 000 <210> 788 <400> 788 000 <210> 789 <400> 789 000 <210> 790 <400> 790 000 <210> 791 <400> 791 000 <210> 792 <400> 792 000 <210> 793 <400> 793 000 <210> 794 <400> 794 000 <210> 795 <400> 795 000 <210> 796 <400> 796 000 <210> 797 <400> 797 000 <210> 798 <400> 798 000 <210> 799 <400> 799 000 <210> 800 <400> 800 000 <210> 801 <400> 801 000 <210> 802 <400> 802 000 <210> 803 <400> 803 000 <210> 804 <400> 804 000 <210> 805 <400> 805 000 <210> 806 <400> 806 000 <210> 807 <400> 807 000 <210> 808 <400> 808 000 <210> 809 <400> 809 000 <210> 810 <400> 810 000 <210> 811 <400> 811 000 <210> 812 <400> 812 000 <210> 813 <400> 813 000 <210> 814 <400> 814 000 <210> 815 <400> 815 000 <210> 816 <400> 816 000 <210> 817 <400> 817 000 <210> 818 <400> 818 000 <210> 819 <400> 819 000 <210> 820 <400> 820 000 <210> 821 <400> 821 000 <210> 822 <400> 822 000 <210> 823 <400> 823 000 <210> 824 <400> 824 000 <210> 825 <400> 825 000 <210> 826 <400> 826 000 <210> 827 <400> 827 000 <210> 828 <400> 828 000 <210> 829 <400> 829 000 <210> 830 <400> 830 000 <210> 831 <400> 831 000 <210> 832 <400> 832 000 <210> 833 <400> 833 000 <210> 834 <400> 834 000 <210> 835 <400> 835 000 <210> 836 <400> 836 000 <210> 837 <400> 837 000 <210> 838 <400> 838 000 <210> 839 <400> 839 000 <210> 840 <400> 840 000 <210> 841 <400> 841 000 <210> 842 <400> 842 000 <210> 843 <400> 843 000 <210> 844 <400> 844 000 <210> 845 <400> 845 000 <210> 846 <400> 846 000 <210> 847 <400> 847 000 <210> 848 <400> 848 000 <210> 849 <400> 849 000 <210> 850 <400> 850 000 <210> 851 <400> 851 000 <210> 852 <400> 852 000 <210> 853 <400> 853 000 <210> 854 <400> 854 000 <210> 855 <400> 855 000 <210> 856 <400> 856 000 <210> 857 <400> 857 000 <210> 858 <400> 858 000 <210> 859 <400> 859 000 <210> 860 <400> 860 000 <210> 861 <400> 861 000 <210> 862 <400> 862 000 <210> 863 <400> 863 000 <210> 864 <400> 864 000 <210> 865 <400> 865 000 <210> 866 <400> 866 000 <210> 867 <400> 867 000 <210> 868 <400> 868 000 <210> 869 <400> 869 000 <210> 870 <400> 870 000 <210> 871 <400> 871 000 <210> 872 <400> 872 000 <210> 873 <400> 873 000 <210> 874 <400> 874 000 <210> 875 <400> 875 000 <210> 876 <400> 876 000 <210> 877 <400> 877 000 <210> 878 <400> 878 000 <210> 879 <400> 879 000 <210> 880 <400> 880 000 <210> 881 <400> 881 000 <210> 882 <400> 882 000 <210> 883 <400> 883 000 <210> 884 <400> 884 000 <210> 885 <400> 885 000 <210> 886 <400> 886 000 <210> 887 <400> 887 000 <210> 888 <400> 888 000 <210> 889 <400> 889 000 <210> 890 <400> 890 000 <210> 891 <400> 891 000 <210> 892 <400> 892 000 <210> 893 <400> 893 000 <210> 894 <400> 894 000 <210> 895 <400> 895 000 <210> 896 <400> 896 000 <210> 897 <400> 897 000 <210> 898 <400> 898 000 <210> 899 <400> 899 000 <210> 900 <400> 900 000 <210> 901 <400> 901 000 <210> 902 <400> 902 000 <210> 903 <400> 903 000 <210> 904 <400> 904 000 <210> 905 <400> 905 000 <210> 906 <400> 906 000 <210> 907 <400> 907 000 <210> 908 <400> 908 000 <210> 909 <400> 909 000 <210> 910 <400> 910 000 <210> 911 <400> 911 000 <210> 912 <400> 912 000 <210> 913 <400> 913 000 <210> 914 <400> 914 000 <210> 915 <400> 915 000 <210> 916 <400> 916 000 <210> 917 <400> 917 000 <210> 918 <400> 918 000 <210> 919 <400> 919 000 <210> 920 <400> 920 000 <210> 921 <400> 921 000 <210> 922 <400> 922 000 <210> 923 <400> 923 000 <210> 924 <400> 924 000 <210> 925 <400> 925 000 <210> 926 <400> 926 000 <210> 927 <400> 927 000 <210> 928 <400> 928 000 <210> 929 <400> 929 000 <210> 930 <400> 930 000 <210> 931 <400> 931 000 <210> 932 <400> 932 000 <210> 933 <400> 933 000 <210> 934 <400> 934 000 <210> 935 <400> 935 000 <210> 936 <400> 936 000 <210> 937 <400> 937 000 <210> 938 <400> 938 000 <210> 939 <400> 939 000 <210> 940 <400> 940 000 <210> 941 <400> 941 000 <210> 942 <400> 942 000 <210> 943 <400> 943 000 <210> 944 <400> 944 000 <210> 945 <400> 945 000 <210> 946 <400> 946 000 <210> 947 <400> 947 000 <210> 948 <400> 948 000 <210> 949 <400> 949 000 <210> 950 <400> 950 000 <210> 951 <400> 951 000 <210> 952 <400> 952 000 <210> 953 <400> 953 000 <210> 954 <400> 954 000 <210> 955 <400> 955 000 <210> 956 <400> 956 000 <210> 957 <400> 957 000 <210> 958 <400> 958 000 <210> 959 <400> 959 000 <210> 960 <400> 960 000 <210> 961 <400> 961 000 <210> 962 <400> 962 000 <210> 963 <400> 963 000 <210> 964 <400> 964 000 <210> 965 <400> 965 000 <210> 966 <400> 966 000 <210> 967 <400> 967 000 <210> 968 <400> 968 000 <210> 969 <400> 969 000 <210> 970 <400> 970 000 <210> 971 <400> 971 000 <210> 972 <400> 972 000 <210> 973 <400> 973 000 <210> 974 <400> 974 000 <210> 975 <400> 975 000 <210> 976 <400> 976 000 <210> 977 <400> 977 000 <210> 978 <400> 978 000 <210> 979 <400> 979 000 <210> 980 <400> 980 000 <210> 981 <400> 981 000 <210> 982 <400> 982 000 <210> 983 <400> 983 000 <210> 984 <400> 984 000 <210> 985 <400> 985 000 <210> 986 <400> 986 000 <210> 987 <400> 987 000 <210> 988 <400> 988 000 <210> 989 <400> 989 000 <210> 990 <400> 990 000 <210> 991 <400> 991 000 <210> 992 <400> 992 000 <210> 993 <400> 993 000 <210> 994 <400> 994 000 <210> 995 <400> 995 000 <210> 996 <400> 996 000 <210> 997 <400> 997 000 <210> 998 <400> 998 000 <210> 999 <400> 999 000 <210> 1000 <211> 92 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 1000 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60 cacctgcctg aaatcacttt ttttcaggtt gg 92 <210> 1001 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1001 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720 ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900 gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125 <210> 1002 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1002 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc agtggagagg agcagaggtt gtcctggtgt 300 ggtttaggta gtgtgagagg gtccaggttc aaaaccactt gctgggtggg gagttgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900 gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125 <210> 1003 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1003 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc acttgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccaacc ctgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacccccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900 gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125 <210> 1004 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1004 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcatg ccaccccctc caccttggac acaggacact 900 gtggtttctg agccaggtac aatgactcct tttggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gtgtctgggc agcataggca ggtgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctctgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ctgttgcccc tctggatcca ctgcttaaat acagacaagg acagg 1125 <210> 1005 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1005 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcatg ccaccccctc caccttggac acaggacact 900 gtggtttctg agccaggtac aatgactcct tttggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gtgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125 <210> 1006 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1006 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900 gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctctgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ctgttgcccc tctggatcca ctgcttaaat acggacaagg acagg 1125 <210> 1007 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1007 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt 720 ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900 gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gcgtctgggc agcataggca ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagg 1125 <210> 1008 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1008 aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc 60 ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc 120 tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc 180 cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc 240 tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt 300 ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag 360 taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa 420 gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg 480 ttttgttttt tgagatggag gtttgctctg tggcccaggc tggagtgcag tgacacaatc 540 tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt 600 gccaccacac ctggctaatt ttctattttt agtagagatg ggtttctcca tgttggtcag 660 cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacctgg ctaatttttt 720 ctatttttga cagggatggg gtttcaccat gttggtcagg ctggtctaga ggtactggat 780 cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt 840 ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct 900 gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg 960 cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag 1020 cccctgtttg ctcctctgat aactggggtg accttggtta atattcacca gcagcctccc 1080 ccgttgcccc tctggatcca ctgcttaaat acagacgagg acagg 1125 <210> 1009 <211> 103 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1009 taacaaacac cattgtcaca ctccatcacc aaacaccatt gtcacactcc acgatcaaac 60 accattgtca cactccatca ccaaacacca ttgtcacact cca 103 <210> 1010 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 1010 tccataaagt aggaaacact acacgattcc ataaagtagg aaacactaca tcactccata 60 aagtaggaaa cactaca 77 <210> 1011 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1011 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccaa 60 gagacaagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120 ctgaaagaag aagtgggcgc cctggccaag gtgctgagac tgttcgaaga gaacgacgtg 180 aacctgacac acatcgagag cgcgcccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagcggag cctgcctgct ctgaccaaca tcatcaagat cctgcggcac 300 gacatcggcg ccacagtgca cgaactgagc cgggacaaga aaaaggacac cgtgccatgg 360 ttccccagaa ccatccaaga gctggacaga ttcgccaacc agatcctgag ctatggcgcc 420 gagctggacg ctgatcaccc tggctttaag gaccccgtgt accgggccag aagaaagcag 480 tttgccgata tcgcctacaa ctaccggcac ggccagccta ttcctcgggt cgagtacatg 540 gaagaggaaa agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660 gaggacaata tccctcagct tgaggacgtg tcccagttcc tgcagacctg caccggcttt 720 agactgaggc cagttgccgg actgctgagc agcagagatt ttctcggcgg cctggccttc 780 agagtgttcc actgtaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840 cctgatatct gccacgagct gctgggacat gtgcccctgt tcagcgatag aagcttcgcc 900 cagttcagcc aagagatcgg actggcttct ctgggagccc ctgacgagta cattgagaag 960 ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020 aaagcttatg gcgctggcct gctgtctagc ttcggcgagc tgcagtactg tctgagcgag 1080 aagcctaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ctctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200 aacttcgccg ccaccattcc tcggcctttc agcgtcagat acgaccccta cacacagcgg 1260 atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320 atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359 <210> 1012 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1012 atgtccaccg ccgtgctgga gaaccctggc ctgggcagaa agctgtctga ctttggccag 60 gagacctcct acatcgagga caactgcaac cagaatggag ccatctccct gatcttctcc 120 ctgaaggagg aggtgggagc cctggccaag gtgctgagac tgtttgagga gaatgatgtg 180 aacctgaccc acatcgagtc cagaccctcc agactgaaga aggatgagta tgagttcttc 240 acccacctgg acaagagatc cctgcctgcc ctgaccaaca tcatcaagat cctgagacac 300 gacattggag ccaccgtgca cgagctgtcc agagacaaga agaaggacac cgtgccctgg 360 ttccccagaa ccatccagga gctggacaga tttgccaacc agatcctgtc ctatggagcc 420 gagctggatg ccgaccaccc tggcttcaag gaccctgtgt acagagccag aagaaagcag 480 tttgccgaca ttgcctacaa ctacagacac ggccagccca tccccagagt ggagtacatg 540 gaggaggaga agaagacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600 cacgcctgct atgagtacaa ccacatcttc cccctgctgg agaagtactg tggcttccac 660 gaggacaaca tcccccagct ggaggatgtg tcccagttcc tgcagacctg caccggcttc 720 agactgagac ctgtggccgg cctgctgtcc tccagagact tcctgggagg cctggccttc 780 agagtgttcc actgcaccca gtacatcaga cacggctcca agcccatgta cacccctgag 840 cctgacatct gccacgagct gctgggccac gtgcccctgt tctctgacag atcctttgcc 900 cagttctccc aggagattgg cctggcctcc ctgggagccc ctgatgagta cattgagaag 960 ctggccacca tctactggtt caccgtggag tttggcctgt gcaagcaggg agactccatc 1020 aaggcctatg gagccggcct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080 aagcccaagc tgctgcccct ggagctggag aagaccgcca tccagaacta caccgtgacc 1140 gagttccagc ccctgtacta tgtggccgag tccttcaatg atgccaagga gaaggtcaga 1200 aactttgccg ccaccatccc cagacccttc tctgtgagat atgaccccta cacccagaga 1260 atcgaggtgc tggacaacac ccagcagctg aagatcctgg ccgactccat caactctgag 1320 atcggcatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 1013 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1013 atgagcaccg ccgtgctgga aaaccccggt ctgggcagga agctgtccga ctttggccag 60 gagacctcct acatcgagga caactgcaac cagaacgggg ccatctccct gatcttctcc 120 ctgaaggagg aggtgggggc cctggccaag gtgctgaggc tgttcgagga gaacgacgtt 180 aacctgaccc acatcgagag ccggcccagc agactgaaga aggacgagta cgagttcttc 240 acccacctgg acaagagaag cctgcccgcc ctgaccaaca tcattaagat cctgaggcac 300 gacatcggag ccacagtgca tgagctctcc agagacaaga agaaggacac cgtgccctgg 360 ttcccccgca ccatccagga gctggacagg ttcgccaacc agatcctgag ctatggggcc 420 gagctggatg ccgaccaccc tggcttcaag gacccagtgt accgcgccag gcggaagcag 480 ttcgccgaca ttgcctacaa ttaccggcac ggccagccca tcccccgggt ggagtacatg 540 gaggaggaga agaagacctg ggggaccgtg ttcaagaccc tgaaaagcct gtacaagacc 600 cacgcctgct acgagtacaa ccacatcttc cccctgctgg agaagtactg tggattccac 660 gaggataaca tcccccagct ggaggatgtg tcccagttcc tgcagacatg cacaggcttt 720 aggctgaggc ctgtcgccgg cctcctgtcc agcagagact tcctgggcgg gctggccttc 780 cgcgtgttcc actgcaccca gtacatcagg cacggcagca agcccatgta caccccagag 840 cctgacatct gtcacgagct gctgggccac gtgcccctgt tctctgacag atcctttgca 900 cagttcagcc aggagatcgg cttggcctcc ctgggggccc ccgacgaata tatcgagaag 960 ctggccacca tctactggtt caccgtggag ttcggactgt gcaagcaagg agacagcatc 1020 aaggcctacg gcgctggcct gctgtccagc tttggagagc tgcagtactg cctgtctgag 1080 aagcccaagc tgctgccact ggagctggag aagaccgcca tccagaacta caccgtgaca 1140 gagttccagc ccctgtacta cgtggccgag agcttcaatg acgccaagga gaaggtgagg 1200 aacttcgctg ccaccatccc tcgccccttc agcgtgaggt atgaccccta cacccagaga 1260 atcgaggtgc tggacaacac ccagcagctg aagatcctgg ctgacagcat caacagcgag 1320 atcggcatcc tgtgctccgc cctgcagaag atcaagtaa 1359 <210> 1014 <211> 1359 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1014 atgagcacag cagtactaga aaacccagga ttaggcagga agttgtctga ctttggccag 60 gagacctcct acattgaaga caactgcaac cagaatggtg ccatctcctt gatcttcagc 120 ctgaaggagg aggtgggagc tctggccaag gtgctgaggc tgtttgagga gaatgatgtg 180 aacctgaccc acattgagtc caggcccagt aggctgaaga aggatgagta tgagttcttc 240 acccacctgg acaagagatc cctgccagct ctgaccaaca tcatcaagat cctgagacat 300 gacattgggg ccacagtgca tgagctgagc agggacaaga agaaggacac agtgccctgg 360 ttccccagaa ccatccagga gctggacagg tttgccaacc agatcctgtc ctatggagct 420 gagctggatg cagaccaccc tggcttcaag gacccagtgt acagggccag aaggaagcag 480 tttgctgata ttgcctacaa ctacaggcat ggccagccca tcccaagggt ggagtacatg 540 gaggaggaga agaagacctg gggcacagtg ttcaagacac tgaagtccct gtacaagacc 600 catgcttgct atgagtataa ccacatcttc cctctcctgg agaaatactg tggcttccat 660 gaggacaaca tccctcagct ggaggatgtg agtcagttcc tgcagacatg cactggcttc 720 aggctgaggc ctgtggctgg actcctgagc agcagggact tcctgggagg cttggccttc 780 agggtgttcc actgcaccca gtatatcagg catggctcca agcctatgta caccccagag 840 cctgacatct gccatgagct gctggggcat gtgcccctgt tctctgacag gagctttgcc 900 cagttcagcc aggagattgg cctggcctcc ctgggggctc cagatgagta cattgagaag 960 ctggctacca tctactggtt tacagtggag tttgggctgt gcaagcaggg ggacagcatc 1020 aaggcctatg gggctgggct gctgtcctcc tttggagagc tgcagtactg cctgtctgag 1080 aagcccaagc tcctccccct ggagctggag aagactgcca tccagaacta cactgtgaca 1140 gagttccagc ccctgtacta tgtggctgag tccttcaatg atgccaagga gaaggtgagg 1200 aactttgctg ccaccatccc caggcccttc tcagtgagat atgaccccta cacccagagg 1260 attgaggtgc tggacaacac ccagcagctg aagatcctgg cagacagcat caactctgag 1320 attggaatcc tgtgctctgc cctgcagaag atcaagtaa 1359 <210> 1015 <211> 1588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1015 atgagtacag cagtgttaga gaatccaggc ctaggtagaa agctgtctga ctttggccag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ctgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcattgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg agacctccta 300 cattgaggac aactgcaacc agaatggagc catcagcctg atcttcagcc tgaaggagga 360 ggtgggagcc ctggccaagg tgctgagact gtttgaggag aatgatgtga acctgaccca 420 cattgagtcc agaccctcca gactgaagaa ggatgagtat gagttcttca cccacctgga 480 caagagatcc ctgcctgctc tgaccaacat catcaagatc ctgagacatg atattggagc 540 cacagtgcat gagctgagca gggacaagaa gaaggacaca gtgccttggt tccccagaac 600 catccaggag ctggacaggt ttgccaacca gatcctgtcc tatggagctg agctggatgc 660 tgaccaccct ggatttaagg atcctgtgta cagggccaga aggaagcagt ttgctgacat 720 tgcctacaac tacaggcatg gccagcccat ccccagggtg gagtacatgg aggaggagaa 780 gaagacctgg ggcactgtgt tcaagaccct gaagagcctg tacaagaccc atgcctgcta 840 tgagtacaac cacatcttcc ccctgctgga gaagtactgt ggcttccatg aggacaacat 900 ccctcagctg gaggatgtgt cccagttcct gcagacctgc acaggcttca gactgagacc 960 tgtggctggc ctgctgtcta gcagagactt cctgggaggc ctggccttca gagtgttcca 1020 ctgcacccag tacatcagac atggaagcaa gcccatgtac acccctgagc cagacatctg 1080 ccatgagctg ctgggccatg tgcccctgtt ctctgataga tcctttgccc agttcagcca 1140 ggagattggc ctggccagcc tgggagcccc tgatgagtac attgagaagc tggccaccat 1200 ctactggttc acagtggagt ttggcctgtg caagcaggga gactccatca aggcctatgg 1260 agctggactg ctgtcctcct ttggagagct gcagtactgc ctgtctgaga agcccaagct 1320 gctgcccctg gagctggaga agacagccat ccagaactac acagtgacag agttccagcc 1380 cctgtactat gtggctgaga gcttcaatga tgccaaggag aaggtgagaa actttgctgc 1440 caccatcccc agacccttct ctgtgaggta tgacccctac acccagagga ttgaggtgct 1500 ggacaacacc cagcagctga agatcctggc tgactccatc aactctgaga ttggcatcct 1560 gtgctctgcc ctgcagaaga tcaagtaa 1588 <210> 1016 <400> 1016 000 <210> 1017 <400> 1017 000 <210> 1018 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 1018 gggactttcc 10 <210> 1019 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 1019 ggggactttc c 11 <210> 1020 <400> 1020 000 <210> 1021 <211> 1363 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1021 atgtccactg cggtcctgga aaacccaggc ttgggcagga aactctctga ctttggacag 60 gaaacaagct atattgaaga caactgcaat caaaatggtg ccatatcact gatcttctca 120 ctcaaagaag aagttggtgc attggccaaa gtattgcgct tatttgagga gaatgatgta 180 aacctgaccc acattgaatc tagaccttct cgtttaaaga aagatgagta tgaatttttc 240 acccatttgg ataaacgtag cctgcctgct ctgacaaaca tcatcaagat cttgaggcat 300 gacattggtg ccactgtcca tgagctttca cgagataaga agaaagacac agtgccctgg 360 ttcccaagaa ccattcaaga gctggacaga tttgccaatc agattctcag ctatggagcg 420 gaactggatg ctgaccaccc tggttttaaa gatcctgtgt accgtgcaag acggaagcag 480 tttgctgaca ttgcctacaa ctaccgccat gggcagccca tccctcgagt ggaatacatg 540 gaggaagaaa agaaaacatg gggcacagtg ttcaagactc tgaagtcctt gtataaaacc 600 catgcttgct atgagtacaa tcacattttt ccacttcttg aaaagtactg tggcttccat 660 gaagataaca ttccccagct ggaagacgtt tctcagttcc tgcagacttg cactggtttc 720 cgcctccgac ctgtggctgg cctgctttcc tctcgggatt tcttgggtgg cctggccttc 780 cgagtcttcc actgcacaca gtacatcaga catggatcca agcccatgta tacccccgaa 840 cctgacatct gccatgagct gttgggacat gtgcccttgt tttcagatcg cagctttgcc 900 cagttttccc aggaaattgg ccttgcctct ctgggtgcac ctgatgaata cattgaaaag 960 ctcgccacaa tttactggtt tactgtggag tttgggctct gcaaacaagg agactccata 1020 aaggcatatg gtgctgggct cctgtcatcc tttggtgaat tacagtactg cttatcagag 1080 aagccaaagc ttctccccct ggagctggag aagacagcca tccaaaatta cactgtcacg 1140 gagttccagc ccctctatta cgtggcagag agttttaatg atgccaagga gaaagtaagg 1200 aactttgctg ccacaatacc tcggcccttc tcagttcgct acgacccata cacccaaagg 1260 attgaggtct tggacaatac ccagcagctt aagattttgg ctgattccat taacagtgaa 1320 attggaatcc tttgcagtgc cctccagaaa ataaagtaat taa 1363 <210> 1022 <211> 428 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1022 atgagcaccg ccgtgctgga aaatcctggc ttgggcagga aactctctga ctttggacag 60 gtgagccacg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 ccgaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attcgttgga 180 agctgatgat agaagaaaga gttcatgctt gctttgtcca tggaggttta acaggaatga 240 attgctaaac tgtggaaaat gttttaaaca aatgcatctt atcctgtagg aaacaagcta 300 tattgaagac aactgcaatc aaaacggcgc catcagcctg atcttcagcc tgaaagaaga 360 agtgggcgcc ctggccaagg tgctgagact gttcgaagag aacgacgtga acctgacaca 420 catcgaga 428 <210> 1023 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1023 atgagcaccg ccgtgctgga aaatcctggc ctgggcagaa agctgagcga cttcggccag 60 gtgagccagg gcagcctgag ctgctcagtt aggggaattt gggcctccag agaaagagat 120 cccaagactg ctggtgcttc ctggtttcat aagctcagta agaagtctga attggttgga 180 agctga 186 <210> 1024 <211> 186 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1024 agttcatgct tgctttgtcc atgtaggttt aacaggaatg aattgctaaa ctgtggaaaa 60 tgttttaaac aaatgcatct tatcctgtag gagacaagct acatcgagga caactgcaac 120 cagaacggcg ccatcagcct gatcttcagc ctgaaagaag aagtgggcgc cctggccaag 180 gtgctg 186 <210> 1025 <211> 450 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 1025 Met Ser Thr Ala Val Leu Glu Asn Pro Gly Leu Gly Arg Lys Leu Ser 1 5 10 15 Asp Phe Gly Gln Glu Thr Ser Tyr Ile Glu Asp Asn Cys Asn Gln Asn 20 25 30 Gly Ala Ile Ser Leu Ile Phe Ser Leu Lys Glu Glu Val Gly Ala Leu 35 40 45 Ala Lys Val Leu Arg Leu Phe Glu Glu Asn Asp Val Asn Leu Thr His 50 55 60 Ile Glu Ser Arg Pro Ser Arg Leu Lys Lys Asp Glu Tyr Glu Phe Phe 65 70 75 80 Thr His Leu Asp Lys Arg Ser Leu Pro Ala Leu Thr Asn Ile Ile Lys 85 90 95 Ile Leu Arg His Asp Ile Gly Ala Thr Val His Glu Leu Ser Arg Asp 100 105 110 Lys Lys Lys Asp Thr Val Pro Trp Phe Pro Arg Thr Ile Gln Glu Leu 115 120 125 Asp Arg Phe Ala Asn Gln Ile Leu Ser Tyr Gly Ala Glu Leu Asp Ala 130 135 140 Asp His Pro Gly Phe Lys Asp Pro Val Tyr Arg Ala Arg Arg Lys Gln 145 150 155 160 Phe Ala Asp Ile Ala Tyr Asn Tyr Arg His Gly Gln Pro Ile Pro Arg 165 170 175 Val Glu Tyr Met Glu Glu Glu Lys Lys Thr Trp Gly Thr Val Phe Lys 180 185 190 Thr Leu Lys Ser Leu Tyr Lys Thr His Ala Cys Tyr Glu Tyr Asn His 195 200 205 Ile Phe Pro Leu Leu Glu Lys Tyr Cys Gly Phe His Glu Asp Asn Ile 210 215 220 Pro Gln Leu Glu Asp Val Ser Gln Phe Leu Gln Thr Cys Thr Gly Phe 225 230 235 240 Arg Leu Arg Pro Val Ala Gly Leu Leu Ser Ser Arg Asp Phe Leu Gly 245 250 255 Gly Leu Ala Phe Arg Val Phe His Cys Thr Gln Tyr Ile Arg His Gly 260 265 270 Ser Lys Pro Met Tyr Thr Pro Glu Pro Asp Ile Cys His Glu Leu Leu 275 280 285 Gly His Val Pro Leu Phe Ser Asp Arg Ser Phe Ala Gln Phe Ser Gln 290 295 300 Glu Ile Gly Leu Ala Ser Leu Gly Ala Pro Asp Glu Tyr Ile Glu Lys 305 310 315 320 Leu Ala Thr Ile Tyr Trp Phe Thr Val Glu Phe Gly Leu Cys Lys Gln 325 330 335 Gly Asp Ser Ile Lys Ala Tyr Gly Ala Gly Leu Leu Ser Ser Phe Gly 340 345 350 Glu Leu Gln Tyr Cys Leu Ser Glu Lys Pro Lys Leu Leu Pro Leu Glu 355 360 365 Leu Glu Lys Thr Ala Ile Gln Asn Tyr Thr Val Thr Glu Phe Gln Pro 370 375 380 Leu Tyr Tyr Val Ala Glu Ser Phe Asn Asp Ala Lys Glu Lys Val Arg 385 390 395 400 Asn Phe Ala Ala Thr Ile Pro Arg Pro Phe Ser Val Arg Tyr Asp Pro 405 410 415 Tyr Thr Gln Arg Ile Glu Val Leu Asp Asn Thr Gln Gln Leu Lys Ile 420 425 430 Leu Ala Asp Ser Ile Asn Ser Glu Ile Gly Ile Leu Cys Ser Ala Leu 435 440 445 Gln Lys 450 <210> 1026 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 1026 aagaggtaag ggtttaaggg atggttggtt ggtggggtat taatgtttaa ttacctggag 60 cacctgcctg aaatcacttt ttttcaggtt g 91

Claims (86)

  1. 폐쇄형 DNA(ceDNA) 벡터로서,
    적어도 하나의 페닐알라닌 히드록실라아제(PAH: phenylalanine hydroxylase) 단백질을 인코딩하는 적어도 하나의 핵산 서열(여기서, 적어도 하나의 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 90% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 코돈 최적화되며, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR: inverted terminal repeat) 사이에 위치함)과,
    적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 뉴클레오타이드 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터(hAAT(979) 프로모터 및 CpGmin_hAAT 프로모터 포함) 및 트랜스티레틴(TTR: transthyretin) 간(liver) 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터.
  2. 제1항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 표 1A에 제시된 서열 중 어느 하나와 적어도 95% 동일성을 갖는 서열에서 선택되는, ceDNA 벡터.
  3. 폐쇄형 DNA(ceDNA) 벡터로서,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 95% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터.
  4. 폐쇄형 DNA(ceDNA) 벡터로서,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 96% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터.
  5. 폐쇄형 DNA(ceDNA) 벡터로서,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 97% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터.
  6. 폐쇄형 DNA(ceDNA) 벡터로서,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 98% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터.
  7. 폐쇄형 DNA(ceDNA) 벡터로서,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열(여기서, 핵산 서열은 표 1A에 열거된 서열 중 임의의 것과 적어도 99% 동일성을 갖는 서열에서 선택되고, 적어도 하나의 핵산 서열은 플랭킹 역말단반복서열(ITR) 사이에 위치함)과,
    적어도 하나의 PAH 단백질을 인코딩하는 핵산 서열에 작동적으로 연결된 프로모터(여기서, 프로모터는 VD 프로모터, 인간 알파 1-항트립신(hAAT) 프로모터 및 트랜스티레틴(TTR) 간 특이적 프로모터로 이루어지는 군에서 선택됨)를 포함하는 ceDNA 벡터.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 382로 제시된 서열과 적어도 98% 동일성을 갖는 서열인, ceDNA 벡터.
  9. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 382로 제시된 서열과 적어도 99% 동일성을 갖는 서열인, ceDNA 벡터.
  10. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 382로 제시된 서열인, ceDNA 벡터.
  11. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 425로 제시된 서열과 적어도 99% 동일성을 갖는 서열인, ceDNA 벡터.
  12. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 425로 제시된 서열인, ceDNA 벡터.
  13. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 431로 제시된 서열과 적어도 99% 동일성을 갖는 서열인, ceDNA 벡터.
  14. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 431로 제시된 서열인, ceDNA 벡터.
  15. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 435로 제시된 서열과 적어도 99% 동일성을 갖는 서열인, ceDNA 벡터.
  16. 제1항 내지 제7항 중 어느 한 항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 서열번호 435로 제시된 서열인, ceDNA 벡터.
  17. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 191과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
  18. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 443과 적어도 98% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
  19. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 444와 적어도 99% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
  20. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 445와 적어도 99% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
  21. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 446과 적어도 99% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
  22. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 447과 적어도 96% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 인핸서를 추가로 포함하는 ceDNA 벡터.
  24. 제23항에 있어서, 인핸서가 세르핀 인핸서, 3xHNF1-4_ProEnh_10mer 및 5xHNF1_ProEnh_10mer로 이루어지는 군에서 선택되는, ceDNA 벡터.
  25. 제23항에 있어서, 인핸서가 서열번호 450과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
  26. 제23항에 있어서, 인핸서가 서열번호 586과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
  27. 제23항에 있어서, 인핸서가 서열번호 587과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는, ceDNA 벡터.
  28. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 462와 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
  29. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 467과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
  30. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 470과 적어도 85% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
  31. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 470과 적어도 90% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
  32. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 서열번호 470과 적어도 95% 동일성을 갖는 핵산 서열을 포함하는 프로모터 세트인, ceDNA 벡터.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 하나 이상의 인트론을 추가로 포함하는 ceDNA 벡터.
  34. 제33항에 있어서, 하나 이상의 인트론이 미세생쥐바이러스(MVM: minute virus of mice)인, ceDNA 벡터.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 3' 미번역 영역(3' UTR)을 포함하는 ceDNA 벡터.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 적어도 하나의 polyA 서열을 포함하는 ceDNA 벡터.
  37. 제1항 내지 제7항 중 어느 한 항에 있어서, VD 프로모터가 SERP 인핸서를 포함하는, ceDNA 벡터.
  38. 제1항 내지 제7항 중 어느 한 항에 있어서, VD 프로모터가 3xSERP 인핸서를 포함하는, ceDNA 벡터.
  39. 제1항 내지 제7항 중 어느 한 항에 있어서, 프로모터가 TTR 간 프로모터이고, ceDNA가 MVM 인트론을 추가로 포함하는, ceDNA 벡터.
  40. 제1항 내지 제39항 중 어느 한 항에 있어서, 서열번호 194, 서열번호 195, 서열번호 196, 서열번호 197, 서열번호 198, 서열번호 199, 서열번호 200, 서열번호 201, 서열번호 202, 서열번호 203, 서열번호 204, 서열번호 205, 서열번호 206, 서열번호 207, 서열번호 208, 서열번호 209, 서열번호 210, 서열번호 211, 서열번호 212, 서열번호 213, 서열번호 541, 서열번호 542, 서열번호 543, 서열번호 544, 서열번호 545, 서열번호 546, 서열번호 547, 서열번호 548, 서열번호 549, 서열번호 550, 서열번호 551, 서열번호 552, 서열번호 553, 서열번호 554, 서열번호 555, 서열번호 556, 서열번호 557, 서열번호 558, 서열번호 559, 서열번호 560, 서열번호 561, 서열번호 562, 서열번호 563, 서열번호 564, 서열번호 565, 서열번호 566, 서열번호 567, 서열번호 570, 서열번호 571, 서열번호 572, 서열번호 573, 서열번호 574, 서열번호 575, 서열번호 576, 서열번호 577, 서열번호 578, 서열번호 579, 서열번호 580, 서열번호 581, 서열번호 582, 서열번호 583 및 서열번호 584로 이루어지는 군에서 선택되는 핵산 서열과 적어도 90% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
  41. 제1항 내지 제40항 중 어느 한 항에 있어서, 적어도 하나의 핵산 서열이 PAH에 대한 cDNA인, ceDNA 벡터.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서, 적어도 하나의 ITR이 기능성 말단 분해 부위(TRS)와 Rep 결합 부위를 포함하는, ceDNA 벡터.
  43. 제1항 내지 제42항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 파르보바이러스(parvovirus), 데펜도바이러스(dependovirus) 및 아데노연관바이러스(AAV: adeno-associated virus)에서 선택되는 바이러스에서 유래한 것인, ceDNA 벡터.
  44. 제1항 내지 제43항 중 어느 한 항에 있어서, 플랭킹 ITR이 대칭 또는 비대칭인, ceDNA 벡터.
  45. 제44항에 있어서, 플랭킹 ITR이 대칭 또는 실질적으로 대칭인, ceDNA 벡터.
  46. 제45항에 있어서, 플랭킹 ITR이 비대칭인, ceDNA 벡터.
  47. 제1항 내지 제46항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 야생형이거나, 두 개의 ITR이 모두 야생형인, ceDNA 벡터.
  48. 제1항 내지 제47항 중 어느 한 항에 있어서, 두 개의 ITR이 모두 동일한 AAV의 야생형인, ceDNA 벡터.
  49. 제48항에 있어서, 두 개의 ITR이 모두 AAV2의 야생형인, ceDNA 벡터.
  50. 제1항 내지 제49항 중 어느 한 항에 있어서, 플랭킹 ITR이 상이한 바이러스 혈청형에서 유래한 것인, ceDNA 벡터.
  51. 제1항 내지 제50항 중 어느 한 항에 있어서, 플랭킹 ITR이 표 2에 제시된 한 쌍의 바이러스 혈청형에서 유래한 것인, ceDNA 벡터.
  52. 제1항 내지 제51항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 표 3, 표 5A, 표 5B 또는 표 6의 서열에서 선택되는 서열을 포함하는, ceDNA 벡터.
  53. 제1항 내지 제52항 중 어느 한 항에 있어서, ITR 중 적어도 하나가 ITR의 전반적인 3차원 입체형태에 영향을 미치는 결실, 부가 또는 치환에 의해 야생형 AAV ITR 서열로부터 변경된 것인, ceDNA 벡터.
  54. 제1항 내지 제53항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11 및 AAV12에서 선택되는 AAV 혈청형에서 유도된 것인, ceDNA 벡터.
  55. 제1항 내지 제54항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 합성인, ceDNA 벡터.
  56. 제1항 내지 제55항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 야생형 ITR이 아니거나, 두 개의 ITR이 모두 야생형이 아닌, ceDNA 벡터.
  57. 제1항 내지 제56항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 A, A', B, B', C, C', D 및 D'에서 선택되는 ITR 영역 중 적어도 하나에서 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
  58. 제57항에 있어서, 결실, 삽입 및/또는 치환이 통상적으로 A, A', B, B' C 또는 C' 영역으로 형성된 스템-루프 구조(stem-loop structure)의 전부 또는 일부의 결실을 초래하는, ceDNA 벡터.
  59. 제1항 내지 제58항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
  60. 제1항 내지 제59항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조의 전부 또는 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
  61. 제1항 내지 제60항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 스템-루프 구조의 일부 및/또는 통상적으로 C 및 C' 영역으로 형성된 스템-루프 구조 일부의 결실을 초래하는 결실, 삽입 및/또는 치환에 의해 변형된 것인, ceDNA 벡터.
  62. 제1항 내지 제61항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템-루프 구조를 포함하는, ceDNA 벡터.
  63. 제1항 내지 제62항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 2개의 루프를 포함하는, ceDNA 벡터.
  64. 제1항 내지 제63항 중 어느 한 항에 있어서, ITR 중 하나 또는 둘 모두가 통상적으로 B 및 B' 영역으로 형성된 제1 스템-루프 구조와 C 및 C' 영역으로 형성된 제2 스템-루프 구조를 포함하는 영역에 단일 스템과 단일 루프를 포함하는, ceDNA 벡터.
  65. 제1항 내지 제64항 중 어느 한 항에 있어서, ITR이 서로에 대해 역전될 때, 두 개의 ITR이 모두 전반적인 3차원 대칭을 이루는 방식으로 변경되는, ceDNA 벡터.
  66. 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 90% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
  67. 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 95% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
  68. 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 96% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
  69. 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 97% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
  70. 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 98% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
  71. 제1항 내지 제65항 중 어느 한 항에 있어서, 서열번호 382, 서열번호 383, 서열번호 384, 서열번호 385 또는 서열번호 386과 적어도 99% 동일한 핵산 서열을 포함하는 ceDNA 벡터.
  72. 세포를 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터와 접촉시키는 단계를 포함하는, 세포에서 PAH 단백질을 발현시키는 방법.
  73. 제72항에 있어서, 세포가 광수용체 세포 또는 망막색소상피(RPE: retinal pigment epithelial) 세포인, 방법.
  74. 제72항 또는 제73항에 있어서, 세포가 시험관내 또는 생체내에 존재하는, 방법.
  75. 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터를 페닐케톤뇨증(PKU)을 앓고 있는 대상에게 투여하는 단계를 포함하는, 페닐케톤뇨증(PKU)을 앓고 있는 대상을 치료하는 방법.
  76. 제75항에 있어서, 적어도 하나의 PAH 단백질을 인코딩하는 적어도 하나의 핵산 서열이 표 1A에 제시된 서열 중 임의의 것과 적어도 90% 동일성을 갖는 서열에서 선택되는, 방법.
  77. 제72항 내지 제76항 중 어느 한 항에 있어서, 대상이 투여 전 대상의 혈청 페닐알라닌 수준과 비교하여 혈청 페닐알라닌 수준의 적어도 약 50% 감소를 나타내는, 방법.
  78. 제72항 내지 제77항 중 어느 한 항에 있어서, 대상이 투여 전 PAH 활성 수준과 비교하여 투여 후 PAH 활성의 적어도 약 10%의 증가를 나타내는, 방법.
  79. 제72항 내지 제78항 중 어느 한 항에 있어서, ceDNA 벡터가 지질 나노입자로 제형화된 것인, 방법.
  80. 제72항 내지 제79항 중 어느 한 항에 있어서, ceDNA 벡터가 정맥내로 투여되는, 방법.
  81. 제72항 내지 제79항 중 어느 한 항에 있어서, ceDNA 벡터가 근육내로 투여되는, 방법.
  82. 제72항 내지 제79항 중 어느 한 항에 있어서, ceDNA 벡터가 주입을 통해 투여되는, 방법.
  83. 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터를 포함하는 약학적 조성물.
  84. 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터와 지질을 포함하는 조성물.
  85. 제84항에 있어서, 지질이 지질 나노입자(LNP)인, 조성물.
  86. 제1항 내지 제71항 중 어느 한 항의 ceDNA 벡터, 제83항의 약학적 조성물, 또는 제84항 또는 제85항의 조성물을 포함하는 키트.
KR1020237012572A 2020-09-16 2021-09-16 폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도 KR20230066615A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063078954P 2020-09-16 2020-09-16
US63/078,954 2020-09-16
PCT/US2021/050695 WO2022061000A1 (en) 2020-09-16 2021-09-16 Closed-ended dna vectors and uses thereof for expressing phenylalanine hydroxylase (pah)

Publications (1)

Publication Number Publication Date
KR20230066615A true KR20230066615A (ko) 2023-05-16

Family

ID=80775707

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237012572A KR20230066615A (ko) 2020-09-16 2021-09-16 폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도

Country Status (10)

Country Link
US (1) US20240026374A1 (ko)
EP (1) EP4214309A1 (ko)
JP (1) JP2023542131A (ko)
KR (1) KR20230066615A (ko)
CN (1) CN116507730A (ko)
AU (1) AU2021345187A1 (ko)
CA (1) CA3191765A1 (ko)
IL (1) IL301196A (ko)
MX (1) MX2023003019A (ko)
WO (1) WO2022061000A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3270944B1 (en) * 2015-03-17 2019-10-23 Vrije Universiteit Brussel Optimized liver-specific expression systems for fviii and fix
US11382941B2 (en) * 2016-12-30 2022-07-12 The Trustees Of The University Of Pennsylvania Gene therapy for treating Phenylketonuria
CN111132699A (zh) * 2017-09-08 2020-05-08 世代生物公司 修饰的封闭端dna(cedna)
CA3133330A1 (en) * 2019-03-13 2020-09-17 Generation Bio Co. Non-viral dna vectors and uses thereof for expressing phenylalanine hydroxylase (pah) therapeutics
BR112021024124A2 (pt) * 2019-05-31 2022-01-11 American Gene Tech Int Inc Expressão otimizada de fenilalanina hidroxilase

Also Published As

Publication number Publication date
AU2021345187A1 (en) 2023-04-06
IL301196A (en) 2023-05-01
EP4214309A1 (en) 2023-07-26
JP2023542131A (ja) 2023-10-05
CN116507730A (zh) 2023-07-28
CA3191765A1 (en) 2022-03-24
MX2023003019A (es) 2023-05-08
US20240026374A1 (en) 2024-01-25
WO2022061000A1 (en) 2022-03-24

Similar Documents

Publication Publication Date Title
KR102482890B1 (ko) 아포지질단백질 (a) 발현을 조절하는 조성물 및 방법
CA2909733C (en) Effective delivery of large genes by dual aav vectors
US8404658B2 (en) RNA interference for the treatment of heart failure
JP7416451B2 (ja) CRISPR-Casによる標的化された核内RNA切断及びポリアデニル化
JP2019519221A (ja) 加齢関連疾患及び症状の遺伝子治療法
BR112014004895B1 (pt) Oligonucleotídeos antissentido para o tratamento de amaurose congênita de leber
KR20210149702A (ko) 비바이러스성 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 치료제 발현을 위한 이의 용도
KR20210119416A (ko) 폐쇄-말단 dna (cedna), 및 유전자 또는 핵산 치료 관련 면역 반응을 감소시키는 방법에서의 이의 용도
CN111818942A (zh) 非病毒dna载体以及其用于产生抗体和融合蛋白的用途
KR20210133993A (ko) Rho-연관 상염색체-우성 망막색소변성증(adrp)을 치료하기 위한 crispr/rna-가이드 뉴클레아제-관련 방법 및 조성물
KR20210127935A (ko) 폐쇄형 DNA(ceDNA) 생산에서의 Rep 단백질 활성의 변형
KR20200124250A (ko) 폐쇄-말단 dna (cedna) 벡터를 사용한 이식유전자의 제어된 발현
CN112639108A (zh) 治疗非综合征性感觉神经性听力损失的方法
CN116113697A (zh) 用于治疗癫痫的方法和组合物
KR20230003477A (ko) 비-바이러스성 dna 벡터 및 인자 ix 치료제 발현을 위한 이의 용도
KR20230129162A (ko) 제1형 근긴장성 이영양증을 치료하기 위한 rna 표적화조성물 및 방법
CN113874513A (zh) 非病毒dna载体及其用于表达fviii治疗剂的用途
KR20220007601A (ko) 치료제 투여를 위한 조성물 및 방법
KR20230003478A (ko) 비-바이러스성 dna 벡터 및 고셰 치료제 발현을 위한 이의 용도
KR20230066615A (ko) 폐쇄형 dna 벡터 및 페닐알라닌 히드록실라아제(pah) 발현을 위한 이의 용도
RU2814137C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фенилаланингидроксилазы (pah)
RU2812850C2 (ru) Модуляция активности rep белка при получении днк с замкнутыми концами (зкднк)
CN113755524B (zh) 用于治疗脊髓性肌萎缩的腺相关病毒载体及其用途
KR20230066453A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
RU2811724C2 (ru) РЕДАКТИРОВАНИЕ ГЕНОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННОЙ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК)