KR20220119703A - 조절 핵산 서열 - Google Patents

조절 핵산 서열 Download PDF

Info

Publication number
KR20220119703A
KR20220119703A KR1020227025726A KR20227025726A KR20220119703A KR 20220119703 A KR20220119703 A KR 20220119703A KR 1020227025726 A KR1020227025726 A KR 1020227025726A KR 20227025726 A KR20227025726 A KR 20227025726A KR 20220119703 A KR20220119703 A KR 20220119703A
Authority
KR
South Korea
Prior art keywords
seq
promoter
functional variant
muscle
specific
Prior art date
Application number
KR1020227025726A
Other languages
English (en)
Inventor
조지 오마르 야네즈-쿠나
후안 마누엘 이글레시아스
싱클레어 쿠퍼
케이티 베이커
폴리세니 카츠피
린쿠 라잔
일레아나 게리니
안토니아 에브리피오티
키라 무라오
마이클 엘. 로버트
Original Assignee
아스클레피오스 바이오파마슈티컬, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1919269.9A external-priority patent/GB201919269D0/en
Priority claimed from GBGB2012192.7A external-priority patent/GB202012192D0/en
Application filed by 아스클레피오스 바이오파마슈티컬, 인크. filed Critical 아스클레피오스 바이오파마슈티컬, 인크.
Publication of KR20220119703A publication Critical patent/KR20220119703A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/32Special delivery means, e.g. tissue-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은 유전자의 근육-특이적 발현을 향상시킬 수 있는 조절 핵산 서열, 특히 근육-특이적 프로모터, 이의 요소, 및 기타 이러한 핵산 서열에 관한 것이다. 본 발명은 또한 이러한 근육-특이적 조절 핵산 서열을 포함하는 발현 컨스트럭트, 벡터 및 세포, 및 이들의 이용 방법에 관한 것이다. 조절 핵산 서열은 유전자 치료 적용 분야에 특히 유용하지만, 바이오프로세싱 및 생명공학과 같은 타 분야에서도 유용하다.

Description

조절 핵산 서열
본 발명은 유전자의 근육-특이적 발현을 향상시킬 수 있는 조절 핵산 서열, 특히 근육-특이적 프로모터, 이의 요소, 및 기타 이러한 핵산 서열에 관한 것이다. 본 발명은 또한 이러한 근육-특이적 조절 핵산 서열을 포함하는 발현 컨스트럭트, 벡터 및 세포, 및 이들의 이용 방법에 관한 것이다. 조절 핵산 서열은 유전자 치료 적용 분야에 특히 유용하지만 바이오프로세싱 및 생명공학과 같은 타 분야에서도 유용하다.
하기 논의는 독자가 개시 내용을 이해하는 데 도움을 주기 위해 제공되고 선행 기술의 내용 또는 관련성에 대한 어느 인정도 구성하지 않는다.
유전자 요법을 포함한 많은 영역에서, 원하는 세포, 조직 또는 기관 내에서 단백질 또는 핵산 발현 산물을 제조하기 위해 유전자의 발현을 유도할 수 있는 조절 핵산 서열을 제공하는 것이 바람직하다.
근육에서 치료 유전자의 발현은 유전자 치료(gene therapy)에서 매력적이다. 근육에서의 유전자 요법은 디스트로핀 및 사르코글리칸과 같은, 다양한 근육 단백질의 발현을 교정하거나 증가시킬 가능성이 있다. 이것은 근이영양증(muscular dystrophy)과 같은 병증, 예를 들어 뒤센느 근이영양증(Duchenne muscular dystrophy, DMD)을 치료하는 데 이용할 수 있다. 또한 근육은 다른 병증의 치료를위한 치료 단백질을 발현하는 플랫폼으로 이용될 수 있다.
근육 세포에 유전자를 전달하기 위해 다양한 벡터, 예를 들어 아데노바이러스, 레트로바이러스, 렌티바이러스, 및 아데노-관련 바이러스(adeno-associated viral, AAV) 뿐만 아니라 플라스미드와 같은 비-바이러스 벡터가 이용되었다. 아데노바이러스 벡터는 비교적 큰 클로닝 능력을 가지고 있으며 일부 세포에 효율적으로 형질도입할 수 있다. 그러나, 이는 강한 면역 반응을 이끌어내는 경향이 있어 중대한 도전에 직면하였다. 레트로바이러스 및 렌티바이러스 벡터는 게놈에 안정적으로 통합되며, 이는 장점과 단점 모두와 관련된다. 렌티바이러스 벡터는 분열 세포와 비분열 세포에 모두 형질도입할 수 있지만, 대부분의 기존 레트로바이러스 벡터는 분열 세포만에만 형질도입할 수 있어, 비분열 근육 세포에서의 이용이 제한된다. 플라스미드 DNA는 인 비트로(in vitro)에서 근육 세포로 유전자를 전달하는 데 이용가능하나, 임상에서는 잠재적인 유용성이 덜 명확하다. AAV 벡터는 근육에서의 유전자 치료의 적용에 특히 매력적이다. AAV 벡터는 근육 세포에 대해 자연적인 친화성을 나타내고, 치료 페이로드(payload)의 장기간 발현을 유도할 수 있으며, 및 최소한의 면역 반응을 이끌어낼 수 있다. 일부 유전자 치료 벡터의 근육 세포 우선적 형질도입 능력에도 불구하고 표적-외(off-target) 형질도입이 발생하고 있다. AAV 혈청형 1, 2 (AAV serotypes 1, 2) 및 키메라 2.5 (chimeric 2.5)를 이용한 여러 1상 및 2상 임상 시험이 뒤센느 근이영양증(DMD) 및 알파-1 항트립신 결핍증(alpha-1 antitrypsin deficiency)의 치료에서 보고되었다(D. E. Bowles, S. WJ McPhee, C. Li, S. J. Gray, J. J. Samulski, A. S. Camp, J. Li, B. Wang, P. E. Monahan, J. E. Rabinowitz, J. C. Grieger, La. Govindasamy, M. Agbandje-McKenna, X. Xiao and R. J. Samulski, Molecular Therapy, 20, 443-455 (2012); M. L. Brantly, J. D. Chulay, L. Wang, C. Mueller, M. Humphries, L. T. Spencer, F. Rouhani, T. J. Conlon, R. Calcedo, M. R. Berts, C. Spencer, B. J. Byrne, J. M. Wilson, T. R. Flotte, Sustained transgene expression despite T lymphocyte responses in a clinical trial of rAAVl-AAT gene therapy. Proceedings of the National Academy of Sciences of the United States of America 106, 16363-16368 (2009); T. R. Flotte, M. L. Brantly, L. T. Spencer, B. J. Byrne, C. T. Spencer, D. J. Baker, M. Humphries, Phase I trial of intramuscular injection of a recombinant adeno-associated virus alpha 1 -antitrypsin (rAAV2-CB-hAAT) gene vector to AAT-deficient adults. Human gene therapy 15, 93-128 (2004); T. R. Flotte, B. C. Trapnell, M. Humphries, B. Carey, R. Calcedo, F. Rouhani, M. Campbell-Thompson, A. T. Yachnis, R. A. Sandhaus, N. G. McElvaney, C. Mueller, L. M. Messina, J. M. Wilson, M. Brantly, D. R. Knop, G. J. Ye, J. D. Chulay, Phase 2 clinical trial of a recombinant adeno-associated viral vector expressing alphal-antitrypsin: interim results. Human gene therapy 22, 1239-1247 (2011); C. Mueller, J. D. Chulay, B. C. Trapnell, M. Humphries, B. Carey, R. A. Sandhaus, N. G. McElvaney, L. Messina, Q. Tang, F. N. Rouhani, M. Campbell-Thompson, A. D. Fu, A. Yachnis, D. R. Knop, G. J. Ye, M. Brantly, R. Calcedo, S. Somanathan, L. P. Richman, R. H. Vonderheide, M. A. Hulme, T. M. Brusko, J. M. Wilson, T. R. Flotte, Human Treg responses allow sustained recombinant adeno-associated virus-mediated transgene expression. The Journal of clinical investigation 123, 5310-5318 (2013)).
근육-특이적 방식으로 유전자 발현을 조절하기 위한 시스템을 제공하는 것이 바람직하다. 이상적으로는, 이러한 시스템은 근육에 높은-특이성을 가지며(이에 의해 비-표적 조직에서 표적-외 발현을 피하거나 최소화함) 또한 강력하고, 즉 근육에서 높은 수준의 발현을 유도한다. 시스-작용 조절 요소의 용도가 특이성 및 활성 모두를 제공하는 것으로 제안되었다. 일반적으로, 이는 시스-조절 인핸서 서열(cis-regulatory enhancer sequences), 즉 프로모터의 활성을 증가시키기 위해 시스(cis)로 작용하는 핵산 서열에 관한 것이다.
다양한 근육-특이적 프로모터가 당업계에 공지되어 있으며, 일반적으로 근육에서 우세하게 발현되는 유전자, 예를 들어 데스민(desmin), 골격 액틴(skeletal actin), 심장 α-액틴, 근육 크레아틴 키나제(muscle creatine kinase, CKM), 미오신 중쇄 및 경쇄, 및 트로포닌 T/I(troponin T/I)을 코딩하는 것으로부터 수득된다. C5-12 프로모터는 공지된 합성 프로모터를 나타낸다.
짧은 길이의 조절 서열은 유전자 치료 벡터 중 조절 서열이 차지하는 비율을 최소화하는 데 바람직하다; 이것은 특히 AAV 벡터와 같이 제한된 용량(페이로드, payload)을 가진 유전자 치료 벡터에 중요하다. 또한, 강력한 프로모터를 제공하는 것이 바람직하지만, 많은 경우에 당업자가 다양한 파워의 프로모터 범위로부터, 원하는 파워를 갖는 적절한 프로모터를 선택할 수 있는 것이 바람직할 수 있다.
근육-특이적 유전자 발현을 유도할 수 있는 조절 핵산에 대한 필요성은 당업계에 여전히 남아있다. 특히, 원하는 유전자(예를 들어, 유전자 치료 맥락에서 치료 이식유전자)의 근육-특이적 발현을 위해 발현 컨스트럭트 및 벡터에 도입될 수 있는 근육-특이적 조절 서열(예를 들어, 프로모터, 시스-조절 모듈, 시스-조절 요소 및 최소 또는 근위 프로모터 요소)에 대한 필요성이 있다.
본 발명의 일 측면은,
a) 서열번호 1 내지 137, 342 내지 367, 424 내지 453 및 478 내지 509 중 어느 하나에 따른 서열 또는 이들의 기능적 변이체를 포함하거나 또는 이로 이루어진 합성된 근육-특이적 프로모터; 또는
b) 서열번호 138 내지 269, 369 내지 394, 454 내지 461 및 510 내지 532 중 어느 하나의 서열 또는 이들의 기능적 변이체를 포함하는 시스-조절 모듈(CRM)을 포함하거나 또는 이로 구성된 합성된 근육-특이적 프로모터를 제공한다.
일 구체예에 있어서 상기 합성된 근육-특이적 프로모터는 서열번호 1 내지 137, 342 내지 367, 424 내지 453 및 478 내지 509 중 어느 하나와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함한다.
일 구체예에 있어서 상기 합성된 근육-특이적 시스-조절 모듈(CRM)은 서열번호 138 내지 269, 369 내지 394, 454 내지 461 및 510 내지 532 중 어느 하나와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함한다.
일 구체예에 있어서 b)에 따른 합성된 근육-특이적 프로모터는 프로모터 요소(일반적으로 최소(minimal) 또는 근위(proximal) 프로모터)에 작동가능하게 연결된 상기 기재된 바와 같은 CRM을 포함한다. 근위 프로모터는 바람직하게는 근육-특이적 근위 프로모터이다.
따라서 본 발명은 다양한 합성된 근육-특이적 프로모터 및 이의 기능적 변이체를 제공한다. 서열번호 1 내지 137, 342 내지 367, 424 내지 453 및 478 내지 509 중 어느 하나의 변이체인 본 발명에 따른 프로모터는 참조 프로모터 활성의 적어도 25%, 50%, 75%, 80%, 85%, 90%, 95% 또는 100%를 보유하는 것이 일반적으로 바람직하다. 적절하게는 상기 활성은 본 명세서에 기재된 바와 같은 예시 중 하나를 이용하여 평가되지만, 다른 방법이 이용될 수 있다.
본 발명의 다른 측면은, 서열번호 293 내지 298, 301 내지 341, 395 내지 419, 462 내지 470 및 533 내지 546 중 어느 하나에 따른 서열, 또는 이들 중 어느 하나의 기능적 변이체를 포함하거나 또는 이로 이루어진 근육-특이적 시스-조절 요소(cis-regulatory element, CRE)를 제공한다. 일 구체예에 있어서 근육-특이적 CRE는 서열번호 293 내지 298, 301 내지 341, 395 내지 419, 462 내지 470 및 533 내지 546 중 어느 하나와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함한다.
서열번호 293 내지 298, 301 내지 341, 395 내지 419, 462 내지 470 및 533 내지 546 중 어느 하나의 변이체인 본 발명에 따른 근육-특이적 CRE는 참조 CRE의 활성의 적어도 25%, 50%, 75%, 80%, 85%, 90%, 95% 또는 100%를 보유하는 것이 일반적으로 바람직하다. 적절하게는 상기 활성은 본 명세서에 기재된 바와 같은 예시 중 하나를 이용하여 평가되지만, 다른 방법이 이용될 수 있다.
CRE0033 (서열번호 309), CRE0090 (서열번호 409) 및 CRE0096 (서열번호 417)은 바람직한 근육-특이적 CRE이고 적절한 프로모터 요소와 조합될 때 및/또는 적절한 합성 프로모터에 더해질 때 심장 근육에서 현저한 근육-특이적 인핸서 활성을 제공하는 것이 확인되었다.
본 발명의 또 다른 측면은 본 발명의 어느 한 측면의 CRE을 포함하는 합성된 프로모터를 제공한다.
본 발명의 다른 측면은 서열번호 299에 따른 서열, 또는 이의 기능적 변이체를 포함하거나 이로 구성된 인트론을 제공한다. 본 발명의 또 다른 측면은 상기 인트론을 포함하는 합성된 프로모터, 적절하게는 상기 인트론을 포함하는 합성된 근육-특이적 프로모터를 제공한다. 적절하게는 기능적 변이체는 서열번호 299와 적어도 서열번호 299와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함한다.
본 발명의 다른 측면은 서열번호 368에 따른 서열, 또는 이의 기능적 변이체를 포함하거나 이로 구성된 조절 요소(5' UTR 및 인트론)를 제공한다. 본 발명의 또 다른 측면에서, 상기 조절 요소를 포함하는 합성된 프로모터, 적절하게는 상기 조절 요소를 포함하는 합성된 근육-특이적 프로모터를 제공한다. 적절하게는 기능적 변이체는 서열번호 368과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함한다.
본 발명의 다른 측면은 서열번호 270 내지 292, 420 내지 423, 471 내지 477 및 300 중 어느 하나에 따른 서열, 또는 이의 기능적 변이체를 포함하거나 이로 구성된 최소 또는 근위 프로모터를 제공한다. 본 발명의 또 다른 측면에서, 상기 최소 또는 근위 프로모터를 포함하는 합성된 프로모터, 적절하게는 상기 최소 또는 근위 프로모터를 포함하는 합성된 근육-특이적 프로모터가 제공된다. 적절하게는 기능적 변이체는 서열번호 270 내지 292, 420 내지 423, 471 내지 477 및 300과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함한다.
본 발명의 CRE, CRM, 인트론, UTR, 최소/근위 프로모터 및 프로모터는 다양한 근육 조직, 특히 골격 근육 및/또는 심장 근육에서 활성일 수 있지만, 이에 제한되지 않는다. 하나 이상의 근육 조직 유형 또는 하나 이상의 근육 세포 유형에서 활성인 CRE, CRM, 프로모터 요소 또는 프로모터는 '근육-특이적'으로 지칭될 수 있다. 용이함을 위해, 근육-특이적 CRE, CRM, 프로모터 요소 또는 프로모터는 CRE, CRM, 프로모터 요소 또는 프로모터가 골격 근육 또는 심장 근육에서 우세하게 활성인지 여부에 따라 하위 유형으로 추가적으로 세분화될 수 있다.
일 구체예에 있어서 본 발명의 시스-조절 요소 및 프로모터는 골격 근육-특이적이다. 일 구체예에 있어서 본 발명의 시스-조절 요소, CRM, 프로모터 요소 및 프로모터는 골격 근육에서 우세하게 활성이고 심장 근육에서는 덜 활성이거나 활성이 아니다. 이러한 CRE, CRM, 프로모터 요소 및 프로모터는 '골격 근육-특이적'이라고 한다.
일 구체예에 있어서 본 발명의 시스-조절 요소 및 프로모터는 심장 근육-특이적이다. 일 구체예에 있어서 본 발명의 시스-조절 요소, CRM, 프로모터 요소 및 프로모터는 심장 근육에서 우세하게 활성이고 골격 근육에서는 덜 활성이거나 활성이 아니다. 이러한 CRE, CRM, 프로모터 요소 및 프로모터는 '심장 근육-특이적'이라고 한다.
일 구체예에 있어서, 골격 근육 및 심장 근육 모두에서 활성인 근육-특이적 CRE, CRM, 프로모터 요소 및 프로모터가 바람직하다. 이러한 CRE, CRM, 프로모터 요소 및 프로모터는 프로모터 활성이 골격 근육과 심장(심장 근육) 모두에서 필요할 때 선호될 수 있다. 골격 및 심장 근육 모두에서 활성인 근육-특이적 프로모터의 예는 SP0010, SP0020, SP0033, SP0038, SP0040, SP0042, SP0051, SP0057, SP0058, SP0061, SP0062, SP0064, SP0065, SP0066, SP0068, SP0070, SP0071, SP0076, SP0132, SP0133, SP0134, SP0136, SP0146, SP0147, SP0148, SP0150, SP0153, SP0155, SP0156, SP0157, SP0158, SP0159, SP0160, SP0161, SP0162, SP0163, SP0164, SP0165, SP0166, SP0169, SP0170, SP0171, SP0173, SP0228, SP0229, SP0230, SP0231, SP0232, SP0257, SP0262, SP0264, SP0265, SP0266, SP0267, SP0268, SP0270, SP0271, SP0279, SP0286, SP0305, SP0306, SP0307, SP0309, SP0310, SP0311, SP0312, SP0313, SP0314, SP0315, SP0316, SP0320, SP0322, SP0323, SP0324, SP0325, SP0326, SP0327, SP0328, SP0329, SP0330, SP0331, SP0332, SP0333, SP0334, SP0335, SP0336, SP0337, SP0338, SP0339, SP0340, SP0341, SP0343, SP0345, SP0346, SP0347, SP0348, SP0349, SP0350, SP0351, SP0352, SP0353, SP0354, SP0355, SP0356, SP0358, SP0359, SP0361, SP0362, SP0363, SP0364, SP0365, SP0366, SP0367, SP0368, SP0369, SP0370, SP0371, SP0372, SP0373, SP0374, SP0375, SP0376, SP0377, SP0378, SP0379, SP0380, SP0381, SP0382, SKM_14, SKM_18, SKM_20, SP0357, SP0437-SP0445, SP0447 및 SP0453-SP0471, 473-474를 포함한다. 골격 및 심장 근육 모두에서 활성인 합성된 근육-특이적 프로모터의 바람직한 예는 SP0057, SP0134, SP0173, SP0279, SP0286, SP0310, SP0316, SP0320 및 SP0326이다.
일 구체예에 있어서, 골격 근육-특이적 CRE, CRM, 프로모터 요소 및 프로모터가 바람직할 수 있다. 이러한 CRE, CRM, 프로모터 요소 및 프로모터는 심장(심장 근육)에서 거의 또는 전혀 활성이 없고, 골격 근육에서 프로모터 활성이 요구될 때 선호될 수 있다. 합성된 골격 근육-특이적 프로모터의 예는 SP0227, SP0069, SP0342, SP0407, SP0408, SP0409, SP0410, SP0411, SP0412, SP0413, SP0414, SP0415, SP0416, SP0417, SP0418, SP0419, SP0420, SP0421, SP0422, SP0423, SP0426, SP0427, SP0428, SP0431, SP0432, SP0060 및 SP0446을 포함한다. 합성된 골격 근육-특이적 프로모터의 바람직한 예는 SP0227, SP0407 및 SP0418이다. 골격 근육-특이적 프로모터는 속근(fast-twitch muscle) 및/또는 지근(slow-twitch muscle)에서 활성일 수 있다. 일 구체예에 있어서, 속근에서 활성인 골격 근육-특이적 CRE, CRM, 프로모터 요소 및 프로모터가 바람직할 수 있다. 일 구체예에 있어서, 지근에서 활성인 골격 근육-특이적 CRE, CRM, 프로모터 요소 및 프로모터가 바람직할 수 있다. 일 구체예에 있어서, 지근 및 속근 모두에서 활성인 골격 근육-특이적 CRE, CRM, 프로모터 요소 및 프로모터가 바람직할 수 있다. 속근에서 활성인 골격 근육-특이적 프로모터의 예는 SP0227, SP0419, SP0431 및 SP0432이다. 지근에서 활성인 골격 근육-특이적 프로모터의 예는 SP0409, SP0417 및 SP0418이다.
일 구체예에 있어서, 심장 근육-특이적 CRE, CRM, 프로모터 요소 및 프로모터가 바람직할 수 있다. 이러한 CRE, CRM, 프로모터 요소 및 프로모터는 골격 근육에서 거의 또는 전혀 활성이 없고, 심장(심장 근육에서)에서 프로모터 활성이 요구될 때 선호될 수 있다. 합성된 심장 근육-특이적 프로모터의 예는 SP0435, SP0449, SP0450, SP0451, SP0475, SP0476, SP0477, SP0478, SP0479, SP0480, SP0481, SP0482, SP0484, SP0485, SP0486, SP0487, SP0488, SP0489, SP0490, SP0491, SP0492, SP0493, SP0494, SP0495, SP0067, SP0075, SP0424, SP0425, SP0429, SP0430, SP0433, SP0436, SP0452, SP0344, SP0483 및 SP0496을 포함한다. 심장 근육-특이적 프로모터의 바람직한 예는 SP0067, SP0433, SP0436, SP0452, SP0344 및 SP0483이다.
본 발명의 심장 근육-특이적 CRE, CRM, 프로모터 요소 및 프로모터는 심장의 다양한 세포에서 활성일 수 있다. 심장의 우세한 세포 유형은 심실 심근세포(ventricular ardiomyocytes), 심방 심근세포(atrial cardiomyocytes), 심장 섬유아세포(cardiac fibroblasts), 또는 심장의 내피 세포(endothelial cells, EC), 뿐만 아니라 혈관-주위 세포(peri-vascular cells) 및 심장박동원 세포(pacemaker cells)이다. 추가적으로, 본 발명의 심장 근육-특이적 CRE, CRM, 프로모터 요소 및 프로모터는, 심장의 다양한 부위, 예를 들어, 하기 심장 영역 중 하나 또는 전부에서 활성일 수 있다: 대동맥궁 동맥(aortic arch arteries, AA); 대동맥(aorta); 심근세포(cardiomyocytes, CM); 내피 또는 심내막 세포(endothelial 또는 endocardial cells, EC); 하대정맥(inferior caval vein, ICV); 심실 중격(interventricular septum, IVS); 좌심방(left atrium, LA); 좌상대정맥(left superior caval vein, LSCV); 좌심실(left ventricle, LV); 유출로(outflow tract, OT); 폐동맥(pulmonary arteries, PO); 전심장외막기관(proepicardial organ, PEO); 폐정맥(pulmonary vein, PV); 우심방(right atrium, RA); 우상대정맥(right superior caval vein, RSCV); 우심실(right ventricle, RV); 상대 정맥(superior caval vein, SCV); 심장 평활근 세포(smooth muscle cell, SM).
본 발명의 다른 측면은, 하기로 이루어진 그룹에서 선택된 2개 이상의 작동가능하게 연결된 시스-조절 요소(CRE)를 포함하는 합성된 근육-특이적 시스-조절 모듈(CRM)을 제공한다:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체; 및
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체.
일 구체예에 있어서, 합성된 근육-특이적 CRM은 골격 및 심장 근육 모두에서 활성이다. 일 구체예에 있어서, 합성된 근육-특이적 CRM은 골격근에서 활성이다. 일 구체예에 있어서, 합성된 근육-특이적 CRM은 심장 근육에서 활성이다.
본 발명의 다른 측면은, 하기를 포함하는 합성된 근육-특이적 프로모터가 제공된다:
a) CRE0035 (서열번호 310) 또는 이의 기능적 변이체, CRE0071 (서열번호 321) 또는 이의 기능적 변이체, CRE0020 (서열번호 303) 또는 이의 기능적 변이체, CRE0031 (서열번호 308) 또는 이의 기능적 변이체의 그룹 중 적어도 두개의 CRE를 포함하는 근육-특이적 CRM; 또는
b) 하기의 CRE 중 적어도 하나로서:
CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체; 및
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체,
하기의 프로모터 요소 중 적어도 하나에 작동가능하게 연결된 것:
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체; 및
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
일 구체예에 있어서, 합성된 근육-특이적 프로모터는 골격 및 심장 근육 모두에서 활성이다. 일 구체예에 있어서, 합성된 근육-특이적 프로모터는 골격근에서 활성이다. 일 구체예에 있어서, 합성된 근육-특이적 프로모터는 심장 근육에서 활성이다.
본 발명의 다른 측면은, 하기로 이루어진 그룹에서 선택되고 2개 이상의 작동가능하게 연결된 프로모터 요소를 포함하는 합성된 근육-특이적 프로모터를 제공한다:
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체; 및
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
일 구체예에 있어서, 합성된 근육-특이적 프로모터는 골격 및 심장 근육 모두에서 활성이다. 일 구체예에 있어서, 합성된 근육-특이적 프로모터는 골격근에서 활성이다. 일 구체예에 있어서, 합성된 근육-특이적 프로모터는 심장 근육에서 활성이다.
본 발명의 다른 측면은, 하기로 이루어진 그룹에서 선택되고 2개 이상의 작동가능하게 연결된 시스-조절 요소(CRE)를 포함하는 합성된 근육-특이적 시스-조절 모듈(CRM)을 제공한다:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
- CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체; 및
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체.
일 구체예에 있어서, 합성된 근육-특이적 CRM은 골격 및 심장 근육 모두에서 활성이다. 일 구체예에 있어서, 합성된 근육-특이적 CRM은 상기 CRE 중 3개 이상, 4개 이상 또는 5개 이상을 포함한다. 하기에서 더 자세히 논의되는 바와 같이, 이러한 CRE는 근육-특이적 프로모터에 존재하는 CRM의 활성 및 근육-특이적 프로모터의 활성에 기여하는 것으로 확인되었다.
일 구체예에 있어서, 본 발명의 합성된 근육-특이적 CRM은 하기로 이루어진 그룹에서 선택된 CRE의 조합, 또는 이의 기능적 변이체를 포함한다:
CRE0035 및 CRE0036; CRE0035 및 CRE0029; CRE0035 및 CRE0071; CRE0035 및 CRE0020; CRE0035 및 CRE0031; CRE0036 및 CRE0029; CRE0036 및 CRE0071; CRE0020 및 CRE0036; CRE0036 및 CRE0031; CRE0029 및 CRE0071; CRE0029 및 CRE0020; CRE0029 및 CRE0031; CRE0020 및 CRE0071; CRE0071 및 CRE0031; 및 CRE0020 및 CRE0031.
본 명세서에 개시된 CRE의 조합 또는 이의 기능적 변이체 중 어느 하나에서, 기재된 CRE는 임의의 순서로 존재할 수 있다. 바람직한 일 구체예에 있어서, 상기 CRE는 기재된 순서대로 존재한다(즉, 작동가능하게 연결된 프로모터 요소 또는 유전자에 대한 위치를 참조하여, 상류에서 하류 순서로).
본 명세서에 개시된 CRE의 조합, 또는 이의 기능적 변이체 중 어느 하나에서, 기재된 CRE의 일부 또는 전부는 적절하게는 CRM에 서로 인접하게 위치하는 것일 수 있다(즉, 어느 끼어든 CRE 또는 다른 조절 요소 없이). 상기 CRE는 연속적(contiguous) 또는 비연속적(non-contiguous)일 수 있다(즉, 서로 바로 인접하게 위치하거나 스페이서 또는 다른 서열에 의해 분리될 수 있음). 바람직한 일 구체예에 있어서, 상기 CRE, 또는 이의 기능적 변이체는 기재된 순서대로 제공되고 서로 인접한다. 예를 들어, 합성된 근육-특이적 CRM은 CRE0031의 바로 상류에 있는 CRE0035 등을 포함할 수 있다. 상기 CRE는 연속적 또는 비연속적일 수 있다. 일 실시예에 있어서, 상기 CRE의 일부 또는 전부는 연속적인 것이 바람직하다.
상기 언급한 CRE의 조합을 포함하는 CRM은 적절한 프로모터 요소와 조합할 때 골격 및 심장 근육 모두에서 현저한 근육-특이적 인핸서 활성을 제공하는 것으로 확인되었다. 특히 CRE가 하기와 같이 기재된 순서대로 서로 인접해 있을 때 높은 수준의 활성이 관찰되었다:
- CRE0035 및 CRE0031;
- CRE0035 및 CRE0036;
- CRE0029 및 CRE0071;
- CRE0035 및 CRE0020;
- CRE0020 및 CRE0071; 및
- CRE0020 및 CRE0036.
따라서, 이들은 골격 및 심장 근육 모두에서 높은 수준의 근육-특이적 프로모터 활성과 일반적으로 연관성이 있는, 일부의 바람직한 CRE '모티프(motif)'를 나타낸다.
본 발명의 바람직한 일 구체예에 있어서, 상기 합성된 근육-특이적 CRM은 하기로 이루어진 그룹에서 선택된 CRE의 조합, 또는 이의 기능적 변이체를 포함한다:
- CRE0035 및 CRE0031 (즉, SP0160 및 SP0163 유래 CRE);
- CRE0035 및 CRE0036 (즉, SP0159 및 SP0162 유래 CRE);
- CRE0029 및 CRE0071 (즉, SP0057 유래 CRE);
- CRE0035 및 CRE0020 (즉, SP0156 유래 CRE);
- CRE0020 및 CRE0071 (즉, SP0134 유래 CRE); 및
- CRE0020 및 CRE0036 (즉, SP0158 및 SP0161 유래 CRE).
일 구체예에 있어서, 상기 합성된 근육-특이적 CRM은 상기 기재된 CRE 외에 하나 이상의 조절 요소를 포함한다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 다른 CRE 또는 그밖의 CRE일 수 있다. 일 구체예에 있어서, 추가의 CRE은 CRE0033 (서열번호 309), CRE0090 (서열번호 409) 및 CRE0096 (서열번호 417) 중 어느 하나일 수 있다.
본 발명의 일 구체예에 있어서, 상기 합성된 근육-특이적 CRM은 CRM_SP0160 (서열번호 173), CRM_SP0163 (서열번호 176), CRM_SP0159 (서열번호 172), CRM_SP0162 (서열번호 175), CRM_SP0057 (서열번호 145), CRM_SP0156 (서열번호 169), CRM_SP0134 (서열번호 161), CRM_SP0158 (서열번호 171) 및 CRM_SP0161 (서열번호 174)으로 이루어진 그룹에서 선택된 CRM, 또는 이들 중 어느 하나의 기능적 변이체를 포함한다. 적절하게는, 임의의 상기 CRM의 기능적 변이체는 참조(reference) 합성된 근육-특이적 CRM과 적어도 70% 동일, 더 바람직하게는 참조 합성된 근육-특이적 CRM과 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다.
일 구체예에 있어서, 본 발명에 따른 근육-특이적 CRM은 프로모터 요소에 작동가능하게 연결되어 합성된 근육-특이적 프로모터를 형성한다. 본 발명의 일 구체예에서, 합성된 근육-특이적 프로모터는 SP0160, SP0163, SP0159, SP0162, SP0057, SP0156, SP0134, SP0158 및 SP0161로 이루어진 그룹에서 선택된 프로모터, 또는 이의 기능적 변이체를 포함한다. 적절하게는 임의의 상기 프로모터의 기능적 변이체는 참조 합성된 근육-특이적 프로모터와 적어도 70% 동일, 더 바람직하게는 참조 합성된 근육-특이적 프로모터와 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다.
본 발명의 다른 측면은, 하기를 포함하는 합성된 근육-특이적 프모로터를 제공한다:
하기로 이루어진 그룹에서 선택된 두개 이상의 작동가능하게 연결된 CRE를 포함하는 CRM으로서:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
- CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체; 및
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체;
하기로 이루어진 그룹에서 선택된 프로모터 요소에 작동가능하게 연결된 것인, CRM:
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체;
- SKM_18 (서열번호 135) 또는 이의 기능적 변이체;
- CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체;
- CRE0049 (서열번호 278) 또는 이의 기능적 변이체;
- CRE0048 (서열번호 277) 또는 이의 기능적 변이체;
- CRE0011 (서열번호 291) 또는 이의 기능적 변이체;
- SKM_14 (서열번호 287) 또는 이의 기능적 변이체;
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
본 발명의 다른 측면은, 하기를 포함하는 합성된 근육-특이적 프로모터를 제공한다:
하기로 이루어진 그룹으로부터의 적어도 하나의 CRE로서:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
- CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체; 및
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체;
하기로 이루어진 그룹에서 프로모터 요소에 작동가능하게 연결된 것인 CRE:
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체;
- SKM_18 (서열번호 135) 또는 이의 기능적 변이체;
- CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체;
- CRE0049 (서열번호 278) 또는 이의 기능적 변이체;
- CRE0048 (서열번호 277) 또는 이의 기능적 변이체;
- CRE0011 (서열번호 291) 또는 이의 기능적 변이체;
- SKM_14 (서열번호 287) 또는 이의 기능적 변이체; 및
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
일 구체예에 있어서, 합성된 근육-특이적 프로모터는 골격 및 심장 근육에서 활성이다. 일 구체예에 있어서, 합성된 근육-특이적 프로모터는 기재된 프로모터 요소에 작동가능하게 연결된 적어도 2개의 기재된 CRE, 또는 이의 기능적 변이체를 포함한다.
하기에서 더 자세히 논의되는 바와 같이, CRE0035 (서열번호 310) 또는 이의 기능적 변이체, CRE0036 (서열번호 311) 또는 이의 기능적 변이체, CRE0029 (서열번호 307) 또는 이의 기능적 변이체, CRE0071 (서열번호 321) 또는 이의 기능적 변이체, CRE0020 (서열번호 303) 또는 이의 기능적 변이체 및 CRE0031 (서열번호 308)에서 선택되는 적어도 하나의 CRE, 및 CRE0037 (서열번호 275) 또는 이의 기능적 변이체, CRE0070 (서열번호 284) 또는 이의 기능적 변이체, SKM_18 (서열번호 135) 또는 이의 기능적 변이체, CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체, CRE0049 (서열번호 278) 또는 이의 기능적 변이체, CRE0048 (서열번호 277) 또는 이의 기능적 변이체, CRE0011 (서열번호 291) 또는 이의 기능적 변이체, SKM_14 (서열번호 287) 또는 이의 기능적 변이체 및 CRE0046 (서열번호 276) 또는 이의 기능적 변이체로부터 선택되는 적어도 하나의 프로모터 요소의 조합은 골격 및 심장 근육 모두에서 높은 수준의 근육-특이적 활성을 제공하는 것을 확인하였다.
일 구체예에 있어서, 상기 프로모터 요소는 CRE의 하류에 있으며, 일반적으로 근위 CRE에 인접한다. 상기 프로모터 요소는 인접 CRE와 연속되거나, 또는 스페이서에 의해 분리될 수 있다.
일 구체예에 있어서, 합성된 근육-특이적 프로모터는 상기 기재된 CRE 및/또는 프로모터 요소에 추가하여 하나 이상의 조절 요소를 포함한다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 다른 CRE 또는 그밖의 CRE일 수 있다. 일 구체예에 있어서, 상기 CRE는 CRE0047 및 DES_MT enhancer_48bp로부터 선택될 수 있다. 일 구체예에 있어서, 상기 추가 CRE는 CRE0033 (서열번호 309), CRE0090 (서열번호 409) 및 CRE0096 (서열번호 417) 중 어느 하나일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 하나 이상의 프로모터 요소일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 하나 이상의 UTR 또는 인트론일 수 있다.
일 구체예에 있어서, 합성된 근육-특이적 프로모터는 표 A에 기재된 바와 같이, 프로모터 요소 또는 이의 기능적 변이체에 작동가능하게 연결된 CRE의 조합, 또는 이의 기능적 변이체 중 하나를 포함한다:
표 A
Figure pct00001
CRE는 바람직하게는 기재된 순서로 존재하고 바람직하게는 서로 인접한다. CRE는 연속적이거나 비연속적일 수 있다. 프로모터 요소는 CRE의 하류에 있으며 일반적으로 근위 CRE에 인접한다. 프로모터 요소는 인접 CRE와 연속하거나, 또는 스페이서에 의해 분리될 수 있다.
본 발명의 일 구체예에 있어서, 합성된 근육-특이적 프로모터는 하기로 이루어진 그룹에서 선택된 프로모터, 또는 이들 중 어느 하나의 기능적 변이체를 포함한다: SP0160, SP0159, SP0057, SP0156, SP0173, SP0134, SP0147, SP0066, SP0158, SP0068, SP0164, SP0042, SP0149, SP0148, SP0132, SP0136, SP0153, SP0155, SP0051 및 SP0154. 적절하게는 임의의 상기 프로모터의 기능적 변이체는 참조 합성된 근육-특이적 프로모터와 적어도 70% 동일, 보다 바람직하게는 참조 합성된 근육-특이적 프로모터와 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다.
본 발명의 다른 측면은, 하기로 이루어진 그룹에서 선택되는 2개 이상의 작동가능하게 연결된 프로모터 요소를 포함하는 합성된 근육-특이적 프로모터를 제공한다:
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체;
- SKM_18 (서열번호 135) 또는 이의 기능적 변이체;
- CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체;
- CRE0049 (서열번호 278) 또는 이의 기능적 변이체;
- CRE0048 (서열번호 277) 또는 이의 기능적 변이체;
- CRE0011 (서열번호 291) 또는 이의 기능적 변이체;
- SKM_14 (서열번호 287) 또는 이의 기능적 변이체; 및
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
일 구체예에 있어서, 상기 합성된 근육-특이적 프로모터는 골격 및 심장 근육에서 활성이다. 하기에서 더 자세히 논의하는 바와 같이, CRE0037 (서열번호 275) 또는 이의 기능적 변이체, CRE0070 (서열번호 284) 또는 이의 기능적 변이체, SKM_18 (서열번호 135) 또는 이의 기능적 변이체, CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체, CRE0049 (서열번호 278) 또는 이의 기능적 변이체, CRE0048 (서열번호 277) 또는 이의 기능적 변이체, CRE0011 (서열번호 291) 또는 이의 기능적 변이체, SKM_14 (서열번호 287) 또는 이의 기능적 변이체, 및 CRE0046 (서열번호 276) 또는 이의 기능적 변이체에서 선택되는 적어도 두 개의 프로모터 요소의 조합은 골격 및 심장 근육 모두에서 높은 수준의 근육-특이적 활성을 제공하는 것을 확인하였다.
일 구체예에 있어서, 2개의 프로모터 요소는 서로 인접한다. 프로모터 요소는 인접한 프로모터 요소와 연속되거나, 또는 스페이서에 의해 분리될 수 있다. 일 구체예에 있어서, 2개의 프로모터 요소는 하나 이상의 CRE와 같은 다른 조절 요소에 의해 분리된다.
일 구체예에 있어서, 합성된 근육-특이적 프로모터는 상기 기재된 프로모터 요소에 추가하여 하나 이상의 조절 요소를 포함한다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 CRE 또는 다른 CRE일 수 있다. 일 구체예에 있어서, CRE는 CRE0035일 수 있다. 일 실시에에 있어서, 추가의 CRE는 CRE0033 (서열번호 309), CRE0090 (서열번호 409) 및 CRE0096 (서열번호 417) 중 어느 하나일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 프로모터 요소 또는 다른 프로모터 요소일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 UTR 또는 인트론 또는 다른 UTR 또는 인트론일 수 있다.
일 구체예에 있어서, 합성된 근육 특이적 프로모터는 표 B에 기재된 바와 같은 프로모터 요소의 조합 중 하나, 또는 이의 기능적 변이체를 포함한다:
표 B
Figure pct00002
프로모터 요소는 바람직하게는 기재된 순서로 존재한다. 일 구체예에 있어서, 2개의 프로모터 요소는 서로 인접한다. 프로모터 요소는 인접 프로모터 요소와 연속되거나, 또는 스페이서에 의해 분리될 수 있다. 일 구체예에 있어서, 2개의 프로모터 요소는 하나 이상의 CRE와 같은 다른 조절 요소에 의해 분리된다.
본 발명의 일 구체예에 있어서, 상기 합성된 골격 근육-특이적 프로모터는 SP0173 및 SP0171로 이루어진 그룹에서 선택된 프로모터, 또는 이들 중 어느 하나의 기능적 변이체를 포함한다. 적절하게는 임의의 상기 프로모터의 기능적 변이체는 참조 합성된 골격 근육-특이적 프로모터와 적어도 70% 동일, 보다 바람직하게는 참조 합성된 골격 근육-특이적 프로모터와 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다.
본 발명의 다른 측면은, 하기로 이루어진 그룹으로부터 선택된 2개 이상의 작동가능하게 연결된 CRE를 포함하는 합성된 골격 근육-특이적 CRM을 제공한다:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0050 (서열번호 313) 또는 이의 기능적 변이체;
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체;
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체;
- CRE0047 (서열번호 312) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체; 및
- DES_MT_enhancer_48bp(서열번호 547) 또는 이의 기능적 변이체.
일 구체예에 있어서, 상기 합성된 골격 근육-특이적 CRM은 골격 근육에서 우세하게 활성이다. 일 구체예에 있어서 합성 골격 근육-특이적 CRM은 상기 CRE 중 3개 이상, 4개 이상 또는 5개 이상을 포함한다. 하기에서 더 자세히 논의되는 바와 같이, 이러한 CRE는 골격 근육-특이적 프로모터에 존재하는 CRM의 활성 및 골격 근육-특이적 프로모터의 활성에 기여하는 것이 확인되었다.
일 구체예에 있어서, 본 발명의 합성된 골격 근육-특이적 CRM은 하기로 이루어진 그룹에서 선택된 CRE의 조합, 또는 이의 기능적 변이체를 포함한다:
CRE0035 및 CRE0050; CRE0035 및 CRE0020; CRE0035 및 CRE0031; CRE0035 및 CRE0047; CRE0035 및 CRE0071; CRE0035 및 DES_MT_enhancer_48bp; CRE0050 및 CRE0020; CRE0050 및 CRE0031; CRE0050 및 CRE0047; CRE0050 및 CRE0071; CRE0050 및 DES_MT_enhancer_48bp; CRE0020 및 CRE0031; CRE0047 및 CRE0020; CRE0020 및 CRE0071; CRE0020 및 DES_MT_enhancer_48bp; CRE0031 및 CRE0047; CRE0031 및 CRE0071; CRE0031 및 DES_MT_enhancer_48bp; CRE0047 및 CRE0071; CRE0047 및 DES_MT_enhancer_48bp; 및 CRE0035 및 DES_MT_enhancer_48bp 및 DES_MT_enhancer_48bp.
본 명세서에 개시된 CRE의 조합 또는 이의 기능적 변이체의 어느 하나에서, 기재된 CRE는 임의의 순서로 존재할 수 있다. 바람직한 일 구체예에 있어서, 상기 CRE는 기재된 순서로 존재한다(즉, 작동가능하게 연결된 프로모터 요소 또는 유전자에 대한 위치를 참조하여, 상류에서 하류 순서로).
본 명세서에 개시된 CRE의 조합 또는 이의 기능적 변이체의 어느 하나에서, 일부 또는 전부의 기재된 CRE는 적절하게는 CRM에서 서로 인접하여 위치하는 것일 수 있다(즉, 끼어든 어느 CRE 또는 다른 조절 요소 없이). 상기 CRE는 연속적 또는 비연속적일 수 있다(즉, 서로 바로 인접하게 위치하거나 스페이서 또는 다른 시퀀스에 의해 분리될 수 있음). 바람직한 일 구체예에 있어서, 상기 CRE, 또는 이의 기능적 변이체는 기재된 순서대로 제공되고 서로 인접한다. 예를 들어, 합성된 근육-특이적 CRM은 CRE0071의 바로 상류에 있는 CRE0020 등을 포함할 수 있다. 상기 CRE는 연속적 또는 비연속적일 수 있다. 일 실시예에 있어서, 상기 CRE의 일부 또는 전부는 연속적인 것이 바람직하다.
상기 언급한 CRE의 조합을 포함하는 CRM은 적절한 프로모터 요소와 조합할 때 골격 근육에서 현저한 골격 근육-특이적 인핸서 활성을 제공하는 것이 확인되었다. 특히 CRE가 하기에 기재된 순서대로 서로 인접해 있을 때 높은 수준의 활성이 관찰되었다:
- CRE0035, DES_MT_enhancer_48bp 및 DES_MT_enhancer_48bp;
- CRE0035 및 CRE0031;
- CRE0035 및 CRE0020;
- CRE0047 및 CRE0020;
- CRE0020 및 CRE0071; 및
- CRE0035 및 CRE0031;
따라서, 이들은 골격 근육에서 높은 수준의 골격 근육-특이적 프로모터 활성과 일반적으로 연관성이 있는, 일부의 바람직한 CRE '모티프'를 나타낸다.
본 발명의 바람직한 일 구체예에 있어서, 상기 합성된 골격 근육-특이적 CRM은 하기로 이루어진 그룹에서 선택된 CRE의 조합, 또는 이의 기능적 변이체를 포함한다:
- CRE0035, DES_MT_enhancer_48 bp 및 DES_MT_enhancer_48 bp(즉, SP0155 유래 CRE);
- CRE0035 및 CRE0031 (즉, SP0160 유래 CRE);
- CRE0035 및 CRE0020 (즉, SP0156 유래 CRE);
- CRE0047 및 CRE0020 (즉, SP0164 유래 CRE);
- CRE0020 및 CRE0071 (즉, SP0134 유래 CRE); 및
- CRE0035 및 CRE0031 (즉, SP0163 유래 CRE).
본 발명의 일 구체예에 있어서, 상기 합성된 골격 근육-특이적 CRM은 CRM_SP0155 (서열번호 168), CRM_SP0160 (서열번호 173), CRM_SP0156 (서열번호 169), CRM_SP0164 (서열번호 177), CRM_SP0134 (서열번호 161) 및 CRM_SP0163 (서열번호 176)으로 이루어진 그룹에서 선택된 CRM, 또는 이들 중 어느 하나의 기능적 변이체를 포함한다. 적절하게는, 임의의 상기 CRM의 기능적 변이체는 참조 합성된 골격 근육-특이적 CRM과 적어도 70% 동일, 더 바람직하게는 참조 합성된 근육-특이적 CRM과 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다.
일 구체예에 있어서, 본 발명에 따른 골격 근육-특이적 CRM은 프로모터 요소에 작동가능하게 연결되어 합성된 골격 근육-특이적 프로모터를 형성한다. 본 발명의 일 구체예에 있어서, 합성된 골격 근육-특이적 프로모터는 SP0155, SP0160, SP0156, SP0164, SP0134 및 SP0163으로 이루어진 그룹에서 선택된 프로모터를 포함한다. 적절하게는 임의의 상기 프로모터의 기능적 변이체는 참조 합성된 골격 근육-특이적 프로모터와 적어도 70% 동일, 더 바람직하게는 참조 합성된 골격 근육-특이적 프로모터와 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다. 본 발명에 따른 골격 근육-특이적 CRM은 프로모터 요소에 작동가능하게 연결된 경우에 또한 심장 근육에서 활성일 수 있다.
본 발명의 다른 측면은, 하기를 포함하는 합성된 골격 근육-특이적 프모로터를 제공한다:
하기로 이루어진 그룹에서 선택된 두개 이상의 작동가능하게 연결된 CRE를 포함하는 CRM으로서:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0050 (서열번호 313) 또는 이의 기능적 변이체;
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체;
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체;
- CRE0047 (서열번호 312) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체; 및
- DES_MT_enhancer_48bp(서열번호 547) 또는 이의 기능적 변이체
하기로 이루어진 그룹에서 선택된 프로모터 요소에 작동가능하게 연결된 CRM:
- CRE0049 (서열번호 278) 또는 이의 기능적 변이체;
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- SKM_14 (서열번호 287) 또는 이의 기능적 변이체;
- CRE0048 (서열번호 277) 또는 이의 기능적 변이체;
- CRE0011_RSV(서열번호 291) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체; 및
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
본 발명의 다른 측면은, 하기를 포함하는 합성된 골격 근육-특이적 프로모터를 제공한다:
하기로 이루어진 그룹의 적어도 하나의 CRE로서:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0050 (서열번호 313) 또는 이의 기능적 변이체;
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체;
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체;
- CRE0047 (서열번호 312) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체; 및
- DES_MT_enhancer_48bp(서열번호 547) 또는 이의 기능적 변이체
하기로 이루어진 그룹에서 선택된 프로모터 요소에 작동가능하게 연결된 것인 CRE:
- CRE0049 (서열번호 278) 또는 이의 기능적 변이체;
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- SKM_14 (서열번호 287) 또는 이의 기능적 변이체;
- CRE0048 (서열번호 277) 또는 이의 기능적 변이체;
- CRE0011_RSV(서열번호 291) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체; 및
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
일 구체예에 있어서, 합성된 골격 근육-특이적 프로모터는 골격 근육에서 우세하게 활성이다. 일 구체예에 있어서, 합성된 골격 근육-특이적 프로모터는 기재된 프로모터 요소에 작동가능하게 연결된, 적어도 2개의 기재된 CRE, 또는 이의 기능적 변이체를 포함한다.
하기에서 더 자세히 논의되는 바와 같이, CRE0035 (서열번호 310) 또는 이의 기능적 변이체, CRE0050 (서열번호 313) 또는 이의 기능적 변이체, CRE0020 (서열번호 303) 또는 이의 기능적 변이체, CRE0031 (서열번호 308) 또는 이의 기능적 변이체, CRE0047 (서열번호 312) 또는 이의 기능적 변이체, CRE0071 (서열번호 321) 또는 이의 기능적 변이체, 및 DES_MT_enhancer_48bp(서열번호 547) 또는 이의 기능적 변이체에서 선택되는 적어도 하나의 CRE, 및 CRE0049 (서열번호 278) 또는 이의 기능적 변이체, CRE0037 (서열번호 275) 또는 이의 기능적 변이체, SKM_14 (서열번호 287) 또는 이의 기능적 변이체, CRE0048 (서열번호 277) 또는 이의 기능적 변이체, CRE0011_RSV(서열번호 291) 또는 이의 기능적 변이체, CRE0070 (서열번호 284) 또는 이의 기능적 변이체; 및 CRE0046 (서열번호 276) 또는 이의 기능적 변이체로부터 선택되는 적어도 하나의 프로모터 요소의 조합이 골격 근육에서 높은 수준의 골격 근육-특이적 활성을 제공하는 것을 확인하였다.
일 구체예에 있어서, 상기 프로모터 요소는 CRE의 하류에 있으며, 일반적으로 근위 CRE에 인접한다. 상기 프로모터 요소는 인접 CRE와 연속되거나, 또는 스페이서에 의해 분리될 수 있다.
일 구체예에 있어서, 합성된 골격 근육-특이적 프로모터는 상기 기재된 CRE 및/또는 프로모터 요소에 추가하여 하나 이상의 조절 요소를 포함한다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 다른 CRE 또는 그밖의 CRE일 수 있다. 일 구체예에 있어서, 하나 이상의 CRE는 CRE0036 및 CRE0029에서 선택될 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 프로모터 요소 또는 그밖의 프로모터 요소일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 UTR 또는 인트론 또는 그밖의 UTR 또는 인트론일 수 있다. 일 구체예에 있어서, 하나 이상의 UTR 또는 인트론은 HBB 인트론일 수 있다.
일 구체예에 있어서, 합성된 골격 근육-특이적 프로모터는 표 C에 기재된 바와 같이, 프로모터 요소 또는 이의 기능적 변이체에 작동가능하게 연결된 CRE의 조합, 또는 이의 기능적 변이체 중 하나를 포함한다:
표 C
Figure pct00003
상기 CRE은 바람직하게는 기재된 순서로 존재하고 바람직하게는 서로 인접한다. CRE는 연속적 또는 비연속적일 수 있다. 프로모터 요소는 CRE의 하류에 있으며 일반적으로 근위 CRE에 인접한다. 프로모터 요소는 인접 CRE와 연속되거나, 또는 스페이서에 의해 분리될 수 있다.
본 발명의 일 구체예에 있어서, 상기 합성된 골격 근육-특이적 프로모터는 SP0155, SP0160, SP0156, SP0159, SP0164, SP0057, SP0158, SP0134, SP0146, SP0147, SP0148, SP0149, SP0165, SP0153, SP0051, SP0154로 이루어진 그룹에서 선택된 프로모터, 또는 이들 중 어느 하나의 기능적 변이체를 포함한다. 적절하게는 임의의 상기 프로모터의 기능적 변이체는 참조 합성된 골격 근육-특이적 프로모터와 적어도 70% 동일, 보다 바람직하게는 참조 합성된 골격 근육-특이적 프로모터와 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다. 일 구체예에 있어서, 상기 합성된 골격 근육-특이적 프로모터는 또한 심장 근육에서 활성일 수 있다.
본 발명의 다른 측면은, 하기로 이루어진 그룹에서 선택된 2개 이상의 작동가능하게 연결된 시스-조절 요소(cis-regulatory element, CRE)를 포함하는 합성된 심장 근육-특이적 시스-조절 모듈(cis-regulatory module, CRM)을 제공한다:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
- CRE0069 (서열번호 320) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
- CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
- CRE0096 (서열번호 417) 또는 이의 기능적 변이체;
- CRE0079 (서열번호 329) 또는 이의 기능적 변이체;
- CRE0051 (서열번호 314) 또는 이의 기능적 변이체;
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체; 및
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체;
일 구체예에 있어서, 상기 합성된 심장 근육-특이적 CRM은 심장 근육에서 우세하게 활성이다. 일 구체예에 있어서 합성된 심장 근육-특이적 CRM은 상기 CRE 중 3개 이상, 4개 이상 또는 5개 이상을 포함한다. 하기에서 더 자세히 논의되는 바와 같이, 이러한 CRE는 심장 근육-특이적 프로모터에 존재하는 CRM의 활성 및 심장 근육-특이적 프로모터의 활성에 기여하는 것이 확인되었다.
일 구체예에 있어서, 본 발명의 합성된 심장 근육-특이적 CRM은 하기로 이루어진 그룹에서 선택된 CRE의 조합 또는 이의 기능적 변이체를 포함한다:
- CRE0035 및 CRE0029; CRE0035 및 CRE0069; CRE0035 및 CRE0071; CRE0035 및 CRE0036; CRE0035 및 CRE0096; CRE0035 및 CRE0079; CRE0035 및 CRE0051; CRE0035 및 CRE0031; CRE0035 및 CRE0020; CRE0029 및 CRE0069; CRE0029 및 CRE0071; CRE0029 및 CRE0036; CRE0029 및 CRE0096; CRE0029 및 CRE0079; CRE0029 및 CRE0051; CRE0029 및 CRE0031; CRE0029 및 CRE0020; CRE0069 및 CRE0071; CRE0069 및 CRE0036; CRE0069 및 CRE0096; CRE0069 및 CRE0079; CRE0069 및 CRE0051; CRE0069 및 CRE0031; CRE0069 및 CRE0020; CRE0071 및 CRE0036; CRE0071 및 CRE0096; CRE0071 및 CRE0079; CRE0071 및 CRE0051; CRE0071 및 CRE0031; CRE0071 및 CRE0020; CRE0036 및 CRE0096; CRE0036 및 CRE0079; CRE0036 및 CRE0051; CRE0036 및 CRE0031; CRE0036 및 CRE0020; CRE0096 및 CRE0079; CRE0096 및 CRE0051; CRE0096 및 CRE0031; CRE0096 및 CRE0020; CRE0079 및 CRE0051; CRE0079 및 CRE0031; CRE0079 및 CRE0020; CRE0051 및 CRE0031; CRE0051 및 CRE0020; CRE0031 및 CRE0020; CRE0020, CRE0029 및 CRE0071; CRE0020, CRE0069 및 CRE0071; CRE0029, CRE0035 및 CRE0071;CRE0020, CRE0020 및 CRE0071; CRE0020 및 CRE0071; CRE0079 및 CRE0071; CRE0035 및 CRE0035; CRE0079 및 CRE0035; CRE0020 및 CRE0036; CRE0069 및 CRE0035; CRE0071 및 CRE0035; CRE0029 및 CRE0035; 및 CRE0020 및 CRE0035.
본 명세서에 개시된 CRE의 조합, 또는 이의 기능적 변이체의 어느 하나에서, 기재된 CRE는 임의의 순서로 존재할 수 있다. 바람직한 일 구체예에 있어서, 상기 CRE는 기재된 순서로 존재한다(즉, 작동가능하게 연결된 프로모터 요소 또는 유전자에 대한 위치를 참조하여, 상류에서 하류 순서로).
본 명세서에 개시된 CRE의 조합, 또는 이의 기능적 변이체의 어느 하나에서, 일부 또는 전부의 기재된 CRE는 적절하게는 CRM에서 서로 인접하여 위치하는 것일 수 있다(즉, 끼어든 어느 CRE 또는 다른 조절 요소 없이). 상기 CRE는 연속적 또는 비연속적일 수 있다(즉, 서로 바로 인접하게 위치하거나 또는 스페이서 또는 다른 서열에 의해 분리될 수 있음). 바람직한 일 구체예에 있어서, 상기 CRE, 또는 이의 기능적 변이체는 기재된 순서대로 제공되고 서로 인접한다. 예를 들어, 합성된 근육-특이적 CRM은 CRE0071의 바로 상류에 있는 CRE0069 등을 포함할 수 있다. 상기 CRE는 연속적 또는 비연속적일 수 있다. 일 실시예에 있어서, 상기 CRE의 일부 또는 전부는 연속적인 것이 바람직하다.
상기 언급한 CRE 조합을 포함하는 CRM은 적절한 프로모터 요소와 조합할 때 우세하게 심장 근육에서 현저한 심장 근육-특이적 인핸서 활성을 제공하는 것이 확인되었다. 특히 CRE가 하기와 같이 기재된 순서대로 서로 인접해 있을 때 높은 수준의 활성이 관찰되었다: CRE0020, CRE0029 및 CRE0071; CRE0020, CRE0069 및 CRE0071; CRE0029, CRE0035 및 CRE0071; CRE0020, CRE0020 및 CRE0071; CRE0020 및 CRE0071; CRE0079 및 CRE0071; CRE0035 및 CRE0071; CRE0029 및 CRE0071; CRE0035 및 CRE0036; CRE0069 및 CRE0051; CRE0069 및 CRE0071; CRE0035 및 CRE0031; CRE0035 및 CRE0035; CRE0079 및 CRE0035; CRE0020 및 CRE0036; CRE0069 및 CRE0035; CRE0029 및 CRE0071; CRE0071 및 CRE0035; CRE0035 및 CRE0020; CRE0029 및 CRE0035; CRE0035 및 CRE0036; CRE0020 및 CRE0035; 및 CRE0071 및 CRE0020.
따라서, 이들은 높은 수준의 심장 근육-특이적 프로모터 활성과 일반적으로 연관성이 있는, 일부의 바람직한 CRE '모티프'를 나타낸다.
본 발명의 바람직한 일 구체예에 있어서, 상기 합성된 근육-특이적 CRM은 하기로 이루어진 그룹으로부터 선택된 CRE의 조합, 또는 이의 기능적 변이체를 포함한다:
- CRE0020, CRE0029 및 CRE0071 (즉, SP0229, SP0228, SP0229A 유래 CRE);
- CRE0020, CRE0069 및 CRE0071 (즉, SP0328 유래 CRE);
- CRE0029, CRE0035 및 CRE0071 (즉, SP0349 유래 CRE);
- CRE0020, CRE0020 및 CRE0071 (즉, SP0230 유래 CRE);
- CRE0020 및 CRE0071 (즉, SP0279, SP0134, SP0345, SP0231, SP0453, SP0459, SP0458 및 SP0463 유래 CRE);
- CRE0079 및 CRE0071 (즉, SP0366 유래 CRE);
- CRE0035 및 CRE0071 (즉, SP0467, SP0332, SP0232 유래 CRE);
- CRE0029 및 CRE0071 (즉, SP0057 유래 CRE);
- CRE0035 및 CRE0036 (즉, SP0159 유래 CRE);
- CRE0069 및 CRE0051 (즉, SP0322 유래 CRE);
- CRE0069 및 CRE0071 (즉, SP0327, SP0346 유래 CRE);
- CRE0035 및 CRE0031 (즉, SP0160, SP0163 유래 CRE);
- CRE0035 및 CRE0035 (즉, SPO309 유래 CRE);
- CRE0079 및 CRE0035 (즉, SPO368 유래 CRE);
- CRE0020 및 CRE0036 (즉, SP0158, SP0161 유래 CRE);
- CRE0029 및 CRE0071 (즉, SP0364 유래 CRE);
- CRE0071 및 CRE0035 (즉, SP0468 유래 CRE);
- CRE0035 및 CRE0020 (즉, SP0156 유래 CRE);
- CRE0029 및 CRE0035 (즉, SP0306 유래 CRE);
- CRE0035 및 CRE0036 (즉, SP0162 유래 CRE);
- CRE0020 및 CRE0035 (즉, SP0307 유래 CRE); 및
- CRE0071 및 CRE0020 (즉, SP0471, SP0464, SP0465 유래 CRE).
일 구체예에 있어서, 합성된 심장 근육-특이적 CRM은 상기 기재된 CRE 외에 하나 이상의 조절 요소를 포함한다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 다른 CRE 또는 그밖의 CRE일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 CRE는 하기의 CRE에서 선택된다: DES_MT_enhancer_72bp 및 CRE0055. 일 구체예에 있어서, 추가 CRE은 CRE0033 (서열번호 309) 및 CRE0090 (서열번호 409) 중 어느 하나일 수 있다. 본 발명의 바람직한 일 구체예에 있어서, 합성된 근육-특이적 CRM은 하기로 이루어진 그룹으로부터 선택된 CRE의 조합, 또는 이의 기능적 변이체를 포함한다:
CRE0020, DES_MT_enhancer_72bp 및 CRE0071; 및 CRE0069, CRE0035 및 CRE0055.
본 발명의 일 구체예에 있어서, 합성된 심장 근육-특이적 CRM은 하기로 이루어진 그룹에서 선택된 CRM, 또는 이들 중 어느 하나의 기능적 변이체를 포함한다: CRM_SP0229 (서열번호 185), CRM_SP0228 (서열번호 184), CRM_SP0328 (서열번호 217), CRM_SP0229A (서열번호 549), CRM_SP0349 (서열번호 236), CRM_SP0230 (서열번호 186), CRM_SP0279 (서열번호 198), CRM_SP0366 (서열번호 251), CRM_SP0467 (서열번호 527), CRM_SP0332 (서열번호 221), CRM_SP0057 (서열번호 145), CRM_SP0159 (서열번호 172), CRM_SP0134 (서열번호 161), CRM_SP0322 (서열번호 211), CRM_SP0327 (서열번호 216), CRM_SP0345 (서열번호 232), CRM_SP0160 (서열번호 173), CRM_SP0350 (서열번호 237), CRM_SP0346 (서열번호 233), CRM_SP0231 (서열번호 187), CRM_SP0309 (서열번호 202), CRM_SP0368 (서열번호 253), CRM_SP0158 (서열번호 171), CRM_SP0338 (서열번호 226), CRM_SP0364 (서열번호 249), CRM_SP0468 (서열번호 528), CRM_SP0232 (서열번호 188), CRM_SP0156 (서열번호 169), CRM_SP0306 (서열번호 200), CRM_SP0453 (서열번호 514), CRM_SP0459 (서열번호 520), CRM_SP0163 (서열번호 176), CRM_SP0162 (서열번호 175), CRM_SP0307 (서열번호 201), CRM_SP0471 (서열번호 530), CRM_SP0458 (서열번호 519), CRM_SP0161 (서열번호 174), CRM_SP0464 (서열번호 524), CRM_SP0463 (서열번호 523), CRM_SP0465 (서열번호 525). 적절하게는, 임의의 상기 CRM의 기능적 변이체는 참조 합성된 근육-특이적 CRM과 적어도 70% 동일한 서열, 보다 바람직하게는 참조 합성된 근육-특이적 CRM과 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다.
일 구체예에 있어서, 본 발명에 따른 심장 근육-특이적 CRM은 프로모터 요소에 작동가능하게 연결되어, 합성된 심장 근육-특이적 프로모터를 형성한다. 본 발명의 일 구체예에 있어서, 합성된 심장 근육-특이적 프로모터는 SP0229, SP0228, SP0328, SP0229A, SP0349, SP0230, SP0279, SP0366, SP0467, SP0332, SP0057, SP0159, SP0134, SP0322, SP0327, SP0345, SP0160, SP0350, SP0346, SP0231, SP0309, SP0368, SP0158, SP0338, SP0364, SP0468, SP0232, SP0156, SP0306, SP0453 SP0459, SP0163, SP0162, SP0307, SP0471, SP0458, SP0161, SP0464, SP0463, SP0465로 이루어지는 그룹에서 선택된 프로모터를 포함한다. 적절하게는 임의의 상기 프로모터의 기능적 변이체는 참조 합성된 심장 근육-특이적 프로모터와 적어도 70% 동일한 서열, 보다 바람직하게는 참조 합성된 심장 근육-특이적 프로모터과 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다. 일 구체예에 있어서, 본 발명에 따른 심장 근육-특이적 CRM은 프로모터 요소에 작동가능하게 연결될 때 또한 골격 근육에서 활성일 수 있다.
일 구체예에 있어서, 본 발명에 따른 심장 근육-특이적 CRM을 포함하는 합성된 심장 근육-특이적 프로모터는 표 D에 자세히 나타낸 바와 같은 CRE 및 프로모터 요소의 다음의 조합을 포함한다:
표 D
Figure pct00004
본 발명의 다른 측면은, 하기를 포함하는 합성된 심장 근육-특이적 프모로터를 제공한다:
하기로 이루어진 그룹에서 선택된 두개 이상의 작동가능하게 연결된 CRE를 포함하는 CRM으로서:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
- CRE0069 (서열번호 320) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
- CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
- CRE0096 (서열번호 417) 또는 이의 기능적 변이체;
- CRE0079 (서열번호 329) 또는 이의 기능적 변이체;
- CRE0051 (서열번호 314) 또는 이의 기능적 변이체;
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체; 및
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체
하기로 이루어진 그룹에서 선택된 프로모터 요소에 작동가능하게 연결된 것인 CRM:
- SKM_18 (서열번호 135) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체;
- CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체;
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체; 및
- Des_mp_V1 (서열번호 292) 또는 이의 기능적 변이체.
본 발명의 다른 측면은, 하기를 포함하는 합성된 심장 근육-특이적 프로모터를 제공한다:
하기로 이루어진 그룹에서 선택된 적어도 하나의 CRE로서:
- CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
- CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
- CRE0069 (서열번호 320) 또는 이의 기능적 변이체;
- CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
- CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
- CRE0096 (서열번호 417) 또는 이의 기능적 변이체;
- CRE0079 (서열번호 329) 또는 이의 기능적 변이체;
- CRE0051 (서열번호 314) 또는 이의 기능적 변이체;
- CRE0031 (서열번호 308) 또는 이의 기능적 변이체; 및
- CRE0020 (서열번호 303) 또는 이의 기능적 변이체
하기로 이루어진 그룹에서 선택된 프로모터 요소에 작동가능하게 연결된 것인 CRE:
- SKM_18 (서열번호 135) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체;
- CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체;
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체; 및
- Des_mp_V1 (서열번호 292) 또는 이의 기능적 변이체.
일 구체예에 있어서, 합성된 심장 근육-특이적 프로모터는 심장 근육에서 우세하게 활성이다. 일 구체예에 있어서, 합성된 심장 근육-특이적 프로모터는 기재된 프로모터 요소에 작동가능하게 연결된 적어도 2개의 기재된 CRE, 또는 이의 기능적 변이체를 포함한다.
하기에서 더 자세히 논의되는 바와 같이, CRE0035 (서열번호 310) 또는 이의 기능적 변이체, CRE0029 (서열번호 307) 또는 이의 기능적 변이체, CRE0069 (서열번호 320) 또는 이의 기능적 변이체, CRE0071 (서열번호 321) 또는 이의 기능적 변이체, CRE0036 (서열번호 311) 또는 이의 기능적 변이체, CRE0096 (서열번호 417) 또는 이의 기능적 변이체, CRE0079 (서열번호 329) 또는 이의 기능적 변이체, CRE0051 (서열번호 314) 또는 이의 기능적 변이체, CRE0031 (서열번호 308) 또는 이의 기능적 변이체 및 CRE0020 (서열번호 303) 또는 이의 기능적 변이체에서 선택되는 적어도 하나의 CRE, 및 SKM_18 (서열번호 135) 또는 이의 기능적 변이체, CRE0070 (서열번호 284) 또는 이의 기능적 변이체, CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체, CRE0037 (서열번호 275) 또는 이의 기능적 변이체, CRE0046 (서열번호 276) 또는 이의 기능적 변이체 및 Des_mp_V1 (서열번호 292) 또는 이의 기능적 변이체로부터 선택되는 적어도 하나의 프로모터 요소의 조합은 심장 근육에서 높은 수준의 근육-특이적 활성을 제공하는 것을 확인하였다.
일 구체예에 있어서, 상기 프로모터 요소는 CRE의 하류에 있으며, 일반적으로 근위 CRE에 인접한다. 상기 프로모터 요소는 인접 CRE와 연속되거나, 또는 스페이서에 의해 분리될 수 있다.
일 구체예에 있어서, 합성된 심장 근육-특이적 프로모터는 상기 기재된 CRE 및/또는 프로모터 요소에 추가하여 하나 이상의 조절 요소를 포함한다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 다른 CRE 또는 그밖의 CRE일 수 있다. 일 구체예에 있어서, 추가 CRE는 CRE0033, CRE0071.5, CRE0071.13, CRE0050, CRE0093.2, CRE0094.2, DES_MT_Enhancer_72bp_v3 (서열번호 338), Des_MT_enhancer_48bp (서열번호 547), CNTRL_001, CRE0094, DES_MT_Enhancer_72 bp_v4 (서열번호 339), CRE0093, CRE0094, CRE0071.19, CRE0071.5, 72bp random, DES_MT_enhancer_72bp에서 선택될 수 있다. 일 구체예에 있어서, 추가 CRE는 CRE0033 (서열번호 309) 및 CRE0090 (서열번호 409) 중 어느 하나일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 하나 이상의 프로모터 요소일 수 있다. 일 구체예에 있어서, 추가 프로모터 요소는 CRE0055일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 하나 이상의 UTR 또는 인트론일 수 있다. 일 구체예에 있어서, 하나 이상의 추가적인 UTR 또는 인트론은 CMV-IE 인트론일 수 있다.
일 구체예에 있어서, 합성된 심장 근육-특이적 프로모터는 하기 표 E에 기재된 바와 같이, 프로모터 요소 또는 이의 기능적 변이체에 작동가능하게 연결된 CRE의 조합, 또는 이의 기능적 변이체를 포함한다:
표 E
Figure pct00005
Figure pct00006
CRE는 바람직하게는 기재된 순서로 존재하고 바람직하게는 서로 인접한다. CRE는 연속적이거나 비연속적일 수 있다. 프로모터 요소는 CRE의 하류에 있으며 일반적으로 근위 CRE에 인접한다. 프로모터 요소는 인접 CRE와 연속하거나, 또는 스페이서에 의해 분리될 수 있다.
본 발명의 일 구체예에 있어서, 합성된 심장 근육-특이적 프로모터는 하기로 이루어진 그룹에서 선택된 프로모터, 또는 이들 중 어느 하나의 기능적 변이체를 포함한다: SP0326, SP0286, SP0451, SP0042, SP0362, SP0334, SP0343, SP0066, SP0440, SP0170, SP0347, SP0469, SP0068, SP0267, SP0132, SP0310, SP0365, SP0379, SP0339, SP0136, SP0325, SP0337, SP0270, SP0457, SP0268, SP0341, SP0378, SP0380, SP0262, SP0359, SP0455, SP0381, SP0441, SP0153, SP0442, SP0154, SP0155, SP0454, SP0456, SP0305, SP0382, SP0279, SP0320, SP0366, SP0467, SP0332, SP0057, SP0159, SP0134, SP0322, SP0257, SP0327, SP0345, SP0173, SP0160, SP0350, SP0346, SP0231, SP0309, SP0368, SP0158, SP0338, SP0364, SP0468, SP0232, SP0453, SP0340, SP0471, SP0229, SP0228, SP0328, SP0349, SP0230. 적절하게는 임의의 상기 프로모터의 기능적 변이체는 참조 합성된 심장 근육-특이적 프로모터와 적어도 70% 동일한 서열, 보다 바람직하게는 참조 합성된 심장 근육-특이적 프로모터와 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다. 일 구체예에 있어서, 심장 근육-특이적 프로모터는 또한 골격 근육에서도 활성일 수 있다.
본 발명의 다른 측면은, 하기로 이루어진 그룹으로부터 선택되는 2개 이상의 작동가능하게 연결된 프로모터 요소를 포함하는 합성된 심장 근육-특이적 프로모터를 제공한다:
- SKM_18 (서열번호 135) 또는 이의 기능적 변이체;
- CRE0070 (서열번호 284) 또는 이의 기능적 변이체;
- CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체;
- CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
- CRE0046 (서열번호 276) 또는 이의 기능적 변이체; 및
- Des_mp_V1 (서열번호 292) 또는 이의 기능적 변이체.
일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 심장 근육에서 우세하게 활성이다. 하기에서 더 자세히 논의하는 바와 같이, SKM_18 (서열번호 135) 또는 이의 기능적 변이체, CRE0070 (서열번호 284) 또는 이의 기능적 변이체, CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체, CRE0037 (서열번호 275) 또는 이의 기능적 변이체, CRE0046 (서열번호 276) 또는 이의 기능적 변이체, 및 Des_mp_V1 (서열번호 292) 또는 이의 기능적 변이체에서 선택되는 적어도 두 개의 프로모터 요소의 조합은 심장 근육에서 높은 수준의 심장 근육-특이적 활성을 제공하는 것을 확인하였다.
일 구체예에 있어서, 2개의 프로모터 요소는 서로 인접한다. 프로모터 요소는 인접한 프로모터 요소와 연속되거나, 또는 스페이서에 의해 분리될 수 있다. 일 구체예에 있어서, 2개의 프로모터 요소는 하나 이상의 CRE와 같은 다른 조절 요소에 의해 분리된다.
일 구체예에 있어서, 합성된 심장 근육-특이적 프로모터는 상기 기재된 프로모터 요소에 추가하여 하나 이상의 조절 요소를 포함한다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 CRE 또는 그밖의 CRE일 수 있다. 일 구체예에 있어서, CRE는 CRE0035일 수 있다. 일 구체예에 있어서, 추가의 CRE는 CRE0033 (서열번호 309), CRE0090 (서열번호 409) 및 CRE0096 (서열번호 417) 중 어느 하나일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 프로모터 요소 또는 그밖의 프로모터 요소일 수 있다. 일 구체예에 있어서, 하나 이상의 추가 조절 요소는 본 발명에 따른 하나 이상의 UTR 또는 인트론 또는 그밖의 UTR 또는 인트론일 수 있다. 일 구체예에 있어서, 하나 이상의 추가적인 UTR 또는 인트론은 CMV-IE 인트론일 수 있다.
일 구체예에 있어서, 합성된 심장 근육-특이적 프로모터는 하기 표 F에 기재된 바와 같은 프로모터 요소의 조합, 또는 이의 기능적 변이체 중 하나를 포함한다:
표 F
Figure pct00007
프로모터 요소는 바람직하게는 기재된 순서로 존재한다. 일 구체예에 있어서, 2개의 프로모터 요소는 서로 인접한다. 프로모터 요소는 인접 프로모터 요소와 연속되거나, 또는 스페이서에 의해 분리될 수 있다. 일 구체예에 있어서, 2개의 프로모터 요소는 하나 이상의 CRE와 같은 다른 조절 요소에 의해 분리된다.
본 발명의 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 SP0173, SP0171, SP0320, SP0257, SP0340으로 이루어진 그룹으로부터 선택된 프로모터, 또는 이들 중 어느 하나의 기능적 변이체를 포함한다. 적절하게는 임의의 상기 프로모터의 기능적 변이체는 참조 합성된 심장 근육-특이적 프로모터와 적어도 70% 동일한 서열, 보다 바람직하게는 참조 합성된 심장 근육-특이적 프로모터와 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다. 일 구체예에 있어서, 심장 근육-특이적 프로모터는 또한 골격 근육에서도 활성일 수 있다.
본 발명의 다른 측면은, 발현 산물을 코딩하는 서열, 적절하게는 유전자, 예를 들어 이식유전자(transgene)에 작동가능하게 연결된 본 발명의 어느 한 측면의 합성된 근육-특이적 프로모터, 심장 근육-특이적 프로모터 또는 골격 근육-특이적 프로모터를 포함하는 발현 카세트가 제공된다. 일 구체예에 있어서, 상기 발현 산물은 치료적 발현 산물이다.
상기 치료적 발현 산물은 심혈관 병증 또는 심장 질병 및 장애, 예를 들어 심부전 또는 CHF의 치료에 유용한 치료적 발현 산물일 수 있다. 상기 치료적 발현 산물은 근육에서의 발현을 이용할 수 있는 모든 병증의 치료에, 예를 들어 근육 병증의 치료 또는 근육으로부터 치료적 발현 산물의 분비가 바람직할 수 있는 병증의 치료에, 유용한 치료적 산물일 수 있다.
상기 치료적 발현 산물은 포스파타제 활성, 예를 들어, 제1형 포스파타제(type 1 phosphatase) 활성의 조절제(modulator)일 수 있다. 상기 조절제는 포스파타제 활성, 예를 들어, 제1형 포스파타제 활성을 억제하는 단백질일 수 있다. 상기 조절제는 전사 인자와 같은 포스파타제 활성을 억제하는 단백질을 코딩하는 내인성 핵산의 발현을 증가시키는 핵산일 수 있다. 상기 조절제는 포스파타제 활성을 억제하는 단백질을 코딩하는 내인성 핵산 내부 또는 근처에 통합되는 조절 서열일 수 있다. 상기 조절제는 siRNA와 같은 유전자 발현의 핵산 조절제를 제공할 수 있는 핵산일 수 있다.
상기 치료적 발현 산물은 단백질 포스페이트 1 (protein phosphate 1, PP1) 억제제, 예를 들어 I-1 폴리펩티드일 수 있다. 포스파타제 억제제-1 (또는 "I-1") 단백질은 제1형 포스파타제의 내인성 억제제이다. I-1의 수준 또는 활성을 증가시키는 것은 부전(failing)을 가진 인간 심근세포에서 β-아드레날린성 반응성을 회복시킬 수 있다. 적절하게는, 상기 I-1 단백질은 트레오닌 35가 아스파르트산 대신 글루탐산으로 대체된 I-1 단백질과 같이 구성적으로(constitutively) 활성일 수 있다. 상기 치료적 발현 산물은 하기에서 선택된 어느 하나 이상의 억제제일 수 있다: 포스파타제 억제제 2 (phosphatase inhibitor 2, PP2); 오카다산(okadaic acid) 또는 칼리쿨린(caliculin); 및 단백질 포스파타제 1의 내인성 핵 억제제인 니플(nippl).
상기 치료적 발현 산물은 제1형 포스파타제 억제제와 같이 심장 활성을 조절하는 임의의 단백질, 예를 들어 I-1 또는 근소포체(sacroplasmic reticulum) Ca2+ ATPase(SERCA), 예를 들어 SERCA1 (예를 들어, 1a 또는 1b), SERCA2 (예를 들어, 2a 또는 2b), 또는 SERCA3일 수 있다.
상기 치료적 발현 산물은 돌연변이 형태의 포스파타제 억제제-1 단백질을 코딩하는 핵산 서열일 수 있고, 여기서 상기 돌연변이 형태는 야생형에 있어서 PKC-α 인산화 부위 위치에 적어도 하나의 아미노산을 포함하고, 여기서 적어도 하나의 아미노산은 구성적으로(constitutively) 인산화되지 않거나 또는 돌연변이 형태에서 인산화되지 않은 상태를 모방하는 것이다. 상기 치료적 발현 산물은 아데닐릴 사이클라제 6 (adenylyl cyclase 6)(AC6, 아드네닐릴 사이클라제 VI라고도 함), S100A1, β-아드레날린 수용체 키나제-ct(β-adrenergic receptor kinase-ct, βARKct), sarco/소포체(sarco/endoplasmic reticulum, SR) Ca-ATPase(SERCA2a), IL-18, VEGF, VEGF 활성화제, 유로코르틴(urocortins), 및 B-세포 림프종 2-관련 안타노겐-3 (B-cell lymphoma 2 (bcl-2)-associated anthanogene-3, BAG3)일 수 있다.
상기 치료적 발현 산물은 IL-18 억제제와 같은 사이토카인의 억제제일 수 있다. 치료적 발현 산물은 심장 기능을 향상시키기 위해 베타-아드레날린성 신호 단백질(베타-ASP)(베타-아드레날린성 수용체(베타-Ars), G-단백질 수용체 키나제 억제제(GRK 억제제) 및 아데닐릴사이클라제(Acs) 포함)을 코딩할 수 있다.
상기 치료적 발현 산물은 혈관신생 단백질(angiogenic protein)일 수 있다. 상기 혈관신생 단백질은 혈관의 발달과 분화를 촉진한다. 혈관신생 단백질의 예시는 aFGF(FGF-1), bFGF(FGF-2), FGF-4 ("hst/KS3"으로도 알려짐), FGF-5 및 FGF-6와 같은 섬유아세포 성장인자(the fibroblast growth factor, FGF) 패밀리, 혈관 내피 성장 인자(vascular endothelial growth factor, VEGF) 패밀리, 혈소판 유래 성장 인자(platelet-derived growth factor, PDGF) 패밀리, 인슐린 유사 성장 인자(insulin-like growth factor, IGF) 패밀리 등의 구성원을 포함한다.
바람직한 일 구체예에 있어서, 상기 발현 카세트는 단백질 포스페이트 1 (protein phosphate 1, PP1)의 억제제에 작동가능하게 연결된 심장 근육-특이적 프로모터를 포함한다. 제1형 포스파타제는 PP1cα, PP1cβ, PP1cδ 및 PP1cγ를 포함하지만, 이에 제한되지 않는다.
다른 측면은, 본 발명에 따른 합성된 근육-특이적 프로모터 또는 발현 카세트를 포함하는 벡터를 제공한다. 일 구체예에 있어서, 상기 벡터는 발현 벡터이다. 일 실시예에 있어서, 상기 벡터는 바이러스 벡터이다. 일 구체예에 있어서, 상기 벡터는 유전자 요법 벡터, 적절하게는 AAV 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 또는 렌티바이러스 벡터이다. AAV 벡터는 특히 주요 관심에 있다. AAAV 벡터는 AAV2, AAV6, AAV8, AAV9, BNP116, rh10, AAV2.5, AAV2i8, AAVDJ8 및 AAV2G9로 이루어진 그룹에서 선택되거나, 또는 이의 유도체일 수 있다. AAV 혈청형 9 (AAV9)는 심장 및 골격 근육에서 효율적인 형질도입을 달성하는 것으로 알려져 있으며, 따라서 AAV9 및 이의 유도체는 적절한 AAV 벡터의 비제한적인 예시를 나타낸다. 일 구체예에 있어서, 상기 rAAV 벡터는 AAV3b 혈청형이고, AAV3b265D 비리온, AAV3b265D549A 비리온, AAV3b549A 비리온, AAV3bQ263Y 비리온, 또는 AAV3bSASTG 비리온(즉, Q263A/T265 돌연변이를 포함하는 AAV3b 캡시드를 포함하는 비리온)를 포함하나, 이에 제한되지 않는다. 일 구체예에 있어서, 비리온은 합리적 단배체(rational haploid), 키메라 또는 돌연변이체일 수 있고, 캡시드와 같은 경우 원하는 위치(예시로 심장)에서 증가된 출현(update)을 위해 제작(tailored)될 수 있다. 다른 캡시드는 AAV1, AAV3, AAV4, AAV5, AAV7, AAV10 등을 포함하는 임의의 공지된 AAV 혈청형의 캡시드를 포함할 수 있다. 일 구체예에 있어서, AAV 벡터는 AAV2i8이다.
본 발명에 따른 벡터는 심부전 치료를 위한 치료적 발현 산물을 코딩하는 핵산을 포함하는 AAV 벡터일 수 있으며, 여기서 핵산은 심장-특이적 프로모터에 작동가능하게 연결되어 있다.
다른 측면은, 본 발명에 따른 벡터, 적절하게는 바이러스 벡터를 포함하는 비리온(바이러스 입자)를 제공한다. 일 구체예에 있어서, 상기 비리온은 AAV 비리온이다. 적절한 비리온은 상기 기술한 바와 같다.
다른 측면은, 본 발명에 따른 합성된 근육-특이적 프로모터, 발현 카세트, 벡터 또는 비리온을 포함하는 약제학적 조성물을 제공한다.
다른 측면은, 치료, 즉, 의학적 병증 또는 질병의 예방 또는 치료에 이용하기 위한 본 발명에 따른 합성된 근육-특징적 프로모터, 발현 카세트, 벡터, 비리온 또는 약제학적 조성물을 제공한다. 적절하게는 이를 필요로 하는 개체의 치료에 이용한다. 적절하게는 상기 병증 또는 질병은 비정상적인 유전자 발현, 선택적으로는 근육 세포(근세포) 또는 조직에서의 비정상적인 유전자 발현과 관련성이 있다. 적절하게는 상기 병증 또는 질병은 심장 근육 세포 또는 심장 조직에서의 비정상적인 유전자 발현과 관련되어 있다. 적절하게는, 상기 병증 또는 질병은 골격 근육 또는 조직에서의 비정상적인 유전자 발현과 관련되어 있다. 적절하게는, 골격 및/또는 심장 근육에서 치료적 발현 산물의 발현에 이용하기 위한 본 발명에 따른 합성된 근육-특이적 프로모터, 발현 카세트, 벡터, 비리온 또는 약학 조성물을 제공한다.
일 구체예에 있어서, 상기 질병은 심혈관 병증 또는 심장 질병 및 장애일 수 있다. 일 구체예에 있어서, 상기 질병은 울혈성 심부전과 같은 심부전일 수 있다. 일 구체예에 있어서, 상기 질병은 허혈(ischemia), 부정맥(arrhythmia), 심근경색증(myocardial infarction, MI), 비정상 심장 수축(abnormal heart contractility), 비허혈성 심근병증(non-ischemic cardiomyopathy), 말초 동맥 폐쇄 질병(peripheral arterial occlusive disease), 및 비정상 Ca2+ 대사(abnormal Ca2+ metabolism), 및 이들의 조합으로부터 선택될 수 있다. 일 구체예에 있어서, 상기 질병은 하기의 그룹으로부터 선택될 수 있다: 울혈성 심부전(congestive heart failure), 심근병증(cardiomyopathy), 심근경색증, 조직 허혈(tissue ischemia), 심장 허혈(cardiac ischemia), 혈관 질환(vascular disease), 후천성 심장 질환(acquired heart disease), 선천성 심장 질환(congenital heart disease), 죽상동맥경화증(atherosclerosis), 기능장애성 전도 시스템(dysfunctional conduction systems), 기능장애성 관상동맥(dysfunctional coronary arteries), 폐심장 고혈압(pulmonary heart hypertension). 일 구체예에 있어서, 상기 질병은 울혈성 심부전, 관상동맥 질병(coronary artery disease), 심근경색증(myocardial infarction), 심근 허혈(myocardial ischemia), 동맥경화증(atherosclerosis), 심근병증(cardiomyopathy), 특발성 심근병증(idiopathic cardiomyopathy), 심부정맥(cardiac arrhythmias), 근이영양증(muscular dystrophy), 근육량 이상(muscle mass abnormality), 근육 변성(muscle degeneration), 감염성 심근염(infective myocarditis), 약물- 또는 독소-유도성 근육 이상(drug- or toxin-induced muscle abnormalities), 과민성 심근염(hypersensitivity myocarditis), 자가면역 심내막염(autoimmune endocarditis) 및 선천성 심장병(congenital heart disease). 적절하게는 상기 용도는 유전자 요법, 바람직하게는 비정상적인 유전자 발현을 포함하는 질병의 치료를 위한 것이다. 적절하게는 유전자 요법은 근육 세포 또는 조직, 적절하게는 심장 근육 세포 또는 심장 조직, 또는 적절하게는 골격 근육 세포 또는 조직에서 치료적 발현 산물의 발현과 관련된다.
적절하게는, 치료를 필요로 하는 개체는 심혈관 병증, 예를 들어, 상기에서 논의된 바와 같은 심장병 또는 심부전의 특징적인 증상을 나타낼 것이다. 상기 의학 용도는 일반적으로는 치료적 양의 치료적 발현 산물을 발현함으로써, 이를 필요로 하는 개체가 나타내는 증상을 개선하는 것을 포함한다. 일 구체예에 있어서, 상기 발현 카세트는 심장 근육-특이적 프로모터에 작동가능하게 연결된 PP1 억제제를 코딩하는 유전자를 포함한다. 적절하게는 상기 요법은 상기 대상체의 심장 조직에서 PP1 억제제의 치료량을 발현시키는 것을 포함한다. 적절하게는, 심장 조직에서 PP1 억제제의 치료적 양을 발현시키는 것은 개체의 심부전 또는 심장 장애의 증상을 감소시킨다. 적절하게는, 심장 조직에서 PP1 억제제의 치료적 양을 발현시키는 것은 심장 리모델링을 약화시키거나, 운동 능력을 개선하거나, 또는 심장 수축성을 개선할 수 있다. 적절하게는, 심장 조직에서 PP1 억제제의 치료적 양을 발현시키는 것은 근세포(myocyte) 단축, 이완을 위한 시간 상수의 저하, 및 칼슘 신호 감쇠(decay)의 가속화, 수축기말 압력 치수(end-systolic pressure dimension) 관계의 개선 및 이들의 조합을 야기할 수 있다.
다른 측면은, 본 발명의 합성된 근육-특이적 프로모터, 발현 카세트, 벡터, 또는 비리온을 포함하는 세포를 제공한다. 일 구체예에 있어서, 상기 세포는 진핵 세포, 선택적으로 포유동물 세포, 선택적으로 인간 세포이다. 적절하게는 상기 세포는 근육 세포일 수 있고, 선택적으로 상기 세포는 인간 근육 세포이다. 적절하게는 인간 골격 근육 세포 또는 인간 심장 근육 세포이다. 상기 합성된 근육-특이적 프로모터, 발현 카세트는 에피솜성이거나 또는 세포의 게놈에 있을 수 있다.
다른 측면은, 의학적 병증 또는 질병 치료용 약제학적 조성물의 제조에 이용하기 위한 상기 기술한 바와 같은 합성된 근육-특이적 CRM, 합성된 근육-특이적 프로모터, 발현 카세트, 벡터, 비리온 또는 약제학적 조성물을 제공한다.
다른 측면은, 본 발명의 합성된 근육-특이적 발현 카세트를 근육 세포에 제공하는 단계 및 합성된 근육-특이적 발현 카세트에 존재하는 유전자를 발현시키는 단계를 포함하는 발현 산물의 제조 방법을 제공한다. 상기 방법은 시험관 내(in vitro) 또는 생체 외(ex vivo)일 수 있거나, 또는 생체 내(in vivo)일 수 있다. 일 구체예에 있어서, 상기 방법은 바이오프로세싱 방법이다. 일 구체예에 있어서, 상기 근육 세포는 심장 근육 세포이다. 일 구체예에 있어서, 상기 근육 세포는 골격 근육 세포이다.
다른 측면은, 근육 세포에서 치료적 이식유전자를 발현시키는 방법으로서, 상기 방법은 근육 세포 내로 본 명세서에 기재된 바와 같은 합성된 근육-특이적 발현 카세트, 벡터 또는 비리온을 도입하는 단계를 포함하는 방법을 제공한다. 일 구체예에 있어서, 상기 근육 세포는 심장 근육 세포이다. 일 구체예에 있어서, 상기 근육 세포는 골격 근육 세포이다.
다른 측면은, 치료를 필요로 하는 개체, 바람직하게는 인간의 치료 방법을 제공하며, 상기 방법은 하기를 포함한다:
- 본 발명에 따른 프로모터에 작동가능하게 연결된 치료적 산물을 코딩하는 서열을 포함하는, 본 명세서에 기재된 바와 같은 발현 카세트, 벡터, 비리온 또는 약제학적 조성물을 개체에게 투여하는 단계; 및
- 상기 개체의 근육에서 치료적 양의 치료적 산물을 발현시키는 단계.
일 구체예에 있어서, 상기 근육 세포는 심장 근육 세포이다. 일 구체예에 있어서, 상기 근육 세포는 골격 근육 세포이다. 적절하게는, 개체의 치료 방법은 심장 및/또는 골격 근육에서 치료적 양의 치료적 산물의 발현을 포함한다.
일 구체예에 있어서, 상기 방법은 하기를 포함한다:
- 치료적 산물을 코딩하는 유전자를 포함하는, 본 명세서에 기재된 바와 같은 발현 카세트, 벡터, 비리온 또는 약제학적 조성물을 개체의 근육 내로 도입하는 단계; 및
- 상기 개체의 근육에서 치료적 양의 치료적 산물을 발현시키는 단계.
일 구체예에 있어서, 상기 근육 세포는 심장 근육 세포이다. 일 구체예에 있어서, 상기 근육 세포는 골격 근육 세포이다. 적절하게는, 상기 방법은 상기 개체의 심장 및/또는 골격 근육에서 치료적 양의 치료적 산물의 발현을 포함한다.
적절하게는 상기 방법은 본 명세서에 기재된 바와 같은 벡터, 비리온 또는 약제학적 조성물을 개체에게 투여하는 단계를 포함한다. 바람직한 일 구체예에 있어서 상기 벡터는 바이러스 유전자 치료 벡터, 바람직하게는 AAV 벡터이다.
본 발명의 추가 특징 및 구체예는 이제 다음 섹션에서 설명될 것이다. 임의의 섹션에 있는 임의의 특징 또는 구체예는 임의의 실행 가능한 조합으로 임의의 다른 특징 또는 구체예, 또는 본 발명의 임의의 측면과 결합될 수 있다.
복합 프로모터(composite promoter)
일 구체예에 있어서, 상기 기재된 바와 같은 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 프로모터는 하나 이상의 추가 조절 서열에 작동가능하게 연결된다. 추가 조절 서열은 예를 들어, 추가 조절 서열에 작동가능하게 연결되지 않은 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 프로모터와 비교하여 발현을 향상시킬 수 있다. 일반적으로, 추가 조절 서열은 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 프로모터의 특이도를 실질적으로 감소시키지 않는 것이 바람직하다.
예를 들어, 본 발명에 따른 합성 근육-특이적, 심장 근육-특이적 또는 골격근-특이적 프로모터는 UTR(예를 들어, 5' 및/또는 3' UTR), 및/또는 인트론, 또는 그러한 것들을 코딩하는 서열에 작동가능하게 연결될 수 있다.
일 구체예에 있어서, 상기 합성된 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 프로모터는 UTR, 예를 들어 5' UTR을 코딩하는 서열에 작동가능하게 연결된다. 5' UTR은 유전자 발현을 조절할 수 있는 다양한 요소를 함유할 수 있다. 천연 유전자의 5' UTR은 전사 시작 부위에서 시작하여 코딩 영역의 시작 코돈 전 1 뉴클레오타이드에서 종료한다. 본 명세서에서 언급된 5' UTR은 전체 자연 발생 5' UTR일 수 있거나 또는 자연 발생 5' UTR의 일부일 수 있다는 점에 유의해야 한다. 5' UTR은 부분적으로 또는 전체적으로 합성될 수 있다. 진핵생물에서, 5' UTR은 약 150개 뉴클레오티드의 중앙값 길이를 갖지만, 경우에 따라 상당히 길 수도 있다. 5' UTR에서 찾을 수 있는 조절 서열에서는 다음이 포함되지만 이에 제한되지는 않는다:
- mRNA의 안정성 또는 번역에 영향을 줄 수 있는 단백질의 결합 부위;
- 리보스위치(Riboswitches);
- 번역 개시를 촉진하거나 억제하는 서열; 및
- 5' UTR 내의 인트론은 유전자 발현 및 mRNA 방출의 조절과 연결되어 있다.
조절 서열이 5' UTR과 인트론을 모두 포함하는 경우, 5' UTR 및 인트론이라고 부를 수 있다.
일 구체예에 있어서, 상기 기재된 바와 같은 합성된 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 프로모터는 5' UTR 및 인트론을 코딩하는 서열에 작동가능하게 연결된다. 일 구체예에 있어서, 5' UTR 및 인트론은 CMV 주요 조기 유전자(major immediate gene)(CMV-IE 유전자)로부터 유래된다. 예를 들어, CMV-IE 유전자 유래 5' UTR 및 인트론은 적절하게는 CMV-IE 유전자 엑손 1 및 CMV-IE 유전자 엑손 1, 또는 이의 부분을 포함한다.
일 구체예에 있어서, 상기 프로모터 요소는 5' UTR에 대한 연결을 고려해서 변형될 수 있으며, 예를 들어 프로모터 요소에서 전사 시작 부위(transcription start site, TSS)의 하류 서열은 제거될 수 있다(예를 들어, 5' UTR로 대체됨).
상기 CMV-IE 5' UTR 및 인트론은 Simari, et al., Molecular Medicine 4: 700-706, 1998 "Requirements for Enhanced Transgene Expression by Untranslated Sequences from the Human Cytomegalovirus Immediate-Early Gene"에 기재되어 있으며, 이는 본 명세서에 참조로서 통합된다. Simari, et al에서 논의된 CMV-IE 5' UTR 및 인트론 서열의 변형은 참조로서 통합된 WO2002/031137에 제시되고 있으며, 상기 문헌에 개시된 조절 서열 또한 이용될 수 있다.
프로모터와 조합하여 이용될 수 있는 다른 UTR과 같은 다른 조절 요소는 당업계, 예를 들어, 본 명세서에 참조로서 통합된, Leppek, K., Das, R. & Barna, M. "Functional 5' UTR mRNA structures in eukaryotic translation regulation and how to find them". Nat Rev Mol Cell Biol 19, 158-174 (2018)에 공지되어 있다.
일 구체예에 있어서, 상기 5' UTR 및 인트론을 코딩하는 서열은 서열번호 368, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 368은 CMV-IE 5' UTR 및 인트론을 코딩한다.
일 구체예에 있어서, 5' UTR 또는 5' UTR 및 인트론은 단백질 번역 개시 부위로서 기능하는 핵산 모티프, 예를 들어, 생성된 mRNA에서 Kozak 서열을 정의하는 서열을 포함한다. 예를 들어, 일 구체예에 있어서, 5' UTR을 코딩하는 서열은 그의 3' 말단에서 또는 그 근처에 서열 모티프 GCCACC를 포함한다. 다른 Kozak 서열 또는 다른 단백질 번역 개시 부위는 당업계에 알려진 바와 같이 이용될 수 있다(예를 들어, Marilyn Kozak, "Point Mutations Define a Sequence Flanking the AUG Initiator Codon That Modulates Translation by Eukaryotic Ribosomes" Cell, Vol. 44, 283-292, January 31, 1986; Marilyn Kozak "At Least Six Nucleotides Preceding the AUG Initiator Codon Enhance Translation in Mammalian Cells" J. Mol. Rid. (1987) 196, 947-950; Marilyn Kozak "An analysis of 5'-noncoding sequences from 699 vertebrate messenger RNAs" Nucleic Acids Research. Vol. 15 (20) 1987로서, 본 명세서에 모두 참조로 통합됨). 단백질 번역 개시 부위(예를 들어, Kozak 서열)는 바람직하게는 시작 코돈 바로 인접하여 위치한다.
일 구체예에 있어서, 본 명세서에 개시된 프로모터 또는 이의 변이체 중 어느 하나는 5' UTR 및/또는 5' UTR 및 인트론을 코딩하는 서열에 연결되어 복합 프로모터(composite promoter)를 제공한다. 본 명세서에서, 이러한 복합 프로모터는 단순히 "복합 프로모터"로 지칭될 수 있고, 일부 경우에는 간략하게 "프로모터"로 지칭될 수 있다.
일 구체예에 있어서, 상기 논의된 바와 같은 SP0067 프로모터 또는 이의 변이체는 5' UTR 및 인트론을 코딩하는 서열에 작동가능하게 연결되어 복합 프로모터를 제공한다. 일 구체예에 있어서, 복합 프로모터는 서열번호 432 또는 이의 기능적 변이체를 포함한다. 이 복합 프로모터 컨스트럭트는 CMV-IE 유전자(서열번호 368) 유래 5' UTR 및 인트론에 작동가능하게 연결된 SP0067을 포함한다. 상기 복합 프로모터는 본 명세서에 기재된 바와 같이 SP0475로 지칭된다.
일 구체예에 있어서, 상기 논의된 바와 같은 SP0173 프로모터 또는 이의 변이체는 5'UTR 및 인트론을 코딩하는 서열에 작동가능하게 연결되어 복합 프로모터를 제공한다. 일 구체예에 있어서, 복합 프로모터는 서열번호 75 또는 이의 기능적 변이체를 포함한다. 이 복합 프로모터 컨스트럭트는 CMV-IE 유전자(서열번호 368) 유래 5' UTR 및 인트론에 작동가능하게 연결된 SP0173을 포함한다. 상기 복합 프로모터는 본 명세서에 기재된 바와 같이 SP0320으로 지칭된다.
일 구체예에 있어서, 상기 논의된 바와 같은 SP0134 프로모터 또는 이의 변이체는 5'UTR 및 인트론을 코딩하는 서열에 작동가능하게 연결되어 복합 프로모터를 제공한다. 일 구체예에 있어서, 복합 프로모터는 서열번호 62, 또는 이의 기능적 변이체를 포함한다. 이 복합 프로모터 컨스트럭트는 CMV-IE 유전자(서열번호 368) 유래 5' UTR 및 인트론에 작동가능하게 연결된 SP0134를 포함한다. 이 복합 프로모터는 본 명세서에 기재된 바와 같이 SP0279로 지칭된다.
SP0067 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위(proximal) 또는 최소 프로모터(minimal promoter)일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 SKM_18.
CRE0033은 서열번호 309에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 갖는다.
CRE0033의 기능적 변이체는 CRE0033과는 다르나, 실질적으로 근육-특이적 CRE로서의 활성을 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(transcription factor, TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE(reference CRE)와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0033의 기능적 변이체는, 프로모터에서 CRE0033의 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0033 자리에 치환된 CRE0033의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0067을 예로 고려하면, SP0067 중 CRE0033은 CRE0033의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0033 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥으로 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 309의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 309에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE033 또는 이의 기능적 변이체는 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가질 수 있다.
SKM_18은 서열번호 289에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 갖는다.
상기에서 논의한 바와 같이, SKM_18의 기능적 변이체는 근육-특이적 프로모터 요소로 작용하는 SKM_18의 능력을 실질적으로 유지한다. 예를 들어, SKM_18의 기능적 변이체가 심장 근육-특이적 프로모터 SP0067로 치환될 때, 변형된 프로모터는 SP0067의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 SKM_18의 기능적 변이체는 서열번호 289에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, SKM_18 또는 그의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 15에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 15에 따른 서열을 갖는 프로모터는 SP0067로 지칭된다. SP0067 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 매우 특이적임이 확인되었고 또한 매우 짧은데, 이는 일부 상황에서 유리하다.
SP0075 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_20 또는 이의 기능적 변이체이다. SKM_20은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소 (또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 SKM_20.
CRE0033의 서열 및 이의 변이체는 상기 기재된 바와 같다. SKM_20은 서열번호 290에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, SKM_20의 기능적 변이체는 근육-특이적 프로모터 요소로 작용하는 SKM_20의 능력을 실질적으로 유지한다. 예를 들어, SKM_20의 기능적 변이체가 심장 근육-특이적 프로모터 SP0075로 치환될 때, 변형된 프로모터는 SP0075의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 SKM_20의 기능적 변이체는 서열번호 290에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, SKM_20 또는 이의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 20에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 20에 따른 서열을 갖는 프로모터는 SP0075로 지칭된다. SP0075 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 매우 특이적임이 확인되었고 또한 매우 짧은데, 이는 일부 상황에서 유리하다.
SP0424 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0004을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0004을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0082 또는 이의 기능적 변이체이다. CRE0082은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0004 및 이어서 CRE0082.
CRE0004는 서열번호 415에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0004의 기능적 변이체는 CRE0004과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 한, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0004의 기능적 변이체는 프로모터에서 CRE0004의 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0004 자리에 치환된 CRE0004의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0424를 예로 고려하면, SP0424의 CRE0004은 CRE0004의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0004 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 415의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 415에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE004 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
CRE0082는 서열번호 422에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0082의 기능적 변이체는 심장 근육-특이적 프로모터 요소로 작용하는 CRE0082의 능력을 실질적으로 유지한다. 예를 들어, CRE0082의 기능적 변이체가 심장 근육-특이적 프로모터 SP0424로 치환될 때, 변형된 프로모터는 SP0424의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CRE0082의 기능적 변이체는 서열번호 422에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0082 또는 그의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 500개 이하, 400개 이하, 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 359에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 359에 따른 서열을 갖는 프로모터는 SP0424로 지칭된다. SP0424 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0425 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0028을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0028을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0082 또는 이의 기능적 변이체이다. CRE0082은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0028 및 이어서 CRE0082.
CRE0028은 서열번호 306에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0028의 기능적 변이체는 CRE0028과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 가진 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0028의 기능적 변이체는, 프로모터에서 CRE0028의 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0028 자리에 치환된 CRE0028의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0425을 예로 고려하면 SP0425 중 CRE0028은 CRE0028의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0028 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 306의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 306에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0028 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
CRE0082의 서열 및 이의 변이체는 상기 기재한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 360에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 360에 따른 서열을 갖는 프로모터는 SP0425로 지칭된다. SP0425 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0429 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0095을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0095을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0082 또는 이의 기능적 변이체이다. CRE0082은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0095 및 이어서 CRE0082.
CRE0095는 서열번호 416에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0095의 기능적 변이체는 CRE0095과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 가진 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 한, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0095의 기능적 변이체는 프로모터에서 CRE0095 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0095 자리에 치환된 CRE0095의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0429을 예로 고려하면 SP0429 중 CRE0095은 CRE0095의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0095 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 416의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 416에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0095 또는 이의 기능적 변이체는 400개 이하, 300개 이하, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
CRE0082의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 364에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 364에 따른 서열을 갖는 프로모터는 SP0429로 지칭된다. SP0429 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0430 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0096을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0096을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0082 또는 이의 기능적 변이체이다. CRE0082은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0096 및 이어서 CRE0082.
CRE0096은 서열번호 417에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0096의 기능적 변이체는 CRE0096과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0096의 기능적 변이체는 프로모터에서 CRE0096의 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0096 자리에 치환된 CRE0096의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0430을 예로 고려하면 SP0430의 CRE0096은 CRE0096의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0096 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 417의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 417에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0096 또는 이의 기능적 변이체는 500개 이하의 뉴클레오티드, 400개 이하의 뉴클레오티드, 300개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
CRE0082의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 365에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 365에 따른 서열을 갖는 프로모터는 SP0430로 지칭된다. SP0430 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0344 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0038 또는 이의 기능적 변이체이다. CRE0038은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 CRE0038. CRE0038의 서열 및 이의 기능적 변이체는 상기에 기술한 바와 같다.
CRE0038은 서열번호 471에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0038의 기능적 변이체는 심장 근육-특이적 프로모터 요소로 작용하는 CRE0038의 능력을 실질적으로 유지한다. 예를 들어, CRE0038의 기능적 변이체가 심장 근육-특이적 프로모터 SP0344로 치환될 때, 변형된 프로모터는 SP0344의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CR0038의 기능적 변이체는 서열번호 471에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CR0038 또는 이의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 424에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 424에 따른 서열을 갖는 프로모터는 SP0344로 지칭된다. SP0344 프로모터는 일 구체예에 있어서 특히 바람직하다. 상기 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0433 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0033 및 CRE0071.3의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 심장 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에있어서, 심장 근육-특이적 프로모터는 CRE0033, CRE0071.3의 순서로 상기 CRE, 또는 이의 기능적 변이체, 이어서 프로모터 요소(순서는 당업계에서 통상적인 바와 같이 상류에서 하류 방향으로 주어짐)를 포함한다. 일 구체예에 있어서, 심장 근육-특이적 프로모터는 CRE0071.3, CRE0033의 순서로 상기 CRE, 또는 이의 기능적 변이체, 이어서 프로모터 요소를 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐).
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 심장 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0070, 또는 이의 기능적 변이체이다. CRE0070은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0033, CRE0071.3 및 CRE0070. 상기 CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다.
CRE0071.3은 서열번호 293에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0071.3의 기능적 변이체는 CRE0071.3과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0071.3의 기능적 변이체는 프로모터에서 CRE0071.3의 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0071.3 자리에 치환된 CRE0071.3의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0433을 예로 고려하면 SP00433의 CRE0071.3은 CRE0071.3의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0071.3 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 293의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 293에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0071.3 또는 이의 기능적 변이체는 300개 이하, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
CRE0070은 서열번호 284에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0070의 기능적 변이체는 근육-특이적 프로모터 요소로 작용하는 CRE0070의 능력을 실질적으로 유지한다. 예를 들어, CRE0070의 기능적 변이체가 심장 근육-특이적 프로모터 SP0433로 치환될 때, 변형된 프로모터는 SP0433의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CRE0070의 기능적 변이체는 서열번호 284에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0070 또는 그의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드, 85개 이하의 뉴클레오티드, 75개 이하의 뉴클레오티드, 50개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서 심장 근육-특이적 프로모터는 서열번호 425, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 425에 따른 서열을 갖는 프로모터는 SP0433로 지칭된다. SP0433 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0435 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0082 또는 이의 기능적 변이체이다. CRE0082은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 CRE0082. CRE0033 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0082 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 426에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 426에 따른 서열을 갖는 프로모터는 SP0435로 지칭된다. SP0435 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0436 및 이의 변이체
일 구체예에 있어서, 프로모터는 두개의 시스-조절 요소 CRE0033의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 심장 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE 또는 이의 기능적 변이체를 첫 번째 CRE0033, 두 번째 CRE0033, 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐).
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서, 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다. 따라서, 일 구체예에 있어서 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: 제1 CRE0033, 제2 CRE0033 및 SKM_18.
2개의 동일한 CRE를 포함하는 합성된 프로모터는 동일한 CRE 중 어느 하나만 포함하는 동등한 프로모터보다 표적 조직 또는 세포에서 더 높은 발현을 갖는 것으로 예측된다. 예를 들어, 첫 번째 CRE0033, 두 번째 CRE0033 및 SKM_18을 포함하는 프로모터 SP0436은 CRE0033 및 SKM_18만 포함하는 프로모터 SP0067보다 심장 근육 세포에서 더 높은 발현을 가진다. CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. SKM_18의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 427에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 427에 따른 서열을 갖는 프로모터는 SP0436로 지칭된다. SP0436 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0449 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0004 및 CRE0033의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 심장 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0004, CRE0033, 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0033, CRE0004, 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐).
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0004, CRE0033 및 SKM_18. 상기 CRE0004의 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. SKM_18의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 428에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 428에 따른 서열을 갖는 프로모터는 SP0449로 지칭된다. SP0449 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0450 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0095 및 CRE0033의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 심장 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0095, CRE0033, 및 이어서 프로모터 요소(순서는 당업계에서 통상적인 바와 같이 상류에서 하류 방향으로 주어짐)의 순서로 포함한다. 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0033, CRE0095 및 이어서 프로모터 요소(순서는 당업계에서 통상적인 바와 같이 상류에서 하류 방향으로 주어짐)의 순서로 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서, 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0095, CRE0033 및 SKM_18. 상기 CRE0095의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. SKM_18의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 429, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 429에 따른 서열을 갖는 프로모터는 SP0450로 지칭된다. SP0450 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 일부 상황에서 유리하다.
SP0451 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0096 및 CRE0033의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 심장 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를, CRE0096, CRE0033 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를, CRE0033, CRE0096 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐).
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서, 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0096, CRE0033 및 SKM_18. 상기 CRE0096의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 SKM_18의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 430에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 430에 따른 서열을 갖는 프로모터는 SP0451로 지칭된다. SP0451 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0452 및 이의 변이체
일 구체예에 있어서, 프로모터는 심장 근육-특이적 근위 프로모터 CRE0082 및 시스-조절 요소 CRE0033의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 심장 근육-특이적 프로모터이다. 일반적으로 심장 근육-특이적 근위 프로모터 CR0082 및 시스-조절 요소 CRE0033은 추가 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 근위 프로모터 및 CRE, 또는 이의 기능적 변이체를 CRE0082, CRE0033 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐).
상기 추가 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 추가 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서, 상기 추가 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0082, CRE0033 및 SKM_18. 이 프로모터는 직렬(tandem)로 사용된 두 개의 근위 프로모터를 포함한다. 상기 CRE0082의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 SKM_18의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 431에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 431에 따른 서열을 갖는 프로모터는 SP0452로 지칭된다. SP0452 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0475 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소 및 5' UTR 및/또는 인트론과 같은 조절 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 있는 CRE0033에 이어 5' UTR 및/또는 인트론과 같은 조절 요소를 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
상기 인트론은 임의의 적절한 인트론일 수 있다. 상기 5' UTR은 임의의 적절한 5' UTR일 수 있다. 조절 요소는 인트론과 5' UTR을 포함할 수 있다. 바람직한 일 구체예에 있어서, 상기 조절 요소는 CMV-IE 5' UTR 및 인트론이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0033, 이어서 SKM_18, 및 이어서 CMV-IE 5'UTR 및 인트론. CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. SKM_18 및 그 변이체는 상기 기술한 바와 같다.
CMV-IE 5'UTR 및 인트론은 서열번호 368에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
일 구체예에 있어서, CMV-IE 5' UTR 및 인트론의 기능적 변이체는 프로모터에서 CMV-IE 5' UTR 및 인트론 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 인트론으로 볼 수 있다. 예를 들어, CMV-IE 5' UTR 및 인트론 자리에 치환된 CMV-IE 5' UTR 및 인트론의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0475를 예로 고려하면, SP0475의 CMV-IE 5' UTR 및 인트론은 CMV-IE 5' UTR 및 인트론의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CMV-IE 5' UTR 및 인트론과 같은 인트론을 포함하는 합성된 프로모터는 인트론을 포함하지 않는 동등한 프로모터보다 표적 조직 또는 세포에서 더 높은 발현을 가질 것으로 예측된다. 예를 들어, CRE0033, SKM_18 및 CMV-IE 5'UTR 및 인트론을 포함하는 프로모터 SP0475는 CRE0033 및 SKM_18만 포함하는 프로모터 SP0067보다 심장 근육 조직 또는 세포에서 더 높은 발현을 가질 것으로 예측된다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 432에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 432에 따른 서열을 갖는 프로모터는 SP0475로 지칭된다. SP0475 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0476 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0105을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0105을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다. 일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0105 및 이어서 SKM_18.
CRE0105은 서열번호 462에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. CRE00105의 기능적 변이체는 CRE0105과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0105의 기능적 변이체는 프로모터에서 CRE0105 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0105 자리에 치환된 CRE0105의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0476을 예로 고려하면, SP0476의 CRE0105은 CRE0105의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0105 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 462의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 462에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0105 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 433에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 433에 따른 서열을 갖는 프로모터는 SP0476으로 지칭된다. SP0476 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0477 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0106을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0106을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0106 및 이어서 SKM_18.
CRE0106은 서열번호 463에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0106의 기능적 변이체는 CRE0106과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0106의 기능적 변이체는 프로모터에서 CRE0106 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0106 자리에 치환된 CRE0106의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0477을 예로 고려하면, SP0477의 CRE0106은 CRE0106의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0106 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 463의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 463에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0106 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 434에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 434에 따른 서열을 갖는 프로모터는 SP0477로 지칭된다. SP0477 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0478 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0107을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0107을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0107 및 이어서 SKM_18.
CRE0107은 서열번호 464에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0107의 기능적 변이체는 CRE0107과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0107의 기능적 변이체는 프로모터에서 CRE0107 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0107 자리에 치환된 CRE0107의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0478을 예로 고려하면, SP0478의 CRE0107은 CRE0107의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0107 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 464의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 464에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0107 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 435에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 435에 따른 서열을 갖는 프로모터는 SP0478로 지칭된다. SP0478 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0479 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0108을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0108을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0108 및 이어서 SKM_18.
CRE0108은 서열번호 465에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0108의 기능적 변이체는 CRE0108과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0108의 기능적 변이체는 프로모터에서 CRE0108 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0108 자리에 치환된 CRE0108의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0479을 예로 고려하면, SP0479의 CRE0108은 CRE0108의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0108 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 465의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 465에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0108 또는 이의 기능적 변이체는 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 436에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 436에 따른 서열을 갖는 프로모터는 SP0479로 지칭된다. SP0479 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0480 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0109을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0109를 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다. 일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0109 및 이어서 SKM_18.
CRE0109는 서열번호 466에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0109의 기능적 변이체는 CRE0109과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0109의 기능적 변이체는 프로모터에서 CRE0109 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0109 자리에 치환된 CRE0109의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0480을 예로 고려하면, SP0480의 CRE0109은 CRE0109의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0109 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 466의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 466에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0109 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 437에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 437에 따른 서열을 갖는 프로모터는 SP0480으로 지칭된다. SP0480 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0481 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0110 또는 이의 기능적 변이체이다. CRE0110은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 CRE0110. CRE0033의 서열 및 이의 변이체는 상기 기재한 바와 같다. CRE0110은 서열번호 473에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0110의 기능적 변이체는 심장 근육-특이적 프로모터 요소로 작용하는 CRE0110의 능력을 실질적으로 유지한다. 예를 들어, CRE0110의 기능적 변이체가 심장 근육-특이적 프로모터 SP0481로 치환될 때, 변형된 프로모터는 SP0481의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CRE0110의 기능적 변이체는 서열번호 473에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0110 또는 그의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 438에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 438에 따른 서열을 갖는 프로모터는 SP0481로 지칭된다. SP0481 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0482 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0111을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0111을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0111 및 이어서 SKM_18.
CRE0111은 서열번호 467에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0111의 기능적 변이체는 CRE0111과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0111의 기능적 변이체는 프로모터에서 CRE0111 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0111 자리에 치환된 CRE0111의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0482을 예로 고려하면, SP0482의 CRE0111은 CRE0111의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0111 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 467의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 467에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0111 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 439에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 439에 따른 서열을 갖는 프로모터는 SP0482로 지칭된다. SP0482 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0483 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서, 상기 프로모터 요소는 CRE0112 또는 이의 기능적 변이체이다. CRE0112는 심장 근육-특이적 근위 프로모터이다. 일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소( 또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 CRE0112.
CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0112은 서열번호 474에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0112의 기능적 변이체는 심장 근육-특이적 프로모터 요소로 작용하는 CRE0112의 능력을 실질적으로 유지한다. 예를 들어, CRE0112의 기능적 변이체가 심장 근육-특이적 프로모터 SP0483으로 치환될 때, 변형된 프로모터는 SP0483의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CRE0112의 기능적 변이체는 서열번호 474에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0112 또는 이의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 440에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 440에 따른 서열을 갖는 프로모터는 SP0483으로 지칭된다. SP0483 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0484 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0113 또는 이의 기능적 변이체이다. CRE0113은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 CRE0113. CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0113은 서열번호 475에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0113의 기능적 변이체는 심장 근육-특이적 프로모터 요소로 작용하는 CRE0113의 능력을 실질적으로 유지한다. 예를 들어, CRE0113의 기능적 변이체가 심장 근육-특이적 프로모터 SP0484으로 치환될 때, 변형된 프로모터는 SP0484의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CRE0113의 기능적 변이체는 서열번호 475에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0113 또는 이의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 441에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 441에 따른 서열을 갖는 프로모터는 SP0484으로 지칭된다. SP0484 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0485 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0114를 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0114를 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0114 및 이어서 SKM_18.
CRE0114은 서열번호 468에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0114의 기능적 변이체는 CRE0114와는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0114의 기능적 변이체는 프로모터에서 CRE0114 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0114 자리에 치환된 CRE0114의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0485를 예로 고려하면, SP0485의 CRE0114는 CRE0114의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0114 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 468의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 468에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0114 또는 이의 기능적 변이체는 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 442에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 442에 따른 서열을 갖는 프로모터는 SP0485로 지칭된다. SP0485 프로모터는 일 구체예에 있어서 특히 바람직하다. 상기 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0486 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0115 또는 이의 기능적 변이체이다. CRE0115는 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 CRE0115.
CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0115은 서열번호 476에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0115의 기능적 변이체는 심장 근육-특이적 프로모터 요소로 작용하는 CRE0115의 능력을 실질적으로 유지한다. 예를 들어, CRE0115의 기능적 변이체가 심장 근육-특이적 프로모터 SP0486으로 치환될 때, 변형된 프로모터는 SP0486의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CRE0115의 기능적 변이체는 서열번호 476에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0115 또는 그의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 443, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 443에 따른 서열을 갖는 프로모터는 SP0486으로 지칭된다. SP0486 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0487 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0116 또는 이의 기능적 변이체이다. CRE0116은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 CRE0116.
CRE0033의 서열 및 이의 변이체는 상기 기재한 바와 같다.
CRE0116은 서열번호 477에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0116의 기능적 변이체는 근육-특이적 프로모터 요소로 작용하는 CRE0116의 능력을 실질적으로 유지한다. 예를 들어, CRE0116의 기능적 변이체가 심장 근육-특이적 프로모터 SP0487로 치환될 때, 변형된 프로모터는 SP0487의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CRE0116의 기능적 변이체는 서열번호 477에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0116 또는 이의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 444에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 444에 따른 서열을 갖는 프로모터는 SP0487로 지칭된다. SP0487 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0488 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0117을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0117를 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0117 및 이어서 SKM_18.
CRE0117은 서열번호 469에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0117의 기능적 변이체는 CRE0117과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0117의 기능적 변이체는 프로모터에서 CRE0117 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0117 자리에 치환된 CRE0117의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0488을 예로 고려하면, SP0488의 CRE0117은 CRE0117의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0117 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 469의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 469에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0117 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 445에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 445에 따른 서열을 갖는 프로모터는 SP0488로 지칭된다. SP0488 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0489 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0033을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0033을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0104 또는 이의 기능적 변이체이다. CRE0104는 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0033 및 이어서 CRE0104. CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0104는 서열번호 472에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0104의 기능적 변이체는 심장 근육-특이적 프로모터 요소로 작용하는 CRE0104의 능력을 실질적으로 유지한다. 예를 들어, CRE0104의 기능적 변이체가 심장 근육-특이적 프로모터 SP0489로 치환될 때, 변형된 프로모터는 SP0489의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CRE0104의 기능적 변이체는 서열번호 472에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0104 또는 이의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 400개 이하의 뉴클레오티드, 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 446, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 446에 따른 서열을 갖는 프로모터는 SP0489로 지칭된다. SP0489 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 일부 상황에서 유리하다.
SP0490 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0106을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0106을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0110 또는 이의 기능적 변이체이다. CRE0110은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0106 및 이어서 CRE0110. CRE0106의 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0110의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 447에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 447에 따른 서열을 갖는 프로모터는 SP0490으로 지칭된다. SP0490 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0491 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0107을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0107을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0110 또는 이의 기능적 변이체이다. CRE0110은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0107 및 이어서 CRE0110. CRE0107의 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0110의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 448에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 448에 따른 서열을 갖는 프로모터는 SP0491으로 지칭된다. SP0491 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0492 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0106을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0106을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0116 또는 이의 기능적 변이체이다. CRE0116은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0106 및 이어서 CRE0116. CRE0106의 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0116의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 449에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 449에 따른 서열을 갖는 프로모터는 SP0492로 지칭된다. SP0492 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적으로 예측되고, 이는 일부 상황에서 유리하다.
SP0493 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0107을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0107을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0116 또는 이의 기능적 변이체이다. CRE0116은 심장 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0107 및 이어서 CRE0116. CRE0107의 서열 및 이의 변이체는 상기 기술한 바와 같다. CRE0116의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 450에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 450에 따른 서열을 갖는 프로모터는 SP0493으로 지칭된다. SP0493 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0494 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0118을 포함하는 합성된 심장 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0118을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0118 및 이어서 SKM_18.
CRE0118은 서열번호 470에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0118의 기능적 변이체는 CRE0118과는 다르지만, 심장 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0118의 기능적 변이체는 프로모터에서 CRE0118 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0118 자리에 치환된 CRE0118의 기능적 변이체를 포함하는 심장 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0494을 예로 들면 SP0494의 CRE0118은 CRE0118의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. CRE0118 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 470의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 470에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0118 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 451에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 451에 따른 서열을 갖는 프로모터는 SP0494으로 지칭된다. SP0494 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0495 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0106 및 CRE0033의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 심장 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를, CRE0106, CRE0033, 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0033, CRE0106 및 이어서 프로모터 요소(순서는 당업계에서 통상적인 바와 같이 상류에서 하류 방향으로 주어짐)의 순서로 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0116, 또는 이의 기능적 변이체이다. CRE0116은 심장 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0106, CRE0033 및 CRE0116. 상기 CRE0106의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0116의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 452에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 452에 따른 서열을 갖는 프로모터는 SP0495로 지칭된다. SP0495 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0496 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0107 및 CRE0033의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 심장 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0107, CRE0033 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 심장 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0033, CRE0107 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐).
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 심장 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서, 상기 프로모터 요소는 CRE0116, 또는 이의 기능적 변이체이다. CRE0116은 심장 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0107, CRE0033 및 CRE0116. 상기 CRE0106의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0033의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0116의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 심장 근육-특이적 프로모터는 서열번호 453에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 453에 따른 서열을 갖는 프로모터는 SP0496으로 지칭된다. SP0496 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 심장 근육에 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0227 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0020을 포함하는 합성된 골격 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 골격 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0020를 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0049 또는 이의 기능적 변이체이다. CRE0049은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 골격 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0020 및 이어서 CRE0049.
CRE0020은 서열번호 303에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0020의 기능적 변이체는 CRE0020과는 다르지만, 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0020의 기능적 변이체는 프로모터에서 CRE0020 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, SPO227을 예로 들면, CRE0020 자리에 치환된 CRE0020의 기능적 변이체를 포함하는 골격 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0227을 예로 고려하면, SP0227의 CRE0020은 CRE0020의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0020 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 303의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 303에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0020 또는 이의 기능적 변이체는 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 또는 100개 이하의 뉴클레오티드의 길이를 가진다.
CRE0049는 서열번호 278에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기에서 논의한 바와 같이, CRE0049의 기능적 변이체는 골격 근육-특이적 프로모터 요소로 작용하는 CRE0049의 능력을 실질적으로 유지한다. 예를 들어, CRE0049의 기능적 변이체가 골격 근육-특이적 프로모터 SP0227로 치환될 때, 변형된 프로모터는 SP0227의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 더욱 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%을 유지한다. 적절하게는 CRE0049의 기능적 변이체는 서열번호 278에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 갖는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0049 또는 이의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 400개 이하의 뉴클레오티드, 350개 이하의 뉴클레오티드, 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
일 구체예에 있어서, 골격 근육-특이적 프로모터는 서열번호 47에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 47에 따른 서열을 갖는 프로모터는 SP0227로 지칭된다. SP0227 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 골격 근육에 매우 특이적임을 확인하였고, 이는 일부 상황에서 유리하다.
SP0407 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0080 및 CRE0081의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 골격 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 골격 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0080, CRE0081 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 골격 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0081, CRE0080 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐).
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 골격 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0080, CRE0081 및 SKM_18.
CRE0080은 서열번호 401에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0080의 기능적 변이체는 CRE0080과는 다르지만, 골격 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0080의 기능적 변이체는 프로모터에서 CRE0080 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0080 자리에 치환된 CRE0080의 기능적 변이체를 포함하는 골격 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0407을 예로 고려하면 SP00407의 CRE0080은 CRE0080의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0080 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 401의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 401에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0080 또는 이의 기능적 변이체는 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 100개 이하의 뉴클레오티드, 90개 이하의 뉴클레오티드, 또는 80개 이하의 뉴클레오티드의 길이를 가진다.
CRE0081은 서열번호 402에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0081의 기능적 변이체는 CRE0081과는 다르지만, 골격 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0081의 기능적 변이체는 프로모터에서 CRE0081 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0081 자리에 치환된 CRE0081의 기능적 변이체를 포함하는 골격 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0407을 예로 들면 SP00407의 CRE0081은 CRE0081의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0081 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 402의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 402에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
일 구체예에 있어서, CRE0081 또는 이의 기능적 변이체는 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 100개 이하의 뉴클레오티드, 90개 이하의 뉴클레오티드, 80개 이하의 뉴클레오티드, 70개 이하의 뉴클레오티드, 또는 60개 이하의 뉴클레오티드의 길이를 가진다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 골격 근육-특이적 프로모터는 서열번호 342에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 342에 따른 서열을 갖는 프로모터는 SP0407로 지칭된다. SP0407 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 골격 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0418 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE083 및 CRE0090의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 골격 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 골격 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0083, CRE0090 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 골격 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0090, CRE0083, 및 이어서 프로모터 요소의 순서로 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 골격 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0083, CRE0090 및 SKM_18.
CRE0083은 서열번호 403에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0083의 기능적 변이체는 CRE0083과는 다르지만, 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0083의 기능적 변이체는 프로모터에서 CRE0083 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0083 자리에 치환된 CRE0083의 기능적 변이체를 포함하는 골격 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0418을 예로 고려하면, SP00418의 CRE0083은 CRE0083의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0083 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 403의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 403에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
CRE0090은 서열번호 409에 따른 서열을 가진다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0090의 기능적 변이체는 CRE0090과는 다르지만, 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0090의 기능적 변이체는 프로모터에서 CRE0090 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0090 자리에 치환된 CRE0090의 기능적 변이체를 포함하는 골격 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0418을 예로 고려하면, SP00418의 CRE0090은 CRE0090의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0090 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 409의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 409에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
SKM_18 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 골격 근육-특이적 프로모터는 서열번호 353에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 353에 따른 서열을 갖는 프로모터는 SP0418로 지칭된다. SP0418 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 골격 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0446 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0080 및 CRE0081의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 골격 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 골격 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0080, CRE0081 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 골격 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0081, CRE0080 및 이어서 프로모터 요소의 순서로 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적 또는 골격 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0049 또는 이의 기능적 변이체이다. CRE0049는 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0080, CRE0081 및 CRE0049. 상기 CRE0080의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0081의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0049의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 골격 근육-특이적 프로모터는 서열번호 487, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 487에 따른 서열을 갖는 프로모터는 SP0446으로 지칭된다. 일 구체예에 있어서 SP0446 프로모터는 특히 바람직하다. 이 프로모터는 골격 근육에 매우 특이적임을 확인하였고, 일부 상황에서 유리하다.
SP0057 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0029 및 CRE0071의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0029, CRE0071 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0071, CRE0029 및 이어서 프로모터 요소의 순서로 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서, 상기 프로모터 요소는 CRE0070 또는 이의 기능적 변이체이다. CRE0070은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0029, CRE0071 및 CRE0070.
일 구체예에 있어서, CRE0029는 서열번호 307, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0029의 기능적 변이체는 CRE0029과는 다르지만, 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0029의 기능적 변이체는 프로모터에서 CRE0029 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0029 자리에 치환된 CRE0029의 기능적 변이체를 포함하는 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0057을 예로 고려하면, SP0057의 CRE0029은 CRE0029의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0029 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 307의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 307에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
CRE0071는 서열번호 321에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0071의 기능적 변이체는 CRE0071과는 다르지만, 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0071의 기능적 변이체는 프로모터에서 CRE0071 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0071 자리에 치환된 CRE0029의 기능적 변이체를 포함하는 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0057을 예로 들면, SP0057의 CRE0071은 CRE0071의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0071 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 321의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 321에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
CRE0070의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 근육-특이적 프로모터는 서열번호 8에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 8에 따른 서열을 갖는 프로모터는 SP0057으로 지칭된다. SP0057 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0134 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0020 및 CRE0071의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0020, CRE0071 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0071, CRE0020 및 이어서 프로모터 요소의 순서로 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0070 또는 이의 기능적 변이체이다. CRE0070은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0020, CRE0071 및 CRE0070. 상기 CRE0020의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0071의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0070의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 상기 근육-특이적 프로모터는 서열번호 24에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 24에 따른 서열을 갖는 프로모터는 SP0134로 지칭된다. SP0134 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0173 및 이의 변이체
일 구체예에 있어서, 프로모터는 근육-특이적 근위 프로모터 CRE0010 및 시스-조절 요소 CRE0035의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 근육-특이적 프로모터이다. 일반적으로, 근육 특이적 근위 프로모터 CRE0010 및 시스-조절 요소 CRE0035는 추가 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 합성된 근육-특이적 프로모터는 상기 근위 프로모터 및 CRE, 또는 이의 기능적 변이체를 CRE0010, CRE0035 및 이어서 추가의 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐). 일 구체예에 있어서, 합성된 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0035, CRE0010 및 이어서 추가의 프로모터 요소의 순서로 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0010, CRE0035 및 SKM_18. 일 구체예에 있어서, CRE0010 (본 명세서에 CRE0010_ITGB1BP2로 공지됨)은 서열번호 272에 따른 서열을 갖는다. 이의 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
상기 논의한 바와 같이, CRE0010의 기능적 변이체는 근육-특이적 프로모터 요소로 작용하는 CRE0010의 능력을 실질적으로 유지한다. 예를 들어, CRE0010의 기능적 변이체가 근육-특이적 프로모터 SP0320으로 치환되는 경우, 변형된 프로모터는 SP0320의 활성의 80% 이상, 보다 바람직하게는 활성의 90% 이상, 보다 바람직하게는 활성의 95% 이상, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 적절하게는 CRE0010의 기능적 변이체는 서열번호 272에 대해 적어도 70%, 80%, 90%, 95% 또는 99% 동일성을 가지는 서열을 포함한다.
바람직한 일 구체예에 있어서, CRE0010 또는 그의 기능적 변이체를 포함하거나 또는 이로 구성된 프로모터 요소는 400개 이하의 뉴클레오티드, 300개 이하의 뉴클레오티드, 250개 이하의 뉴클레오티드, 200개 이하의 뉴클레오티드, 150개 이하의 뉴클레오티드, 125개 이하의 뉴클레오티드, 110개 이하의 뉴클레오티드, 또는 95개 이하의 뉴클레오티드의 길이를 가진다.
CRE0035는 서열번호 310에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다.
CRE0035의 기능적 변이체는 CRE0035와는 다르지만, 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0035 기능적 변이체는 프로모터에서 CRE0035 자리에 치환될 때, 이의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0035 자리에 치환된 CRE0035의 기능적 변이체를 포함하는 근육-특이적 프로모터는 바람직하게는 이의 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0173을 예로 고려하면, SP0173의 CRE0035는 CRE0035의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0035 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 310의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 310에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
SKM_18의 서열 및 그 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 근육-특이적 프로모터는 서열번호 46에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 46에 따른 서열을 갖는 프로모터는 SP0173으로 지칭된다. SP0173 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0279 및 이의 변이체
일 구체예에 있어서, 프로모터는 시스-조절 요소 CRE0020 및 CRE0071의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 근육-특이적 프로모터이다. 일반적으로 CRE는 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0020, CRE0071 및 이어서 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이 상류에서 하류 방향으로 주어짐). 바람직한 일 구체예에 있어서, 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0071, CRE0020 및 이어서 프로모터 요소의 순서로 포함한다. 바람직한 일 구체예에 있어서, 근육-특이적 프로모터는 상기 CRE, 또는 이의 기능적 변이체를 CRE0020, CRE0071, 프로모터 요소 및 CMV-IE 5' UTR 및 인트론의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이, 상류에서 하류 방향으로 주어짐).
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0070 또는 이의 기능적 변이체이다. CRE0070은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서, 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0020, CRE0071, CRE0070 및 CMV-IE 5' UTR 및 인트론. 상기 CRE0020의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0071의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0070의 서열 및 이의 변이체는 상기 기술한 바와 같다. CMV-IE 5'UTR 및 인트론의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 근육-특이적 프로모터는 서열번호 62에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 62에 따른 서열을 갖는 프로모터는 SP0279로 지칭된다. SP0279 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0286 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0071을 포함하는 합성된 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0071을 포함한다. 바람직한 일 구체예에 있어서, 상기 합성된 근육-특이적 프로모터는 프로모터 요소 및 CMV-IE 5' UTR 및 인트론의 바로 상류에 CRE0071을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육- 특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 CRE0070 또는 이의 기능적 변이체이다. CRE0070은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 합성된 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0071, CRE0070 및 이어서 CMV-IE 5' UTR 및 인트론. 상기 CRE0071의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0070의 서열 및 이의 변이체는 상기 기술한 바와 같다. CMV-IE 5' UTR 및 인트론의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 근육-특이적 프로모터는 서열번호 63에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 63에 따른 서열을 갖는 프로모터는 SP0286로 지칭된다. SP0286 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0310 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0035을 포함하는 합성된 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0035를 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육- 특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0035 및 이어서 SKM_18. 상기 CRE0035의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 SKM_18의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 근육-특이적 프로모터는 서열번호 68에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 68에 따른 서열을 갖는 프로모터는 SP0310으로 지칭된다. SP0310 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0316 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0050을 포함하는 합성된 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0050을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적인 것이 일반적으로 바람직하다. 바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0050 및 이어서 SKM_18.
CRE0050은 서열번호 313에 따른 서열을 갖는다. 이의 기능적 변이체는 이와 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 갖는다.
CRE0050의 기능적 변이체는 CRE0050과는 다르지만, 근육-특이적 CRE로서의 활성을 실질적으로 유지하는 서열을 갖는 조절 요소이다. 당업자는 필수 전사 인자(TF)에 결합하고 발현을 향상시키는 능력을 유지하면서 CRE의 서열을 변화시키는 것이 가능하다는 것을 이해할 것이다. 기능적 변이체는 CRE를 실질적으로 비기능적으로 만들지 않는 경우, 참조 CRE와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRE0050의 기능적 변이체는 프로모터에서 CRE0050 자리에 치환될 때, 그의 활성을 실질적으로 유지하는 CRE로 볼 수 있다. 예를 들어, CRE0050 자리에 치환된 CRE0035의 기능적 변이체를 포함하는 근육-특이적 프로모터는 바람직하게는 활성의 80%, 더 바람직하게는 활성의 90%, 더 바람직하게는 활성의 95%, 및 더욱 더 바람직하게는 활성의 100%를 유지한다. 예를 들어, 프로모터 SP0316을 예로 고려하면, SP0316의 CRE0050은 CRE0050의 기능적 변이체로 대체될 수 있으며, 프로모터는 실질적으로 활성을 유지한다. 활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다.
CRE0050 또는 이의 기능적 변이체는 이중 가닥 폴리뉴클레오타이드의 어느 한 가닥에 제공될 수 있고 어느 방향으로든 제공될 수 있음을 유의해야 할 것이다. 이와 같이, 서열번호 313의 상보적 및 역상보적 서열 또는 이의 기능적 변이체는 본 발명의 범위에 속한다. 서열번호 313에 따른 서열 또는 이의 기능적 변이체를 포함하는 단일 가닥 핵산도 본 발명의 범위에 속한다.
상기 SKM_18의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 근육-특이적 프로모터는 서열번호 74에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 74에 따른 서열을 갖는 프로모터는 SP0316으로 지칭된다. SP0316 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0320 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 근육 특이적 근위 프로모터 CRE0010 및 시스-조절 요소 CRE0035의 조합, 또는 이의 기능적 변이체를 포함하는 합성된 근육-특이적 프로모터이다. 일반적으로, 근육 특이적 근위 프로모터 CRE0010 및 시스-조절 요소 CRE0035는 추가 프로모터 요소에 작동가능하게 연결된다. 바람직한 일 구체예에 있어서, 합성된 근육 특이적 프로모터는 상기 근위 프로모터 및 CRE, 또는 이의 기능적 변이체를 CRE0010, CRE0035 및 이어서 추가의 프로모터 요소의 순서로 포함한다(순서는 당업계에서 통상적인 바와 같이 상류에서 하류 방향으로 주어짐). 일 구체예에 있어서, 합성 근육-특이적 프로모터는 상기 근위 프로모터 및 CRE, 또는 이의 기능적 변이체를 CRE0035, CRE0010 및 이어서 추가 프로모터 요소의 순서로 포함한다. 바람직한 일 구체예에 있어서, 합성된 근육-특이적 프로모터는 상기 근위 프로모터 및 CRE, 또는 이의 기능적 변이체를 CRE0010, CRE0035, 추가 프로모터 요소, 이어서 CMV-IE 5' UTR 및 인트론의 순서로 포함한다.
상기 추가 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육-특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서, 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
따라서, 일 구체예에 있어서 상기 프로모터는 하기 조절 요소 또는 이의 기능적 변이체를 포함한다: CRE0010, CRE0035, SKM_18 및 CMV-IE 5' UTR 및 인트론. 상기 CRE0010의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CRE0035의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 SKM_18의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 CMV-IE 5' UTR 및 인트론의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 상기 근육-특이적 프로모터는 서열번호 75에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 75에 따른 서열을 갖는 프로모터는 SP0320으로 지칭된다. SP0320 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
SP0326 및 이의 변이체
일 구체예에 있어서, 상기 프로모터는 프로모터 요소에 작동가능하게 연결된 CRE0071을 포함하는 합성된 근육-특이적 프로모터이다. 바람직한 일 구체예에 있어서, 상기 합성된 근육-특이적 프로모터는 프로모터 요소의 바로 상류에 CRE0071을 포함한다.
상기 프로모터 요소는 임의의 적절한 근위 또는 최소 프로모터일 수 있다. 일 구체예에 있어서, 프로모터 요소는 최소 프로모터이다. 상기 프로모터가 근위 프로모터인 경우, 근위 프로모터는 근육- 특이적인 것이 일반적으로 바람직하다.
바람직한 일 구체예에 있어서 상기 프로모터 요소는 SKM_18 또는 이의 기능적 변이체이다. SKM_18은 근육-특이적 근위 프로모터이다.
일 구체예에 있어서, 상기 심장 근육-특이적 프로모터는 하기 요소(또는 이의 기능적 변이체)를 포함한다: CRE0071 및 이어서 SKM_18. 상기 CRE0071의 서열 및 이의 변이체는 상기 기술한 바와 같다. 상기 SKM_18의 서열 및 이의 변이체는 상기 기술한 바와 같다.
일 구체예에 있어서, 근육-특이적 프로모터는 서열번호 80에 따른 서열, 또는 이의 기능적 변이체를 포함한다. 일 구체예에 있어서, 기능적 변이체는 적어도 이와 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 동일한 서열을 가질 수 있다. 서열번호 80에 따른 서열을 갖는 프로모터는 SP0326으로 지칭된다. SP0326 프로모터는 일 구체예에 있어서 특히 바람직하다. 이 프로모터는 근육에 매우 특이적임이 확인되었고, 이는 일부 상황에서 유리하다.
직렬 프로모터(tandem promoter)
일 구체예에 있어서, 합성된 근육-특이적 프로모터는 2개 이상의 프로모터 요소를 포함한다. 2개 이상의 프로모터 요소를 포함하는 합성 프로모터는 여기서 '직렬 프로모터(tandem promoter)'로 지칭된다. 예를 들어, SP0452는 프로모터 요소 CRE0082 및 SKM_18을 포함하므로 직렬 프로모터이다. SP0171은 프로모터 요소 CRE0010 및 SKM_18을 포함하므로 직렬 프로모터이다. SP0173은 프로모터 요소 CRE0010 및 SKM_18을 포함하므로 직렬 프로모터이다. SP0257은 프로모터 요소 CRE0010 및 CRE0046을 포함하므로 직렬 프로모터이다. SP0262는 프로모터 요소 CRE0010 및 CRE0054를 포함하므로 직렬 프로모터이다. SP0265는 프로모터 요소 CRE0010 및 CRE0010_ALDOA를 포함하므로 직렬 프로모터이다. SP0266은 프로모터 요소 CRE0010 및 CRE0010_ALDOA를 포함하므로 직렬 프로모터이다. SP0268은 프로모터 요소 CRE0010 및 SKM_18을 포함하므로 직렬 프로모터이다. SP0270은 프로모터 요소 CRE0055 및 DES_mp_v1을 포함하므로 직렬 프로모터이다. SP0305는 프로모터 요소 CRE0010 및 SRL_mp를 포함하므로 직렬 프로모터이다. SP0320은 프로모터 요소 CRE0010 및 SKM_18을 포함하므로 직렬 프로모터이다. SP0335는 프로모터 요소 CRE0055 및 SRL_mp를 포함하므로 직렬 프로모터이다. SP0336은 프로모터 요소 CRE0055 및 SRL_mp를 포함하므로 직렬 프로모터이다. SP0337은 프로모터 요소 CRE0055 및 SKM_18을 포함하므로 직렬 프로모터이다. SP0338은 프로모터 요소 CRE0055 및 DES_mp_v1을 포함하므로 직렬 프로모터이다. SP0339는 프로모터 요소 CRE0055 및 DES_mp_v1을 포함하므로 직렬 프로모터이다. SP0340은 프로모터 요소 CRE0046 및 SKM_18을 포함하므로 직렬 프로모터이다. SP0341은 프로모터 요소 CRE0055 및 CRE0010을 포함하므로 직렬 프로모터이다. SP0452는 프로모터 요소 CRE0082 및 SKM_18을 포함하므로 직렬 프로모터이다.
일 구체예에 있어서, 직렬 프로모터는 다른 프로모터 요소의 직접적 상류에 프로모터 요소를 포함할 수 있다. 일 구체예에 있어서, 직렬 프로모터는 하나 또는 각각의 프로모터 요소의 상류에 하나 이상의 CRE를 포함할 수 있다. 일 구체예에서, 직렬 프로모터는 프로모터 요소들 사이에 하나 이상의 CRE를 포함할 수 있다. 일 구체예에 있어서, 본 명세서에서 개시된 합성된 근육-특이적 프로모터 중 어느 하나는 추가 프로모터 요소에 작동가능하게 연결될 수 있다. 예를 들어, SP0452는 프로모터 요소 CRE0082에 작동가능하게 연결된 합성된 프로모터 SP0067이다. 합성된 프로모터 SP0067은 본 명세서에 개시된 어느 하나의 다른 프로모터 요소에 작동가능하게 연결될 수 있음이 이해될 것이다. 유사하게, 본 명세서에 개시된 어느 하나의 다른 합성된 프로모터는 본 명세서에 개시된 어느 하나의 프로모터 요소에 작동가능하게 연결될 수 있다.
- 도 1a 내지 c는 공지된 프로모터 RSV의 활성으로 정규화된, 골격 근관으로 분화된 C2C12 세포주 및 심장 근관으로 분화된 H9C2 세포주에서 본 발명의 구체예에 따른 다양한 합성된 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 RSV의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 2는 공지된 프로모터 CBA의 활성으로 정규화된, 골격 근관으로 분화된 C2C12 세포주 및 심장 근관으로 분화된 H9C2 세포주에서 본 발명의 구체예에 따른 다양한 합성된 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 CBA의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 3a 내지 j는 공지된 프로모터 CBA의 활성으로 정규화된, 골격 근관으로 분화된 H2K 2B4 세포주 및 심장 근관으로 분화된 H9C2 세포주에서 본 발명의 구체예에 따른 다양한 합성된 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 CBA의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 4는 공지된 프로모터 RSV의 활성과 비교하여 배아 신장 세포주 HEK293 세포 및 간세포 세포주 Huh7(즉, 비-근육 유래 세포)에서 본 발명의 구체예에 따른 다양한 합성된 근육-특이적 프로모터의 평균 활성을 나타낸 것이다.
- 도 5는 공지된 프로모터 CBA의 활성과 비교하여 간세포 세포주 Huh7(즉, 비-근육 유래 세포)에서 본 발명의 구체예에 따른 다양한 합성된 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 도 4 및 도 5의 실험은 본 발명의 구체예에 따라 테스트된 근육-특이적 프로모터가 근육 특이적, 즉 이들은 다른 조직으로부터 유래된 세포와 비교하여 근육 세포 또는 근육-유래 세포에서 훨씬 더 높은 활성임을 나타낸 것이다.
- 도 6a는 도 1a 내지 c에 제시된 C2C12 세포의 데이터를 보여주지만, 합성된 근육-특이적 프로모터는 가장 높은 상대 활성을 갖는 프로모터를 우선으로 하여 C2C12 세포에서 분화된 골격 근관의 상대적인 활성을 기준으로 정렬되었다.
- 도 6b는 도 1a 내지 c에 제시된 H9C2 세포의 데이터를 보여주지만, 합성된 근육-특이적 프로모터는 가장 높은 상대 활성을 갖는 프로모터를 우선으로 하여 H9C2 세포에서 분화된 심장 근관의 상대적인 활성을 기준으로 정렬되었다.
- 도 7a는 도 2에 제시된 C2C12 세포의 데이터를 보여주지만, 합성된 근육-특이적 프로모터는 가장 높은 상대 활성을 갖는 프로모터를 우선으로 하여 C2C12 세포에서 분화된 골격 근관의 상대적인 활성을 기준으로 정렬되었다.
- 도 7b는 도 2에 제시된 H9C2 세포의 데이터를 보여주지만, 합성된 근육-특이적 프로모터는 가장 높은 상대 활성을 갖는 프로모터를 우선으로 하여 H9C2 세포에서 분화된 심장 근관의 상대적인 활성을 기준으로 정렬되었다.
- 도 8a 및 도 8b는 도 3a 내지 j에 제시된 H2K 2B4 세포의 데이터를 보여주지만, 합성된 근육-특이적 프로모터는 가장 높은 상대 활성을 갖는 프로모터를 우선으로 하여 H2K 2B4 세포에서 분화된 골격 근관의 상대적인 활성을 기준으로 정렬되었다.
- 도 9a 및 도 9b는 도 3a 내지 j에 제시된 H9C2 세포의 데이터를 보여주지만, 합성된 근육-특이적 프로모터는 가장 높은 상대 활성을 갖는 프로모터를 우선으로 하여 H9C2 세포에서 분화된 심장 근관의 상대적인 활성을 기준으로 정렬되었다.
- 도 10은 도 1a 내지 c에서 나타낸 실험에서 대조군 프로모터로 사용된 공지된 프로모터를 나타낸 것이다.
- 도 11a는 도 2에서 나타낸 실험에서 대조군 프로모터로 사용된 공지된 프로모터를 나타낸 것이다.
- 도 11b는 도 3a 내지 j에 나타낸 실험에서 대조군 프로모터로 사용된 공지된 프로모터를 나타낸 것이다.
- 도 12a 내지 d는 표시된 시스-조절 요소 및 최소 또는 근위 프로모터를 갖는 본 발명의 구체예에 따른 근육-특이적 프로모터의 개략도를 나타낸 것이다.
- 도 13a는 공지된 프로모터 CBA의 활성으로 정규화된, 골격 근관으로 분화된 C2C12 세포주에서 본 발명의 구체예에 따른 합성된 심장 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 CBA의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 13b는 공지된 프로모터 CBA의 활성으로 정규화된, 심장 근관으로 분화된 H9C2 세포주에서 본 발명의 구체예에 따른 합성된 심장 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 CBA의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 14a 및 b는 공지된 프로모터 CBA의 활성으로 정규화된, 골격 근관으로 분화된 H2K 2B4 및 심장 근관으로 분화된 H9C2 세포주에서 본 발명의 구체예에 따른 합성된 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 CBA의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 15a, b, c, d 및 e는 공지된 프로모터 CBA의 활성으로 정규화된, 심장 근관으로 분화된 H9C2 세포주에서 본 발명의 구체예에 따른 합성된 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 CBA의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 16a는 공지된 프로모터 CBA의 활성으로 정규화된, 골격 근관으로 분화된 H2K 세포주에서 본 발명의 구체예에 따른 합성된 심장 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 CBA의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 16b는 공지된 프로모터 CBA의 활성으로 정규화된, 심장 근관으로 분화된 H9C2 세포주에서 본 발명의 구체예에 따른 합성된 심장 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 CBA의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 17a는 심장에서의 합성된 근육-특이적 프로모터, 대조군 프로모터 CBA 및 CK8 뿐만 아니라 염수(saline) 음성 대조군의 생체 내 활성을 나타낸 것이다.
- 도 17b는 횡격막에서의 합성된 근육-특이적 프로모터, 대조군 프로모터 CBA CK8 및 염수 음성 대조군의 생체 내 활성을 나타낸 것이다.
- 도 17c는 대퇴사두근(quadriceps)에서의 합성된 근육-특이적 프로모터, 대조군 프로모터 CBA 및 CK8 뿐만 아니라 염수 음성 대조군의 생체 내 활성을 나타낸 것이다.
- 도 17d는 장(intestine)에서의 합성된 근육-특이적 프로모터, 대조군 프로모터 CBA 및 CK8 뿐만 아니라 염수 음성 대조군의 생체 내 활성을 나타낸 것이다.
- 도 17e는 전방 경골(tibialis anterior)에서의 합성된 근육-특이적 프로모터, 대조군 프로모터 CBA 및 CK8 뿐만 아니라 염수 음성 대조군의 생체 내 활성을 나타낸 것이다.
- 도 17f는 간에서의 합성된 근육-특이적 프로모터, 대조군 프로모터 CBA 및 CK8 뿐만 아니라 염수 음성 대조군의 생체 내 활성을 나타낸 것이다.
- 도 18a는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0173의 생체 내 활성을 나타낸 것이다.
- 도 18b는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0270의 생체 내 활성을 나타낸 것이다
- 도 18c는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0268의 생체 내 활성을 나타낸 것이다.
- 도 18d는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0320의 생체 내 활성을 나타낸 것이다.
- 도 18e는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0279의 생체 내 활성을 나타낸 것이다.
- 도 18f는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0134의 생체 내 활성을 나타낸 것이다.
- 도 18g는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0057의 생체 내 활성을 나타낸 것이다.
- 도 18f는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0229의 생체 내 활성을 나타낸 것이다.
- 도 18i는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0067의 생체 내 활성을 나타낸 것이다.
- 도 18j는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0310의 생체 내 활성을 나타낸 것이다.
- 도 18k는 횡격막, 심장, 장, 간, 대퇴사두근(quad) 및 전방 경골(TA)에서의 합성된 근육-특이적 프로모터 SP0267의 생체 내 활성을 나타낸 것이다.
- 도 19a는 마우스의 심장 근육에서 프로모터 SP0067의 생체 내 활성을 대조군 프로모터 CBA 및 CK8과 비교하여 나타낸 것이다.
- 도 19b는 마우스의 전방 경골(TA)에서 프로모터 SP0067의 생체 내 활성을 대조군 프로모터 CBA 및 CK8과 비교하여 나타낸 것이다.
- 도 20a 및 b는 공지된 프로모터 CBA의 활성에 대해 정규화된, 심장 근관으로 분화된 H9C2 세포주에서 본 발명의 일 구체예에 따른 합성된 근육-특이적 프로모터의 평균 활성을 나타낸 것이다. 상대적인 활성 1은 CBA의 활성과 같다. 오차 막대는 표준 편차이다.
- 도 21a는 H9C2 및 C2C12 세포에서 특정 수의 CRE(임의의 CRE)를 갖는 프로모터의 평균 활성과 비교하여 특정 수의 코어 심장 및 골격 CRE를 갖는 프로모터의 평균 활성을 나타낸 것이다. 프로모터의 활성은 공지된 프로모터 CBA 또는 RSV의 활성으로 정규화되었다. 1개 또는 2개의 코어 심장 및 골격 CRE의 존재는 1개 또는 2개의 임의의 CRE를 갖는 프로모터보다 증가된 활성과 연관성이 있다. 코어 심장 및 골격 CRE는 하기로 이루어진 그룹에서 선택된다: CRE0035 (서열번호 310), CRE0036 (서열번호 311), CRE0029 (서열번호 307), CRE0071 (서열번호 321), CRE0020 (서열번호 303), CRE0031 (서열번호 308). 도 21b는 H9C2 및 C2C12 세포에서 근육-특이적 프로모터의 큰 풀(pool)(그룹 'ALL') 및 적어도 2개의 코어 골격 및 심장 CRE를 포함하는 프로모터('그룹 1')의 평균 활성을 나타낸 것이다. '그룹 1'(n=9)의 평균 활성은 그룹 'ALL'(n=103)의 평균 활성보다 약 4배 높다.
- 도 22a는 H9C2 및 C2C12 세포에서 특정 수의 요소(임의의 CRE, 프로모터 요소 또는 UTR/인트론)를 갖는 프로모터의 평균 활성과 비교하여 특정 수의 코어 심장 및 골격 CRE 및 프로모터 요소를 갖는 프로모터의 평균 활성을 나타낸 것이다. 프로모터의 활성은 공지된 프로모터 CBA 또는 RSV의 활성으로 정규화되었다. 1개, 2개 또는 3개의 코어 심장 및 골격 CRE 및 프로모터 요소의 존재는 1개, 2개 또는 3개의 임의의 요소를 갖는 프로모터보다 증가된 활성과 연관성이 있다. 코어 심장 및 골격 CRE는 하기로 이루어진 그룹에서 선택된다: CRE0035(서열번호 310), CRE0036(서열번호 311), CRE0029(서열번호 307), CRE0071(서열번호 321), CRE0020(서열번호 303), CRE0031(서열번호 308). 코어 심장 및 골격 프로모터 요소는 하기로 이루어진 그룹에서 선택된다: CRE0037, CRE0070, SKM_18, CRE0010, CRE0049, CRE0048, CRE0011, SKM_14, CRE0046.
- 도 22b는 H9C2 및 C2C12 세포에서 근육-특이적 프로모터의 큰 풀(그룹 'ALL') 및 적어도 하나의 코어 골격 및 심장 CRE 및 적어도 하나의 코어 골격 및 심장 프로모터 요소를 포함하는 프로모터('그룹 2')의 평균 활성을 나타낸 것이다. '그룹 2'(n=20)의 평균 활성은 'ALL'(n=103)의 평균 활성보다 약 2배 높다.
- 도 23a는 H9C2 및 C2C12 세포에서 특정 수의 요소(임의의 CRE, 프로모터 요소 또는 UTR/인트론)를 갖는 프로모터의 평균 활성과 비교하여 특정 수의 코어 심장 및 골격 프로모터 요소를 갖는 프로모터의 평균 활성을 나타낸 것이다. 프로모터의 활성은 공지된 프로모터 CBA 또는 RSV의 활성으로 정규화되었다. 1개 또는 2개의 코어 심장 및 골격 프로모터 요소의 존재는 1개 또는 2개의 임의의 요소를 갖는 프로모터보다 증가된 활성과 연관성이 있다. 코어 심장 및 골격 프로모터 요소는 하기로 이루어진 그룹에서 선택된다: CRE0037, CRE0070, SKM_18, CRE0010, CRE0049, CRE0048, CRE0011, SKM_14, CRE0046.
- 도 23b는 H9C2 및 C2C12 세포에서 근육 특이적 프로모터의 큰 풀(그룹 'ALL') 및 적어도 2개의 코어 골격 및 심장 프로모터 요소를 포함하는 프로모터('그룹 3')의 평균 활성을 나타낸 것이다. '그룹 3'(n=2)의 평균 활성은 그룹 'ALL'(n=103)의 평균 활성보다 약 2배 높다.
- 도 24a는 C2C12 세포에서 특정 수의 CRE(임의의 CRE)를 갖는 프로모터의 평균 활성과 비교하여 특정 수의 코어 골격 CRE를 갖는 프로모터의 평균 활성을 나타낸 것이다. 프로모터의 활성은 공지된 프로모터 CBA 또는 RSV의 활성으로 정규화되었다. 1개 또는 2개의 코어 골격 CRE의 존재는 1개 또는 2개의 임의의 CRE를 갖는 프로모터보다 증가된 활성과 연관성이 있다. 코어 심장 및 골격 CRE는 하기로 이루어진 그룹에서 선택된다: CRE0035, CRE0050, CRE0020, CRE0031, CRE0047, CRE0071, DES_MT_enhancer_48bp.
- 도 24b는 C2C12 세포에서 근육 특이적 프로모터의 큰 풀(그룹 'ALL') 및 적어도 2개의 코어 골격 CRE를 포함하는 프로모터('그룹 3')의 평균 활성을 나타낸 것이다. '그룹 4'(n=6)의 평균 활성은 그룹 'ALL'(n=104)의 평균 활성보다 약 2배 높다.
- 도 25a는 C2C12 세포에서 특정 수의 요소(임의의 CRE, 프로모터 요소 또는 UTR/인트론)를 갖는 프로모터의 평균 활성과 비교하여 특정 수의 코어 골격 CRE 및 프로모터 요소를 갖는 프로모터의 평균 활성을 나타낸 것이다. 프로모터의 활성은 공지된 프로모터 CBA 또는 RSV의 활성으로 정규화되었다. 1개, 2개 또는 3개의 코어 골격 CRE 및 프로모터 요소의 존재는 1개, 2개 또는 3개의 임의의 요소를 갖는 프로모터에 비해 증가된 활성과 연관성이 있다. 코어 골격 CRE는 하기로 이루어진 그룹에서 선택된다: CRE0035, CRE0050, CRE0020, CRE0031, CRE0047, CRE0071, DES_MT_enhancer_48bp. 코어 골격 프로모터 요소는 하기로 이루어진 그룹에서 선택된다: CRE0049, CRE0037, SKM_14_CRE0048, CRE0011_RSV, CRE0070 및 CRE0046.
- 도 25b는 C2C12 세포에서 근육 특이적 프로모터의 큰 풀(그룹 'ALL') 및 적어도 하나의 코어 골격 CRE 및 적어도 하나의 코어 골격 프로모터 요소를 포함하는 프로모터('그룹 5')의 평균 활성을 나타낸 것이다. '그룹 5'(n=16)의 평균 활성은 그룹 'ALL'(n=104)의 평균 활성보다 약 2배 높다.
- 도 26a는 H9C2 세포에서 특정 수의 CRE(임의의 CRE)를 갖는 프로모터의 평균 활성과 비교하여 특정 수의 코어 심장 CRE를 갖는 프로모터의 평균 활성을 나타낸 것이다. 프로모터의 활성은 공지된 프로모터 CBA 또는 RSV의 활성으로 정규화되었다. 1개, 2개 또는 3개의 코어 심장 CRE의 존재는 1개, 2개 또는 3개의 임의의 CRE를 갖는 프로모터에 비해 증가된 활성과 연관성이 있다. 코어 심장 CRE는 하기로 이루어진 그룹에서 선택된다: CRE0035, CRE0029, CRE0069, CRE0071, CRE0036, CRE0096, CRE0079, CRE0051, CRE0031 및 CRE0020.
- 도 26b는 H9C2 세포에서 근육 특이적 프로모터의 큰 풀(그룹 'ALL') 및 적어도 2개의 코어 심장 CRE를 포함하는 프로모터('그룹 6')의 평균 활성을 나타낸 것이다. '그룹 6'(n=40)의 평균 활성은 그룹 'ALL'(n=285)의 평균 활성보다 약 2배 더 높다.
- 도 27a는 H9C2 세포에서 특정 수의 요소(임의의 CRE, 프로모터 요소 또는 UTR/인트론)를 갖는 프로모터의 평균 활성과 비교하여 특정 수의 코어 심장 CRE 및 프로모터 요소를 갖는 프로모터의 평균 활성을 나타낸 것이다. 프로모터의 활성은 공지된 프로모터 CBA 또는 RSV의 활성으로 정규화되었다. 1개, 2개 또는 3개의 코어 심장 CRE 및 프로모터 요소의 존재는 1개, 2개 또는 3개의 임의의 요소를 갖는 프로모터에 비해 증가된 활성과 연관성이 있다. 코어 심장 CRE는 하기로 이루어진 그룹에서 선택된다: CRE0035, CRE0029, CRE0069, CRE0071, CRE0036, CRE0096, CRE0079, CRE0051, CRE0031 및 CRE0020. 코어 심장 프로모터 요소는 하기이다: SKM_18, CRE0070, CRE0010_ITGB1BP2, CRE0037, DES_mp_V1 및 CRE0046.
- 도 27b는 H9C2 세포에서 근육 특이적 프로모터의 큰 풀(그룹 'ALL') 및 적어도 하나의 코어 심장 CRE 및 적어도 하나의 코어 심장 프로모터 요소를 포함하는 프로모터('그룹 7')의 평균 활성을 나타낸 것이다. '그룹 7'(n=73)의 평균 활성은 그룹 'ALL'(n=285)의 평균 활성보다 약 2배 더 높다.
- 도 28a는 H9C2 세포에서 특정 수의 요소(임의의 CRE, 프로모터 요소 또는 UTR/인트론)를 갖는 프로모터의 평균 활성과 비교하여 특정 수의 코어 심장 프로모터 요소를 갖는 프로모터의 평균 활성을 나타낸 것이다. 프로모터의 활성은 공지된 프로모터 CBA 또는 RSV의 활성으로 정규화되었다. 1개 또는 2개의 코어 심장 프로모터 요소의 존재는 1개 또는 2개의 임의의 요소를 갖는 프로모터에 비해 증가된 활성과 연관성이 있다. 코어 심장 및 골격 프로모터 요소는 하기로 이루어진 그룹에서 선택된다: SKM_18, CRE0070, CRE0010_ITGB1BP2, CRE0037, DES_mp_V1 및 CRE0046.
- 도 28b는 H9C2 세포에서 근육 특이적 프로모터의 큰 풀(그룹 'ALL') 및 적어도 2개의 코어 심장 프로모터 요소를 포함하는 프로모터('그룹 8')의 평균 활성을 나타낸 것이다. '그룹 8'(n=5)의 평균 활성은 그룹 'ALL'(n=285)의 평균 활성보다 약 3배 더 높다.
- 도 29a는 공지된 프로모터 CBA의 활성으로 정규화된, 심장 근관으로 분화된 H9C2 세포주에서 프로모터 요소 SKM_18 및 합성된 근육-특이적 프로모터 SP0067 및 SP00436의 평균 활성을 나타낸 것이다. 하나의 CRE0033(SP0067) 또는 두 개의 CRE0033(SP0436)을 추가하면 SKM_18에 비해 심장 근육의 활성이 증가한다. 오차 막대는 표준 편차이다.
- 도 29b는 공지된 프로모터 CBA의 활성으로 정규화된, 심장 근관으로 분화된 H9C2 세포주에서 합성된 근육-특이적 프로모터 SP0409 및 SP00418의 평균 활성을 나타낸 것이다. 합성 프로모터 SP0409에 CRE0090(SP0418)을 추가하면 SP0409에 비해 심장 근육의 활성이 증가한다. 오차 막대는 표준 편차이다.
- 도 29c는 공지된 프로모터 CBA의 활성으로 정규화된, 심장 근관으로 분화된 H9C2 세포주에서 합성된 근육-특이적 프로모터 SP0067 및 SP00451의 평균 활성을 나타낸 것이다. 합성 프로모터 SP0067에 CRE0090(SP0451)을 추가하면 SP0067에 비해 심장 근육의 활성이 증가한다. 오차 막대는 표준 편차이다.
CRE 및 이의 기능적 변이체:
근육-특이적 프로모터의 컨스트럭트에 사용될 수 있는 다양한 CRE가 본 명세서에 개시되어 있다. 이러한 CRE는 일반적으로 게놈 프로모터 및 인핸서 서열에서 유래하지만, 본 명세서에서는 본래의 게놈 환경과 상당히 다른 맥락에서 사용된다. 일반적으로, CRE은 이들이 보통 연관된 유전자의 발현을 제어하는, 더 큰 게놈 조절 도메인의 작은 부분을 구성한다. 놀랍게도 대부분이 매우 작은, 이러한 CRE이 다양한 합성된 프로모터를 구축하는 데 사용될 때 그들의 정상적인 환경에서 분리될 수 있고 근육-특이적 조절 활성을 유지할 수 있다는 것을 확인하였다. 게놈에서 복잡하고 "삼차원적인" 자연적 맥락으로부터 조절 서열을 제거하면 종종 활성의 현저한 상실로 이어지므로, 따라서 주어진 CRE가 일단 자연환경에서 제거된 후 관찰된 활성 수준을 유지할 것이라고 기대할 이유가 전혀 없다. 이러한 CRE의 많은 조합을 테스트하였고 최소 및 근위 프로모터와 조합할 때 근육-특이적 프로모터 활성을 향상시키는 데 매우 효과적임을 확인하였다. 본 발명의 CRE의 서열은 활성의 실질적 손실 없이도 변경될 수 있음을 유의해야 한다. CRE의 기능적 변이체는 CRE의 활성에 상당히 해로운 변형을 제외하는 한, CRE의 서열을 변형하여 준비할 수 있다. 본 개시에서 제공하는 정보의 관점에서, 기능적 변이체를 제공하는 CRE의 변형은 복잡하지 않다. 더욱이, 본 개시는 임의의 주어진 CRE 변이체의 기능을 단순히 평가하기 위한 방법론을 제공한다. 각 CRE의 기능적 변이체는 하기에서 논의한다.
본 발명에 따른 일부 CRE의 기능적 변이체를 표 11에 나타내었다. CRE0020.2(서열번호 411), CRE0093(서열번호 412), CRE0094(서열번호 413), CRE0093.2(서열번호 545) 및 CRE0094.2(서열번호 546)는 CRE0020(서열번호 303)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0117(서열번호 469)는 CRE0028(서열번호 306)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0029.2(서열번호 395)는 CRE0029(서열번호 307)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0108(서열번호 465)는 CRE0033(서열번호 309)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0050(서열번호 313) 및 CRE0099(서열번호 300)는 CRE0035(서열번호 310)의 기능적 변이체이다. DES_MT_enhancer_48bp(서열번호 547), DES_MT_enhancer_48bp_v2(서열번호 335), DES_MT_enhancer_48bp_v3(서열번호 336), DES_MT_enhancer_72bp(서열번호 400), DES_MT_enhancer_72bp_v2(서열번호 337), DES_MT_enhancer_72bp_v3(서열번호 338), DES_MT_enhancer_72bp_v4(서열번호 339), DES_MT_enhancer_72bp_v5(서열번호 340), DES_MT_enhancer_72bp_v6(서열번호 341), CRE0059(서열번호 317) 및 CRE0060(서열번호 318)는 CRE0047(서열번호 312)의 기능적 변이체이다. CRE0084(서열번호 404)는 CRE0052(서열번호 315)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0069.2(서열번호 396)는 CRE0069(서열번호 320)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0051(서열번호 314), CRE0071.2(서열번호 323), CRE0071.3(서열번호 293), CRE0071.4(서열번호 294), CRE0071.5(서열번호 537), CRE0071.6(서열번호 295), CRE0071.7(서열번호 331), CRE0071.8(서열번호 296), CRE0071.9(서열번호 297), CRE0071.10(서열번호 332), CRE0071.11(서열번호 333), CRE0071.12(서열번호 334), CRE0071.13(서열번호 397), CRE0071.14(서열번호 398), CRE0071.15(서열번호 399), CRE0071.16(서열번호 533), CRE0071.17(서열번호 534), CRE0071.18(서열번호 535), CRE0071.19(서열번호 536), CRE0071.20(서열번호 538), CRE0071.21(서열번호 539), CRE0071.22(서열번호 540), CRE0071.23(서열번호 541), CRE0071.24(서열번호 543)는 CRE0071(서열번호 321)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0074(서열번호 325) 및 CRE0075(서열번호 326)는 CRE0073(서열번호 324)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0077(서열번호 298)은 CRE0076(서열번호 327)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0092(서열번호 420)는 CRE0081(서열번호 402)의 기능적 변이체이고, 반대도 마찬가지이다. CRE0091(서열번호 410)는 CRE0090(서열번호 409)의 기능적 변이체이고, 반대도 마찬가지이다.
본 발명에 따른 특정 CRE의 비교적 작은 크기는 CRE, 보다 구체적으로 이를 함유하는 프로모터가 벡터의 페이로드의 최소량을 차지하면서 벡터에 제공될 수 있도록 하기 때문에 유리하다. 이는 AAV 기반 벡터와 같이, CRE를 용량이 제한된 벡터에서 사용할 때 특히 중요하다.
본 발명의 CRE는 특정 근육-특이적 TFBS를 포함한다. 일반적으로 CRE의 기능적 변이체에서 이러한 근육-특이적 TFBS가 기능적으로 유지되는 것이 바람직하다. 당업자는 TFBS 시퀀스가 다양하면서도 기능을 유지할 수 있음을 잘 인지하고 있다. 이러한 관점에서, TFBS의 서열은 어느 정도의 변이가 전형적으로 존재하는 공통 서열(consensus sequence)에 의해 설명된다. TFBS에서 발생하는 변이에 대한 추가 정보는 위치 가중치 행렬(positional weight matrix, PWM)을 사용하여 설명할 수 있고, 이는 주어진 뉴클레오티드가 일반적으로 공통 서열의 주어진 위치에서 발견되는 빈도를 나타낸 것이다. TF 공통 서열 및 관련 위치 가중치 행렬에 대한 세부 정보는, 예를 들어 Jaspar 또는 Transfac 데이터베이스 http://jaspar.genereg.net/ 및 http://gene-regulation.com/pub/databases.html에서 찾을 수 있다. 이 정보를 통해 당업자는 CRE 기능을 유지하고, 일부 경우에는 심지어 증가시키는 방식으로, CRE의 임의의 주어진 TFBS에서 서열을 변형할 수 있다. 이러한 관점에서 당업자는 원하는 TF와 결합하는 능력을 유지하면서, 임의의 주어진 TF에 대한 TFBS를 수정하는 방법에 대한 충분한 지침을 가진다; Jaspar 시스템은, 예를 들어, 주어진 PWM과의 유사성을 기반으로 추정 TFBS에 점수를 매긴다. 또한, JASPAR 데이터베이스의 모든 PWM에 대해 CRE를 스캔하여 모든 TFBS를 식별/분석할 수 있다. 당업자는 물론 문헌에서 추가 지침을 찾을 수 있으며, 더욱이, 일상적인 실험을 사용하여 임의의 변이체 CRE에서 추정 TFBS에 결합하는 TF를 확인할 수 있다. CRE의 TFBS 내에서도, 기능을 유지하면서 CRE의 상당한 서열 변형이 이루어질 수 있음은 명백하다.
합성된 근육-특이적 CRM 및 이의 기능적 변이체
합성된 근육-특이적 프로모터의 컨스트럭트에 사용할 수 있는 다양한 합성된 근육-특이적 CRM이 본 명세서에 개시되어 있다. 본 발명의 CRM은 광범위한 범위의 적절한 최소 프로모터 또는 근육-특이적 근위 프로모터와 조합하여 사용할 수 있다.
CRM의 기능적 변이체는 참조 CRM 요소와는 다르지만, 실질적으로 근육-특이적 CRM으로 활성을 유지하는 서열을 포함한다. 적절한 근육-특이적 전사 인자(TF)를 모집하여 발현을 향상시키는 능력을 유지하면서 CRM의 서열을 변화시킴이 가능하다는 것이 당업자에게 이해될 것이다. CRM의 기능적 변이체는 이들이 CRM을 실질적으로 비기능적으로 만들지 않는다면, 참조 CRM과 비교하여 대체, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, CRM의 기능적 변이체는 프로모터에서 참조 CRM 대신 치환될 때, 실질적으로 이의 활성을 유지하는 CRM으로 볼 수 있다. 예를 들어, 주어진 CRM의 기능적 변이체를 포함하는 근육-특이적 프로모터는 바람직하게는 활성의 80% 이상, 더 바람직하게는 활성의 90% 이상, 더 바람직하게는 활성의 95% 이상, 및 바람직하게는 활성의 100%를 포함한다(비변형 CRM을 포함하는 참조 프로모터와 비교하여).
적절하게는, CRM의 기능적 변이체는 참조 CRM에 대해 상당한 수준의 서열 동일성을 유지한다. 적절하게는 기능적 변이체는 참조 CRM과 적어도 70% 동일한 서열, 보다 바람직하게는 참조 CRM과 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다.
활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. 근육-특이적 프로모터 활성을 평가하기 위한 적절한 분석은 본 명세서, 예를 들어 실시예에 개시된다.
주어진 CRM의 기능적 변이체는, 일 구체예에 있어서, 참조 CRM에 존재하는 하나 이상의 CRE의 기능적 변이체를 포함할 수 있다. 예를 들어, 주어진 CRM의 기능적 변이체는 참조 CRM에 존재하는 CRE의 1, 2, 3, 4, 5, 또는 6개의 기능적 변이를 포함할 수 있다.
주어진 CRM의 기능적 변이체는, 일 구체예에 있어서, 참조 CRM과 동일한 조합의 CRE를 포함할 수 있지만, CRE는 참조 CRM과 다른 순서로 존재할 수도 있다. 일반적으로 CRE는 참조 CRM과 동일한 순서로 존재하는 것이 바람직하다(따라서, CRM의 기능적 변이체는 참조 CRM에 설정된 CRE의 동일한 순열을 적절하게 포함함).
주어진 CRM의 기능적 변이체는, 일 구체예에 있어서, 참조 CRM에 존재하는 것들에 적어도 하나의 추가 CRE를 포함할 수 있다. 추가 CRE는 참조 CRM에 존재하는 CRE의 상류, 참조 CRM에 존재하는 CRE의 하류, 및/또는 참조 CRM에 존재하는 CRE 사이에 제공될 수 있다. 추가 CRE는 본 명세서에 개시된 CRE이거나, 그밖의 CRE일 수 있다. 일반적으로, 주어진 CRM의 기능적 변이체는 동일한 CRE(또는 이의 기능적 변이체)을 포함하고 추가 CRE를 포함하지 않는 것이 바람직하다.
주어진 CRM의 기능적 변이체는 참조 CRM과 비교하여 적어도 하나의 추가 조절 요소를 포함할 수 있다. 예를 들어, 이는 CRM이 실질적으로 기능을 하지 못하게 하지 않는 한, 유도성 또는 억제성 요소(inducible or repressible element), 경계 제어 요소(boundary control element), 인슐레이터(insulator), 유전자좌 제어 영역(locus control region), 반응 요소(response element), 결합 부위(binding site), 말단 반복의 세그먼트(segment of a terminal repeat), 반응 부위(responsive site), 안정화 요소(stabilizing element), 탈안정화 요소(de-stabilizing element), 및 스플라이싱 요소(splicing element) 등이다.
주어진 CRM의 기능적 변이체는 인접한 CRE 사이에 추가 스페이서를 포함할 수 있고, 또는 적어도 하나의 스페이서가 참조 CRM에 존재하는 경우, 상기 하나 이상의 스페이서는 참조 CRM보다 길거나 짧을 수 있다.
본 명세서에 개시된 바와 같은 CRM, 또는 이의 기능적 변이체는 본 발명에 따른 합성된 근육-특이적 프로모터를 제공하기 위해 임의의 적합한 프로모터 요소와 조합될 수 있음이 명백할 것이다.
많은 경우에, 특히 벡터(예를 들어, AAV와 같은 바이러스 벡터)가 제한된 용량을 갖는 상황에서 사용하기 위해서는, 더 짧은 프로모터 서열이 바람직하다. 따라서, 일 구체예에 있어서 합성된 근육-특이적 CRM은 500개 이하의 뉴클레오티드, 예를 들어 450개, 400개, 350개, 300개, 250개, 200개, 150개, 100개, 75개, 60개, 50개 또는 이하의 뉴클레오티드의 길이를 갖는다.
프로모터 요소 및 이의 기능적 변이체:
본 발명의 CRE 및 CRM은 총괄하여 프로모터 요소라고 지칭되는, 광범위한 적절한 최소 프로모터 또는 근육-특이적 근위 프로모터와 조합하여 사용할 수 있다.
프로모터 요소의 기능적 변이체는 참조 프로모터 요소와 다르지만, 실질적으로 근육-특이적 프로모터 요소로서 활성을 유지하는 서열을 포함한다. 발현을 촉진하는 능력을 유지하면서 프로모터 요소의 서열을 변화시킴이 가능하다는 것이 당업자에게 이해될 것이다. 프로모터 요소의 기능적 변이체는 이들이 프로모터 요소를 실질적으로 비기능적으로 만들지는 않는한, 참조 프로모터 요소와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
일 구체예에 있어서, 프로모터 요소의 기능적 변이체는 프로모터에서 참조 프로모터 요소 대신 치환될 때, 실질적으로 이의 활성을 유지하는 프로모터 요소로 볼 수 있다. 예를 들어, 주어진 프로모터의 기능적 변이체를 포함하는 근육 특이적 합성 프로모터는 바람직하게는 활성의 80% 이상, 더 바람직하게는 활성의 90% 이상, 더 바람직하게는 활성의 95% 이상, 및 바람직하게는 활성의 100%를 유지한다(비변형 CRM을 포함하는 참조 프로모터와 비교하여).
적절하게는, 프로모터 요소의 기능적 변이체는 참조 프로모터 요소에 대해 상당한 수준의 서열 동일성을 유지한다. 적절하게는 기능적 변이체는 참조 프로모터 요소와 적어도 70% 동일한 서열, 보다 바람직하게는 참조 프로모터 요소와 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다.
활성의 유지는 동등한 조건 하에서 참조 프로포터와, 치환된 CRE를 포함하고 그 외에는 동일한 프로모터의 조절 하에서 적절한 리포터의 발현을 비교함으로써 평가할 수 있다. 근육 특이적 프로모터 활성을 평가하기 위한 적절한 분석은 본 명세서, 예를 들어 실시예에 개시된다.
본 발명에 따른 일부 프로모터 요소의 기능적 변이체는 표 11에 나타낸 바와 같다. 예를 들어, CRE0055(서열번호 282), CRE0056(서열번호 283) 및 CRE0072(서열번호 286)는 CRE0010_ITGB1BP2(서열번호 272)의 기능적 변이체이고 반대도 마찬가지이다. CRE0034(서열번호 274)는 CRE0049(서열번호 278)의 변이체이고, 이의 반대도 마찬가지이다. CRE0053. 2(서열번호 280)는 CRE0053(서열번호 279)의 기능적 변이체이고 이의 반대도 마찬가지이다. CRE0054(서열번호 281) 및 CRE0046(서열번호 276)는 CRE0070(서열번호 284)의 기능적 변이체이고 이의 반대도 마찬가지이다.
합성된 근육-특이적 프로모터 및 이의 기능적 변이체:
다양한 합성된 근육-특이적 프로모터가 본 명세서에 개시되어 있다. 참조 합성된 근육-특이적 프로모터의 기능적 변이체는 참조 합성된 근육-특이적 프로모터와 다르지만, 실질적으로 근육-특이적 프로모터의 활성을 유지하는 서열을 포함하는 프로모터이다. 작동가능하게 연결된 서열(예를 들어, 오픈 리딩 프레임(open reading frame))의 근육 특이적 발현을 제공하기 위해 적합한 근육 특이적 전사 인자(TF)를 모집하고 RNA 폴리머라제 II를 모집하는 능력을 유지하면서, 합성된 근육-특이적 프로모터의 서열을 변화시키는 것이 가능하다는 것이 당업자에 의해 인식될 것이다. 이러한 치환, 결실 및/또는 삽입이 참조 프로모터에 비해 합성된 근육-특이적 프로모터를 실질적으로 비기능적으로 만들지 않는한, 합성된 근육-특이적 프로모터의 기능적 변이체는 참조 프로모터와 비교하여 치환, 결실 및/또는 삽입을 포함할 수 있다.
따라서, 일 구체예에 있어서, 합성된 근육-특이적 프로모터의 기능적 변이체는 참조 프로모터의 근육-특이적 프로모터 활성을 실질적으로 유지하는 변이체로 볼 수 있다. 예를 들어, 합성된 근육-특이적 프로모터의 기능적 변이체는 참조 프로모터의 활성의 70% 이상, 바람직하게는 활성의 80% 이상, 더 바람직하게는 활성의 90% 이상, 더 바람직하게는 활성의 95% 이상, 및 바람직하게는 활성의 100%를 유지한다.
합성된 근육-특이적 프로모터의 기능적 변이체는 종종 참조 합성된 근육-특이적 프로모터와 상당한 수준의 서열 유사성을 유지한다. 일 구체예에 있어서, 기능적 변이체는 참조 합성된 근육-특이적 프로모터와 적어도 70% 동일한 서열, 보다 바람직하게는 참조 합성된 근육-특이적 프로모터와 적어도 80%, 90%, 95% 또는 99% 동일한 서열을 포함한다.
기능적 변이체의 활성은 동등한 조건 하에서 참조 합성된 근육-특이적 프로모터의 제어 하에 적합한 리포터의 발현을 추정(putative) 기능적 변이체와 비교하여 평가할 수 있다. 근육-특이적 프로모터 활성을 평가하기 위한 적절한 분석은 본 명세서, 예를 들어 실시예에 개시된다.
주어진 합성된 근육-특이적 프로모터의 기능적 변이체는 참조 합성된 근육-특이적 프로모터에 존재하는 하나 이상의 CRE의 기능적 변이체를 포함할 수 있다. 예를 들어, 주어진 CRM의 기능적 변이체는 참조 CRM에 존재하는 1, 2, 3, 4, 5, 또는 6개의 CRE를 포함할 수 있다. CRE의 기능적 변이체는 위에서 논의된다.
주어진 합성된 근육-특이적 프로모터의 기능적 변이체는 참조 합성된 근육-특이적 프로모터와 비교할 때 프로모터 요소의 기능적 변이체, 또는 상이한 프로모터 요소를 포함할 수 있다.
주어진 합성된 근육-특이적 프로모터의 기능적 변이체는 참조 합성된 근육-특이적 프로모터와 동일한 CRE를 포함할 수 있지만, CRE는 참조 합성된 근육-특이적 프로모터와 다른 순서로 존재할 수 있다.
주어진 합성된 근육-특이적 프로모터의 기능적 변이체는 참조 합성된 근육-특이적 프로모터에 존재하는 하나 이상의 추가 CRE를 포함할 수 있다. 추가 CRE는 참조 CRM에 존재하는 CRE의 상류, 참조 근육-특이적 프로모터에 존재하는 CRE의 하류, 및/또는 참조 근육-특이적 프로모터에 존재하는 CRE 사이에 제공될 수 있다. 추가 CRE는 본 명세서에 개시된 CRE거나, 그밖의 CRE일 수 있다.
주어진 CRM의 기능적 변이체는 참조 CRM과 비교하여 하나 이상의 추가 조절 요소를 포함할 수 있다. 이는 프로모터를 실질적으로 비기능적이지 않게 하는 한, 예를 들어, 유도성 요소, 인트론 요소(intronic element), 경계 제어 요소(boundary control element), 인슐레이터(insulator), 유전자좌 제어 영역(locus control region), 반응 요소(response element), 결합 부위, 말단 반복의 세그먼트(segment of a terminal repeat), 반응 부위, 안정화 요소, 탈안정화 요소, 및 스플라이싱 요소 등을 포함할 수 있다.
주어진 합성된 근육-특이적 프로모터의 기능적 변이체는 인접한 CRE와 프로모터 요소 사이에 추가 스페이서를 포함할 수 있고, 또는 하나 이상의 스페이서가 참조 합성된 근육-특이적 프로모터에 존재하는 경우, 상기 하나 이상의 스페이서는 참조 합성된 근육-특이적 프로모터보다 길거나 짧을 수 있다.
본 발명의 합성된 근육-특이적 프로모터는 본 발명의 CRM 및 추가 조절 서열을 포함할 수 있음이 명백할 것이다. 이는 예로서 프로모터를 실질적으로 기능을 하지 못하게 하지 않는 한, 예를 들어, 하나 이상의 추가 CRM, 유도성 또는 억제성 요소, 경계 제어 요소, 인슐레이터, 유전자좌 제어 영역, 반응 요소, 결합 부위, 말단 반복의 세그먼트, 반응 부위, 안정화 요소, 탈안정화 요소, 및 스플라이싱 요소 등을 포함할 수 있다.
본 발명의 바람직한 합성된 근육-특이적 프로모터는 근육 세포에서 CBA 또는 RSV 프로모터가 나타내는 활성의 적어도 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 125%, 150%, 175%, 200%, 250%, 300%, 350% 또는 400%인 근육-특이적 프로모터 활성을 나타낸다. 많은 경우에 더 높은 수준의 프로모터 활성이 바람직하지만, 항상 그렇지는 않다; 따라서, 어떤 경우에는 보다 적당한 수준의 발현이 바람직할 수 있다. 일부 경우에, 발현 수준이 요구사항에 맞게 조정될 수 있도록 다양한 활성 수준의 이용가능한 범위의 프로모터를 갖는 것이 바람직하다; 본 개시는 그러한 범위의 활성을 갖는 프로모터를 제공한다. CBA 또는 RSV와 비교되는 본 발명의 주어진 합성된 근육-특이적 프로모터의 활성은, 두 프로모터가 다른 동등한 발현 컨스트럭트 및 동등한 조건에 주어지는 경우, 합성된 근육-특이적 프로모터에 의해 제어되는 리포터 유전자의 근육-특이적 발현과 CBA 또는 RSV 프로모터에 의해 제어되는 동일한 리포터의 발현을 비교하여 평가할 수 있다.
일 구체예에 있어서, 본 발명의 합성된 근육-특이적 프로모터는 개체의 근육 또는 근육 세포에서 유전자(예를 들어, 치료 유전자 또는 관심 유전자)의 발현을, 공지된 근육-특이적 프로모터, 적절하게는 SPc5-12 프로모터에 비해(Gene Ther. 2008 Nov;15(22):1489-99) 적어도 20%, 적어도 40%, 적어도 60%, 적어도 80%, 적어도 100%, 적어도 200%, 적어도 300%, 적어도 500%, 적어도 1000% 또는 그 이상 증가시키는 것이 가능하다.
본 발명의 바람직한 합성 근육-특이적 프로모터는 비-근육 세포(예를 들어, Huh7 및 HEK293 세포)에서 CMV-IE와 비교할 때 50% 이하인 활성을 나타내고, 바람직하게는 CMV-IE보다 25% 이하, 더욱 바람직하게는 CMV-IE보다 10% 이하, 및 일부 경우에는 CMV-IE보다 5% 이하, 또는 CMV-IE보다 1% 이하의 활성을 나타낸다.
많은 경우에, 특히 벡터(예를 들어, AAV와 같은 바이러스 벡터)가 제한된 용량을 갖는 상황에서 사용하기 위해, 보다 짧은 프로모터 서열이 바람직하다. 따라서, 일 구체예에 있어서 합성된 근육-특이적 프로모터는 700개 이하의 뉴클레오티드, 예를 들어 600개, 500개, 450개, 400개, 350개, 300개, 250개, 200개, 150개, 100개, 75개, 70개, 68개 또는 그 이하의 뉴클레오티드 길이를 갖는다.
특히 바람직한 합성된 근육-특이적 프로모터는 짧으면서 높은 수준의 활성을 나타내는 것이다.
합성된 근육-특이적 발현 카세트:
본 발명은 또한 발현 산물, 적절하게는 유전자(예를 들어, 이식유전자)를 코딩하는 서열에 작동가능하게 연결된 본 발명의 합성된 근육-특이적 프로모터를 포함하는 합성된 근육-특이적 발현 카세트를 제공한다.
유전자는 전형적으로 폴리펩티드(단백질) 또는 RNA와 같은 원하는 유전자 발현 산물을 코딩한다. 유전자는 전장 cDNA 또는 게놈 DNA 서열, 또는 적어도 일부 원하는 생물학적 활성을 갖는 이의 단편, 서브유닛 또는 돌연변이체일 수 있다.
유전자가 단백질을 코딩하는 경우 본질적으로 모든 유형의 단백질일 수 있다. 비제한적인 예시로서, 단백질은 효소, 항체 또는 항체 단편(예로서, 모노클로날 항체), 바이러스 단백질(예로서, REP-CAP, REV, VSV-G, 또는 RD114), 치료 단백질, 또는 독성 단백질(예로서, Caspase 3, 8 또는 9)일 수 있다.
본 발명의 바람직한 일 구체예에 있어서, 상기 유전자는 선택적으로 근육에서, 선택적으로 심장 근육에서, 비정상적인 유전자 발현과 관련된 질병 또는 병증을 치료하는데 사용하기에 적합한 치료적 발현 산물, 바람직하게는 치료용 폴리펩티드를 코딩한다.
일 구체예에 있어서, 치료적 발현 산물은 근육 질병의 치료에 유용한 것을 포함한다. 용어 "근육 질병(muscular disease)"은 원칙적으로, 당업자에 의해 이해된다. 상기 용어는 활성 화합물을 근육, 특히 근육 세포에 투여함으로써 치료 및/또는 예방할 수 있는 질병에 관한 것이다. 일 구체예에 있어서, 상기 근육 질병은 골격 근육 질병이다. 일 구체예에 있어서, 상기 근육 질병은 심장 근육 질병이다.
일 구체예에 있어서, 상기 근육 질병은 혈관 질병(vascular disease), 근이영양증(muscular dystrophy), 심근병증(cardiomyopathy), 근긴장증(myotonia), 근위축(muscular atrophy), 간대성 근긴장이상(myoclonus dystonia)(영향 유전자: SGCE), 미토콘드리아 근병증(mitochondrial myopathy), 횡문근융해증(rhabdomyolysis), 섬유근육통(fibromyalgia), 및/또는 근막 통증 증후군(myofascial pain syndrome)이다.
일 구체예에 있어서, 상기 질병은 심혈관 질병 또는 심장 질병 및 장애일 수 있다. 일 구체예에 있어서, 상기 질병은 울혈성 심부전과 같은 심부전일 수 있다. 일 구체예에 있어서, 상기 질병은 허혈(ischemia), 부정맥(arrhythmia), 심근경색증(myocardial infarction, MI), 비정상 심장 수축(abnormal heart contractility), 비허혈성 심근병증(non-ischemic cardiomyopathy), 말초 동맥 폐쇄 질병(peripheral arterial occlusive disease), 및 비정상 Ca2+ 대사(abnormal Ca2+ metabolism), 및 이들의 조합으로부터 선택될 수 있다. 일 구체예에 있어서, 상기 질병은 울혈성 심부전(congestive heart failure), 심근병증(cardiomyopathy), 심근경색증, 조직 허혈(tissue ischemia), 심장 허혈(cardiac ischemia), 혈관 질병(vascular disease), 후천성 심장 질병(acquired heart disease), 선천성 심장 질병(congenital heart disease), 죽상동맥경화증(atherosclerosis), 기능장애성 전도 시스템(dysfunctional conduction systems), 기능장애성 관상동맥(dysfunctional coronary arteries), 폐 심장 고혈압(pulmonary heart hypertension)으로부터 선택될 수 있다. 일 구체예에 있어서, 상기 질병은 울혈성 심부전, 관상동맥 질병(coronary artery disease), 심근경색증, 심근 허혈(myocardial ischemia), 동맥경화증(atherosclerosis), 심근병증(cardiomyopathy), 특발성 심근병증(idiopathic cardiomyopathy), 심부정맥(cardiac arrhythmias), 근이영양증(muscular dystrophy), 근육량 이상(muscle mass abnormality), 근육 변성(muscle degeneration), 감염성 심근염(infective myocarditis), 약물- 또는 독소-유발 근육 이상(drug- or toxin-induced muscle abnormalities), 과민성 심근염(hypersensitivity myocarditis), 자가면역 심내막염(autoimmune endocarditis) 및 선천성 심장병(congenital heart disease)으로부터 선택될 수 있다.
일 구체예에 있어서, 상기 심근병증은 비대성 심근병증(hypertrophic cardiomyopathy), 부정맥원성 우심실 이형성증(arrhythmogenic right ventricular dysplasia), 확장성 심근병증(dilated cardiomyopathy), 제한성 심근병증(restrictive cardiomyopathy), 좌심실 비압축성(left ventricular noncompaction), 타코츠보 심근병증(Takotsubo cardiomyopathy), 심근염(myocarditis), 호산구성 심근염(eosinophilic myocarditis), 및 허혈성 심근병증(ischemic cardiomyopathy)이다. 바람직하게는, 상기 비대성 심근병증은 CMH1(유전자: MYH7), CMH2(유전자: TNNT2), CMH3(유전자: TPM1), CMH4(유전자: MYBPC3), CMH5, CMH6(유전자: PRKAG2), CMH7(유전자: TNNI3), CMH8(유전자: MYL3), CMH9(유전자: TTN), CMH10(유전자: MYL2), CMH11(유전자: ACTC1), 또는 CMH12(유전자: CSRP3)이다. 바람직하게는, 상기 부정맥성 우심실 이형성증은 ARVD1(유전자: TGFB3), ARVD2(유전자: RYR2), ARVD3, ARVD4, ARVD5(유전자: TMEM43), ARVD6, ARVD7(유전자: DES), ARVD8(유전자: DSP), ARVD9(유전자: PKP2), ARVD10(유전자: DSG2), ARVD11(유전자: DSC2), 및/또는 ARVD12(유전자: JUP)이다.
일 구체예에 있어서, 상기 근육 질병은 혈관 질병(vascular disease)이다. 상기 혈관 질병은 관상 동맥 질병, 말초 동맥 질병, 뇌혈관 질병, 신동맥 협착증 또는 대동맥류일 수 있다. 일부 실시양태에서, 근육 질병은 심근병증일 수 있다. 심근병증은 고혈압성 심장 질병, 심부전(예를 들어, 울혈성 심부전), 폐 심장 질병, 심장 부정맥, 염증성 심장 질병(예를 들어, 심내막염, 염증성 심근 비대, 심근염), 판막 심장 질병, 선천성 심장 질병 및 류마티스성 심장 질병일 수 있다.
일 구체예에 있어서, 상기 근이영양증은 뒤센 근이영양증(Duchenne muscular dystrophy)(영향받는 유전자: DMD), 베커 근이영양증(Becker muscular dystrophy)(영향받는 유전자: DMD), 사지대근이영양증(Limb girdle muscular dystrophy)(아형 및 영향받는 유전자: LGMD1A(유전자: TTID), LGMD1B(유전자: LMNA), LGMD1C(유전자: CAV3), LGMD1D(유전자: DNAJB6), LGMD1E(유전자: DES), LGMD1F(유전자: TNP03), LGMD1G(유전자: HNRPDL), LGMD1H, LGMD2A(유전자: CAPN3), LGMD2B(유전자: DYSF), LGMD2C(유전자: SGCG), LGMD2D(유전자: SGCA), LGMD2E(유전자: SGCB), LGMD2F(유전자: SGCD), LGMD2G(유전자: TCAP), LGMD2H(유전자: TRIM32), LGMD2I(유전자: FKRP), LGMD2J(유전자: TTN), LGMD2K(유전자: POMT1), LGMD2L(유전자: AN05), LGMD2M(유전자: FKTN), LGMD2N(유전자: POMT2), LGMD20(유전자: POMGNT1), LGMD2Q(유전자: PLEC1)), 선천성 근이영양증(Congenital muscular dystrophy), 원위성 근이영양증(Distal muscular dystrophy)(아형 및 영향받는 유전자: 미요시 근병증(유전자: DYSF), 경골 전방 발병이 있는 원위성 근이영양증(Distal myopathy with anterior tibial onset)(유전자: DYSF), 웰렌더 원위성 근병증(Welander distal myopathy)(유전자: TIA1), 고워-라잉 말단 근병증(Gowers-Laing distal myopathy)(유전자: MYH7), 노나카 근이영양증(Nonaka distal myopathy), 유전성 봉입체 근염 제1형(hereditary inclusion-body myositis type 1), 성대 및 인두 쇠약을 동반한 원위성 근병증(distal myopathy with vocal cord 및 pharyngeal weakness), ZASP-연관 근병증(ZASP-related myopathy), 안면견갑상완형 근이영양증(Facioscapulohumeral muscular dystrophy)(아형 및 영향받는 유전자: 제1형(유전자: DUX4), 제2형(유전자: SMCHD1)), 안구인두근 위축증(Oculopharyngeal muscular dystrophy)(영향받는 유전자: PABPN1), 및/또는 근육긴장성 이영양증(myotonic dystrophy)(아형 및 영향받는 유전자: DM1(유전자: DMPK) 및 DM2(유전자: ZNF9))이다.
일 구체예에 있어서, 상기 근긴장증은 선천성 근무력증(congenital myotonia)(영향받는 유전자: CLCN1; 아형: Type Thomsen, Type Becker) 및/또는 선천성 이상근긴장증(Paramyotonia congenital)(영향받는 유전자: SCN4A)이다.
일 구체예에 있어서, 상기 근육 질병은 뒤센 근이영양증(유전자: DMD), 근세관성 근증(myotubular myopathy)(유전자: MTM1), 척수성 근위축증(Spinal muscular atroph)(유전자: SMA), 2형 당원 축적병(Glycogen storage disease type II)(폼페병(Pompe disease), 유전자: GAA), 또는 심근병증(cardiomyopathy)이다.
일 구체예에 있어서, 유전자는 비-질병 매개 변이체, 예를 들어, DMD GALGT2, SMA, GAA, MTM1, TTID, LMNA, CAV3, DNAJB6, DES, TNP03, HNRPDL, CAPN3, DYSF, SGCG, SGCA, SGCB, SGCD, TCAP, TRIM32, FKRP, TTN, POMT1, AN05, FKTN, POMT2, PFEC1, DYSF, TIA1, MYH7, DUX4, SMCHD, PABPN1, DMPK, ZNF9, CFCN1, SCN4A, MYH7, TNNT2, TPM1, MYBPC3, PRKAG2, TNNI3, MYF3, TTN, MYF2, ACTC1, CSRP3, TGFB3, RYR2, TMEM43, DES, DSP, PKP2, DSG2, DSC2, JUP, 및 HYPP로 이루어진 그룹에서 선택되는 적어도 하나의 인간 유전자의 야생형 변이체를 코딩한다.
추가의 예시적인 근육 조직-관련 질병은 산성 말타제 결핍(Acid Maltase Deficiency, AMD), 알파-1 항트립신 결핍(alpha-1 antitrypsin deficiency), 근위축성 측삭 경화증(Amyotrophic Lateral Sclerosis, ALS), 안데르센-타윌 증후군(Andersen-Tawil Syndrome), 베커 근이영양증(Becker Muscular Dystrophy, BMD), 선천성 베커 근긴장증(Becker Myotonia Congenita), 베드레헴 근병증(Bethlem Myopathy), 카르티닌 결핍증(Carnitine Deficiency), 카르티닌 팔미토일 전환 효소 결핍증(Carnitine Palmityl Transferase Deficiency, CPT Deficiency), 중심핵병(Central Core Disease, CCD), 중심핵 근병증(Centronuclear Myopathy), 샤르코-마리- 투스병(Charcot-Marie- Tooth Disease, CMT), 선천성 근무력증 증후군(Congenital Myasthenic Syndromes, CMS), 선천성 근긴장이영양증(Congenital Myotonic Dystrophy), 코리병(Cori Disease)(디브랜처 효소(Debrancher Enzyme) 결핍), 디브랜처 효소 결핍증, 데체린병(Dejerine-Sottas Disease, DSD), 피부근염(Dermatomyositis, DM), 내분비 근육병증(Endocrine Myopathies), 오일렌부르그 병(Eulenberg Disease, 선천성 이상근긴장증(Paramyotonia Congenita)), 포브스병(Forbes Disease, 디브랜처 효소 결핍), 프리드리히 실조증(Friedreich's Ataxia, FA), 글리코겐증 제10형(Glycogenosis Type 10), 글리코겐증 제11형, 글리코겐증 제2형, 글리코겐증 제3형, 글리코겐증 제5형, 글리코겐증 제7형, 글리코겐증 제9형, 고워-라잉 말단 근병증, 호프만-탄휴저 근이영양증(Hauptmann-Thanheuser MD)(에머리- 드레이푸스 근이영양증, Emery- Dreifuss Muscular Dystrophy), 유전성 봉입체 근염(Hereditary Inclusion-Body Myositis), 유전성 운동 및 감각 신경병증(Hereditary Motor and Sensory Neuropathy, 샤르코-마리-투스병), 갑상선기능항진 근병증(Hyperthyroid Myopathy), 갑상선기능저하 근병증(Hypothyroid Myopathy), 봉입체 근육염(Inclusion-Body Myositis, IBM), 유전성 근병증(Inherited Myopathies), 인테그린-결핍 선천성 근이영양증(Integrin-Deficient Congenital Muscular Dystrophy), 젖산 탈수소효소 결핍증(Lactate Dehydrogenase Deficiency), 램버트-이튼 근무력증 증후군(Lambert-Eaton Myasthenic Syndrome, LEMS), 맥아들 병(McArdle Disease, 인산화효소 결핍(Phosphorylase Deficiency)), 근육의 대사성 질병(Metabolic Diseases of Muscle), 미토콘드리아 근병증(Mitochondrial Myopathy), 미요시 말단 근병증(Miyoshi Distal Myopathy), 운동 신경 질병(Motor Neurone Disease), 근육-눈-뇌 질병(Muscle-Eye-Brain Disease), 중증근무력증(Myasthenia Gravis, MG), 미오아데닐산염 탈아미노효소 결핍증(Myoadenylate Deaminase Deficiency), 근섬유 근병증(Myofibrillar Myopathy), 근인산화효소 결핍증(Myophosphorylase Deficiency), 선천성 근육강직(Myotonia Congenita, MC), 근위축성 근이영양증(Myotonic Muscular Dystrophy, MMD), 근세관성 근병증(Myotubular Myopathy, MTM 또는 MM), 네말린 근병증(Nemaline Myopathy), 노나카 원위 근이영양증(Nonaka Distal Myopathy), 안 인후근 이영양증(Oculopharyngeal Muscular Dystrophy, OPMD), 선천성 이상근긴장증(Paramyotonia Congenita), 피어슨 증후군(Pearson Syndrome), 주기성 마비(Periodic Paralysis), 비골근위축(Peroneal Muscular Atrophy, 샤르코-마리-투스병), 포스포프룩토키나아제 결핍증(Phosphofructokinase Deficiency), 포스포글리세린산 키나아제 결손증(Phosphoglycerate Kinase Deficiency), 포스포글리세린산 뮤타제 결핍증(Phosphoglycerate Mutase Deficiency), 인산화효소 결핍증(Phosphorylase Deficiency), 인산화효소 결핍증(Phosphorylase Deficiency), 다발근염(Polymyositis, PM), 폼페병(Pompe Disease, 산 말타제 결핍증(Acid Maltase Deficiency)), 진행성 외안 근마비(Progressive External Ophthalmoplegia, PEO), 로드 바디 질병(Rod Body Disease, 네말린 근병증(Nemaline Myopathy)), 척수성 근 위축증(Spinal Muscular Atrophy, SMA), 척수-연수 근육 위축(Spinal-Bulbar Muscular Atrophy, SBMA), 스타이네르트병(Steinert Disease, 근육긴장이상 근위축증(Myotonic Muscular Dystrophy)), 타루이병(Tarui Disease, 포스포프럭토키나아제 결핍증 (Phosphofructokinase Deficiency)), 톰센병(Thomsen Disease), 선천성 근긴장증(Myotonia Congenita)), 울리히 선천성 근위축증(Ullrich Congenital Muscular Dystrophy), 워커-워버그 증후군(Walker-Warburg Syndrome, 선천성 근위축증(Congenital Muscular Dystrophy)), 웰랜더 원위성 근병증(Welander Distal Myopathy), 및 ZASP-관련 근병증(ZASP-Related Myopathy)를 포함하나, 이에 제한되지 않는다.
바람직한 일 구체예에 있어서, 상기 근육 질병은 심장 근육 질병이다. 바람직한 일 구체예에 있어서, 상기 근육 질병은 울혈성 심부전이다.
일 구체예에 있어서, 유용한 발현 산물은 디스트로핀(dystrophins, 마이크로 디스트로핀 포함), 베타 1,4-n-아세틸갈락토사민 갈락토실트랜스퍼라제(beta 1,4-n-acetylgalactosamine galactosyltransferase, GALGT2), 카르바모일 합성효소 I(carbamoyl synthetase I), 알파-1 항트립신(alpha-1 antitrypsin), 오르니틴 트랜스카르바밀라제(ornithine transcarbamylase), 아르기노숙시네이트 합성효소(arginosuccinate synthetase), 아르기노숙신산분해효소(arginosuccinate lyase), 아르기나아제(arginase), 푸마릴아세토아세테이트 하이드로라아제(fumarylacetacetate hydrolase), 페닐알라닌 수산화효소(phenylalanine hydroxylase), 글루코스-6-포스파타제(glucose-6-phosphatase), 포르포빌리노겐 탈아미노효소(porphobilinogen deaminase), 시스타티온 베타-신타제(cystathione beta-synthase), 분지쇄 케토산 탈탄산효소(branched chain ketoacid decarboxylase), 알부민(albumin), 이소발레릴-coA 탈수소효소(isovaleryl-coA dehydrogenase), 프로피오닐 CoA 카르복실라제(propionyl CoA carboxylase), 메틸 말로닐 CoA 뮤타제(methyl malonyl CoA mutase), 글루타릴 CoA 탈수소효소(glutaryl CoA dehydrogenase), 인슐린, 베타-글루코시다아제(beta-glucosidase), 피루베이트 카르복실레이트(pyruvate carboxylate), 간 인산화효소(hepatic phosphorylase), 인산화효소 키나제(phosphorylase kinase), 글리신 탈탄산효소(glycine decarboxylase), H-단백질(H-protein), T-단백질(T-protein), 및 낭포성 섬유증 막횡단 조절제(cystic fibrosis transmembrane regulator, CFTR)를 포함한다.
또 다른 유용한 발현 산물은 효소 대체 요법(enzyme replacement therapy)에 유용한 효소가 포함되며, 및 이는 효소의 활성 결핍으로 인한 다양한 병증에서 유용하다. 예를 들어, 만노스-6-포스페이트(mannose-6-phosphate)를 함유하는 효소는 리소좀 축적 질병(lysosomal storage diseases)에 대한 치료에 사용될 수 있다(예로서, 적합한 유전자는 β-글루쿠로니다제(β-glucuronidase, GUSB)를 코딩하는 유전자를 포함함).
일 구체예에 있어서, 예시적인 폴리펩티드 발현 산물은 신경보호 폴리펩티드(neuroprotective polypeptide) 및 항혈관신생 폴리펩티드(anti-angiogenic polypeptide)를 포함한다. 적절한 폴리펩티드는 신경교 유래 신경영양 인자(glial derived neurotrophic factor, GDNF), 섬유아세포 성장 인자 2(fibroblast growth factor 2, FGF-2), 누르투린(nurturin), 모양체 신경영양 인자(ciliary neurotrophic factor, CNTF), 신경 성장 인자(nerve growth factor, NGF; 예를 들어, 신경 성장 인자-베타.), 뇌 유래 신경영양인자(brain derived neurotrophic factor, BDNF), 뉴로트로핀-3(neurotrophin-3, NT-3), 뉴로트로핀-4(neurotrophin-4, NT-4), 뉴로트로핀-6(neurotrophin-6, NT-6), 표피성장인자(epidermal growth factor, EGF), 색소 상피 유래 인자(pigment epithelium derived factor, PEDF), Wnt 폴리펩티드(Wnt polypeptide), 수용성 Fit-1(soluble Fit-1), 안지오스타틴(angiostatin), 엔도스타틴(endostatin), VEGF, 항-VEGF 항체(anti-VEGF antibody), 수용성 VEGFR(soluble VEGFR), 인자 VIII(FVIII), 인자 IX(FIX), 및 헷지호그 패밀리 중 구성원(member of the hedgehog family)(소닉 헷지호그(sonic hedgehog), 인도 헷지호그, 사막 헷지호그, 등)를 포함하나, 이에 제한되지 않는다.
일 구체예에 있어서, 유용한 치료 발현 산물은 제한 없이, 인슐린, 글루카곤, 성장 호르몬(GH), 부갑상선 호르몬(parathyroid hormone, PTH), 성장 호르몬 방출 인자(growth hormone releasing factor, GRF), 난포 자극 호르몬(follicle stimulating hormone, FSH), 황체 형성 호르몬(luteinizing hormone, LH), 인간 융모성 생식선 호르몬(human chorionic gonadotropin, hCG), 혈관 내피 증식 인자(VEGF), 안지오포에틴(angiopoietins), 안지오스타틴(angiostatin), 과립구 콜로니 자극 인자(granulocyte colony stimulating factor, GCSF), 에리트로포이에틴(erythropoietin, EPO), 결합 조직 성장 인자(connective tissue growth factor, CTGF), 염기성 섬유아세포 성장 인자(basic fibroblast growth factor, bFGF), 산성 섬유아세포 성장 인자(acidic fibroblast growth factor, aFGF), 표피 증식 인자(epidermal growth factor, EGF), 혈소판-유래 성장 인자(platelet- derived growth factor, PDGF), 인슐린 성장인자 I 및 II(insulin growth factor I 및 II, IGF-I 및 IGF-II), TGFa를 포함하는 변형 성장 인자 알파 패밀리(transforming growth factor alpha superfamily)의 어느 하나, 액티빈(activin), 인히빈(inhibin), 또는 BMPs 1-15를 포함하는 뼈 형성 단백질(bone morphogenic proteins, BMP)의 어느 하나, 성장인자의 헤레글루인(heregluin)/뉴레귤린(neuregulin)/ARIA/뉴 분화 인자(neu differentiation factor, NDF) 패밀리 중 어느 하나, 신경성장인자(nerve growth factor, NGF), 뇌-유래 신경영양 인자(brain-derived neurotrophic factor, BDNF), 뉴로트로핀 NT-3 및 NT-4/5, 모양체 신경영양인자(ciliary neurotrophic factor, CNTF), 신경교세포주 유래 신경영양인자(glial cell line derived neurotrophic factor, GDNF), 뉴르투린(neurturin), 아그린(agrin), 세마포린/콜랩신(semaphorin/collapsin), 네트린-1 및 네트린-2(netrin-1 및 netrin-2)의 패밀리 중 어느 하나, 간세포 성장 인자(hepatocyte growth factor, HGF), 에프린(ephrin), 노긴(noggin), 소닉 헷지호그(sonic hedgehog) 및 티로신 수산화효소(tyrosine hydroxylase)를 포함하는 호르몬 및 성장 및 분화 인자를 포함한다.
일 구체예에 있어서, 유용한 발현 산물은 사이토카인 및 림포카인, 예를 들어 트롬보포이에틴(thrombopoietin, TPO), 인터루킨(IL) IL-1 내지 IL-25(IL-2, IL-4, IL-12 및 IL-18 포함), 단핵구 화학유인 단백질(monocyte chemoattractant protein), 백혈병 억제 인자(leukemia inhibitory factor), 과립구-대식세포 콜로니 자극 인자(granulocyte-macrophage colony stimulating factor), Fas 리간드, 종양 괴사 인자 알파 및 베타., 인터페론(알파, 베타 및 감마), 줄기 세포 인자, flk-2/flt3 리간드를 포함하나, 이에 제한되지 않는, 면역계를 조절하는 단백질을 포함한다. 면역계에 의해 생성된 유전자 산물도 또한 본 발명에 유용하다. 여기에는 제한 없이, 면역글로불린 IgG, IgM, IgA, IgD 및 IgE, 키메라 면역글로불린, 인간화 항체, 단일 사슬 항체, T 세포 수용체, 키메라 T 세포 수용체, 단일 사슬 T 세포 수용체, 클래스 I 및 클래스 II MHC 분자, 뿐만 아니라 조작된 면역글로불린 및 MHC 분자를 포함한다. 유용한 유전자 산물에는 또한 보체 조절 단백질, 막 보조인자 단백질(membrane cofactor protein, MCP), 붕괴 촉진 인자(decay accelerating factor, DAF), CR1, CF2 및 CD59와 같은 보체 조절 단백질이 포함된다.
일 구체예에 있어서, 유용한 발현 산물은 호르몬, 성장 인자, 사이토카인, 림포카인, 조절 단백질 및 면역계 단백질에 대한 수용체 중 어느 하나를 포함한다. 유용한 이종 핵산 서열은 또한 저-밀도 지단백(LDL) 수용체, 고밀도 지단백(HDL) 수용체, 초저밀도 지질단백(VLDL) 수용체, 및 스캐빈저 수용체(scavenger receptor)를 포함하는 콜레스테롤 조절 및/또는 지질 변형의 수용체를 포함한다. 본 발명은 또한 글루코콜티코이드 수용체(glucocorticoid receptor) 및 에스트로겐 수용체(estrogen receptor), 비타민 D 수용체 및 다른 핵 수용체를 포함하는 스테로이드 호르몬 수용체 슈퍼패밀리의 구성원과 같은 유전자 산물의 사용을 포함한다. 또한, 유용한 유전자 산물에는 전사인자, 예컨대 jun, fos, max, mad, 혈청 반응 인자(serum response factor, SRF), AP-1, AP-2. Myb, MyoD 및 마이오게닌(myogenin), ETS-box 포함 단백질, TFE3, E2F, ATF1, ATF2, ATF3, ATF4, ZF5, NFAT, CREB, HNF-4, C/EBP, SP1, CCAAT-박스 결합 단백질(CCAAT-box binding protein), 인터페론 조절 인자(interferon regulation factor, IRF-1), 윌름즈 종양 단백질(Wilms tumor protein), ETS-결합 단백질(ETS-binding protein), STAT, GATA-박스 결합 단백질(GATA-box binding protein), 예로서, GATA-3, 및 날개 달린 나선 단백질의 포크헤드 패밀리를 포함한다.
일 구체예에 있어서, 유용한 발현 산물은 혈우병 B(hemophilia B)(인자 IX 포함) 및 혈우병 A(hemophilia A)(이종이량체 및 B-결실 도메인의 경쇄 및 중쇄와 같은 인자 VIII 및 그의 변이체를 포함함; 미국 특허 제6,200,560호 및 미국 특허 제6,221,349호)를 포함하여, 혈우병의 치료에 사용되는 것을 포함한다.
일 구체예에 있어서, 유용한 발현 산물은 포스파타제 활성, 예를 들어, 제1형 포스파타제 활성의 조절제(modulator)일 수 있다. 조절제는 포스파타제 활성, 예로서, 제1형 포스파타제 활성을 억제하는 단백질일 수 있다. 조절제는 전사 인자와 같은 포스파타제 활성을 억제하는 단백질을 코딩하는 내인성 핵산의 발현을 증가시키는 핵산일 수 있다. 조절제는 포스파타제 활성을 억제하는 단백질을 코딩하는 내인성 핵산 내부 또는 근처에 통합되는 조절 서열일 수 있다. 조절제는 siRNA와 같은 유전자 발현의 핵산 조절제를 제공할 수 있는 핵산일 수 있다.
일 구체예에 있어서, 유용한 발현 산물은 단백질 포스페이트 1(PP1)의 억제제, 예로서, I-1 폴리펩티드일 수 있다. 포스파타제 억제제-1(또는 "I-1") 단백질은 제1형 포스파타제의 내인성 억제제이다. I-1 수준 또는 활성을 증가시키면 죽어가는 인간 심근세포에서 β-아드레날린성 반응성을 회복할 수 있다. 적절하게는, 상기 I-1 단백질은 트레오닌 35가 아스파르트산 대신 글루탐산으로 대체된 I-1 단백질과 같이 구성적으로 활성될 수 있다. 치료 발현 산물은 하기로부터 선택된 억제제 중 어느 하나 이상일 수 있다: 포스파타제 억제제 2(PP2); 오카다산 또는 칼리쿨린; 및 단백질 포스파타제 1의 내인성 핵 억제제인 니플(nippl).
일 구체예에 있어서, 유용한 발현 산물은 제1형 포스파타제 억제제와 같은 심장 활성을 조절하는 임의의 단백질, 예로서, I-1 또는 근소포체 Ca2+ ATPase(sacroplasmic reticulum Ca2+ ATPase, SERCA), 예로서, SERCA1(예로서, 1a 또는 1b), SERCA2(예로서, 2a 또는 2b), 또는 SERCA3.
일 구체예에 있어서, 유용한 발현 산물은 돌연변이 형태의 포스파타제 억제제-1 단백질을 코딩하는 핵산 서열일 수 있으며, 여기서 돌연변이 형태는 야생형에서 PKC-α 인산화 부위의 위치에 적어도 하나의 아미노산을 포함하고, 여기서 적어도 하나의 아미노산은 구성적으로 인산화되지 않거나 돌연변이 형태에서 인산화되지 않은 상태를 모방한다. 치료적 발현 산물은 아데닐릴 사이클라제 6(AC6, 아드네닐릴 사이클라제 VI라고도 함), S100A1, β-아드레날린 수용체 키나제-ct(βARKct), 근/소포체(SR) Ca -ATPase(SERCA2a), IL-18, VEGF, VEGF 활성화제, 유로코르틴, 및 B-세포 림프종 2(B-cell lymphoma 2, Bcl2)-관련 안타노겐-3(BAG3) 일 수 있다.
일 구체예에 있어서, 유용한 발현 산물은 IL-18 억제제와 같은 사이토카인의 억제제일 수 있다. 치료 발현 산물은 심장 기능을 향상시키기 위해 베타-아드레날린성 신호 단백질(베타-ASP)(베타-아드레날린성 수용체를 포함하는(베타-Ars), G-단백질 수용체 키나제 억제제(GRK 억제제) 및 아데닐릴사이클라제(Acs)를 포함)을 코딩할 수 있다.
일 구체예에 있어서, 유용한 발현 산물은 혈관신생 단백질일 수 있다. 혈관신생 단백질은 혈관의 발달과 분화를 촉진한다. 혈관신생 단백질의 예로는 aFGF(FGF-1), bFGF(FGF-2), FGF-4("hst/KS3"으로도 알려짐), FGF-5 및 FGF-6과 같은 섬유아세포 성장 인자(FGF) 패밀리, 혈관 내피 성장 인자(VEGF) 패밀리, 혈소판 유래 성장 인자(PDGF) 패밀리, 인슐린 유사 성장 인자(IGF) 패밀리 등의 구성원을 포함한다.
일 구체예에 있어서, 유용한 발현 산물은 비-자연 발생 폴리펩티드, 예를 들어 삽입, 결실 또는 아미노산 치환을 함유하는 비-자연 발생 아미노산 서열을 갖는 키메라 또는 하이브리드 폴리펩티드를 포함한다.
추가로 적절한 발현 산물은 마이크로 RNA(miRNA), 간섭 RNA, 역배열 RNA, 리보자임, 및 앱타머를 포함한다.
바람직한 일 구체예에 있어서, 발현 산물은 단백질 인산 1(PP1)의 억제제이다.
본 발명의 일 구체예에 있어서, 합성된 근육-특이적 발현 카세트는 유전자 편집에 유용한 유전자, 예를 들어, 메가뉴클레아제, 징크 핑거 뉴클레아제(zinc finger nuclease, ZFN), 전사 활성제-유사 효과기-기반 뉴클레아제(transcription activator-like effector-based nuclease, TALEN), 또는 클러스터링된 규칙적으로 간격을 둔 짧은 회문 반복 시스템(clustered regularly interspaced short palindromic repeats system, CRISPR-Cas)과 같은 부위 특이적 뉴클레아제를 코딩하는 유전자를 포함한다. 적절하게는 부위-특이적 뉴클레아제는 비상동 말단 접합(non-homologous end-joining, NHEJ) 또는 상동 의존 복구(homology dependent repair, HDR)를 통해 복구되는 절단(일반적으로 부위 특이적 이중 가닥 파손)을 만들어 원하는 표적 게놈 유전자좌를 편집하도록 조정되어, 원하는 편집을 가져온다. 편집은 기능 장애가 있는 유전자의 부분적 또는 완전한 복구, 또는 기능적 유전자의 유전자 제거(knock-down) 또는 유전자 기능 감소(knock-out)일 수 있다. 대안적으로, 편집은 당업계에 공지된 적절한 시스템을 사용하여, 염기 편집 또는 프라임 편집을 통해 수행될 수 있다.
적절하게는 합성된 근육-특이적 발현 카세트는 리보솜 결합 부위, 시작 코돈, 정지 코돈, 및 전사 종결 서열 중 하나 이상, 및 바람직하게는 모두를 제공하거나 코딩하는 서열을 포함한다. 적절하게는 발현 카세트는 전사 후 조절 요소를 코딩하는 핵산을 포함한다. 적절하게는 발현 카세트는 polyA 요소를 코딩하는 핵산을 포함한다.
벡터 및 바이러스 입자:
본 발명은 또한 본 발명에 따른 합성된 근육-특이적 프로모터, 또는 발현 카세트를 포함하는 벡터를 제공한다.
본 발명의 일 구체예에 있어서, 상기 벡터는 플라스미드이다. 이러한 플라스미드는 하나 이상의 선택가능한 마커, 하나 이상의 복제 기점, 다중 클로닝 부위 등과 같은 다양한 다른 기능적 핵산 서열을 포함할 수 있다. 본 발명의 일 구체예에 있어서, 상기 벡터는 바이러스 벡터이다.
본 발명의 일 구체예에 있어서, 벡터는 진핵 세포에서의 발현을 위한 발현 벡터이다. 진핵생물 발현 벡터의 예는 Stratagene으로부터 입수가능한 pW-LNEO, pSV2CAT, pOG44, pXT1 및 pSG; Amersham Pharmacia Biotech로부터 입수가능한 pSVK3, pBPV, pMSG 및 pSVL; 및 클론테크(Clontech)로부터 입수가능한 pCMVDsRed2-express, pIRES2-DsRed2, pDsRed2-Mito, pCMV-EGFP를 함유하나, 이에 제한되지 않는다. 많은 다른 벡터가 잘 알려져 있고 상업적으로 이용 가능하다. 포유동물 세포 아데노바이러스 벡터의 경우, 벡터의 pSV 및 pCMV 시리즈는 특히 잘 알려진 비제한적 예이다. 공지된 효모 발현 벡터는 효모 통합 플라스미드(yeast integrative plasmids, Yip) 및 효모 복제 플라스미드(yeast replicative plasmids, Yrp)를 포함하나, 제한은 없다. 식물의 경우, 아그로박테리움의 Ti 플라스미드는 예시적인 발현 벡터이고, 식물 바이러스는 또한 적절한 발현 벡터, 예를 들어, 담배 모자이크 바이러스(tobacco mosaic virus, TMV), 감자 바이러스 X(potato virus X) 및 동백 모자이크 바이러스(cowpea mosaic virus)를 제공한다.
바람직한 일 실시예에 있어서, 상기 벡터는 유전자 치료 벡터이다. 다양한 유전자 요법 벡터가 당업계에 공지되어 있고, 및 AAV 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 및 렌티바이러스 벡터가 언급될 수 있다. 벡터가 유전자 치료 벡터인 경우, 벡터는 바람직하게는 치료적 발현 산물, 적절하게는 치료 단백질을 코딩하는 본 발명의 합성된 근육-특이적 프로모터에 작동가능하게 연결된 핵산 서열을 포함한다. 치료 단백질은 분비성 단백질일 수 있다. 분비가능한 단백질의 비제한적인 예는 상기 논의한 바와 같고, 및 예시적인 분비 가능한 치료 단백질은, 인자 VIII(factor VIII) 또는 인자 IX(factor IX)와 같은 응고 인자, 인슐린, 에리트로포이에틴(erythropoietin), 지단백질 리파아제(lipoprotein lipase), 항체 또는 나노바디, 성장 인자, 사이토카인, 케모카인, 혈장 인자(plasma factor), 독성 단백질(toxic protein) 등을 포함한다.
본 발명의 일 구체예에 있어서, 상기 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 또는 아데노-연관 바이러스(AAV) 벡터와 같은, 바이러스 벡터이다. 바람직한 일 구체예에 있어서 상기 벡터는 AAV 벡터이다. 바람직한 일 구체예에 있어서 상기 AAV는 근육 형질도입에 적합한 혈청형을 갖는다. 일 구체예에 있어서, AAV는 AAV2, AAV5, AAV6, AAV7, AAV8, AAV9 BNP116, rh10, AAV2.5, AAV2i8, AAVDJ8 및 AAV2G9로 이루어진 그룹에서 선택되거나, 또는 이의 유도체이다. AAV 벡터는 바람직하게는 AAV 형질도입에서 제한 단계 중 하나(즉, 단일 가닥에서 이중 가닥 AAV 전환)를 극복하기 위해 자가-상보적(self-complementary), 이중 가닥 AAV 벡터(double-stranded AAV vectors, scAAV)로 사용되지만, 단일 가닥 AAV 벡터(ssAAV)의 이용도 본 명세서에 포괄된다. 본 발명의 일 구체예에 있어서, 상기 AAV 벡터는 키메라이며, 이는 벡터가 AAV2의 ITR 및 AAV5의 캡시드 단백질과 같은 적어도 2개의 AAV 혈청형으로부터의 성분을 포함함을 의미한다. AAV9가 골격 근육 및 심장 근육을 특히 효과적으로 형질도입하는 것이 공지되었으므로, 및 따라서 AAV9 및 그의 유도체는 골격 및 심장 근육을 표적화하는데 특히 관심이 있다. AAV1, AAV6, AAV7 및 AAV8은 또한 골격 근육을 표적으로 하는 것으로 알려져 있으며, 및 따라서 이러한 AAV의 혈청형 및 이의 유도체 또한 골격 근육을 표적으로 하는 데 특히 중요하다. AAV1 및 AAV8은 또한 심장 근육을 표적으로 하는 것으로 알려져 있으며, 및 따라서 이러한 AAV 혈청형 및 이의 유도체 또한 심장 근육을 표적으로 하는 데 특히 중요하다. 일 구체예에 있어서, 상기 rAAV 벡터는 AAV3b265D 비리온, AAV3b265D549A 비리온, AAV3b549A 비리온, AAV3bQ263Y 비리온, 또는 AAV3bSASTG 비리온(즉, Q263A/T265 돌연변이를 포함하는 AAV3b 캡시드를 포함하는 비리온)을 포함하나, 이에 제한되지 않는다. 일 구체예에 있어서, 비리온은 합리적 단배체(rational haploid), 캡시드와 같은 키메라 또는 임의의 돌연변이체일 수 있고, 캡시드와 같은 경우 원하는 위치, 예를 들어 심장에서의 증가된 출현(update)을 위해 제작(tailored)될 수 있다. 그밖의 캡시드는 AAV1, AAV3, AAV4, AAV5, AAV7, AAV10 등을 포함하는 임의의 알려진 AAV 혈청형 유래 캡시드를 포함할 수 있다.
본 발명은 전술한 바와 같은 벡터를 포함하는 재조합 비리온(바이러스 입자)을 추가로 제공한다.
약제학적 조성물:
본 발명의 벡터 또는 비리온은 약제학적으로 허용되는 부형제, 즉 하나 이상의 약제학적으로 허용되는 담체 물질 및/또는 첨가제, 예로서 완충제, 담체, 부형제, 안정화제 등과 함께 약제학적 조성물로 제형화될 수 있다. 상기 약제학적 조성물 키트 형태로 제공될 수 있다. 상기 AAV 벡터 또는 이의 방법 및 용도에 적합한 약제학적 조성물 및 전달 시스템은 당업계에 공지되어 있다.
따라서, 본 발명의 다른 측면은 본 명세서에서 기재된 바와 같은 벡터 또는 비리온을 포함하는 약제학적 조성물을 제공한다.
치료 및 기타 방법 및 용도:
본 발명은 또한 질병, 바람직하게는 비정상적인 유전자 발현과 관련되고, 선택적으로는 근육 내의 질병(예로서, 유전적 근육 질병)의 치료에 사용하기 위한, 본 발명의 다양한 측면에 따른 합성된 근육-특이적 프로모터, 발현 카세트, 벡터, 비리온 또는 약제학적 조성물을 제공한다. 일 구체예에 있어서, 본 발명은 골격 근육 질병의 치료에 사용하기 위한 본 발명의 다양한 측면에 따른 합성된 근육-특이적 프로모터, 발현 카세트, 벡터, 비리온 또는 약제학적 조성물을 제공한다. 일 구체예에 있어서, 본 발명은 또한 심장 근육 질병의 치료에 사용하기 위한 본 발명의 다양한 측면에 따른 합성된 근육-특이적 프로모터, 발현 카세트, 벡터, 비리온 또는 약제학적 조성물을 제공한다.
관련 병증, 질병 및 치료적 발현 산물은 위에서 논의된다.
본 발명은 또한 본 명세서에 언급된 임의의 병증 또는 질병의 치료를 위한 약제학적 조성물의 제조에 사용하기 위한 본 발명의 다양한 측면에 따른 합성된 근육-특이적 프로모터, 발현 카세트, 벡터, 비리온을 제공한다.
본 발명은 또한 본 발명의 다양한 측면에 따른 합성된 근육-특이적 프로모터, 발현 카세트, 벡터, 비리온을 포함하는 세포를 제공한다. 적절하게는 세포는 진핵 세포이다. 상기 진핵 세포는 적절하게는 진균 세포(예를 들어, 효모 세포), 동물(후생동물) 세포(예를 들어, 포유동물 세포), 또는 식물 세포일 수 있다. 대안적으로, 상기 세포는 원핵 세포일 수 있다.
일 구체예에 있어서, 세포는 생체 외(ex vivo), 예로서 세포 배양물 중이다. 본 발명의 다른 구체예에 있어서, 상기 세포는 조직 또는 다세포 유기체의 일부일 수 있다.
바람직한 일 구체예에 있어서, 상기 세포는 생체 외(ex vivo) 또는 생체 내(in vivo)일 수 있는, 근육 세포(근세포)이다. 바람직한 일 구체예에 있어서, 상기 세포는 생체 외 또는 생체 내일 수 있는, 심장 근육 세포이다. 대안적인 바람직한 일 구체예에 있어서, 상기 세포는 생체 외 또는 생체 내일 수 있는, 골격 근육 세포이다. 상기 근육 세포는 1차 근육 세포 또는 근육-유래 세포주, 예로서, 불멸화 세포주(immortalised cell line)의 세포일 수 있다. 상기 세포는 근육 조직 환경(예로서, 동물의 근육 내)에 존재할 수 있거나 근육 조직에서 분리될 수 있고, 예로서, 세포 배양물(cell culture)에 존재할 수 있다. 적절하게는 상기 세포는 인간 세포이다.
골격 근육 세포는 속근(fast twitch) 또는 지근(slow twitch)에서 유래할 수 있다.
심장 근육 세포는 심장의 심실 심근세포(ventricular cardiomyocyte), 심방 심근세포(atrial cardiomyocyte), 심장 섬유아세포(cardiac fibroblast), 또는 내피 세포(endothelial cell, EC), 뿐만 아니라 혈관주위 세포(peri-vascular cell) 및 심장박동원 세포(pacemaker cell)로부터 선택될 수 있다.
본 발명에 따른 합성된 근육-특이적 프로모터, 발현 카세트, 또는 벡터는 세포의 게놈 내로 삽입될 수 있거나, 에피솜성(예를 들어, 에피솜 벡터에 존재)일 수 있다.
다른 측면에서, 본 발명은 세포, 바람직하게는 근육 세포에 본 발명에 따른 합성된 근육-특이적 발현 카세트(바람직하게는 상기 기재된 바와 같은 벡터 내)를 제공하는 단계, 및 합성된 근육-특이적 발현 카세트에 존재하는 유전자를 발현시키는 단계를 포함하는 발현 산물의 제조 방법을 제공한다. 상기 방법은 적절하게는 상기 근육 세포를 유전자의 발현에 적합한 조건 하에 유지하는 단계를 포함한다. 배양에서 이것은 세포, 또는 세포를 포함하는 조직을 적절한 배양 조건 하에 배양하는 단계를 포함할 수 있다. 발현은 물론 생체 내, 예를 들어 개체의 근육에 있는 하나 이상의 세포에서 일어날 수 있다. 일 구체예에 있어서, 상기 근육 세포/들은 심장 근육 세포/들이다. 일 구체예에 있어서, 상기 근육 세포/들은 골격 근육 세포/들이다.
적절하게는 상기 방법은 합성된 근육-특이적 발현 카세트를 근육 세포에 도입하는 단계를 포함한다. 상기 근육 세포를 형질감염시키는 광범위한 방법이 당업계에 공지되어 있다. 상기 근육 세포를 형질감염시키는 바람직한 방법은 세포를 합성된 근육-특이적 발현 카세트, 예로서 AAV 벡터를 포함하는 바이러스 벡터로 형질도입하는 것이다.
본 발명의 다양한 측면에 따른 합성된 근육-특이적 프로모터, 발현 카세트, 벡터 또는 비리온이 유전자 치료에 사용될 수 있다는 것은 당업자에게 명백할 것이다. 따라서, 유전자 요법에서 이러한 핵산 컨스트럭트의 사용은 본 발명의 일부를 형성한다.
따라서, 본 발명은, 일부 실시예에 있어서, 개체의 유전자 요법, 바람직하게는 치료 유전자의 근육-특이적 발현을 통한 유전자 치료에 사용하기 위한 본 발명에 따른 발현 카세트, 벡터 또는 비리온을 제공한다. 적절하게는 치료 유전자의 심장 근육-특이적 발현 및/또는 치료 유전자의 골격 근육 특이적 발현을 통한다. 상기 치료는 근육 세포로부터 치료적 발현 산물의 분비를 통한 질병의 치료를 포함할 수 있으며, 적절하게는 근육에서 비정상적인 유전자 발현을 포함하는 질병이 상기에서 논의된다.
본 발명은 또한 본 발명에 따른 발현 카세트 또는 벡터를 근육 세포 내로 도입하는 단계를 포함하는, 근육 세포에서 치료적 이식유전자를 발현시키는 방법을 제공한다. 상기 근육 세포는 생체 내 또는 생체 외에 있을 수 있다. 일 구체예에 있어서, 상기 근육 세포/들은 심장 근육 세포/들이다. 일 구체예에 있어서, 상기 근육 세포/들은 골격 근육 세포/들이다.
본 발명은 또한 이를 필요로 하는 개체, 바람직하게는 인간의 유전자 치료 방법을 제공하며, 상기 방법은 다음을 포함한다:
- 치료적 산물을 코딩하는 유전자를 포함하는, 본 발명의 합성된 근육-특이적 발현 카세트, 벡터, 비리온 또는 약제학적 조성물을 개체에게 투여(적절하게는 개체의 근육 내로 도입)하는 단계.
일 구체예에 있어서, 상기 근육은 심장 근육이다. 일 구체예에 있어서, 상기 근육은 골격 근육이다.
상기 방법은 적절하게는 상기 개체의 근육에서 유전자로부터 치료량의 치료적 산물을 발현시키는 단계를 포함한다. 치료할 수 있는 다양한 병증 및 질병은 상기 논의한 바와 같다. 일 구체예에 있어서, 상기 근육은 심장 근육이다. 일 구체예에 있어서, 상기 근육은 골격 근육이다.
적절한 치료적 산물을 코딩하는 유전자는 상기 논의한 바와 같다.
상기 방법은 적절하게는 본 발명에 따른 벡터 또는 비리온을 개체에게 투여하는 단계를 포함한다. 적절하게는 상기 벡터는 바이러스 유전자 치료 벡터, 예를 들어 AAV 벡터이다.
일 구체예에 있어서, 상기 방법은 바이러스 유전자 요법 벡터를 전신적으로 투여하는 것을 포함한다. 상기 전신 투여는 장(예로서, 경구, 설하, 및 직장) 또는 비경구(예로서, 주사)일 수 있다. 바람직한 주사 경로는 정맥내, 근육내, 피하, 동맥내, 관절내, 척추강내, 및 피내 주사를 포함한다.
일 구체예에 있어서, 상기 바이러스 유전자 요법 벡터는 하나 이상의 추가 치료제 또는 망상 내피 시스템(reticular endothelial system)에 의한 벡터의 제거를 방지하도록 설계된 하나 이상의 포화제(saturating agent)와 동시에 또는 순차적으로 투여될 수 있다.
상기 벡터가 AAV 벡터인 경우, 벡터의 투여량은 1 x 1010 gc/kg 내지 1 x 1015 gc/kg 또는 그 이상, 적절하게는 1 x 1012 gc/kg 내지 1 x 1014 gc/kg, 적절하게는 5 x 1012 gc/kg 내지 5 x 1013 gc/kg일 수 있다.
일반적으로, 이를 필요로 하는 개체는 포유동물, 바람직하게는 영장류, 보다 바람직하게는 인간일 것이다. 전형적으로, 이를 필요로 하는 개체는 질병의 특징적인 증상을 나타낼 것이다. 상기 방법은 전형적으로 치료적 양의 치료적 발현 산물을 발현함으로써 이를 필요로 하는 개체에 나타나는 증상을 개선하는 것을 포함한다.
시험관 내 및 생체 내 표적 세포에서 치료 유전자 발현을 위한 유전자 요법 프로토콜은 당업계에 잘 알려져 있으며 여기서 상세히 논의하지 않는다. 간단히 말해서, 여기에는 플라스미드 DNA 벡터(노출된 또는 리포좀 내의) 또는 바이러스 벡터의 근육내 주입, 간질 주입, 기도 내 점적, 내피에 적용, 간 실질내, 정맥내 또는 동맥내 투여(예로서, 간 동맥내, 간 정맥내)가 포함된다. 표적 세포에 대한 DNA의 가용성을 향상시키기 위한 다양한 장치가 개발되었다. 간단한 접근 방식은 표적 세포를 관련 벡터를 포함하는 카테터 또는 이식 가능한 재료와 물리적으로 접촉하는 것이지만, 더 복잡한 접근 방식은 이와 같은 제트 주입 장치를 사용할 수 있다. 포유류 근육 세포로의 유전자 전달은 생체 외 및 생체 내 절차를 모두 사용하여 수행되었다. 생체 외 접근 방식은 일반적으로 근육 세포의 수확, 적절한 발현 벡터를 사용한 시험관 내 형질도입, 이어서 형질도입된 근세포의 재도입을 필요로 한다. 생체 내 유전자 전달은 DNA 또는 바이러스 벡터를 근육에 주입하여 달성되었다.
바람직한 다른 구체예에 따르면, 상기 기술된 방법은 상기에서 논의된 바와 같은 근육 관련 질병, 예로서, 근이영양증 또는 울혈성 심부전이 있는 개체의 치료에 사용될 수 있다.
정의 및 일반적 사항:
본 발명의 다양한 실시예들을 만들어 사용하는 것에 대해서 아래에 상세히 설명하지만, 본 발명이 광범위하게 다양한 구체적인 상황들에 구현될 수 있는 여러가지로 응용가능한 독창적인 개념을 제공하고 있다는 점을 이해해야 할 것이다. 본 명세서에에서 논의된 구체적인 실시예들은 본 발명을 만들어 사용하는 구체적인 방법들을 예시하는 것일 뿐이지, 본 발명의 범위를 한정하는 것은 아니다.
본 발명의 배경에 대한 논의는 본 발명의 맥락을 설명하기 위해 포함된다. 이것이 언급한 임의의 자료가 임의의 청구항에 대하여 우선일 시점에 임의의 국가에서 출판되었거나, 공지되었거나, 또는 일반적인 상식의 일부임을 인정하려는 것으로 간주되어서는 안된다.
본 발명 전반에 걸쳐, 다양한 간행물, 특허 및 공개된 특허 명세서들은 인용 식별기호에 의해 언급된다. 본 명세서에서 인용된 모든 문헌들은 그 전문이 본원에 참조로 통합된다. 특히, 본 명세서에 구체적으로 언급된 상기 문헌들의 교시 또는 섹션들은 참조로 통합된다.
본 발명의 실시는, 달리 명시하지 않는 한, 당업계의 기술 범위에 속하는 세포 생물학, 세포 배양학, 분자 생물학, 유전자이식(transgenic) 생물학, 미생물학, 재조합 DNA 기술 및 면역학의 통상적인 기술을 사용할 것이다. 이러한 기술은 문헌에 충분히 설명되어 있다. 예를 들어, Current Protocols in Molecular Biology (Ausubel, 2000, Wiley and son Inc, Library of Congress, USA); Molecular Cloning: A Laboratory Manual, Third Edition, (Sambrook et al, 2001, Cold Spring Harbor, New York: Cold Spring Harbor Laboratory Press); Oligonucleotide Synthesis (M. J. Gait ed., 1984); U.S. Pat. No. 4,683,195; Nucleic Acid Hybridization (Harries and Higgins eds. 1984); Transcription and Translation (Hames and Higgins eds. 1984); Culture of Animal Cells (Freshney, Alan R. Liss, Inc., 1987); Immobilized Cells and Enzymes (IRL Press, 1986); Perbal, A Practical Guide to Molecular Cloning (1984); the series, Methods in Enzymology (Abelson and Simon, eds. -in-chief, Academic Press, Inc., New York), specifically, Vols.154 and 155 (Wu et al. eds.) and Vol. 185, "Gene Expression Technology" (Goeddel, ed.); Gene Transfer Vectors For Mammalian Cells (Miller and Calos eds., 1987, Cold Spring Harbor Laboratory); Immunochemical Methods in Cell and Molecular Biology (Mayer and Walker, eds., Academic Press, London, 1987); Handbook of Experimental Immunology, Vols. I-IV (Weir and Blackwell, eds., 1986); 및 Manipulating the Mouse Embryo, (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1986)를 참조한다.
본 발명을 쉽게 이해하기 위해, 여러 용어들을 하기에 정의한다. 본 명세서에 정의되는 용어들은 본 발명과 관련된 분야의 통상의 숙련가들이 통상적으로 이해하는 의미를 지닌다. "a", "an" 및 "the"와 같은 용어는 단수의 실체만을 지칭하려는 것은 아니고, 예시를 위해 구체적인 예를 사용할 수 있는 일반적인 부류도 포함한다. 본 명세서에서의 용어는 본 발명의 구체적인 실시형태들을 설명하는데 사용되지만, 이들의 사용이 청구범위에 개괄된 것을 제외하고는 본 발명을 한정하는 것은 아니다.
용어 "근육"은 당업자에 의해 잘 이해된다. 바람직하게는, 근육은 골격 근육(횡격막 포함) 또는 심장 근육이다. 본 발명의 프로모터는 골격 근육 및/또는 심장 근육에서 활성일 수 있다. 바람직하게는, 근육은 척추동물, 보다 바람직하게는 포유동물, 훨씬 더 바람직하게는 인간 개체의 근육이다. 바람직하게는, 근육은 줄무늬 근육(striated muscle)이다.
용어 "근육 세포(muscle cell)" 또는 "근세포(myocyte)"는 본원에서, 근육(근육 조직)에서 발견되거나 또는 근육 조직 유래인 세포를 말한다. 근육 세포는 1차 세포 또는 세포주(예를 들어, C2C12 또는 H2K 세포(골격근 세포주) 또는 H9C2 세포(심장 세포주))일 수 있다. 근육 세포는 생체 내(예를 들어, 근육 조직) 또는 시험관 내(예를 들어, 세포 배양)일 수 있다. 근육 조직에서 발견되는 근세포는 일반적으로 근형성(myogenesis)으로 알려진 과정에서 근육을 형성하기 위해 근모세포(myoblast)에서 발달하는 길고, 관 모양의 세포이다. 본 명세서에서 사용된 용어 근육 세포 또는 근세포는 골격 근육 유래 및 심장 근육 유래 근세포(심근세포(cardiomyocytes))를 포함한다. 본 발명의 프로모터는 골격 근육 세포 및/또는 심장 근육 세포에서 활성일 수 있다.
용어 "시스-조절 요소(cis-regulatory element)" 또는 "CRE"는 당업자에게 익히 알려진 용어로서, 이웃한 유전자(즉, in cis)의 전사를 조절하거나 변형시킬 수 있는 인핸서, 프로모터, 인슐레이터(insulator) 또는 사일런서(silencer)와 같은 핵산 서열을 의미한다. CRE는 이들이 조절하는 유전자들의 부근에서 발견된다. CRE는 일반적으로 TF에 결합하여 유전자 전사를 조절하고, 즉 TFBS를 포함한다. 하나의 TF는 여러 CRE에 결합할 수 있기 때문에, 여러 유전자들의 발현을 제어할 수 있다(다면발현성). CRE는, 항상 그런 것은 아니지만 일반적으로는, 이들이 조절하는 유전자의 전사 개시 부위(TSS) 상류에 위치한다. "인핸서(enhancer)"는 이들이 작동가능하게 결합되어 있는 유전자들의 전사를 향상 (즉, 상향조절)시키는 CRE로서, 이들이 조절하는 유전자의 상류, 하류, 및 심지어 인트론 내에서도 발견될 수 있다. 다중 인핸서들은 한 유전자의 전사를 조절하기 위해 균형있게 상호작용하는 방식으로 작용할 수 있다. 이와 관련하여 "사일런서(silencer)"는 유전자의 전사를 방지하거나 하향조절하는 작용을 하는, 억제자(repressor)라고 불리는 TF에 결합하는 CRE와 관계가 있다. 또한, "사일런서"라는 용어는 해당 메신저 RNA 분자의 번역을 억제하는 단백질에 결합하는, mRNA의 3' 비번역 영역에 있는 영역을 지칭할 수도 있지만, 이러한 사용은 CRE를 설명하는데 있어서의 그의 사용과는 구별된다. 일반적으로, 본 발명의 CRE는 근육 특이적, 심장 근육 특이적, 또는 골격 근육 특이적 인핸서 요소(종종 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 CRE, 또는 근육-특이적, 심장-근육 특이적, 또는 골격 근육-특이적 CRE 인핸서, 또는 그러한 것들)이다. 본 문맥상, CRE는 전사 개시 부위(transcription start site, TSS)로부터 2500개의 뉴클레오타이드 이하, 보다 바람직하게는 TSS로부터 2000개의 뉴클레오타이드 이하, 보다 바람직하게는 TSS로부터 1500개의 뉴클레오타이드 이하, 및 적절하게는 TSS로부터 1000, 750, 500, 250, 200, 150, 또는 100개 이하의 뉴클레오타이드에 위치하는 것이 바람직하다. 본 발명의 CRE는 길이가 비교적 짧은 것이 바람직한데, 바람직하게는 길이가 500개의 뉴클레오타이드 이하이고, 예를 들어 이들의 길이는 400, 300, 200, 175, 150, 90, 80, 70, 60 또는 50개의 뉴클레오타이드 이하일 수 있다. 본 발명의 CRE는 전형적으로 최소 프로모터 또는 근위 프로모터일 수 있는, 작동가능하게 연결된 프로모터 요소와 조합하여 제공되며; 본 발명의 CRE는 프로모터 요소의 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 활성을 향상시킨다. 본 명세서에 개시된 CRE 또는 이의 기능적 변이체의 임의의 조합에서, 기재된 CRE 및 프로모터 요소의 일부 또는 전부는 적절하게 프로모터에서 서로 인접하게 위치할 수 있다(즉, 임의의 끼어든 CRE 또는 기타 조절 요소 없이). CRE는 연속적이거나 비연속적일 수 있다(즉, 서로 바로 인접하게 위치하거나 스페이서 또는 다른 서열에 의해 분리될 수 있음). CRE는 임의의 순서일 수 있다. 바람직한 일 실시예에서, CRE 또는 이의 기능적 변이체는 기재된 순서로 제공되고 서로 인접한다. 예를 들어, 합성된 근육-특이적 조절 핵산은 CRE0033의 바로 상류에 있는 CRE0107 등을 포함할 수 있다. 일 실시예에 있어서 CRE의 일부 또는 전부가 인접하는 것이 바람직하다.
용어 "시스 조절 모듈(cis-regulatory module)" 또는 "CRM"는 흔히 2개 이상의 CRE를 포함하는 기능적 조절 핵산 모듈을 의미하며; 본 발명에서 CRE는 일반적으로 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 인핸서이고 따라서 CRM은 합성 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 조절 핵산이다. 따라서, 본 출원에서 CRM은 일반적으로 복수개의 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 CRE를 포함한다. 전형적으로, CRM 내의 다중 CRE들은(예를 들어, 부가적으로 또는 상승적으로) 함께 작용하여 CRM을 포함하는 프로모터가 작동가능하게 결합된 유전자의 전사를 향상시킨다. CRM 내 CRE들을 셔플(즉, 재정렬), 역위(즉, 역배향), 및 간격(spacing) 변경하는 상당한 범위가 존재한다. 따라서, 본 발명의 CRM의 기능적 변이체는 그 중에서도, 참조된 CRM의 변이체를 포함하며, 여기서 그들 내의 CRE는 셔플 및/또는 역위되고, 및/또는 CRE 사이의 간격이 변경된 것이다. 직렬 프로모터(tandem promoter)의 경우, CRM은 프로모터 요소와, 추가 프로모터 요소에 작동가능하게 연결된 하나 이상의 CRE의 조합을 설명하는 데 사용할 수 있다. 예를 들어, 직렬 프로모터 SP0268에서, CRE0035와 프로모터 요소 CRE0010의 조합은 CRM으로 간주될 수 있다.
본 명세서에서, 용어 "프로모터(promoter)"는 일반적으로 전사가 일어나는데 필요한, 즉 전사를 개시하는데 필요한 전사될 핵산 서열의 상류에 위치하는 DNA 영역을 말한다. 프로모터는 자신들의 제어 하에 코딩 서열의 전사에 대해 올바른 활성화 또는 억제를 허용한다. 프로모터는 일반적으로 복수개의 TF들에 의해 인식되어 결합되는 특정 서열들을 함유한다. TF는 프로모터 서열에 결합하여 유전자의 코딩 영역으로부터 RNA를 합성하는 효소인 RNA 폴리머라제를 모집하게 된다. 상당히 많은 프로모터들이 당업계에 공지되어 있다.
일부 경우에, 용어 "프로모터" 또는 "복합 프로모터(composite promoter)"는 프로모터 및 추가 조절 요소의 조합, 예를 들어, 전사 시작 부위(TSS)의 바로 하류에 위치한 조절 서열, 예를 들어, 5' UTR 및/또는 5' UTR 및 인트론을 지칭하는 것으로 본 명세서에서 사용된다. TSS의 하류에 있는 이러한 서열은 전사 및/또는 번역 단계에서 발현의 조절에 기여할 수 있다. 일부 경우에, 용어 "프로모터" 또는 "복합 프로모터"는 본 명세서의 다른 곳에서 정의된 바와 같은 '직렬 프로모터(tandem promoter)'를 지칭하는 것으로 본 명세서에서 사용된다.
본 명세서에서 사용된 용어 "합성된 프로모터"는 자연에서 발생하지 않는 프로모터와 관련된다. 본 문맥에서 이는 전형적으로 최소(또는 코어) 프로모터 또는 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 근위 프로모터(프로모터 요소)에 작동가능하게 연결된 본 발명의 CRE 및/또는 CRM을 포함한다. 본 발명의 CRE 및/또는 CRM은 합성된 프로모터에 작동가능하게 연결된 유전자의 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 전사를 향상시키는데 기여한다. 합성된 프로모터의 일부는 자연적으로 발생하는 것일 수 있지만(예로서, 프로모터 중 최소 프로모터 또는 하나 이상의 CRE), 전체로서 합성된 프로모터는 자연적으로 발생하지 않는다.
본 명세서에서 사용된, "최소 프로모터(minimal promoter)"("코어 프로모터(core promoter)"로도 공지됨)라고 하면, 그 자체가 불활성이거나 대개 불활성이지만, 다른 전사 조절 요소들과 조합되는 경우에 전사를 매개할 수 있는 짧은 DNA 세그먼트(segment)를 말한다. 최소 프로모터 서열은 원핵생물 및 진핵생물 유전자를 포함한, 서로 다른 다양한 공급원들로부터 유래될 수 있다. 최소 프로모터의 예들에 대해서는 위에서 논의하였으며, 데스민 최소 프로모터(desmin minimum promoter), 도파민 베타-하이드록실라제 유전자 최소 프로모터(dopamine beta-hydroxylase gene minimum promoter), 사이토메갈로바이러스(cytomegalovirus, CMV) 즉시 조기 발현 유전자 최소 프로모터(immediate early gene minimum promoter, CMV-MP), 및 헤르페스 티미딘 키나제 최소 프로모터 (herpes thymidine kinase minimal promoter, MinTK)를 포함한다. 최소 프로모터는 일반적으로 전사 시작 부위(TSS) 및 바로 상류의 요소인 RNA 중합효소 II에 대한 결합 부위, 및 일반 전사 인자 결합 부위(흔히 TATA 박스)를 포함한다. 최소 프로모터는 또한 TSS의 하류에 일부 요소를 포함할 수 있지만, 이들은 일반적으로 추가 조절 요소의 부재시 기능이 거의 없다.
본 명세서에서 사용된, "근위 프로모터(proximal promoter)"는 최소 프로모터에 적어도 일부 추가 조절 서열, 일반적으로 일차 조절 요소를 함유하는 경향이 있는 유전자의 상류의 근위 서열에 관한 것이다. 이는 종종 TSS의 상류에서 약 250개의 염기쌍 정도로 연장되고, 특정 TFBS를 포함한다. 근위 프로모터는 또한 TSS의 하류에 하나 이상의 조절 요소, 예를 들어 UTR 또는 인트론을 포함할 수 있다. 이 경우에, 근위 프로모터는 적절하게는 본 발명의 하나 이상의 CRE 또는 CRM과 조합될 수 있는 자연 발생적인 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 근위 프로모터일 수 있다. 다만, 근위 프로모터는 합성될 수 있다.
본 명세서에서 사용된, "프로모터 요소"는 상기 정의된 바와 같은 최소 프로모터 또는 근위 프로모터를 말한다. 본 발명의 맥락에서, 프로모터 요소는 일반적으로 본 발명의 합성된 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 프로모터를 제공하기 위해 하나 이상의 CRE와 조합된다.
본 발명의 맥락에서 CRE, CRM, 프로모터 요소, 프로모터 또는 기타 조절 핵산 서열의 "기능적 변이체(functional variant)"는, 참조 서열, 예로서 근육-특이적, 심장 근육-특이적, 골격 근육-특이적 CRE, 근육-특이적, 심장 근육-특이적, 골격 근육-특이적 CRM, 또는 근육-특이적, 심장 근육-특이적, 골격 근육-특이적 프로모터와 같이, 동일한 방식으로 기능하는 능력을 보유하고 있는 참조 서열의 변이체이다. 이러한 기능적 변이체라는 말을 대체할 수 있는 용어는 "생물학적 균등물(biological equivalent)" 또는 "균등물(equivalent)"을 포함한다.
근육 특이적, 심장 근육 특이적, 또는 골격근 특이적 인핸서로서 기능하는 주어진 CRE, CRM, 프로모터 또는 기타 조절 서열의 능력은 서열이 참조 서열에 결합하는 동일한 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 TF에 결합하는 서열의 능력에 의해 상당히 결정된다는 것이 이해될 것이다. 따라서, 대부분의 경우, CRE 또는 CRM의 기능적 변이체는 참조 CRE, CRM 또는 프로모터와 대부분 또는 전부의 동일한 TF에 대한 TFBS를 함유할 것이다. 기능적 변이체의 TFBS가 참조 CRE, CRM 또는 프로모터와 동일한 상대적 위치(즉, 순서 및 일반 위치)에 있는 것이 바람직하지만, 필수는 아니다. 기능적 변이체의 TFBS가 참조 서열과 동일한 배향으로 있는 것이 또한 바람직하지만, 필수는 아니다(TFBS는 경우에 따라 역배향, 예를 들어 참조 서열의 서열에 대한 역 상보로 존재할 수 있음을 유의할 것임). 기능적 변이체의 TFBS가 참조 서열과 동일한 가닥에 있는 것이 또한 바람직하지만, 필수는 아니다. 따라서, 바람직한 일 구체예에 있어서, 상기 기능적 변이체는 참조 서열과 동일한 TF, 동일한 순서, 동일한 위치, 동일한 배향 및 동일한 가닥에 대한 TFBS를 포함한다. 또한 TFBS 사이에 있는 서열(일부 경우 스페이서 서열 등으로 지칭됨)은 CRE 또는 CRM의 기능에 덜 중요하다는 것이 이해될 것이다. 이러한 서열은 일반적으로 상당히 다양할 수 있고, 길이도 변경될 수 있다. 다만, 바람직한 일 구체예에 있어서 참조 서열에서와 같이 기능적 변이체에서 간격(즉, 인접 TFBS 사이의 거리)은 실질적으로 동일하다(예를 들어, 20% 이상 변화되지 않고, 바람직하게는 10% 이하, 및 보다 바람직하게는 대략적으로 동일함). 일부 경우에는 CRE의 기능적 변이체가 역배향으로 존재할 수 있고, 예를 들어, 이는 상기에서 설명한 CRE의 역 상보 또는 이의 변이체일 수 있음이 명확할 것이다.
기능적 변이체와 참조 서열 사이의 서열 동일성 수준은 또한 유지된 기능성의 지표일 수 있다. CRE, CRM 또는 프로모터의 TFBS에서 높은 수준의 서열 동일성은 일반적으로 스페이서 서열(서열의 보존에 대한 요구 사항이 거의 또는 전혀 없는 경우)의 서열 동일성보다 더 중요하다. 그러나, 기능적 TFBS의 서열이 공통 서열과 정확히 일치할 필요가 없는 한, TFBS 내에서도, 상당한 정도의 서열 변이가 수용될 수 있다는 것을 이해할 것이다.
주어진 기능적 변이체에서 TFBS에 결합하는 하나 이상의 TF의 능력은 전기이동성 이동 분석(EMSA), 결합 분석, 염색질 면역침전(ChIP), 및 ChIP 시퀀싱(ChIP-seq)을 포함하지만, 이에 제한되지 않는, 당업계에 공지된 임의의 관련 수단에 의해 결정될 수 있다. 바람직한 일 구체예에 있어서, 주어진 기능적 변이체에 결합하는 하나 이상의 TF 능력은 EMSA에 의해 결정된다. EMSA를 수행하는 방법은 당업계에 널리 공지되어 있다. 적절한 접근 방식은 상기에서 인용된 Sambrook et al.에 기재된다. 이 절차를 기재하는 많은 관련 문헌, 예를 들어, Hellman and Fried, Nat Protoc. 2007; 2(8): 1849-1861이 사용가능하다.
"근육-특이적" 또는 "근육-특이적 발현"은 시스-조절 요소, 시스-조절 모듈 또는 프로모터가 다른 조직(예를 들어, 간, 신장, 비장, 심장, 폐, 및 뇌)에 비해 우선적이거나 우세한 방식으로 근육 세포(또는 근육 유래 세포)에서 유전자의 발현을 향상시키거나 유도하는 능력을 말한다. 유전자의 발현은 mRNA 또는 단백질의 형태일 수 있다. 바람직한 실시형태에서, 근육-특이적 발현은 다른(즉, 비-근육) 조직 또는 세포에서는 무시할 수 있을 정도의 발현인 것으로, 즉 발현은 고도로 근육-특이적이다. 예를 들어, 다른 세포와 대조하여 근육 세포에서의 발현은 적어도 75%, 80%, 85%, 90% 또는 95%이다. "심장 근육-특이적" 또는 "심장 근육-특이적 발현"은 다른 조직(예를 들어, 비장, 간, 폐, 및 뇌)과 비교하고 골격 근육 조직과 비교하여 우선적 또는 우세한 방식으로 심장 근육에서 유전자의 발현을 향상시키거나 유도하기 위한 시스-조절 요소, 시스-조절 모듈, 프로모터 요소 또는 프로모터의 능력을 지칭한다. "골격 근육-특이적" 또는 "골격 근육-특이적 발현"은 다른 조직(예로서, 비장, 간, 폐, 및 뇌)과 비교하고 심장 근육 조직과 비교하여 우선적으로 또는 우세한 방식으로 골격근에서 유전자의 발현을 향상시키거나 유도하기 위한 시스-조절 요소, 시스-조절 모듈, 프로모터 요소 또는 프로모터의 능력을 지칭한다. 낮은 정도의 특이도가 바람직한 사례가 있을 수 있고 본 발명의 일부이다.
근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 CRE, CRM 또는 프로모터로서 기능하는 CRE, CRM 또는 프로모터의 능력은 당업자에 의해 용이하게 평가될 수 있다. 따라서 당업자는 상기 기재된 특정 CRE, CRM 또는 프로모터의 임의의 변이체(즉, 상기에서 정의된 기능적 변이체임)가 기능적으로 유지되고 있는지를 쉽게 결정할 수 있다. 예를 들어, 평가되는 어느 주어진 CRM은 최소 프로모터(예를 들어, CMV-MP의 상류에 위치)에 작동가능하게 연결될 수 있고 유전자(전형적으로 리포터 유전자)의 근육-특이적, 심장 근육-특이적, 또는 골격 근육-특이적 발현을 유도하는 시스-조절 요소의 능력이 측정된다. 대안적으로, CRE 또는 CRM의 변이체는 참조 CRE 또는 CRM의 자리에 합성 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 프로모터로 치환될 수 있으며, 상기 변형된 프로모터에 의해 유도되는 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 발현에 대한 효과가 결정되고 및 비변형된 형태와 비교될 수 있다. 유사하게, 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 발현을 유도하는 프로모터의 능력은 (예를 들어, 하기 실시예에 기재된 바와 같이) 당업자에 의해 용이하게 평가될 수 있다. 참조 프로모터의 변이체에 의해 유도되는 유전자의 발현 수준은 참조 프로모터에 의해 유도되는 발현 수준과 비교할 수 있다. 일 구체예에 있어서, 변이 프로모터에 의해 유도되는 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 발현 수준이 참조 프로모터에 의해 유도된 발현 수준의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 100%인 경우, 변이체가 기능적으로 유지되고 있다고 말할 수 있다. 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 발현 향상을 평가하기 위한 적절한 핵산 컨스트럭트 및 리포터 분석은 쉽게 구성될 수 있으며, 하기에 설명된 예는 적절한 방법론을 제공한다.
근육-특이도, 심장 근육-특이도 또는 골격 근육-특이도는 유전자(예로서, 치료 또는 리포터 유전자)의 발현이 근육-유래 세포, 심장 근육-유래 세포 또는 골격 근육에서 우선적으로 또는 우세하게 일어나는 경우에 확인될 수 있다. 예를 들어, 발현 수준이 다른 유형의 세포(즉, 비-근육-유래 세포, 비-심장 근육 유래 세포 또는 비-골격 근육 유래 세포)보다 근육 유래, 심장 근육 유래 또는 골격근 유래 세포에서 현저하게 높은 경우 우선적 또는 우세한 발현이 정의될 수 있다. 예를 들어, 근육-유래, 심장 근육-유래 또는 골격 근육-유래 세포에서의 발현은 적절하게는 비-근육 세포, 비-심장 근육 세포 또는 비-골격 근육 세포에서보다 적어도 5배, 바람직하게는 비-근육 세포, 비-심장근육세포 또는 비-골격 근육 세포보다 적어도 10배 더 높고, 및 일부 경우에는 50배 이상 높을 수 있다. 편의를 위해, 근육-특이적 발현은 근육-세포주(예로서, C2C12 또는 H2K 세포(골격 근육) 또는 H9C2 세포(심장)와 같은 근육-유래 세포주)에서의 발현을 간-유래 세포주(예로서, Huh7 또는 HepG2), 신장-유래 세포주(예로서, HEK-293), 자궁 경부 조직-유래 세포주(예로서, HeLa) 및/또는 폐-유래 세포주(예로서, A549)에서의 발현 수준과 비교하여 적절하게 입증될 수 있다. 심장 근육-특이적 발현은 심장 근육 세포주(예로서, H9C2와 같은 심장 근육-유래 세포주) 또는 1차 심근세포의 발현 수준을 간-유래 세포주(예로서, Huh7 또는 HepG2), 신장-유래 세포주(예로서, HEK-293), 자궁경부 조직-유래 세포주(예로서, HeLa), 폐-유래 세포주(예로서, A549) 및/또는 골격 근육-유래 세포주(예로서, C2C12 또는 H2K)의 발현 수준과 비교하여 적절하게 입증될 수 있다. 골격 근육-특이적 발현은 골격 근육-유래 세포(예로서, HC2C12 또는 H2K) 또는 1차 골격 근육 세포의 발현 수준을 간-유래 세포주(예로서, Huh7 또는 HepG2), 신장-유래 세포주(예로서, HEK-293), 자궁경부 조직-유래 세포주(예로서, HeLa), 폐-유래 세포주(예로서, A549) 및/또는 심장 근육-유래 세포주(예로서, H9C2)의 발현 수준과 비교하여 적절하게 입증될 수 있다.
본 발명의 합성된 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 프로모터는 CMV-IE와 같은 비조직 특이적 프로모터와 비교할 때 비-근육-유래 세포, 적절하게는 Huh7, HEK-293, HeLa, 및/또는 A549 세포에서 바람직하게는 발현 감소를 나타낸다. 본 발명의 합성된 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 프로모터는 바람직하게는 비-근육-유래 세포에서 (적절하게는 Huh7, HEK-293, HeLa, 및/또는 A549 세포에서) CMV-IE 프로모터보다 50% 이하, 적절하게는 25% 이하, 20% 이하, 15% 이하, 10% 이하, 5% 이하 또는 1% 이하의 활성을 갖는다. 일반적으로, 비-근육 유래 세포에서의 발현을 최소화하는 것이 바람직하지만, 경우에 따라 이것이 필요하지 않을 수 있다. 본 발명의 합성 프로모터가 예를 들어 1개 또는 2개의 비-근육 세포에서 더 높은 발현을 갖는다 하더라도, 일반적으로 비-근육 세포에 비해 근육 세포의 범위에서 전반적으로 더 높은 발현을 갖는 한, 여전히 근육-특이적 프로모터일 수 있다. 일 구체예에 있어서, 근육-특이적 프로모터는 비-근육 세포와 비교하여 근육 세포에서 적어도 25%, 또는 적어도 35%, 또는 적어도 45%, 또는 적어도 55%, 또는 적어도 65%, 또는 적어도 75%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 25% 내지 95% 사이의 임의의 정수만큼 더 높게 유전자를 발현한다.
본 발명의 합성된 근육-특이적 프로모터는 바람직하게는 개체의 근육에서의 발현을 촉진하는데 적절하며, 예로서 이식유전자, 바람직하게는 치료적 이식유전자의 근육-특이적 발현을 유도한다. 본 발명의 합성된 심장 근육-특이적 프로모터는 바람직하게는 개체의 심장에서의 발현을 촉진하는데 적절하며, 예로서 이식유전자, 바람직하게는 치료적 이식유전자의 심장 근육-특이적 발현을 유도한다. 본 발명의 합성된 골격 근육-특이적 프로모터는 바람직하게는 개체의 골격 근육에서의 발현 촉진에 적합하며, 예로서 이식유전자, 바람직하게는 치료적 이식유전자의 골격 근육-특이적 발현을 유도한다. 본 발명의 바람직한 합성된 근육-특이적 프로모터는 근육-특이적 이식유전자 발현을 촉진하는 데 적절하고 근육 세포에서 CBA 활성의 적어도 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 125%, 150%, 175%, 200%, 250%, 300%, 350% 또는 400%의 활성을 가진다. 일 구체예에 있어서, 본 발명의 합성된 근육-특이적 프로모터는 CBA 프로모터 활성의 적어도 100% 수준, 바람직하게는 CBA 또는 spc5-12 프로모터의 활성의 150%, 200%, 300% 또는 500% 수준으로 근육-특이적 이식유전자 발현을 촉진하기에 적절하다. 일 구체예에 있어서, 상기 합성된 심장 근육-특이적 프로모터는 Tnnt2 또는 Myl2 프로모터의 활성의 적어도 100%, 바람직하게는 Tnnt2 또는 Myl2 프로모터의 활성의 150%, 200%, 300% 또는 500% 수준으로 심장 근육-특이적 이식유전자 발현을 촉진하는데 적절하다. 일 구체예에 있어서, 상기 합성된 골격 근육-특이적 프로모터는 Tnnt2 또는 Myl2 프로모터의 활성의 적어도 100%, 바람직하게는 spc5-12 프로모터의 활성의 150%, 200%, 300% 또는 500% 수준에서 골격 근육-특이적 이식유전자 발현을 촉진하는데 적절하다. 이러한 근육-특이적 발현은 근육-유래 세포, 예를 들어 C2C12 또는 H2K 세포(골격 근육) 또는 H9C2 세포(심장) 또는 1차 근육 세포(적절하게는 1차 인간 근세포)에서 적절하게 결정된다.
본 발명의 합성된 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 프로모터는 또한 근육-유래 세포 (예로서, c2c12 또는 H2K 세포(골격근) 또는 h9C2 세포(심장))에서 CMV-IE와 비교하여 적어도 50%, 100%, 150% 또는 200% 수준에서 유전자의 근육-특이적, 심장 근육-특이적 또는 골격 근육-특이적 발현을 촉진할 수 있다.
본 명세서에서 사용된 용어 "핵산"은 필수적으로 뉴클레오타이드로 구성된 임의의 길이의 올리고머 또는 폴리머(바람직하게는 선형 폴리머)를 통상적으로 지칭한다. 뉴클레오타이드 단위는 통상 헤테로사이클릭 염기, 당 그룹, 및 적어도 1개, 예를 들어 1개, 2개 또는 3개의 인산기(변형 또는 치환된 인산기를 포함함)를 포함한다. 헤테로사이클릭 염기는, 그 중에서도 자연 발생 핵산에 널리 퍼져 있는 아데닌(A), 구아닌(G), 시토신(C), 티민(T) 및 우라실(U)과 같은 퓨린 및 피리미딘 염기, 그밖의 자연 발생 염기(예로서, 크산틴, 이노신, 하이포크산틴) 뿐만 아니라 화학적 또는 생화학적으로 변형(예로서, 메틸화)된, 비자연 또는 유도체화 염기를 포함할 수 있다. 당 그룹은 그 중에서도 펜토스(펜토푸라노오스) 기, 예컨대 바람직하게는 자연 발생 핵산에서 흔히 볼 수 있는 리보스 및/또는 2-데옥시리보스, 또는 아라비노오스, 2-데옥시아라비노오스, 트레오스 또는 헥소스 당 그룹, 뿐만 아니라 변형 또는 치환된 당 그룹을 포함할 수 있다. 본 명세서에서 의도한 핵산이라고 하면, 자연 발생 뉴클레오타이드, 변형된 뉴클레오타이드 또는 이들의 혼합물을 포함할 수 있다. 변형된 뉴클레오타이드는 변형된 헤테로사이클릭 염기, 변형된 당 모이어티, 변형된 인산기 또는 이들의 조합을 포함할 수 있다. 인산기 또는 당의 변형을 도입하여 안정성, 효소적 분해에 대한 저항성, 또는 기타 일부 유용한 특성을 개선할 수 있다. "핵산"이라는 용어는 더욱 바람직하게는 DNA, RNA 및 DNA RNA 하이브리드 분자를 포괄하며, 구체적으로는 hnRNA, pre-mRNA, mRNA, cDNA, 게놈 DNA, 증폭 산물, 올리고뉴클레오타이드, 및 합성된 (예로서, 화학적으로 합성된) DNA, RNA 또는 DNA RNA 하이브리드를 포함한다. 핵산은 자연 발생되는 것일 수 있으며, 예를 들어 자연에 존재하거나 자연으로부터 분리될 수 있거나; 또는 비자연 발생되는 것일 수 있고, 예를 들어 재조합체, 즉 재조합 DNA 기술에 의해 생산되거나, 및/또는 부분 또는 전체적으로, 화학적 또는 생화학적으로 합성될 수도 있다. "핵산"은 이중 가닥, 부분 이중 가닥, 또는 단일 가닥일 수 있다. 단일 가닥의 경우, 핵산은 센스 가닥 또는 안티센스 가닥일 수 있다. 또한, 핵산은 원형 또는 선형일 수 있다.
"분리된"의 의미로는, 핵산은 자연에서 일반적으로 관련된 서열이 전체 또는 부분적으로 결여된 핵산 분자를 지칭할 경우; 또는 자연에 존재하지만 그와 관련된 이종 서열을 갖는 서열; 또는 염색체로부터 단리된(disassociated) 분자이다.
용어 "동일성" 및 "동일한" 등 2개의 폴리머 분자 간에, 예를 들어 2개의 DNA 분자간과 같은 2개의 핵산 분자간의 서열 유사성을 가리킨다. 서열 정렬과 서열 동일성의 결정은, 예를 들어 Altschul et al. 1990 (J Mol Biol 215: 403-10)에 의해 처음 기재된 Basic Local Alignment Search Tool (BLAST), 예를 들어 Tatusova and Madden 1999 (FEMS Microbiol Lett 174: 247-250)에 의해 기재된 "Blast 2 서열" 알고리즘을 사용하여 수행할 수 있다.
비교를 위해 서열을 정렬하는 방법은 당업계에 잘 알려져 있다. 다양한 프로그램 및 정렬 알고리즘들은, 예를 들어 하기 문헌에 기재되어 있다: Smith and Waterman (1981) Adv. Appl. Math. 2:482; Needleman and Wunsch (1970) J. Mol. Biol. 48:443; Pearson and Lipman (1988) Proc. Natl. Acad. Sci. U.S.A. 85:2444; Higgins and Sharp (1988) Gene 73:237-44; Higgins and Sharp (1989) CABIOS 5:151-3; Corpet et al. (1988) Nucleic Acids Res. 16:10881-90; Huang et al. (1992) Comp. Appl. Biosci. 8:155-65; Pearson et al. (1994) Methods Mol. Biol. 24:307-31; Tatiana et al. (1999) FEMS Microbiol. Lett. 174:247-50. 서열 정렬 방법 및 상동성 계산에 대한 상세한 고려 사항은, 예를 들어 Altschul et al. (1990) J. Mol. Biol. 215:403-10에서 찾아볼 수 있다.
여러 서열 분석 프로그램들과 관련하여 사용하기 위한, 미국 National Center for Biotechnology Information (NCBI) Basic Local Alignment Search Tool (BLAST™; Altschul et al. (1990))는 미국 National Center for Biotechnology Information (Bethesda, MD)를 포함한 여러 공급업체, 및 인터넷 상에서 이용가능하다. 상기 프로그램을 사용하여 서열 동일성을 결정하는 방법에 대한 설명은 인터넷의 BLAST™에 대한 "도움말" 섹션에서 찾아볼 수 있다. 핵산 서열들의 비교를 위해서는, 기본 매개변수를 이용하여 BLAST™(Blastn) 프로그램의 "Blast 2 서열" 기능을 사용할 수 있다. 참조 서열에 대해 훨씬 더 큰 유사성을 갖는 핵산 서열들은 상기 방법으로 평가할 때 증가하는 퍼센트 동일성(percentage identity)을 나타낼 것이다. 일반적으로, 퍼센트 서열 동일성은 해당 서열의 전체 길이에 대해 계산된다.
예를 들어, 전역 최적 정렬(global optimal alignment)은 다음과 같은 점수 매개변수를 사용하여 니들맨-분쉬(Needleman-Wunsch) 알고리즘에 의해 적절히 찾아진다: 정합(match) 점수: +2, 부정합(mismatch) 점수: -3; 갭 페널티: 갭 오픈 5, 갭 확장 2. 생성된 최적의 전역 정렬의 퍼센트 동일성은 해당 정렬의 총 길이에 대한 정렬된 염기수의 비율로 적절히 계산되며, 여기서 정렬 길이는 정합과 부정합을 모두 포함하여 100을 곱한다.
용어 "혼성화(hybridising)"은 혼성화 과정에서 적어도 부분적으로 상보적인 2개의 뉴클레오티드 서열에 어닐링하는 것을 의미한다. 혼성화가 일어나도록 하기 위해 상보적 핵산 분자는 일반적으로 열적으로 또는 화학적으로 변성되어 이중 가닥을 2개의 단일 가닥으로 용융시키고 및/또는 단일 가닥 핵산으로부터 헤어핀 또는 기타 2차 구조를 제거한다. 혼성화의 엄격성은 온도, 염 농도 및 혼성화 완충액 조성과 같은 조건의 영향을 받는다. 통상적인 혼성화 조건은 예를 들어, Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York에 기술되어 있으나. 숙련자는 다양한 혼성화 조건이 알려지거나 또는 예상되는 상동성 및/또는 핵산 서열의 길이에 따라 기능적으로 설계될 수 있음을 이해할 것이다. 혼성화를 위한 높은 엄격성 조건에는 고온 및/또는 낮은 나트륨/염 농도(염에는 예를 들어 NaCl 및 Na-시트레이트에서와 같이 나트륨을 포함함) 및/또는 혼성화 완충액에 포름아미드 포함 및/또는 혼성화 완충액에 SDS(나트륨 도데실 황산염 계면활성제)와 같은 화합물의 농도 감소 및/또는 또는 혼성화 완충액으로부터 덱스트란 설페이트 또는 폴리에틸렌 글리콜(분자 군집(crowding) 촉진)과 같은 화합물의 배제를 포함한다. 비제한적인 예로서, 엄격한 혼성화를 위한 대표적인 염 및 온도 조건은 다음과 같다: 1 x SSC, 65℃에서 0.5% SDS. 약어 SSC는 핵산 혼성화 용액에 사용되는 완충액을 말한다. 1리터의 20X(20배 농축) 스톡 SSC 완충 용액(pH 7.0)은 175.3 g의 염화나트륨과 88.2 g의 시트르산나트륨을 함유한다. 혼성화 달성을 위한 대표적인 시간은 12시간이다.
용어 "전사 인자 결합 부위"(transcription factor binding site, TFBS)는 당업계에 널리 공지되어 있다. 다양한 특정 TFBS 서열이 본 명세서에 개시되어 있다. 의도하는 TF에 결합하는 한, 대안적인 TFBS 서열이 사용될 수 있다는 것이 당업자에게 명백할 것이다. 본 명세서에 개시된 다양한 TFBS에 대한 공통 서열은 당업계에 공지되어 있고, 당업자는 대안적인 TFBS를 결정하기 위해 이 정보를 용이하게 사용할 수 있다. 또한, 주어진 추정 서열에 결합하는 TF의 능력은 당업자에 의해 (예를 들어, EMSA 및 당업계에 널리 공지되고 본 명세서에서 논의되는 다른 접근법에 의해) 실험적으로 쉽게 결정할 수 있다.
"공통 서열(consensus sequence)"의 의미는 당업계에 널리 공지되어 있다. 본 출원에서, 문맥상 달리 표시하지 않는 한, 다음 표기법이 공통 서열에 사용된다. 다음 예시적인 DNA 서열을 고려한다:
A[CT]N{A}YR
A는 A가 항상 해당 위치에서 발견된다는 것을 의미하고; [CT]는 해당 위치의 C 또는 T를 나타내며; N은 해당 위치의 모든 염기를 나타내고; 및 {A}는 A를 제외한 모든 염기가 그 위치에서 발견됨을 의미한다. Y는 임의의 피리미딘을 나타내고, R은 임의의 퓨린을 나타낸다.
본 출원에서 "합성된"이란 자연에서 발생하지 않는 핵산 분자를 의미한다. 본 발명의 합성 핵산은 인공적으로 제조되며, 이는 일반적으로 재조합 기법, 또는 신규(de novo) 합성에 의한 것이다. 이러한 합성된 핵산은 자연 발생 서열(예로서, 프로모터, 인핸서, 인트론, 및 기타 이러한 조절 서열들)을 함유할 수 있으나, 이들은 비-자연 발생 상황에서 존재한다. 예를 들어, 합성 유전자(또는 유전자의 일부)는 통상적으로 자연에서 연속되지 않은 하나 이상의 핵산 서열들(키메라 서열)을 함유하고, 및/또는 치환, 삽입, 및 결실 및 이들의 조합을 포괄할 수 있다.
본 명세서에서 사용된 "상보적인" 또는 "상보성"은 2개의 핵산 서열의 왓슨-크릭 염기쌍을 말한다. 예를 들어, 서열 5'-AGT-3'의 경우는 상보적 서열 3'-TCA-5'에 결합한다. 2개의 핵산 서열들 간의 상보성은 "부분적"일 수 있으며, 여기서 염기들 중 일부만이 그들의 상보체에 결합하며, 또는 해당 서열의 모든 염기가 그의 상보적 염기에 결합하는 경우 완전할 수 있다. 핵산 가닥들 간의 상보성 정도는 핵산 가닥들 간의 혼성화의 효율성과 강도에 상당한 영향을 미친다.
본 출원에서 "형질감염(transfection)"은 핵산을 세포 내로 의도적으로 도입하는 임의의 과정을 광범위하게 말하며, 바이러스 및 비-바이러스 벡터의 도입을 망라하고, 및 형질전환, 형질도입 및 이와 유사한 용어 및 과정들도 포함하거나 이와 균등하다. 그 예로는, 이에 제한되지는 않지만, 바이러스 벡터를 사용한 형질감염; 플라스미드 벡터를 사용한 형질전환; 전기천공 (Fromm et al. (1986) Nature 319:791-3); 리포펙션 (Feigner et al. (1987) Proc. Natl. Acad. Sci. USA 84:7413-7); 미세주입 (Mueller et al. (1978) Cell 15:579-85); 아그로박테리움-매개형 전달 (Fraley et al. (1983) Proc. Natl. Acad. Sci. USA 80:4803-7); 직접 DNA 흡수; 위스커-매개형(whiskers-mediated) 형질전환; 및 미세사출법(microprojectile bombardment) (Klein et al. (1987) Nature 327:70)을 포함한다.
본 명세서에 사용된 바와 같이, "이식유전자(transgene)"는 외인성 핵산 서열을 말한다. 일 예에서, 이식유전자는 산업적 또는 약학적으로 유용한 화합물을 코딩하는 유전자, 또는 바람직한 형질을 코딩하는 유전자이다. 또 다른 예에서, 이식유전자는 안티센스 핵산 서열과 같은 유용한 핵산을 코딩하며, 여기서 상기 안티센스 핵산 서열의 발현은 표적 핵산 서열의 발현을 억제한다. 상기 이식유전자는 치료적 산물, 예를 들어 단백질을 코딩한다.
용어 "벡터(vector)"는 용어는 당업계에 잘 알려져 있으며, 이는 본 명세서에서 사용되는 바와 같이 핵산 분자, 예로서 본 발명에 따른 핵산 서열이 그 내부에 삽입되었을 수 있는, 이중 가닥 DNA를 말한다. 벡터는 삽입된 핵산 분자를 적절한 숙주 세포로 수송하는데 적절히 사용된다. 벡터는 일반적으로 삽입 핵산 분자를 전사하고, 및 바람직하게는 전사체를 폴리펩티드로 번역하는데 필요한 모든 요소들을 함유한다. 벡터는, 일단 벡터가 숙주 세포 중에 존재하면, 숙주 염색체 DNA와는 독립적으로 또는 이와 동시에 복제할 수 있도록 하는, 필요한 모든 요소들을 통상적으로 함유하며; 벡터 및 이의 삽입된 핵산 분자의 여러 카피들이 생성될 수 있다. 본 발명의 벡터는 에피솜성 벡터(즉, 숙주 세포의 게놈 내로 통합되지 않음)일 수 있거나, 또는 숙주 세포 게놈 내로 통합되는 벡터일 수 있다. 본 정의에는 비-바이러스 및 바이러스 벡터가 모두 포함된다. 비-바이러스 벡터에는, 이에 제한되지는 않지만, 플라스미드 벡터 (예를 들어, pMA-RQ, pUC 벡터, 블루스크립트 벡터(pBS) 및 pBR322 또는 박테리아 서열(미니서클)이 없는 이의 유도체), 트랜스포존 기반 벡터 (예를 들어, PiggyBac (PB) 벡터 또는 Sleeping Beauty (SB) 벡터) 등을 포함한다. 더 큰 벡터들, 예를 들어 인공 염색체 (박테리아 (BAC), 효모 (YAC), 또는 인간 (HAC))를 사용하여 더 큰 삽입물을 수용할 수도 있다. 바이러스 벡터는 바이러스로부터 유래되며, 레트로바이러스, 렌티바이러스, 아데노 연관 바이러스, 아데노바이러스, 헤르페스 바이러스, 간염 바이러스 벡터 등을 포함하나 이에 제한되지는 않는다. 반드시 그런 것은 아니지만 일반적으로, 바이러스 벡터는 복제에 필수적인 바이러스 유전자가 바이러스 벡터로부터 제거되어, 해당 세포에서 증식하는 능력을 상실하였기 때문에 복제 불능성(replication-deficient)이다. 그러나, 일부 바이러스 벡터들은 해당 세포, 예컨대 암세포에서 특이적으로 복제하도록 제작될 수 있으며, 일반적으로 (암) 세포-특이적 (종양) 용해를 유발하는데 사용된다. 비로좀(virosome)은 바이러스 및 비-바이러스 요소를 모두 포함하는 벡터의 비제한적 예이며, 특히 이들은 리포좀과 비활성화된 HIV 또는 인플루엔자 바이러스를 결합시킨다(Yamada et al., 2003). 또 다른 예는 양이온성 지질과 혼합된 바이러스 벡터를 포괄한다.
본 명세서에서 사용된 용어 "작동가능하게 연결된", "작동가능하게 결합된" 또는 이와 균등한 표현들은 요소들이 기능적으로 결합되어 의도된 방식으로 서로 상호작용할 수 있도록 각각에 대해 다양한 핵산 요소들을 배열한 것을 말한다. 이러한 요소들은, 제한 없이, 프로모터, CRE(예를 들어, 인핸서 또는 기타 조절 요소), 프로모터 요소, 폴리아데닐화 서열, 하나 이상의 인트론 및/또는 엑손, 및 발현될 관심 유전자의 코딩 서열을 포함할 수 있다. 핵산 서열 요소들은, 적절하게 배향되거나 작동가능하게 연결되는 경우, 함께 작용하여 서로의 활성을 조절하고, 및 궁극적으로는 발현 산물의 발현 수준에 영향을 미칠 수 있다. 조절한다는 것은 특정 요소의 활성 수준을 증가, 감소, 또는 유지하는 것을 의미한다. 다른 요소들에 대한 각 해당 요소의 위치는 각 요소의 5' 말단 및 3' 말단, 또는 다른 요소 또는 이들의 위치(TSS 또는 프로모터 요소와 같은)의 상류 또는 하류 위치로 나타낼 수 있고, 임의의 특정 요소들 사이의 거리는 해당 요소들 사이에 있는 개재되어 있는 뉴클레오타이드 또는 염기쌍의 수로 언급될 수 있다. 당업자라면 이해할 수 있듯이, 작동가능하게 연결되어 있다는 것은 기능적 활성을 의미하며, 및 자연적인 위치 연결과 반드시 관련이 있는 것은 아니다. 실제로, 핵산 발현 카세트에 사용되는 경우, CRE는 통상적으로 프로모터 요소의 상류 바로 가까이에 위치할 것이지만(일반적으로 이러한 경우이긴 하나, 핵산 발현 카세트 내의 위치를 제한하거나 배제하는 것으로 해석되어서는 결코 아니된다), 그러나 이것은 생체 내에서 그러할 필요는 없는데, 예를 들어 전사가 영향을 미치는 유전자의 하류에서 자연 발생하는 조절 요소 서열은 프로모터의 상류에 위치하는 경우에 동일한 방식으로 기능할 수 있다. 따라서, 특정 구체예에 따르면, 조절 요소의 조절 효과 또는 향상 효과는 위치-독립적일 수 있다.
본 명세서에서 사용된 "스페이서 서열(spacer sequence)" 또는 "스페이서(spacer)"는 2개의 기능적 핵산 서열들(예를 들어, TFBS, CRE, CRM, 프로모터 요소 등)을 분리시키는 핵산 서열이다. 기능적 핵산 서열 (예로서, 시스-조절 요소)이 목적하는 대로 기능하는 것을 방해(예로서, 이는 사일런서 서열을 포함하거나, 원하는 전사 인자의 결합을 방해하는 등의 경우에 일어날 수 있음)하지 않는 한, 스페이서는 본질적으로는 임의의 서열을 가질 수 있다. 일반적으로, 이는 인접한 기능적 핵산 서열들을 서로 이격시키기 위해서만 존재하기 때문에 비기능적이다. 일 구체예에 있어서, 스페이서는 75개, 50개, 40개, 30개, 30개 또는 10개 뉴클레오티드 이하의 길이를 가질 수 있다.
본 명세서에서 사용된 용어 "약제학적으로 허용가능한"은 당업계에서와 일치하고, 약제학적 조성물의 다른 성분들과 상용성으로서 그 수용 개체에게 유해하지 않음을 의미한다.
"치료적 유효량" 및 이와 유사한 문구들은, 원하는 특정 약리학적 효과, 예를 들어 근육에서 치료 유전자를 발현시키는 것을 제공하는 개체에서의 용량 또는 혈장 농도를 의미한다. 비록 이러한 용량이 당업자에 의해 치료적으로 유효량인 것으로 간주된다고 하더라도, 치료적 유효량이 본원에 기재된 병증들을 치료하는데 항상 효과적인 것은 아닐 수 있다. 상기 치료적 유효량은 투여 경로 및 제형, 개체의 연령 및 체중, 및/또는 치료되는 질병 또는 병증에 따라 달라질 수 있다.
본 명세서에서 사용된 용어 "AAV 벡터"는 당업계에 널리 공지되어 있으며, 일반적으로 다양한 핵산 서열을 포함하는 AAV 벡터 핵산 서열을 말한다. 본 명세서에서 사용된 AAV 벡터는 전형적으로 벡터의 일부로서 AAV 기원이 아닌 이종 핵산 서열을 포함한다. 이러한 이종 핵산 서열은 전형적으로 본 명세서에 개시된 프로모터 및 세포의 유전적 형질전환을 위한 다른 관심 서열을 포함한다. 일반적으로, 이종 핵산 서열은 적어도 하나, 일반적으로 두개의 AAV 역 말단 반복 서열(inverted terminal repeat sequence, ITR)에 의해 플랭킹(flank)된다. "AAV 비리온" 또는 "AAV 바이러스" 또는 "AAV 바이러스 입자" 또는 "AAV 벡터 입자"는 적어도 하나의 AAV 캡시드 폴리펩티드(변이체 AAV 캡시드 폴리펩티드 및 비변이체 모 캡시드 폴리펩티드 모두 포함) 및 캡슐화된 폴리뉴클레오티드 AAV 벡터로 구성된 바이러스 입자를 말한다. 입자가 이종 핵산(즉, 포유동물 세포에 전달될 이식유전자와 같은, 야생형 AAV 게놈 이외의 폴리뉴클레오티드)을 포함하는 경우, "AAV 벡터 입자" 또는 간단히 "AAV 벡터"로 지칭될 수 있다. 따라서, AAV 비리온 또는 AAV 입자의 생산은 이러한 벡터가 AAV 비리온 또는 AAV 입자 내에 포함되기 때문에 반드시 AAV 벡터의 생산을 포함한다.
"작은 간섭" 또는 "짧은 간섭 RNA" 또는 siRNA는 관심 유전자("표적 유전자")를 표적으로 하는 뉴클레오티드의 RNA 이합체이다. "RNA 이합체(duplex)"는 RNA 분자의 2개 영역 사이의 상보적 짝짓기에 의해 형성된 구조를 말한다. siRNA는 유전자에 "표적화"되고 및 siRNA의 이합체 부분의 뉴클레오티드 서열은 표적화된 유전자의 뉴클레오티드 서열에 상보적이다. 일 구체예에 있어서, siRNA의 이합체의 길이는 30개 뉴클레오티드 미만이다. 일 구체예에 있어서, 상기 이합체는 길이가 29개, 28개, 27개, 26개, 25개, 24개, 23개, 22개, 21개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개 또는 10개 뉴클레오티드일 수 있다. 일 구체예에 있어서, 이합체의 길이는 19개 내지 25개 뉴클레오티드일 수 있다. siRNA의 RNA 이합체 부분은 헤어핀 구조의 일부일 수 있다. 이합체 부분에 더하여, 헤어핀 구조는 이합체를 형성하는 2개의 서열 사이에 위치된 루프 부분을 함유할 수 있다. 상기 루프는 길이가 다를 수 있다. 일 구체예에 있어서, 상기 루프는 길이가 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개 또는 13개 뉴클레오티드일 수 있다. 상기 헤어핀 구조는 3' 또는 5' 돌출부(overhang) 부분을 포함할 수 있다. 일 구체예에 있어서, 상기 돌출부는 길이가 0개, 1개, 2개, 3개, 4개 또는 5개의 뉴클레오티드인 3' 또는 5' 돌출부일 수 있다.
본 명세서에서 사용된, 용어 "마이크로 RNA(microRNA)"는 내인성 마이크로 RNA 및 인공 마이크로 RNA(예를 들어, 합성 miRNA)를 포함하나, 이에 제한되지 않는, 임의의 유형의 간섭 RNA를 말한다. 내인성 마이크로 RNA는 mRNA의 생산적 이용을 조절할 수 있는 게놈에 자연적으로 코딩된 작은 RNA(small RNA)이다. 인공 마이크로 RNA는 mRNA의 활성을 조절할 수 있는, 내인성 마이크로 RNA 이외의, 모든 유형의 RNA 서열일 수 있다. 마이크로 RNA 서열은 이들 서열 중 임의의 하나 이상으로 구성된 RNA 분자일 수 있다. 마이크로 RNA(또는 "miRNA"") 서열은 이러한 문헌 Lim, et al , 2003, Genes & Development, 17, 991-1008, Lim et al , 2003, Science, 299, 1540, Lee and Ambrose, 2001, Science, 294, 862, Lau et al, 2001, Science 294, 858-861, Lagos -Quintana et al, 2002, Current Biology, 12, 735-739, Lagos- Quintana ei a/., 2001, Science, 294, 853-857, and Lagos-Quintana et al. , 2003, RNA, 9, 175-179에 기재되어 있다. 마이크로 RNA의 예는 더 큰 RNA의 RNA 단편을 포함하거나 miRNA, siRNA, stRNA, sncRNA, tncRNA, snoRNA, smRNA, shRNA, snRNA, 또는 기타 작은 비암호화 RNA이다. 예를 들어, 미국 특허 출원 20050272923, 20050266552, 20050142581, 및 20050075492를 참조한다. "마이크로 RNA 전구체"(또는 "pre-miRNA")는 마이크로 RNA 서열이 내부에 통합된 스템-루프 구조를 갖는 핵산을 말한다. "성숙한 마이크로 RNA"(또는 "성숙 miRNA")는 마이크로 RNA 전구체로부터 절단되거나 합성된(예로서, 무세포 합성에 의해 실험실에서 합성된) 마이크로 RNA("pre-miRNA"")를 포함하며, 및 약 19개 뉴클레오티드 내지 약 27개 뉴클레오티드의 길이를 가지고, 예를 들어, 성숙한 마이크로 RNA는 19 nt, 20 nt, 21 nt, 22 nt, 23 nt, 24 nt, 25 nt, 26 nt, 또는 27 nt의 길이를 가질 수 있다. 성숙한 마이크로 RNA는 표적 mRNA에 결합하고 표적 mRNA의 번역을 억제할 수 있다.
용어 "치료" 또는 "치료하는"은 질병 또는 병증의 하나 이상의 징후, 증상, 또는 영향을 감소, 개선 또는 제거하는 것을 말한다. 따라서 본 명세서에서 사용된 "치료"는 포유동물, 특히 인간의 질병의 임의의 치료를 포함하고, 다음을 포함한다: (a) 질병에 걸리기 쉽거나 질병에 걸릴 위험이 있지만 아직 발병한 것으로 진단되지 않은 개체에서 질병이 발생하는 것을 방지하는 것; (b) 질병을 억제하는 것, 즉 병의 발병을 억제하는 것; 및 (c) 질병을 완화시키는 것, 즉 질병의 회귀를 야기하는 것.
개체에 대한 약제의 "투여"는 약제의 의도된 기능을 수행하기 위해 피험자에게 약제를 도입하거나 전달하는 모든 경로가 포함된다. 투여는 경구, 비내, 안내, 안과, 비경구(정맥내, 근육내, 복강내, 또는 피하), 또는 국소를 포함한, 임의의 적합한 경로에 의해 수행될 수 있다. 투여는 자가-투여와 타인에 의한 투여를 포함한다. 근육내 투여는 본 발명에서 특히 중요하다.
용어 "개체", "대상체" 및 "환자"는 서로 교환하여 사용되는 것으로, 치료가 필요한 질병 또는 병증이 있는 모든 개별 대상을 지칭한다. 본 발명의 목적상, 개체는 영장류, 바람직하게는 인간, 또는 다른 포유동물, 예를 들어 개, 고양이, 말, 돼지, 염소, 또는 소 등일 수 있다.
실시예
본 발명의 구체예에 따른 합성된 근육-특이적 프로모터의 강도는 각각의 합성된 근육-특이적 프로모터를 리포터 유전자 루시페라제에 작동가능하게 연결하여 테스트하였다. 테스트할 근육-특이적 프로모터 및 루시퍼라제 유전자를 포함하는 발현 카세트를 적절한 플라스미드에 삽입한 다음 이를 다양한 세포 유형에 형질감염시켜 이들 세포에서 합성된 근육-특이적 프로모터의 발현을 테스트하였다.
실시예 1 - 1세대 디자인의 인 비트로 테스트
재료 및 방법
DNA 준비물은 H9C2 (랫트 BDIX 심장 근모세포 세포주, ATCC에서 입수가능함), C2C12 (불멸화된 마우스 근모세포 세포주, ATCC에서 입수가능함), H2K 2B4 (불멸 위성 세포-유래 세포주, PloS One. 2011; 6 (9): e24826 참조), Huh7 (공지된 간세포 암종 세포주, JCRB Cell Bank(JCRB0403) 출처) 또는 HEK293 (공지된 인간 배아 신장 세포, ECACC 세포 은행)에 형질감염하여 전사 활성을 평가하였다.
H9C2 세포 배양 및 형질감염
H9C2는 쥐 BDIX 심장 근모세포 세포주이다. 이는, 심장 근육 특성을 갖는데, 예를 들어 컨플루언시(confluency)로 형성된 근관이 아세틸콜린에 반응한다.
세포 유지
H9C2 세포를 T-75 플라스크 내에서, 1% FBS(열 비활성화된-Gibco 10270-106, lot number 42G2076K), 1% 글루타맥스(35050-038, Gibco), 1% 페니실린-스트렙토마이신 용액(15140-122, Gibco)가 포함된 DMEM(고글루코오스, D6546, Sigma)에서 배양하였다. 세포를 컨플루언스 아래 단계(70 내지 80%)에서 계대하여 세포가 컨플루언스 및 융합되어 근관을 형성하는 위험을 피하였다.
세포를 유지하는 동안 계대하기 위해, 배양 배지를 제거하고, 세포를 MgCl2 (14190-094, Gibco) 없이, CaCl2가 없는 5ml DPBS로 두 번 세척하였다. 세포를 약 5분 동안 1 ml 트립신 EDTA(25200-056, Gibco)와 함께 배양하여 플라스크에서 분리하였다. 다음으로, 4 ml의 배양 배지를 플라스크에 첨가하고 혼합물을 위아래로 부드럽게 피펫팅하여 플라스크 표면에서 세포를 분리하는 데 도움을 주었다. 세포를 100g에서 3분 동안 펠렛화하였다. 상층액을 제거하고 세포를 3 ml의 배양 배지에 재현탁시켰다. 세포를 Countess 자동 세포 계수기(Countess automated cell counter)에서 계수하고, 1:3 내지 1:10으로 접종, 즉 1-3x10,000개 세포/cm2로 접종하고 37℃ 5% CO2에서 배양하였다.
세포 형질전환 및 분화
H9C2 세포를 상기 기술한 바와 같이, DPBS로 세척하고, 1 ml 트립신 EDTA를 이용하여 플라스크에서 분리하고, 4 ml의 배양 배지로 플라스크 표면을 세척하고, 100 g에서 3시간 동안 펠렛화하여 대략 70 내지 80% 컨플루언시(confluency)의 2개의 T-75 플라스크에서 수집하였다. 세포를 45 ml 배양 배지에 재현탁하고 48 웰 평평한 바닥인 플레이트(300μl/웰)(353230, Corning)에 40,000개 세포/웰의 밀도로 접종하였다. 48-웰 플레이트의 세포를 37℃ 5% CO2에서 배양하였다.
24시간 후, 상기 세포의 배양 배지를 300 μl 무항생제 배양 배지(즉, 1% FBS(열 불활성화-Gibco 10270-106, lot number 42G2076K), 1% 글루타맥스가 포함된 DMEM(고글루코오스, D6546, Sigma))로 교환하였다. 웰당 300 ng의 DNA를 웰당 30 μl의 총 복합체 부피에서 비아펙트(viafect)(E4981, Promega)로 형질감염시켰다. 플레이트를 형질감염 후 부드럽게 혼합하고 37℃ 5% CO2에서 배양하였다.
24시간 후, 형질감염된 세포에서 배양 배지를 제거하고 DMEM(고글루코오스, D6546, Sigma), 1% 글루타맥스(35050-038, Gibco), 1% FBS(열 불활성화-Gibco 10270-106, lot number 42G2076K), 1% 페니실린/스트렙토마이신 용액(15140-122, Gibco) 및 0.1% 레티노이드 산(Sigma-R2625)으로 이루어진 300 μl의 분화 배지로 교환하였다. 플레이트를 37℃ 5% CO2에서 7일 동안 배양하여 분화를 유도하였다. 분화 후, 세포 형태를 관찰하여 근관으로의 분화를 확인하였다.
다음으로 세포를 500 μl DPBS로 세척하고, Milli-Q 워터를 이용하여 1X로 희석한 100 μl 루시퍼라제 세포 배양 용해 5X 시약(Luciferase Cell Culture Lysis 5X Reagent)(E1531, Promega)로 용해시켰다. 세포 용해 시약을 위아래로 10회 피펫팅한 다음 플레이트를 중간 세기에서 30분 동안 볼텍싱하여 세포 용해를 촉진하였다. 플레이트를 밀봉하고 루시퍼라제 분석을 완료하기 전까지 -80℃에서 보관하였다. 루시퍼라제 분석부터 H9C2 세포에서 형질감염까지 수집된 모든 데이터는 적어도 3회 생물학적 반복 실험의 3회 기술적 반복 실험을 기반으로 하였다.
H2K 2B4 (H2K) 세포 배양 및 형질감염
세포 유지
H2K 세포는 T-75 플라스크 중 20% FBS(열 불활성화-Gibco 10500-064, lot number 08Q2771K), 1% 글루타맥스(35050-038, Gibco), 1% 페니실린-스트렙토마이신 용액(15140-122, Gibco), 0.5% 닭 배아 추출물(MD-OO4E-UK, LSP, lot number A20418), 0.2% 마우스 IFN-γ(315-05, Peprotech, lot number 061798C2918)가 포함된 DMEM(고글루코오스, D6546, Sigma)에서 배양하였다. 세포가 4 내지 6.7 x 104 세포/cm2의 컨플루언시에 도달하면 세포를 3 내지 4일마다 매번 계대하였다. 계대를 위해, 배양 배지는 제거되었으며, 세포를 MgCl2 (14190-094, Gibco)가 없고, CaCl2가 없는 5 ml DPBS로 2회 세척하고 및 세포를 1 ml 트립신 EDTA(25200-056, Gibco)를 이용하여 플라스크로부터 분리하였다. 세포는 약 2분 동안 트립신 EDTA와 함께 배양한 후, 플라스크에 4 ml의 배양 배지를 첨가하고 위아래로 부드럽게 피펫팅하여 플라스크 표면에서 세포를 세척하였다. 세포는 100g에서 3분 동안 펠렛화하였다. 상층액을 제거하고 세포를 6 ml의 배양 배지에 재현탁시켰다. 세포를 Countess 자동 세포 계수기(Countess automated cell counter)에서 계수하고 4000, 2700, 2000 또는 1300 세포/cm2의 4가지 밀도로 접종하고, 및 33℃ 10% CO2에서 배양하였다.
세포 형질감염 및 분화
H2K 세포를 DPBS로 세척하고, 약 2분 동안 1 ml의 트립신 FDTA를 이용하여 플라스크에서 분리하며, 4 ml의 배양 배지로 플라스크 표면을 세척하고 3분 동안 100g에서 피펫팅하여 약 20 내지 40%의 컨플루언시(confluency)의 세 개의 T-75 플라스크로부터 수집하였다. 45 ml의 배양 배지에 세포를 8000개의 세포/100 ㎕의 밀도로 재현탁시켰다. 다음으로, 100μl의 세포 현탁액을 BioFill Solo Reagent Dispenser(Brooks Automation Ltd, Catalog #34-1000)를 이용하여 96-웰 마트리겔- 코팅된(Corning, ref. 354234, lot. 8085009) 플레이트의 각 웰에 분배하였다. 96-웰 플레이트의 세포를 33℃ 10% CO2에서 배양하였다.
24시간 후, 세포의 배양 배지를 100 μl 무항생제 배양 배지(즉, 20% FBS(열-불활성화 10500-064, lot number 08Q2771K), 1% 글루타맥스(35050-038, Gibco), 0.5% 닭 배아 추출물(MD-OO4E-UK, LSP, lot number A20418), 0.2% 마우스 IFN-γ(315-05, Peprotech, lot number 061798C2918)가 포함된 DMEM(고글루코오스, D6546, Sigma))로 교환하였다. 웰당 150 ng의 DNA를 웰당 10 μl의 총 복합체 부피인 0.3 μl Lipofectamine 3000으로 형질감염시켰다. 플레이트를 형질감염 후 부드럽게 혼합하고 33℃ 10% CO2에서 배양하였다. 24시간 후, 형질감염된 세포에서 배양 배지를 제거하고 DMEM(고글루코오스, D6546, Sigma), 0.1% 글루타맥스(35050-038, Gibco), 0.2% 말 혈청(GIBCO, ref. 16050-122, lot.1671317), 0.02% 닭 배아 추출물(MD-OO4E-UK, LSP, lot number A20418), 0.1% 페니실린/스트렙토마이신 용액(15140-122, Gibco)으로 이루어지는 200 μl 분화 배지로 교환하였다. 플레이트를 37℃ 5% CO2에서 72시간 동안 인큐베이션하여 분화를 유도하였다. 분화 후, 세포 형태를 관찰하여 근관으로 분화 여부를 확인하였다 . 다음으로, 세포를 250 μl DPBS로 세척한 다음, Milli-Q 워터를 이용하여 1X로 희석한 50 μl 루시페라제 세포 배양 용해 5X 시약(E1531, Promega)로 용해하였다. 세포 용해 시약을 위아래로 10회 피펫팅한 다음 플레이트를 중간 세기에서 10분 동안 볼텍싱하여 세포 용해를 촉진하였다. 플레이트를 밀봉하고, 루시퍼라제 분석을 완료하기 전까지 -80℃에서 보관하였다.
루시퍼라제 분석 준비
용해된 세포를 포함하는 96-웰 플레이트는 상온에서 해동시키고, 중간 세기에서 10분 동안 볼텍싱하고, 2250g에서 1분 동안 원심분리하였다. 10 μl 용해물은 각 웰에서 Microplate FluoroNunc 96 웰 평평한 바닥(Fisher Scientific, 10346331)으로 옮겼다. 루시퍼라제 판독값은 하기 기재한 바와 같이 BMG Labtech FLUOstar Omega 플레이트 판독기에서 LAR(Promega, catalog# E4550) 주입을 이용하여 생성하였다. 루시퍼라제 분석부터 H2K 세포의 형질감염까지 수집된 모든 데이터는 4회 기술적 반복 실험과 3회의 생물학적 반복 실험을 기반으로 하였다(하나의 생물학적 반복실험만 이용가능한 SP0346 및 SP0347 제외).
C2C12 세포 배양 및 형질감염
세포 유지
C2C12 세포는 T-75 플라스크 중 10% FBS(열 불활성화-Gibco 10500-064), 1% 글루타멕스(35050-038, Gibco), 1% 페니실린-스트렙토마이신 용액(15140-122, Gibco)가 포함된 DMEM(High Glucose, D6546, Sigma)에서 배양되었다. 세포에 2 내지 3일마다 새로운 배지를 공급하고 70% 컨플루언시(confluency)에 도달했을 때 계대하였다. 계대하기 위해, 배양 배지를 제거하고, 세포를 MgCl2 (14190-094, Gibco)가 없이, CaCl2 없는 5 ml DPBS로 2회 세척하고 세포를 플라스크(T-75)로부터 1 ml 트립신 EDTA(25200-056, Gibco)를 이용하여 분리되었다. 세포가 현미경 하에서 감별되어 분리될 때까지, 세포를 37℃에서(CO2 인큐베이터 내에서) 3 내지 5분 동안 배양하였다. 4 ml의 완전 배양 배지를 플라스크에 첨가하여 트립신을 불활성화시키고 세포 현탁액을 15 ml 튜브로 옮겼다. 세포를 3분 동안 250g에서 펠렛화하였다. 상층액을 제거하고 세포를 6 ml의 배양 배지에 재현탁시켰다. 세포를 Countess 자동 세포 계수기에서 계수하고 1:10 희석으로 접종하였으며, 및 37℃ 5% CO2에서 배양하였다.
세포 형질감염 및 분화
C2C12 세포는 80% 컨플루언시에 도달하면 DPBS로 세척하고, 약 3 내지 5분 동안 1 ml의 트립신 EDTA를 이용하여 플라스크에서 분리하며, 4 ml의 배양 배지로 플라스크 표면을 세척하고, 및 3분 동안 250g에서 펠렛화하여 T-75 플라스크에서 수집하였다. 세포를 계대 수에 따라 특정 밀도로 재현탁하였다(상세하게는 하기 표 참조).
Figure pct00008
다음으로 300μl의 적절한 세포 현탁액(계대 수를 기준으로 함)을 48웰 플레이트의 각 웰에 분배하였다. 48-웰 플레이트의 세포를 37℃ 5% CO2에서 배양하였다.
24시간 후, 세포의 배양 배지를 DMEM(고글루코오스, D6546, Sigma) 및 1% 글루타맥스를 포함하는 300 ㎕의 미리 데워진 형질감염 배지로 교환하였다. 300 ng의 DNA를 웰당 30㎕의 총 복합체 부피인 0.9㎕ 비아펙트(Viafect)(E4981, Promega)로 형질감염시켰다. 플레이트를 형질감염 후 부드럽게 혼합하고 37℃ 5% CO2에서 배양하였다.
24시간 후, 배양 배지를 형질감염된 세포에서 제거하고 DMEM(고글루코오스, 피부르산 나트륨 없음, 11960-044, Gibco), 1% 글루타맥스, 2% 말 혈청(열-불활성화, 16050-122, Gibco)로 이루어진 분화 배지로 교환하였다. 플레이트를 37℃ 5% CO2에서 추가로 5.5일 동안 배양하여 분화를 유도하였다. 분화 후, 세포 형태를 관찰하여 근관으로의 분화를 확인하였다. 다음으로, 세포를 300 μl DPBS로 세척하고, 이어서 Milli-Q 워터를 사용하여 1X로 희석된 100 μl 루시페라제 세포 배양 용해 5X 시약(E1531, Promega)로 용해하였다. 플레이트를 밀봉하였으며, 루시퍼라제 분석을 완료하기 전까지 -80℃에서 보관하였다.
루시퍼라제 분석 준비
용해된 세포를 함유하는 48-웰 플레이트를 상온에서 해동시키고, 중간 세기으로 10분 동안 볼텍싱하고, 1분 동안 2250xg에서 원심분리하였다. 10 μl의 용해물을 각 웰에서 흰색 Microplate FluoroNunc 96 웰 플랫 바텀(Fisher Scientific, 10346331)으로 옮겼다. 하기 설명한 바와 같이, 루시퍼라제 판독값은 BMG Labtech FLUOstar Omega 플레이트 판독기에서 LAR(Promega, 카탈로그 번호 E4550) 주입을 사용하여 생성하였다. 루시페라제 분석부터 C2C12 세포의 형질감염까지 수집된 모든 데이터는 3회 기술적 반복실험과 최소 3회 생물학적 반복실험을 기반으로 하였다.
Huh7 세포 배양 및 형질감염
재료
- 인간 간세포주 Huh7 세포
- DPBS: CaCl2 없음, MgCl2 없음(Gibco, 14190-094)
- DMEM(Sigma, D6546)
- FBS(Sigma, F9665)
- Pen-Strep(Sigma, P4333)
- Promega Fugene-HD(E2311)
- LARII(Dual Luciferase Reporter 1000 assay system, Promega, E1980)
방법
1일차
세포를 48 웰 플레이트에 25,000개 세포/300 μl의 밀도로 접종하였다.
HEK293 세포 배양 및 형질감염
2일차
- 형질감염 당일, 형질감염할 DNA를 100 ng/μl 저장 용액(stock sloution)으로 희석하였다.
- 48 웰 형질감염당, 45 ng의 DNA를 4.1 μl의 옵티멤 배지(Optimem medium)와 혼합하였다. 0.5 μl의 Fusion HD를 4 μl의 옵티멤 배지와 혼합하였다. 이 2개의 용액을 혼합하고 실온에서 15분 동안 배양한 다음, 웰에 적가하였다.
3일차
루시퍼라제 활성은 하기와 같이 측정하였다.
HEK293 세포 배양 및 형질감염
HEK293-T는 20%의 밀도로 접종하였다. 60%와 80% 사이의 컨플루언시에 도달하면, 배지를 10% FBS(Gibco, 26140)가 보충된 DMEM(#21885-025 - Thermo Scientific)로 교체하였다. 3시간 후, 세포를 형질감염 혼합물로 형질감염시켰다. 상기 형질감염 혼합물은 멸균 DPBS(#14190169 - ThermoFisher Scientific)에 DNA(6 웰 플레이트 당 2 μg) 및 PEI 25 kDA(#23966-1 - Polyscience)를 1:3의 비율로 추가하여 준비하였다. 혼합 후, 형질감염 혼합물을 실온에서 30분 동안 배양한 다음 세포에 바로 첨가하였다.
24시간 형질감염 후, 루시퍼라제 활성을 하기 기재한 바와 같이 측정하였다.
루시퍼라제 활성 측정
- 루시페라제 활성은 LARII(Dual Luciferase Reporter 1000 assay system, Promega, E1980)를 이용하여 측정하였다.
- 형질감염 24시간 후, 세포에서 배지를 제거하였다.
- 세포는 300 μl의 DPBS에 1회 세척하였다.
- 세포를 100μl의 수동 용해 완충액을 사용하여 용해하고 15분 동안 흔들면서 배양하였다.
- 탁상형 원심분리기에서 최대 속도로 플레이트를 1분간 원심분리하여 세포 잔해를 펠릿화하였다.
- 10μl 시료를 흰색 96-웰 플레이트로 옮기고 BMG Labtech FLUOstar Omega 플레이트 리더에 50μl의 LARII 기질을 주입하여 발광을 측정하였다.
이러한 세포 배양에서 생성된 결과는 도 1 내지 11 및 13, 14, 15, 16 및 20에 나타내었다.
실시예 2. 생체 내 테스트
루시퍼라제 유전자를 유도하는 SP0173, SP0270, SP0268, SP0320, SP0134, SP0279, SP0057, SP0229, SP0310, SP0067, 및 SP0267 각각, 또는 대조군 프로모터 CBA 및 CK8을 포함하는 발현 카세트가 생성되고, 이러한 발현 카세트를 포함하는 AAV2/9를 고성능 액체 크로마토그래피(high performance liquid chromatography, HPLC)를 통해 정제하였다. AAV를 0.9% 염수로 희석하고 꼬리 정맥을 통해 8마리의 8주령 수컷 Balb/c(야생형) 마우스에 200 μl/마우스로 1e+12 vg/마우스 용량으로 전달하였다. 6주 후에 마우스를 희생시켰고, 및 횡격막(골격 근육), 심장(심장 근육), 장(골격 근육), 신장(특이도 대조군 조직), 간(특이도 대조군 조직), 폐(특이도 대조군 조직), 대퇴사두근(골격 근육), 비장(특이도 대조군 조직) 및 전방 경골(골격 근육)을 수집하고, 3부분으로 나누었다. 샘플은 해부 직후 액체 질소에서 급속-냉동되어 -80℃에서 보관되었다. 횡격막, 심장, 장, 간, 대퇴사두근, 및 전방 경골에 대한 판독값은 단백질 정량화(BCA Pierce 단백질 분석 키트; Promega 23225 사용) 및 루시페라제 정량화(ONE-Glo Luciferase Assay System; Promega E6120 사용)로 생성하였다. RLU 값은 pg/ml로 계산하였다.
도 17의 x축은 로그 스케일이다. 데이터를 로그 스케일(log10)로 표시하기 위해, 로그 스케일로 변환하기 전 정규화된 RLU 값에 109를 곱했다. x축은 정규화된 RLU 값의 log10 곱하기 109를 나타낸다. 도 18 및 19에서 x축은 RLU 값(pg/ml)을 나타낸다.
생체 내 테스트된 합성된 프로모터는 도 17A 내지 17F에 나타낸 바와 같이 간 및 장에서보다 심장, 횡격막, 대퇴사두근 및 전방 경골에서 훨씬 더 활성이 높았다.
SP0270 및 SP0268 (도 18B 및 18C)과 같은 일부 프로모터는 심장 근육(심장)보다 골격 근육(횡격막 및 전방 경골)에서 더 활성이 높았다. SP0057, SP0229 및 SP0067 (도 18G, 18H, 및 18I)과 같은 다른 프로모터는 골격 근육(횡격막 및 전방 경골)보다 심장 근육(심장)에서 더 활성이 높았다.
도 19 및 도 18I는 심장 근육-특이적 프로모터 SP0067이 골격 근육(횡격막, 대퇴사두근, 전방경골, 장)에서 활성이 아니라 심장에서 활성임을 나타낸다. SP0067은 대조군 프로모터 CBA 및 CK8보다 심장 근육에서 덜 활성이었으나 이러한 일반 대조군 프로모터와는 달리, 골격 근육에 비해 심장 근육에 대해 상당히 특이적이었다. 또한, SP0067은 간에서 약간의 활성을 갖는다.
실시예 3. 고성능 시스-조절 요소(CRE) 및 프로모터 요소 및 이들의 조합 확
골격 및 심장 근육:
근육-특이적 유전자 발현을 향상시키는 데 유용할 것으로 예상되는 CRE 및/또는 프로모터 요소의 다양한 조합을 포함하는 100개 이상의 대규모 그룹의 합성된 프로모터를 조립하고(여기에는 실시예 1 및 2의 합성된 프로모터 및 추가적인 근육-특이적 프로모터를 포함함), 골격 및 심장 근육에서 테스트하였다. 이들 프로모터는 다양한 CRE, 프로모터 요소 및 이들의 조합에 의한 심장 및 골격 근육 발현에 대한 기여를 평가하는데 유용한 근육-특이적 프로모터의 대규모 그룹을 나타낸다. 심장 및 골격 근육(H9C2 및 C2C12 세포)에서 테스트된 대규모 그룹의 프로모터를 도 21 내지 23에서 'ALL'로 지칭하였다.
이 그룹을 분석하여 심장 및 골격 근육 모두에서 높은 수준의 근육-특이적 발현과 특별히 강한 상관관계가 있는 CRE 그룹, 프로모터 요소 그룹 및 이들의 조합을 식별하였다.
테스트한 모든 프로모터 그룹 중에서, CRE0035, CRE0036, CRE0029, CRE0071, CRE0020 및 CRE0031로 이루어진 그룹으로부터 선택된 2개 이상의 작동가능하게 연결된 "코어(core)" 골격 및 심장 CRE를 포함하는 근육-특이적 프로모터의 특정 하위집합이 골격 및 심장 근육 모두에서 높은 활성과 특별히 좋은 상관관계가 있는 것이 확인되었다. 이 바람직한 프로모터 그룹은 도 21B에서 '그룹 1'로 지칭하였다.
추가적으로, 코어 심장 및 골격 프로모터 요소 CRE0037, CRE0070, SKM_18, CRE0010, CRE0049, CRE0048, CRE0011, SKM_14 및 CRE0046 중 하나에 작동가능하게 연결된 위에서 언급한 코어 심장 및 골격 CRE 중 적어도 하나를 포함하는 근육-특이적 프로모터의 추가 하위집단이 높은 활성과 특별히 좋은 상관관계가 있는 것이 확인되었다. 이 바람직한 프로모터 그룹은 도 22B에서 '그룹 2'로 지칭된다.
또한, CRE0037, CRE0070, SKM_18, CRE0010, CRE0049, CRE0048, CRE0011, SKM_14 및 CRE0046에서 선택되는 두개의 코어 심장 및 골격 프로모터 요소를 포함하는 근육-특이적 프로모터의 하위집단이 높은 활성과 특별히 좋은 상관관계가 있는 것이 확인되었다. 이 바람직한 프로모터 그룹은 도 23B에서 '그룹 3'으로 지칭하였다.
'그룹 1' 프로모터의 특별히 높은 활성을 설명하기 위하여 골격 및 심장 근육에서 그룹 'ALL'(n=103)과 '그룹 1'(n=9)의 평균 활성을 도 21B에 나타내었다(참고로, 'ALL'은 '그룹 1'의 프로모터에 추가 프로모터를 함유함). 골격 근육에서 각 프로모터의 활성과 심장 근육 활성을 평균하여 골격 근육 및 심장 근육의 (평균) 활성을 나타내었다. 이러한 도면에서 알 수 있듯이, '그룹 1'의 평균 활성은 그룹 'ALL'의 평균 활성보다 약 2배 정도 높았다.
이론에 얽매이는 걸 바라지 않으나, '그룹 1'의 우수한 성능은 하나 이상의 코어 골격 및 심장 CRE의 존재 때문일 수 있다. 골격 및 심장 근육에서 테스트된 모든 프로모터의 그룹('그룹 ALL')에서, 각각의 프로모터에 존재하는 CRE의 개수를 계산하였다. 추가로, 각 프로모터에 존재하는 코어 골격 및 심장 CRE의 수를 계산하였고, 여기서 다시 코어 CRE는 CRE0035, CRE0036, CRE0029, CRE0071, CRE0020 및 CRE0031이었다. 특정 수의 코어 CRE 대 임의의 CRE를 가지는 프로모터의 평균 활성을 계산하고 도 21A에 나타내었다. 이 도면은 프로모터 내 특정 개수의 코어 골격 및 심장 CRE가 존재하는 것이 임의의 CRE인 특정 개수의 CRE를 가지는 프로모터와 비교하여 증가된 활성과 연관성이 있음을 보여준다.
'그룹 2' 프로모터의 특별히 높은 활성을 설명하기 위하여 골격 및 심장 근육에서 그룹 'ALL'(n=103)과 '그룹 2'(n=20)의 평균 활성을 도 22B에 나타내었다(참고로,'ALL'은 '그룹 2'의 프로모터에 추가 프로모터를 함유함). 골격 근육에서 각 프로모터의 활성과 심장 근육에서의 활성을 평균하여 골격 근육 및 심장 근육의 (평균) 활성을 나타내었다. 이러한 도면에서 알 수 있듯이, '그룹 2'의 평균 활성은 그룹 'ALL'의 평균 활성보다 약 3배 정도 높았다.
이론에 얽매이는 걸 바라지 않으나, '그룹 2'의 우수한 성능은 골격 및 심장 CRE 및 코어 골격 및 심장 프로모터 요소의 존재 때문일 수 있다. 골격 및 심장 근육에서 테스트된 모든 프로모터 그룹(그룹 'ALL')에서, 각각의 프로모터에 존재하는 요소의 개수를 계산하였으며, 이때, 각 프로모터 요소, CRE, 5' UTR/인트론은 하나의 요소로 계산하였다. 추가적으로, 각각의 프로모터에 존재하는 코어 골격 및 심장 CRE 및 코어 골격 및 심장 프로모터 요소의 수를 계산하였다. 특정 수의 코어 CRE 및 프로모터 요소 대 임의의 요소를 가지는 프로모터의 평균 활성을 계산하고 도 22A에 나타내었다. 이 도면은 프로모터 내 특정 개수의 코어 골격 및 심장 CRE 및 코어 골격 및 심장 프로모터 요소가 존재하는 것이 임의의 요소인 특정 개수의 요소를 가지는 프로모터와 비교하여 증가된 활성과 연관성이 있음을 보여준다.
'그룹 3' 프로모터의 높은 활성을 설명하기 위하여 골격 및 심장 근육에서 그룹 'ALL'(n=103)과 '그룹 3'(n=2)의 평균 활성을 도 23B에 나타내었다(참고로, 그룹 'ALL'은 '그룹 3'의 프로모터에 추가 프로모터를 함유함). 골격 근육에서 각 프로모터의 활성과 심장 근육에서 활성을 평균하여 골격 근육 및 심장 근육의 (평균) 활성을 나타내었다. 이러한 도면에서 알 수 있듯이, '그룹 3'의 평균 활성은 그룹 'ALL'의 평균 활성보다 약 2배 정도 높았다.
이론에 얽매이는 걸 바라지 않으나, '그룹 3'의 우수한 성능은 코어 골격 및 심장 프로모터 요소의 존재 때문일 수 있다. 심장 및 골격 근육에서 테스트된 모든 프로모터 그룹(그룹 'ALL')에서, 각각의 프로모터에 존재하는 요소의 개수를 계산하였으며, 즉, 각 프로모터 요소, CRE, 5' UTR/인트론을 하나의 요소로 계산하였다. 추가적으로, 각각의 프로모터에 존재하는 코어 골격 및 심장 프로모터 요소의 수를 계산하였다. 특정 수의 코어 골격 및 심장 프로모터 요소 대 임의의 요소를 가지는 프로모터의 평균 활성을 계산하고 도 23A에 나타내었다. 이 도면은 프로모터 내 특정 개수의 코어 골격 및 심장 프로모터 요소가 존재하는 것이 임의의 요소인 특정 개수의 요소를 가지는 프로모터와 비교하여 증가된 활성과 연관성이 있음을 보여준다.
골격 근육:
근육-특이적 유전자 발현을 향상시키는 데 유용할 것으로 예상되는 CRE 및/또는 프로모터 요소의 다양한 조합을 포함하는 100개 이상의 합성된 프로모터의 대규모 그룹을 조립하고(여기에는 실시예 1 및 2의 합성된 프로모터 및 추가 근육-특이적 프로모터가 포함됨), 골격 근육에서 테스트하였다. 이러한 프로모터는 다양한 CRE, 프로모터 요소 및 이들의 조합에 의한 골격 근육 발현에 대한 기여를 평가하는데 유용한 근육-특이적 프로모터의 대규모 그룹을 나타낸다. 골격 근육(C2C12 세포)에서 테스트된 대규모 그룹의 프로모터를 도 24 내지 25에서 'ALL'로 지칭하였다.
이 그룹을 분석하여 골격 근육에서 높은 수준의 근육-특이적 발현과 특별히 강한 상관관계가 있는 CRE 그룹, 및 프로모터 요소 그룹을 확인하였다.
테스트한 모든 프로모터 그룹 중에서, RE0035, CRE0050, CRE0020, CRE0031, CRE0047, CRE0071 및 DES_MT_enhancer_48bp로 이루어지는 그룹으로부터 선택된 2개 이상의 작동가능하게 연결된 "코어" 골격 CRE를 포함하는 근육-특이적 프로모터의 특정 하위집합이 골격 근육에서 높은 수준의 활성과 특별히 좋은 상관관계가 있는 것이 확인되었다. 이 바람직한 프로모터 그룹은 도 24B에서 '그룹 4'로 지칭된다.
추가적으로, 코어 골격 프로모터 요소 CRE0049, CRE0037, SKM_14_CRE0048, CRE0011_RSV, CRE0070, CRE0046 중 하나에 작동가능하게 연결된 위에서 언급한 코어 골격 CRE 중 적어도 하나를 포함하는 근육-특이적 프로모터의 추가 하위집합이 골격 근육에서 높은 수준의 활성과 특별히 좋은 상관관계가 있는 것으로 확인되었다. 이 바람직한 프로모터 그룹은 도 25B에서 '그룹 5'로 지칭된다.
'그룹 4' 프로모터의 특별히 높은 활성을 설명하기 위하여 그룹 'ALL'(n=104)과 '그룹 4'(n=6)의 평균 활성을 도 24B에 나타내었다(참고로, 'ALL'은 '그룹 4'의 프로모터에 추가 프로모터를 함유함). 이러한 도면에서 알 수 있듯이, '그룹 4'의 평균 활성은 그룹 'ALL'의 평균 활성보다 약 3배 정도 높았다.
이론에 얽매이는 걸 바라지 않으나, 골격 근육에서 '그룹 4'의 우수한 성능은 하나 이상의 코어 골격 CRE의 존재 때문일 수 있다. 골격 근육에서 테스트된 모든 프로모터 그룹('그룹 ALL')에서, 각각의 프로모터에 존재하는 CRE의 개수를 계산하였다. 또한, 각 프로모터에 존재하는 코어 골격 CRE의 수를 계산하였고, 여기서 다시 코어 골격 CRE은 CRE0035, CRE0050, CRE0020, CRE0031, CRE0047, CRE0071 및 DES_MT_enhancer_48bp이었다. 특정 수의 코어 골격 CRE 대 임의의 CRE를 가지는 프로모터의 평균 활성을 계산하고 도 24A에 나타내었다. 이 도면은 프로모터 내 특정 개수의 코어 골격 CRE가 존재하는 것이 임의의 CRE인 특정 개수의 CRE를 가지는 프로모터와 비교하여 증가된 활성과 연관성이 있음을 보여준다.
'그룹 5' 프로모터의 높은 활성을 설명하기 위하여 그룹 'ALL'(n=104)과 '그룹 5'(n=16)의 평균 활성을 도 25B에 나타내었다(참고로, 'ALL'은 '그룹 5'의 프로모터에 추가 프로모터를 함유함). 이러한 도면에서 알 수 있듯이, '그룹 5'의 평균 활성은 그룹 'ALL'의 평균 활성보다 약 3배 정도 높았다.
이론에 얽매이는 걸 바라지 않으나, '그룹 5'의 우수한 성능은 코어 골격 CRE 및 코어 골격 프로모터 요소의 존재 때문일 수 있다. 골격 근육에서 테스트된 모든 프로모터 그룹(그룹 'ALL')에서, 각각의 프로모터에 존재하는 요소의 수를 계산하였고, 즉 각 프로모터 요소, CRE, 또는 5' UTR/인트론은 하나의 요소로 계산하였다. 추가적으로, 각 프로모터에 존재하는 코어 골격 CRE 및 코어 골격 프로모터 요소의 수를 계산하였다. 특정 수의 코어 골격 CRE 및 프로모터 요소 대 임의의 요소를 가지는 프로모터의 평균 활성을 계산하고 도 25A에 나타내었다. 이 도면은 특정 개수의 코어 골격 CRE 및 코어 골격 프로모터 요소가 존재하는 것이 특정 개수의 요소를 가지는 프로모터와 비교하여 프로모터 내 증가된 활성과 연관성이 있고, 여기서 CRE이 임의의 CRE임을 보여준다.
골격 및 심장 근육:
근육-특이적 유전자 발현을 향상시키는 데 유용할 것으로 예상되는 CRE 및/또는 프로모터 요소의 다양한 조합을 포함하는 250개 이상의 합성된 프로모터 대규모 그룹을 조립하고(여기는 실시예 1 및 2의 합성된 프로모터 및 추가적인 근육-특이적 프로모터를 포함함), 심장 근육에서 테스트하였다. 이러한 프로모터는 다양한 CRE, 프로모터 요소 및 이들의 조합에 의한 심장 근육 발현에 대한 기여를 평가하는데 유용한 근육-특이적 프로모터의 대규모 그룹을 나타낸다. 심장 근육(H9C2 세포)에서 테스트된 다수의 프로모터 그룹을 도 26 내지 28에서 'ALL'로 지칭하였다.
이 그룹을 분석하여 심장 근육에서 높은 수준의 근육-특이적 발현과 특별히 강한 상관관계가 있는 CRE 그룹, 프로모터 요소 그룹 및 이들의 조합을 확인하였다.
테스트한 모든 프로모터 그룹 중에서, CRE0035, CRE0029, CRE0069, CRE0071, CRE0036, CRE0096, CRE0079, CRE0051, CRE0031 및 CRE0020로 이루어지는 그룹으로부터 선택되고 2개 이상의 작동가능하게 연결된 "코어" 심장 CRE를 포함하는 근육-특이적 프로모터의 특정 하위집합이 심장 근육에서 높은 수준의 활성과 특별히 좋은 상관관계가 있는 것이 확인되었다. 이 바람직한 프로모터 그룹은 도 26B에서 '그룹 6'으로 지칭된다.
추가적으로, 코어 심장 프로모터 요소 SKM_18, CRE0070, CRE0010_ITGB1BP2, CRE0037, DES_mp_V1, CRE0046 중 하나에 작동가능하게 연결된 위에서 언급한 코어 심장 CRE 중 적어도 하나를 포함하는 근육-특이적 프로모터의 추가 하위집합이 심장 근육에서 높은 수준의 활성과 특별히 좋은 상관관계가 있는 것이 확인되었다. 이 바람직한 프로모터 그룹은 도 27B에서 '그룹 7'로 지칭된다.
또한, SKM_18, CRE0070, CRE0010_ITGB1BP2, CRE0037, DES_mp_V1, CRE0046에서 선택된 2개의 코어 심장 프로모터 요소를 포함하는 근육-특이적 프로모터의 하위집합은 심장 근육에서 높은 활성과 특별히 좋은 상관관계가 있는 것으로 확인되었다. 이 바람직한 프로모터 그룹은 도 28B에서 '그룹 8'로 지칭된다.
'그룹 6' 프로모터의 특별히 높은 활성을 설명하기 위하여 심장 근육에서 그룹 'ALL'(n=285)와 '그룹 6'(n=49)의 평균 활성을 도 26B에 나타내었다(참고로, 'ALL'은 '그룹 6'의 프로모터에 추가 프로모터를 함유함). 이 도면에서 알 수 있듯이, '그룹 6'의 평균 활성은 그룹 'ALL'의 평균 활성보다 약 2배 정도 높았다.
이론에 얽매이는 걸 바라지 않으나, '그룹 6'의 우수한 성능은 하나 이상의 코어 심장 CRE의 존재 때문일 수 있다. 심장 근육에서 테스트된 모든 프로모터 그룹('그룹 ALL')에서, 각각의 프로모터에 존재하는 CRE의 개수를 계산하였다. 추가적으로, 각 프로모터에 존재하는 코어 심장 CRE의 수를 계산하였고, 여기서 다시 코어 CRE는 CRE0035, CRE0029, CRE0069, CRE0071, CRE0036, CRE0096, CRE0079, CRE0051, CRE0031 및 CRE0020이었다. 특정 수의 코어 심장 CRE 대 임의의 CRE를 가지는 프로모터의 평균 활성을 계산하고 도 26A에 나타내었다. 이 도면은 프로모터 내 특정 개수의 코어 심장 CRE가 존재하는 것이 임의의 CRE인 특정 개수의 CRE를 가지는 프로모터와 비교하여 증가된 활성과 연관성이 있음을 보여준다.
'그룹 7' 프로모터의 특별히 높은 활성을 설명하기 위하여 심장 근육에서 그룹 'ALL'(n=285)와 '그룹 7'(n=73)의 평균 활성을 도 27B에 나타내었다(참고로, 'ALL'은 '그룹 7'의 프로모터에 추가 프로모터를 함유함). 이 도면에서 알 수 있듯이, '그룹 7'의 평균 활성은 그룹 'ALL'의 평균 활성보다 약 2배 정도 높았다.
이론에 얽매이는 걸 바라지 않으나, '그룹 7'의 우수한 성능은 심장 CRE 및 코어 심장 프로모터 요소의 존재 때문일 수 있다. 심장 근육에서 테스트된 모든 프로모터 그룹(그룹 'ALL')에서, 각각의 프로모터에 존재하는 요소의 개수를 계산하였고, 즉, 각각의 프로모터 요소, CRE, 5' UTR/인트론을 하나의 요소로 계산하였다. 추가적으로, 각 프로모터에 존재하는 코어 심장 CRE 및 코어 심장 프로모터 요소의 수를 계산하였다. 특정 수의 코어 심장 CRE 및 프로모터 요소 대 임의의 요소를 갖는 프로모터의 평균 활성을 계산하고 도 27A에 나타내었다. 이 도면은 프로모터 내 특정 개수의 코어 심장 CRE 및 프로모터 요소가 존재하는 것이 임의의 CRE인 특정 개수의 요소를 가지는 프로모터와 비교하여 심장 근육에서 증가된 활성과 연관성이 있음을 보여준다.
'그룹 8' 프로모터의 특별히 높은 활성을 설명하기 위하여 심장 근육에서 그룹 'ALL'(n=285)와 '그룹 8'(n=2)의 평균 활성을 도 28B에 나타내었다(참고로, 'ALL'은 '그룹 8'의 프로모터에 추가 프로모터를 함유함). 이 도면에서 알 수 있듯이, '그룹 8'의 평균 활성은 그룹 'ALL'의 평균 활성보다 약 2배 정도 높았다.
이론에 얽매이는 걸 바라지 않으나, '그룹 8'의 우수한 성능은 코어 심장 프로모터 요소의 존재 때문일 수 있다. 심장 근육에서 테스트된 모든 프로모터 그룹(그룹 'ALL')에서, 각각의 프로모터에 존재하는 요소의 개수를 계산하였고, 즉, 각각의 프로모터 요소, CRE, 5' UTR/인트론을 하나의 요소로 계산하였다. 추가적으로, 각 프로모터에 존재하는 코어 심장 프로모터 요소의 수를 계산하였다. 특정 수의 코어 심장 프로모터 요소 대 임의의 요소를 갖는 프로모터의 평균 활성을 계산하고 도 28A에 나타내었다. 이 도면은 프로모터 내 특정 개수의 코어 심장 프로모터 요소가 존재하는 것이 임의의 요소인 특정 개수의 요소를 가지는 프로모터와 비교하여 증가된 활성과 연관성이 있음을 보여준다.
분석:
합성된 프로모터 중 일부의 활성은 공지 프로모터 CBA로 정규화되었으나 반면에 다른 합성된 프로모터의 활성은 공지 프로모터 RSV로 정규화되었다. 금번 분석에서 공지된 프로모터 CBA 및 공지된 프로모터 RSV의 활성은 약 1:1 이므로 CBA로 정규화된 합성된 프로모터의 활성과 RSV로 정규화된 합성된 프로모터의 활성을 함께 대조하고 분석하여 고성능 CRE, 및 프로모터 및 이의 조합을 확인하였다. 따라서 도 23 내지 도 28에 나타낸 합성된 프로모터의 활성은 CBA 또는 RSV로 정규화된 것이다.
일부 프로모터는 '그룹 1', '그룹 2', '그룹 3', '그룹 4', '그룹 5', '그룹 6', '그룹 7' 및 '그룹 8' 중 하나 이상의 그룹에 속함을 참고해야 한다.
상기 언급한 분석은 골격 및/또는 심장 근육의 활성에 기여하는 CRE 및/또는 프로모터 요소의 전용 목록을 제공하는 것이 아니다. 프로모터 요소 또는 합성된 프로모터에 추가되는 경우 골격 및/또는 심장 근육의 활성에 기여하는, 다른 CRE 및/또는 프로모터 요소가 있다.
예를 들어, 시스-조절 요소 CRE0033을 프로모터 요소 SKM_18에 추가하면(합성된 프로모터 SP0067이 생성됨), 도 29A에 나타낸 바와 같이 SKM_18 단독에 비해 심장 근육(H9C2 세포)의 활성이 증가하였다. 추가적으로, 총 2개의 CRE0033 및 1개의 SKM_18에 추가 시스-조절 요소 CRE0033을 추가하면(합성된 프로모터 SP0436이 생성됨), 도 29A에 나타낸 바와 같이 심장 근육의 활성이 추가로 증가하였다. SKM_18은 코어 심장 프로모터 요소 및 코어 심장 및 골격 프로모터 요소이다.
마찬가지로, 합성된 프로모터 SP0409 (즉, 차례로 CRE0083 및 SKM_18로 이루어짐)에 시스-조절 요소 CRE0090을 추가하면, 합성된 프로모터 SP0418이 생성되고 도 29B에 나타낸 바와 같이 SP0409에 비해 심장 근육(H9C2 세포)의 활성이 증가하였다.
또한, 합성된 프로모터 SP0067 (즉, 차례로 CRE0033 및 SKM_18로 이루어짐)에 시스-조절 요소 CRE0096을 추가하여 합성된 프로모터 SP0451이 생성되고, 도 29C에 나타낸 바와 같이 SP0067에 비해 심장 근육(H9C2 세포)의 활성이 증가하였다.
서열 정보
표 1 - 근육-특이적 프로모터
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
Figure pct00030
Figure pct00031
Figure pct00032
표 1A - 추가의 근육-특이적 프로모터
Figure pct00033
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
표 1B - 추가의 심장 근육-특이적 프로모터
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
표 1C - 추가의 근육-특이적 프로모터
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
표 2 - 표 1의 프로모터 유래 CRM
Figure pct00052
Figure pct00053
Figure pct00054
Figure pct00055
Figure pct00056
Figure pct00057
Figure pct00058
Figure pct00059
Figure pct00060
Figure pct00061
Figure pct00062
Figure pct00063
Figure pct00064
Figure pct00065
표 2A - 표 1A의 프로모터 유래 CRM
Figure pct00066
Figure pct00067
Figure pct00068
표 2B - 표 1B의 프로모터 유래 CRM
Figure pct00069
Figure pct00070
표 2C - 표 1C의 프로모터 유래 CRM
Figure pct00071
Figure pct00072
Figure pct00073
Figure pct00074
표 3. 표 1의 프로모터에 포함된 시스-조절 요소
Figure pct00075
Figure pct00076
Figure pct00077
Figure pct00078
Figure pct00079
표 4 - 표 1의 프로모터에 포함된 최소/근위 프로모터
Figure pct00080
Figure pct00081
Figure pct00082
표 5 - 기타 요소들(예를 들어, 인트론/UTR)
Figure pct00083
표 6. 표 3에 제시된 CRE에 추가하여 표 1A의 프로모터에 포함된 시스-조절 요소
Figure pct00084
Figure pct00085
Figure pct00086
표 7 - 표 4의 최소 또는 근위 프로모터에 추가로 표 1A의 프로모터에 포함된 최소/근위 프로모터
Figure pct00087
표 8. 표 3 및/또는 표 6에 제시된 CRE에 추가로 표 1B 및 1C의 프로모터에 포함된 시스-조절 요소
Figure pct00088
Figure pct00089
표 9. 표 4 및/또는 표 7의 최소 또는 근위 프로모터에 추가로 표 1B 및 1C의 프로모터에 포함된 최소/근위 프로모터.
Figure pct00090
Figure pct00091
표 10 - 표시된 시스-조절 요소 및 최소 또는 근위 프로모터를 갖는 본 발명의 구체예에 따른 심장 특이적 프로모터의 개략도
Figure pct00092
Figure pct00093
CRE ID 참고
CRE0010_ITGB1BP2 (서열번호 272)
CRE0055 (서열번호 282) CRE0010의 더 짧은 버전 (서열번호 272)
CRE0056 (서열번호 283) CRE0055 (서열번호 282) + 5' UTR
CRE0072 (서열번호 286) CRE0010 (서열번호 272) + 5' UTR
CRE0020 (서열번호 303)
CRE0020.2 (서열번호 411) CRE0020의 더 짧은 버전(서열번호 303)
CRE0093 (서열번호 412) MUS_CRE0020의 부분 (서열번호 303)
CRE0094 (서열번호 413) MUS_CRE0020의 부분 (서열번호 303)
CRE0093.2 (서열번호 545) CRE0093의 더 짧은 버전 (서열번호 412)
CRE0094.2 (서열번호 546) CRE0094의 더 짧은 버전 (서열번호 413)
CRE0028 (서열번호 306)
CRE0117 (서열번호 469) CRE0028의 더 큰 버전 (서열번호 306)
CRE0029 (서열번호 307)
CRE0029.2 (서열번호 395) CRE0029의 더 짧은 단편 (서열번호 307)
CRE0033 (서열번호 309)
CRE0108 (서열번호 465) CRE0033의 변이 (서열번호 309)
CRE0035 (서열번호 310)
CRE0050 (서열번호 313) CRE0035의 변이 (서열번호 310)
CRE0099 (서열번호 300) CRE0035의 변이 (서열번호 310)
CRE0047 (서열번호 312)
DES_MT_enhancer_48bp (서열번호 547) CRE0047의 짧은 버전 (서열번호 312)
DES_MT_enhancer_48bp_v2 (서열번호 335) CRE0047의 변이 (서열번호 312)
DES_MT_enhancer_48bp_v3 (서열번호 336) CRE0047의 변이 (서열번호 312)
DES_MT_enhancer_72bp (서열번호 400) CRE0047의 짧은 버전 (서열번호 312)
DES_MT_enhancer_72bp_v2 (서열번호 337) CRE0047의 변이 (서열번호 312)
DES_MT_enhancer_72bp_v3 (서열번호 338) CRE0047의 변이 (서열번호 312)
DES_MT_enhancer_72bp_v4 (서열번호 339) CRE0047의 변이 (서열번호 312)
DES_MT_enhancer_72bp_v5 (서열번호 340) CRE0047의 변이 (서열번호 312)
DES_MT_enhancer_72bp_v6 (서열번호 341) CRE0047의 변이 (서열번호 312)
CRE0059 (서열번호 317) CRE0047의 더 짧은 버전 (서열번호 312)
CRE0060 (서열번호 318) CRE0047의 더 짧은 버전 (서열번호 312)
CRE0049 (서열번호 278)
CRE0034 (서열번호 274) CRE0049의 변이 (서열번호 278)
CRE0052 (서열번호 315)
CRE0084 (서열번호 404) CRE0052의 더 긴 버전 (서열번호 315)
CRE0053 (서열번호 279)
CRE0053. 2 (서열번호 280) CRE0053의 1 bp 확장 (서열번호 279)
CRE0069 (서열번호 320)
CRE0069.2 (서열번호 396) CRE0069의 더 짧은 버전 (서열번호 320)
CRE0070 (서열번호 284)
CRE0054 (서열번호 281) CRE0070의 더 긴 버전 (서열번호 284)
CRE0046 (서열번호 276) CRE0070의 더 긴 버전 (서열번호 284)
CRE0071 (서열번호 321)
CRE0051 (서열번호 314) CRE0071의 더 긴 버전 (서열번호 321)
CRE0071.2 (서열번호 323) CRE0071의 변이 (서열번호 321)
CRE0071.3 (서열번호 293) CRE0071의 변이 (서열번호 321)
CRE0071.4 (서열번호 294) CRE0071의 변이 (서열번호 321)
CRE0071.5 (서열번호 537) CRE0071의 변이 (서열번호 321)
CRE0071.6 (서열번호 295) CRE0071의 변이 (서열번호 321)
CRE0071.7 (서열번호 331) CRE0071의 변이 (서열번호 321)
CRE0071.8 (서열번호 296) CRE0071의 변이 (서열번호 321)
CRE0071.9 (서열번호 297) CRE0071의 변이 (서열번호 321)
CRE0071.10 (서열번호 332) CRE0071의 변이 (서열번호 321)
CRE0071.11 (서열번호 333) CRE0071의 변이 (서열번호 321)
CRE0071.12 (서열번호 334) CRE0071의 변이 (서열번호 321)
CRE0071.13 (서열번호 397) CRE0071의 변이 (서열번호 321)
CRE0071.14 (서열번호 398) CRE0071의 변이 (서열번호 321)
CRE0071.15 (서열번호 399) CRE0071의 변이 (서열번호 321)
CRE0071.16 (서열번호 533) CRE0071의 변이 (서열번호 321)
CRE0071.17 (서열번호 534) CRE0071의 변이 (서열번호 321)
CRE0071.18 (서열번호 535) CRE0071의 변이 (서열번호 321)
CRE0071.19 (서열번호 536) CRE0071의 변이 (서열번호 321)
CRE0071.20 (서열번호 538) CRE0071의 변이 (서열번호 321)
CRE0071.21 (서열번호 539) CRE0071의 변이 (서열번호 321)
CRE0071.22 (서열번호 540) CRE0071의 변이 (서열번호 321)
CRE0071.23 (서열번호 541) CRE0071의 변이 (서열번호 321)
CRE0071.24 (서열번호 543) CRE0071의 변이 (서열번호 321)
CRE0073 (서열번호 324)
CRE0074 (서열번호 325) CRE0073의 더 짧은 버전 (서열번호 324)
CRE0075 (서열번호 326) CRE0073의 더 짧은 버전 (서열번호 324)
CRE0076 (서열번호 327)
CRE0077 (서열번호 298) CRE0076의 더 짧은 버전 (서열번호 327)
CRE0081 (서열번호 402)
CRE0092 (서열번호 420) CRE0081의 더 긴 버전 (서열번호 402)
CRE0090 (서열번호 409)
CRE0091 (서열번호 410) CRE0090의 더 짧은 버전 (서열번호 409)
<110> Synpromics Limited ASKLEPIOS BIOPHARMACEUTICAL, INC <120> Regulatory Nucleic Acid Sequences <130> P266013WO <150> GB1919269.9 <151> 2019-12-24 <150> GB2012192.7 <151> 2020-08-05 <160> 550 <170> PatentIn version 3.5 <210> 1 <211> 298 <212> DNA <213> Artificial Sequence <220> <223> SP0010 <400> 1 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccacc 298 <210> 2 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> SP0020 <400> 2 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtccaccg cctgctgcca 300 cggccggccg tataaataga ggcgaggagc agctgggctc tcttggcagt cacc 354 <210> 3 <211> 270 <212> DNA <213> Artificial Sequence <220> <223> SP0033 <400> 3 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgccaccg cctgctgcca cggccggccg tataaataga ggcgaggagc 240 agctgggctc tcttggcagt caccgccacc 270 <210> 4 <211> 286 <212> DNA <213> Artificial Sequence <220> <223> SP0038 <400> 4 taagtccggg cagggtcctg tccataaaag gcttttcccg ggccggctcc ccgccggcag 60 cgtgccccgc cccggcccgc tccatctcca aagcatgcag agaatgtctc ggcagccccg 120 gtagactgct ccaacttggt gtctttcccc aaatatggag cctgtgtgga gtcactgggg 180 gagccggggg tggggagcgg agccggcttc ctctagccac cgcctgctgc cacggccggc 240 cgtataaata gaggcgagga gcagctgggc tctcttggca gtcacc 286 <210> 5 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> SP0040 <400> 5 ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60 tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120 ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180 cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240 aggagccacc gcctgctgcc acggccggcc gtataaatag aggcgaggag cagctgggct 300 ctcttggcag tcacc 315 <210> 6 <211> 421 <212> DNA <213> Artificial Sequence <220> <223> SP0042 <400> 6 ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60 tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120 ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180 cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240 aggagaggtc cctatatggt tgtgttagag tgaacggcca gcttcagccc gtctttgctc 300 cttgtttggg aagcgagtgg gaggggatca gagcaagggg ctatataacc cttcagcgtt 360 cagcctcccg ggacaccacc cacccagagt ggagaagccc agccagtcgc tgtcagccac 420 c 421 <210> 7 <211> 524 <212> DNA <213> Artificial Sequence <220> <223> SP0051 <400> 7 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtttctcc tctataaata 300 cccgctctgg tatttggggt tggcagctgt tgctgccagg gagatggttg ggttgacggg 360 atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 420 ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 480 gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 524 <210> 8 <211> 601 <212> DNA <213> Artificial Sequence <220> <223> SP0057 <400> 8 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc caccgcggtg 240 gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg ggtgaggaat 300 ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg ttggcgctct 360 aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc aaatatggcg 420 acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc gcattcctgg 480 gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg gcggcccacg 540 agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg cggccgccac 600 c 601 <210> 9 <211> 531 <212> DNA <213> Artificial Sequence <220> <223> SP0058 <400> 9 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaaactcgg gggccaggca ctggcgctga 300 cgcaggctag cagggcgcca ctggctggtc cccacccacc tcggtgggtt gggggatggg 360 cgcaccagcc cctcctgggt gagccctagc ctggggcttc ctatttcggg agccgggggc 420 gtgggccacg tctcctcatg tgatgcgagg gctatttaaa gcggcagccc gggcagggag 480 ccgccgtcgg agcccttgca cgcctgctct cttgtagctg cggccgccac c 531 <210> 10 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> SP0061 <400> 10 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaaataaat acccgctctg gtatttgggg 300 ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgcg ggatcttgca 360 gctgtcaggg gaggggaggc gggggctgat gtcaggaggg atacaaatag tgccgacggc 420 tgggggccct gtctcccctc gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc 480 ctccgtgcgc ccgccagcct cgcccgcgcc gtcaccgcgg ccgccacc 528 <210> 11 <211> 454 <212> DNA <213> Artificial Sequence <220> <223> SP0062 <400> 11 ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60 tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120 gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180 tgctctgagg agctggaacc ataaataccc gctctggtat ttggggttct cctctataaa 240 tacccgctct ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg 300 ggaggcgggg gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct 360 cccctcgccg catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc 420 cagcctcgcc cgcgccgtca ccgcggccgc cacc 454 <210> 12 <211> 484 <212> DNA <213> Artificial Sequence <220> <223> SP0064 <400> 12 tacatcattt acctagaaaa gaggacagct gtcctttccc aaagctccgg tgaccctgcc 60 ccgcccagtg tgactagccc aggttggtga ttctgatctg ttgccaaacc aaactggctc 120 cccggggagc catttggtaa tgttccctgg agtcatttcc ttgcgaagca ttccttttcg 180 gtgagaggac atttttttca tccctgataa acaaccacag cctgcgccag ataaataccc 240 gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 300 gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 360 aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 420 gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgcggccgc 480 cacc 484 <210> 13 <211> 465 <212> DNA <213> Artificial Sequence <220> <223> SP0065 <400> 13 taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60 gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120 atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180 acatttcttc ctgattcgca tacgccgcgg cataaatacc cgctctggta tttggggttc 240 tcctctataa atacccgctc tggtatttgg ggttggcagc tgttgcggga tcttgcagct 300 gtcaggggag gggaggcggg ggctgatgtc aggagggata caaatagtgc cgacggctgg 360 gggccctgtc tcccctcgcc gcatccactc tccggccggc cgcctgcccg ccgcctcctc 420 cgtgcgcccg ccagcctcgc ccgcgccgtc accgcggccg ccacc 465 <210> 14 <211> 484 <212> DNA <213> Artificial Sequence <220> <223> SP0066 <400> 14 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc ataaataccc 240 gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 300 gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 360 aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 420 gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgcggccgc 480 cacc 484 <210> 15 <211> 443 <212> DNA <213> Artificial Sequence <220> <223> SP0067 <400> 15 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctga taaatacccg ctctggtatt tggggttctc ctctataaat acccgctctg 240 gtatttgggg ttggcagctg ttgcgggatc ttgcagctgt caggggaggg gaggcggggg 300 ctgatgtcag gagggataca aatagtgccg acggctgggg gccctgtctc ccctcgccgc 360 atccactctc cggccggccg cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc 420 gcgccgtcac cgcggccgcc acc 443 <210> 16 <211> 448 <212> DNA <213> Artificial Sequence <220> <223> SP0068 <400> 16 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgataaat acccgctctg gtatttgggg ttctcctcta taaatacccg 240 ctctggtatt tggggttggc agctgttgcg ggatcttgca gctgtcaggg gaggggaggc 300 gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 360 gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct 420 cgcccgcgcc gtcaccgcgg ccgccacc 448 <210> 17 <211> 518 <212> DNA <213> Artificial Sequence <220> <223> SP0069 <400> 17 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaaattttt aaagactgag gaattaggca 300 cctgtcattt ttgccagctg gtgtagatgt taaaaattac tgtcactctt ccgcctgcta 360 ctttattttg cacctgctgt tacttgagtt acaggcattt cacacatggt aatttaataa 420 ggttagttcc catgacacac cgcctgctgc cacggccggc cgtataaata gaggcgagga 480 gcagctgggc tctcttggca gtcaccgcgg ccgccacc 518 <210> 18 <211> 444 <212> DNA <213> Artificial Sequence <220> <223> SP0070 <400> 18 ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60 tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120 gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180 tgctctgagg agctggaacc atttttaaag actgaggaat taggcacctg tcatttttgc 240 cagctggtgt agatgttaaa aattactgtc actcttccgc ctgctacttt attttgcacc 300 tgctgttact tgagttacag gcatttcaca catggtaatt taataaggtt agttcccatg 360 acacaccgcc tgctgccacg gccggccgta taaatagagg cgaggagcag ctgggctctc 420 ttggcagtca ccgcggccgc cacc 444 <210> 19 <211> 404 <212> DNA <213> Artificial Sequence <220> <223> SP0071 <400> 19 gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60 cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120 ggtggggcgg ggcgggccgc gagccggaga aagagaaagc atttttaaag actgaggaat 180 taggcacctg tcatttttgc cagctggtgt agatgttaaa aattactgtc actcttccgc 240 ctgctacttt attttgcacc tgctgttact tgagttacag gcatttcaca catggtaatt 300 taataaggtt agttcccatg acacaccgcc tgctgccacg gccggccgta taaatagagg 360 cgaggagcag ctgggctctc ttggcagtca ccgcggccgc cacc 404 <210> 20 <211> 433 <212> DNA <213> Artificial Sequence <220> <223> SP0075 <400> 20 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctga tttttaaaga ctgaggaatt aggcacctgt catttttgcc agctggtgta 240 gatgttaaaa attactgtca ctcttccgcc tgctacttta ttttgcacct gctgttactt 300 gagttacagg catttcacac atggtaattt aataaggtta gttcccatga cacaccgcct 360 gctgccacgg ccggccgtat aaatagaggc gaggagcagc tgggctctct tggcagtcac 420 cgcggccgcc acc 433 <210> 21 <211> 438 <212> DNA <213> Artificial Sequence <220> <223> SP0076 <400> 21 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgattttt aaagactgag gaattaggca cctgtcattt ttgccagctg 240 gtgtagatgt taaaaattac tgtcactctt ccgcctgcta ctttattttg cacctgctgt 300 tacttgagtt acaggcattt cacacatggt aatttaataa ggttagttcc catgacacac 360 cgcctgctgc cacggccggc cgtataaata gaggcgagga gcagctgggc tctcttggca 420 gtcaccgcgg ccgccacc 438 <210> 22 <211> 538 <212> DNA <213> Artificial Sequence <220> <223> SP0132 <400> 22 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtataaat acccgctctg 300 gtatttgggg ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgcg 360 ggatcttgca gctgtcaggg gaggggaggc gggggctgat gtcaggaggg atacaaatag 420 tgccgacggc tgggggccct gtctcccctc gccgcatcca ctctccggcc ggccgcctgc 480 ccgccgcctc ctccgtgcgc ccgccagcct cgcccgcgcc gtcaccgcgg ccgccacc 538 <210> 23 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> SP0133 <400> 23 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtattttt aaagactgag 300 gaattaggca cctgtcattt ttgccagctg gtgtagatgt taaaaattac tgtcactctt 360 ccgcctgcta ctttattttg cacctgctgt tacttgagtt acaggcattt cacacatggt 420 aatttaataa ggttagttcc catgacacac cgcctgctgc cacggccggc cgtataaata 480 gaggcgagga gcagctgggc tctcttggca gtcaccgcgg ccgccacc 528 <210> 24 <211> 655 <212> DNA <213> Artificial Sequence <220> <223> SP0134 <400> 24 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cctcggccgg ggccgcattc ctgggggccg 540 ggcggtgctc ccgcccgcct cgataaaagg ctccggggcc ggcggcggcc cacgagctac 600 ccggaggagc gggaggcgcc aagctctaga actagtggat cccgcggccg ccacc 655 <210> 25 <211> 588 <212> DNA <213> Artificial Sequence <220> <223> SP0136 <400> 25 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtgtttct tagcagctgc 300 tgctgtgtcc aaggcttgga attgctgtgg tgaatctaaa actgtctcag tagtggtgag 360 ctgacctcac ccaagttcaa agccctactc tgcctgatcc ttttttcctg agcctcagag 420 ctaaaatgcc cccgagctct ttcctattgg ctggaaagac gaattgaagt tcccttgccc 480 atgttaggag gtgtacgcct cctgaactaa agatagaaac agctggccct tccaggcagc 540 taaaagcctc cagactaaga ggtgttcccc attcgggcgg ccgccacc 588 <210> 26 <211> 660 <212> DNA <213> Artificial Sequence <220> <223> SP0146 <400> 26 ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60 tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120 aaccctgcat gccatgttcc cggcgaaggg ccagctgtcc cccgccagct agactcagca 180 cttagtttag gaaccagtga gcaagtcagc ccttggggca gcccatacaa ggccatgggg 240 ctgggcaagc tgcacgcctg ggtccggggt gggcacggtg cccgggcaac gagctgaaag 300 ctcatctgct ctcaggggcc cctccctggg gacagcccct cctggctagt cacaccctgt 360 aggctcctct atataaccca ggggcacagg ggctgccctc attctaccac cacctccaca 420 gcacagacag acactcagga gccagccagc caggtaggga ctgtactagc agctacaatc 480 cagctaccat tctgctttta ttttatggtt gggataaggc tggattattc tgagtccaag 540 ctaggccctt ttgctaatca tgttcatacc tcttatcttc ctcccacagc tcctgggcaa 600 cgtgctggtc tgtgtgctgg cccatcactt tggcaaagaa ttgcgatcgc ctctagaacc 660 660 <210> 27 <211> 806 <212> DNA <213> Artificial Sequence <220> <223> SP0147 <400> 27 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcatgtt cccggcgaag 300 ggccagctgt cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca 360 gcccttgggg cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg 420 gtgggcacgg tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg 480 gggacagccc ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca 540 ggggctgccc tcattctacc accacctcca cagcacagac agacactcag gagccagcca 600 gccaggtagg gactgtacta gcagctacaa tccagctacc attctgcttt tattttatgg 660 ttgggataag gctggattat tctgagtcca agctaggccc ttttgctaat catgttcata 720 cctcttatct tcctcccaca gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac 780 tttggcaaag aattgcgatc gccacc 806 <210> 28 <211> 938 <212> DNA <213> Artificial Sequence <220> <223> SP0148 <400> 28 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaattc tcatgtttga 300 cagcttatca tcgcagatcc gtatggtgca ctctcagtac aatctgctct gatgccgcat 360 agttaagcca gtatctgctc cctgcttgtg tgttggaggt cgctgagtag tgcgcgagca 420 aaatttaagc tacaacaagg caaggcttga ccgacaattg catgaagaat ctgcttaggg 480 ttaggcgttt tgcgctgctt cgcgatgtac gggccagata tacgcgtatc tgaggggact 540 agggtgtgtt taggcgaaaa gcggggcttc ggttgtacgc ggttaggagt cccctcagga 600 tatagtagtt tcgcttttgc atagggaggg ggaaatgtag tcttatgcaa tactcttgta 660 gtcttgcaac atggtaacga tgagttagca acatgcctta caaggagaga aaaagcaccg 720 tgcatgccga ttggtggaag taaggtggta cgatcgtgcc ttattaggaa ggcaacagac 780 gggtctgaca tggattggac gaaccactga attccgcatt gcagagatat tgtatttaag 840 tgcctagctc gatacaataa acgccatttg accattcacc acattggtgt gcacctccaa 900 gctgggtacc gcgggcccgg gatccaccgg tcgccacc 938 <210> 29 <211> 814 <212> DNA <213> Artificial Sequence <220> <223> SP0150 <400> 29 gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60 cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120 ggtggggcgg ggcgggccgc gagccggaga aagagaaagc caattctcat gtttgacagc 180 ttatcatcgc agatccgtat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt 240 aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg cgagcaaaat 300 ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc ttagggttag 360 gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgtatctgag gggactaggg 420 tgtgtttagg cgaaaagcgg ggcttcggtt gtacgcggtt aggagtcccc tcaggatata 480 gtagtttcgc ttttgcatag ggagggggaa atgtagtctt atgcaatact cttgtagtct 540 tgcaacatgg taacgatgag ttagcaacat gccttacaag gagagaaaaa gcaccgtgca 600 tgccgattgg tggaagtaag gtggtacgat cgtgccttat taggaaggca acagacgggt 660 ctgacatgga ttggacgaac cactgaattc cgcattgcag agatattgta tttaagtgcc 720 tagctcgata caataaacgc catttgacca ttcaccacat tggtgtgcac ctccaagctg 780 ggtaccgcgg gcccgggatc caccggtcgc cacc 814 <210> 30 <211> 418 <212> DNA <213> Artificial Sequence <220> <223> SP0153 <400> 30 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcccggc agacgctcct tatacggccc ggcctcgctc acctgggccg 240 cggccaggag cgccttcttt gggcagcgcc gggccggggc cgcgccgggc ccgacaccca 300 aatatggcga cggccggggc cgcattcctg ggggccgggc ggcgctcccg cccgcctcga 360 taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg aggccacc 418 <210> 31 <211> 508 <212> DNA <213> Artificial Sequence <220> <223> SP0155 <400> 31 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240 tgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg cccggcagac 300 gctccttata cggcccggcc tcgctcacct gggccgcggc caggagcgcc ttctttgggc 360 agcgccgggc cggggccgcg ccgggcccga cacccaaata tggcgacggc cggggccgca 420 ttcctggggg ccgggcggcg ctcccgcccg cctcgataaa aggctccggg gccggcggcg 480 gcccacgagc tacccggagg agcgggag 508 <210> 32 <211> 718 <212> DNA <213> Artificial Sequence <220> <223> SP0156 <400> 32 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctggggccc cacagcagct gggggcattt atgggccttc ctataaactt 240 ctgagagggt aactttatcc tgcttctttc agccaagtat cctcctccag cagctggtca 300 caaagctggt taatctccca gagtgctcag cttaaaaccc gtgactcaca gcacagccag 360 tgtgggggag ggggtggctg cctccaatac gtggcgccca gagtcagctg ttctggggcc 420 ttctctggtt tctccaactg agtcctgagg tttggggcct tgtcttcctt cctggagttt 480 ctcctctata aatacccgct ctggtatttg gggttggcag ctgttgctgc cagggagatg 540 gttgggttga cgggatcttg cagctgtcag gggaggggag gcgggggctg atgtcaggag 600 ggatacaaat agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc cactctccgg 660 ccggccgcct gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg ccgtcacc 718 <210> 33 <211> 202 <212> DNA <213> Artificial Sequence <220> <223> SP0157 <400> 33 ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60 tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120 aaccctgcat gcccaccgcc tgctgccacg gccggccgta taaatagagg cgaggagcag 180 ctgggctctc ttggcagtca cc 202 <210> 34 <211> 705 <212> DNA <213> Artificial Sequence <220> <223> SP0158 <400> 34 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctgaga ttttcctagc 300 attttgtgtt tcatgactaa atatggtttg tgtttcaaga ccaatgagct gggaactgta 360 ctgttctttc ccctcccatc aactcatttt tggcacaaga cgcactctag tcagttggag 420 caaatcccct gacccgggtg cagttccaaa agcagacact cgagcgtgtt ttacctaatt 480 aggaaatgct ttgctccaaa ccgaactgct cattcaggtt agagaggaga ggtccctata 540 tggttgtgtt agagtgaacg gccagcttca gcccgtcttt gctccttgtt tgggaagcga 600 gtgggagggg atcagagcaa ggggctatat aacccttcag cgttcagcct cccgggacac 660 cacccaccca gagtggagaa gcccagccag tcgctgtcag ccacc 705 <210> 35 <211> 615 <212> DNA <213> Artificial Sequence <220> <223> SP0159 <400> 35 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgctgaga ttttcctagc attttgtgtt tcatgactaa atatggtttg 240 tgtttcaaga ccaatgagct gggaactgta ctgttctttc ccctcccatc aactcatttt 300 tggcacaaga cgcactctag tcagttggag caaatcccct gacccgggtg cagttccaaa 360 agcagacact cgagcgtgtt ttacctaatt aggaaatgct ttgctccaaa ccgaactgct 420 cattcaggtt agagaggaga ggtccctata tggttgtgtt agagtgaacg gccagcttca 480 gcccgtcttt gctccttgtt tgggaagcga gtgggagggg atcagagcaa ggggctatat 540 aacccttcag cgttcagcct cccgggacac cacccaccca gagtggagaa gcccagccag 600 tcgctgtcag ccacc 615 <210> 36 <211> 586 <212> DNA <213> Artificial Sequence <220> <223> SP0160 <400> 36 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtaagtc cgggcagggt cctgtccata aaaggctttt cccgggccgg 240 ctccccgccg gcagcgtgcc ccgccccggc ccgctccatc tccaaagcat gcagagaatg 300 tctcggcagc cccggtagac tgctccaact tggtgtcttt ccccaaatat ggagcctgtg 360 tggagtcact gggggagccg ggggtgggga gcggagccgg cttcctctag aggtccctat 420 atggttgtgt tagagtgaac ggccagcttc agcccgtctt tgctccttgt ttgggaagcg 480 agtgggaggg gatcagagca aggggctata taacccttca gcgttcagcc tcccgggaca 540 ccacccaccc agagtggaga agcccagcca gtcgctgtca gccacc 586 <210> 37 <211> 740 <212> DNA <213> Artificial Sequence <220> <223> SP0161 <400> 37 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctgaga ttttcctagc 300 attttgtgtt tcatgactaa atatggtttg tgtttcaaga ccaatgagct gggaactgta 360 ctgttctttc ccctcccatc aactcatttt tggcacaaga cgcactctag tcagttggag 420 caaatcccct gacccgggtg cagttccaaa agcagacact cgagcgtgtt ttacctaatt 480 aggaaatgct ttgctccaaa ccgaactgct cattcaggtt agagaggagc tgagtccttt 540 tgcatacatt tttcaaatga taactcactc tacccacccc ccttccctac ccccaaggcg 600 atttattgaa aaaaccacct tatatggtaa tattgctaac acaccgtcag ctggcctttt 660 tagggacttt gtttaaagaa gatccgcctc tggggtttta tattgctctg gtattcatgc 720 caaagacaca ccaggccacc 740 <210> 38 <211> 650 <212> DNA <213> Artificial Sequence <220> <223> SP0162 <400> 38 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgctgaga ttttcctagc attttgtgtt tcatgactaa atatggtttg 240 tgtttcaaga ccaatgagct gggaactgta ctgttctttc ccctcccatc aactcatttt 300 tggcacaaga cgcactctag tcagttggag caaatcccct gacccgggtg cagttccaaa 360 agcagacact cgagcgtgtt ttacctaatt aggaaatgct ttgctccaaa ccgaactgct 420 cattcaggtt agagaggagc tgagtccttt tgcatacatt tttcaaatga taactcactc 480 tacccacccc ccttccctac ccccaaggcg atttattgaa aaaaccacct tatatggtaa 540 tattgctaac acaccgtcag ctggcctttt tagggacttt gtttaaagaa gatccgcctc 600 tggggtttta tattgctctg gtattcatgc caaagacaca ccaggccacc 650 <210> 39 <211> 621 <212> DNA <213> Artificial Sequence <220> <223> SP0163 <400> 39 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtaagtc cgggcagggt cctgtccata aaaggctttt cccgggccgg 240 ctccccgccg gcagcgtgcc ccgccccggc ccgctccatc tccaaagcat gcagagaatg 300 tctcggcagc cccggtagac tgctccaact tggtgtcttt ccccaaatat ggagcctgtg 360 tggagtcact gggggagccg ggggtgggga gcggagccgg cttcctctag ctgagtcctt 420 ttgcatacat ttttcaaatg ataactcact ctacccaccc cccttcccta cccccaaggc 480 gatttattga aaaaaccacc ttatatggta atattgctaa cacaccgtca gctggccttt 540 ttagggactt tgtttaaaga agatccgcct ctggggtttt atattgctct ggtattcatg 600 ccaaagacac accaggccac c 621 <210> 40 <211> 764 <212> DNA <213> Artificial Sequence <220> <223> SP0164 <400> 40 cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60 cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120 ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180 tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggggccccac 240 agcagctggg ggcatttatg ggccttccta taaacttctg agagggtaac tttatcctgc 300 ttctttcagc caagtatcct cctccagcag ctggtcacaa agctggttaa tctcccagag 360 tgctcagctt aaaacccgtg actcacagca cagccagtgt gggggagggg gtggctgcct 420 ccaatacgtg gcgcccagag tcagctgttc tggggccttc tctggtttct ccaactgagt 480 cctgaggttt ggggccttgt cttccttcct ggagtgactc aggggcgcag gcctcttgcg 540 ggggagctgg cctccccgcc cccacggcca cgggccgccc tttcctggca ggacagcggg 600 atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 660 ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 720 gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 764 <210> 41 <211> 480 <212> DNA <213> Artificial Sequence <220> <223> SP0165 <400> 41 cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60 cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120 ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180 tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggactcaggg 240 gcgcaggcct cttgcggggg agctggcctc cccgccccca cggccacggg ccgccctttc 300 ctggcaggac agcgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg 360 agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc 420 ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg cgccgtcacc 480 480 <210> 42 <211> 894 <212> DNA <213> Artificial Sequence <220> <223> SP0166 <400> 42 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 caattctcat gtttgacagc ttatcatcgc agatccgtat ggtgcactct cagtacaatc 300 tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct 360 gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg 420 aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg 480 cgtatctgag gggactaggg tgtgtttagg cgaaaagcgg ggcttcggtt gtacgcggtt 540 aggagtcccc tcaggatata gtagtttcgc ttttgcatag ggagggggaa atgtagtctt 600 atgcaatact cttgtagtct tgcaacatgg taacgatgag ttagcaacat gccttacaag 660 gagagaaaaa gcaccgtgca tgccgattgg tggaagtaag gtggtacgat cgtgccttat 720 taggaaggca acagacgggt ctgacatgga ttggacgaac cactgaattc cgcattgcag 780 agatattgta tttaagtgcc tagctcgata caataaacgc catttgacca ttcaccacat 840 tggtgtgcac ctccaagctg ggtaccgcgg gcccgggatc caccggtcgc cacc 894 <210> 43 <211> 248 <212> DNA <213> Artificial Sequence <220> <223> SP0169 <400> 43 ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 60 gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 120 ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 180 ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 240 ccgccacc 248 <210> 44 <211> 482 <212> DNA <213> Artificial Sequence <220> <223> SP0170 <400> 44 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 300 gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 360 ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 420 ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 480 cc 482 <210> 45 <211> 534 <212> DNA <213> Artificial Sequence <220> <223> SP0171 <400> 45 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc ggataaatac 300 ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg gggttggcag 360 ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat 420 acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg 480 ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 534 <210> 46 <211> 728 <212> DNA <213> Artificial Sequence <220> <223> SP0173 <400> 46 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctgataa atacccgctc tggtatttgg ggttctcctc tataaatacc cgctctggta 540 tttggggttg gcagctgttg cgggatcttg cagctgtcag gggaggggag gcgggggctg 600 atgtcaggag ggatacaaat agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc 660 cactctccgg ccggccgcct gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg 720 ccgtcacc 728 <210> 47 <211> 608 <212> DNA <213> Artificial Sequence <220> <223> SP0227 <400> 47 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcatgtt cccggcgaag 300 ggccagctgt cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca 360 gcccttgggg cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg 420 gtgggcacgg tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg 480 gggacagccc ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca 540 ggggctgccc tcattctacc accacctcca cagcacagac agacactcag gagccagcca 600 gcgccacc 608 <210> 48 <211> 885 <212> DNA <213> Artificial Sequence <220> <223> SP0228 <400> 48 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300 gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360 ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420 cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480 cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540 ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600 tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660 agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720 cgccatattt gggtgtccgc cctcggccgg ggccgcattc ctgggggccg ggcggtgctc 780 ccgcccgcct cgataaaagg ctccggggcc ggcggcggcc cacgagctac ccggaggagc 840 gggaggcgcc aagctctaga actagtggat cccgcggccg ccacc 885 <210> 49 <211> 1003 <212> DNA <213> Artificial Sequence <220> <223> SP0229 <400> 49 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300 gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360 ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420 cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480 cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540 ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600 tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660 agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720 cgccatattt gggtgtccgc cctcggccga taaatacccg ctctggtatt tggggttctc 780 ctctataaat acccgctctg gtatttgggg ttggcagctg ttgcgggatc ttgcagctgt 840 caggggaggg gaggcggggg ctgatgtcag gagggataca aatagtgccg acggctgggg 900 gccctgtctc ccctcgccgc atccactctc cggccggccg cctgcccgcc gcctcctccg 960 tgcgcccgcc agcctcgccc gcgccgtcac cgcggccgcc acc 1003 <210> 50 <211> 953 <212> DNA <213> Artificial Sequence <220> <223> SP0230 <400> 50 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtatcaag cttggtacgg 300 gccccacagc agctgggggc atttatgggc cttcctataa acttctgaga gggtaacttt 360 atcctgcttc tttcagccaa gtatcctcct ccagcagctg gtcacaaagc tggttaatct 420 cccagagtgc tcagcttaaa acccgtgact cacagcacag ccagtgtggg ggagggggtg 480 gctgcctcca atacgtggcg cccagagtca gctgttctgg ggccttctct ggtttctcca 540 actgagtcct gaggtttggg gccttgtctt ccttcctgga gtcaccgcgg tggcggccgt 600 ccgccctcgg caccatcctc acgacaccca aatatggcga cgggtgagga atggtgggga 660 gttattttta gagcggtgag gaaggtgggc aggcagcagg tgttggcgct ctaaaaataa 720 ctcccgggag ttatttttag agcggaggaa tggtggacac ccaaatatgg cgacggttcc 780 tcacccgtcg ccatatttgg gtgtccgccc tcggccgggg ccgcattcct gggggccggg 840 cggtgctccc gcccgcctcg ataaaaggct ccggggccgg cggcggccca cgagctaccc 900 ggaggagcgg gaggcgccaa gctctagaac tagtggatcc cgcggccgcc acc 953 <210> 51 <211> 773 <212> DNA <213> Artificial Sequence <220> <223> SP0231 <400> 51 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cctcggccga taaatacccg ctctggtatt 540 tggggttctc ctctataaat acccgctctg gtatttgggg ttggcagctg ttgcgggatc 600 ttgcagctgt caggggaggg gaggcggggg ctgatgtcag gagggataca aatagtgccg 660 acggctgggg gccctgtctc ccctcgccgc atccactctc cggccggccg cctgcccgcc 720 gcctcctccg tgcgcccgcc agcctcgccc gcgccgtcac cgcggccgcc acc 773 <210> 52 <211> 683 <212> DNA <213> Artificial Sequence <220> <223> SP0232 <400> 52 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240 caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300 gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360 aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420 cctcggccga taaatacccg ctctggtatt tggggttctc ctctataaat acccgctctg 480 gtatttgggg ttggcagctg ttgcgggatc ttgcagctgt caggggaggg gaggcggggg 540 ctgatgtcag gagggataca aatagtgccg acggctgggg gccctgtctc ccctcgccgc 600 atccactctc cggccggccg cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc 660 gcgccgtcac cgcggccgcc acc 683 <210> 53 <211> 710 <212> DNA <213> Artificial Sequence <220> <223> SP0257 <400> 53 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctgcccg gcagacgctc cttatacggc ccggcctcgc tcacctgggc cgcggccagg 540 agcgccttct ttgggcagcg ccgggccggg gccgcgccgg gcccgacacc caaatatggc 600 gacggccggg gccgcattcc tgggggccgg gcggcgctcc cgcccgcctc gataaaaggc 660 tccggggccg gcggcggccc acgagctacc cggaggagcg ggaggccacc 710 <210> 54 <211> 943 <212> DNA <213> Artificial Sequence <220> <223> SP0262 <400> 54 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctgccag ctgcctgccc cctgcctggc acagcccgta cctggccgca cgctccctca 540 caggtgaagc tcgaaaactc cgtccccgta aggagccccg ctgccccccg aggcctcctc 600 cctcacgcct cgctgcgctc ccggctcccg cacggccctg ggagaggccc ccaccgcttc 660 gtccttaacg ggcccggcgg tgccggggga ttatttcggc cccggccccg ggggggcccg 720 gcagacgctc cttatacggc ccggcctcgc tcacctgggc cgcggccagg agcgccttct 780 ttgggcagcg ccgggccggg gccgcgccgg gcccgacacc caaatatggc gacggccggg 840 gccgcattcc tgggggccgg gcggcgctcc cgcccgcctc gataaaaggc tccggggccg 900 gcggcggccc acgagctacc cggaggagcg ggaggcggcc acc 943 <210> 55 <211> 724 <212> DNA <213> Artificial Sequence <220> <223> SP0264 <400> 55 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctggccgcg aagaccggaa gctggggcgg ccccgggccg cgcgcgctgg 240 gcctgggagg cgaaactcag cttccttcgt ttccgacttt tccatccgcg tcctccactt 300 ccccgttccg ccctccccca ttgccaacat tctggctgag tcacggcgcc ccagagcgcg 360 ccaggctggg ggaaaggagc agaagggagg gccctagcga cccgcgggat gtggtccgag 420 tcacgtccga ggggggtggg gagggatcgt gttctcggcg cccgcccctt cctagcgcgg 480 cctctgggct gcgcctctcg ggggcggccc gtagcccagt ccgtcgcctg ccattggacg 540 ccgcccgctc ctcgtaaagg aaaaagctcg gcggagggcg gagtggtgcc tttaaaaggc 600 cgggcgccgc cttccgcctg cccgcctcct gcgccgcccc ttccgaggct aaatcggctg 660 cgttcctctc ggaacgcgcc gcagaagggg tcctggtgac gagtcccgcg ttctctccgc 720 cacc 724 <210> 56 <211> 822 <212> DNA <213> Artificial Sequence <220> <223> SP0265 <400> 56 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccgcgaa 300 gaccggaagc tggggcggcc ccgggccgcg cgcgctgggc ctgggaggcg aaactcagct 360 tccttcgttt ccgacttttc catccgcgtc ctccacttcc ccgttccgcc ctcccccatt 420 gccaacattc tggctgagtc acggcgcccc agagcgcgcc aggctggggg aaaggagcag 480 aagggagggc cctagcgacc cgcgggatgt ggtccgagtc acgtccgagg ggggtgggga 540 gggatcgtgt tctcggcgcc cgccccttcc tagcgcggcc tctgggctgc gcctctcggg 600 ggcggcccgt agcccagtcc gtcgcctgcc attggacgcc gcccgctcct cgtaaaggaa 660 aaagctcggc ggagggcgga gtggtgcctt taaaaggccg ggcgccgcct tccgcctgcc 720 cgcctcctgc gccgcccctt ccgaggctaa atcggctgcg ttcctctcgg aacgcgccgc 780 agaaggggtc ctggtgacga gtcccgcgtt ctctccgcca cc 822 <210> 57 <211> 1016 <212> DNA <213> Artificial Sequence <220> <223> SP0266 <400> 57 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctggccg cgaagaccgg aagctggggc ggccccgggc cgcgcgcgct gggcctggga 540 ggcgaaactc agcttccttc gtttccgact tttccatccg cgtcctccac ttccccgttc 600 cgccctcccc cattgccaac attctggctg agtcacggcg ccccagagcg cgccaggctg 660 ggggaaagga gcagaaggga gggccctagc gacccgcggg atgtggtccg agtcacgtcc 720 gaggggggtg gggagggatc gtgttctcgg cgcccgcccc ttcctagcgc ggcctctggg 780 ctgcgcctct cgggggcggc ccgtagccca gtccgtcgcc tgccattgga cgccgcccgc 840 tcctcgtaaa ggaaaaagct cggcggaggg cggagtggtg cctttaaaag gccgggcgcc 900 gccttccgcc tgcccgcctc ctgcgccgcc ccttccgagg ctaaatcggc tgcgttcctc 960 tcggaacgcg ccgcagaagg ggtcctggtg acgagtcccg cgttctctcc gccacc 1016 <210> 58 <211> 560 <212> DNA <213> Artificial Sequence <220> <223> SP0267 <400> 58 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgc accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat 240 atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg 300 cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg 360 tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccctcg 420 gccggggccg cattcctggg ggccgggcgg tgctcccgcc cgcctcgata aaaggctccg 480 gggccggcgg cggcccacga gctacccgga ggagcgggag gcgccaagct ctagaactag 540 tggatcccgc ggccgccacc 560 <210> 59 <211> 728 <212> DNA <213> Artificial Sequence <220> <223> SP0268 <400> 59 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctggtttct tagcagctgc tgctgtgtcc aaggcttgga attgctgtgg 240 tgaatctaaa actgtctcag tagtggtgag ctgacctcac ccaagttcaa agccctactc 300 tgcctgatcc ttttttcctg agcctcagag ctaaaatgcc cccgagctct ttcctattgg 360 ctggaaagac gaattgaagt tcccttgccc atgttaggag gtgtacgcct cctgaactaa 420 agatagaaac agctggccct tccaggcagc taaaagcctc cagactaaga ggtgttcccc 480 attcggataa atacccgctc tggtatttgg ggttctcctc tataaatacc cgctctggta 540 tttggggttg gcagctgttg cgggatcttg cagctgtcag gggaggggag gcgggggctg 600 atgtcaggag ggatacaaat agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc 660 cactctccgg ccggccgcct gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg 720 ccgtcacc 728 <210> 60 <211> 562 <212> DNA <213> Artificial Sequence <220> <223> SP0270 <400> 60 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240 aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300 gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360 aaagcctcca gactaagagg tgttccccat tcggcgggat cttgcagctg tcaggggagg 420 ggaggcgggg gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct 480 cccctcgccg catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc 540 cagcctcgcc cgcgccgtca cc 562 <210> 61 <211> 451 <212> DNA <213> Artificial Sequence <220> <223> SP0271 <400> 61 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240 aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300 gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360 aaagcctcca gactaagagg tgttccccat tcggcagcca gactccttga aatacccttt 420 cagtaatcat tcaaccaacg cttccgccac c 451 <210> 62 <211> 883 <212> DNA <213> Artificial Sequence <220> <223> SP0279 <400> 62 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cctcggccgg ggccgcattc ctgggggccg 540 ggcggtgctc ccgcccgcct cgataaaagg ctccggggcc ggcggcggcc cactcagatc 600 gcctggagac gccatccacg ctgttttgac ctccatagaa gacaccggga ccgatccagc 660 ctccgcggcc gggaacggtg cattggaacg cggattcccc gtgccaagag tgacgtaagt 720 accgcctata gactctatag gcacacccct ttggctctta tgcatgaacg gtggagggca 780 gtgtagtctg agcagtactc gttgctgccg cgcgcgccac cagacataat agctgacaga 840 ctaacagact gttcctttcc atgggtcttt tctgcaggcc acc 883 <210> 63 <211> 616 <212> DNA <213> Artificial Sequence <220> <223> SP0286 <400> 63 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccact cagatcgcct ggagacgcca tccacgctgt tttgacctcc atagaagaca 360 ccgggaccga tccagcctcc gcggccggga acggtgcatt ggaacgcgga ttccccgtgc 420 caagagtgac gtaagtaccg cctatagact ctataggcac acccctttgg ctcttatgca 480 tgaacggtgg agggcagtgt agtctgagca gtactcgttg ctgccgcgcg cgccaccaga 540 cataatagct gacagactaa cagactgttc ctttccatgg gtcttttctg cagtcaccgt 600 ccttgacacg gccacc 616 <210> 64 <211> 562 <212> DNA <213> Artificial Sequence <220> <223> SP0305 <400> 64 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctgccac cgcctgctgc cacggccggc cgtataaata gaggcgagga gcagctgggc 540 tctcttggca gtcaccgcca cc 562 <210> 65 <211> 500 <212> DNA <213> Artificial Sequence <220> <223> SP0306 <400> 65 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc gccactacgg 240 gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc tggttataat 300 taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc tcacccccac 360 cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc taaaaataac 420 cctgccaccg cctgctgcca cggccggccg tataaataga ggcgaggagc agctgggctc 480 tcttggcagt caccgccacc 500 <210> 66 <211> 554 <212> DNA <213> Artificial Sequence <220> <223> SP0307 <400> 66 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtgccact acgggtctag 300 gctgcccatg taaggaggca aggcctgggg acacccgaga tgcctggtta taattaaccc 360 agacatgtgg ctgccccccc cccccaacac ctgctgcctg agcctcaccc ccaccccggt 420 gcctgggtct taggctctgt acaccatgga ggagaagctc gctctaaaaa taaccctgcc 480 accgcctgct gccacggccg gccgtataaa tagaggcgag gagcagctgg gctctcttgg 540 cagtcaccgc cacc 554 <210> 67 <211> 636 <212> DNA <213> Artificial Sequence <220> <223> SP0309 <400> 67 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctggccact acgggtctag gctgcccatg taaggaggca aggcctgggg 240 acacccgaga tgcctggtta taattaaccc agacatgtgg ctgccccccc cccccaacac 300 ctgctgcctg agcctcaccc ccaccccggt gcctgggtct taggctctgt acaccatgga 360 ggagaagctc gctctaaaaa taaccctgat aaatacccgc tctggtattt ggggttctcc 420 tctataaata cccgctctgg tatttggggt tggcagctgt tgcgggatct tgcagctgtc 480 aggggagggg aggcgggggc tgatgtcagg agggatacaa atagtgccga cggctggggg 540 ccctgtctcc cctcgccgca tccactctcc ggccggccgc ctgcccgccg cctcctccgt 600 gcgcccgcca gcctcgcccg cgccgtcacc gccacc 636 <210> 68 <211> 442 <212> DNA <213> Artificial Sequence <220> <223> SP0310 <400> 68 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgataaat acccgctctg gtatttgggg ttctcctcta taaatacccg 240 ctctggtatt tggggttggc agctgttgcg ggatcttgca gctgtcaggg gaggggaggc 300 gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 360 gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct 420 cgcccgcgcc gtcaccgcca cc 442 <210> 69 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> SP0311 <400> 69 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240 tgccaccgcc tgctgccacg gccggccgta taaatagagg cgaggagcag ctgggctctc 300 ttggcagtca ccgccacc 318 <210> 70 <211> 501 <212> DNA <213> Artificial Sequence <220> <223> SP0312 <400> 70 cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60 cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120 ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180 tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggccactacg 240 ggtctaggct gcccatgtaa ggaggcaagg cctggggaca cccgagatgc ctggttataa 300 ttaacccaga catgtggctg cccccccccc ccaacacctg ctgcctgagc ctcaccccca 360 ccccggtgcc tgggtcttag gctctgtaca ccatggagga gaagctcgct ctaaaaataa 420 ccctgccacc gcctgctgcc acggccggcc gtataaatag aggcgaggag cagctgggct 480 ctcttggcag tcaccgccac c 501 <210> 71 <211> 395 <212> DNA <213> Artificial Sequence <220> <223> SP0313 <400> 71 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcccctg ccccccacag ctcctctcct gtgccttgtt tcccagccat 240 gcgttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt gctgccaggg 300 agatggttgg gttgacatgc caccgcctgc tgccacggcc ggccgtataa atagaggcga 360 ggagcagctg ggctctcttg gcagtcaccg ccacc 395 <210> 72 <211> 334 <212> DNA <213> Artificial Sequence <220> <223> SP0314 <400> 72 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgctctat aaatacccgc tctggtattt ggggttctct ataaataccc 240 gctctggtat ttggggttcc accgcctgct gccacggccg gccgtataaa tagaggcgag 300 gagcagctgg gctctcttgg cagtcaccgc cacc 334 <210> 73 <211> 204 <212> DNA <213> Artificial Sequence <220> <223> SP0315 <400> 73 ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60 tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120 aaccctgccc accgcctgct gccacggccg gccgtataaa tagaggcgag gagcagctgg 180 gctctcttgg cagtcaccgc cacc 204 <210> 74 <211> 376 <212> DNA <213> Artificial Sequence <220> <223> SP0316 <400> 74 ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60 tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120 aaccctgcat aaatacccgc tctggtattt ggggttctcc tctataaata cccgctctgg 180 tatttggggt tggcagctgt tgcgggatct tgcagctgtc aggggagggg aggcgggggc 240 tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca 300 tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg 360 cgccgtcacc gccacc 376 <210> 75 <211> 944 <212> DNA <213> Artificial Sequence <220> <223> SP0320 <400> 75 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctgataa atacccgctc tggtatttgg ggttctcctc tataaatacc cgctctggta 540 tttggggttg gcagctgttg cgggatcttg cagctgtcag gggaggggag gcgggggctg 600 atgtcaggag ggatacaaat agtgccgacg gctgggggcc ctgtctcccc tcgctcagat 660 cgcctggaga cgccatccac gctgttttga cctccataga agacaccggg accgatccag 720 cctccgcggc cgggaacggt gcattggaac gcggattccc cgtgccaaga gtgacgtaag 780 taccgcctat agactctata ggcacacccc tttggctctt atgcatgaac ggtggagggc 840 agtgtagtct gagcagtact cgttgctgcc gcgcgcgcca ccagacataa tagctgacag 900 actaacagac tgttcctttc catgggtctt ttctgcaggc cacc 944 <210> 76 <211> 661 <212> DNA <213> Artificial Sequence <220> <223> SP0322 <400> 76 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180 gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240 ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300 aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360 gttcctcacc cgtcgccata tttgggtgtc cgccctcggc cggggccata aatacccgct 420 ctggtatttg gggttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt 480 gcgggatctt gcagctgtca ggggagggga ggcgggggct gatgtcagga gggatacaaa 540 tagtgccgac ggctgggggc cctgtctccc ctcgccgcat ccactctccg gccggccgcc 600 tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc gccgtcaccg cggccgccac 660 c 661 <210> 77 <211> 613 <212> DNA <213> Artificial Sequence <220> <223> SP0323 <400> 77 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagcccaca ttcctttcca gaggccagct ctccatttat agcccctggg cagagcagcc 120 accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat atggcgacgg 180 gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt 240 tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca 300 aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccctcg gccggggcca 360 taaatacccg ctctggtatt tggggttctc ctctataaat acccgctctg gtatttgggg 420 ttggcagctg ttgcgggatc ttgcagctgt caggggaggg gaggcggggg ctgatgtcag 480 gagggataca aatagtgccg acggctgggg gccctgtctc ccctcgccgc atccactctc 540 cggccggccg cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc gcgccgtcac 600 cgcggccgcc acc 613 <210> 78 <211> 407 <212> DNA <213> Artificial Sequence <220> <223> SP0324 <400> 78 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagcttc tcctctataa 180 atacccgctc tggtatttgg ggttggcagc tgttgctgcc agggagatgg ttgggttgac 240 gggatcttgc agctgtcagg ggaggggagg cgggggctga tgtcaggagg gatacaaata 300 gtgccgacgg ctgggggccc tgtctcccct cgccgcatcc actctccggc cggccgcctg 360 cccgccgcct cctccgtgcg cccgccagcc tcgcccgcgc cgtcacc 407 <210> 79 <211> 409 <212> DNA <213> Artificial Sequence <220> <223> SP0325 <400> 79 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagcata aatacccgct 180 ctggtatttg gggttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt 240 gcgggatctt gcagctgtca ggggagggga ggcgggggct gatgtcagga gggatacaaa 300 tagtgccgac ggctgggggc cctgtctccc ctcgccgcat ccactctccg gccggccgcc 360 tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc gccgtcacc 409 <210> 80 <211> 483 <212> DNA <213> Artificial Sequence <220> <223> SP0326 <400> 80 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgcccta taaatacccg 240 ctctggtatt tggggttctc ctctataaat acccgctctg gtatttgggg ttggcagctg 300 ttgcgggatc ttgcagctgt caggggaggg gaggcggggg ctgatgtcag gagggataca 360 aatagtgccg acggctgggg gccctgtctc ccctcgccgc atccactctc cggccggccg 420 cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc gcgccgtcac cgcggccgcc 480 acc 483 <210> 81 <211> 538 <212> DNA <213> Artificial Sequence <220> <223> SP0327 <400> 81 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180 gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240 ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300 aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360 gttcctcacc cgtcgccata tttgggtgtc cgccctcggc cggggccgca ttcctggggg 420 ccgggcggtg ctcccgcccg cctcgataaa aggctccggg gccggcggcg gcccacgagc 480 tacccggagg agcgggaggc gccaagctct agaactagtg gatcccgcgg ccgccacc 538 <210> 82 <211> 822 <212> DNA <213> Artificial Sequence <220> <223> SP0328 <400> 82 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtagactg gggcaggtgc 300 aggctggatt gggtttccag aggctatata tataaaggct gccgggagcc ccagggccgc 360 tccctgaggg cacaacactg tgggggccca gccaggccca cattcctttc cagaggccag 420 ctctccattt atagcccctg ggcagagcag ccaccgcggt ggcggccgtc cgccctcggc 480 accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 540 agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 600 tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 660 catatttggg tgtccgccct cggccggggc cgcattcctg ggggccgggc ggtgctcccg 720 cccgcctcga taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg 780 aggcgccaag ctctagaact agtggatccc gcggccgcca cc 822 <210> 83 <211> 324 <212> DNA <213> Artificial Sequence <220> <223> SP0329 <400> 83 acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60 ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120 ggaggaatgg tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg 180 tccgccctcg gccggggccg cattcctggg ggccgggcgg tgctcccgcc cgcctcgata 240 aaaggctccg gggccggcgg cggcccacga gctacccgga ggagcgggag gcgccaagct 300 ctagaactag tggatcccgc cacc 324 <210> 84 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> SP0330 <400> 84 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360 ccacc 365 <210> 85 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> SP0331 <400> 85 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgaggtaaac gagctattag 180 ttatgaggtc cgtagattga acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360 ccacc 365 <210> 86 <211> 565 <212> DNA <213> Artificial Sequence <220> <223> SP0332 <400> 86 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240 caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300 gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360 aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420 cctcggccgg ggccgcattc ctgggggccg ggcggtgctc ccgcccgcct cgataaaagg 480 ctccggggcc ggcggcggcc cacgagctac ccggaggagc gggaggcgcc aagctctaga 540 actagtggat cccgcggccg ccacc 565 <210> 87 <211> 543 <212> DNA <213> Artificial Sequence <220> <223> SP0333 <400> 87 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctggtttct tagcagctgc tgctgtgtcc aaggcttgga attgctgtgg 240 tgaatctaaa actgtctcag tagtggtgag ctgacctcac ccaagttcaa agccctactc 300 tgcctgatcc ttttttcctg agcctcagag ctaaaatgcc cccgagctct ttcctattgg 360 ctggaaagac gaattgaagt tcccttgccc atgttaggag gtgtacgcct cctgaactaa 420 agatagaaac agctggccct tccaggcagc taaaagcctc cagactaaga ggtgttcccc 480 attcggcagc cagactcctt gaaataccct ttcagtaatc attcaaccaa cgcttccgcc 540 acc 543 <210> 88 <211> 362 <212> DNA <213> Artificial Sequence <220> <223> SP0334 <400> 88 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 240 ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 300 ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 360 cc 362 <210> 89 <211> 715 <212> DNA <213> Artificial Sequence <220> <223> SP0335 <400> 89 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240 aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300 gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360 aaagcctcca gactaagagg tgttccccat tcggccatgt tcccggcgaa gggccagctg 420 tcccccgcca gctagactca gcacttagtt taggaaccag tgagcaagtc agcccttggg 480 gcagcccata caaggccatg gggctgggca agctgcacgc ctgggtccgg ggtgggcacg 540 gtgcccgggc aacgagctga aagctcatct actctcaggg gcccctccct ggggacagcc 600 cctcctggct agtcacaccc tgtaggctcc tctatataac ccaggggcac aggggctgcc 660 cccgggtcac caccacctcc acagcacaga cagacactca ggagccagcg ccacc 715 <210> 90 <211> 521 <212> DNA <213> Artificial Sequence <220> <223> SP0336 <400> 90 tcaaagccct actctgcctg atcctttttt cctgagcctc agagctaaaa tgcccccgag 60 ctctttccta ttggctggaa agacgaattg aagttccctt gcccatgtta ggaggtgtac 120 gcctcctgaa ctaaagatag aaacagctgg cccttccagg cagctaaaag cctccagact 180 aagaggtgtt ccccattcgg ccatgttccc ggcgaagggc cagctgtccc ccgccagcta 240 gactcagcac ttagtttagg aaccagtgag caagtcagcc cttggggcag cccatacaag 300 gccatggggc tgggcaagct gcacgcctgg gtccggggtg ggcacggtgc ccgggcaacg 360 agctgaaagc tcatctactc tcaggggccc ctccctgggg acagcccctc ctggctagtc 420 acaccctgta ggctcctcta tataacccag gggcacaggg gctgcccccg ggtcaccacc 480 acctccacag cacagacaga cactcaggag ccagcgccac c 521 <210> 91 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> SP0337 <400> 91 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240 aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300 gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360 aaagcctcca gactaagagg tgttccccat tcggcccggc agacgctcct tatacggccc 420 ggcctcgctc acctgggccg cggccaggag cgccttcttt gggcagcgcc gggccggggc 480 cgcgccgggc ccgacaccca aatatggcga cggccggggc cgcattcctg ggggccgggc 540 ggcgctcccg cccgcctcga taaaaggctc cggggccggc ggcggcccac gagctacccg 600 gaggagcggg aggccacc 618 <210> 92 <211> 729 <212> DNA <213> Artificial Sequence <220> <223> SP0338 <400> 92 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagcgcc actacgggtc 180 taggctgccc atgtaaggag gcaaggcctg gggacacccg agatgcctgg ttataattaa 240 cccagacatg tggctgcccc ccccccccaa cacctgctgc ctgagcctca cccccacccc 300 ggtgcctggg tcttaggctc tgtacaccat ggaggagaag ctcgctctaa aaataaccct 360 gtcaaagccc tactctgcct gatccttttt tcctgagcct cagagctaaa atgcccccga 420 gctctttcct attggctgga aagacgaatt gaagttccct tgcccatgtt aggaggtgta 480 cgcctcctga actaaagata gaaacagctg gcccttccag gcagctaaaa gcctccagac 540 taagaggtgt tccccattcg gcgggatctt gcagctgtca ggggagggga ggcgggggct 600 gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc ctcgccgcat 660 ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc 720 gccgtcacc 729 <210> 93 <211> 610 <212> DNA <213> Artificial Sequence <220> <223> SP0339 <400> 93 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240 tgtcaaagcc ctactctgcc tgatcctttt ttcctgagcc tcagagctaa aatgcccccg 300 agctctttcc tattggctgg aaagacgaat tgaagttccc ttgcccatgt taggaggtgt 360 acgcctcctg aactaaagat agaaacagct ggcccttcca ggcagctaaa agcctccaga 420 ctaagaggtg ttccccattc ggcgggatct tgcagctgtc aggggagggg aggcgggggc 480 tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca 540 tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg 600 cgccgtcacc 610 <210> 94 <211> 654 <212> DNA <213> Artificial Sequence <220> <223> SP0340 <400> 94 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcccggc agacgctcct tatacggccc ggcctcgctc acctgggccg 240 cggccaggag cgccttcttt gggcagcgcc gggccggggc cgcgccgggc ccgacaccca 300 aatatggcga cggccggggc cgcattcctg ggggccgggc ggcgctcccg cccgcctcga 360 taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg agataaatac 420 ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg gggttggcag 480 ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat 540 acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg 600 ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 654 <210> 95 <211> 924 <212> DNA <213> Artificial Sequence <220> <223> SP0341 <400> 95 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240 aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300 gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360 aaagcctcca gactaagagg tgttccccat tcgggccgcg aagaccggaa gctggggcgg 420 ccccgggccg cgcgcgctgg gcctgggagg cgaaactcag cttccttcgt ttccgacttt 480 tccatccgcg tcctccactt ccccgttccg ccctccccca ttgccaacat tctggctgag 540 tcacggcgcc ccagagcgcg ccaggctggg ggaaaggagc agaagggagg gccctagcga 600 cccgcgggat gtggtccgag tcacgtccga ggggggtggg gagggatcgt gttctcggcg 660 cccgcccctt cctagcgcgg cctctgggct gcgcctctcg ggggcggccc gtagcccagt 720 ccgtcgcctg ccattggacg ccgcccgctc ctcgtaaagg aaaaagctcg gcggagggcg 780 gagtggtgcc tttaaaaggc cgggcgccgc cttccgcctg cccgcctcct gcgccgcccc 840 ttccgaggct aaatcggctg cgttcctctc ggaacgcgcc gcagaagggg tcctggtgac 900 gagtcccgcg ttctctccgc cacc 924 <210> 96 <211> 488 <212> DNA <213> Artificial Sequence <220> <223> SP0342 <400> 96 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagccca tgttcccggc 180 gaagggccag ctgtcccccg ccagctagac tcagcactta gtttaggaac cagtgagcaa 240 gtcagccctt ggggcagccc atacaaggcc atggggctgg gcaagctgca cgcctgggtc 300 cggggtgggc acggtgcccg ggcaacgagc tgaaagctca tctactctca ggggcccctc 360 cctggggaca gcccctcctg gctagtcaca ccctgtaggc tcctctatat aacccagggg 420 cacaggggct gcccccgggt caccaccacc tccacagcac agacagacac tcaggagcca 480 gcgccacc 488 <210> 97 <211> 652 <212> DNA <213> Artificial Sequence <220> <223> SP0343 <400> 97 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgataaat acccgctctg gtatttgggg ttctcctcta taaatacccg 240 ctctggtatt tggggttggc agctgttgcg ggatcttgca gctgtcaggg gaggggaggc 300 gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 360 gctcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac 420 cgatccagcc tccgcggccg ggaacggtgc attggaacgc ggattccccg tgccaagagt 480 gacgtaagta ccgcctatag actctatagg cacacccctt tggctcttat gcatgaacgg 540 tggagggcag tgtagtctga gcagtactcg ttgctgccgc gcgcgccacc agacataata 600 gctgacagac taacagactg ttcctttcca tgggtctttt ctgcaggcca cc 652 <210> 98 <211> 693 <212> DNA <213> Artificial Sequence <220> <223> SP0345 <400> 98 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cctcgggatc ttgcagctgt caggggaggg 540 gaggcggggg ctgatgtcag gagggataca aatagtgccg acggctgggg gccctgtctc 600 ccctcgccgc atccactctc cggccggccg cctgcccgcc gcctcctccg tgcgcccgcc 660 agcctcgccc gcgccgtcac cgcggccgcc acc 693 <210> 99 <211> 576 <212> DNA <213> Artificial Sequence <220> <223> SP0346 <400> 99 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180 gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240 ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300 aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360 gttcctcacc cgtcgccata tttgggtgtc cgccctcggg atcttgcagc tgtcagggga 420 ggggaggcgg gggctgatgt caggagggat acaaatagtg ccgacggctg ggggccctgt 480 ctcccctcgc cgcatccact ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc 540 gccagcctcg cccgcgccgt caccgcggcc gccacc 576 <210> 100 <211> 606 <212> DNA <213> Artificial Sequence <220> <223> SP0347 <400> 100 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc ctagactagc 240 atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt tataattaac 300 ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat aaccctgcat 360 aaatacccgc tctggtattt ggggttctcc tctataaata cccgctctgg tatttggggt 420 tggcagctgt tgcgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg 480 agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc 540 ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg cgccgtcacc 600 gccacc 606 <210> 101 <211> 575 <212> DNA <213> Artificial Sequence <220> <223> SP0348 <400> 101 ctctgtctcc tcaggtgcct ggctgcttcc tagctgggcc tttccttctc ctctataaat 60 accagctctg gtatttcgcc ttggcagctg ttgctgctag ggagacggct ggcttgacat 120 gcatctcctg acaaaacaca aacccgtggt gtgagtgggt gtgggcggtg tgagtagggg 180 gatgaatcag agagggggcc tagactagca tgctgcccat gtaaggaggc aaggcctggg 240 gacacccgag atgcctggtt ataattaacc cagacatgtg gctgcccccc cccccccaac 300 acctgctgcc tctaaaaata accctgcata aatacccgct ctggtatttg gggttctcct 360 ctataaatac ccgctctggt atttggggtt ggcagctgtt gcgggatctt gcagctgtca 420 ggggagggga ggcgggggct gatgtcagga gggatacaaa tagtgccgac ggctgggggc 480 cctgtctccc ctcgccgcat ccactctccg gccggccgcc tgcccgccgc ctcctccgtg 540 cgcccgccag cctcgcccgc gccgtcaccg ccacc 575 <210> 102 <211> 907 <212> DNA <213> Artificial Sequence <220> <223> SP0349 <400> 102 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc gccactacgg 240 gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc tggttataat 300 taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc tcacccccac 360 cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc taaaaataac 420 cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc caaatatggc 480 gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg gcaggcagca 540 ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg aatggtggac 600 acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc cctataaata 660 cccgctctgg tatttggggt tctcctctat aaatacccgc tctggtattt ggggttggca 720 gctgttgcgg gatcttgcag ctgtcagggg aggggaggcg ggggctgatg tcaggaggga 780 tacaaatagt gccgacggct gggggccctg tctcccctcg ccgcatccac tctccggccg 840 gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc gcccgcgccg tcaccgcggc 900 cgccacc 907 <210> 103 <211> 727 <212> DNA <213> Artificial Sequence <220> <223> SP0350 <400> 103 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtttctcc tctataaata 300 cccgctctgg tatttggggt tggcagctgt tgctgccagg gagatggttg ggttgacacc 360 gcggtggcgg ccgtccgccc tcggcaccat cctcacgaca cccaaatatg gcgacgggtg 420 aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag caggtgttgg 480 cgctctaaaa ataactcccg ggagttattt ttagagcgga ggaatggtgg acacccaaat 540 atggcgacgg ttcctcaccc gtcgccatat ttgggtgtcc gccctcggcc ggggccgcat 600 tcctgggggc cgggcggtgc tcccgcccgc ctcgataaaa ggctccgggg ccggcggcgg 660 cccacgagct acccggagga gcgggaggcg ccaagctcta gaactagtgg atcccgcggc 720 cgccacc 727 <210> 104 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> SP0351 <400> 104 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180 tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360 ccacc 365 <210> 105 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> SP0352 <400> 105 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagc tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaatagct cccgggagct atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360 ccacc 365 <210> 106 <211> 568 <212> DNA <213> Artificial Sequence <220> <223> SP0353 <400> 106 tccctaacct cctgcttgcg aggcctctct ctggcctctg agagggtcag tgtcctgccc 60 caacccatga gatgacagac tataatagcc acaggattaa catagcaggc attgtctttc 120 tctgactata gggtgggtat tatgtgttca tcaaccatcc taaaaatacc cggtaaacag 180 gtgcagcccc tgtggctcca gtcccctggg atctgttggc ttctggctgg agatgaagat 240 tagggcagag gagaggtgaa ttagtctcac tgagttccag gcatgagact cgggtgtcct 300 ttggaacctg ggaaatctag attccaggaa acccatctgg agggcccggc agacgctcct 360 tatacggccc ggcctcgctc acctgggccg cggccaggag cgccttcttt gggcagcgcc 420 gggccggggc cgcgccgggc ccgacaccca aatatggcga cggccggggc cgcattcctg 480 ggggccgggc ggcgctcccg cccgcctcga taaaaggctc cggggccggc ggcggcccac 540 gagctacccg gaggagcggg aggccacc 568 <210> 107 <211> 376 <212> DNA <213> Artificial Sequence <220> <223> SP0354 <400> 107 ccatcctaaa aatacccggt aaacaggtgc agcccctgtg gctccagtcc cctgggatct 60 gttggcttct ggctggagat gaagattagg gcagaggaga ggtgaattag tctcactgag 120 ttccaggcat gagactcggg tgtcctttgg aacccggcag acgctcctta tacggcccgg 180 cctcgctcac ctgggccgcg gccaggagcg ccttctttgg gcagcgccgg gccggggccg 240 cgccgggccc gacacccaaa tatggcgacg gccggggccg cattcctggg ggccgggcgg 300 cgctcccgcc cgcctcgata aaaggctccg gggccggcgg cggcccacga gctacccgga 360 ggagcgggag gccacc 376 <210> 108 <211> 296 <212> DNA <213> Artificial Sequence <220> <223> SP0355 <400> 108 agggtcagtg tcctgcccca acccatgaga tgacagacta taatagccac aggattaaca 60 tagcaggcat tgcccggcag acgctcctta tacggcccgg cctcgctcac ctgggccgcg 120 gccaggagcg ccttctttgg gcagcgccgg gccggggccg cgccgggccc gacacccaaa 180 tatggcgacg gccggggccg cattcctggg ggccgggcgg cgctcccgcc cgcctcgata 240 aaaggctccg gggccggcgg cggcccacga gctacccgga ggagcgggag gccacc 296 <210> 109 <211> 654 <212> DNA <213> Artificial Sequence <220> <223> SP0356 <400> 109 ctgaggggtg tcagagcaca ggctgaggcc tcttgcctga cgtgggaccc cttggtctgg 60 catttgtcag tgaggcaggc tgggggcagg ccccggagct tggcaggagg tgtaaaccgg 120 ccttggaagg tagggcccca caatggggac agttggatct ctgagggaga cagggaggca 180 tgatcactgc caaatgccca ccaaggacaa ggcacatccc agggagacag acgcagacct 240 ggtgccctct ggacactggc attcctggag gctgatgatg gacagatggg cctggaggtg 300 gctcttcgcc agctggtgtt tcctttggac ttcctcagtg tctttggaga agcagagccc 360 taagaataag cagctgccca taaaatctaa taccagccaa gcatctcagg aattcatgga 420 ttgtctccat cccggcagac gctccttata cggcccggcc tcgctcacct gggccgcggc 480 caggagcgcc ttctttgggc agcgccgggc cggggccgcg ccgggcccga cacccaaata 540 tggcgacggc cggggccgca ttcctggggg ccgggcggcg ctcccgcccg cctcgataaa 600 aggctccggg gccggcggcg gcccacgagc tacccggagg agcgggaggc cacc 654 <210> 110 <211> 659 <212> DNA <213> Artificial Sequence <220> <223> SP0358 <400> 110 ttctgagtcc tctaaggtcc ctcactccca actcagcccc atgtcctgtc aattcccact 60 cagtgtctga tctccttctc ctcacctttc ccatctcccg tttgacccaa gcttcctgag 120 ctctcctccc attccccttt ttggagtcct cctcctctcc cagaacccag taataagtgg 180 gctcctccct ggcctggacc cccgtggtaa ccctataagg cgaggcagct gctgtctgag 240 gcagggaggg gctggtgtgg gaggctaagg gcagctgcta agtttagggt ggctccttct 300 ctcttcttag agacaacagg tggctggggc ctcagtgccc agaaaagaaa atgtcttaga 360 ggtatcggca tgggcctgga ggagggggga cagggcaggg ggaggcatct tcctcaggac 420 atcgggtcct agaggcccgg cagacgctcc ttatacggcc cggcctcgct cacctgggcc 480 gcggccagga gcgccttctt tgggcagcgc cgggccgggg ccgcgccggg cccgacaccc 540 aaatatggcg acggccgggg ccgcattcct gggggccggg cggcgctccc gcccgcctcg 600 ataaaaggct ccggggccgg cggcggccca cgagctaccc ggaggagcgg gaggccacc 659 <210> 111 <211> 332 <212> DNA <213> Artificial Sequence <220> <223> SP0359 <400> 111 cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60 gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtgcc cggcagacgc 120 tccttatacg gcccggcctc gctcacctgg gccgcggcca ggagcgcctt ctttgggcag 180 cgccgggccg gggccgcgcc gggcccgaca cccaaatatg gcgacggccg gggccgcatt 240 cctgggggcc gggcggcgct cccgcccgcc tcgataaaag gctccggggc cggcggcggc 300 ccacgagcta cccggaggag cgggaggcca cc 332 <210> 112 <211> 483 <212> DNA <213> Artificial Sequence <220> <223> SP0361 <400> 112 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180 tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgcccta taaatacccg 240 ctctggtatt tggggttctc ctctataaat acccgctctg gtatttgggg ttggcagctg 300 ttgcgggatc ttgcagctgt caggggaggg gaggcggggg ctgatgtcag gagggataca 360 aatagtgccg acggctgggg gccctgtctc ccctcgccgc atccactctc cggccggccg 420 cctgcccgcc gcctcctccg tgcgcccgcc agcctcgccc gcgccgtcac cgcggccgcc 480 acc 483 <210> 113 <211> 535 <212> DNA <213> Artificial Sequence <220> <223> SP0362 <400> 113 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagcaca cccaaatatg 180 gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 240 caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgag ctctataaat 300 acccgctctg gtatttgggg ttttgaaccc gtcgccatat ttgggtgtcc gccctcggga 360 tcttgcagct gtcaggggag gggaggcggg ggctgatgtc aggagggata caaatagtgc 420 cgacggctgg gggccctgtc tcccctcgcc gcatccactc tccggccggc cgcctgcccg 480 ccgcctcctc cgtgcgcccg ccagcctcgc ccgcgccgtc accgcggccg ccacc 535 <210> 114 <211> 598 <212> DNA <213> Artificial Sequence <220> <223> SP0363 <400> 114 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc acacccaaat 240 atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg 300 cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc gagctctata 360 aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg tccgccctcg 420 ggatcttgca gctgtcaggg gaggggaggc gggggctgat gtcaggaggg atacaaatag 480 tgccgacggc tgggggccct gtctcccctc gccgcatcca ctctccggcc ggccgcctgc 540 ccgccgcctc ctccgtgcgc ccgccagcct cgcccgcgcc gtcaccgcgg ccgccacc 598 <210> 115 <211> 683 <212> DNA <213> Artificial Sequence <220> <223> SP0364 <400> 115 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc caccgcggtg 240 gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg ggtgaggaat 300 ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg ttggcgctct 360 aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc aaatatggcg 420 acggttcctc acccgtcgcc atatttgggt gtccgccctc ccggcagacg ctccttatac 480 ggcccggcct cgctcacctg ggccgcggcc aggagcgcct tctttgggca gcgccgggcc 540 ggggccgcgc cgggcccgac acccaaatat ggcgacggcc ggggccgcat tcctgggggc 600 cgggcggcgc tcccgcccgc ctcgataaaa ggctccgggg ccggcggcgg cccacgagct 660 acccggagga gcgggaggcc acc 683 <210> 116 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> SP0365 <400> 116 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ccggcagacg 240 ctccttatac ggcccggcct cgctcacctg ggccgcggcc aggagcgcct tctttgggca 300 gcgccgggcc ggggccgcgc cgggcccgac acccaaatat ggcgacggcc ggggccgcat 360 tcctgggggc cgggcggcgc tcccgcccgc ctcgataaaa ggctccgggg ccggcggcgg 420 cccacgagct acccggagga gcgggaggcc acc 453 <210> 117 <211> 591 <212> DNA <213> Artificial Sequence <220> <223> SP0366 <400> 117 cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60 gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtgca ccgcggtggc 120 ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 180 tggggagtta tttttagagc ggtgaggaag gtgggcaggc agcaggtgtt ggcgctctaa 240 aaataactcc cgggagttat ttttagagcg gaggaatggt ggacacccaa atatggcgac 300 ggttcctcac ccgtcgccat atttgggtgt ccgccctata aatacccgct ctggtatttg 360 gggttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt gcgggatctt 420 gcagctgtca ggggagggga ggcgggggct gatgtcagga gggatacaaa tagtgccgac 480 ggctgggggc cctgtctccc ctcgccgcat ccactctccg gccggccgcc tgcccgccgc 540 ctcctccgtg cgcccgccag cctcgcccgc gccgtcaccg cggccgccac c 591 <210> 118 <211> 429 <212> DNA <213> Artificial Sequence <220> <223> SP0367 <400> 118 cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60 gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtgcc atgttcccgg 120 cgaagggcca gctgtccccc gccagctaga ctcagcactt agtttaggaa ccagtgagca 180 agtcagccct tggggcagcc catacaaggc catggggctg ggcaagctgc acgcctgggt 240 ccggggtggg cacggtgccc gggcaacgag ctgaaagctc atctactctc aggggcccct 300 ccctggggac agcccctcct ggctagtcac accctgtagg ctcctctata taacccaggg 360 gcacaggggc tgcccccggg tcaccaccac ctccacagca cagacagaca ctcaggagcc 420 agcgccacc 429 <210> 119 <211> 550 <212> DNA <213> Artificial Sequence <220> <223> SP0368 <400> 119 cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60 gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtggc cactacgggt 120 ctaggctgcc catgtaagga ggcaaggcct ggggacaccc gagatgcctg gttataatta 180 acccagacat gtggctgccc ccccccccca acacctgctg cctgagcctc acccccaccc 240 cggtgcctgg gtcttaggct ctgtacacca tggaggagaa gctcgctcta aaaataaccc 300 tgataaatac ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg 360 gggttggcag ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt 420 caggagggat acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact 480 ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt 540 caccgccacc 550 <210> 120 <211> 388 <212> DNA <213> Artificial Sequence <220> <223> SP0369 <400> 120 cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60 aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120 gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240 tttagagcgg agcggccggg gccgcattcc tgggggccgg gcggtgctcc cgcccgcctc 300 gataaaaggc tccggggccg gcggcggccc acgagctacc cggaggagcg ggaggcgcca 360 agctctagaa ctagtggatc ccgccacc 388 <210> 121 <211> 514 <212> DNA <213> Artificial Sequence <220> <223> SP0370 <400> 121 cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60 aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120 gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240 tttagagcgg agcgacaccc aaatatggcg acgggtgagg aatggtgggg agttattttt 300 agagcggtga ggaaggtggg caggcagcag gtgttggcgc tctaaaaata actcccggga 360 gttattttta gagcggagcg gccggggccg cattcctggg ggccgggcgg tgctcccgcc 420 cgcctcgata aaaggctccg gggccggcgg cggcccacga gctacccgga ggagcgggag 480 gcgccaagct ctagaactag tggatcccgc cacc 514 <210> 122 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> SP0371 <400> 122 taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60 gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120 aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180 cggttcctca cccgtcgcca tatttgggtg tccgccctcg gccggggccg cattcctggg 240 ggccgggcgg tgctcccgcc cgcctcgata aaaggctccg gggccggcgg cggcccacga 300 gctacccgga ggagcgggag gcgccaagct ctagaactag tggatcccgc cacc 354 <210> 123 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> SP0372 <400> 123 aggctaaggg cagctgctaa gtttagggtg acacccaaat atggcgacgg gtgaggaatg 60 gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120 aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180 cggttcctca cccgtcgcca tatttgggtg tccgccctcg gccggggccg cattcctggg 240 ggccgggcgg tgctcccgcc cgcctcgata aaaggctccg gggccggcgg cggcccacga 300 gctacccgga ggagcgggag gcgccaagct ctagaactag tggatcccgc cacc 354 <210> 124 <211> 362 <212> DNA <213> Artificial Sequence <220> <223> SP0373 <400> 124 taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60 gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120 aaaataactc ccgggagtta tttttagagc gctctaaggt ccctcactcc caactcagcc 180 ccatgtcctg tcaattcacc cgtcgccata tttgggtgtc cgccctcggc cggggccgca 240 ttcctggggg ccgggcggtg ctcccgcccg cctcgataaa aggctccggg gccggcggcg 300 gcccacgagc tacccggagg agcgggaggc gccaagctct agaactagtg gatcccgcca 360 cc 362 <210> 125 <211> 362 <212> DNA <213> Artificial Sequence <220> <223> SP0374 <400> 125 ctctaaggtc cctcactccc aactcagccc catgtcctgt caattcgaca cccaaatatg 60 gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 120 caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgta aggcgaggca 180 gctgctgtct gaggcagacc cgtcgccata tttgggtgtc cgccctcggc cggggccgca 240 ttcctggggg ccgggcggtg ctcccgcccg cctcgataaa aggctccggg gccggcggcg 300 gcccacgagc tacccggagg agcgggaggc gccaagctct agaactagtg gatcccgcca 360 cc 362 <210> 126 <211> 376 <212> DNA <213> Artificial Sequence <220> <223> SP0375 <400> 126 taaggcgagg cagctgctgt ctgaggcaga ggctaagggc agctgctaag tttagggtct 60 ctaaggtccc tcactcccaa ctcagcccca tgtcctgtca attccgacac ccaaatatgg 120 cgacgggtga ggaatggtgg ggagttattt ttagagcagg cagcaggtgt tggcgctcta 180 aaaataactc ccgggagtta tttttagagc gacccgtcgc catatttggg tgtccgccct 240 cggccggggc cgcattcctg ggggccgggc ggtgctcccg cccgcctcga taaaaggctc 300 cggggccggc ggcggcccac gagctacccg gaggagcggg aggcgccaag ctctagaact 360 agtggatccc gccacc 376 <210> 127 <211> 434 <212> DNA <213> Artificial Sequence <220> <223> SP0376 <400> 127 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgataaat acccgctctg gtatttgggg tactaaaaat agaacgacta 240 tttttaggct tttctggcag ctggcccggg atcttgcagc tgtcagggga ggggaggcgg 300 gggctgatgt caggagggat acaaatagtg ccgacggctg ggggccctgt ctcccctcgc 360 cgcatccact ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg 420 cccgcgccgt cacc 434 <210> 128 <211> 436 <212> DNA <213> Artificial Sequence <220> <223> SP0377 <400> 128 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgataaat acccgctctg gtatttgggg cgaggtacta taaataccct 240 tagaggtatt ttatcttggc agctaggtcg ggatcttgca gctgtcaggg gaggggaggc 300 gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 360 gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct 420 cgcccgcgcc gtcacc 436 <210> 129 <211> 522 <212> DNA <213> Artificial Sequence <220> <223> SP0378 <400> 129 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttactaa aaatagaacg 300 actattttta ggcttttctg gcagctggcc ctgccagaca gagttcctca gtaacgggat 360 cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 420 gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 480 cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca cc 522 <210> 130 <211> 524 <212> DNA <213> Artificial Sequence <220> <223> SP0379 <400> 130 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcgaggt actataaata 300 cccttagagg tattttatct tggcagctag gtctgccaga cagagttcct cagtaacggg 360 atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 420 ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 480 gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 524 <210> 131 <211> 522 <212> DNA <213> Artificial Sequence <220> <223> SP0380 <400> 131 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttactaa aaatagaacg 300 actattttta ggcttttctg gcagctggcc ctgccagaca gataaacgag ctatcgggat 360 cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 420 gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 480 cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca cc 522 <210> 132 <211> 524 <212> DNA <213> Artificial Sequence <220> <223> SP0381 <400> 132 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcgaggt actataaata 300 cccttagagg tattttatct tggcagctag gtctgccaga cagataaacg agctatcggg 360 atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 420 ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 480 gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 524 <210> 133 <211> 524 <212> DNA <213> Artificial Sequence <220> <223> SP0382 <400> 133 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttaaacg agctattagt 300 tatgaggtcc gtagattgaa taaacgagct attagttatg aggtccgtag attgaacggg 360 atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat acaaatagtg 420 ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg ccgcctgccc 480 gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt cacc 524 <210> 134 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> SKM_14 <400> 134 ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgct gccagggaga 60 tggttgggtt gacgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg 120 agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc 180 ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg cgccgtcacc 240 240 <210> 135 <211> 242 <212> DNA <213> Artificial Sequence <220> <223> SKM_18 <400> 135 ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 60 gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 120 ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 180 ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 240 cc 242 <210> 136 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> SKM_20 <400> 136 atttttaaag actgaggaat taggcacctg tcatttttgc cagctggtgt agatgttaaa 60 aattactgtc actcttccgc ctgctacttt attttgcacc tgctgttact tgagttacag 120 gcatttcaca catggtaatt taataaggtt agttcccatg acacaccgcc tgctgccacg 180 gccggccgta taaatagagg cgaggagcag ctgggctctc ttggcagtca cc 232 <210> 137 <211> 335 <212> DNA <213> Artificial Sequence <220> <223> SP0357 <400> 137 tctgagggag acagggaggc atgatcactg ccaaatgccc accaaggaca aggcacatcc 60 cagggagaca gacgcagacc tggtgccctc tggacactgg cattcctgga gcccggcaga 120 cgctccttat acggcccggc ctcgctcacc tgggccgcgg ccaggagcgc cttctttggg 180 cagcgccggg ccggggccgc gccgggcccg acacccaaat atggcgacgg ccggggccgc 240 attcctgggg gccgggcggc gctcccgccc gcctcgataa aaggctccgg ggccggcggc 300 ggcccacgag ctacccggag gagcgggagg ccacc 335 <210> 138 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0020 <400> 138 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284 <210> 139 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0033 <400> 139 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 140 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0336 <400> 140 tcaaagccct actctgcctg atcctttttt cctgagcctc agagctaaaa tgcccccgag 60 ctctttccta ttggctggaa agacgaattg aagttccctt gcccatgtta ggaggtgtac 120 gcctcctgaa ctaaagatag aaacagctgg cccttccagg cagctaaaag cctccagact 180 aagaggtgtt ccccattcgg 200 <210> 141 <211> 216 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0038 <400> 141 taagtccggg cagggtcctg tccataaaag gcttttcccg ggccggctcc ccgccggcag 60 cgtgccccgc cccggcccgc tccatctcca aagcatgcag agaatgtctc ggcagccccg 120 gtagactgct ccaacttggt gtctttcccc aaatatggag cctgtgtgga gtcactgggg 180 gagccggggg tggggagcgg agccggcttc ctctag 216 <210> 142 <211> 245 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0040 <400> 142 ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60 tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120 ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180 cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240 aggag 245 <210> 143 <211> 245 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0042 <400> 143 ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60 tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120 ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180 cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240 aggag 245 <210> 144 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0051 <400> 144 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284 <210> 145 <211> 459 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0057 <400> 145 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc caccgcggtg 240 gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg ggtgaggaat 300 ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg ttggcgctct 360 aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc aaatatggcg 420 acggttcctc acccgtcgcc atatttgggt gtccgccct 459 <210> 146 <211> 274 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0058 <400> 146 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaa 274 <210> 147 <211> 274 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0061 <400> 147 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaa 274 <210> 148 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0062 <400> 148 ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60 tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120 gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180 tgctctgagg agctggaacc 200 <210> 149 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0064 <400> 149 tacatcattt acctagaaaa gaggacagct gtcctttccc aaagctccgg tgaccctgcc 60 ccgcccagtg tgactagccc aggttggtga ttctgatctg ttgccaaacc aaactggctc 120 cccggggagc catttggtaa tgttccctgg agtcatttcc ttgcgaagca ttccttttcg 180 gtgagaggac atttttttca tccctgataa acaaccacag cctgcgccag 230 <210> 150 <211> 211 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0065 <400> 150 taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60 gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120 atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180 acatttcttc ctgattcgca tacgccgcgg c 211 <210> 151 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0066 <400> 151 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc 230 <210> 152 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0067 <400> 152 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctg 189 <210> 153 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0068 <400> 153 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 154 <211> 274 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0069 <400> 154 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaa 274 <210> 155 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0070 <400> 155 ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60 tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120 gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180 tgctctgagg agctggaacc 200 <210> 156 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0071 <400> 156 gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60 cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120 ggtggggcgg ggcgggccgc gagccggaga aagagaaagc 160 <210> 157 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0075 <400> 157 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctg 189 <210> 158 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0076 <400> 158 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 159 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0132 <400> 159 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284 <210> 160 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0133 <400> 160 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284 <210> 161 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0134 <400> 161 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cct 513 <210> 162 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0136 <400> 162 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284 <210> 163 <211> 128 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0146 <400> 163 ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60 tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120 aaccctgc 128 <210> 164 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0147 <400> 164 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284 <210> 165 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0148 <400> 165 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284 <210> 166 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0150 <400> 166 gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60 cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120 ggtggggcgg ggcgggccgc gagccggaga aagagaaagc 160 <210> 167 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0153 <400> 167 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 168 <211> 290 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0155 <400> 168 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240 tgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 290 <210> 169 <211> 478 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0156 <400> 169 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctggggccc cacagcagct gggggcattt atgggccttc ctataaactt 240 ctgagagggt aactttatcc tgcttctttc agccaagtat cctcctccag cagctggtca 300 caaagctggt taatctccca gagtgctcag cttaaaaccc gtgactcaca gcacagccag 360 tgtgggggag ggggtggctg cctccaatac gtggcgccca gagtcagctg ttctggggcc 420 ttctctggtt tctccaactg agtcctgagg tttggggcct tgtcttcctt cctggagt 478 <210> 170 <211> 128 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0157 <400> 170 ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60 tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120 aaccctgc 128 <210> 171 <211> 529 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0158 <400> 171 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctgaga ttttcctagc 300 attttgtgtt tcatgactaa atatggtttg tgtttcaaga ccaatgagct gggaactgta 360 ctgttctttc ccctcccatc aactcatttt tggcacaaga cgcactctag tcagttggag 420 caaatcccct gacccgggtg cagttccaaa agcagacact cgagcgtgtt ttacctaatt 480 aggaaatgct ttgctccaaa ccgaactgct cattcaggtt agagaggag 529 <210> 172 <211> 439 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0159 <400> 172 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgctgaga ttttcctagc attttgtgtt tcatgactaa atatggtttg 240 tgtttcaaga ccaatgagct gggaactgta ctgttctttc ccctcccatc aactcatttt 300 tggcacaaga cgcactctag tcagttggag caaatcccct gacccgggtg cagttccaaa 360 agcagacact cgagcgtgtt ttacctaatt aggaaatgct ttgctccaaa ccgaactgct 420 cattcaggtt agagaggag 439 <210> 173 <211> 410 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0160 <400> 173 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtaagtc cgggcagggt cctgtccata aaaggctttt cccgggccgg 240 ctccccgccg gcagcgtgcc ccgccccggc ccgctccatc tccaaagcat gcagagaatg 300 tctcggcagc cccggtagac tgctccaact tggtgtcttt ccccaaatat ggagcctgtg 360 tggagtcact gggggagccg ggggtgggga gcggagccgg cttcctctag 410 <210> 174 <211> 529 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0161 <400> 174 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctgaga ttttcctagc 300 attttgtgtt tcatgactaa atatggtttg tgtttcaaga ccaatgagct gggaactgta 360 ctgttctttc ccctcccatc aactcatttt tggcacaaga cgcactctag tcagttggag 420 caaatcccct gacccgggtg cagttccaaa agcagacact cgagcgtgtt ttacctaatt 480 aggaaatgct ttgctccaaa ccgaactgct cattcaggtt agagaggag 529 <210> 175 <211> 439 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0162 <400> 175 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgctgaga ttttcctagc attttgtgtt tcatgactaa atatggtttg 240 tgtttcaaga ccaatgagct gggaactgta ctgttctttc ccctcccatc aactcatttt 300 tggcacaaga cgcactctag tcagttggag caaatcccct gacccgggtg cagttccaaa 360 agcagacact cgagcgtgtt ttacctaatt aggaaatgct ttgctccaaa ccgaactgct 420 cattcaggtt agagaggag 439 <210> 176 <211> 410 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0163 <400> 176 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtaagtc cgggcagggt cctgtccata aaaggctttt cccgggccgg 240 ctccccgccg gcagcgtgcc ccgccccggc ccgctccatc tccaaagcat gcagagaatg 300 tctcggcagc cccggtagac tgctccaact tggtgtcttt ccccaaatat ggagcctgtg 360 tggagtcact gggggagccg ggggtgggga gcggagccgg cttcctctag 410 <210> 177 <211> 515 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0164 <400> 177 cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60 cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120 ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180 tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggggccccac 240 agcagctggg ggcatttatg ggccttccta taaacttctg agagggtaac tttatcctgc 300 ttctttcagc caagtatcct cctccagcag ctggtcacaa agctggttaa tctcccagag 360 tgctcagctt aaaacccgtg actcacagca cagccagtgt gggggagggg gtggctgcct 420 ccaatacgtg gcgcccagag tcagctgttc tggggccttc tctggtttct ccaactgagt 480 cctgaggttt ggggccttgt cttccttcct ggagt 515 <210> 178 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0165 <400> 178 cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60 cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120 ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180 tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg g 231 <210> 179 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0166 <400> 179 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 240 <210> 180 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0170 <400> 180 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 240 <210> 181 <211> 292 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0171 <400> 181 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gg 292 <210> 182 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0173 <400> 182 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctg 486 <210> 183 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0227 <400> 183 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284 <210> 184 <211> 743 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0228 <400> 184 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300 gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360 ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420 cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480 cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540 ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600 tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660 agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720 cgccatattt gggtgtccgc cct 743 <210> 185 <211> 743 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0229 <400> 185 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300 gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360 ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420 cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480 cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540 ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600 tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660 agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720 cgccatattt gggtgtccgc cct 743 <210> 186 <211> 811 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0230 <400> 186 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtatcaag cttggtacgg 300 gccccacagc agctgggggc atttatgggc cttcctataa acttctgaga gggtaacttt 360 atcctgcttc tttcagccaa gtatcctcct ccagcagctg gtcacaaagc tggttaatct 420 cccagagtgc tcagcttaaa acccgtgact cacagcacag ccagtgtggg ggagggggtg 480 gctgcctcca atacgtggcg cccagagtca gctgttctgg ggccttctct ggtttctcca 540 actgagtcct gaggtttggg gccttgtctt ccttcctgga gtcaccgcgg tggcggccgt 600 ccgccctcgg caccatcctc acgacaccca aatatggcga cgggtgagga atggtgggga 660 gttattttta gagcggtgag gaaggtgggc aggcagcagg tgttggcgct ctaaaaataa 720 ctcccgggag ttatttttag agcggaggaa tggtggacac ccaaatatgg cgacggttcc 780 tcacccgtcg ccatatttgg gtgtccgccc t 811 <210> 187 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0231 <400> 187 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cct 513 <210> 188 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0232 <400> 188 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240 caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300 gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360 aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420 cct 423 <210> 189 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0257 <400> 189 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctg 486 <210> 190 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0262 <400> 190 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctg 486 <210> 191 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0264 <400> 191 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 192 <211> 292 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0265 <400> 192 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gg 292 <210> 193 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0266 <400> 193 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctg 486 <210> 194 <211> 418 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0267 <400> 194 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgc accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat 240 atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg 300 cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg 360 tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccct 418 <210> 195 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0268 <400> 195 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctggtttct tagcagctgc tgctgtgtcc aaggcttgga attgctgtgg 240 tgaatctaaa actgtctcag tagtggtgag ctgacctcac ccaagttcaa agccctactc 300 tgcctgatcc ttttttcctg agcctcagag ctaaaatgcc cccgagctct ttcctattgg 360 ctggaaagac gaattgaagt tcccttgccc atgttaggag gtgtacgcct cctgaactaa 420 agatagaaac agctggccct tccaggcagc taaaagcctc cagactaaga ggtgttcccc 480 attcgg 486 <210> 196 <211> 394 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0270 <400> 196 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240 aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300 gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360 aaagcctcca gactaagagg tgttccccat tcgg 394 <210> 197 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0271 <400> 197 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 198 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0279 <400> 198 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cct 513 <210> 199 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0305 <400> 199 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctg 486 <210> 200 <211> 424 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0306 <400> 200 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc gccactacgg 240 gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc tggttataat 300 taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc tcacccccac 360 cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc taaaaataac 420 cctg 424 <210> 201 <211> 478 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0307 <400> 201 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtgccact acgggtctag 300 gctgcccatg taaggaggca aggcctgggg acacccgaga tgcctggtta taattaaccc 360 agacatgtgg ctgccccccc cccccaacac ctgctgcctg agcctcaccc ccaccccggt 420 gcctgggtct taggctctgt acaccatgga ggagaagctc gctctaaaaa taaccctg 478 <210> 202 <211> 388 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0309 <400> 202 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctggccact acgggtctag gctgcccatg taaggaggca aggcctgggg 240 acacccgaga tgcctggtta taattaaccc agacatgtgg ctgccccccc cccccaacac 300 ctgctgcctg agcctcaccc ccaccccggt gcctgggtct taggctctgt acaccatgga 360 ggagaagctc gctctaaaaa taaccctg 388 <210> 203 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0310 <400> 203 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 204 <211> 242 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0311 <400> 204 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240 tg 242 <210> 205 <211> 425 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0312 <400> 205 cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60 cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120 ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180 tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg ggccactacg 240 ggtctaggct gcccatgtaa ggaggcaagg cctggggaca cccgagatgc ctggttataa 300 ttaacccaga catgtggctg cccccccccc ccaacacctg ctgcctgagc ctcaccccca 360 ccccggtgcc tgggtcttag gctctgtaca ccatggagga gaagctcgct ctaaaaataa 420 ccctg 425 <210> 206 <211> 319 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0313 <400> 206 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcccctg ccccccacag ctcctctcct gtgccttgtt tcccagccat 240 gcgttctcct ctataaatac ccgctctggt atttggggtt ggcagctgtt gctgccaggg 300 agatggttgg gttgacatg 319 <210> 207 <211> 258 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0314 <400> 207 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgctctat aaatacccgc tctggtattt ggggttctct ataaataccc 240 gctctggtat ttggggtt 258 <210> 208 <211> 128 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0315 <400> 208 ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60 tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120 aaccctgc 128 <210> 209 <211> 128 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0316 <400> 209 ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60 tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120 aaccctgc 128 <210> 210 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0320 <400> 210 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gggccactac 300 gggtctaggc tgcccatgta aggaggcaag gcctggggac acccgagatg cctggttata 360 attaacccag acatgtggct gccccccccc cccaacacct gctgcctgag cctcaccccc 420 accccggtgc ctgggtctta ggctctgtac accatggagg agaagctcgc tctaaaaata 480 accctg 486 <210> 211 <211> 407 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0322 <400> 211 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180 gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240 ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300 aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360 gttcctcacc cgtcgccata tttgggtgtc cgccctcggc cggggcc 407 <210> 212 <211> 359 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0323 <400> 212 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagcccaca ttcctttcca gaggccagct ctccatttat agcccctggg cagagcagcc 120 accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat atggcgacgg 180 gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt 240 tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca 300 aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccctcg gccggggcc 359 <210> 213 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0324 <400> 213 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagc 167 <210> 214 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0325 <400> 214 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagc 167 <210> 215 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0326 <400> 215 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 216 <211> 396 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0327 <400> 216 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180 gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240 ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300 aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360 gttcctcacc cgtcgccata tttgggtgtc cgccct 396 <210> 217 <211> 680 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0328 <400> 217 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtagactg gggcaggtgc 300 aggctggatt gggtttccag aggctatata tataaaggct gccgggagcc ccagggccgc 360 tccctgaggg cacaacactg tgggggccca gccaggccca cattcctttc cagaggccag 420 ctctccattt atagcccctg ggcagagcag ccaccgcggt ggcggccgtc cgccctcggc 480 accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 540 agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 600 tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 660 catatttggg tgtccgccct 680 <210> 218 <211> 188 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0329 <400> 218 acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60 ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120 ggaggaatgg tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg 180 tccgccct 188 <210> 219 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0330 <400> 219 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 220 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0331 <400> 220 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgaggtaaac gagctattag 180 ttatgaggtc cgtagattga acccgtcgcc atatttgggt gtccgccct 229 <210> 221 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0332 <400> 221 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240 caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300 gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360 aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420 cct 423 <210> 222 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0333 <400> 222 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 223 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0334 <400> 223 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 224 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0335 <400> 224 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 225 <211> 394 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0337 <400> 225 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240 aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300 gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360 aaagcctcca gactaagagg tgttccccat tcgg 394 <210> 226 <211> 561 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0338 <400> 226 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagcgcc actacgggtc 180 taggctgccc atgtaaggag gcaaggcctg gggacacccg agatgcctgg ttataattaa 240 cccagacatg tggctgcccc ccccccccaa cacctgctgc ctgagcctca cccccacccc 300 ggtgcctggg tcttaggctc tgtacaccat ggaggagaag ctcgctctaa aaataaccct 360 gtcaaagccc tactctgcct gatccttttt tcctgagcct cagagctaaa atgcccccga 420 gctctttcct attggctgga aagacgaatt gaagttccct tgcccatgtt aggaggtgta 480 cgcctcctga actaaagata gaaacagctg gcccttccag gcagctaaaa gcctccagac 540 taagaggtgt tccccattcg g 561 <210> 227 <211> 442 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0339 <400> 227 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240 tgtcaaagcc ctactctgcc tgatcctttt ttcctgagcc tcagagctaa aatgcccccg 300 agctctttcc tattggctgg aaagacgaat tgaagttccc ttgcccatgt taggaggtgt 360 acgcctcctg aactaaagat agaaacagct ggcccttcca ggcagctaaa agcctccaga 420 ctaagaggtg ttccccattc gg 442 <210> 228 <211> 412 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0340 <400> 228 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcccggc agacgctcct tatacggccc ggcctcgctc acctgggccg 240 cggccaggag cgccttcttt gggcagcgcc gggccggggc cgcgccgggc ccgacaccca 300 aatatggcga cggccggggc cgcattcctg ggggccgggc ggcgctcccg cccgcctcga 360 taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg ag 412 <210> 229 <211> 394 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0341 <400> 229 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgtcaaag ccctactctg cctgatcctt ttttcctgag cctcagagct 240 aaaatgcccc cgagctcttt cctattggct ggaaagacga attgaagttc ccttgcccat 300 gttaggaggt gtacgcctcc tgaactaaag atagaaacag ctggcccttc caggcagcta 360 aaagcctcca gactaagagg tgttccccat tcgg 394 <210> 230 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0342 <400> 230 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagc 167 <210> 231 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0343 <400> 231 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 232 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0345 <400> 232 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cct 513 <210> 233 <211> 396 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0346 <400> 233 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagccac cgcggtggcg 180 gccgtccgcc ctcggcacca tcctcacgac acccaaatat ggcgacgggt gaggaatggt 240 ggggagttat ttttagagcg gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa 300 aataactccc gggagttatt tttagagcgg aggaatggtg gacacccaaa tatggcgacg 360 gttcctcacc cgtcgccata tttgggtgtc cgccct 396 <210> 234 <211> 358 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0347 <400> 234 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc ctagactagc 240 atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt tataattaac 300 ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat aaccctgc 358 <210> 235 <211> 327 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0348 <400> 235 ctctgtctcc tcaggtgcct ggctgcttcc tagctgggcc tttccttctc ctctataaat 60 accagctctg gtatttcgcc ttggcagctg ttgctgctag ggagacggct ggcttgacat 120 gcatctcctg acaaaacaca aacccgtggt gtgagtgggt gtgggcggtg tgagtagggg 180 gatgaatcag agagggggcc tagactagca tgctgcccat gtaaggaggc aaggcctggg 240 gacacccgag atgcctggtt ataattaacc cagacatgtg gctgcccccc cccccccaac 300 acctgctgcc tctaaaaata accctgc 327 <210> 236 <211> 653 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0349 <400> 236 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc gccactacgg 240 gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc tggttataat 300 taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc tcacccccac 360 cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc taaaaataac 420 cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc caaatatggc 480 gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg gcaggcagca 540 ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg aatggtggac 600 acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc cct 653 <210> 237 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0350 <400> 237 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtttctcc tctataaata 300 cccgctctgg tatttggggt tggcagctgt tgctgccagg gagatggttg ggttgacacc 360 gcggtggcgg ccgtccgccc tcggcaccat cctcacgaca cccaaatatg gcgacgggtg 420 aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag caggtgttgg 480 cgctctaaaa ataactcccg ggagttattt ttagagcgga ggaatggtgg acacccaaat 540 atggcgacgg ttcctcaccc gtcgccatat ttgggtgtcc gccct 585 <210> 238 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0351 <400> 238 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180 tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgccct 229 <210> 239 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0352 <400> 239 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagc tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaatagct cccgggagct atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 240 <211> 344 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0353 <400> 240 tccctaacct cctgcttgcg aggcctctct ctggcctctg agagggtcag tgtcctgccc 60 caacccatga gatgacagac tataatagcc acaggattaa catagcaggc attgtctttc 120 tctgactata gggtgggtat tatgtgttca tcaaccatcc taaaaatacc cggtaaacag 180 gtgcagcccc tgtggctcca gtcccctggg atctgttggc ttctggctgg agatgaagat 240 tagggcagag gagaggtgaa ttagtctcac tgagttccag gcatgagact cgggtgtcct 300 ttggaacctg ggaaatctag attccaggaa acccatctgg aggg 344 <210> 241 <211> 152 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0354 <400> 241 ccatcctaaa aatacccggt aaacaggtgc agcccctgtg gctccagtcc cctgggatct 60 gttggcttct ggctggagat gaagattagg gcagaggaga ggtgaattag tctcactgag 120 ttccaggcat gagactcggg tgtcctttgg aa 152 <210> 242 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0355 <400> 242 agggtcagtg tcctgcccca acccatgaga tgacagacta taatagccac aggattaaca 60 tagcaggcat tg 72 <210> 243 <211> 430 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0356 <400> 243 ctgaggggtg tcagagcaca ggctgaggcc tcttgcctga cgtgggaccc cttggtctgg 60 catttgtcag tgaggcaggc tgggggcagg ccccggagct tggcaggagg tgtaaaccgg 120 ccttggaagg tagggcccca caatggggac agttggatct ctgagggaga cagggaggca 180 tgatcactgc caaatgccca ccaaggacaa ggcacatccc agggagacag acgcagacct 240 ggtgccctct ggacactggc attcctggag gctgatgatg gacagatggg cctggaggtg 300 gctcttcgcc agctggtgtt tcctttggac ttcctcagtg tctttggaga agcagagccc 360 taagaataag cagctgccca taaaatctaa taccagccaa gcatctcagg aattcatgga 420 ttgtctccat 430 <210> 244 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0358 <400> 244 ttctgagtcc tctaaggtcc ctcactccca actcagcccc atgtcctgtc aattcccact 60 cagtgtctga tctccttctc ctcacctttc ccatctcccg tttgacccaa gcttcctgag 120 ctctcctccc attccccttt ttggagtcct cctcctctcc cagaacccag taataagtgg 180 gctcctccct ggcctggacc cccgtggtaa ccctataagg cgaggcagct gctgtctgag 240 gcagggaggg gctggtgtgg gaggctaagg gcagctgcta agtttagggt ggctccttct 300 ctcttcttag agacaacagg tggctggggc ctcagtgccc agaaaagaaa atgtcttaga 360 ggtatcggca tgggcctgga ggagggggga cagggcaggg ggaggcatct tcctcaggac 420 atcgggtcct agagg 435 <210> 245 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0359 <400> 245 cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60 gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtg 108 <210> 246 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0361 <400> 246 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180 tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgccct 229 <210> 247 <211> 355 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0362 <400> 247 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagcaca cccaaatatg 180 gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 240 caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgag ctctataaat 300 acccgctctg gtatttgggg ttttgaaccc gtcgccatat ttgggtgtcc gccct 355 <210> 248 <211> 418 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0363 <400> 248 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc acacccaaat 240 atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa ggtgggcagg 300 cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc gagctctata 360 aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg tccgccct 418 <210> 249 <211> 459 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0364 <400> 249 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc caccgcggtg 240 gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg ggtgaggaat 300 ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg ttggcgctct 360 aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc aaatatggcg 420 acggttcctc acccgtcgcc atatttgggt gtccgccct 459 <210> 250 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0365 <400> 250 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 251 <211> 337 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0366 <400> 251 cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60 gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtgca ccgcggtggc 120 ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 180 tggggagtta tttttagagc ggtgaggaag gtgggcaggc agcaggtgtt ggcgctctaa 240 aaataactcc cgggagttat ttttagagcg gaggaatggt ggacacccaa atatggcgac 300 ggttcctcac ccgtcgccat atttgggtgt ccgccct 337 <210> 252 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0367 <400> 252 cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60 gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtg 108 <210> 253 <211> 302 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0368 <400> 253 cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60 gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtggc cactacgggt 120 ctaggctgcc catgtaagga ggcaaggcct ggggacaccc gagatgcctg gttataatta 180 acccagacat gtggctgccc ccccccccca acacctgctg cctgagcctc acccccaccc 240 cggtgcctgg gtcttaggct ctgtacacca tggaggagaa gctcgctcta aaaataaccc 300 tg 302 <210> 254 <211> 252 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0369 <400> 254 cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60 aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120 gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240 tttagagcgg ag 252 <210> 255 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0370 <400> 255 cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60 aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120 gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240 tttagagcgg agcgacaccc aaatatggcg acgggtgagg aatggtgggg agttattttt 300 agagcggtga ggaaggtggg caggcagcag gtgttggcgc tctaaaaata actcccggga 360 gttattttta gagcggag 378 <210> 256 <211> 218 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0371 <400> 256 taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60 gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120 aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180 cggttcctca cccgtcgcca tatttgggtg tccgccct 218 <210> 257 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0372 <400> 257 gacacccaaa tatggcgacg ggtgaggaat ggtggggagt tatttttaga gcggtgagga 60 aggtgggcag gcagcaggtg ttggcgctct aaaaataact cccgggagtt atttttagag 120 cggaggaatg gtggacaccc aaatatggcg acggttcctc acccgtcgcc atatttgggt 180 gtccgccct 189 <210> 258 <211> 226 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0373 <400> 258 taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60 gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120 aaaataactc ccgggagtta tttttagagc gctctaaggt ccctcactcc caactcagcc 180 ccatgtcctg tcaattcacc cgtcgccata tttgggtgtc cgccct 226 <210> 259 <211> 226 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0374 <400> 259 ctctaaggtc cctcactccc aactcagccc catgtcctgt caattcgaca cccaaatatg 60 gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 120 caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgta aggcgaggca 180 gctgctgtct gaggcagacc cgtcgccata tttgggtgtc cgccct 226 <210> 260 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0375 <400> 260 taaggcgagg cagctgctgt ctgaggcaga ggctaagggc agctgctaag tttagggtct 60 ctaaggtccc tcactcccaa ctcagcccca tgtcctgtca attccgacac ccaaatatgg 120 cgacgggtga ggaatggtgg ggagttattt ttagagcagg cagcaggtgt tggcgctcta 180 aaaataactc ccgggagtta tttttagagc gacccgtcgc catatttggg tgtccgccct 240 240 <210> 261 <211> 266 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0376 <400> 261 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgataaat acccgctctg gtatttgggg tactaaaaat agaacgacta 240 tttttaggct tttctggcag ctggcc 266 <210> 262 <211> 268 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0377 <400> 262 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgataaat acccgctctg gtatttgggg cgaggtacta taaataccct 240 tagaggtatt ttatcttggc agctaggt 268 <210> 263 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0378 <400> 263 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttactaa aaatagaacg 300 actattttta ggcttttctg gcagctggcc ctgccagaca gagttcctca gtaa 354 <210> 264 <211> 356 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0379 <400> 264 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcgaggt actataaata 300 cccttagagg tattttatct tggcagctag gtctgccaga cagagttcct cagtaa 356 <210> 265 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0380 <400> 265 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttactaa aaatagaacg 300 actattttta ggcttttctg gcagctggcc ctgccagaca gataaacgag ctat 354 <210> 266 <211> 356 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0381 <400> 266 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcgaggt actataaata 300 cccttagagg tattttatct tggcagctag gtctgccaga cagataaacg agctat 356 <210> 267 <211> 356 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0382 <400> 267 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttaaacg agctattagt 300 tatgaggtcc gtagattgaa taaacgagct attagttatg aggtccgtag attgaa 356 <210> 268 <211> 163 <212> DNA <213> Artificial Sequence <220> <223> CRM_SKM_20 <400> 268 atttttaaag actgaggaat taggcacctg tcatttttgc cagctggtgt agatgttaaa 60 aattactgtc actcttccgc ctgctacttt attttgcacc tgctgttact tgagttacag 120 gcatttcaca catggtaatt taataaggtt agttcccatg aca 163 <210> 269 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0357 <400> 269 tctgagggag acagggaggc atgatcactg ccaaatgccc accaaggaca aggcacatcc 60 cagggagaca gacgcagacc tggtgccctc tggacactgg cattcctgga g 111 <210> 270 <211> 245 <212> DNA <213> Artificial Sequence <220> <223> CRE0005 <400> 270 actcgggggc caggcactgg cgctgacgca ggctagcagg gcgccactgg ctggtcccca 60 cccacctcgg tgggttgggg gatgggcgca ccagcccctc ctgggtgagc cctagcctgg 120 ggcttcctat ttcgggagcc gggggcgtgg gccacgtctc ctcatgtgat gcgagggcta 180 tttaaagcgg cagcccgggc agggagccgc cgtcggagcc cttgcacgcc tgctctcttg 240 tagct 245 <210> 271 <211> 205 <212> DNA <213> Artificial Sequence <220> <223> CRE0009 <400> 271 ctgagtcctt ttgcatacat ttttcaaatg ataactcact ctacccaccc cccttcccta 60 cccccaaggc gatttattga aaaaaccacc ttatatggta atattgctaa cacaccgtca 120 gctggccttt ttagggactt tgtttaaaga agatccgcct ctggggtttt atattgctct 180 ggtattcatg ccaaagacac accag 205 <210> 272 <211> 292 <212> DNA <213> Artificial Sequence <220> <223> CRE0010 otherwise known as: CRE0010_ITGB1BP2 <400> 272 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc gg 292 <210> 273 <211> 524 <212> DNA <213> Artificial Sequence <220> <223> CRE0010_ALDOA <400> 273 gccgcgaaga ccggaagctg gggcggcccc gggccgcgcg cgctgggcct gggaggcgaa 60 actcagcttc cttcgtttcc gacttttcca tccgcgtcct ccacttcccc gttccgccct 120 cccccattgc caacattctg gctgagtcac ggcgccccag agcgcgccag gctgggggaa 180 aggagcagaa gggagggccc tagcgacccg cgggatgtgg tccgagtcac gtccgagggg 240 ggtggggagg gatcgtgttc tcggcgcccg ccccttccta gcgcggcctc tgggctgcgc 300 ctctcggggg cggcccgtag cccagtccgt cgcctgccat tggacgccgc ccgctcctcg 360 taaaggaaaa agctcggcgg agggcggagt ggtgccttta aaaggccggg cgccgccttc 420 cgcctgcccg cctcctgcgc cgccccttcc gaggctaaat cggctgcgtt cctctcggaa 480 cgcgccgcag aaggggtcct ggtgacgagt cccgcgttct ctcc 524 <210> 274 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> CRE0034 <400> 274 ccatgttccc ggcgaagggc cagctgtccc ccgccagcta gactcagcac ttagtttagg 60 aaccagtgag caagtcagcc cttggggcag cccatacaag gccatggggc tgggcaagct 120 gcacgcctgg gtccggggtg ggcacggtgc ccgggcaacg agctgaaagc tcatctactc 180 tcaggggccc ctccctgggg acagcccctc ctggctagtc acaccctgta ggctcctcta 240 tataacccag gggcacaggg gctgcccccg ggtcaccacc acctccacag cacagacaga 300 cactcaggag ccagc 315 <210> 275 <211> 170 <212> DNA <213> Artificial Sequence <220> <223> CRE0037 <400> 275 aggtccctat atggttgtgt tagagtgaac ggccagcttc agcccgtctt tgctccttgt 60 ttgggaagcg agtgggaggg gatcagagca aggggctata taacccttca gcgttcagcc 120 tcccgggaca ccacccaccc agagtggaga agcccagcca gtcgctgtca 170 <210> 276 <211> 218 <212> DNA <213> Artificial Sequence <220> <223> CRE0046 <400> 276 cccggcagac gctccttata cggcccggcc tcgctcacct gggccgcggc caggagcgcc 60 ttctttgggc agcgccgggc cggggccgcg ccgggcccga cacccaaata tggcgacggc 120 cggggccgca ttcctggggg ccgggcggcg ctcccgcccg cctcgataaa aggctccggg 180 gccggcggcg gcccacgagc tacccggagg agcgggag 218 <210> 277 <211> 249 <212> DNA <213> Artificial Sequence <220> <223> CRE0048 <400> 277 gactcagggg cgcaggcctc ttgcggggga gctggcctcc ccgcccccac ggccacgggc 60 cgccctttcc tggcaggaca gcgggatctt gcagctgtca ggggagggga ggcgggggct 120 gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc ctcgccgcat 180 ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc 240 gccgtcacc 249 <210> 278 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> CRE0049 <400> 278 catgttcccg gcgaagggcc agctgtcccc cgccagctag actcagcact tagtttagga 60 accagtgagc aagtcagccc ttggggcagc ccatacaagg ccatggggct gggcaagctg 120 cacgcctggg tccggggtgg gcacggtgcc cgggcaacga gctgaaagct catctgctct 180 caggggcccc tccctgggga cagcccctcc tggctagtca caccctgtag gctcctctat 240 ataacccagg ggcacagggg ctgccctcat tctaccacca cctccacagc acagacagac 300 actcaggagc cagccagc 318 <210> 279 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> CRE0053 (SRL_mp) <400> 279 caccgcctgc tgccacggcc ggccgtataa atagaggcga ggagcagctg ggctctcttg 60 gcagtcacc 69 <210> 280 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> CRE0053. 2 SRL_mp <400> 280 ccaccgcctg ctgccacggc cggccgtata aatagaggcg aggagcagct gggctctctt 60 ggcagtcacc 70 <210> 281 <211> 451 <212> DNA <213> Artificial Sequence <220> <223> CRE0054 <400> 281 ccagctgcct gccccctgcc tggcacagcc cgtacctggc cgcacgctcc ctcacaggtg 60 aagctcgaaa actccgtccc cgtaaggagc cccgctgccc cccgaggcct cctccctcac 120 gcctcgctgc gctcccggct cccgcacggc cctgggagag gcccccaccg cttcgtcctt 180 aacgggcccg gcggtgccgg gggattattt cggccccggc cccggggggg cccggcagac 240 gctccttata cggcccggcc tcgctcacct gggccgcggc caggagcgcc ttctttgggc 300 agcgccgggc cggggccgcg ccgggcccga cacccaaata tggcgacggc cggggccgca 360 ttcctggggg ccgggcggcg ctcccgcccg cctcgataaa aggctccggg gccggcggcg 420 gcccacgagc tacccggagg agcgggaggc g 451 <210> 282 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> CRE0055 <400> 282 tcaaagccct actctgcctg atcctttttt cctgagcctc agagctaaaa tgcccccgag 60 ctctttccta ttggctggaa agacgaattg aagttccctt gcccatgtta ggaggtgtac 120 gcctcctgaa ctaaagatag aaacagctgg cccttccagg cagctaaaag cctccagact 180 aagaggtgtt ccccattcgg 200 <210> 283 <211> 251 <212> DNA <213> Artificial Sequence <220> <223> CRE0056 <400> 283 tcaaagccct actctgcctg atcctttttt cctgagcctc agagctaaaa tgcccccgag 60 ctctttccta ttggctggaa agacgaattg aagttccctt gcccatgtta ggaggtgtac 120 gcctcctgaa ctaaagatag aaacagctgg cccttccagg cagctaaaag cctccagact 180 aagaggtgtt ccccattcgg cagccagact ccttgaaata ccctttcagt aatcattcaa 240 ccaacgcttc c 251 <210> 284 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> CRE0070 <400> 284 cggccggggc cgcattcctg ggggccgggc ggtgctcccg cccgcctcga taaaaggctc 60 cggggccggc ggcggcccac gagctacccg gaggagcggg aggcg 105 <210> 285 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> CRE0070.2 <400> 285 cggccggggc cgcattcctg ggggccgggc ggtgctcccg cccgcctcga taaaaggctc 60 cggggccggc ggcggcccac 80 <210> 286 <211> 343 <212> DNA <213> Artificial Sequence <220> <223> CRE0072 <400> 286 gtttcttagc agctgctgct gtgtccaagg cttggaattg ctgtggtgaa tctaaaactg 60 tctcagtagt ggtgagctga cctcacccaa gttcaaagcc ctactctgcc tgatcctttt 120 ttcctgagcc tcagagctaa aatgcccccg agctctttcc tattggctgg aaagacgaat 180 tgaagttccc ttgcccatgt taggaggtgt acgcctcctg aactaaagat agaaacagct 240 ggcccttcca ggcagctaaa agcctccaga ctaagaggtg ttccccattc ggcagccaga 300 ctccttgaaa taccctttca gtaatcattc aaccaacgct tcc 343 <210> 287 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> SKM_14 <400> 287 ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgct gccagggaga 60 tggttgggtt gacgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg 120 agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc 180 ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg cgccgtcacc 240 240 <210> 288 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> SKM_18.2 <400> 288 ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 60 gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 120 ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgc 168 <210> 289 <211> 242 <212> DNA <213> Artificial Sequence <220> <223> SKM_18 <400> 289 ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg 60 gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 120 ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 180 ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca 240 cc 242 <210> 290 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> SKM_20 <400> 290 atttttaaag actgaggaat taggcacctg tcatttttgc cagctggtgt agatgttaaa 60 aattactgtc actcttccgc ctgctacttt attttgcacc tgctgttact tgagttacag 120 gcatttcaca catggtaatt taataaggtt agttcccatg acacaccgcc tgctgccacg 180 gccggccgta taaatagagg cgaggagcag ctgggctctc ttggcagtca cc 232 <210> 291 <211> 620 <212> DNA <213> Artificial Sequence <220> <223> CRE0011_RSV promoter <400> 291 caattctcat gtttgacagc ttatcatcgc agatccgtat ggtgcactct cagtacaatc 60 tgctctgatg ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct 120 gagtagtgcg cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg 180 aagaatctgc ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg 240 cgtatctgag gggactaggg tgtgtttagg cgaaaagcgg ggcttcggtt gtacgcggtt 300 aggagtcccc tcaggatata gtagtttcgc ttttgcatag ggagggggaa atgtagtctt 360 atgcaatact cttgtagtct tgcaacatgg taacgatgag ttagcaacat gccttacaag 420 gagagaaaaa gcaccgtgca tgccgattgg tggaagtaag gtggtacgat cgtgccttat 480 taggaaggca acagacgggt ctgacatgga ttggacgaac cactgaattc cgcattgcag 540 agatattgta tttaagtgcc tagctcgata caataaacgc catttgacca ttcaccacat 600 tggtgtgcac ctccaagctg 620 <210> 292 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> DES_mp_v1 <400> 292 cgggatcttg cagctgtcag gggaggggag gcgggggctg atgtcaggag ggatacaaat 60 agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc cactctccgg ccggccgcct 120 gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg ccgtcacc 168 <210> 293 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.3 <400> 293 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 294 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.4 <400> 294 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgaggtaaac gagctattag 180 ttatgaggtc cgtagattga acccgtcgcc atatttgggt gtccgccct 229 <210> 295 <211> 252 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.6 <400> 295 cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60 aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120 gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240 tttagagcgg ag 252 <210> 296 <211> 218 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.8 <400> 296 taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60 gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120 aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180 cggttcctca cccgtcgcca tatttgggtg tccgccct 218 <210> 297 <211> 218 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.9 <400> 297 aggctaaggg cagctgctaa gtttagggtg acacccaaat atggcgacgg gtgaggaatg 60 gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120 aaaataactc ccgggagtta tttttagagc ggaggaatgg tggacaccca aatatggcga 180 cggttcctca cccgtcgcca tatttgggtg tccgccct 218 <210> 298 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> CRE0077 <400> 298 tctgagggag acagggaggc atgatcactg ccaaatgccc accaaggaca aggcacatcc 60 cagggagaca gacgcagacc tggtgccctc tggacactgg cattcctgga g 111 <210> 299 <211> 192 <212> DNA <213> Artificial Sequence <220> <223> HBB <400> 299 caggtaggga ctgtactagc agctacaatc cagctaccat tctgctttta ttttatggtt 60 gggataaggc tggattattc tgagtccaag ctaggccctt ttgctaatca tgttcatacc 120 tcttatcttc ctcccacagc tcctgggcaa cgtgctggtc tgtgtgctgg cccatcactt 180 tggcaaagaa tt 192 <210> 300 <211> 253 <212> DNA <213> Artificial Sequence <220> <223> CRE0099 <400> 300 ccactacggg tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct 60 ggttataatt aacccagaca tgtggctgcc cccccccccc caacacctgc tgcctctaaa 120 aataaccctg tccctggtgg atcccctgca tgcgaagatc ttcgaacaag gctgtggggg 180 actgagggca ggctgtaaca ggcttggggg ccagggctta tacgtgcctg ggactcccaa 240 agtattactg ttc 253 <210> 301 <211> 274 <212> DNA <213> Artificial Sequence <220> <223> CRE0016 <400> 301 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaa 274 <210> 302 <211> 200 <212> DNA <213> Artificial Sequence <220> <223> CRE0018 <400> 302 ctgtgtgttt ctgtggctga gtcagatgga ggagtcctca tgtttcactg cttagcagtt 60 tttgtccttc ctagtacccg ttcccagccc acaagatgca gaaagagctg ttgctagcgt 120 gagttatttt tgtcagctga gtcaccacgc cagaaagcaa gaaatgaccc gctttatgtc 180 tgctctgagg agctggaacc 200 <210> 303 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CRE0020 <400> 303 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagt 284 <210> 304 <211> 160 <212> DNA <213> Artificial Sequence <220> <223> CRE0025 <400> 304 gcgccctgat gaatatgcat cgcggcgcgc ccgcccccgg ctcctccttt cggtttcctt 60 cccgccgcca ggcggaagcg aagagccgcg cttcccgcgc gcccaggccg gccgtggtag 120 ggtggggcgg ggcgggccgc gagccggaga aagagaaagc 160 <210> 305 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> CRE0027 <400> 305 tacatcattt acctagaaaa gaggacagct gtcctttccc aaagctccgg tgaccctgcc 60 ccgcccagtg tgactagccc aggttggtga ttctgatctg ttgccaaacc aaactggctc 120 cccggggagc catttggtaa tgttccctgg agtcatttcc ttgcgaagca ttccttttcg 180 gtgagaggac atttttttca tccctgataa acaaccacag cctgcgccag 230 <210> 306 <211> 211 <212> DNA <213> Artificial Sequence <220> <223> CRE0028 <400> 306 taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60 gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120 atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180 acatttcttc ctgattcgca tacgccgcgg c 211 <210> 307 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> CRE0029 <400> 307 ctctgtctcc tcaggtgcct ggctcccagt ccccagaacg cctctcctgt accttgcttc 60 ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc cttggcagct 120 gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac aaacccgtgg 180 tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc 230 <210> 308 <211> 216 <212> DNA <213> Artificial Sequence <220> <223> CRE0031 <400> 308 taagtccggg cagggtcctg tccataaaag gcttttcccg ggccggctcc ccgccggcag 60 cgtgccccgc cccggcccgc tccatctcca aagcatgcag agaatgtctc ggcagccccg 120 gtagactgct ccaacttggt gtctttcccc aaatatggag cctgtgtgga gtcactgggg 180 gagccggggg tggggagcgg agccggcttc ctctag 216 <210> 309 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> CRE0033 <400> 309 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctg 189 <210> 310 <211> 194 <212> DNA <213> Artificial Sequence <220> <223> CRE0035 <400> 310 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctg 194 <210> 311 <211> 245 <212> DNA <213> Artificial Sequence <220> <223> CRE0036 <400> 311 ctgagatttt cctagcattt tgtgtttcat gactaaatat ggtttgtgtt tcaagaccaa 60 tgagctggga actgtactgt tctttcccct cccatcaact catttttggc acaagacgca 120 ctctagtcag ttggagcaaa tcccctgacc cgggtgcagt tccaaaagca gacactcgag 180 cgtgttttac ctaattagga aatgctttgc tccaaaccga actgctcatt caggttagag 240 aggag 245 <210> 312 <211> 231 <212> DNA <213> Artificial Sequence <220> <223> CRE0047 <400> 312 cccacccatg cctcctcagg taccccctgc cccccacagc tcctctcctg tgccttgttt 60 cccagccatg cgttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 120 ctgccaggga gatggttggg ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg 180 tgtgggcgtg ggtggtgtga gtagggggat gaatcaggga gggggcgggg g 231 <210> 313 <211> 128 <212> DNA <213> Artificial Sequence <220> <223> CRE0050 <400> 313 ctagactagc atgctgccca tgtaaggagg caaggcctgg ggacacccga gatgcctggt 60 tataattaac ccagacatgt ggctgccccc ccccccccaa cacctgctgc ctctaaaaat 120 aaccctgc 128 <210> 314 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> CRE0051 <400> 314 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 240 <210> 315 <211> 163 <212> DNA <213> Artificial Sequence <220> <223> CRE0052 <400> 315 atttttaaag actgaggaat taggcacctg tcatttttgc cagctggtgt agatgttaaa 60 aattactgtc actcttccgc ctgctacttt attttgcacc tgctgttact tgagttacag 120 gcatttcaca catggtaatt taataaggtt agttcccatg aca 163 <210> 316 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> HTMB ev_4 <400> 316 ataaataccc gctctggtat ttgggg 26 <210> 317 <211> 125 <212> DNA <213> Artificial Sequence <220> <223> CRE0059 <400> 317 cccctgcccc ccacagctcc tctcctgtgc cttgtttccc agccatgcgt tctcctctat 60 aaatacccgc tctggtattt ggggttggca gctgttgctg ccagggagat ggttgggttg 120 acatg 125 <210> 318 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> CRE0060 <400> 318 ctctataaat acccgctctg gtatttgggg tt 32 <210> 319 <211> 409 <212> DNA <213> Artificial Sequence <220> <223> CRE0065_short <400> 319 gtgtgtgtgt gtgcgcccgc gtgtgcgtgt gtgcatgtat gtgtgtgtgt ggtgggtttt 60 attgttgttt tagcggggct gctccaggag tggggctgcg ccggtcagat gcagccggca 120 cggccccggg gtcgcgcgat cgccccttcc ccgccctcgg attggcctgg cccgcggcgg 180 ggctgccccg gaaccgccac ccagcagcgc acccttccgc gcccggcccg cgctcctcct 240 gcagtcgcct ccctggcttt ctctttctcc ggctcgcggc ccgccccgcc ccaccctacc 300 acggccggcc tgggcgcgcg ggaagcgcgg ctcttcgctt ccgcctggcg gcgggaagga 360 aaccgaaagg aggagccggg ggcgggcgcg ccgcgatgca tattcatca 409 <210> 320 <211> 167 <212> DNA <213> Artificial Sequence <220> <223> CRE0069 <400> 320 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagccccag ggccgctccc tgagggcaca acactgtggg ggcccagcca ggcccacatt 120 cctttccaga ggccagctct ccatttatag cccctgggca gagcagc 167 <210> 321 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRE0071 <400> 321 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 322 <211> 188 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.5 <400> 322 acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60 ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120 gagctctata aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg 180 tccgccct 188 <210> 323 <211> 189 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.2 <400> 323 gacacccaaa tatggcgacg ggtgaggaat ggtggggagt tatttttaga gcggtgagga 60 aggtgggcag gcagcaggtg ttggcgctct aaaaataact cccgggagtt atttttagag 120 cggaggaatg gtggacaccc aaatatggcg acggttcctc acccgtcgcc atatttgggt 180 gtccgccct 189 <210> 324 <211> 344 <212> DNA <213> Artificial Sequence <220> <223> CRE0073 <400> 324 tccctaacct cctgcttgcg aggcctctct ctggcctctg agagggtcag tgtcctgccc 60 caacccatga gatgacagac tataatagcc acaggattaa catagcaggc attgtctttc 120 tctgactata gggtgggtat tatgtgttca tcaaccatcc taaaaatacc cggtaaacag 180 gtgcagcccc tgtggctcca gtcccctggg atctgttggc ttctggctgg agatgaagat 240 tagggcagag gagaggtgaa ttagtctcac tgagttccag gcatgagact cgggtgtcct 300 ttggaacctg ggaaatctag attccaggaa acccatctgg aggg 344 <210> 325 <211> 152 <212> DNA <213> Artificial Sequence <220> <223> CRE0074 <400> 325 ccatcctaaa aatacccggt aaacaggtgc agcccctgtg gctccagtcc cctgggatct 60 gttggcttct ggctggagat gaagattagg gcagaggaga ggtgaattag tctcactgag 120 ttccaggcat gagactcggg tgtcctttgg aa 152 <210> 326 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> CRE0075 <400> 326 agggtcagtg tcctgcccca acccatgaga tgacagacta taatagccac aggattaaca 60 tagcaggcat tg 72 <210> 327 <211> 430 <212> DNA <213> Artificial Sequence <220> <223> CRE0076 <400> 327 ctgaggggtg tcagagcaca ggctgaggcc tcttgcctga cgtgggaccc cttggtctgg 60 catttgtcag tgaggcaggc tgggggcagg ccccggagct tggcaggagg tgtaaaccgg 120 ccttggaagg tagggcccca caatggggac agttggatct ctgagggaga cagggaggca 180 tgatcactgc caaatgccca ccaaggacaa ggcacatccc agggagacag acgcagacct 240 ggtgccctct ggacactggc attcctggag gctgatgatg gacagatggg cctggaggtg 300 gctcttcgcc agctggtgtt tcctttggac ttcctcagtg tctttggaga agcagagccc 360 taagaataag cagctgccca taaaatctaa taccagccaa gcatctcagg aattcatgga 420 ttgtctccat 430 <210> 328 <211> 435 <212> DNA <213> Artificial Sequence <220> <223> CRE0078 <400> 328 ttctgagtcc tctaaggtcc ctcactccca actcagcccc atgtcctgtc aattcccact 60 cagtgtctga tctccttctc ctcacctttc ccatctcccg tttgacccaa gcttcctgag 120 ctctcctccc attccccttt ttggagtcct cctcctctcc cagaacccag taataagtgg 180 gctcctccct ggcctggacc cccgtggtaa ccctataagg cgaggcagct gctgtctgag 240 gcagggaggg gctggtgtgg gaggctaagg gcagctgcta agtttagggt ggctccttct 300 ctcttcttag agacaacagg tggctggggc ctcagtgccc agaaaagaaa atgtcttaga 360 ggtatcggca tgggcctgga ggagggggga cagggcaggg ggaggcatct tcctcaggac 420 atcgggtcct agagg 435 <210> 329 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> CRE0079 <400> 329 cctccctggc ctggaccccc gtggtaaccc tataaggcga ggcagctgct gtctgaggca 60 gggaggggct ggtgtgggag gctaagggca gctgctaagt ttagggtg 108 <210> 330 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> 48 bp <400> 330 ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttg 48 <210> 331 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.7 <400> 331 cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag agcggtgagg 60 aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga 120 gcggagcgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 180 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 240 tttagagcgg agcgacaccc aaatatggcg acgggtgagg aatggtgggg agttattttt 300 agagcggtga ggaaggtggg caggcagcag gtgttggcgc tctaaaaata actcccggga 360 gttattttta gagcggag 378 <210> 332 <211> 226 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.10 <400> 332 taaggcgagg cagctgctgt ctgaggcagg acacccaaat atggcgacgg gtgaggaatg 60 gtggggagtt atttttagag cggtgaggaa ggtgggcagg cagcaggtgt tggcgctcta 120 aaaataactc ccgggagtta tttttagagc gctctaaggt ccctcactcc caactcagcc 180 ccatgtcctg tcaattcacc cgtcgccata tttgggtgtc cgccct 226 <210> 333 <211> 226 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.11 <400> 333 ctctaaggtc cctcactccc aactcagccc catgtcctgt caattcgaca cccaaatatg 60 gcgacgggtg aggaatggtg gggagttatt tttagagcgg tgaggaaggt gggcaggcag 120 caggtgttgg cgctctaaaa ataactcccg ggagttattt ttagagcgta aggcgaggca 180 gctgctgtct gaggcagacc cgtcgccata tttgggtgtc cgccct 226 <210> 334 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.12 <400> 334 taaggcgagg cagctgctgt ctgaggcaga ggctaagggc agctgctaag tttagggtct 60 ctaaggtccc tcactcccaa ctcagcccca tgtcctgtca attccgacac ccaaatatgg 120 cgacgggtga ggaatggtgg ggagttattt ttagagcagg cagcaggtgt tggcgctcta 180 aaaataactc ccgggagtta tttttagagc gacccgtcgc catatttggg tgtccgccct 240 240 <210> 335 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> DES_MT_Enhancer_48bp_v2 <400> 335 tactaaaaat agaacgacta tttttaggct tttctggcag ctggcc 46 <210> 336 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> DES_MT_Enhancer_48bp_v3 <400> 336 cgaggtacta taaataccct tagaggtatt ttatcttggc agctaggt 48 <210> 337 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> DES_MT_Enhancer_72 bp_v2 <400> 337 tactaaaaat agaacgacta tttttaggct tttctggcag ctggccctgc cagacagagt 60 tcctcagtaa 70 <210> 338 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> DES_MT_Enhancer_72 bp_v3 <400> 338 cgaggtacta taaataccct tagaggtatt ttatcttggc agctaggtct gccagacaga 60 gttcctcagt aa 72 <210> 339 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> DES_MT_Enhancer_72 bp_v4 <400> 339 tactaaaaat agaacgacta tttttaggct tttctggcag ctggccctgc cagacagata 60 aacgagctat 70 <210> 340 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> DES_MT_Enhancer_72 bp_v5 <400> 340 cgaggtacta taaataccct tagaggtatt ttatcttggc agctaggtct gccagacaga 60 taaacgagct at 72 <210> 341 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> DES_MT_Enhancer_72bp_v6 <400> 341 ttaaacgagc tattagttat gaggtccgta gattgaataa acgagctatt agttatgagg 60 tccgtagatt gaa 73 <210> 342 <211> 388 <212> DNA <213> Artificial Sequence <220> <223> SP0407 <400> 342 agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60 gctgtggagt cagctggctt ccaaggtgcc tgggatcttt tcgttctgcc cttggctcct 120 gccctaactg gcaaacccca ataaataccc gctctggtat ttggggttct cctctataaa 180 tacccgctct ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg 240 ggaggcgggg gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct 300 cccctcgccg catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc 360 cagcctcgcc cgcgccgtca ccgccacc 388 <210> 343 <211> 306 <212> DNA <213> Artificial Sequence <220> <223> SP0408 <400> 343 agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60 gctgtggagt cagctggctt ccaaggtgac aatccctgcc tgggatcttt tcgttctgcc 120 cttggctcct gccctaactg gcaaacccca ccccctcatc accagctttc aagtatcaga 180 ttgcgtttcc ggcctcttct ttccaaaccc ctaaaccacc agcacctgtc cccttgcttg 240 cctcattcca cagccaacag gctgaaggga agacaaaccc tagtcagtca gaggtggggg 300 gccacc 306 <210> 344 <211> 344 <212> DNA <213> Artificial Sequence <220> <223> SP0409 <400> 344 ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60 gtggcagtgg ggggtgagga gcatctaaaa atagccataa atacccgctc tggtatttgg 120 ggttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg cgggatcttg 180 cagctgtcag gggaggggag gcgggggctg atgtcaggag ggatacaaat agtgccgacg 240 gctgggggcc ctgtctcccc tcgccgcatc cactctccgg ccggccgcct gcccgccgcc 300 tcctccgtgc gcccgccagc ctcgcccgcg ccgtcaccgc cacc 344 <210> 345 <211> 588 <212> DNA <213> Artificial Sequence <220> <223> SP0410 <400> 345 agtgattctc cctcaagacc ttataaaacc actttaaccc tcaatgggat aatatctagt 60 acattgtcat gggaactaac cttattaaat taccatgtgt gaaatgcctg taactcaagt 120 aacagcaggt gcaaaataaa gtagcaggcg gaagagtgac agtaattttt aacatctaca 180 ccagctggca aaaatgacag gtgcctaatt cctcagtctt taaaaataac ttttgagaag 240 cctacacagc ataagcaaat attttcaagt ttatttttta gctatcttcg agttaccttc 300 ctgacaaaat gtaataatat acactgattt ttgcagaaaa ataaataccc gctctggtat 360 ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct gttgcgggat 420 cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 480 gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 540 cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 588 <210> 346 <211> 505 <212> DNA <213> Artificial Sequence <220> <223> SP0411 <400> 346 ataacttcag cacactgtca tgggacctaa ccttattaaa ttaccatgtg tgaagcgtcc 60 ataactcaag taacagcagg tgcaaaaatg gagctgcagg cagaagagtg gtagtcattt 120 ttacaaatcc ccaccagctg gcgaaacaac aggtgcctaa ttcctcagct tttaaaaata 180 acttttaaaa agcctgtgct gcataagcaa atattttcaa gtttgttttt aaaccatctt 240 caagttacct tggtcacata aatacccgct ctggtatttg gggttctcct ctataaatac 300 ccgctctggt atttggggtt ggcagctgtt gcgggatctt gcagctgtca ggggagggga 360 ggcgggggct gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc 420 ctcgccgcat ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag 480 cctcgcccgc gccgtcaccg ccacc 505 <210> 347 <211> 528 <212> DNA <213> Artificial Sequence <220> <223> SP0412 <400> 347 agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60 cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120 agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180 ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240 aacccgcgcc tgagtcacag ggccctgaat tggcccctct ataaataccc gctctggtat 300 ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct gttgcgggat 360 cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 420 gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 480 cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 528 <210> 348 <211> 554 <212> DNA <213> Artificial Sequence <220> <223> SP0413 <400> 348 agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60 cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120 agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180 ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240 aacccgcgcc tgagtcacag ggccctgaat tggcccctct attattcacc tgttcgcctt 300 agatgaagaa tcaaggaaca gcagctctag ggggttggga ggagttaggg tccggccctg 360 ccccagacct ctcagtgtcc aatttctctg tgtcagctgt gtttctcagc tgtccacttt 420 cctccagccc tgtcatttca gccctgacac caaggcagga ggctaggagg tctacaaata 480 gcgactgggt agctggtgtg aacacagggg gtactggggg ggcttagccc ccaaggaaga 540 ggaccagtgc cacc 554 <210> 349 <211> 621 <212> DNA <213> Artificial Sequence <220> <223> SP0414 <400> 349 agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60 cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120 agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180 ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240 aacccgcgcc tgagtcacag ggccctgaat tggcccctct agactggggc aggtgcaggc 300 tggattgggt ttccagaggc tatatatata aaggctgccg ggagccccag ggccgctccc 360 tgagggcaca acactgtggg ggcccagcca ggcccacatt cctttccaga ggccagctct 420 ccatttatag cccctgggca gagcagccgg gatcttgcag ctgtcagggg aggggaggcg 480 ggggctgatg tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg 540 ccgcatccac tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc 600 gcccgcgccg tcaccgccac c 621 <210> 350 <211> 498 <212> DNA <213> Artificial Sequence <220> <223> SP0415 <400> 350 atggtgcttc caagtctgct cccgggacgt ttcctgttct tggaacagct gcaccagcct 60 ggggtaccct cctgctactt gatcctatag ggaggtgtcc agtggctgtg ggcaattttc 120 agatgacctt gttcgtctga cgtcattaga tcgctatttt tggctttgct gtttatgctg 180 cagaagttgg gctggaatgg gagaggagga atgaaggagg ggctgctctt ggtttcccat 240 tgttccaggg ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct 300 ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg 360 gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg 420 catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc 480 cgcgccgtca ccgccacc 498 <210> 351 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> SP0416 <400> 351 actgatgtgg aaggggttat atataggaag atgtgtagga agaaaaaggt agagagctct 60 cctcagaggg tgggggatta tgggtagcca gagggagcct gggttagtgg agttgaagcc 120 ctagtcttgg gtgctttgta gcatcagaag cctctggagc ctttgctgac acctgcctga 180 tgtacggagc catctgtggg tgtctgtgtg ctggaggatt gcccacagct atgattcaga 240 gatgctcatg ttgttgccca agcaattgac agatgatgtt tcaggcttgg agatggcagg 300 atgggagcaa agagaagcca ggtcaggaaa gaacgtgccg ttctggccct agtggggaat 360 tctgggcctt ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct 420 ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg 480 gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg 540 catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc 600 cgcgccgtca ccgccacc 618 <210> 352 <211> 498 <212> DNA <213> Artificial Sequence <220> <223> SP0417 <400> 352 gggagagcca ggacattggc tgcctgtggt cttggtggtc gtggtcagtt ccctctcctg 60 ccagctgtgg aatgtgaggc ctggcctggg agatattttt gctgcacttt gagccacccc 120 gccccctgga actcagaccc tgcacagtcc atgccataac aatgacgacc acttccaatt 180 gtttcctagc tggagaggcg gggaggggag cactgtttgg gaaggggggg agcctggggg 240 aaatgcttct ataaataccc gctctggtat ttggggttct cctctataaa tacccgctct 300 ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg ggaggcgggg 360 gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg 420 catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc 480 cgcgccgtca ccgccacc 498 <210> 353 <211> 594 <212> DNA <213> Artificial Sequence <220> <223> SP0418 <400> 353 ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60 gtggcagtgg ggggtgagga gcatctaaaa atagccggga gagccaggac attggctgcc 120 tgtggtcttg gtggtcgtgg tcagttccct ctcctgccag ctgtggaatg tgaggcctgg 180 cctgggagat atttttgctg cactttgagc caccccgccc cctggaactc agaccctgca 240 cagtccatgc cataacaatg acgaccactt ccaattgttt cctagctgga gaggcgggga 300 ggggagcact gtttgggaag ggggggagcc tgggggaaat gcttctataa atacccgctc 360 tggtatttgg ggttctcctc tataaatacc cgctctggta tttggggttg gcagctgttg 420 cgggatcttg cagctgtcag gggaggggag gcgggggctg atgtcaggag ggatacaaat 480 agtgccgacg gctgggggcc ctgtctcccc tcgccgcatc cactctccgg ccggccgcct 540 gcccgccgcc tcctccgtgc gcccgccagc ctcgcccgcg ccgtcaccgc cacc 594 <210> 354 <211> 657 <212> DNA <213> Artificial Sequence <220> <223> SP0419 <400> 354 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttccatg ccataacaat 300 gacgaccact tccaattgtt tcctagctgg ccatgttccc ggcgaagggc cagctgtccc 360 ccgccagcta gactcagcac ttagtttagg aaccagtgag caagtcagcc cttggggcag 420 cccatacaag gccatggggc tgggcaagct gcacgcctgg gtccggggtg ggcacggtgc 480 ccgggcaacg agctgaaagc tcatctactc tcaggggccc ctccctgggg acagcccctc 540 ctggctagtc acaccctgta ggctcctcta tataacccag gggcacaggg gctgcccccg 600 ggtcaccacc acctccacag cacagacaga cactcaggag ccagcgcggc cgccacc 657 <210> 355 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> SP0420 <400> 355 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaatccatg ccataacaat gacgaccact 300 tccaattgtt tcctagctgg atttttaaag actgaggaat taggcacctg tcatttttgc 360 cagctggtgt agatgttaaa aattactgtc actcttccgc ctgctacttt attttgcacc 420 tgctgttact tgagttacag gcatttcaca catggtaatt taataaggtt agttcccatg 480 acacaccgcc tgctgccacg gccggccgta taaatagagg cgaggagcag ctgggctctc 540 ttggcagtca ccgcggccgc cacc 564 <210> 356 <211> 577 <212> DNA <213> Artificial Sequence <220> <223> SP0421 <400> 356 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca gcagctggtc acaaagctgg ttaatctccc 120 agagtgctca gcttaaaacc cgtgactcac agcacagcca gtgtggggga gggggtggct 180 gcctccaata cgtggcgccc agagtcagct gttctggggc cttctctggt ttctccaact 240 gagtcctgag gtttggccat gttcccggcg aagggccagc tgtcccccgc cagctagact 300 cagcacttag tttaggaacc agtgagcaag tcagcccttg gggcagccca tacaaggcca 360 tggggctggg caagctgcac gcctgggtcc ggggtgggca cggtgcccgg gcaacgagct 420 gaaagctcat ctactctcag gggcccctcc ctggggacag cccctcctgg ctagtcacac 480 cctgtaggct cctctatata acccaggggc acaggggctg cccccgggtc accaccacct 540 ccacagcaca gacagacact caggagccag cgccacc 577 <210> 357 <211> 532 <212> DNA <213> Artificial Sequence <220> <223> SP0422 <400> 357 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120 ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180 ctggtttctc caactgagtc ctgaggtttg gccatgttcc cggcgaaggg ccagctgtcc 240 cccgccagct agactcagca cttagtttag gaaccagtga gcaagtcagc ccttggggca 300 gcccatacaa ggccatgggg ctgggcaagc tgcacgcctg ggtccggggt gggcacggtg 360 cccgggcaac gagctgaaag ctcatctact ctcaggggcc cctccctggg gacagcccct 420 cctggctagt cacaccctgt aggctcctct atataaccca ggggcacagg ggctgccccc 480 gggtcaccac cacctccaca gcacagacag acactcagga gccagcgcca cc 532 <210> 358 <211> 461 <212> DNA <213> Artificial Sequence <220> <223> SP0423 <400> 358 ggcaggcgga cctggtggtc agacctcagt gatcctcagg gaccagtgaa tatttcaggc 60 tggggctgag catcacctgc tcccttggcc ccacttatag ggcaaagggg agtctaccag 120 cctactcact gatgacaaac tggaaaagtt tgtcctgtct ctgctctggc cccacctcgc 180 cctctcccct acttggaagt tcctttcctg aaccactgac tgcattttta aagactgagg 240 aattaggcac ctgtcatttt tgccagctgg tgtagatgtt aaaaattact gtcactcttc 300 cgcctgctac tttattttgc acctgctgtt acttgagtta caggcatttc acacatggta 360 atttaataag gttagttccc atgacacacc gcctgctgcc acggccggcc gtataaatag 420 aggcgaggag cagctgggct ctcttggcag tcaccgccac c 461 <210> 359 <211> 765 <212> DNA <213> Artificial Sequence <220> <223> SP0424 <400> 359 ttctgactgg gtcccttacc actgtctttg caaatggcat ttccattaac atttctattt 60 ctggccatta ggggcaccta aagatttccc accaagattg acagccacta ttttaagaaa 120 gtgcttttaa aaagccagtg cttttgctaa gtttaaatct gactttctca ggggatgctt 180 aaaagaaata cacagtttgt ttgttttttt tttaagaacc tttgcaagtt caaaataaca 240 ttccagaagg agtcactaga aaaacattca agggaagaga aaaaaattgt tttcgtttgt 300 agcagacctg gcttcatcca aatgttctat ttgtttttta ctgcagggat aaaagcagtc 360 tgggctttca catgacagca tctggggctg cggcagaggg tcgggtccga agcgctgcct 420 tatcagcgtc cccagccctg ggaggtgaca gctggctggc ttgtgtcagc ccctcgggca 480 ctcacgtatc tccgtccgac gggtttaaaa tagcaaaact ctgaggccac acaatagctt 540 gggcttatat gggctcctgt gggggaaggg ggagcacgga gggggccggg gccgctgctg 600 ccaaaatagc agctcacaag tgttgcattc ctctctgggc gccgggcaca ttcctgctgg 660 ctctgcccgc cccggggtgg gcgccggggg gaccttaaag cctctgcccc ccaaggagcc 720 cttcccagac agccgccggc acccaccgct ccgtgggacg ccacc 765 <210> 360 <211> 631 <212> DNA <213> Artificial Sequence <220> <223> SP0425 <400> 360 taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60 gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120 atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180 acatttcttc ctgattcgca tacgccgcgg cgggataaaa gcagtctggg ctttcacatg 240 acagcatctg gggctgcggc agagggtcgg gtccgaagcg ctgccttatc agcgtcccca 300 gccctgggag gtgacagctg gctggcttgt gtcagcccct cgggcactca cgtatctccg 360 tccgacgggt ttaaaatagc aaaactctga ggccacacaa tagcttgggc ttatatgggc 420 tcctgtgggg gaagggggag cacggagggg gccggggccg ctgctgccaa aatagcagct 480 cacaagtgtt gcattcctct ctgggcgccg ggcacattcc tgctggctct gcccgccccg 540 gggtgggcgc cggggggacc ttaaagcctc tgccccccaa ggagcccttc ccagacagcc 600 gccggcaccc accgctccgt gggacgccac c 631 <210> 361 <211> 525 <212> DNA <213> Artificial Sequence <220> <223> SP0426 <400> 361 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaaactcgg gggccaggca ctggcgctga 300 cgcaggctag cagggcgcca ctggctggtc cccacccacc tcggtgggtt gggggatggg 360 cgcaccagcc cctcctgggt gagccctagc ctggggcttc ctatttcggg agccgggggc 420 gtgggccacg tctcctcatg tgatgcgagg gctatttaaa gcggcagccc gggcagggag 480 ccgccgtcgg agcccttgca cgcctgctct cttgtagctg ccacc 525 <210> 362 <211> 422 <212> DNA <213> Artificial Sequence <220> <223> SP0427 <400> 362 ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgcc cctgcccccc 60 acagctcctc tcctgtgcct tgtttcccag ccatgcgttc tcctctataa atacccgctc 120 tggtatttgg ggttggcagc tgttgctgcc agggagatgg ttgggttgac atggactcag 180 gggcgcaggc ctcttgcggg ggagctggcc tccccgcccc cacggccacg ggccgccctt 240 tcctggcagg acagcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca 300 ggagggatac aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct 360 ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgcca 420 cc 422 <210> 363 <211> 616 <212> DNA <213> Artificial Sequence <220> <223> SP0428 <400> 363 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240 tgcccctgcc ccccacagct cctctcctgt gccttgtttc ccagccatgc gttctcctct 300 ataaataccc gctctggtat ttggggttgg cagctgttgc tgccagggag atggttgggt 360 tgacatggac tcaggggcgc aggcctcttg cgggggagct ggcctccccg cccccacggc 420 cacgggccgc cctttcctgg caggacagcg ggatcttgca gctgtcaggg gaggggaggc 480 gggggctgat gtcaggaggg atacaaatag tgccgacggc tgggggccct gtctcccctc 540 gccgcatcca ctctccggcc ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct 600 cgcccgcgcc gccacc 616 <210> 364 <211> 806 <212> DNA <213> Artificial Sequence <220> <223> SP0429 <400> 364 aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60 agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120 aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180 aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240 caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300 cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360 acactctgga gttagacaaa gccaagggga taaaagcagt ctgggctttc acatgacagc 420 atctggggct gcggcagagg gtcgggtccg aagcgctgcc ttatcagcgt ccccagccct 480 gggaggtgac agctggctgg cttgtgtcag cccctcgggc actcacgtat ctccgtccga 540 cgggtttaaa atagcaaaac tctgaggcca cacaatagct tgggcttata tgggctcctg 600 tgggggaagg gggagcacgg agggggccgg ggccgctgct gccaaaatag cagctcacaa 660 gtgttgcatt cctctctggg cgccgggcac attcctgctg gctctgcccg ccccggggtg 720 ggcgccgggg ggaccttaaa gcctctgccc cccaaggagc ccttcccaga cagccgccgg 780 cacccaccgc tccgtgggac gccacc 806 <210> 365 <211> 842 <212> DNA <213> Artificial Sequence <220> <223> SP0430 <400> 365 gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60 tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120 gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180 aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240 ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300 cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360 aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420 atgggataaa agcagtctgg gctttcacat gacagcatct ggggctgcgg cagagggtcg 480 ggtccgaagc gctgccttat cagcgtcccc agccctggga ggtgacagct ggctggcttg 540 tgtcagcccc tcgggcactc acgtatctcc gtccgacggg tttaaaatag caaaactctg 600 aggccacaca atagcttggg cttatatggg ctcctgtggg ggaaggggga gcacggaggg 660 ggccggggcc gctgctgcca aaatagcagc tcacaagtgt tgcattcctc tctgggcgcc 720 gggcacattc ctgctggctc tgcccgcccc ggggtgggcg ccggggggac cttaaagcct 780 ctgcccccca aggagccctt cccagacagc cgccggcacc caccgctccg tgggacgcca 840 cc 842 <210> 366 <211> 648 <212> DNA <213> Artificial Sequence <220> <223> SP0431 <400> 366 gatcctctgc ctggcagggg ggtggcctta tttagcctgg cctggctcct ctgagctttc 60 ttgggaatgt ctatatatag gggaagagcg cagcccagtt gccactgtcc atctgccttc 120 cttggactct ggtccacccc tccctgaccc tgggctccat tttctttctg tgccactttc 180 ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga ccagctgcca 240 ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg ccggaggagg 300 gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc ccttcttcac 360 catcccgagt ccaaagccct gacccagatg gcctggcttg ataaataccc gctctggtat 420 ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct gttgcgggat 480 cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac aaatagtgcc 540 gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc gcctgcccgc 600 cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 648 <210> 367 <211> 478 <212> DNA <213> Artificial Sequence <220> <223> SP0432 <400> 367 tgccactttc ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga 60 ccagctgcca ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg 120 ccggaggagg gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc 180 ccttcttcac catcccgagt ccaaagccct gacccagatg gcctggcttg ataaataccc 240 gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 300 gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 360 aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 420 gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 478 <210> 368 <211> 284 <212> DNA <213> Artificial Sequence <220> <223> CMV-IE 5'UTR and intron <400> 368 tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 60 atccagcctc cgcggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga 120 cgtaagtacc gcctatagac tctataggca cacccctttg gctcttatgc atgaacggtg 180 gagggcagtg tagtctgagc agtactcgtt gctgccgcgc gcgccaccag acataatagc 240 tgacagacta acagactgtt cctttccatg ggtcttttct gcag 284 <210> 369 <211> 140 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0407 <400> 369 agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60 gctgtggagt cagctggctt ccaaggtgcc tgggatcttt tcgttctgcc cttggctcct 120 gccctaactg gcaaacccca 140 <210> 370 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0408 <400> 370 agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60 gctgtggagt cagctggctt ccaagg 86 <210> 371 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0409 <400> 371 ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60 gtggcagtgg ggggtgagga gcatctaaaa atagcc 96 <210> 372 <211> 340 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0410 <400> 372 agtgattctc cctcaagacc ttataaaacc actttaaccc tcaatgggat aatatctagt 60 acattgtcat gggaactaac cttattaaat taccatgtgt gaaatgcctg taactcaagt 120 aacagcaggt gcaaaataaa gtagcaggcg gaagagtgac agtaattttt aacatctaca 180 ccagctggca aaaatgacag gtgcctaatt cctcagtctt taaaaataac ttttgagaag 240 cctacacagc ataagcaaat attttcaagt ttatttttta gctatcttcg agttaccttc 300 ctgacaaaat gtaataatat acactgattt ttgcagaaaa 340 <210> 373 <211> 257 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0411 <400> 373 ataacttcag cacactgtca tgggacctaa ccttattaaa ttaccatgtg tgaagcgtcc 60 ataactcaag taacagcagg tgcaaaaatg gagctgcagg cagaagagtg gtagtcattt 120 ttacaaatcc ccaccagctg gcgaaacaac aggtgcctaa ttcctcagct tttaaaaata 180 acttttaaaa agcctgtgct gcataagcaa atattttcaa gtttgttttt aaaccatctt 240 caagttacct tggtcac 257 <210> 374 <211> 280 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0412 <400> 374 agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60 cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120 agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180 ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240 aacccgcgcc tgagtcacag ggccctgaat tggcccctct 280 <210> 375 <211> 280 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0413 <400> 375 agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60 cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120 agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180 ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240 aacccgcgcc tgagtcacag ggccctgaat tggcccctct 280 <210> 376 <211> 447 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0414 <400> 376 agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60 cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120 agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180 ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240 aacccgcgcc tgagtcacag ggccctgaat tggcccctct agactggggc aggtgcaggc 300 tggattgggt ttccagaggc tatatatata aaggctgccg ggagccccag ggccgctccc 360 tgagggcaca acactgtggg ggcccagcca ggcccacatt cctttccaga ggccagctct 420 ccatttatag cccctgggca gagcagc 447 <210> 377 <211> 250 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0415 <400> 377 atggtgcttc caagtctgct cccgggacgt ttcctgttct tggaacagct gcaccagcct 60 ggggtaccct cctgctactt gatcctatag ggaggtgtcc agtggctgtg ggcaattttc 120 agatgacctt gttcgtctga cgtcattaga tcgctatttt tggctttgct gtttatgctg 180 cagaagttgg gctggaatgg gagaggagga atgaaggagg ggctgctctt ggtttcccat 240 tgttccaggg 250 <210> 378 <211> 370 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0416 <400> 378 actgatgtgg aaggggttat atataggaag atgtgtagga agaaaaaggt agagagctct 60 cctcagaggg tgggggatta tgggtagcca gagggagcct gggttagtgg agttgaagcc 120 ctagtcttgg gtgctttgta gcatcagaag cctctggagc ctttgctgac acctgcctga 180 tgtacggagc catctgtggg tgtctgtgtg ctggaggatt gcccacagct atgattcaga 240 gatgctcatg ttgttgccca agcaattgac agatgatgtt tcaggcttgg agatggcagg 300 atgggagcaa agagaagcca ggtcaggaaa gaacgtgccg ttctggccct agtggggaat 360 tctgggcctt 370 <210> 379 <211> 250 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0417 <400> 379 gggagagcca ggacattggc tgcctgtggt cttggtggtc gtggtcagtt ccctctcctg 60 ccagctgtgg aatgtgaggc ctggcctggg agatattttt gctgcacttt gagccacccc 120 gccccctgga actcagaccc tgcacagtcc atgccataac aatgacgacc acttccaatt 180 gtttcctagc tggagaggcg gggaggggag cactgtttgg gaaggggggg agcctggggg 240 aaatgcttct 250 <210> 380 <211> 346 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0418 <400> 380 ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60 gtggcagtgg ggggtgagga gcatctaaaa atagccggga gagccaggac attggctgcc 120 tgtggtcttg gtggtcgtgg tcagttccct ctcctgccag ctgtggaatg tgaggcctgg 180 cctgggagat atttttgctg cactttgagc caccccgccc cctggaactc agaccctgca 240 cagtccatgc cataacaatg acgaccactt ccaattgttt cctagctgga gaggcgggga 300 ggggagcact gtttgggaag ggggggagcc tgggggaaat gcttct 346 <210> 381 <211> 330 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0419 <400> 381 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagttccatg ccataacaat 300 gacgaccact tccaattgtt tcctagctgg 330 <210> 382 <211> 320 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0420 <400> 382 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaatccatg ccataacaat gacgaccact 300 tccaattgtt tcctagctgg 320 <210> 383 <211> 256 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0421 <400> 383 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca gcagctggtc acaaagctgg ttaatctccc 120 agagtgctca gcttaaaacc cgtgactcac agcacagcca gtgtggggga gggggtggct 180 gcctccaata cgtggcgccc agagtcagct gttctggggc cttctctggt ttctccaact 240 gagtcctgag gtttgg 256 <210> 384 <211> 211 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0422 <400> 384 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120 ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180 ctggtttctc caactgagtc ctgaggtttg g 211 <210> 385 <211> 223 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0423 <400> 385 ggcaggcgga cctggtggtc agacctcagt gatcctcagg gaccagtgaa tatttcaggc 60 tggggctgag catcacctgc tcccttggcc ccacttatag ggcaaagggg agtctaccag 120 cctactcact gatgacaaac tggaaaagtt tgtcctgtct ctgctctggc cccacctcgc 180 cctctcccct acttggaagt tcctttcctg aaccactgac tgc 223 <210> 386 <211> 345 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0424 <400> 386 ttctgactgg gtcccttacc actgtctttg caaatggcat ttccattaac atttctattt 60 ctggccatta ggggcaccta aagatttccc accaagattg acagccacta ttttaagaaa 120 gtgcttttaa aaagccagtg cttttgctaa gtttaaatct gactttctca ggggatgctt 180 aaaagaaata cacagtttgt ttgttttttt tttaagaacc tttgcaagtt caaaataaca 240 ttccagaagg agtcactaga aaaacattca agggaagaga aaaaaattgt tttcgtttgt 300 agcagacctg gcttcatcca aatgttctat ttgtttttta ctgca 345 <210> 387 <211> 211 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0425 <400> 387 taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60 gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120 atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180 acatttcttc ctgattcgca tacgccgcgg c 211 <210> 388 <211> 274 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0426 <400> 388 ccttgcctga ctattggcag gcggacctgg tggtcagacc tcagtgatcc tcagggacca 60 gtgaatattt caggctgggg ctgagcatca cctgctccct tggccccact tatagggcaa 120 aggggagtct accagcctac tcactgatga caaactggaa aagtttgtcc tgtctctgct 180 ctggccccac ctcgccctct cccctacttg gaagttcctt tcctgaacca ctgactgcca 240 aagcttgagg gattaaataa atcatctggc ccaa 274 <210> 389 <211> 173 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0427 <400> 389 ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgcc cctgcccccc 60 acagctcctc tcctgtgcct tgtttcccag ccatgcgttc tcctctataa atacccgctc 120 tggtatttgg ggttggcagc tgttgctgcc agggagatgg ttgggttgac atg 173 <210> 390 <211> 367 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0428 <400> 390 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgttctcc tctataaata cccgctctgg tatttggggt tggcagctgt 240 tgcccctgcc ccccacagct cctctcctgt gccttgtttc ccagccatgc gttctcctct 300 ataaataccc gctctggtat ttggggttgg cagctgttgc tgccagggag atggttgggt 360 tgacatg 367 <210> 391 <211> 386 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0429 <400> 391 aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60 agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120 aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180 aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240 caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300 cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360 acactctgga gttagacaaa gccaag 386 <210> 392 <211> 422 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0430 <400> 392 gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60 tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120 gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180 aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240 ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300 cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360 aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420 at 422 <210> 393 <211> 400 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0431 <400> 393 gatcctctgc ctggcagggg ggtggcctta tttagcctgg cctggctcct ctgagctttc 60 ttgggaatgt ctatatatag gggaagagcg cagcccagtt gccactgtcc atctgccttc 120 cttggactct ggtccacccc tccctgaccc tgggctccat tttctttctg tgccactttc 180 ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga ccagctgcca 240 ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg ccggaggagg 300 gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc ccttcttcac 360 catcccgagt ccaaagccct gacccagatg gcctggcttg 400 <210> 394 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0432 <400> 394 tgccactttc ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga 60 ccagctgcca ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg 120 ccggaggagg gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc 180 ccttcttcac catcccgagt ccaaagccct gacccagatg gcctggcttg 230 <210> 395 <211> 199 <212> DNA <213> Artificial Sequence <220> <223> CRE0029.2 <400> 395 ctctgtctcc tcaggtgcct ggctgcttcc tagctgggcc tttccttctc ctctataaat 60 accagctctg gtatttcgcc ttggcagctg ttgctgctag ggagacggct ggcttgacat 120 gcatctcctg acaaaacaca aacccgtggt gtgagtgggt gtgggcggtg tgagtagggg 180 gatgaatcag agagggggc 199 <210> 396 <211> 119 <212> DNA <213> Artificial Sequence <220> <223> CRE0069.2 <400> 396 agactggggc aggtgcaggc tggattgggt ttccagaggc tatatatata aaggctgccg 60 ggagcccaca ttcctttcca gaggccagct ctccatttat agcccctggg cagagcagc 119 <210> 397 <211> 188 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.13 <400> 397 acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60 ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120 ggaggaatgg tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg 180 tccgccct 188 <210> 398 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.14 <400> 398 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgagctctat aaatacccgc 180 tctggtattt ggggttttga acccgtcgcc atatttgggt gtccgccct 229 <210> 399 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.15 <400> 399 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagc tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaatagct cccgggagct atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 400 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> DES_MT_enhancer_72 bp <400> 400 ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttgct gccagggaga 60 tggttgggtt ga 72 <210> 401 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> CRE0080 <400> 401 agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60 gctgtggagt cagctggctt ccaagg 86 <210> 402 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> CRE0081 <400> 402 tgcctgggat cttttcgttc tgcccttggc tcctgcccta actggcaaac ccca 54 <210> 403 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> CRE0083 <400> 403 ccagcccacc tgtcccaatg ctgacttagt gcaaggcgag ccagcaagga gggaggacag 60 gtggcagtgg ggggtgagga gcatctaaaa atagcc 96 <210> 404 <211> 340 <212> DNA <213> Artificial Sequence <220> <223> CRE0084 <400> 404 agtgattctc cctcaagacc ttataaaacc actttaaccc tcaatgggat aatatctagt 60 acattgtcat gggaactaac cttattaaat taccatgtgt gaaatgcctg taactcaagt 120 aacagcaggt gcaaaataaa gtagcaggcg gaagagtgac agtaattttt aacatctaca 180 ccagctggca aaaatgacag gtgcctaatt cctcagtctt taaaaataac ttttgagaag 240 cctacacagc ataagcaaat attttcaagt ttatttttta gctatcttcg agttaccttc 300 ctgacaaaat gtaataatat acactgattt ttgcagaaaa 340 <210> 405 <211> 257 <212> DNA <213> Artificial Sequence <220> <223> CRE0085 <400> 405 ataacttcag cacactgtca tgggacctaa ccttattaaa ttaccatgtg tgaagcgtcc 60 ataactcaag taacagcagg tgcaaaaatg gagctgcagg cagaagagtg gtagtcattt 120 ttacaaatcc ccaccagctg gcgaaacaac aggtgcctaa ttcctcagct tttaaaaata 180 acttttaaaa agcctgtgct gcataagcaa atattttcaa gtttgttttt aaaccatctt 240 caagttacct tggtcac 257 <210> 406 <211> 280 <212> DNA <213> Artificial Sequence <220> <223> CRE0086 <400> 406 agggcaccat ccggatgcct gcctagttcc cttccggccc tgatggaggc atgagcctcc 60 cccaccgcct gctcactgct cactcctcgg ccgccagccc agcagctgtt gcctcagatc 120 agtgtggacc atctaatccc ctctccagag ccctggcccc ctcctcaggc agtaaattaa 180 ggaggatgta agaacagagg gcaccagcgt cagcagagcg gcatccaaaa catcctcccc 240 aacccgcgcc tgagtcacag ggccctgaat tggcccctct 280 <210> 407 <211> 250 <212> DNA <213> Artificial Sequence <220> <223> CRE0088 <400> 407 atggtgcttc caagtctgct cccgggacgt ttcctgttct tggaacagct gcaccagcct 60 ggggtaccct cctgctactt gatcctatag ggaggtgtcc agtggctgtg ggcaattttc 120 agatgacctt gttcgtctga cgtcattaga tcgctatttt tggctttgct gtttatgctg 180 cagaagttgg gctggaatgg gagaggagga atgaaggagg ggctgctctt ggtttcccat 240 tgttccaggg 250 <210> 408 <211> 370 <212> DNA <213> Artificial Sequence <220> <223> CRE0089 <400> 408 actgatgtgg aaggggttat atataggaag atgtgtagga agaaaaaggt agagagctct 60 cctcagaggg tgggggatta tgggtagcca gagggagcct gggttagtgg agttgaagcc 120 ctagtcttgg gtgctttgta gcatcagaag cctctggagc ctttgctgac acctgcctga 180 tgtacggagc catctgtggg tgtctgtgtg ctggaggatt gcccacagct atgattcaga 240 gatgctcatg ttgttgccca agcaattgac agatgatgtt tcaggcttgg agatggcagg 300 atgggagcaa agagaagcca ggtcaggaaa gaacgtgccg ttctggccct agtggggaat 360 tctgggcctt 370 <210> 409 <211> 250 <212> DNA <213> Artificial Sequence <220> <223> CRE0090 <400> 409 gggagagcca ggacattggc tgcctgtggt cttggtggtc gtggtcagtt ccctctcctg 60 ccagctgtgg aatgtgaggc ctggcctggg agatattttt gctgcacttt gagccacccc 120 gccccctgga actcagaccc tgcacagtcc atgccataac aatgacgacc acttccaatt 180 gtttcctagc tggagaggcg gggaggggag cactgtttgg gaaggggggg agcctggggg 240 aaatgcttct 250 <210> 410 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> CRE0091 <400> 410 tccatgccat aacaatgacg accacttcca attgtttcct agctgg 46 <210> 411 <211> 256 <212> DNA <213> Artificial Sequence <220> <223> CRE0020.2 <400> 411 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca gcagctggtc acaaagctgg ttaatctccc 120 agagtgctca gcttaaaacc cgtgactcac agcacagcca gtgtggggga gggggtggct 180 gcctccaata cgtggcgccc agagtcagct gttctggggc cttctctggt ttctccaact 240 gagtcctgag gtttgg 256 <210> 412 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> CRE0093 <400> 412 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca 90 <210> 413 <211> 121 <212> DNA <213> Artificial Sequence <220> <223> CRE0094 <400> 413 aaacccgtga ctcacagcac agccagtgtg ggggaggggg tggctgcctc caatacgtgg 60 cgcccagagt cagctgttct ggggccttct ctggtttctc caactgagtc ctgaggtttg 120 g 121 <210> 414 <211> 223 <212> DNA <213> Artificial Sequence <220> <223> CRE0016.1 <400> 414 ggcaggcgga cctggtggtc agacctcagt gatcctcagg gaccagtgaa tatttcaggc 60 tggggctgag catcacctgc tcccttggcc ccacttatag ggcaaagggg agtctaccag 120 cctactcact gatgacaaac tggaaaagtt tgtcctgtct ctgctctggc cccacctcgc 180 cctctcccct acttggaagt tcctttcctg aaccactgac tgc 223 <210> 415 <211> 345 <212> DNA <213> Artificial Sequence <220> <223> CRE0004 <400> 415 ttctgactgg gtcccttacc actgtctttg caaatggcat ttccattaac atttctattt 60 ctggccatta ggggcaccta aagatttccc accaagattg acagccacta ttttaagaaa 120 gtgcttttaa aaagccagtg cttttgctaa gtttaaatct gactttctca ggggatgctt 180 aaaagaaata cacagtttgt ttgttttttt tttaagaacc tttgcaagtt caaaataaca 240 ttccagaagg agtcactaga aaaacattca agggaagaga aaaaaattgt tttcgtttgt 300 agcagacctg gcttcatcca aatgttctat ttgtttttta ctgca 345 <210> 416 <211> 386 <212> DNA <213> Artificial Sequence <220> <223> CRE0095 <400> 416 aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60 agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120 aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180 aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240 caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300 cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360 acactctgga gttagacaaa gccaag 386 <210> 417 <211> 422 <212> DNA <213> Artificial Sequence <220> <223> CRE0096 <400> 417 gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60 tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120 gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180 aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240 ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300 cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360 aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420 at 422 <210> 418 <211> 170 <212> DNA <213> Artificial Sequence <220> <223> CRE0097 <400> 418 gatcctctgc ctggcagggg ggtggcctta tttagcctgg cctggctcct ctgagctttc 60 ttgggaatgt ctatatatag gggaagagcg cagcccagtt gccactgtcc atctgccttc 120 cttggactct ggtccacccc tccctgaccc tgggctccat tttctttctg 170 <210> 419 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> CRE0098 <400> 419 tgccactttc ttctgcgtac ccctcctact tgacttgaag aagtaattgg actccagaga 60 ccagctgcca ttgcccatgc ccaactaaaa atagcctatc ctcctggatc aggccaaggg 120 ccggaggagg gaaggaggaa ctgggccagc tggctgaagg atgtcttggg actcgtcacc 180 ccttcttcac catcccgagt ccaaagccct gacccagatg gcctggcttg 230 <210> 420 <211> 214 <212> DNA <213> Artificial Sequence <220> <223> CRE0092 <400> 420 tgacaatccc tgcctgggat cttttcgttc tgcccttggc tcctgcccta actggcaaac 60 cccaccccct catcaccagc tttcaagtat cagattgcgt ttccggcctc ttctttccaa 120 acccctaaac caccagcacc tgtccccttg cttgcctcat tccacagcca acaggctgaa 180 gggaagacaa accctagtca gtcagaggtg gggg 214 <210> 421 <211> 268 <212> DNA <213> Artificial Sequence <220> <223> CRE0087 <400> 421 attattcacc tgttcgcctt agatgaagaa tcaaggaaca gcagctctag ggggttggga 60 ggagttaggg tccggccctg ccccagacct ctcagtgtcc aatttctctg tgtcagctgt 120 gtttctcagc tgtccacttt cctccagccc tgtcatttca gccctgacac caaggcagga 180 ggctaggagg tctacaaata gcgactgggt agctggtgtg aacacagggg gtactggggg 240 ggcttagccc ccaaggaaga ggaccagt 268 <210> 422 <211> 414 <212> DNA <213> Artificial Sequence <220> <223> CRE0082 <400> 422 gggataaaag cagtctgggc tttcacatga cagcatctgg ggctgcggca gagggtcggg 60 tccgaagcgc tgccttatca gcgtccccag ccctgggagg tgacagctgg ctggcttgtg 120 tcagcccctc gggcactcac gtatctccgt ccgacgggtt taaaatagca aaactctgag 180 gccacacaat agcttgggct tatatgggct cctgtggggg aagggggagc acggaggggg 240 ccggggccgc tgctgccaaa atagcagctc acaagtgttg cattcctctc tgggcgccgg 300 gcacattcct gctggctctg cccgccccgg ggtgggcgcc ggggggacct taaagcctct 360 gccccccaag gagcccttcc cagacagccg ccggcaccca ccgctccgtg ggac 414 <210> 423 <211> 243 <212> DNA <213> Artificial Sequence <220> <223> CRE0048.1 <400> 423 gactcagggg cgcaggcctc ttgcggggga gctggcctcc ccgcccccac ggccacgggc 60 cgccctttcc tggcaggaca gcgggatctt gcagctgtca ggggagggga ggcgggggct 120 gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc ctcgccgcat 180 ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc 240 gcc 243 <210> 424 <211> 458 <212> DNA <213> Artificial Sequence <220> <223> SP0344 <400> 424 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgg gccccagcca ctgtctcttt aaccttgaag gcatttttgg gtctcacgtg 240 tccacccagg cgggtgtcgg actttgaacg gctcttactt cagaagaacg gcatggggtg 300 ggggggctta ggtggcctct gcctcaccta caactgccaa aagtggtcat ggggttattt 360 ttaaccccag ggaagaggta tttattgttc cacagcaggg gccggccagc aggctccttg 420 aattcttcag aggcagcagc cagcctcaga cagccacc 458 <210> 425 <211> 554 <212> DNA <213> Artificial Sequence <220> <223> SP0433 <400> 425 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgc accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat 240 atggcgacgg gtgaggaatg gtggggagtt atttttagag cgtaaacgag ctattagttg 300 cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg 360 tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccctcg 420 gccggggccg cattcctggg ggccgggcgg tgctcccgcc cgcctcgata aaaggctccg 480 gggccggcgg cggcccacga gctacccgga ggagcgggag gcgccaagct ctagaactag 540 tggatcccgc cacc 554 <210> 426 <211> 609 <212> DNA <213> Artificial Sequence <220> <223> SP0435 <400> 426 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgg ggataaaagc agtctgggct ttcacatgac agcatctggg gctgcggcag 240 agggtcgggt ccgaagcgct gccttatcag cgtccccagc cctgggaggt gacagctggc 300 tggcttgtgt cagcccctcg ggcactcacg tatctccgtc cgacgggttt aaaatagcaa 360 aactctgagg ccacacaata gcttgggctt atatgggctc ctgtggggga agggggagca 420 cggagggggc cggggccgct gctgccaaaa tagcagctca caagtgttgc attcctctct 480 gggcgccggg cacattcctg ctggctctgc ccgccccggg gtgggcgccg gggggacctt 540 aaagcctctg ccccccaagg agcccttccc agacagccgc cggcacccac cgctccgtgg 600 gacgccacc 609 <210> 427 <211> 632 <212> DNA <213> Artificial Sequence <220> <223> SP0436 <400> 427 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgc ccttcagatt aaaaataact gaggtaaggg cctgggtagg ggaggtggtg 240 tgagacgctc ctgtctctcc tctatctgcc catcggccct ttggggagga ggaatgtgcc 300 caaggactaa aaaaaggcca tggagccaga ggggcgaggg caacagacct ttcatgggca 360 aaccttgggg ccctgctgat aaatacccgc tctggtattt ggggttctcc tctataaata 420 cccgctctgg tatttggggt tggcagctgt tgcgggatct tgcagctgtc aggggagggg 480 aggcgggggc tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc 540 cctcgccgca tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca 600 gcctcgcccg cgccgtcacc gcggccgcca cc 632 <210> 428 <211> 782 <212> DNA <213> Artificial Sequence <220> <223> SP0449 <400> 428 ttctgactgg gtcccttacc actgtctttg caaatggcat ttccattaac atttctattt 60 ctggccatta ggggcaccta aagatttccc accaagattg acagccacta ttttaagaaa 120 gtgcttttaa aaagccagtg cttttgctaa gtttaaatct gactttctca ggggatgctt 180 aaaagaaata cacagtttgt ttgttttttt tttaagaacc tttgcaagtt caaaataaca 240 ttccagaagg agtcactaga aaaacattca agggaagaga aaaaaattgt tttcgtttgt 300 agcagacctg gcttcatcca aatgttctat ttgtttttta ctgcaccctt cagattaaaa 360 ataactgagg taagggcctg ggtaggggag gtggtgtgag acgctcctgt ctctcctcta 420 tctgcccatc ggccctttgg ggaggaggaa tgtgcccaag gactaaaaaa aggccatgga 480 gccagagggg cgagggcaac agacctttca tgggcaaacc ttggggccct gctgataaat 540 acccgctctg gtatttgggg ttctcctcta taaatacccg ctctggtatt tggggttggc 600 agctgttgcg ggatcttgca gctgtcaggg gaggggaggc gggggctgat gtcaggaggg 660 atacaaatag tgccgacggc tgggggccct gtctcccctc gccgcatcca ctctccggcc 720 ggccgcctgc ccgccgcctc ctccgtgcgc ccgccagcct cgcccgcgcc gtcaccgcca 780 cc 782 <210> 429 <211> 823 <212> DNA <213> Artificial Sequence <220> <223> SP0450 <400> 429 aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60 agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120 aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180 aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240 caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300 cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360 acactctgga gttagacaaa gccaagccct tcagattaaa aataactgag gtaagggcct 420 gggtagggga ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg 480 gggaggagga atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa 540 cagacctttc atgggcaaac cttggggccc tgctgataaa tacccgctct ggtatttggg 600 gttctcctct ataaataccc gctctggtat ttggggttgg cagctgttgc gggatcttgc 660 agctgtcagg ggaggggagg cgggggctga tgtcaggagg gatacaaata gtgccgacgg 720 ctgggggccc tgtctcccct cgccgcatcc actctccggc cggccgcctg cccgccgcct 780 cctccgtgcg cccgccagcc tcgcccgcgc cgtcaccgcc acc 823 <210> 430 <211> 859 <212> DNA <213> Artificial Sequence <220> <223> SP0451 <400> 430 gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60 tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120 gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180 aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240 ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300 cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360 aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420 atcccttcag attaaaaata actgaggtaa gggcctgggt aggggaggtg gtgtgagacg 480 ctcctgtctc tcctctatct gcccatcggc cctttgggga ggaggaatgt gcccaaggac 540 taaaaaaagg ccatggagcc agaggggcga gggcaacaga cctttcatgg gcaaaccttg 600 gggccctgct gataaatacc cgctctggta tttggggttc tcctctataa atacccgctc 660 tggtatttgg ggttggcagc tgttgcggga tcttgcagct gtcaggggag gggaggcggg 720 ggctgatgtc aggagggata caaatagtgc cgacggctgg gggccctgtc tcccctcgcc 780 gcatccactc tccggccggc cgcctgcccg ccgcctcctc cgtgcgcccg ccagcctcgc 840 ccgcgccgtc accgccacc 859 <210> 431 <211> 851 <212> DNA <213> Artificial Sequence <220> <223> SP0452 <400> 431 gggataaaag cagtctgggc tttcacatga cagcatctgg ggctgcggca gagggtcggg 60 tccgaagcgc tgccttatca gcgtccccag ccctgggagg tgacagctgg ctggcttgtg 120 tcagcccctc gggcactcac gtatctccgt ccgacgggtt taaaatagca aaactctgag 180 gccacacaat agcttgggct tatatgggct cctgtggggg aagggggagc acggaggggg 240 ccggggccgc tgctgccaaa atagcagctc acaagtgttg cattcctctc tgggcgccgg 300 gcacattcct gctggctctg cccgccccgg ggtgggcgcc ggggggacct taaagcctct 360 gccccccaag gagcccttcc cagacagccg ccggcaccca ccgctccgtg ggaccccttc 420 agattaaaaa taactgaggt aagggcctgg gtaggggagg tggtgtgaga cgctcctgtc 480 tctcctctat ctgcccatcg gccctttggg gaggaggaat gtgcccaagg actaaaaaaa 540 ggccatggag ccagaggggc gagggcaaca gacctttcat gggcaaacct tggggccctg 600 ctgataaata cccgctctgg tatttggggt tctcctctat aaatacccgc tctggtattt 660 ggggttggca gctgttgcgg gatcttgcag ctgtcagggg aggggaggcg ggggctgatg 720 tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg ccgcatccac 780 tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc gcccgcgccg 840 tcaccgccac c 851 <210> 432 <211> 647 <212> DNA <213> Artificial Sequence <220> <223> SP0475 <400> 432 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctga taaatacccg ctctggtatt tggggttctc ctctataaat acccgctctg 240 gtatttgggg ttggcagctg ttgcgggatc ttgcagctgt caggggaggg gaggcggggg 300 ctgatgtcag gagggataca aatagtgccg acggctgggg gccctgtctc ccctcgctca 360 gatcgcctgg agacgccatc cacgctgttt tgacctccat agaagacacc gggaccgatc 420 cagcctccgc ggccgggaac ggtgcattgg aacgcggatt ccccgtgcca agagtgacgt 480 aagtaccgcc tatagactct ataggcacac ccctttggct cttatgcatg aacggtggag 540 ggcagtgtag tctgagcagt actcgttgct gccgcgcgcg ccaccagaca taatagctga 600 cagactaaca gactgttcct ttccatgggt cttttctgca ggccacc 647 <210> 433 <211> 501 <212> DNA <213> Artificial Sequence <220> <223> SP0476 <400> 433 ccagcagttt catccctaga ccatcccaaa catggttgag aagctctgag gggaggaccc 60 agcactgccc ggcccctgaa gtatctaatc agcagtcctg ctcagcatat caatccaagc 120 ccactctaga cagagatgcc ggtgcccagt tttctatttt taactggtgt gaactgaagg 180 aaaagcacag cattagaagt ccaagcacta gtcaagaacc aagaatacag ggcaccccag 240 ggcaagcata aatacccgct ctggtatttg gggttctcct ctataaatac ccgctctggt 300 atttggggtt ggcagctgtt gcgggatctt gcagctgtca ggggagggga ggcgggggct 360 gatgtcagga gggatacaaa tagtgccgac ggctgggggc cctgtctccc ctcgccgcat 420 ccactctccg gccggccgcc tgcccgccgc ctcctccgtg cgcccgccag cctcgcccgc 480 gccgtcaccg cggccgccac c 501 <210> 434 <211> 484 <212> DNA <213> Artificial Sequence <220> <223> SP0477 <400> 434 gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60 gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120 cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180 gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata ataaataccc 240 gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 300 gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 360 aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 420 gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgcggccgc 480 cacc 484 <210> 435 <211> 465 <212> DNA <213> Artificial Sequence <220> <223> SP0478 <400> 435 cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60 aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120 ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180 aaaatagcag ccaacacccc ccattgtgtt gataaatacc cgctctggta tttggggttc 240 tcctctataa atacccgctc tggtatttgg ggttggcagc tgttgcggga tcttgcagct 300 gtcaggggag gggaggcggg ggctgatgtc aggagggata caaatagtgc cgacggctgg 360 gggccctgtc tcccctcgcc gcatccactc tccggccggc cgcctgcccg ccgcctcctc 420 cgtgcgcccg ccagcctcgc ccgcgccgtc accgcggccg ccacc 465 <210> 436 <211> 456 <212> DNA <213> Artificial Sequence <220> <223> SP0479 <400> 436 ccagttgttc aactcaccct tcagattaaa aataactgag gtaagggcct gggtagggga 60 ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg gggaggagga 120 atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa cagacctttc 180 atgggcaaac cttggggccc tgataaatac ccgctctggt atttggggtt ctcctctata 240 aatacccgct ctggtatttg gggttggcag ctgttgcggg atcttgcagc tgtcagggga 300 ggggaggcgg gggctgatgt caggagggat acaaatagtg ccgacggctg ggggccctgt 360 ctcccctcgc cgcatccact ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc 420 gccagcctcg cccgcgccgt caccgcggcc gccacc 456 <210> 437 <211> 496 <212> DNA <213> Artificial Sequence <220> <223> SP0480 <400> 437 tgctgagccc agaaaaactg accgccctgt gtcctgccca cctccacact ctagagctat 60 attgagaggt gacagtagat agggtgggag ctggtagcag ggagagtgtt cctgggtgtg 120 agggtgtagg ggaaagccag agcaggggag tctggctttg cctcctgaac acaatgtcta 180 cttagttata acaggcatga cctgctaaag acccaacatc tacgacctct gaaaagacag 240 caataaatac ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg 300 gggttggcag ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt 360 caggagggat acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact 420 ctccggccgg ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt 480 caccgcggcc gccacc 496 <210> 438 <211> 456 <212> DNA <213> Artificial Sequence <220> <223> SP0481 <400> 438 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgt atgtctatat taggtgacgc agaactgccc gtcgctcctg tcatccaggc 240 ccctggccca atggcaggct gaatcccccc tactccagcc tgctcccgcc tcttctgccc 300 ctggtgctcc gcgctacctg ctgccgcgcg ccacatccag ggcagagagg cgggtgcgcg 360 ggcgggcggc gggcaccatg cggggaggct gtccccaggg gtgggcagca ccactctctg 420 ctacccacct ggcgctgtga aacctgcgtc gccacc 456 <210> 439 <211> 517 <212> DNA <213> Artificial Sequence <220> <223> SP0482 <400> 439 agcggagccg agggggcagc gcgtgacccc gagcggaagg gccccagtct gggtcctaat 60 gcgggtggcg tctctcttga caggcagcgt ttggggacaa cagcggggaa gggagataag 120 atgacatacc agagcagatt tggtgtgcgc gctgatactc ctggcccgac aggaaactcg 180 gagctattta aaaaggccct atcgattact ttatcttccc cggaggaaaa cttcttgccg 240 agagacaaaa gatgtccccc tacataaata cccgctctgg tatttggggt tctcctctat 300 aaatacccgc tctggtattt ggggttggca gctgttgcgg gatcttgcag ctgtcagggg 360 aggggaggcg ggggctgatg tcaggaggga tacaaatagt gccgacggct gggggccctg 420 tctcccctcg ccgcatccac tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc 480 cgccagcctc gcccgcgccg tcaccgcggc cgccacc 517 <210> 440 <211> 453 <212> DNA <213> Artificial Sequence <220> <223> SP0483 <400> 440 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgg gccccagcca ctgactcttt aaccttgaag gcatttttgg gtctcacgtg 240 tccacccagg cgggtggccg cctttgagca gctcttactt cagaagaacg gcatggagtg 300 gggggtgggg ggcttaggtg gcctccgcct cacctacaac tgccaaaagt ggtcatgggg 360 ttatttttaa ccccagggga gaggtattta ttgttccaca gcaggggcag aggccagcag 420 gctcctcgaa ctctccagag gtggcaagcc acc 453 <210> 441 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> SP0484 <400> 441 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgg actcgctgaa ttaatgaatc acttttctta tctatttttt gctgttatct 240 aattctgaga gggaagccgg gagcagaggg agttgggaga cgtagctcac aacgtctccc 300 tcccacccgg ctcaaacagg ctggaatctc tgggcctaga gggccacc 348 <210> 442 <211> 442 <212> DNA <213> Artificial Sequence <220> <223> SP0485 <400> 442 cctctagagg caggtgacct tgatgaaagg ccttcagtgt gacacaggtg taaaaatagc 60 ctctgtgctg acttaactcc ctggcttgag caaacggccc ctcacacctg tatattgttt 120 gcttggcata gacacactgc tacctgtttg caggtgtaaa tgactgttta tgtacccaga 180 gttatgagat aaatacccgc tctggtattt ggggttctcc tctataaata cccgctctgg 240 tatttggggt tggcagctgt tgcgggatct tgcagctgtc aggggagggg aggcgggggc 300 tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca 360 tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg 420 cgccgtcacc gcggccgcca cc 442 <210> 443 <211> 463 <212> DNA <213> Artificial Sequence <220> <223> SP0486 <400> 443 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgg ggctggctga aaggatgtct atatgtgtat ttttatcacc catgtgtcgg 240 atgagcctga gagctgccag atagctttct cgacagcttg gcgttagtgt tgggaacagg 300 tccatgtatg gaagcgaaag ccgaaaggca cagataagct aagagccagc tatgcagcca 360 tgcttagaga cactaaggac aggctccccg ggtcctttct ttctggtcta tctggagcag 420 ccttcagagc tggtcggttt ctcatccagc ccatgcagcc acc 463 <210> 444 <211> 337 <212> DNA <213> Artificial Sequence <220> <223> SP0487 <400> 444 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctga agatacctca gctggatgga atttgtctat atttagcagg tggctagcag 240 gaggctgata agcagggctg gggagggggc agtcctcata aatagtgaga acacaggaca 300 ctgttcagtc cctccttggg tggcctgctt ggccacc 337 <210> 445 <211> 544 <212> DNA <213> Artificial Sequence <220> <223> SP0488 <400> 445 taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60 gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120 atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180 acatttcttc ctgattcgca tacgccgcgg ccagcttgtc atctccctct tgggcttccc 240 agacactaag tctggaatga aaattcacct gcctctgaat tggccactgg ataaataccc 300 gctctggtat ttggggttct cctctataaa tacccgctct ggtatttggg gttggcagct 360 gttgcgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 420 aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 480 gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgcggccgc 540 cacc 544 <210> 446 <211> 553 <212> DNA <213> Artificial Sequence <220> <223> SP0489 <400> 446 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgg tctagactct tggatttgag agaagaggga ccttgctccg ggttttccta 240 agtttgaggg aggagggagc tggggcgcta gagtcaaagg aggaggggtg tagatcctgg 300 gcaccttggt tgacccaact ggagctttgc acacggctcc cctcacaccc tgttatcgct 360 tatcctgggc aggggaggag acagcagtat atttagtctt tgtcctcgcc ccttatctca 420 gtgtcctcag tgaggcttga gcagcccaga ggaaacccaa cctctagaga cctccaaggt 480 caccagggac acccttccag gaccctccag gaatctccga tcctgttctc tgcctctgga 540 gatcatcgcc acc 553 <210> 447 <211> 497 <212> DNA <213> Artificial Sequence <220> <223> SP0490 <400> 447 gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60 gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120 cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180 gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata tatgtctata 240 ttaggtgacg cagaactgcc cgtcgctcct gtcatccagg cccctggccc aatggcaggc 300 tgaatccccc ctactccagc ctgctcccgc ctcttctgcc cctggtgctc cgcgctacct 360 gctgccgcgc gccacatcca gggcagagag gcgggtgcgc gggcgggcgg cgggcaccat 420 gcggggaggc tgtccccagg ggtgggcagc accactctct gctacccacc tggcgctgtg 480 aaacctgcgt cgccacc 497 <210> 448 <211> 478 <212> DNA <213> Artificial Sequence <220> <223> SP0491 <400> 448 cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60 aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120 ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180 aaaatagcag ccaacacccc ccattgtgtt gtatgtctat attaggtgac gcagaactgc 240 ccgtcgctcc tgtcatccag gcccctggcc caatggcagg ctgaatcccc cctactccag 300 cctgctcccg cctcttctgc ccctggtgct ccgcgctacc tgctgccgcg cgccacatcc 360 agggcagaga ggcgggtgcg cgggcgggcg gcgggcacca tgcggggagg ctgtccccag 420 gggtgggcag caccactctc tgctacccac ctggcgctgt gaaacctgcg tcgccacc 478 <210> 449 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> SP0492 <400> 449 gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60 gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120 cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180 gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata aagatacctc 240 agctggatgg aatttgtcta tatttagcag gtggctagca ggaggctgat aagcagggct 300 ggggaggggg cagtcctcat aaatagtgag aacacaggac actgttcagt ccctccttgg 360 gtggcctgct tggccacc 378 <210> 450 <211> 359 <212> DNA <213> Artificial Sequence <220> <223> SP0493 <400> 450 cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60 aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120 ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180 aaaatagcag ccaacacccc ccattgtgtt gaagatacct cagctggatg gaatttgtct 240 atatttagca ggtggctagc aggaggctga taagcagggc tggggagggg gcagtcctca 300 taaatagtga gaacacagga cactgttcag tccctccttg ggtggcctgc ttggccacc 359 <210> 451 <211> 545 <212> DNA <213> Artificial Sequence <220> <223> SP0494 <400> 451 aaacttaagt gctgaagata gcacttgcct ggttctattt tagtaggtcc ctggcagcca 60 gtcagcaagt gcagttgctc aagtgtgctt ttggatcatt gagtttcgtg tactggccat 120 atcaggacaa ggagaggcca tgggaaaaaa tagtccagca tctgatagtg tcaggtagtg 180 ttatccctgt cagggtgaca gttgaagtgt ttgagtaata gcagtgtcag cagatgccca 240 gagtttaaca tgtactcact tcaaaaggga cagctgatct aagtgctgga tataaatacc 300 cgctctggta tttggggttc tcctctataa atacccgctc tggtatttgg ggttggcagc 360 tgttgcggga tcttgcagct gtcaggggag gggaggcggg ggctgatgtc aggagggata 420 caaatagtgc cgacggctgg gggccctgtc tcccctcgcc gcatccactc tccggccggc 480 cgcctgcccg ccgcctcctc cgtgcgcccg ccagcctcgc ccgcgccgtc accgcggccg 540 ccacc 545 <210> 452 <211> 567 <212> DNA <213> Artificial Sequence <220> <223> SP0495 <400> 452 gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60 gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120 cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180 gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata cccttcagat 240 taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct cctgtctctc 300 ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta aaaaaaggcc 360 atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg gccctgctga 420 agatacctca gctggatgga atttgtctat atttagcagg tggctagcag gaggctgata 480 agcagggctg gggagggggc agtcctcata aatagtgaga acacaggaca ctgttcagtc 540 cctccttggg tggcctgctt ggccacc 567 <210> 453 <211> 548 <212> DNA <213> Artificial Sequence <220> <223> SP0496 <400> 453 cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60 aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120 ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180 aaaatagcag ccaacacccc ccattgtgtt gcccttcaga ttaaaaataa ctgaggtaag 240 ggcctgggta ggggaggtgg tgtgagacgc tcctgtctct cctctatctg cccatcggcc 300 ctttggggag gaggaatgtg cccaaggact aaaaaaaggc catggagcca gaggggcgag 360 ggcaacagac ctttcatggg caaaccttgg ggccctgctg aagatacctc agctggatgg 420 aatttgtcta tatttagcag gtggctagca ggaggctgat aagcagggct ggggaggggg 480 cagtcctcat aaatagtgag aacacaggac actgttcagt ccctccttgg gtggcctgct 540 tggccacc 548 <210> 454 <211> 418 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0433 <400> 454 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgc accgcggtgg cggccgtccg ccctcggcac catcctcacg acacccaaat 240 atggcgacgg gtgaggaatg gtggggagtt atttttagag cgtaaacgag ctattagttg 300 cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc ggaggaatgg 360 tggacaccca aatatggcga cggttcctca cccgtcgcca tatttgggtg tccgccct 418 <210> 455 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0436 <400> 455 cccttcagat taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct 60 cctgtctctc ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta 120 aaaaaaggcc atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg 180 gccctgctgc ccttcagatt aaaaataact gaggtaaggg cctgggtagg ggaggtggtg 240 tgagacgctc ctgtctctcc tctatctgcc catcggccct ttggggagga ggaatgtgcc 300 caaggactaa aaaaaggcca tggagccaga ggggcgaggg caacagacct ttcatgggca 360 aaccttgggg ccctgctg 378 <210> 456 <211> 533 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0449 <400> 456 tctgactggg tcccttacca ctgtctttgc aaatggcatt tccattaaca tttctatttc 60 tggccattag gggcacctaa agatttccca ccaagattga cagccactat tttaagaaag 120 tgcttttaaa aagccagtgc ttttgctaag tttaaatctg actttctcag gggatgctta 180 aaagaaatac acagtttgtt tgtttttttt ttaagaacct ttgcaagttc aaaataacat 240 tccagaagga gtcactagaa aaacattcaa gggaagagaa aaaaattgtt ttcgtttgta 300 gcagacctgg cttcatccaa atgttctatt tgttttttac tgcacccttc agattaaaaa 360 taactgaggt aagggcctgg gtaggggagg tggtgtgaga cgctcctgtc tctcctctat 420 ctgcccatcg gccctttggg gaggaggaat gtgcccaagg actaaaaaaa ggccatggag 480 ccagaggggc gagggcaaca gacctttcat gggcaaacct tggggccctg ctg 533 <210> 457 <211> 575 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0450 <400> 457 aaactttaaa gattagctat taaaaatgcc attttacata aattaattgg tttttatcag 60 agtagtataa tagtaaacta ctttttgtct aatgacttct gttcacaggt gaagtggtat 120 aatctgccct tgtttatatt tttggttgtc tgaataagat gggaaatatt tttaatatgc 180 aggggcagta gtgaggcacc aagattccat gcacttcctg tcagcaaagg tatcaactgc 240 caggaacccc tgataagtcc tattttgagc aagcagtgtc aggataacag aagacagaca 300 cagtttactg ctgtgaggct ggcagcagag ccaactgcac taccatccta atcacaacag 360 acactctgga gttagacaaa gccaagccct tcagattaaa aataactgag gtaagggcct 420 gggtagggga ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg 480 gggaggagga atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa 540 cagacctttc atgggcaaac cttggggccc tgctg 575 <210> 458 <211> 611 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0451 <400> 458 gaagcaacac atgccccttc ccaaaaatat ctagccagtg cctaatgcca gattgtcaag 60 tagaaagtct gtccagcagt gagacggagg tcgttctcct aatctgtcct gcattcccct 120 gcactctaaa aggagatcca ccaggccagg acaggcaagt tggctctaca cgtagctgca 180 aatagaagca gggctcaagc catccatagc tcgactcact tactaaataa ggatgaaaca 240 ataccgggtt cacttctctg acacattccc ctgtctacga cgagggctgg gtggagagag 300 cagggaagtc cacagtgcac tattgttagc ctttatcaag aaacatgaca aatgaccctg 360 aaatggagcc tcttatcacc caaacctctc cacagcctgc acaaggagca gctgcagtcc 420 atcccttcag attaaaaata actgaggtaa gggcctgggt aggggaggtg gtgtgagacg 480 ctcctgtctc tcctctatct gcccatcggc cctttgggga ggaggaatgt gcccaaggac 540 taaaaaaagg ccatggagcc agaggggcga gggcaacaga cctttcatgg gcaaaccttg 600 gggccctgct g 611 <210> 459 <211> 603 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0452 <400> 459 gggataaaag cagtctgggc tttcacatga cagcatctgg ggctgcggca gagggtcggg 60 tccgaagcgc tgccttatca gcgtccccag ccctgggagg tgacagctgg ctggcttgtg 120 tcagcccctc gggcactcac gtatctccgt ccgacgggtt taaaatagca aaactctgag 180 gccacacaat agcttgggct tatatgggct cctgtggggg aagggggagc acggaggggg 240 ccggggccgc tgctgccaaa atagcagctc acaagtgttg cattcctctc tgggcgccgg 300 gcacattcct gctggctctg cccgccccgg ggtgggcgcc ggggggacct taaagcctct 360 gccccccaag gagcccttcc cagacagccg ccggcaccca ccgctccgtg ggaccccttc 420 agattaaaaa taactgaggt aagggcctgg gtaggggagg tggtgtgaga cgctcctgtc 480 tctcctctat ctgcccatcg gccctttggg gaggaggaat gtgcccaagg actaaaaaaa 540 ggccatggag ccagaggggc gagggcaaca gacctttcat gggcaaacct tggggccctg 600 ctg 603 <210> 460 <211> 419 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0495 <400> 460 gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60 gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120 cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180 gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata cccttcagat 240 taaaaataac tgaggtaagg gcctgggtag gggaggtggt gtgagacgct cctgtctctc 300 ctctatctgc ccatcggccc tttggggagg aggaatgtgc ccaaggacta aaaaaaggcc 360 atggagccag aggggcgagg gcaacagacc tttcatgggc aaaccttggg gccctgctg 419 <210> 461 <211> 400 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0496 <400> 461 cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60 aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120 ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180 aaaatagcag ccaacacccc ccattgtgtt gcccttcaga ttaaaaataa ctgaggtaag 240 ggcctgggta ggggaggtgg tgtgagacgc tcctgtctct cctctatctg cccatcggcc 300 ctttggggag gaggaatgtg cccaaggact aaaaaaaggc catggagcca gaggggcgag 360 ggcaacagac ctttcatggg caaaccttgg ggccctgctg 400 <210> 462 <211> 247 <212> DNA <213> Artificial Sequence <220> <223> CRE0105 <400> 462 ccagcagttt catccctaga ccatcccaaa catggttgag aagctctgag gggaggaccc 60 agcactgccc ggcccctgaa gtatctaatc agcagtcctg ctcagcatat caatccaagc 120 ccactctaga cagagatgcc ggtgcccagt tttctatttt taactggtgt gaactgaagg 180 aaaagcacag cattagaagt ccaagcacta gtcaagaacc aagaatacag ggcaccccag 240 ggcaagc 247 <210> 463 <211> 230 <212> DNA <213> Artificial Sequence <220> <223> CRE0106 <400> 463 gtcaccctct gcttccctgc atgggtcctg ttgccaggga gaaagaatcc tgaggcgagc 60 gcccaggaag ataaccaagg actcttttct gctcctctca cacctttgaa gtgggggcct 120 cttgaggcaa atcagcaaga atgtgactct tgcagctgag ggtctggggg aggggggtga 180 gtggagctgc tcaaggcaaa ggggccgtga caagctttgc cgaactgata 230 <210> 464 <211> 211 <212> DNA <213> Artificial Sequence <220> <223> CRE0107 <400> 464 cctgggctcc tggcatctgc tttatcggga ttctcaagag ggacagctgg tttatgttac 60 aagcctgttc cctgcatatc tgctctggtt ttaaatagct ttatctgagc agctggagga 120 ccacatgagc ttatatggcg tggggtactt gttcttttag ccctgtgccg ggcacctgcc 180 aaaatagcag ccaacacccc ccattgtgtt g 211 <210> 465 <211> 202 <212> DNA <213> Artificial Sequence <220> <223> CRE0108 <400> 465 ccagttgttc aactcaccct tcagattaaa aataactgag gtaagggcct gggtagggga 60 ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg gggaggagga 120 atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa cagacctttc 180 atgggcaaac cttggggccc tg 202 <210> 466 <211> 242 <212> DNA <213> Artificial Sequence <220> <223> CRE0109 <400> 466 tgctgagccc agaaaaactg accgccctgt gtcctgccca cctccacact ctagagctat 60 attgagaggt gacagtagat agggtgggag ctggtagcag ggagagtgtt cctgggtgtg 120 agggtgtagg ggaaagccag agcaggggag tctggctttg cctcctgaac acaatgtcta 180 cttagttata acaggcatga cctgctaaag acccaacatc tacgacctct gaaaagacag 240 ca 242 <210> 467 <211> 263 <212> DNA <213> Artificial Sequence <220> <223> CRE0111 <400> 467 agcggagccg agggggcagc gcgtgacccc gagcggaagg gccccagtct gggtcctaat 60 gcgggtggcg tctctcttga caggcagcgt ttggggacaa cagcggggaa gggagataag 120 atgacatacc agagcagatt tggtgtgcgc gctgatactc ctggcccgac aggaaactcg 180 gagctattta aaaaggccct atcgattact ttatcttccc cggaggaaaa cttcttgccg 240 agagacaaaa gatgtccccc tac 263 <210> 468 <211> 188 <212> DNA <213> Artificial Sequence <220> <223> CRE0114 <400> 468 cctctagagg caggtgacct tgatgaaagg ccttcagtgt gacacaggtg taaaaatagc 60 ctctgtgctg acttaactcc ctggcttgag caaacggccc ctcacacctg tatattgttt 120 gcttggcata gacacactgc tacctgtttg caggtgtaaa tgactgttta tgtacccaga 180 gttatgag 188 <210> 469 <211> 290 <212> DNA <213> Artificial Sequence <220> <223> CRE0117 <400> 469 taagtgtgat gcacagtgct tgcattttct tgatacgtta gtcatatgag agctgacaaa 60 gaaggaaaaa gagcagcgat gtggtgcaat attaacaggc agctgtcccc tggcttcccg 120 atacgtggga tgactcgcat tgctgagcgg tgtggtcact gccaaaggaa tgaccctctc 180 acatttcttc ctgattcgca tacgccgcgg ccagcttgtc atctccctct tgggcttccc 240 agacactaag tctggaatga aaattcacct gcctctgaat tggccactgg 290 <210> 470 <211> 291 <212> DNA <213> Artificial Sequence <220> <223> CRE0118 <400> 470 aaacttaagt gctgaagata gcacttgcct ggttctattt tagtaggtcc ctggcagcca 60 gtcagcaagt gcagttgctc aagtgtgctt ttggatcatt gagtttcgtg tactggccat 120 atcaggacaa ggagaggcca tgggaaaaaa tagtccagca tctgatagtg tcaggtagtg 180 ttatccctgt cagggtgaca gttgaagtgt ttgagtaata gcagtgtcag cagatgccca 240 gagtttaaca tgtactcact tcaaaaggga cagctgatct aagtgctgga t 291 <210> 471 <211> 265 <212> DNA <213> Artificial Sequence <220> <223> CRE0038 <400> 471 ggccccagcc actgtctctt taaccttgaa ggcatttttg ggtctcacgt gtccacccag 60 gcgggtgtcg gactttgaac ggctcttact tcagaagaac ggcatggggt gggggggctt 120 aggtggcctc tgcctcacct acaactgcca aaagtggtca tggggttatt tttaacccca 180 gggaagaggt atttattgtt ccacagcagg ggccggccag caggctcctt gaattcttca 240 gaggcagcag ccagcctcag acacc 265 <210> 472 <211> 358 <212> DNA <213> Artificial Sequence <220> <223> CRE0104 <400> 472 gtctagactc ttggatttga gagaagaggg accttgctcc gggttttcct aagtttgagg 60 gaggagggag ctggggcgct agagtcaaag gaggaggggt gtagatcctg ggcaccttgg 120 ttgacccaac tggagctttg cacacggctc ccctcacacc ctgttatcgc ttatcctggg 180 caggggagga gacagcagta tatttagtct ttgtcctcgc cccttatctc agtgtcctca 240 gtgaggcttg agcagcccag aggaaaccca acctctagag acctccaagg tcaccaggga 300 cacccttcca ggaccctcca ggaatctccg atcctgttct ctgcctctgg agatcatc 358 <210> 473 <211> 267 <212> DNA <213> Artificial Sequence <220> <223> CRE0110 <400> 473 tatgtctata ttaggtgacg cagaactgcc cgtcgctcct gtcatccagg cccctggccc 60 aatggcaggc tgaatccccc ctactccagc ctgctcccgc ctcttctgcc cctggtgctc 120 cgcgctacct gctgccgcgc gccacatcca gggcagagag gcgggtgcgc gggcgggcgg 180 cgggcaccat gcggggaggc tgtccccagg ggtgggcagc accactctct gctacccacc 240 tggcgctgtg aaacctgcgt cgccacc 267 <210> 474 <211> 258 <212> DNA <213> Artificial Sequence <220> <223> CRE0112 <400> 474 ggccccagcc actgactctt taaccttgaa ggcatttttg ggtctcacgt gtccacccag 60 gcgggtggcc gcctttgagc agctcttact tcagaagaac ggcatggagt ggggggtggg 120 gggcttaggt ggcctccgcc tcacctacaa ctgccaaaag tggtcatggg gttattttta 180 accccagggg agaggtattt attgttccac agcaggggca gaggccagca ggctcctcga 240 actctccaga ggtggcaa 258 <210> 475 <211> 153 <212> DNA <213> Artificial Sequence <220> <223> CRE0113 <400> 475 gactcgctga attaatgaat cacttttctt atctattttt tgctgttatc taattctgag 60 agggaagccg ggagcagagg gagttgggag acgtagctca caacgtctcc ctcccacccg 120 gctcaaacag gctggaatct ctgggcctag agg 153 <210> 476 <211> 268 <212> DNA <213> Artificial Sequence <220> <223> CRE0115 <400> 476 gggctggctg aaaggatgtc tatatgtgta tttttatcac ccatgtgtcg gatgagcctg 60 agagctgcca gatagctttc tcgacagctt ggcgttagtg ttgggaacag gtccatgtat 120 ggaagcgaaa gccgaaaggc acagataagc taagagccag ctatgcagcc atgcttagag 180 acactaagga caggctcccc gggtcctttc tttctggtct atctggagca gccttcagag 240 ctggtcggtt tctcatccag cccatgca 268 <210> 477 <211> 142 <212> DNA <213> Artificial Sequence <220> <223> CRE0116 <400> 477 aagatacctc agctggatgg aatttgtcta tatttagcag gtggctagca ggaggctgat 60 aagcagggct ggggaggggg cagtcctcat aaatagtgag aacacaggac actgttcagt 120 ccctccttgg gtggcctgct tg 142 <210> 478 <211> 340 <212> DNA <213> Artificial Sequence <220> <223> SP0437 <400> 478 caccgcggtg gcggccgtcc gccctcggat agctcgttta gacacccaaa tatggcgacg 60 gtaaacgagc tattgggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccacg agctacccgg aggagcggga ggcggccacc 340 <210> 479 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> SP0438 <400> 479 caccgcggtg gcggccgtcc gccctcggat agctcgttta gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360 ccacc 365 <210> 480 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> SP0439 <400> 480 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 gtaaacgagc tattgggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360 ccacc 365 <210> 481 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> SP0440 <400> 481 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcggagga atggtggaca 420 cccaaatatg gcgacggttc ctcacccgtc gccatatttg ggtgtccgcc ctcggccggg 480 gccgcattcc tgggggccgg gcggtgctcc cgcccgcctc gataaaaggc tccggggccg 540 gcggcggccc acgagctacc cggaggagcg ggaggcgccg ccacc 585 <210> 482 <211> 546 <212> DNA <213> Artificial Sequence <220> <223> SP0441 <400> 482 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcgcccgt cgccatattt 420 gggtgtccgc cctcggccgg ggccgcattc ctgggggccg ggcggtgctc ccgcccgcct 480 cgataaaagg ctccggggcc ggcggcggcc cacgagctac ccggaggagc gggaggcgcc 540 gccacc 546 <210> 483 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> SP0442 <400> 483 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420 cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ctcggccggg 480 gccgcattcc tgggggccgg gcggtgctcc cgcccgcctc gataaaaggc tccggggccg 540 gcggcggccc acgagctacc cggaggagcg ggaggcgccg ccacc 585 <210> 484 <211> 328 <212> DNA <213> Artificial Sequence <220> <223> SP0443 <400> 484 ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 60 tggggagcta tttttagagc gtaaacgagc tattagttgc agcaggtgtt ggcgctctaa 120 aaatagctcc cgggagctat ttttagagcg gaggaatggt ggacacccaa atatggcgac 180 ggttcctcac ccgtcgccat atttgggtgt ccgccctcgg ccggggccgc attcctgggg 240 gccgggcggt gctcccgccc gcctcgataa aaggctccgg ggccggcggc ggcccacgag 300 ctacccggag gagcgggagg cggccacc 328 <210> 485 <211> 328 <212> DNA <213> Artificial Sequence <220> <223> SP0444 <400> 485 ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 60 tggggagcta tttttagagc gtaaacgagc tattagttgc agcaggtgtt ggcgctctaa 120 aaatagctcc cgggagctat ttttagagcg agctctataa atacccgctc tggtatttgg 180 ggttttgaac ccgtcgccat atttgggtgt ccgccctcgg ccggggccgc attcctgggg 240 gccgggcggt gctcccgccc gcctcgataa aaggctccgg ggccggcggc ggcccacgag 300 ctacccggag gagcgggagg cggccacc 328 <210> 486 <211> 436 <212> DNA <213> Artificial Sequence <220> <223> SP0445 <400> 486 acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60 ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120 gagctctata aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg 180 tccgccctat aaatacccgc tctggtattt ggggttctcc tctataaata cccgctctgg 240 tatttggggt tggcagctgt tgcgggatct tgcagctgtc aggggagggg aggcgggggc 300 tgatgtcagg agggatacaa atagtgccga cggctggggg ccctgtctcc cctcgccgca 360 tccactctcc ggccggccgc ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg 420 cgccgtcacc gccacc 436 <210> 487 <211> 464 <212> DNA <213> Artificial Sequence <220> <223> SP0446 <400> 487 agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60 gctgtggagt cagctggctt ccaaggtgcc tgggatcttt tcgttctgcc cttggctcct 120 gccctaactg gcaaacccca catgttcccg gcgaagggcc agctgtcccc cgccagctag 180 actcagcact tagtttagga accagtgagc aagtcagccc ttggggcagc ccatacaagg 240 ccatggggct gggcaagctg cacgcctggg tccggggtgg gcacggtgcc cgggcaacga 300 gctgaaagct catctgctct caggggcccc tccctgggga cagcccctcc tggctagtca 360 caccctgtag gctcctctat ataacccagg ggcacagggg ctgccctcat tctaccacca 420 cctccacagc acagacagac actcaggagc cagccagcgc cacc 464 <210> 488 <211> 291 <212> DNA <213> Artificial Sequence <220> <223> SP0447 <400> 488 ggccgtccgc cctcgggaca cccaaatatg gcgacggggg agttattttt agagcgggca 60 ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga gcggaggaat 120 ggtggacacc caaatatggc gacggttcct cacccgtcgc catatttggg tgtccgccct 180 cggccggggc cgcattcctg ggggccgggc ggtgctcccg cccgcctcga taaaaggctc 240 cggggccggc ggcggcccac gagctacccg gaggagcggg aggcggccac c 291 <210> 489 <211> 761 <212> DNA <213> Artificial Sequence <220> <223> SP0453 <400> 489 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cctataaata cccgctctgg tatttggggt 540 tctcctctat aaatacccgc tctggtattt ggggttggca gctgttgcgg gatcttgcag 600 ctgtcagggg aggggaggcg ggggctgatg tcaggaggga tacaaatagt gccgacggct 660 gggggccctg tctcccctcg ccgcatccac tctccggccg gccgcctgcc cgccgcctcc 720 tccgtgcgcc cgccagcctc gcccgcgccg tcaccgccac c 761 <210> 490 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> SP0454 <400> 490 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420 cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ctataaatac 480 ccgctctggt atttggggtt ctcctctata aatacccgct ctggtatttg gggttggcag 540 ctgttgcggg atcttgcagc tgtcagggga ggggaggcgg gggctgatgt caggagggat 600 acaaatagtg ccgacggctg ggggccctgt ctcccctcgc cgcatccact ctccggccgg 660 ccgcctgccc gccgcctcct ccgtgcgccc gccagcctcg cccgcgccgt caccgccacc 720 720 <210> 491 <211> 551 <212> DNA <213> Artificial Sequence <220> <223> SP0455 <400> 491 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120 ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180 ctggtttctc caactgagtc ctgaggtttg gcaccgcggt ggcggccgtc cgccctcggc 240 accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 300 agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 360 tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 420 catatttggg tgtccgccct cggccggggc cgcattcctg ggggccgggc ggtgctcccg 480 cccgcctcga taaaaggctc cggggccggc ggcggcccac gagctacccg gaggagcggg 540 aggcggccac c 551 <210> 492 <211> 688 <212> DNA <213> Artificial Sequence <220> <223> SP0456 <400> 492 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120 ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180 ctggtttctc caactgagtc ctgaggtttg gcaccgcggt ggcggccgtc cgccctcggc 240 accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 300 agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 360 tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 420 catatttggg tgtccgccct ataaataccc gctctggtat ttggggttct cctctataaa 480 tacccgctct ggtatttggg gttggcagct gttgcgggat cttgcagctg tcaggggagg 540 ggaggcgggg gctgatgtca ggagggatac aaatagtgcc gacggctggg ggccctgtct 600 cccctcgccg catccactct ccggccggcc gcctgcccgc cgcctcctcc gtgcgcccgc 660 cagcctcgcc cgcgccgtca ccgccacc 688 <210> 493 <211> 621 <212> DNA <213> Artificial Sequence <220> <223> SP0457 <400> 493 ccccacagca gctgggggca tttatgggcc ttcctataaa cttctgagag ggtaacttta 60 tcctgcttct ttcagccaag tatcctcctc caaggcagtg tatactcttc cataaacgag 120 ctattagtta tgaggtcaaa cccgtgactc acagcacagc cagtgtgggg gagggggtgg 180 ctgcctccaa tacgtggcgc ccagagtcag ctgttctggg gccttctctg gtttctccaa 240 ctgagtcctg aggtttggtg acggaattcg gccgaacggg acaccgcggt ggcggccgtc 300 cgccctcggc accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag 360 ttatttttag agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac 420 tcccgggagt tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct 480 cacccgtcgc catatttggg tgtccgccct cggccggggc cgcattcctg ggggccgggc 540 ggtgctcccg cccgcctcga taaaaggctc cggggccggc ggcggcccac gagctacccg 600 gaggagcggg aggcggccac c 621 <210> 494 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> SP0458 <400> 494 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cctttctcct ctataaatac ccgctctggt 540 atttggggtt ggcagctgtt gctgccaggg agatggttgg gttgacggga tcttgcagct 600 gtcaggggag gggaggcggg ggctgatgtc aggagggata caaatagtgc cgacggctgg 660 gggccctgtc tcccctcgcc gcatccactc tccggccggc cgcctgcccg ccgcctcctc 720 cgtgcgcccg ccagcctcgc ccgcgccgtc accgccacc 759 <210> 495 <211> 837 <212> DNA <213> Artificial Sequence <220> <223> SP0459 <400> 495 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cctcatgttc ccggcgaagg gccagctgtc 540 ccccgccagc tagactcagc acttagttta ggaaccagtg agcaagtcag cccttggggc 600 agcccataca aggccatggg gctgggcaag ctgcacgcct gggtccgggg tgggcacggt 660 gcccgggcaa cgagctgaaa gctcatctgc tctcaggggc ccctccctgg ggacagcccc 720 tcctggctag tcacaccctg taggctcctc tatataaccc aggggcacag gggctgccct 780 cattctacca ccacctccac agcacagaca gacactcagg agccagccag cgccacc 837 <210> 496 <211> 298 <212> DNA <213> Artificial Sequence <220> <223> SP0460 <400> 496 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgcggccggg gccgcattcc 180 tgggggccgg gcggtgctcc cgcccgcctc gataaaaggc tccggggccg gcggcggccc 240 acgagctacc cggaggagcg ggaggcgcca agctctagaa ctagtggatc ccgccacc 298 <210> 497 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> SP0461 <400> 497 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgaggcagtg tatactcttc 180 cataaacgag ctattagtta tgaggtccgt agattgaaaa gggtgacggc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360 ccacc 365 <210> 498 <211> 356 <212> DNA <213> Artificial Sequence <220> <223> SP0462 <400> 498 ctctataaat acccgctctg gtatttgggg ttacacccaa atatggcgac gggtgaggaa 60 tggtggggag ttatttttag agcggtgagg aaggtgggca ggcagcaggt gttggcgctc 120 taaaaataac tcccgggagt tatttttaga gcggaggaat ggtggacacc caaatatggc 180 gacggttcct cacccgtcgc catatttggg tgtccgccct cggccggggc cgcattcctg 240 ggggccgggc ggtgctcccg cccgcctcga taaaaggctc cggggccggc ggcggcccac 300 gagctacccg gaggagcggg aggcgccaag ctctagaact agtggatccc gccacc 356 <210> 499 <211> 772 <212> DNA <213> Artificial Sequence <220> <223> SP0463 <400> 499 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cctccactac gggtctaggc tgcccatgta 540 aggaggcaag gcctggggac acccgagatg cctggttata attaacccag acatgtggct 600 gccccccccc ccccaacacc tgctgcctct aaaaataacc ctgtccctgg tggatcccct 660 gcatgcgaag atcttcgaac aaggctgtgg gggactgagg gcaggctgta acaggcttgg 720 gggccagggc ttatacgtgc ctgggactcc caaagtatta ctgttcgcca cc 772 <210> 500 <211> 837 <212> DNA <213> Artificial Sequence <220> <223> SP0464 <400> 500 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240 cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300 ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360 ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420 aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480 tgaggtttgg ggccttgtct tccttcctgg agtcatgttc ccggcgaagg gccagctgtc 540 ccccgccagc tagactcagc acttagttta ggaaccagtg agcaagtcag cccttggggc 600 agcccataca aggccatggg gctgggcaag ctgcacgcct gggtccgggg tgggcacggt 660 gcccgggcaa cgagctgaaa gctcatctgc tctcaggggc ccctccctgg ggacagcccc 720 tcctggctag tcacaccctg taggctcctc tatataaccc aggggcacag gggctgccct 780 cattctacca ccacctccac agcacagaca gacactcagg agccagccag cgccacc 837 <210> 501 <211> 772 <212> DNA <213> Artificial Sequence <220> <223> SP0465 <400> 501 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240 cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300 ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360 ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420 aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480 tgaggtttgg ggccttgtct tccttcctgg agtccactac gggtctaggc tgcccatgta 540 aggaggcaag gcctggggac acccgagatg cctggttata attaacccag acatgtggct 600 gccccccccc ccccaacacc tgctgcctct aaaaataacc ctgtccctgg tggatcccct 660 gcatgcgaag atcttcgaac aaggctgtgg gggactgagg gcaggctgta acaggcttgg 720 gggccagggc ttatacgtgc ctgggactcc caaagtatta ctgttcgcca cc 772 <210> 502 <211> 764 <212> DNA <213> Artificial Sequence <220> <223> SP0466 <400> 502 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc cacagcagct 240 gggggcattt atgggccttc ctataaactt ctgagagggt aactttatcc tgcttctttc 300 agccaagtat cctcctccaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt 360 ggctgcctcc aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc 420 aactgagtcc tgaggtttgg catgttcccg gcgaagggcc agctgtcccc cgccagctag 480 actcagcact tagtttagga accagtgagc aagtcagccc ttggggcagc ccatacaagg 540 ccatggggct gggcaagctg cacgcctggg tccggggtgg gcacggtgcc cgggcaacga 600 gctgaaagct catctgctct caggggcccc tccctgggga cagcccctcc tggctagtca 660 caccctgtag gctcctctat ataacccagg ggcacagggg ctgccctcat tctaccacca 720 cctccacagc acagacagac actcaggagc cagccagcgc cacc 764 <210> 503 <211> 671 <212> DNA <213> Artificial Sequence <220> <223> SP0467 <400> 503 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240 caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300 gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360 aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420 cctataaata cccgctctgg tatttggggt tctcctctat aaatacccgc tctggtattt 480 ggggttggca gctgttgcgg gatcttgcag ctgtcagggg aggggaggcg ggggctgatg 540 tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg ccgcatccac 600 tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc gcccgcgccg 660 tcaccgccac c 671 <210> 504 <211> 671 <212> DNA <213> Artificial Sequence <220> <223> SP0468 <400> 504 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ccactacggg 240 tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct ggttataatt 300 aacccagaca tgtggctgcc cccccccccc aacacctgct gcctgagcct cacccccacc 360 ccggtgcctg ggtcttaggc tctgtacacc atggaggaga agctcgctct aaaaataacc 420 ctgataaata cccgctctgg tatttggggt tctcctctat aaatacccgc tctggtattt 480 ggggttggca gctgttgcgg gatcttgcag ctgtcagggg aggggaggcg ggggctgatg 540 tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg ccgcatccac 600 tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc gcccgcgccg 660 tcaccgccac c 671 <210> 505 <211> 506 <212> DNA <213> Artificial Sequence <220> <223> SP0469 <400> 505 ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60 ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 120 gttctggggc cttctctggt ttctccaact gagtcctgag gtttggcacc gcggtggcgg 180 ccgtccgccc tcggcaccat cctcacgaca cccaaatatg gcgacgggtg aggaatggtg 240 gggagttatt tttagagcgg tgaggaaggt gggcaggcag caggtgttgg cgctctaaaa 300 ataactcccg ggagttattt ttagagcgga ggaatggtgg acacccaaat atggcgacgg 360 ttcctcaccc gtcgccatat ttgggtgtcc gccctcggcc ggggccgcat tcctgggggc 420 cgggcggtgc tcccgcccgc ctcgataaaa ggctccgggg ccggcggcgg cccacgagct 480 acccggagga gcgggaggcg gccacc 506 <210> 506 <211> 365 <212> DNA <213> Artificial Sequence <220> <223> SP0470 <400> 506 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggata aacgagctat gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgcata gctcgtttat cccgggataa acgagctatg cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc ggccggggcc 240 gcattcctgg gggccgggcg gtgctcccgc ccgcctcgat aaaaggctcc ggggccggcg 300 gcggcccacg agctacccgg aggagcggga ggcgccaagc tctagaacta gtggatcccg 360 ccacc 365 <210> 507 <211> 624 <212> DNA <213> Artificial Sequence <220> <223> SP0471 <400> 507 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240 cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300 ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360 ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420 aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480 tgaggtttgg ggccttgtct tccttcctgg agtcggccgg ggccgcattc ctgggggccg 540 ggcggtgctc ccgcccgcct cgataaaagg ctccggggcc ggcggcggcc cacgagctac 600 ccggaggagc gggaggcggc cacc 624 <210> 508 <211> 718 <212> DNA <213> Artificial Sequence <220> <223> SP0473 <400> 508 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420 cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ctttctcctc 480 tataaatacc cgctctggta tttggggttg gcagctgttg ctgccaggga gatggttggg 540 ttgacgggat cttgcagctg tcaggggagg ggaggcgggg gctgatgtca ggagggatac 600 aaatagtgcc gacggctggg ggccctgtct cccctcgccg catccactct ccggccggcc 660 gcctgcccgc cgcctcctcc gtgcgcccgc cagcctcgcc cgcgccgtca ccgccacc 718 <210> 509 <211> 465 <212> DNA <213> Artificial Sequence <220> <223> SP0474 <400> 509 ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60 ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 120 gttctggggc cttctctggt ttctccaact gagtcctgag gtttggacac ccaaatatgg 180 cgacgggtga ggaatggtgg ggagttattt ttagagcggt gaggaaggtg ggcaggcagc 240 aggtgttggc gctctaaaaa taactcccgg gagttatttt tagagcgagc tctataaata 300 cccgctctgg tatttggggt tttgaacccg tcgccatatt tgggtgtccg ccctcggccg 360 gggccgcatt cctgggggcc gggcggtgct cccgcccgcc tcgataaaag gctccggggc 420 cggcggcggc ccacgagcta cccggaggag cgggaggcgg ccacc 465 <210> 510 <211> 472 <212> DNA <213> Artificial Sequence <220> <223> CRM_ SP0440 <400> 510 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcggagga atggtggaca 420 cccaaatatg gcgacggttc ctcacccgtc gccatatttg ggtgtccgcc ct 472 <210> 511 <211> 433 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0441 <400> 511 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcgcccgt cgccatattt 420 gggtgtccgc cct 433 <210> 512 <211> 472 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0442 <400> 512 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420 cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ct 472 <210> 513 <211> 140 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0446 <400> 513 agctttgagg ctgtgggcag ctcagctgtc atgcgggcac acaggtgatg taagacaata 60 gctgtggagt cagctggctt ccaaggtgcc tgggatcttt tcgttctgcc cttggctcct 120 gccctaactg gcaaacccca 140 <210> 514 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0453 <400> 514 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cct 513 <210> 515 <211> 472 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0454 <400> 515 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420 cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ct 472 <210> 516 <211> 440 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0455 <400> 516 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120 ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180 ctggtttctc caactgagtc ctgaggtttg gcaccgcggt ggcggccgtc cgccctcggc 240 accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 300 agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 360 tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 420 catatttggg tgtccgccct 440 <210> 517 <211> 440 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0456 <400> 517 ccacagcagc tgggggcatt tatgggcctt cctataaact tctgagaggg taactttatc 60 ctgcttcttt cagccaagta tcctcctcca aaacccgtga ctcacagcac agccagtgtg 120 ggggaggggg tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct 180 ctggtttctc caactgagtc ctgaggtttg gcaccgcggt ggcggccgtc cgccctcggc 240 accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag ttatttttag 300 agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac tcccgggagt 360 tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct cacccgtcgc 420 catatttggg tgtccgccct 440 <210> 518 <211> 510 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0457 <400> 518 ccccacagca gctgggggca tttatgggcc ttcctataaa cttctgagag ggtaacttta 60 tcctgcttct ttcagccaag tatcctcctc caaggcagtg tatactcttc cataaacgag 120 ctattagtta tgaggtcaaa cccgtgactc acagcacagc cagtgtgggg gagggggtgg 180 ctgcctccaa tacgtggcgc ccagagtcag ctgttctggg gccttctctg gtttctccaa 240 ctgagtcctg aggtttggtg acggaattcg gccgaacggg acaccgcggt ggcggccgtc 300 cgccctcggc accatcctca cgacacccaa atatggcgac gggtgaggaa tggtggggag 360 ttatttttag agcggtgagg aaggtgggca ggcagcaggt gttggcgctc taaaaataac 420 tcccgggagt tatttttaga gcggaggaat ggtggacacc caaatatggc gacggttcct 480 cacccgtcgc catatttggg tgtccgccct 510 <210> 519 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0458 <400> 519 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cct 513 <210> 520 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0459 <400> 520 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cct 513 <210> 521 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0461 <400> 521 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cgaggcagtg tatactcttc 180 cataaacgag ctattagtta tgaggtccgt agattgaaaa gggtgacgg 229 <210> 522 <211> 220 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0462 <400> 522 ctctataaat acccgctctg gtatttgggg ttacacccaa atatggcgac gggtgaggaa 60 tggtggggag ttatttttag agcggtgagg aaggtgggca ggcagcaggt gttggcgctc 120 taaaaataac tcccgggagt tatttttaga gcggaggaat ggtggacacc caaatatggc 180 gacggttcct cacccgtcgc catatttggg tgtccgccct 220 <210> 523 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0463 <400> 523 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtcaccgc ggtggcggcc 300 gtccgccctc ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg 360 gagttatttt tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat 420 aactcccggg agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt 480 cctcacccgt cgccatattt gggtgtccgc cct 513 <210> 524 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0464 <400> 524 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240 cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300 ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360 ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420 aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480 tgaggtttgg ggccttgtct tccttcctgg agt 513 <210> 525 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0465 <400> 525 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240 cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300 ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360 ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420 aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480 tgaggtttgg ggccttgtct tccttcctgg agt 513 <210> 526 <211> 440 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0466 <400> 526 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctc cacagcagct 240 gggggcattt atgggccttc ctataaactt ctgagagggt aactttatcc tgcttctttc 300 agccaagtat cctcctccaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt 360 ggctgcctcc aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc 420 aactgagtcc tgaggtttgg 440 <210> 527 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0467 <400> 527 gccactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 60 tggttataat taacccagac atgtggctgc cccccccccc caacacctgc tgcctgagcc 120 tcacccccac cccggtgcct gggtcttagg ctctgtacac catggaggag aagctcgctc 180 taaaaataac cctgcaccgc ggtggcggcc gtccgccctc ggcaccatcc tcacgacacc 240 caaatatggc gacgggtgag gaatggtggg gagttatttt tagagcggtg aggaaggtgg 300 gcaggcagca ggtgttggcg ctctaaaaat aactcccggg agttattttt agagcggagg 360 aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 420 cct 423 <210> 528 <211> 423 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0468 <400> 528 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ccactacggg 240 tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct ggttataatt 300 aacccagaca tgtggctgcc cccccccccc aacacctgct gcctgagcct cacccccacc 360 ccggtgcctg ggtcttaggc tctgtacacc atggaggaga agctcgctct aaaaataacc 420 ctg 423 <210> 529 <211> 395 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0469 <400> 529 ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60 ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 120 gttctggggc cttctctggt ttctccaact gagtcctgag gtttggcacc gcggtggcgg 180 ccgtccgccc tcggcaccat cctcacgaca cccaaatatg gcgacgggtg aggaatggtg 240 gggagttatt tttagagcgg tgaggaaggt gggcaggcag caggtgttgg cgctctaaaa 300 ataactcccg ggagttattt ttagagcgga ggaatggtgg acacccaaat atggcgacgg 360 ttcctcaccc gtcgccatat ttgggtgtcc gccct 395 <210> 530 <211> 513 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0471 <400> 530 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccctg ggccccacag 240 cagctggggg catttatggg ccttcctata aacttctgag agggtaactt tatcctgctt 300 ctttcagcca agtatcctcc tccagcagct ggtcacaaag ctggttaatc tcccagagtg 360 ctcagcttaa aacccgtgac tcacagcaca gccagtgtgg gggagggggt ggctgcctcc 420 aatacgtggc gcccagagtc agctgttctg gggccttctc tggtttctcc aactgagtcc 480 tgaggtttgg ggccttgtct tccttcctgg agt 513 <210> 531 <211> 472 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0473 <400> 531 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtacaccc aaatatggcg 300 acgggtgagg aatggtgggg agttattttt agagcggtga ggaaggtggg caggcagcag 360 gtgttggcgc tctaaaaata actcccggga gttattttta gagcgagctc tataaatacc 420 cgctctggta tttggggttt tgaacccgtc gccatatttg ggtgtccgcc ct 472 <210> 532 <211> 354 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0474 <400> 532 ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60 ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 120 gttctggggc cttctctggt ttctccaact gagtcctgag gtttggacac ccaaatatgg 180 cgacgggtga ggaatggtgg ggagttattt ttagagcggt gaggaaggtg ggcaggcagc 240 aggtgttggc gctctaaaaa taactcccgg gagttatttt tagagcgagc tctataaata 300 cccgctctgg tatttggggt tttgaacccg tcgccatatt tgggtgtccg ccct 354 <210> 533 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.16 <400> 533 caccgcggtg gcggccgtcc gccctcggat agctcgttta gacacccaaa tatggcgacg 60 gtaaacgagc tattgggagt tatttttaga gcgtaaacga gctattagtt gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 534 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.17 <400> 534 caccgcggtg gcggccgtcc gccctcggat agctcgttta gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 535 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.18 <400> 535 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 gtaaacgagc tattgggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 536 <211> 149 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.19 <400> 536 acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60 ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120 gcccgtcgcc atatttgggt gtccgccct 149 <210> 537 <211> 188 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.5 <400> 537 acacccaaat atggcgacgg gtgaggaatg gtggggagtt atttttagag cggtgaggaa 60 ggtgggcagg cagcaggtgt tggcgctcta aaaataactc ccgggagtta tttttagagc 120 gagctctata aatacccgct ctggtatttg gggttttgaa cccgtcgcca tatttgggtg 180 tccgccct 188 <210> 538 <211> 217 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.20 <400> 538 ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 60 tggggagcta tttttagagc gtaaacgagc tattagttgc agcaggtgtt ggcgctctaa 120 aaatagctcc cgggagctat ttttagagcg gaggaatggt ggacacccaa atatggcgac 180 ggttcctcac ccgtcgccat atttgggtgt ccgccct 217 <210> 539 <211> 217 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.21 <400> 539 ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 60 tggggagcta tttttagagc gtaaacgagc tattagttgc agcaggtgtt ggcgctctaa 120 aaatagctcc cgggagctat ttttagagcg agctctataa atacccgctc tggtatttgg 180 ggttttgaac ccgtcgccat atttgggtgt ccgccct 217 <210> 540 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.22 <400> 540 ggccgtccgc cctcgggaca cccaaatatg gcgacggggg agttattttt agagcgggca 60 ggcagcaggt gttggcgctc taaaaataac tcccgggagt tatttttaga gcggaggaat 120 ggtggacacc caaatatggc gacggttcct cacccgtcgc catatttggg tgtccgccct 180 180 <210> 541 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.23 <400> 541 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggagt tatttttaga gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgctct aaaaataact cccgggagtt atttttagag cg 162 <210> 542 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> CNTRL_001 (67 bp) <400> 542 aggcagtgta tactcttcca taaacgagct attagttatg aggtccgtag attgaaaagg 60 gtgacgg 67 <210> 543 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> CRE0071.24 <400> 543 caccgcggtg gcggccgtcc gccctcggca ccatcctcac gacacccaaa tatggcgacg 60 ggtgaggaat ggtggggata aacgagctat gcggtgagga aggtgggcag gcagcaggtg 120 ttggcgcata gctcgtttat cccgggataa acgagctatg cggaggaatg gtggacaccc 180 aaatatggcg acggttcctc acccgtcgcc atatttgggt gtccgccct 229 <210> 544 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> CNTRL_001 <400> 544 aggcagtgta tactcttcca taaacgagct attagttatg aggtc 45 <210> 545 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> CRE0093.2 <400> 545 ccacagcagc tgggggcatt tctgagaggg taactttatc ctgcttcttt cagccaagta 60 60 <210> 546 <211> 106 <212> DNA <213> Artificial Sequence <220> <223> CRE0094.2 <400> 546 ctcacagcac agccagtgtg ggggaggggg tggctgcctc cgtggcgccc agagtcagct 60 gttctggggc cttctctggt ttctccaact gagtcctgag gtttgg 106 <210> 547 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> DES_MT_enhancer_48bp <400> 547 ttctcctcta taaatacccg ctctggtatt tggggttggc agctgttg 48 <210> 548 <211> 997 <212> DNA <213> Artificial Sequence <220> <223> SP0229A <400> 548 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300 gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360 ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420 cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480 cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540 ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600 tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660 agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720 cgccatattt gggtgtccgc cctcggccga ccctgataaa tacccgctct ggtatttggg 780 gttctcctct ataaataccc gctctggtat ttggggttgg cagctgttgc gggatcttgc 840 agctgtcagg ggaggggagg cgggggctga tgtcaggagg gatacaaata gtgccgacgg 900 ctgggggccc tgtctcccct cgccgcatcc actctccggc cggccgcctg cccgccgcct 960 cctccgtgcg cccgccagcc tcgcccgcgc cgtcacc 997 <210> 549 <211> 743 <212> DNA <213> Artificial Sequence <220> <223> CRM_SP0229A <400> 549 gggccccaca gcagctgggg gcatttatgg gccttcctat aaacttctga gagggtaact 60 ttatcctgct tctttcagcc aagtatcctc ctccagcagc tggtcacaaa gctggttaat 120 ctcccagagt gctcagctta aaacccgtga ctcacagcac agccagtgtg ggggaggggg 180 tggctgcctc caatacgtgg cgcccagagt cagctgttct ggggccttct ctggtttctc 240 caactgagtc ctgaggtttg gggccttgtc ttccttcctg gagtctctgt ctcctcaggt 300 gcctggctcc cagtccccag aacgcctctc ctgtaccttg cttcctagct gggcctttcc 360 ttctcctcta taaataccag ctctggtatt tcgccttggc agctgttgct gctagggaga 420 cggctggctt gacatgcatc tcctgacaaa acacaaaccc gtggtgtgag tgggtgtggg 480 cggtgtgagt agggggatga atcagagagg gggccaccgc ggtggcggcc gtccgccctc 540 ggcaccatcc tcacgacacc caaatatggc gacgggtgag gaatggtggg gagttatttt 600 tagagcggtg aggaaggtgg gcaggcagca ggtgttggcg ctctaaaaat aactcccggg 660 agttattttt agagcggagg aatggtggac acccaaatat ggcgacggtt cctcacccgt 720 cgccatattt gggtgtccgc cct 743 <210> 550 <211> 301 <212> DNA <213> Artificial Sequence <220> <223> CMV-IE 5'UTR and intron_v2 <400> 550 tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 60 atccagcctc cgcggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga 120 cgtaagtacc gcctatagac tctataggca cacccctttg gctcttatgc atgaacggtg 180 gagggcagtg tagtctgagc agtactcgtt gctgccgcgc gcgccaccag acataatagc 240 tgacagacta acagactgtt cctttccatg ggtcttttct gcagtcaccg tccttgacac 300 g 301

Claims (49)

  1. 서열번호 1 내지 137, 342 내지 367, 424 내지 453 및 478 내지 509 중 어느 하나에 따른 서열, 또는 이의 기능적 변이체; 또는
    서열번호 138 내지 269, 369 내지 394, 454 내지 461 및 510 내지 532 중 어느 하나에 따른 서열, 또는 이의 기능적 변이체를 포함하는 시스-조절 모듈(cis-regulatory module)을 포함하는 합성된 근육-특이적 프로모터.
  2. 제1항에 있어서, 서열번호 1 내지 137, 342 내지 367, 424 내지 453 및 478 내지 509 중 어느 하나와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함하는 것인, 합성된 근육-특이적 프로모터.
  3. 제1항에 있어서, b) 상기 시스-조절 모듈은 서열번호 138 내지 269, 369 내지 394, 454 내지 461 및 510 내지 532 중 어느 하나와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함하는 것인, 합성된 근육-특이적 프로모터.
  4. 제3항에 있어서, 프로모터 요소에 작동가능하게 연결된 상기 시스-조절 요소를 포함하는 것인, 합성된 근육-특이적 프로모터.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 기능적 변이체는 참조 프로모터 활성의 적어도 25%, 50%, 75%, 80%, 85%, 90%, 95% 또는 100%를 유지하는 것인, 합성된 근육-특이적 프로모터.
  6. 서열번호 293 내지 298, 301 내지 341, 395 내지 419, 462 내지 470 및 533 내지 546 중 어느 하나에 따른 서열, 또는 이들 중 어느 하나의 기능적 변이체를 포함하는 것인, 근육-특이적 시스-조절 요소(cis-regulatory element).
  7. 제6항에 있어서, 서열번호 293 내지 298, 301 내지 341, 395 내지 419, 462 내지 470 및 533 내지 546 중 어느 하나와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함하는 것인, 근육-특이적 시스-조절 요소.
  8. 제6항 또는 제7항에 따른 시스-조절 요소를 포함하는 합성된 근육-특이적 프로모터.
  9. 서열번호 299에 따른 서열, 또는 이의 기능적 변이체를 포함하는 단리된 인트론.
  10. 제9항에 있어서, 서열번호 299와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함하는 것인, 단리된 인트론.
  11. 제9항 또는 제10항에 따른 인트론을 포함하는 합성된 근육-특이적 프로모터.
  12. 서열번호 368에 따른 서열, 또는 이의 기능적 변이체를 포함하는 단리된 조절 요소.
  13. 제12항에 있어서, 서열번호 368과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함하는 것인, 단리된 조절 요소.
  14. 제12항 또는 제13항의 조절 요소를 포함하는 합성된 근육-특이적 프로모터.
  15. 서열번호 270 내지 292, 420 내지 423, 471 내지 477 및 300 중 어느 하나에 따른 서열, 또는 이의 기능적 변이체를 포함하는 단리된 최소 또는 근위 프로모터.
  16. 제15항에 있어서, 서열번호 270 내지 292, 420 내지 423, 471 내지 477 및 300과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 서열을 포함하는 것인, 단리된 최소 또는 근위 프로모터.
  17. 제15항 또는 제16항에 따른 최소 또는 근위 프로모터를 포함하는 합성된 근육-특이적 프로모터.
  18. 하기로 이루어진 그룹에서 선택된 2개 이상의 작동가능하게 연결된 시스-조절 요소를 포함하는 것인, 합성된 근육-특이적 시스-조절 모듈:
    CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
    CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
    CRE0020 (서열번호 303) 또는 이의 기능적 변이체; 및
    CRE0031 (서열번호 308) 또는 이의 기능적 변이체.
  19. 제18항에 있어서, 시스-조절 모듈이 프로모터 요소에 작동가능하게 연결된 경우 심장 및 골격 근육에서 활성이고, 시스-조절 모듈은 하기로 이루어진 그룹에서 선택된 2개 이상의 작동가능하게 연결된 시스-조절 요소를 포함하는 것인, 합성된 근육-특이적 시스-조절 모듈:
    - CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
    - CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
    - CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
    - CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
    - CRE0020 (서열번호 303) 또는 이의 기능적 변이체; 및
    - CRE0031 (서열번호 308) 또는 이의 기능적 변이체.
  20. 제19항에 있어서, 하기로 이루어진 그룹에서 선택된 시스-조절 요소의 조합, 또는 이들의 기능적 변이체를 포함하는 것인, 합성된 심장 및 골격 근육-특이적 시스-조절 모듈:
    CRE0035 및 CRE0031; CRE0035 및 CRE0036; CRE0029 및 CRE0071; CRE0035 및 CRE0020; CRE0020 및 CRE0071; 및 CRE0020 및 CRE0036.
  21. 제20항에 있어서, 상기 시스-조절 요소(CRE)는 기재된 순서대로 시스-조절 모듈에 존재하고 바람직하게는 서로 인접하는 것인, 합성된 심장 및 골격 근육-특이적 시스-조절 모듈, 또는 이의 기능적 변이체.
  22. 제19항 내지 제21항 중 어느 한 항에 있어서, CRM_SP0160 (서열번호 173), CRM_SP0163 (서열번호 176), CRM_SP0159 (서열번호 172), CRM_SP0162 (서열번호 175), CRM_SP0057 (서열번호 145), CRM_SP0156 (서열번호 169), CRM_SP0134 (서열번호 161), CRM_SP0158 (서열번호 171) 및 CRM_SP0161 (서열번호 174)로 이루어진 그룹으로부터 선택된 시스-조절 모듈, 또는 이들 중 어느 하나의 기능적 변이체를 포함하는 것인, 합성된 심장 및 골격 근육-특이적 시스-조절 모듈.
  23. 제18항에 있어서, 상기 시스-조절 모듈이 프로모터 요소에 작동가능하게 연결된 경우 골격 근육에서 활성이고, 상기 시스-조절 모듈은 하기로 이루어진 그룹에서 선택된 2개 이상의 작동가능하게 연결된 시스-조절 요소를 포함하는 것인, 합성된 근육-특이적 시스-조절 모듈:
    CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
    CRE0050 (서열번호 313) 또는 이의 기능적 변이체;
    CRE0020 (서열번호 303) 또는 이의 기능적 변이체;
    CRE0031 (서열번호 308) 또는 이의 기능적 변이체;
    CRE0047 (서열번호 312) 또는 이의 기능적 변이체;
    CRE0071 (서열번호 321) 또는 이의 기능적 변이체; 및
    DES_MT_enhancer_48bp(서열번호 547) 또는 이의 기능적 변이체.
  24. 제23항에 있어서, 하기로 이루어진 그룹에서 선택된 시스-조절 요소의 조합, 또는 이의 기능적 변이체를 포함하는 것인, 합성된 골격 근육- 특이적 시스-조절 모듈:
    CRE0035, DES_MT_enhancer_48 bp 및 DES_MT_enhancer_48 bp; CRE0035 및 CRE0031; CRE0035 및 CRE0020; CRE0047 및 CRE0020; CRE0020 및 CRE0071; 및 CRE0035 및 CRE0031.
  25. 제24항에 있어서, 상기 시스-조절 요소는 기재된 순서대로 시스-조절 모듈에 존재하고 바람직하게는 서로 인접하는 것인, 합성된 골격 근육-특이적 시스-조절 모듈, 또는 이의 기능적 변이체.
  26. 제23항 내지 제25항 중 어느 한 항에 있어서, CRM_SP0155 (서열번호 168), CRM_SP0160 (서열번호 173), CRM_SP0156 (서열번호 169), CRM_SP0164 (서열번호 177), CRM_SP0134 (서열번호 161) 및 CRM_SP0163 (서열번호 176)로 이루어지는 그룹에서 선택된 시스-조절 모듈, 또는 이들 중 어느 하나의 기능적 변이체를 포함하는 것인, 합성된 골격 근육-특이적 시스-조절 모듈.
  27. 제18항에 있어서, 시스-조절 모듈이 프로모터 요소에 작동가능하게 연결된 경우 심장 근육에서 활성이고, 시스-조절 모듈은 하기로 이루어진 그룹에서 선택된 2개 이상의 작동가능하게 연결된 시스-조절 요소를 포함하는 것인, 합성된 근육-특이적 시스-조절 모듈:
    - CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
    - CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
    - CRE0069 (서열번호 320) 또는 이의 기능적 변이체;
    - CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
    - CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
    - CRE0096 (서열번호 417) 또는 이의 기능적 변이체;
    - CRE0079 (서열번호 329) 또는 이의 기능적 변이체;
    - CRE0051 (서열번호 314) 또는 이의 기능적 변이체;
    - CRE0031 (서열번호 308) 또는 이의 기능적 변이체; 및
    - CRE0020 (서열번호 303) 또는 이의 기능적 변이체.
  28. 제27항에 있어서, 하기로 이루어진 그룹에서 선택된 시스-조절 요소의 조합, 또는 이들의 기능적 변이체를 포함하는, 합성된 심장 근육-특이적 시스-조절 모듈:
    CRE0020, CRE0029 및 CRE0071; CRE0020, CRE0069 및 CRE0071; CRE0029, CRE0035 및 CRE0071; CRE0020, CRE0020 및 CRE0071; CRE0020 및 CRE0071; CRE0079 및 CRE0071; CRE0035 및 CRE0071; CRE0029 및 CRE0071; CRE0035 및 CRE0036; CRE0069 및 CRE0051; CRE0069 및 CRE0071; CRE0035 및 CRE0031; CRE0035 및 CRE0035; CRE0079 및 CRE0035; CRE0020 및 CRE0036; CRE0069 및 CRE0035; CRE0029 및 CRE0071; CRE0071 및 CRE0035; CRE0035 및 CRE0020; CRE0029 및 CRE0035; CRE0035 및 CRE0036; CRE0020 및 CRE0035; 및 CRE0071 및 CRE0020.
  29. 제28항에 있어서, 상기 시스-조절 요소는 기재된 순서대로 시스-조절 모듈에 존재하고 바람직하게는 서로 인접하는 것인, 합성된 심장 근육-특이적 시스-조절 모듈, 또는 이의 기능적 변이체.
  30. 제27항 내지 제29항 중 어느 한 항에 있어서, CRM_SP0229 (서열번호 185), CRM_SP0228 (서열번호 184), CRM_SP0328 (서열번호 217), CRM_SP0229A(서열번호 549) , CRM_SP0349 (서열번호 236), CRM_SP0230 (서열번호 186), CRM_SP0279 (서열번호 198), CRM_SP0366 (서열번호 251), CRM_SP0467 (서열번호 527), CRM_SP0332 (서열번호 221), CRM_SP0057 (서열번호 145), CRM_SP0159 (서열번호 172), CRM_SP0134 (서열번호 161), CRM_SP0322 (서열번호 211), CRM_SP0327 (서열번호 216), CRM_SP0345 (서열번호 232), CRM_SP0160 (서열번호 173), CRM_SP0350 (서열번호 237), CRM_SP0346 (서열번호 233), CRM_SP0231 (서열번호 187), CRM_SP0309 (서열번호 202), CRM_SP0368 (서열번호 253), CRM_SP0158 (서열번호 171), CRM_SP0338 (서열번호 226), CRM_SP0364 (서열번호 249), CRM_SP0468 (서열번호 528), CRM_SP0232 (서열번호 188), CRM_SP0156 (서열번호 169), CRM_SP0306 (서열번호 200), CRM_SP0453 (서열번호 514), CRM_SP0459 (서열번호 520), CRM_SP0163 (서열번호 176), CRM_SP0162 (서열번호 175), CRM_SP0307 (서열번호 201), CRM_SP0471 (서열번호 530), CRM_SP0458 (서열번호 519), CRM_SP0161 (서열번호 174), CRM_SP0464 (서열번호 524), CRM_SP0463 (서열번호 523), CRM_SP0465 (서열번호 525)로 이루어진 그룹에서 선택된 시스-조절 모듈, 또는 이들 중 어느 하나의 기능적 변이체를 포함하는 것인, 합성된 심장 근육-특이적 시스-조절 모듈.
  31. 합성된 근육-특이적 프로모터로서,
    a) 제18항에 따른 근육-특이적 시스-조절 모듈; 또는
    b) 하기의 시스-조절 요소 중 적어도 하나로서:
    - CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
    - CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
    - CRE0020 (서열번호 303) 또는 이의 기능적 변이체; 및
    - CRE0031 (서열번호 308) 또는 이의 기능적 변이체
    하기의 프로모터 요소 중 적어도 하나에 작동가능하게 연결된 것을 포함하는 합성된 근육-특이적 프로모터:
    - CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
    - CRE0070 (서열번호 284) 또는 이의 기능적 변이체; 및
    - CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
  32. 제31항에 있어서, 상기 프로모터는 심장 및 골격 근육에서 활성이고,
    a) 제19항 내지 제22항 중 어느 한 항에 따른 시스-조절 모듈 또는
    b) 하기 시스-조절 요소 중 적어도 하나로서:
    - CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
    - CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
    - CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
    - CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
    - CRE0020 (서열번호 303) 또는 이의 기능적 변이체; 및
    - CRE0031 (서열번호 308) 또는 이의 기능적 변이체
    하기에서 선택된 프로모터 요소에 작동가능하게 연결된 것을 포함하는, 합성된 근육-특이적 프로모터:
    - CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
    - CRE0070 (서열번호 284) 또는 이의 기능적 변이체;
    - SKM_18 (서열번호 135) 또는 이의 기능적 변이체;
    - CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체;
    - CRE0049 (서열번호 278) 또는 이의 기능적 변이체;
    - CRE0048 (서열번호 277) 또는 이의 기능적 변이체;
    - CRE0011 (서열번호 291) 또는 이의 기능적 변이체;
    - SKM_14 (서열번호 287) 또는 이의 기능적 변이체;
    - CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
  33. 제32항에 있어서, SP0160, SP0159, SP0057, SP0156, SP0173, SP0134, SP0147, SP0066, SP0158, SP0068, SP0164, SP0042, SP0149, SP0148, SP0132, SP0136, SP0153, SP0155, SP0051 및 SP0154로 이루어진 그룹으로부터 선택된 합성된 심장 및 골격 프로모터, 또는 이들 중 어느 하나의 기능적 변이체.
  34. 제31항에 있어서, 상기 프로모터는 골격 근육에서 활성이고,
    a) 제23항 내지 제26항 중 어느 한 항에 따른 시스-조절 모듈 또는
    b) 하기 시스-조절 요소 중 적어도 하나로서:
    - CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
    - CRE0050 (서열번호 313) 또는 이의 기능적 변이체;
    - CRE0020 (서열번호 303) 또는 이의 기능적 변이체;
    - CRE0031 (서열번호 308) 또는 이의 기능적 변이체;
    - CRE0047 (서열번호 312) 또는 이의 기능적 변이체;
    - CRE0071 (서열번호 321) 또는 이의 기능적 변이체; 및
    - DES_MT_enhancer_48bp(서열번호 547) 또는 이의 기능적 변이체
    하기에서 선택된 프로모터 요소에 작동가능하게 연결된 것을 포함하는, 합성된 근육-특이적 프로모터:
    - CRE0049 (서열번호 278) 또는 이의 기능적 변이체;
    - CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
    - SKM_14 (서열번호 287) 또는 이의 기능적 변이체;
    - CRE0048 (서열번호 277) 또는 이의 기능적 변이체;
    - CRE0011_RSV(서열번호 291) 또는 이의 기능적 변이체;
    - CRE0070 (서열번호 284) 또는 이의 기능적 변이체; 및
    - CRE0046 (서열번호 276) 또는 이의 기능적 변이체.
  35. 제34항에 있어서, SP0155, SP0160, SP0156, SP0159, SP0164, SP0057, SP0158, SP0134, SP0146, SP0147, SP0148, SP0149, SP0165, SP0153, SP0051, SP0154, 또는 이들 중 어느 하나의 기능적 변이체로 이루어진 그룹으로부터 선택된 합성된 골격 프로모터 또는 이들 중 어느 하나의 기능적 변이체.
  36. 제31항에 있어서, 상기 프로모터는 심장 근육-특이적으로 활성이고,
    a) 제27항 내지 제30항 중 어느 한 항에 따른 시스-조절 모듈 또는
    b) 하기 시스-조절 요소 중 적어도 하나로서:
    - CRE0035 (서열번호 310) 또는 이의 기능적 변이체;
    - CRE0029 (서열번호 307) 또는 이의 기능적 변이체;
    - CRE0069 (서열번호 320) 또는 이의 기능적 변이체;
    - CRE0071 (서열번호 321) 또는 이의 기능적 변이체;
    - CRE0036 (서열번호 311) 또는 이의 기능적 변이체;
    - CRE0096 (서열번호 417) 또는 이의 기능적 변이체;
    - CRE0079 (서열번호 329) 또는 이의 기능적 변이체;
    - CRE0051 (서열번호 314) 또는 이의 기능적 변이체;
    - CRE0031 (서열번호 308) 또는 이의 기능적 변이체; 및
    - CRE0020 (서열번호 303) 또는 이의 기능적 변이체
    하기에서 선택된 프로모터 요소에 작동가능하게 연결된 것을 포함하는, 합성된 근육-특이적 프로모터:
    - SKM_18 (서열번호 135) 또는 이의 기능적 변이체;
    - CRE0070 (서열번호 284) 또는 이의 기능적 변이체;
    - CRE0010_ITGB1BP2 (서열번호 272) 또는 이의 기능적 변이체;
    - CRE0037 (서열번호 275) 또는 이의 기능적 변이체;
    - CRE0046 (서열번호 276) 또는 이의 기능적 변이체; 및
    - Des_mp_V1 (서열번호 292) 또는 이의 기능적 변이체.
  37. 제36항에 있어서, SP0326, SP0286, SP0451, SP0042, SP0362, SP0334, SP0343, SP0066, SP0440, SP0170, SP0347, SP0469, SP0068, SP0267, SP0132, SP0310, SP0365, SP0379, SP0339, SP0136, SP0325, SP0337, SP0270, SP0457, SP0268, SP0341, SP0378, SP0380, SP0262, SP0359, SP0455, SP0381, SP0441, SP0153, SP0442, SP0154, SP0155, SP0454, SP0456, SP0305, SP0382, SP0279, SP0320, SP0366, SP0467, SP0332, SP0057, SP0159, SP0134, SP0322, SP0257, SP0327, SP0345, SP0173, SP0160, SP0350, SP0346, SP0231, SP0309, SP0368, SP0158, SP0338, SP0364, SP0468, SP0232, SP0453, SP0340, SP0471, SP0229, SP0228, SP0328, SP0349, SP0230로 이루어진 그룹으로부터 선택된 합성된 심장 프로모터, 또는 이들 중 어느 하나의 기능적 변이체.
  38. 발현 산물을 코딩하는 서열에 작동가능하게 연결된, 제1항 내지 제5항, 제8항, 제11항, 제14항, 제17항, 및 제31항 내지 제37항 중 어느 한 항에 따른 합성된 근육-특이적 프로모터를 포함하는 발현 카세트.
  39. 제1항 내지 제5항, 제8항, 제11항, 제14항, 제17항 및 제31항 내지 제37항 중 어느 한 항에 따른 합성된 근육-특이적 프로모터 또는 제38항에 따른 발현 카세트를 포함하는 벡터.
  40. 제39항에 있어서, AAV 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터 또는 렌티바이러스 벡터인 것인, 벡터.
  41. 제40항에 따른 벡터를 포함하는 비리온.
  42. 제1항 내지 제5항, 제8항, 제11항, 제14항, 제17항 및 제31항 내지 제37항 중 어느 한 항에 따른 합성된 근육-특이적 프로모터, 제38항에 따른 발현 카세트, 제39항 또는 제40항에 따른 벡터, 또는 제41항에 따른 비리온을 포함하는 약제학적 조성물.
  43. 치료에 사용하기 위한, 제1항 내지 제5항, 제8항, 제11항, 제14항, 제17항, 및 제31항 내지 제37항 중 어느 한 항에 따른 합성된 근육-특이적 프로모터, 제38항에 따른 발현 카세트, 제39항 또는 제40항에 따른 벡터, 제41항에 따른 비리온, 또는 제42항에 따른 약제학적 조성물.
  44. 제1항 내지 제5항, 제8항, 제11항, 제14항, 제17항, 및 제31항 내지 제37항 중 어느 한 항에 따른 합성된 근육-특이적 프로모터, 제38항에 따른 발현 카세트, 제39항 또는 제40항에 따른 벡터, 제41항에 따른 비리온을 포함하는 세포.
  45. 의학적 병증 또는 질병 치료용 약제학적 조성물의 제조에 사용하기 위한, 제1항 내지 제5항, 제8항, 제11항, 제14항, 제17항 및 제31항 내지 제37항 중 어느 한 항에 따른 합성된 근육-특이적 프로모터, 제38항에 따른 발현 카세트, 제39항 또는 제40항에 따른 벡터, 제41항에 따른 비리온 또는 제42항에 따른 약제학적 조성물.
  46. 제38항에 따른 합성된 근육-특이적 발현 카세트를 근육 세포에 제공하는 단계 및 합성된 근육-특이적 발현 카세트에 존재하는 유전자를 발현시키는 단계를 포함하는, 발현 산물의 제조 방법.
  47. 제38항에 따른 합성된 근육-특이적 발현 카세트, 제39항 또는 제40항에 따른 벡터, 제41항에 따른 비리온을 근육 세포에 도입하는 단계를 포함하는, 근육 세포에서 치료적 이식유전자를 발현시키는 방법.
  48. 치료를 필요로 하는 개체, 바람직하게는 인간의 치료 방법으로서, 상기 방법은
    제1항 내지 제5항, 제8항, 제11항, 제14항, 제17항 및 제31항 내지 제37항 중 어느 한 항에 따른 프로모터에 작동가능하게 연결된 치료적 산물을 코딩하는 서열을 포함하는, 제38항에 따른 발현 카세트, 제39항 또는 제40항에 따른 벡터, 제41항에 따른 비리온 또는 제42항에 따른 약제학적 조성물을 개체에게 투여하는 단계; 및
    상기 개체의 근육에서 치료적 양의 치료적 산물을 발현시키는 단계를 포함하는, 방법.
  49. 제48항에 있어서, 상기 치료적 양의 치료적 산물은 골격 근육 및/또는 심장 근육에서 발현되는 것인, 개체의 치료 방법.
KR1020227025726A 2019-12-24 2020-12-24 조절 핵산 서열 KR20220119703A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GBGB1919269.9A GB201919269D0 (en) 2019-12-24 2019-12-24 Regulatory nucleic acid sequences
GB1919269.9 2019-12-24
GBGB2012192.7A GB202012192D0 (en) 2020-08-05 2020-08-05 Regulatory nucleic acid sequences
GB2012192.7 2020-08-05
PCT/GB2020/053371 WO2021130503A1 (en) 2019-12-24 2020-12-24 Regulatory nucleic acid sequences

Publications (1)

Publication Number Publication Date
KR20220119703A true KR20220119703A (ko) 2022-08-30

Family

ID=74130280

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227025726A KR20220119703A (ko) 2019-12-24 2020-12-24 조절 핵산 서열

Country Status (10)

Country Link
US (1) US20230233710A1 (ko)
EP (1) EP4081643A1 (ko)
JP (1) JP2023509118A (ko)
KR (1) KR20220119703A (ko)
CN (1) CN115151646A (ko)
AU (1) AU2020412375A1 (ko)
CA (1) CA3161735A1 (ko)
IL (1) IL294238A (ko)
WO (1) WO2021130503A1 (ko)
ZA (1) ZA202207849B (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240023643A (ko) * 2021-06-23 2024-02-22 신프로믹스 엘티디 조절 핵산 서열
WO2023205767A2 (en) * 2022-04-22 2023-10-26 Spacecraft Seven, Llc B-cell lymphoma 2–associated anthanogene 3 (bag3) gene therapy using aav vector
CN115948403B (zh) * 2022-12-30 2023-09-15 广州派真生物技术有限公司 在哺乳动物肌肉中特异性启动基因的启动子序列及其应用

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
AU2002211710A1 (en) 2000-10-13 2002-04-22 Chiron Corporation Cytomegalovirus intron a fragments
WO2005047505A2 (en) 2003-08-07 2005-05-26 Whitehead Institute For Biomedical Research Methods and products for expression of micro rnas
US20050142581A1 (en) 2003-09-04 2005-06-30 Griffey Richard H. Microrna as ligands and target molecules
US20050266552A1 (en) 2003-12-05 2005-12-01 Doench John G Reagents and methods for identification of RNAi pathway genes and chemical modulators of RNAi
KR100614827B1 (ko) 2004-05-06 2006-08-25 재단법인서울대학교산학협력재단 양방향 은닉 마코프 모델을 이용한 완숙한마이크로알엔에이 위치예측방법 및 이를 구현하기 위한컴퓨터 프로그램을 기록한 저장매체
WO2011051450A1 (en) * 2009-10-29 2011-05-05 Vib Vzw Cardiac-specific nucleic acid regulatory elements and methods and use thereof
CN103074373A (zh) * 2011-10-26 2013-05-01 南京医科大学 肌肉组织特异性表达Follistatin以提高牛瘦肉率的转基因载体
CN102747082B (zh) * 2011-12-29 2014-06-18 华中农业大学 猪肌肉特异性itgb1bp2启动子及其应用
US20170253927A1 (en) * 2016-03-01 2017-09-07 Washington State University Heritable epigenetic modifications as markers of chemotherapy exposure
CN108018311A (zh) * 2016-11-04 2018-05-11 中国科学院上海生命科学研究院 通过基因编辑特异靶向肌肉组织mstn治疗恶病质
EP3596112A2 (en) * 2017-03-17 2020-01-22 Newcastle University Adeno-associated virus vector delivery of a fragment of micro-dystrophin to treat muscular dystrophy

Also Published As

Publication number Publication date
JP2023509118A (ja) 2023-03-07
CN115151646A (zh) 2022-10-04
US20230233710A1 (en) 2023-07-27
IL294238A (en) 2022-08-01
EP4081643A1 (en) 2022-11-02
AU2020412375A1 (en) 2022-06-30
ZA202207849B (en) 2023-12-20
CA3161735A1 (en) 2021-07-01
WO2021130503A1 (en) 2021-07-01

Similar Documents

Publication Publication Date Title
KR20220119703A (ko) 조절 핵산 서열
JP7069426B2 (ja) ユートロフィン遺伝子を標的とした筋ジストロフィーの治療方法
AU2021232005A1 (en) Methods and compositions for modulating a genome
KR20220111322A (ko) 표적 rna를 편집하기 위한 기능성 영역을 부가한 안티센스형 가이드 rna
EP2871239A9 (en) Cell capable of producing adeno-associated virus vector
KR20210124969A (ko) 근이영양증의 치료를 위한 조합 요법
JP2022507402A (ja) 肝特異的ウイルスプロモーター及びその使用方法
CN116194154A (zh) 使用aav载体的plakophilin-2(pkp2)基因疗法
JP6039048B2 (ja) 外来遺伝子発現亢進活性を有するdnaエレメント
WO2017151717A1 (en) Compositions and methods for adeno-associated virus mediated gene expression in myofibroblast-like cells
JP2022513376A (ja) レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集
WO2019152816A1 (en) Campaign-ready series of recombinant adeno-associated virus (raav) complementing plasmids
WO2021230385A1 (en) Method for treating muscular dystrophy by targeting utrophin gene
JP6025745B2 (ja) ヒト遺伝子由来プロモーター
TW202112797A (zh) 經由靶向lama1基因治療肌肉萎縮症的方法
KR20240023643A (ko) 조절 핵산 서열
CN115175559A (zh) 包含人源化pnpla3基因座的非人动物及其使用方法
EP2486136B1 (en) Nucleic acid molecules and methods for exchanging exon(s) by transsplicing
CN117957326A (zh) 调控核酸序列
CN113227375A (zh) 合成的微小rna模拟物
WO2024060205A1 (zh) 包含基于小分子药物的可变剪接调节元件的核酸分子
CN105358690B (zh) 启动子组合物
EP4342498A1 (en) Antisense oligomer
US20240082429A1 (en) Pah-modulating compositions and methods
US20230081547A1 (en) Non-human animals comprising a humanized klkb1 locus and methods of use