KR20230117177A - 진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의개발 - Google Patents

진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의개발 Download PDF

Info

Publication number
KR20230117177A
KR20230117177A KR1020237022052A KR20237022052A KR20230117177A KR 20230117177 A KR20230117177 A KR 20230117177A KR 1020237022052 A KR1020237022052 A KR 1020237022052A KR 20237022052 A KR20237022052 A KR 20237022052A KR 20230117177 A KR20230117177 A KR 20230117177A
Authority
KR
South Korea
Prior art keywords
nucleic acid
isolated nucleic
vector
acvr1
aav
Prior art date
Application number
KR1020237022052A
Other languages
English (en)
Inventor
재-혁 심
광핑 가오
준 시에
연-숙 양
정 민 김
사친 차우굴
Original Assignee
유니버시티 오브 매사추세츠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유니버시티 오브 매사추세츠 filed Critical 유니버시티 오브 매사추세츠
Publication of KR20230117177A publication Critical patent/KR20230117177A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/45Transferases (2)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/08Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/11Protein-serine/threonine kinases (2.7.11)
    • C12Y207/1103Receptor protein serine/threonine kinase (2.7.11.30)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • C12N2310/141MicroRNAs, miRNAs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/34Allele or polymorphism specific uses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Abstract

일부 측면에서, 본 개시내용은 대상체에서 진행성 골화성 섬유이형성증 (FOP)을 치료하기 위한 조성물 및 방법에 관한 것이다. 일부 측면에서, 본 개시내용은 근육 세포 또는 결합 조직에서 돌연변이된 AVCR1 유전자의 발현을 억제하는 (예를 들어, 감소시키는) 트랜스진을 발현하도록 구성된 단리된 핵산, 및 벡터, 예컨대 rAAV 벡터를 제공한다.

Description

진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의 개발
관련 출원에 대한 상호 참조
본 출원은 35 U.S.C. 119(e) 하에 2020년 12월 3일에 출원된 발명의 명칭 "DEVELOPMENT OF NOVEL GENE THERAPEUTICS FOR FIBRODYSPLASIA OSSIFICANS PROGRESSIVA"의 미국 가출원 번호 63/121,221 및 2021년 10월 4일에 출원된 발명의 명칭 "DEVELOPMENT OF NOVEL GENE THERAPEUTICS FOR FIBRODYSPLASIA OSSIFICANS PROGRESSIVA"의 미국 가출원 번호 63/251,822의 이익을 주장하며, 이들 각각의 전체 개시내용은 그 전문이 본원에 참조로 포함된다.
EFS-웹을 통해 텍스트 파일로서 제출된 서열 목록에 대한 참조
본 출원은 EFS-웹을 통해 ASCII 포맷으로 제출된 서열 목록을 함유하며, 이는 그 전문이 본원에 참조로 포함된다. 2021년 12월 2일에 생성된 ASCII 파일은 U012070152WO00-SEQ-SXT로 명명되고, 232,210 바이트 크기이다.
진행성 골화성 섬유이형성증 (FOP)은 1.36백만명 내지 2백만명당 1명의 발생률로 발생한다. 환자는 골격근 및 결합 조직에서 비정상적 골 형성을 나타낸다. 이러한 이소성 골화 (HO)는 골격근, 건, 및 연골에서의 진행성 골격외 골 형성을 통해 부동 및 중증 통증으로 이어진다. 그러나, 증상 완화로서 강렬한 통증 및 부종을 감소시킬 수 있는, 플레어-업 상태를 위한 고용량의 코르티코스테로이드를 제외하고는, 어떠한 효과적인 치료도 현재 이용가능하지 않다.
본 개시내용의 측면은 진행성 골화성 섬유이형성증 (FOP)을 치료하거나 또는 FOP와 연관된 플레어-업 상태를 감소시키기 위한 조성물 및 방법에 관한 것이다. 본 개시내용은, 부분적으로, 돌연변이된 ACVR1 유전자 발현의 억제, 이소성 골화 감소, 및 야생형 ACVR1 유전자 발현의 촉진을 필요로 하는 대상체에서 돌연변이된 ACVR1 유전자의 발현을 억제하고, 이소성 골화를 감소시키고, 야생형 ACVR1 유전자의 발현을 촉진하는 1종 이상의 트랜스진, 예컨대 억제 핵산 또는 코돈 최적화된 단백질을 코딩하는 단리된 핵산 및 발현 구축물을 기초로 한다.
따라서, 일부 측면에서, 본 개시내용은 ACVR1을 코딩하는 코돈 최적화된 핵산 서열에 작동가능하게 연결된 프로모터를 포함하는 트랜스진을 포함하는 단리된 핵산을 제공한다.
일부 실시양태에서, 단리된 핵산은 벡터 내에 위치한다. 일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 CBA 인트론을 포함한다. 일부 실시양태에서, CBA 프로모터는 서열식별번호(SEQ ID NO): 37에 제시된 바와 같은 서열을 포함하는 매스바이올로직스(MassBiologics) 신규 (MBL) 인트론을 포함한다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 서열식별번호: 36에 제시된 바와 같은 서열을 포함하는 합성 인트론을 포함한다.
일부 실시양태에서, MBL 인트론은 (예를 들어, CBA 프로모터 등을 갖는 벡터 게놈의 크기에 비해) 벡터 게놈의 크기를 감소시킨다. 일부 실시양태에서, 합성 인트론은 벡터 게놈의 크기를 감소시킨다. 일부 실시양태에서, 벡터 게놈의 크기는 적어도 15-25%만큼 감소된다.
일부 실시양태에서, 인트론은 프로모터와 코돈 최적화된 ACVR1을 코딩하는 트랜스진 서열 사이에 존재한다. 일부 실시양태에서, 코돈 최적화된 ACVR1은 서열식별번호: 1에 제시된 바와 같은 서열을 포함한다.
일부 실시양태에서, 벡터는 플라스미드이다. 일부 실시양태에서, 벡터는 바크미드이다. 일부 실시양태에서, 벡터는 코스미드이다. 일부 실시양태에서, 벡터는 바이러스, 폐쇄형-단부 선형 DNA (ceDNA)이다. 일부 실시양태에서, 벡터는 바큘로바이러스 벡터이다. 일부 실시양태에서, 벡터는 아데노-연관 바이러스 (AAV) 벡터이다.
일부 실시양태에서, 트랜스진에 AAV 역전된 말단 반복부 (ITR)가 플랭킹된다.
일부 실시양태에서, 본 개시내용은 서열식별번호: 2-4 중 어느 하나에 제시된 서열을 포함하는 단리된 핵산을 포함하는 벡터를 제공한다. 일부 실시양태에서, 단리된 핵산 또는 벡터는 ACVR1-R206H에 의한 골 형태발생 단백질 (BMP) 신호전달의 활성화를 감소시킨다.
일부 측면에서, 본 개시내용은 내인성 mRNA와 혼성화하여 그의 발현을 억제하기에 충분한, 대상체의 내인성 mRNA와 상보적인 서열을 갖는 핵산을 포함하는 인공 miRNA (ami-RNA)를 포함하는 단리된 핵산을 제공한다. 일부 실시양태에서, 내인성 mRNA는 ACVR1 단백질을 코딩한다.
일부 실시양태에서, ACVR1 단백질은 야생형 ACVR1의 서열의 위치 206에서 구아닌에서 아데닌으로의 단일 염기 돌연변이를 포함한다. 일부 실시양태에서, ACVR1 단백질은 인간 ACVR1-R206H이다. 일부 실시양태에서, ami-RNA는 서열식별번호: 5, 6 및 56-65 중 어느 하나에 제시된 서열에 의해 코딩된다.
일부 실시양태에서, 단리된 핵산은 벡터 내에 위치한다. 일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 벡터는 플라스미드이다. 일부 실시양태에서, 벡터는 바크미드이다. 일부 실시양태에서, 벡터는 코스미드이다. 일부 실시양태에서, 벡터는 바이러스, 폐쇄형-단부 선형 DNA (ceDNA)이다. 일부 실시양태에서, 벡터는 바큘로바이러스 벡터이다. 일부 실시양태에서, 벡터는 아데노-연관 바이러스 (AAV) 벡터이다.
일부 실시양태에서, 바이러스 벡터는 아데노-연관 바이러스 (AAV) 벡터이다. 일부 실시양태에서, AAV 벡터는 적어도 1개의 역전된 말단 반복부 (ITR)를 포함한다. 일부 실시양태에서, ami-RNA는 인간 miRNA 백본을 포함한다. 일부 실시양태에서, ami-RNA는 인간 miR-33 백본이다.
일부 실시양태에서, 본 개시내용은 서열식별번호: 5, 6, 10-21 및 56-65 중 어느 하나에 제시된 서열을 포함하는 단리된 핵산을 포함하는 벡터를 제공한다. 일부 실시양태에서, 본 개시내용은 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터를 제공한다.
일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 인간 야생형 ACVR1을 표적화하는 마이크로RNA와 상보적인 1개 이상의 miRNA 결합 부위를 포함한다. 일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 인간 코돈 최적화된 ACVR1에 상보적인 1개 이상의 miRNA 결합 부위를 포함한다. 일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 인간 ACVR1-R206H에 상보적인 1개 이상의 miRNA 결합 부위를 포함한다.
일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 레닐라 루시페라제 리포터 유전자를 추가로 포함한다. 일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 숙주 세포를 추가로 포함한다. 일부 실시양태에서, 숙주 세포는 진핵 세포이다. 일부 실시양태에서, 숙주 세포는 포유동물 세포이다. 일부 실시양태에서, 포유동물 세포는 HEK293 세포이다.
일부 실시양태에서, 벡터는 서열식별번호: 5, 6, 10-16, 18-21 및 56-65 중 어느 하나에 제시된 서열을 포함하며, ACVR1-R206H의 발현을 감소시킨다. 일부 실시양태에서, 서열은 서열식별번호: 59 또는 60이다.
본 개시내용은 (a) ACVR1 단백질을 코딩하는 내인성 mRNA와 혼성화하여 그의 발현을 억제하기에 충분한, 대상체의 내인성 mRNA와 상보적인 서열을 갖는 핵산을 포함하는 인공 miRNA (ami-RNA)를 코딩하는 제1 영역; 및 (b) ACVR1을 코딩하는 코돈 최적화된 핵산 서열을 포함하는 트랜스진을 코딩하는 제2 영역을 포함하는 단리된 핵산을 제공한다.
일부 실시양태에서, 단리된 핵산은 바이러스 벡터 내에 위치한다. 일부 실시양태에서, 바이러스 벡터는 아데노-연관 바이러스 (AAV) 벡터이다. 일부 실시양태에서, AAV 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh.8, AAV9, AAVrh.10, AAVrh39, 및 AAVrh.43으로부터 선택된 캡시드 단백질에 의해 캡시드화된다.
일부 실시양태에서, ami-RNA 및 트랜스진은 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 CBA 인트론을 포함한다.
일부 실시양태에서, CBA 프로모터는 벡터 내에 서열식별번호: 37에 제시된 바와 같은 서열을 포함하는 매스바이올로직스 신규 (MBL) 인트론을 포함한다. 일부 실시양태에서, ACVR1 단백질은 구아닌에서 아데닌으로의 단일 염기 돌연변이를 갖는 돌연변이된 단백질이다. 일부 실시양태에서, ACVR1 단백질은 인간 ACVR1-R206H이다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 25-28 중 어느 하나에 제시된 서열을 포함한다.
일부 실시양태에서, ami-RNA는 인간 miRNA 백본을 포함한다. 일부 실시양태에서, 인간 miRNA 백본은 인간 miR-33 백본이다.
일부 실시양태에서, ami-RNA 및 트랜스진은 ACVR1-R206H를 야생형 ACVR1로 대체한다. 일부 실시양태에서, 본 개시내용은 서열식별번호: 25-28 중 어느 하나에 제시된 서열을 포함하는 벡터를 제공한다. 일부 실시양태에서, 벡터는 숙주 세포를 추가로 포함한다. 일부 실시양태에서, 숙주 세포는 진핵 세포이다. 일부 실시양태에서, 숙주 세포는 포유동물 세포이다. 일부 실시양태에서, 포유동물 세포는 HEK293 세포이다.
본 개시내용은 (a) ACVR1 유전자의 표적 핵산 서열에 특이적으로 혼성화하는 단일 가이드 RNA (sgRNA); (b) 제1 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제1 rAAV 입자; 및 (c) 제2 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제2 rAAV 입자를 포함하는 재조합 유전자 편집 복합체를 제공한다.
일부 실시양태에서, 제1 재조합 유전자 편집 단백질은 Cas9-기반 아데닌 염기 편집제 (ABE) N-말단 부분 및 그의 단편을 포함한다.
일부 실시양태에서, 제2 재조합 유전자 편집 단백질은 Cas9-기반 아데닌 염기 편집제 (ABE) C-말단 부분 및 그의 단편을 포함한다.
일부 실시양태에서, 재조합 유전자 편집 복합체는 프로토스페이서 인접 모티프를 추가로 포함한다. 일부 실시양태에서, 재조합 유전자 편집 단백질은 Crisper/Cas9 시스템의 단백질이다. 일부 실시양태에서, 제1 및 제2 rAAV 입자는 AAV9 캡시드 단백질 또는 그의 변이체를 포함한다. 일부 실시양태에서, 제1 및 제2 rAAV 입자는 AAV6.2 캡시드 단백질 또는 그의 변이체를 포함한다.
일부 실시양태에서, 각각의 N-말단 ABE 구축물 및 C-말단 ABE 구축물은 트랜스-스플라이싱 인테인 서열을 사용하는 것에 의해 나뉜다. 일부 실시양태에서, N-말단 ABE 구축물은 ACVR1-R206H 돌연변이를 갖는 프로토스페이서를 포함한다. 일부 실시양태에서, C-말단 ABE 구축물은 AAV6.2 또는 AAV9 캡시드 단백질 내로 통합된다. 일부 실시양태에서, ABE는 ACVR1-R206H 대립유전자에서 아데닌을 구아닌으로 전환시킨다.
본 개시내용은 (a) 본원에 개시된 바와 같은 단리된 핵산 및 (b) 적어도 1개의 AAV 캡시드 단백질을 포함하는 재조합 아데노-연관 바이러스 (rAAV)를 제공한다.
일부 실시양태에서, 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh.8, AAV9, AAVrh.10, AAVrh39, 및 AAVrh.43으로부터 선택된 혈청형의 것이다. 일부 실시양태에서, rAAV는 자기-상보적 AAV (scAAV)이다.
일부 측면에서, 본 개시내용은 NF-kB 프로모터 (pNF-kB)를 포함하는 제1 트랜스진 및 골 형태발생 단백질 프로모터 (pBRE)를 포함하는 제2 트랜스진을 포함하며, AAV 벡터 내로 통합된 단리된 핵산을 제공한다.
일부 실시양태에서, AAV 벡터는 rAAV9 벡터이다. 일부 실시양태에서, AAV 벡터는 적어도 1개의 역전된 말단 반복부 (ITR)를 포함한다.
일부 실시양태에서, 단리된 핵산은 가우시아 리포터 유전자 (eBRE/NF-kB-Luc)를 추가로 포함한다. 일부 실시양태에서, pNF-kB는 가용성 폴리스타틴 (sFST)의 발현을 유도한다. 일부 실시양태에서, pBRE는 TNFR2의 발현을 유도한다.
일부 실시양태에서, 액티빈 A는 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, BMP 리간드는 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, 염증은 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, 염증은 염증성 시토카인에 의해 유도된다. 일부 실시양태에서, sFST 및 TNFR2의 발현은 플레어-업 상태에서 액티빈 A 및/또는 TNF 신호전달 경로를 억제한다.
일부 실시양태에서, pNF-kB는 PB2 프로모터 (서열식별번호: 30)이다. 일부 실시양태에서, pBRE는 서열식별번호: 31의 서열을 포함한다.
일부 실시양태에서, 단리된 핵산은 서열식별번호: 32의 서열을 포함한다. 일부 실시양태에서, 단리된 핵산은 인간 가용성 IL1Rα (서열식별번호: 35)의 발현을 추가로 유도한다.
본 개시내용은 가용성 폴리스타틴 (sFST)을 코딩하는 핵산 서열을 포함하는 제1 트랜스진 및 TNFR2를 코딩하는 핵산 서열을 포함하는 제2 트랜스진을 포함하며, 여기서 제1 및 제2 트랜스진은 프로모터에 작동가능하게 연결된 것인 단리된 핵산을 제공한다.
일부 실시양태에서, 단리된 핵산은 인공 miRNA (ami-RNA)를 코딩하는 트랜스진을 추가로 포함한다. 일부 실시양태에서, ami-RNA는 miR-122를 포함한다.
일부 실시양태에서, miR-122는 3'-비번역 영역 (3'-UTR)에 위치한다.
일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 프로모터는 pBRE/pNF-kB 프로모터이다.
일부 실시양태에서, 단리된 핵산은 벡터 내에 위치한다. 일부 실시양태에서, 벡터는 AAV 벡터이다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 33의 서열을 포함한다. 일부 실시양태에서, miR-122는 서열식별번호: 34의 서열을 포함하는 재조합 AAV 벡터 내로 통합된다.
일부 실시양태에서, sFST 및/또는 TNFR2의 발현은 TNF 및 액티빈 A의 활성화를 억제한다.
본 개시내용은 진행성 골화성 섬유이형성증 (FOP)을 갖거나 갖는 것으로 의심되는 대상체를 치료하는 방법을 제공한다. 본 개시내용은 대상체에서 이소성 골화를 억제하는 방법을 제공한다. 본 개시내용은 대상체에서 이소성 골화를 억제하는 방법을 제공한다. 본 개시내용은 진행성 골화성 섬유이형성증 (FOP)을 갖거나 갖는 것으로 의심되는 대상체에서 플레어-업 상태를 개선시키는 방법을 제공한다. 본 개시내용은 세포에 단리된 핵산을 전달하는 것을 포함하는, 세포에서 ACVR1 발현을 억제하는 방법을 제공한다.
일부 실시양태에서, 본원에 개시된 바와 같은 방법은 대상체에게 본원에 개시된 바와 같은 단리된 핵산, 벡터, 재조합 유전자 편집 복합체 또는 rAAV를 투여하는 것을 포함한다.
일부 실시양태에서, 대상체는 돌연변이체 ACVR1 단백질을 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 돌연변이체 ACVR1 단백질은 ACVR1-R206H 단백질이다.
일부 실시양태에서, 대상체는 포유동물 대상체이다. 일부 실시양태에서, 포유동물 대상체는 인간 대상체이다.
일부 실시양태에서, 투여 또는 전달은 주사에 의해 이루어진다. 일부 실시양태에서, 주사는 정맥내 주사이다.
일부 실시양태에서, 투여 또는 전달은 본원에 개시된 바와 같은 rAAV를 포함하는 조직 또는 이식편을 대상체 내로 이식하는 것에 의해 이루어진다.
일부 실시양태에서, 투여 또는 전달은 본원에 개시된 바와 같은 rAAV를 대상체 내로 진피간 전달하는 것에 의해 이루어진다.
일부 실시양태에서, 투여 또는 전달은 이소성 골화의 감소를 발생시킨다. 일부 실시양태에서, 투여 또는 전달은 대상체에서 플레어-업 상태의 감소를 발생시킨다. 일부 실시양태에서, 투여 또는 전달은 돌연변이체 ACVR1 단백질의 감소된 발현을 발생시킨다.
도 1a-1b는 진행성 골화성 섬유이형성증 (FOP)에 수반되는 메카니즘 및 신호전달 경로를 보여준다. 도 1a는 FOP 돌연변이를 보여주는 개략적 다이어그램을 예시한다. 도 1b는 정상 대상체 및 FOP 환자에서의 BMP/액티빈 A 신호전달 경로를 보여준다. 약어: SP, 신호 펩티드; LBD, 리간드 결합 도메인; TM, 막횡단; GS, gly-ser-풍부 도메인.
도 2a-2b는 유전자 부가를 위한 AAV 벡터 게놈의 생성을 보여준다. 도 2a는 플라스미드 구축의 개략적 다이어그램을 보여준다. CBA 프로모터는 닭 베타-액틴 인트론, MBL 인트론, 또는 합성 인트론에 작동가능하게 연결된다. 도 2b는 opt-ACVR1의 발현의 검증을 보여준다. 벡터 게놈을 HEK293 세포 내로 일시적으로 형질감염시키고, 세포 용해물을 항-ACVR1 항체로의 이뮤노블롯팅에 적용하였다. 항-Hsp90 항체를 로딩 대조군에 사용하였다.
도 3a-3d는 유전자 침묵을 위한 AAV 벡터 게놈의 생성을 보여준다. 도 3a는 인간 ACVR1-R206H miRNA (amiR-ACVR1.R206H)의 상이한 서열 부위를 표적화하는 12개의 인공 miRNA (amiR) 및 인간 ACVR1-R206H, -WT (야생형), 또는 -opt (최적화된 것)에 대한 amiR-센서 플라스미드 (도 3b)를 보여주는 개략적 다이어그램이다. 도 3c는 amiR-ctrl (대조군) 또는 amiR-ACVR1.R206H를 amiR-센서 플라스미드와 함께 HEK293 세포 내로 일시적으로 형질감염시키고, 루시페라제 검정을 수행하여 레닐라 및 반딧불이 활성을 측정하였음을 보여준다. 레닐라 대 반딧불이의 보다 낮은 비는 amiR의 보다 높은 침묵 효능을 나타낸다. 도 3d는 amiR-ctrl 또는 amiR-ACVR1.R206H를 HEK293 내로 일시적으로 형질감염시키고, 세포 용해물을 항-ACVR1 항체를 사용한 이뮤노블롯팅에 적용한 것을 보여주는 영상을 도시한다. 항-Hsp90 항체를 로딩 대조군에 사용하였다. 약어: Fluc, 반딧불이 루시페라제; Rluc, 레닐라 루시페라제.
도 4a-4d는 유전자 대체를 위한 AAV 벡터 게놈의 생성을 보여준다. 도 4a는 합성 인트론 (서열식별번호: 36) 또는 MBL 인트론 (서열식별번호: 37), 인공 miRNA (amiR; RH6 또는 RH7) ACVR1을 함유하는 플라스미드 구축의 개략적 다이어그램이다. 도 4b는 벡터 또는 4종의 AAV 벡터 게놈 (합성 인트론을 갖는 RH6 또는 RH7 및 MBL 인트론을 갖는 RH6 또는 RH7)을 amiR-센서 플라스미드와 함께 HEK293 세포 내로 일시적으로 형질감염시킨 후에 루시페라제 활성을 측정한 그래프를 보여주며, 루시페라제 검정을 수행하여 레닐라 및 반딧불이 활성을 측정하였다. 도 4c는 항-ACVR1 항체를 사용한 이뮤노블롯팅에 의해 평가된 opt-ACVR1 발현을 보여준다. 항-Hsp90 항체를 로딩 대조군에 사용하였다. 도 4d는 벡터 대조군 또는 AAV 벡터 게놈을 BRE-luc 리포터 유전자와 함께 HEK293 세포 내로 일시적으로 형질감염시키고, 액티빈 A (100 ng/ml)로 처리한 후에 BRE-루시페라제 활성을 측정한 그래프를 보여준다. 24시간 후에, 액티빈 A 신호전달 활성을 루시페라제 검정에 의해 측정하였다. 값은 평균 ± SD로 나타내어지고: 독립표본 양측 스튜던트 t-검정 또는 일원 ANOVA 검정에 의해 **, P < 0.01 및 ***, P < 0.001.
도 5는 다중 세포의 시험관내 형질도입에 효과적인 rAAV 혈청형의 스크리닝을 보여준다. PBS (대조군) 또는 EGFP를 발현하는 14종의 상이한 rAAV 혈청형 (AAV1, AAV2, AAV3b, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAV.rh8, AAV.rh10, AAV.rh39 및 AAV.rh43) 5 x 1010 GC를 표시된 세포와 함께 2일 동안 인큐베이션하고, 골형성 조건 하에 4일 동안 배양하였다. AAV의 형질도입을 에피형광 현미경검사를 사용하여 GFP 발현에 의해 평가하였다. 축척 막대: 400 μm.
도 6a-6d는 rAAV6.2 및 rAAV9가 골격근에서 이소성 골-존재 세포를 형질도입한다는 것을 보여준다. rBMP2/7 주사 및 근육 손상의 4일 후 (도 6a 및 6b) 또는 8일 후 (도 6c 및 6d)에, rAAV6.2.egfp 또는 rAAV9.egfp의 5 x 1012 vg/kg을 각각 2개월령의 수컷 Tie2-cre;Ai9 마우스 (n=3)에 근육내로 주사하였다. 전신 X-방사선촬영 (도 6a 및 6c) 및 이환된 조직의 동결-절편화 (도 6b 및 6d)를 처리된 마우스에서 수행하였다. 청색 영상은 DAPI에 상응하고; 적색 영상은 Tie2+ 세포에 상응하고; 녹색 영상은 AAV-형질도입된 세포에 상응한다. 약어: M, 근육; HO-BM, 이소성 골화 골수.
도 7a-7b는 유전자 대체를 위한 rAAV6.2 및 rAAV9 벡터의 생성을 보여준다. 도 7a는 MBL 인트론 (서열식별번호: 37), rAAV6.2 또는 rAAV9, amiR-RH6 또는 amiR-RH7, 및 코돈 최적화된 ACVR1을 함유하는 rAAV 벡터의 생성의 개략적 다이어그램이다. 도 7b는 소화 후에 amiR-RH6 또는 -RH7을 함유하는 rAAV6.2의 게놈 완전성을 평가하기 위한 전기영동 후의 겔 영상을 보여준다. 약어: ss, 단일-가닥.
도 8a-8k는 유전자 대체에 대한 rAAV6.2 벡터의 시험관내 기능적 검증을 보여준다. 인간 FOP-iPSC를 5 x 1010 GC의 벡터 (ACVR1-WT 또는 ACVR1-R206H와 조합된 rAAV6.2-amiR-ctrl, -amiRH6, 또는 -amiRH7)로 2일 동안 처리하고, 골형성 조건 하에 4일 동안 배양하였다. 총 RNA를 cDNA 합성에 적용한 후, 차세대 서열분석 (NGS) (도 8a) 또는 RT-PCR 분석 (도 8b)을 수행하였다. 알칼리성 포스파타제 활성 (ALP) (도 8c) 및 알리자린 레드 염색 (도 8d)을 수행하여, 각각 골형성 배양 6일 및 21일 째의 골모세포 분화를 평가하였다. 도 8e는 유형 1 콜라겐 (Col1a1) 및 골 시알로단백질 (ibsp)을 포함한 골모세포 마커 유전자의 mRNA 수준이 amiR-RH7 및 opt-ACVR1을 보유하는 rAAV6.2에 의해 현저하게 감소되었지만, amiR-RH6 및 opt-ACVR1을 보유하는 rAAV6.2 또는 rAAV6.2.amiR-ctrl에 의해서는 그러하지 않음을 보여준다. 값은 평균 ± SD로 나타내어지고: 모든 패널에서 독립표본 양측 스튜던트 t-검정에 의해 **, P < 0.01, ***, P < 0.001 및 ****, P < 0.0001. 도 8f는 ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 tAAV6.2 벡터 5 x 1010 GC를 인간 FOP-iPSC에 형질도입하고, 골형성 조건 하에 4일 동안 배양한 것을 보여준다. 총 RNA를 cDNA 합성에 적용한 후, ACVR1opt mRNA 발현에 대해 차세대 서열분석 (NGS) (상단 도면) 또는 RT-PCR (하단 도면)을 수행하였다. 도 8g는 인간 FOP 환자-유래 iPSC를 PBS, 또는 동일한 CBA-Egfp 트랜스진으로 패키징된 14종의 상이한 AAV 캡시드 5 x 1010 게놈 카피 (GC)로 처리한 것을 보여준다. 2일 후에, EGFP 발현을 항-GFP 항체를 사용한 이뮤노블롯팅에 의해 평가하였다. 항-HSP90 항체를 로딩 대조군에 사용하였다. 도 8h-8k는 ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 AAV6.2 벡터 5 x 1010 GC를 건강한 공여자 (WT-iPSC) 또는 FOP 환자 (R206H-iPSC)로부터 유래된 인간 iPSC에 형질도입한 것을 보여준다. 골형성 유전자 발현을 RT-PCR에 의해 평가하였다 (도 8h). AAV-처리한 세포를 PBS 또는 액티빈 A (100 ng/ml)와 함께 6시간 동안 인큐베이션하고, ID1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 8i). 도 8j는 PDGFRa+Sca1+CD31-CD45- 섬유지방생성 전구세포 (FAP)를 4주령의 Acvr1(R206H)Fl;PDGFRα 마우스의 소화된 경골근으로부터 FACS 분류하고, ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 6일 동안 배양하고, ALP 활성을 골모세포 분화에 대해 평가하였다 (도 8k). 값은 평균 ± SD로 나타내어지고: 일원 ANOVA 검정에 의해 ns, 유의하지 않음; *, P <0.05; **, P < 0.01; ***, P < 0.001; ****, P < 0.0001.
도 9는 마우스에서의 전신 주사된 rAAV6.2 또는 rAAV9의 조직 분포를 보여준다. 혈관 투과성 (VP) 작용제 또는 rAAV6의 존재 또는 부재 하의 rAAV6.2.egfp 5 x 1013 vg/kg을 2개월령의 수컷 마우스 (n=3) 내로 정맥내로 주사하고, 2주 후에, 뇌, 심장, 폐, 비장, 간, 신장 및 뒷다리에서의 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템을 사용하여 EGFP 발현에 의해 평가하였다.
도 10a-10b는 FOP 마우스 모델에서의 rAAV9 벡터의 치료 효과를 보여준다. 타목시펜의 5회 연속 주사의 3일 후, 6주령의 수컷 ACVR1(R206H)FIEx;ERT-Cre 마우스에게 5 x 1013 vg/kg의 rAAV9 벡터 (amiR-RH6 및 opt-ACVR1을 보유하는 rAAV9 벡터, amiR-RH7 및 opt-ACVR1을 보유하는 rAAV9 벡터, 및 amiR 및 대조군을 보유하는 rAAV9 벡터)를 정맥내로 주사하였다. 10주 후에, 자발적 이소성 골화 (HO)를 마이크로CT에 의해 평가하였다. 처리된 마우스 (도 10a, n=5) 및 HO 부위의 대표적인 3D-재구성 마이크로CT 영상을 정량화하였다 (도 10b).
도 11은 ACVR1-R206H 편집을 위한 Cas9-기반 아데닌 염기 편집제 (ABE)의 플라스미드 구축을 보여주는 개략적 다이어그램을 예시한다. C-말단 ABE 구축물 (좌측 영상)은 AAV6.2 또는 AAV9 캡시드 내로 패키징된다. N-말단 ABE 구축물 (우측 영상)은 R206H 돌연변이 부위를 갖는 프로토스페이서를 함유한다.
도 12는 FOP에 대한 AAV-매개된 치료 접근법을 보여주는 개략적 다이어그램이다. 프로모터인 pBRE 및 pNF-κB는 각각 액티빈 A/BMP 리간드 및 염증에 반응하여 가용성 폴리스타틴 (sFST) 및 TNFR2의 발현을 유도한다. rAAV9 벡터의 근육내 또는 정맥내 주사 3일 후에, ACVR1(R206H)FIEx;ERT-Cre 마우스에서 심장독소-유도된 근육 손상을 실행하여 HO를 발생시킬 것이다. 골격근 내 손상-유도된 플레어-업 영역에서의 액티빈 A 및 TNF의 상향조절은 이소성 골에서 액티빈 A 및 TNF 신호전달을 억제하는 가용성 FST 및 TNFR2의 생산을 발생시킨다. 약어: pBRE, BMP-반응성 요소; pNF-κB, NF-κB-결합 부위.
도 13a-13d는 염증성 시토카인 및/또는 골 형태발생 단백질 (BMP)에 반응하는 AAV 벡터 게놈의 생성을 보여준다. 도 13a는 pBRE 및 pNF-kB 프로모터, ITR, 및 가우시아 리포터 유전자를 갖는 플라스미드 구축의 개략적 다이어그램이다. 도 13b-13d는 HEK293 세포를 PB2-luc 또는 AAV 벡터 게놈 (eBRE/NF-κB-luc)으로 일시적으로 형질감염시키고, 24시간 후에, 세포를 상이한 농도의 TNF 또는 IL-1β (도 13b), BMP4 (도 13c), 또는 조합물 (도 13d)로 자극한 후의 결과를 보여준다. 루시페라제 검정을 사용하여 벡터의 반응성을 측정하였다. 값은 평균 ± SD로 나타내어지고: 모든 패널에서 독립표본 양측 스튜던트 t-검정에 의해 *, P < 0.05, **, P < 0.01, ***, 및 P < 0.001.
도 14a-14b는 가용성 폴리스타틴 (FST-288) 및 TNFR2를 생산하는 AAV 벡터 게놈의 생성을 보여준다. 도 14a는 플라스미드 구축의 개략적 다이어그램이다. 도 14b는 HEK293 세포를 대조군 벡터 또는 FST-288 및 sTNFR2를 코딩하는 AAV 벡터 게놈으로 형질감염시키고, 48시간 후에 상청액을 수거한 후의 결과를 보여준다. PB2-luc 또는 3TP-lux를 HEK293 세포 내로 형질감염시키고, 24시간 후에, 배양 배지를 신선한 배지: 상이한 농도의 TNF 또는 액티빈 A를 함유하는 수거한 상청액 (1:1)으로 교체하였다. 24시간 후에, 루시페라제 검정을 수행하여 TNF-유도된 NF-kB 및 액티빈 A-유도된 SMAD 활성화를 평가하였다. 값은 평균 ± SD로 나타내어지고: 모든 패널에서 독립표본 양측 스튜던트 t-검정에 의해 ns, 유의하지 않음, *, P < 0.05, **, P < 0.01, ****, 및 P < 0.0001.
도 15a-15d는 AAV-유전자 치료제가 ACVR1-R206H 돌연변이에 의해 증진된 골형성을 역전시킨다는 것을 보여준다. 도 15a는 ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC를 인간 FOP-iPSC에 2일 동안 형질도입하고, 골형성 조건 하에 4일 동안 배양한 것을 보여준다. 총 RNA를 cDNA 합성에 적용한 후, Egfp 발현에 대해 RT-PCR을 수행하였다. 도 15b는 총 RNA를 RNA 서열분석에 적용하고, amiR-RH7.optACVR1에 비해 amiR-RH6.optACVR1을 발현하는 세포에서 상향/하향조절된 유전자에 대한 유전자 발현을 비교한 볼케이노 플롯을 생성한 것을 보여준다. 도 15c는 Sca1+PDGFRa+CD31-CD45- 섬유지방생성 전구세포 (FAP)를 4주령의 Acvr1R206H;PDGFRa 마우스의 경골근으로부터 FACS 분류하고, ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터의 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 6일 동안 배양하고, 골형성 유전자 발현을 RT-PCR에 의해 평가하였다. 도 15d는 ctrl-발현 세포에 비해 amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt를 발현하는 세포에서 상향조절된 및 하향조절된 유전자에 대한 유전자 발현을 보여주는 볼케이노 플롯을 나타낸 것을 보여준다.
도 16a-16c는 시험관내 액티빈 A-유도된 골형성에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 16a는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, 액티빈 A (100 ng/ml)로 6 또는 24시간 동안 자극하고, 액티빈 A-반응성 유전자 Id1 및 Msx2의 발현을 각각 RT-PCR을 사용하여 평가하였다. 도 16b-16c는 AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 16b) 및 알리자린 레드 염색 (도 16c)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가한 것을 보여준다.
도 17a-17i는 액티빈 A 신호전달 및 외상성 이소성 골화에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 17a-17d는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 17a). AAV-처리한 세포를 액티빈 A (100 ng/ml)로 30분 동안 자극하고, 포스포-Smad1/5에 대해 이뮤노블롯팅하였다. 항-Gapdh 항체를 로딩 대조군에 사용하였다 (도 17b). AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 17c, 좌측) 및 알리자린 레드 염색 (도 17c, 우측)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가하였다. AAV-처리한 세포를 골형성 조건 하에 PBS 또는 BMP4 (50 ng/ml)와 함께 12일 동안 배양하고, 무기질화에 대해 알리자린 레드 염색 (도 17c, 우측)을 수행하였다 (도 17d). 도 17e는 EGFP를 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 Tie2-cre;Ai9 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상 1주 후에 진피내로 (i.d.) 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (좌측 상단) 및 HO 조직의 동결-절편화 (좌측 하단, 우측)를 수행한 것을 보여준다. 박스는 골격근에서의 HO를 나타낸다. M, 근육; HO-BM, 이소성 골화 골수. 청색, DAPI; 적색, Tie2+ 세포; 녹색, AAV-형질도입된 세포. 도 17f-17g는 벡터 또는 CRE 레콤비나제를 발현하는 rAAV9의 5 x 1012 vg/kg을 6주령의 암컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로 i.d. 주사하고, 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였음을 보여준다. 4주 후에, 경골근에서의 Acvr1R206H 및 CRE 레콤비나제 mRNA 수준을 RT-PCR에 의해 측정하고 (도 17f), 경골근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 17g, 좌측) 및 정량화를 나타낸다 (도 17g, 우측). 도 17h는 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 2일 후에 i.d. 주사한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, 경골근에서의 HO를 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측). 도 17i는 ctrl 또는 amiR-RH6.optACVR1을 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=5)의 대퇴근에 i.d. 주사하고, 2일 후에 rBMP2/7-매트리겔 주사 및 근육 손상을 주사 부위에 사용한 것을 보여준다. 4주 후에, 대퇴근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측).
도 18a-18f는 AAV-처리한 골격근에서의 외상성 이소성 골화의 평가를 보여준다. 도 18a-18b는 연구 및 처리 설계의 다이어그램을 보여준다. EGFP를 발현하는 rAAV6.2의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상의 1주 후에 i.d. 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (도 18b, 좌측) 및 HO 조직의 동결-절편화 (도 18b, 우측)를 수행하였다. 박스는 골격근에서의 HO를 나타낸다. 도 18c-18d는 추가의 연구 및 처리 설계의 다이어그램을 보여준다. 도 18e는 ctrl, amiR-RH6, optACVR1 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 3일 후에 i.d. 주사한 것을 보여준다. 3일 후, 핀치 손상 및 1 μM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (우측). 도 18f는 추가의 연구 및 치료 설계의 다이어그램을 보여준다.
도 19a-19f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 19a-19b는 P1 PDGFRa-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템 (도 19a) 또는 AAV-처리한 뒷다리의 동결 절편 (도 19b)을 사용하여 mCherry 발현에 의해 평가한 것을 보여준다. BM: 골수. 도 19c-19e는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=10)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 19c). 경골근에서의 HO를 마이크로CT 또는 조직학을 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 19d, 좌측) 및 정량화를 나타낸다 (도 19d, 우측). 도 19e는 대표적인 조직학 데이터를 보여준다. 도 19f는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=3)를 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 3일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 3, 7, 14, 28일 후, 경골근에서의 HO를 X-방사선촬영에 의해 평가하였다. 박스는 경골근에서의 HO를 나타낸다.
도 20a-20g는 AAV-유전자 치료제의 전신 전달이 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 20a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 20b-20c는 P1 PDGFRα-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, PDGFRα 발현을 IVIS-100 광학 영상화 시스템에 의해 GFP 발현을 사용하여 평가한 것을 보여준다 (도 20b). 뒷다리에서 AAV-형질도입된 세포를 또한 형광 현미경검사를 사용하여 뒷다리에서의 mCherry 발현에 의해 평가하였다. IVIS-100 광학 영상화 시스템 (도 20b) 또는 AAV-처리한 뒷다리의 동결 절편 (도 20c). BM: 골수. 도 20d는 P1 야생형 새끼 (n=3)를 LacZ를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, AAV-형질도입된 조직의 동결-절편을 X-갈락토시다제에 대해 염색한 것을 보여준다. BM: 골수, CB: 피질 골, M: 근육. 도 20e는 P1 PDGFRα-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, PDGFRα 발현을 IVIS-100 광학 영상화 시스템에 의해 GFP 발현을 사용하여 평가한 것을 보여준다. 도 20f는 연구 및 처리 방법 설계의 다이어그램을 보여준다. 도 20g는 연구 및 처리 방법 설계의 다이어그램을 보여준다.
도 21a-21j는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 21a는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후에, 간에서의 Acvr1R206H 및 optACVR1 mRNA 수준을 RT-PCR에 의해 평가하였다. 전신 (도 21b), 몸통 (도 21c) 및 하체 (도 21d)의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방한다는 것을 입증한다. 화살표는 HO 영역을 나타낸다. 전신에서의 총 HO 부피 (도 21e) 및 HO 영역의 수 (도 21f)를 정량화하였다. 임상 HO 발생률의 백분율을 평가하였다 (도 21g). 슬관절의 마이크로CT 및 조직학을 수행하여 이소성 골 (도 21h, 좌측 및 중간), 관절 연골 (도 21h, 중간), 및 성장판 (도 21h, 우측)의 변성을 평가하였다. 박스는 HO 영역 및 관절 연골 및 성장판을 나타낸다. 총 비장세포 집단 내의 면역 세포의 빈도는 전신 면역 반응에 대한 AAV 벡터의 영향이 거의 내지 전혀 없음을 나타낸다 (n=6~8, 도 21i). 도 21j는 관절 연골 (좌측 영상) 및 성장판 (우측 영상)의 변성의 마이크로CT 및 조직학 영상을 보여준다.
도 22a-22f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 22a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 22b는 mCherry를 발현하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 개별 조직에서의 mCherry 발현을 주사 2주 후에 IVIS-100 광학 영상화에 의해 모니터링하였다. 도 22c-2f는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후, 정상적으로 이동하는 Acvr1R206H (ctrl) 마우스, 느리게 이동하는 Acvr1R206H;Cre-ERT2 (ctrl) 마우스, 및 정상적으로 이동하는 Acvr1R206H;Cre-ERT2 (amiR-RH6.optACVR1) 마우스를 포함한 16주령의 AAV-처리한 마우스의 움직임. 화살표는 amiR-RH6.optACVR1-처리한 마우스를 나타낸다 (도 22c). 도 22d는 슬관절 주변의 이소성 골을 보여준다. 도 22e는 AAV-처리한 비장의 종단면의 H&E 염색을 보여준다. 도 22f는 총 비장세포의 집단 내의 단핵구, 대식세포 및 호중구의 빈도를 보여준다 (n=6~8).
도 23은 성체 FOP 마우스에서의 조직 조직병리학에 대한 AAV-유전자 치료제의 효과를 보여준다. ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사하였다. 10주 후에, 폐, 간, 신장, 심장 및 골격근에서 H&E 염색을 수행하여 조직의 조직병리학을 평가하였다 (n=3).
도 24a-24h는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 24a는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRa-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다 (상단). HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다 (하단). 박스는 HO 조직을 나타낸다. 도 24b-24h는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. AAV-처리한 마우스의 생존 (도 24b) 및 체중 (도 24c)을 3주령부터 8주령까지 매주 분석하였다. 5주령의 AAV-처리한 두개골의 마이크로CT 분석은 AAV 벡터가 Acvr1R206H;PDGFRa-Cre 마우스의 악관절강직을 역전시키는 능력을 보여준다 (도 24d-24e). 3D 재구성 (도 24d, 상단) 및 2D 횡단면 (도 24d, 하단) 영상 및 개구 간격 (도 24e)을 나타낸다. 화살표는 측두하악 관절강직의 영역을 나타낸다. 상악골 및 하악골의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스의 낮은 골 질량을 역전시킨다는 것을 입증한다 (도 24f-24g). 마이크로CT 분석은 AAV-처리한 마우스의 상악골 및 하악골을 보여주었다. 2D 단면 (도 24f) 및 횡단면 (도 24g) 영상을 나타낸다. 화살표는 치근골을 나타낸다. 전신의 마이크로CT 분석은 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방하는 AAV 벡터의 능력을 보여준다 (도 24h). 마이크로CT 분석은 AAV-처리한 마우스의 전신을 보여주었다. 3D 재구성 (도 24h, 좌측) 및 2D 횡단면 (도 24h, 우측) 영상을 나타낸다.
도 25a-25b는 AAV9의 전신 전달이 소아 FOP 마우스에서 HO 조직의 형질도입에 효과적이라는 것을 보여준다. 도 25a는 5주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에서의 HO 조직의 알시안 블루 염색을 보여준다. 도 25b는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다. HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다.
도 26a-26b는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 26a는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. 정상 크기의 Acvr1R206H 마우스 (ctrl), 작은 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (ctrl), 및 정상 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (amiR-RH6.optACVR1)를 포함한, 5주령의 AAV-처리한 마우스의 움직임이 제시된다. 도 26b는 5주령의 AAV-처리한 마우스의 전신을 보여주는 X-방사선촬영을 보여준다.
도 27a-27d는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 악관절강직을 예방한다는 것을 보여준다. P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하였다. 도 27a는 5주령의 AAV-처리한 마우스의 개구 능력을 입증하는 사진을 보여준다. 도 27b는 5주령의 AAV-처리한 마우스의 개별 조직이, optACVR1 또는 amiR-RH6.optACVR1의 AAV-매개된 발현이 기아에 의한 Acvr1R206H; PDGFRa-Cre 장의 붕괴를 예방한다는 것을 입증하는 사진을 보여준다. 도 27c는 2개월령의 PDGFRa-GFP 마우스 (n=3)의 하악골의 동결 절편을 형광 현미경검사에 의해 치조골의 뿌리에서의 PDGFRa 발현에 대해 평가한 것을 보여준다. DAPI: 핵 염색. 도 27d는 AAV-처리한 마우스의 상악골 및 하악골의 2D 시상면 절편 영상을 보여주는 마이크로CT 분석을 보여준다. 화살표는 치아에서의 치조골의 뿌리를 나타낸다.
도 28a-28c는 치료 유전자의 발현을 제어하기 위한 AAV 벡터 게놈의 변형을 보여준다. 도 28a는 플라스미드 구축의 개략적 다이어그램을 보여준다. CMV 인핸서/닭 β-액틴 프로모터 (CBA), MBL 인트론 (MBLi), β-글로빈 폴리A 서열 (PA), 및 역전된 말단 반복부 (TR). miR-122: 간-특이적 miRNA, miR-208a: 심장 근육-특이적 miRNA, TS: 표적 서열. miR-122/miR208a-TS는 간 및 심장에서 AAV의 발현을 억제하는 데 사용된다. EndoID1-BRE: BMP-반응성 요소. pNF-kB: 염증-반응성 요소. EndoID1-BRE/pNF-kB를 함유하는 프로모터는 BMP, 액티빈 A, 및/또는 염증유발 시토카인에 반응하여 AAV의 발현을 유도하는 데 사용된다. 도 28b는 플라스미드 구축의 개략적 다이어그램을 보여준다. 도 28c는 6주령의 야생형 마우스를 PBS 또는 5 x 1013 vg/kg의 rAAV9.egfp 또는 rAAV9.egfp.MIR-TS의 i.v. 주사로 처리하고, 2주 후에, AAV 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템에 의해 EGFP 발현을 사용하여 모니터링한 것을 보여준다.
도 29a-29c는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 외상성 HO를 예방한다는 것을 보여준다. P1 Acvr1R206H;Cre-ERT2 새끼 (n=10)를 ctrl, amiR-RH6, ACVR1opt, 또는 amiR-RH6.ACVR1opt를 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스에게 타목시펜 (10 mg/kg)을 i.p. 주사하였다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였다. 경골근에서의 이소성 골을 마이크로CT 또는 조직학을 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 29a, 상단 도면)을 나타낸다. ctrl 또는 amiR-RH6.ACVR1opt를 보유하는 rAAV9의 1011 GC로 처리된 P1 Acvr1R206H;Cre-ERT2 새끼 (n=3)를 6주령까지 성숙시키고, 타목시펜으로 i.p. 주사하였다. 3일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였다. 7, 14, 및 28일 후에, 경골근에서의 HO를 조직학에 의해 평가하였다 (도 29b). 제3일에 손상된 영역의 종단면을 F4/80에 대해 면역염색하였다 (도 29c).
도 30a 및 30b는 유전자 대체, 침묵 및 조합을 위한 생성된 AAV 벡터 게놈을 보여준다. 도 30a는 인간 ACVR1R206H, ACVR1WT, 또는 ACVR1opt cDNA를 코딩하는 포유동물 발현 벡터 (pcDNA6, pAAV)의 개략적 다이어그램을 보여준다. 도 30b는 대조군, 또는 4종의 조합 벡터를 인간 ACVR1R206H, ACVR1WT, 또는 ACVR1opt를 발현하는 플라스미드와 함께 HEK293 세포 내로 일시적으로 형질감염시키고, 인간 ACVR1 mRNA 수준을 RT-PCR에 의해 평가한 것을 보여준다.
도 31은 시험관내 액티빈 A-유도된 골형성에 대한 AAV 유전자 치료제의 효과를 보여준다. ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 AAV6.2 벡터의 5 x 1010 GC를 인간 iPSC에 형질도입하고, 2일 후에, 세포를 PBS 또는 액티빈 A (100 ng/ml)와 함께 6시간 동안 인큐베이션하고, MSX2 mRNA 수준을 RT-PCR에 의해 측정하고, HPRT에 대해 정규화하였다.
도 32a-32e는 마우스에서의 rAAV6.2 또는 rAAV9의 생체분포를 보여준다. 5 x 1013 vg/kg의 rAAV6.2.egfp를 단독으로 (도 32a) 또는 혈관 투과성 작용제와 함께 (VP, 인간 VEGF-166 + 나트륨 헤파린 + 혈청 알부민, 도 32b) 2-개월령의 수컷 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템을 사용하여 EGFP 발현에 의해 평가하였다. 도 32c는 5 x 1013 vg/kg의 rAAV9.egfp를 2-개월령의 수컷 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템을 사용하여 EGFP 발현에 의해 평가한 것을 보여준다. 도 32d 및 32e는 mCherry를 발현하는 rAAV9의 5 x 1012 vg/kg을 2-개월령의 수컷 야생형 마우스 (n=3)의 경골근에 진피간으로 (i.d.) 주사한 것을 보여준다. 2주 후, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템 (도 32d) 또는 AAV-처리한 뒷다리의 동결 절편 (도 32e)을 사용하여 mCherry 발현에 의해 평가하였다.
본 개시내용의 측면은 진행성 골화성 섬유이형성증 (FOP) 및 플레어-업 상태를 치료하기 위한 방법 및 조성물에 관한 것이다. 본 개시내용은 부분적으로, 돌연변이된 액티빈 A 유형 1 수용체 (ACVR1)의 발현을 감소시키는 조성물 (예를 들어, 단리된 핵산, 벡터, rAAV 등)을 기초로 한다. 일부 실시양태에서, 본원에 개시된 바와 같은 조성물 (AAV-매개된 유전자 전달 플랫폼)은 대상체에서 비정상적 골 형성을 갖는 이환 조직, 예컨대 골격근, 건 및 연골에 전달되는 경우에, 예를 들어 액티빈 A 길항제 및/또는 TNF 길항제를 유도함으로써 적어도 이소성 골화 및/또는 플레어-업 상태를 억제한다. 따라서, 본 개시내용에 의해 기재된 방법 및 조성물은 일부 실시양태에서 FOP와 연관된 질환 및 장애의 치료에 유용하다.
단리된 핵산
트랜스진 (예를 들어 억제 RNA, 예컨대 shRNA, miRNA 등)을 대상체에게 전달하기 위한 조성물 및 방법이 본 개시내용에 제공된다. 조성물은 전형적으로 골 대사를 조정하고/거나 FOP를 치료할 수 있는 트랜스진 (예를 들어, 단백질, 억제 핵산 등)을 코딩하는 단리된 핵산을 포함한다. 예를 들어, 일부 실시양태에서, 트랜스진은 표적 단백질, 예컨대 골 형성을 촉진하는 것과 연관된 표적 단백질의 발현을 감소시킨다.
일부 실시양태에서, 본 개시내용에 기재된 바와 같은 단리된 핵산, 벡터, 재조합 유전자 편집 복합체 또는 rAAV는 적어도 1개의 코돈 최적화된 ACVR1 (예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 코돈 최적화된 ACVR1)을 코딩하는 트랜스진을 포함한다. 일부 실시양태에서, 코돈 최적화된 ACVR1은 야생형 ACVR1이다. 일부 실시양태에서, 재조합 ACVR1 유전자의 코돈 조성은 ACVR1의 아미노산 서열을 변경시키지 않으면서 개선 또는 최적화될 수 있다. 일부 실시양태에서, 코돈 최적화된 ACVR1은 ACVR1-R206H의 경쟁적 억제제이다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 코돈 최적화된 ACVR1은 결합에 대해 돌연변이된 ACVR1, 예컨대 ACVR1-R206H와 경쟁한다.
일부 실시양태에서, 코돈 최적화된 ACVR1은 서열식별번호: 1에 제시된 바와 같은 서열을 포함한다. 일부 실시양태에서, 코돈 최적화된 ACVR1을 포함하는 벡터 구축물은 서열식별번호: 2-4에 제시된 바와 같은 서열을 포함한다. 일부 실시양태에서, 코돈 최적화된 ACVR1을 운반하는 rAAV-매개된 유전자 전달은 유전자 부가 플랫폼이다. 일부 실시양태에서, 코돈-최적화된 야생형 인간 ACVR1 cDNA는 크기가 약 1.5 kb이다 (도 2).
일부 실시양태에서, 트랜스진은 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 프로모터는 코돈 최적화된 ACVR1의 발현을 유도하는 데 적합한 임의의 프로모터일 수 있다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 CBA 인트론을 포함한다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 매스바이올로직스 신규 (MBL) 인트론 (예를 들어, 서열식별번호: 37)을 포함한다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 합성 인트론을 포함한다. 일부 실시양태에서, CBA 인트론은 MBL 인트론 또는 합성 인트론에 의해 치환될 수 있다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 합성 인트론은 부분적으로 내인성 인트론으로 치환될 수 있고, 이는 증진된 mRNA 생산으로 이어질 수 있다. 일부 실시양태에서, CBA 프로모터는 코돈 최적화된 ACVR1을 위해 설계된 벡터 구축물에 적합한 임의의 프로모터를 포함할 수 있다. 일부 측면에서, MBL 인트론 및/또는 합성 인트론의 사용은 벡터 게놈의 크기를 감소시키고, 바람직하게는 적어도 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 또는 25%만큼 감소된다. 일부 실시양태에서, 트랜스진에 AAV 역전된 말단 반복부 (ITR)가 플랭킹된다.
일부 실시양태에서, 단리된 핵산, 벡터, 또는 rAAV는 1종 이상 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10종, 또는 그 초과)의 억제 핵산, 예를 들어 dsRNA, siRNA, shRNA, miRNA, 인공 마이크로RNA (ami-RNA) 등을 코딩한다. 일반적으로, 억제 핵산은 FOP와 연관된 유전자 생성물 (예를 들어, 단백질) (예를 들어, ACVR1)을 코딩하는 유전자의 적어도 2개 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25개 또는 그 초과)의 연속 염기에 특이적으로 결합한다 (예를 들어, 혼성화한다). 본원에 사용된 "연속 염기"는 (예를 들어, 핵산 분자의 일부로서) 서로 (예를 들어, 1개 이상의 포스포디에스테르 결합 등에 의해) 공유 결합된 2개 이상의 뉴클레오티드 염기를 지칭한다. 일부 실시양태에서, 적어도 1종의 억제 핵산은 FOP와 연관된 유전자 생성물 (예를 들어, 단백질) (예를 들어, ACVR1)을 코딩하는 유전자의 2개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25개, 또는 그 초과)의 연속 뉴클레오티드 염기와 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95%, 약 99% 또는 약 100% 동일하다.
"마이크로RNA" 또는 "miRNA"는 전사 또는 번역후 유전자 침묵을 매개할 수 있는 작은 비-코딩 RNA 분자이다. 전형적으로, miRNA는 1차 miRNA (pri-miRNA)로 지칭되는 헤어핀 또는 스템-루프 (예를 들어, 자기-상보성, 단일-가닥 백본을 가짐) 듀플렉스 구조로서 전사되고, 이는 효소적으로 (예를 들어, 드로샤, DGCR8, 파샤 등에 의해) pre-miRNA로 프로세싱된다. pri-miRNA의 길이는 다양할 수 있다. 일부 실시양태에서, pri-miRNA는 약 100 내지 약 5000개 염기 쌍 (예를 들어, 약 100, 약 200, 약 500, 약 1000, 약 1200, 약 1500, 약 1800, 또는 약 2000개 염기 쌍) 길이 범위이다. 일부 실시양태에서, pri-miRNA는 200개 초과의 염기 쌍 길이 (예를 들어, 2500, 5000, 7000, 9000개, 또는 그 초과의 염기 쌍 길이)이다.
헤어핀 또는 스템-루프 듀플렉스 구조를 또한 특징으로 하는 pre-miRNA도 또한 길이가 다양할 수 있다. 일부 실시양태에서, pre-miRNA는 크기가 약 40개 염기 쌍 길이 내지 약 500개 염기 쌍 길이 범위이다. 일부 실시양태에서, pre-miRNA는 크기가 약 50 내지 100개 염기 쌍 길이 범위이다. 일부 실시양태에서, pre-miRNA는 크기가 약 50 내지 약 90개 염기 쌍 길이 (예를 들어, 약 50, 약 52, 약 54, 약 56, 약 58, 약 60, 약 62, 약 64, 약 66, 약 68, 약 70, 약 72, 약 74, 약 76, 약 78, 약 80, 약 82, 약 84, 약 86, 약 88, 또는 약 90개 염기 쌍 길이) 범위이다.
일반적으로, pre-miRNA는 세포질 내로 유출되고, 다이서에 의해 효소적으로 프로세싱되어 먼저 불완전한 miRNA/miRNA* 듀플렉스 및 이어서 단일-가닥 성숙 miRNA 분자가 생산되고, 이는 후속적으로 RNA-유도된 침묵 복합체 (RISC) 내로 로딩된다. 전형적으로, 성숙 miRNA 분자는 크기가 약 19 내지 약 30개 염기 쌍 길이 범위이다. 일부 실시양태에서, 성숙 miRNA 분자는 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 또는 30개 염기 쌍 길이이다.
일부 측면에서, 본 개시내용은 1개 이상의 인공 miRNA를 코딩하는 단리된 핵산, 벡터 (예를 들어, rAAV 벡터)를 제공한다. 본원에 사용된 "인공 miRNA" 또는 "amiRNA"는, 예를 들어 문헌 [Eamens et al., (2014), Methods Mol. Biol. 1062:211-224]에 기재된 바와 같이, miRNA 및 miRNA* (예를 들어, miRNA 듀플렉스의 패신저 가닥) 서열이 표적화된 유전자의 고도로 효율적인 RNA 침묵을 지시하는 상응하는 amiRNA/amiRNA* 서열로 대체된, 내인성 pri-miRNA 또는 pre-miRNA (예를 들어, 기능적 성숙 miRNA를 생산할 수 있는 전구체 miRNA인 miRNA 백본)를 지칭한다. 예를 들어, 일부 실시양태에서, 인공 miRNA는 골 대사 조정 (예를 들어, 골 형성 억제제) miRNA를 코딩하는 서열이 내인성 miR-33 성숙 miRNA-코딩 서열 대신 삽입된, miR-33 pri-miRNA 백본을 포함한다. 일부 실시양태에서, 본 개시내용에 기재된 바와 같은 miRNA (예를 들어, 인공 miRNA)는 miR-33 백본 서열을 포함한다.
일부 실시양태에서, 벡터는 플라스미드, 바크미드, 코스미드, 바이러스, 폐쇄형-단부 선형 DNA (ceDNA), 또는 바큘로바이러스 벡터이다.
일부 실시양태에서, 본 개시내용은 ACVR1 단백질을 코딩하는, AVCR1 유전자를 표적화하는 인공 miRNA를 코딩하는 트랜스진을 포함하는 단리된 핵산을 제공한다. ACVR1 (ALK2)은 세포외 리간드 결합 도메인 (LBD), 막횡단 도메인 (TM), 글리신-세린-풍부 도메인 (GS) 및 세린/트레오닌 키나제 도메인을 함유하는 유형 1 BMP 수용체이다. ACVR1에서의 상염색체 우성 돌연변이는 단일유전자 골격 희귀 질환인 FOP의 발생으로 이어진다. 대다수의 FOP 환자는 전형적인 단일 점 돌연변이 (ACVR1-R206H, G>A)를 보유하며, 이는 골 형태발생 단백질 (BMP) 신호전달 경로의 자발적 활성화를 발생시킨다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 액티빈 A도 또한 FOP에서 ACVR1에 대한 리간드로서 확인된다. 정상 조건 하에, 야생형 ACVR1 수용체에 대한 액티빈 A 결합은 SMAD2/3 경로를 통한 TGF-β 신호전달로 이어지고, 이는 야생형 ACVR1에서 BMP 신호전달의 경쟁적 억제제로서 기능한다. ACVR1이 돌연변이되는 경우, ACVR1-R206H 수용체에 대한 액티빈 A 결합은 SMAD1/5/9 경로를 통해 BMP 신호전달을 활성화시켜 골 형성을 발생시킨다.
일부 측면에서, 본 개시내용은 ACVR1 발현을 감소시키는 데 사용되는 인공 마이크로RNA를 코딩하는 트랜스진을 포함하는 단리된 핵산에 관한 것이다. 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 발현을 억제하는 데 사용된다. 일부 실시양태에서, ACVR1은 돌연변이된다. 일부 실시양태에서, FOP와 연관된 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13개의 돌연변이 ACVR1 돌연변이가 확인된다 (도 1a). 일부 실시양태에서, ACVR1은 단일 점 돌연변이 (ACVR1-R206H, G>A)를 보유한다. 일부 실시양태에서, ACVR1 돌연변이는 인간 ACVR1-R206H이다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, FOP 환자의 대략 97%는 ACVR1 유전자에서 상염색체 우성 돌연변이 (G>A)를 보유하며, 위치 206에서 아르기닌의 히스티딘으로의 치환 (R206H, G>A)을 갖는다 (도 1a). 일부 실시양태에서, 마이크로RNA에 대한 벡터 구축물에 사용되는 바와 같은 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 마이크로RNA에 대한 벡터 구축물에 사용되는 바와 같은 프로모터는 마이크로RNA의 발현에 적합한 임의의 프로모터일 수 있다.
일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 적어도 6개의 연속 뉴클레오티드를 표적화한다 (예를 들어, 그에 결합하거나, 또는 그와 상보성인 영역을 포함한다). 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 6 내지 30개의 연속 뉴클레오티드를 표적화한다 (예를 들어, 그에 결합하거나, 또는 그와 상보성인 영역을 포함한다). 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 12-24개의 연속 뉴클레오티드를 표적화한다. 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 9-27개의 연속 뉴클레오티드를 표적화한다. 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 적어도 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 연속 뉴클레오티드를 표적화한다.
일부 실시양태에서, 인공 마이크로RNA는 6-50개 뉴클레오티드 길이이다. 일부 실시양태에서, 인공 마이크로RNA는 8-24개 뉴클레오티드 길이이다. 일부 실시양태에서, 인공 마이크로RNA는 12-36개 뉴클레오티드 길이이다. 일부 실시양태에서, 인공 마이크로RNA는 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개 뉴클레오티드 길이이다.
일부 실시양태에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 표적 유전자의 발현을 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 감소시킨다. 일부 측면에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 표적 유전자의 발현을 75% 내지 90%만큼 감소시킨다. 일부 측면에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 표적 유전자의 발현을 80% 내지 99%만큼 감소시킨다. 일부 실시양태에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 ACVR1 유전자의 발현을 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 감소시킨다. 일부 실시양태에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 ACVR1 유전자의 발현을 75% 내지 90%만큼 감소시킨다. 일부 측면에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 ACVR1 유전자의 발현을 80% 내지 99%만큼 감소시킨다.
트랜스진을 포함하는 영역 (예를 들어, 제2 영역, 제3 영역, 제4 영역 등)은 단리된 핵산의 임의의 적합한 위치에 위치할 수 있다. 영역은 예를 들어 인트론, 5' 또는 3' 비번역 영역 등을 포함하는 핵산의 임의의 비번역 부분에 위치할 수 있다.
일부 경우에, 단백질을 코딩하는 핵산 서열 (예를 들어, 단백질 코딩 서열)의 제1 코돈의 상류에 영역 (예를 들어, 제2 영역, 제3 영역, 제4 영역 등)이 위치하는 것이 바람직할 수 있다. 예를 들어, 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 2000개 뉴클레오티드 사이에 위치할 수 있다. 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 1000개 뉴클레오티드 사이에 위치할 수 있다. 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 500개 뉴클레오티드 사이에 위치할 수 있다. 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 250개 뉴클레오티드 사이에 위치할 수 있다. 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 150개 뉴클레오티드 사이에 위치할 수 있다.
일부 경우에 (예를 들어, 트랜스진에 단백질 코딩 서열이 결여된 경우에), 트랜스진의 폴리-A 테일의 상류에 영역 (예를 들어, 제2 영역, 제3 영역, 제4 영역 등)이 위치하는 것이 바람직할 수 있다. 예를 들어, 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 2000개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 1000개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 500개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 250개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 150개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 100개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 50개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 20개 뉴클레오티드 사이에 위치할 수 있다. 일부 실시양태에서, 영역은 프로모터 서열의 마지막 뉴클레오티드 염기와 폴리-A 테일 서열의 제1 뉴클레오티드 염기 사이에 위치한다.
일부 경우에, 영역은 트랜스진의 폴리-A 테일의 마지막 염기의 하류에 위치할 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 2000개 뉴클레오티드 위치 사이에 있을 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 1000개 뉴클레오티드 위치 사이에 있을 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 500개 뉴클레오티드 위치 사이에 있을 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 250개 뉴클레오티드 위치 사이에 있을 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 150개 뉴클레오티드 위치 사이에 있을 수 있다.
트랜스진이 1개 초과의 miRNA를 코딩하는 경우에, 각각의 miRNA는 트랜스진 내의 임의의 적합한 위치에 위치할 수 있는 것으로 인지되어야 한다. 예를 들어, 제1 miRNA를 코딩하는 핵산은 트랜스진의 인트론에 위치할 수 있고, 제2 miRNA를 코딩하는 핵산 서열은 또 다른 비번역 영역에 (예를 들어, 단백질 코딩 서열의 마지막 코돈과 트랜스진의 폴리-A 테일의 제1 염기 사이에) 위치할 수 있다.
일부 실시양태에서, 트랜스진은 1개 이상의 발현 제어 서열 (예를 들어, 프로모터 등)을 코딩하는 핵산 서열을 추가로 포함한다. 발현 제어 서열은 적절한 전사 개시, 종결, 프로모터 및 인핸서 서열; 효율적인 RNA 프로세싱 신호, 예컨대 스플라이싱 및 폴리아데닐화 (폴리A) 신호; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 증진시키는 서열 (즉, 코작 컨센서스 서열); 단백질 안정성을 증진시키는 서열; 및 원하는 경우에, 코딩된 생성물의 분비를 증진시키는 서열을 포함한다. 천연, 구성적, 유도성 및/또는 조직-특이적인 프로모터를 비롯한 많은 수의 발현 제어 서열이 관련 기술분야에 공지되어 있고 이용될 수 있다.
"프로모터"는 유전자의 특이적 전사를 개시하는 데 요구되는, 세포의 합성 기구 또는 도입된 합성 기구에 의해 인식되는 DNA 서열을 지칭한다. 어구 "작동가능하게 위치한", "제어 하" 또는 "전사 제어 하"는 프로모터가 RNA 폴리머라제 개시 및 유전자의 발현을 제어하기 위해 핵산과 관련하여 정확한 위치 및 배향으로 있음을 의미한다.
단백질을 코딩하는 핵산의 경우, 폴리아데닐화 서열은 일반적으로 트랜스진 서열 다음에 및 3' AAV ITR 서열 앞에 삽입된다. 본 개시내용에 유용한 rAAV 구축물은 또한 바람직하게는 프로모터/인핸서 서열과 트랜스진 사이에 위치하는 인트론을 함유할 수 있다. 본원에 개시된 바와 같이, 하나의 가능한 인트론 서열은 SV-40으로부터 유래되고, SV-40 T 인트론 서열로 지칭된다. 사용될 수 있는 또 다른 벡터 요소는 내부 리보솜 진입 부위 (IRES)이다. IRES 서열은 단일 유전자 전사체로부터 1종 초과의 폴리펩티드를 생산하는 데 사용된다. IRES 서열은 1개 초과의 폴리펩티드 쇄를 함유하는 단백질을 생산하는 데 사용될 것이다. 이들 및 다른 공통 벡터 요소의 선택은 통상적이며, 많은 이러한 서열이 이용가능하다 [예를 들어, 문헌 [Sambrook et al.] 및 그에 인용된 참고문헌, 예를 들어 페이지 3.18 3.26 및 16.17 16.27 및 문헌 [Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1989] 참조]. 일부 실시양태에서, 구제역 바이러스 2A 서열은 폴리단백질에 포함되고; 이는 폴리단백질의 절단을 매개하는 것으로 밝혀진 작은 펩티드 (대략 18개 아미노산 길이)이다 (Ryan, M D et al., EMBO, 1994; 4: 928-933; Mattion, N M et al., J Virology, November 1996; p. 8124-8127; Furler, S et al., Gene Therapy, 2001; 8: 864-873; 및 Halpin, C et al., The Plant Journal, 1999; 4: 453-459). 2A 서열의 절단 활성은 플라스미드 및 유전자 요법 벡터 (AAV 및 레트로바이러스)를 포함한 인공 시스템에서 이전에 입증되었다 (Ryan, M D et al., EMBO, 1994; 4: 928-933; Mattion, N M et al., J Virology, November 1996; p. 8124-8127; Furler, S et al., Gene Therapy, 2001; 8: 864-873; and Halpin, C et al., The Plant Journal, 1999; 4: 453-459; de Felipe, P et al., Gene Therapy, 1999; 6: 198-208; de Felipe, P et al., Human Gene Therapy, 2000; 11: 1921-1931.; 및 Klump, H et al., Gene Therapy, 2001; 8: 811-817).
구성적 프로모터의 예는, 비제한적으로, 레트로바이러스 라우스 육종 바이러스 (RSV) LTR 프로모터 (임의로 RSV 인핸서를 가짐), 시토메갈로바이러스 (CMV) 프로모터 (임의로 CMV 인핸서를 가짐) [예를 들어, 문헌 [Boshart et al., Cell, 41:521-530 (1985)] 참조], SV40 프로모터, 디히드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제 (PGK) 프로모터, 및 EF1α 프로모터 [인비트로젠(Invitrogen)]를 포함한다. 일부 실시양태에서, 프로모터는 증진된 닭 β-액틴 프로모터이다. 일부 실시양태에서, 프로모터는 U6 프로모터이다.
유도성 프로모터는 유전자 발현의 조절을 가능하게 하고, 외인적으로 공급된 화합물, 환경 요인, 예컨대 온도, 또는 특정 생리학적 상태, 예를 들어 급성기, 세포의 특정한 분화 상태의 존재에 의해, 또는 오직 복제 세포에서만 조절될 수 있다. 유도성 프로모터 및 유도성 시스템은 비제한적으로 인비트로젠, 클론테크(Clontech) 및 아리아드(Ariad)를 포함한 다양한 상업적 공급원으로부터 입수가능하다. 많은 다른 시스템이 기재되어 있고, 관련 기술분야의 통상의 기술자에 의해 용이하게 선택될 수 있다. 외인적으로 공급되는 프로모터에 의해 조절되는 유도성 프로모터의 예는 아연-유도성 양 메탈로티오닌 (MT) 프로모터, 덱사메타손 (Dex)-유도성 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 폴리머라제 프로모터 시스템 (WO 98/10088); 엑디손 곤충 프로모터 (No et al., Proc. Natl. Acad. Sci. USA, 93:3346-3351 (1996)), 테트라시클린-억제성 시스템 (Gossen et al., Proc. Natl. Acad. Sci. USA, 89:5547-5551 (1992)), 테트라시클린-유도성 시스템 (Gossen et al., Science, 268:1766-1769 (1995), 또한 문헌 [Harvey et al., Curr. Opin. Chem. Biol., 2:512-518 (1998)] 참조), RU486-유도성 시스템 (Wang et al., Nat. Biotech., 15:239-243 (1997) 및 Wang et al., Gene Ther., 4:432-441 (1997)) 및 라파마이신-유도성 시스템 (Magari et al., J. Clin. Invest., 100:2865-2872 (1997))을 포함한다. 이와 관련하여 유용할 수 있는 또 다른 유형의 유도성 프로모터는 특정 생리학적 상태, 예를 들어 온도, 급성기, 세포의 특정한 분화 상태에 의해, 또는 오직 복제 세포에서만 조절되는 것이다.
또 다른 실시양태에서, 트랜스진에 대한 천연 프로모터가 사용될 것이다. 천연 프로모터는 트랜스진의 발현이 천연 발현을 모방할 것을 목적으로 하는 경우에 바람직할 수 있다. 천연 프로모터는 트랜스진의 발현이 일시적으로 또는 발생적으로, 또는 조직-특이적 방식으로, 또는 특이적 전사 자극에 반응하여 조절되어야 하는 경우에 사용될 수 있다. 추가 실시양태에서, 다른 천연 발현 제어 요소, 예컨대 인핸서 요소, 폴리아데닐화 부위 또는 코작 컨센서스 서열이 또한 천연 발현을 모방하기 위해 사용될 수 있다.
본 개시내용의 측면은 1개 초과의 프로모터 (예를 들어, 2, 3, 4, 5개, 또는 그 초과의 프로모터)를 포함하는 단리된 핵산에 관한 것이다. 예를 들어, 단백질을 코딩하는 제1 영역 및 억제 RNA (예를 들어, miRNA)를 코딩하는 제2 영역을 포함하는 트랜스진을 갖는 구축물과 관련하여, 제1 프로모터 서열 (예를 들어, 단백질 코딩 영역에 작동가능하게 연결된 제1 프로모터 서열)을 사용하여 단백질 코딩 영역의 발현을 구동하고, 제2 프로모터 서열 (예를 들어, 억제 RNA 코딩 영역에 작동가능하게 연결된 제2 프로모터 서열)을 사용하여 억제 RNA 코딩 영역의 발현을 구동하는 것이 바람직할 수 있다. 일반적으로, 제1 프로모터 서열 및 제2 프로모터 서열은 동일한 프로모터 서열 또는 상이한 프로모터 서열일 수 있다. 일부 실시양태에서, 제1 프로모터 서열 (예를 들어, 단백질 코딩 영역의 발현을 구동하는 프로모터)은 RNA 폴리머라제 III (polIII) 프로모터 서열이다. polIII 프로모터 서열의 비제한적 예는 U6 및 H1 프로모터 서열을 포함한다. 일부 실시양태에서, 제2 프로모터 서열 (예를 들어, 억제 RNA의 발현을 구동하는 프로모터 서열)은 RNA 폴리머라제 II (polII) 프로모터 서열이다. polII 프로모터 서열의 비제한적 예는 7, T3, SP6, RSV 및 시토메갈로바이러스 프로모터 서열을 포함한다. 일부 실시양태에서, polIII 프로모터 서열은 억제 RNA (예를 들어, miRNA) 코딩 영역의 발현을 구동한다. 일부 실시양태에서, polII 프로모터 서열은 단백질 코딩 영역의 발현을 구동한다. 일부 실시양태에서, 제1 프로모터 서열 (예를 들어, 단백질 코딩 영역의 발현을 구동하는 프로모터)은 BMP 반응 요소 (pBRE) 프로모터 서열이고, 제2 프로모터 서열 (예를 들어, 억제 RNA 코딩 영역에 작동가능하게 연결된 제2 프로모터 서열)은 NF-kB 프로모터 서열이다.
본원에 개시된 바와 같이, 표적 유전자 ACVR1의 발현을 감소시키는 인공 마이크로RNA (ami-RNA)는 서열식별번호: 5에 제시된 서열에 의해 코딩된 RH1 ami-RNA, 서열식별번호: 6에 제시된 서열에 의해 코딩된 RH2 ami-RNA, 서열식별번호: 56에 제시된 서열에 의해 코딩된 RH3 ami-RNA, 서열식별번호: 57에 제시된 서열에 의해 코딩된 RH4 ami-RNA, 서열식별번호: 58에 제시된 서열에 의해 코딩된 RH5 ami-RNA, 서열식별번호: 59에 제시된 서열에 의해 코딩된 RH6 ami-RNA, 서열식별번호: 60에 제시된 서열에 의해 코딩된 RH7 ami-RNA, 서열식별번호: 61에 제시된 서열에 의해 코딩된 RH8 ami-RNA, 서열식별번호: 62에 제시된 서열에 의해 코딩된 RH9 ami-RNA, 서열식별번호: 63에 제시된 서열에 의해 코딩된 RH10 ami-RNA, 서열식별번호: 64에 제시된 서열에 의해 코딩된 RH11 ami-RNA, 및 서열식별번호: 65에 제시된 서열에 의해 코딩된 RH12 ami-RNA로부터 선택된다 (도 3). 일부 실시양태에서, 표적 유전자 ACVR1의 발현을 감소시키는 ami-RNA는 서열식별번호: 5에 제시된 서열에 의해 코딩된 RH1 ami-RNA, 서열식별번호: 6에 제시된 서열에 의해 코딩된 RH2 ami-RNA, 서열식별번호: 57에 제시된 서열에 의해 코딩된 RH4 ami-RNA, 서열식별번호: 58에 제시된 서열에 의해 코딩된 RH5 ami-RNA, 서열식별번호: 59에 제시된 서열에 의해 코딩된 RH6 ami-RNA, 및 서열식별번호: 60에 제시된 서열에 의해 코딩된 RH7 ami-RNA이다. 일부 실시양태에서, 표적 유전자 ACVR1의 발현을 감소시키는 ami-RNA는 야생형 ACVR1의 발현에 영향을 미치지 않는다. 일부 실시양태에서, 표적 유전자 ACVR1의 발현을 감소시키는 ami-RNA는 코돈 최적화된 ACVR1의 발현에 영향을 미치지 않는다. 일부 실시양태에서, 돌연변이된 ACVR1을 표적화하는 ami-RNA를 운반하는 rAAV-매개된 유전자 전달은 본원에 개시된 바와 같은 유전자 대체 플랫폼이다.
본 개시내용의 측면은 ACVR1 발현을 감소시키기 위한 인공 마이크로RNA를 코딩하는 트랜스진 및 적어도 1개의 코돈 최적화된 ACVR1 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 코돈 최적화된 ACVR1)을 코딩하는 트랜스진을 포함하는 단리된 핵산을 포함하는 단리된 핵산에 관한 것이다. 일부 실시양태에서, amiR-ACVR1-RH (예를 들어, amiR-33) 및 코돈 최적화된 ACVR1의 공동발현은 ACVR1-R206H mRNA를 야생형 ACVR1 mRNA로 대체한다. 본원에 사용된 ACVR1-R206H mRNA를 야생형 ACVR1 mRNA로 "대체한다"는 것은 돌연변이된 ACVR1 유전자 (예를 들어, ACVR1-R206H)의 발현이 코돈 최적화된 ACVR1의 경쟁적 결합으로 인해 감소 또는 억제된다는 것을 의미한다. 일부 실시양태에서, 돌연변이된 ACVR1 유전자 (예를 들어, ACVR1-R206H)의 적어도 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및 그 안의 모든 범위 및 하위범위가 감소 또는 억제된다. 일부 실시양태에서, 야생형 ACVR1 유전자 (예를 들어, 코돈 최적화된 ACVR1)의 적어도 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및 그 안의 모든 범위 및 하위범위가 돌연변이된 ACVR1 유전자 (예를 들어, ACVR1-R206H)를 대체한다.
일부 측면에서, ACVR1 발현을 감소시키기 위한 인공 마이크로RNA를 코딩하는 트랜스진 및 적어도 1개의 코돈 최적화된 ACVR1을 코딩하는 트랜스진을 포함하는 단리된 핵산을 포함하는 단리된 핵산은 프로모터를 포함한다. 일부 실시양태에서, 벡터 구축물에 사용되는 바와 같은 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 벡터 구축물에 사용되는 바와 같은 프로모터는 임의의 프로모터 적합한 유전자 대체 플랫폼일 수 있다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 매스바이올로직스 신규 (MBL) 인트론을 포함한다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 합성 인트론을 포함한다. 일부 실시양태에서, CBA 인트론은 본원에 개시된 바와 같은 단리된 핵산에서 MBL 인트론 또는 합성 인트론에 의해 치환될 수 있다.
유전자 편집 분자
일부 측면에서, 본 개시내용은 ACVR1 유전자의 표적 핵산 서열에 특이적으로 혼성화하는 단일 가이드 RNA (sgRNA), 제1 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제1 rAAV 입자, 및 제2 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제2 rAAV 입자를 포함하는 재조합 유전자 편집 복합체를 제공한다.
일부 실시양태에서, 제1 재조합 유전자 편집 단백질은 Cas9-기반 아데닌 염기 편집제 (ABE) N-말단 부분 및 그의 단편을 포함한다. 일부 실시양태에서, 제2 재조합 유전자 편집 단백질은 Cas9-기반 아데닌 염기 편집제 (ABE) C-말단 부분 및 그의 단편을 포함한다.
일부 실시양태에서, 재조합 유전자 편집 복합체는 프로토스페이서 인접 모티프를 추가로 포함한다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 프로토스페이서 인접 모티프 (PAM)는 CRISPR 박테리아 적응 면역계에서 Cas9 뉴클레아제에 의해 표적화되는 DNA 서열 바로 다음의 2-6-염기 쌍 DNA 서열이다. PAM은 침입 바이러스 또는 플라스미드의 성분이지만, 박테리아 숙주 게놈에서는 발견되지 않고, 따라서 박테리아 CRISPR 유전자좌의 성분이 아니다.
본원에 사용된 "유전자 편집 복합체"는, 예를 들어 표적 DNA에서 1개 이상의 이중 가닥 파괴 (DSB)를 유발함으로써 게놈 서열 (예를 들어, 유전자 서열)을 부가, 파괴 또는 변화시키도록 구성된 생물학적 활성 분자 (예를 들어, 단백질, 1개 이상의 단백질, 핵산, 1개 이상의 핵산, 또는 상기의 임의의 조합)를 지칭한다. 유전자 편집 복합체의 예는 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN), 아연 핑거 뉴클레아제 (ZFN), 조작된 메가뉴클레아제 재조작된 귀소 엔도뉴클레아제, CRISPR/Cas 시스템, 및 메가뉴클레아제 (예를 들어, 메가뉴클레아제 I-SceI)를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 유전자 편집 복합체는 Cas9, Cas6, Cpf1, CRISPR RNA (crRNA), 트랜스-활성화 crRNA (tracrRNA), 및 그의 변이체를 포함하나 이에 제한되지는 않는, CRISPR/Cas 시스템과 관련된 단백질 또는 분자 (예를 들어, 재조합 유전자 편집 단백질)를 포함한다.
일부 실시양태에서, 재조합 유전자 편집 단백질은 뉴클레아제이다. 본원에 사용된 용어 "엔도뉴클레아제" 및 "뉴클레아제"는 폴리뉴클레오티드 쇄 내의 포스포디에스테르 결합 또는 결합들을 절단하는 효소를 지칭한다. 뉴클레아제는 자연 발생이거나 또는 유전자 조작될 수 있다. 유전자 조작된 뉴클레아제는 게놈 편집에 특히 유용하고, 일반적으로 4가지 패밀리: 아연 핑거 뉴클레아제 (ZFN), 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN), 메가뉴클레아제 (예를 들어, 조작된 메가뉴클레아제) 및 CRISPR-연관 단백질 (Cas 뉴클레아제)로 분류된다. 일부 실시양태에서, 뉴클레아제는 ZFN이다. 일부 실시양태에서, ZFN은 FokI 절단 도메인을 포함한다. 일부 실시양태에서, ZFN은 Cys2His2 폴드 기를 포함한다. 일부 실시양태에서, 뉴클레아제는 TALEN이다. 일부 실시양태에서, TALEN은 FokI 절단 도메인을 포함한다. 일부 실시양태에서, 뉴클레아제는 메가뉴클레아제이다. 메가뉴클레아제의 예는 I-SceI, I-CreI, I-DmoI, 및 그의 조합 (예를 들어, E-DreI, DmoCre)을 포함하나 이에 제한되지는 않는다.
용어 "CRISPR"은 염기 서열의 짧은 반복을 함유하는 DNA 유전자좌인 "클러스터링된 규칙적 간격의 짧은 회문식 반복부"를 지칭한다. CRISPR 유전자좌는 외래 유전 물질에 대한 저항성을 부여하는 원핵 적응 면역계의 부분을 형성한다. 각각의 CRISPR 유전자좌에는 바이러스 게놈 물질로부터 유래된 "스페이서 DNA"의 짧은 절편이 플랭킹된다. 유형 II CRISPR 시스템에서, 스페이서 DNA는 전사활성화 RNA (tracrRNA)에 혼성화하고, CRISPR-RNA (crRNA)로 프로세싱되고, 후속적으로 CRISPR-연관 뉴클레아제 (Cas 뉴클레아제)와 회합하여 외래 DNA를 인식하고 분해하는 복합체를 형성한다. 특정 실시양태에서, 뉴클레아제는 CRISPR-연관 뉴클레아제 (Cas 뉴클레아제)이다. CRISPR 뉴클레아제의 예는 Cas9, dCas9, Cas6, Cpf1 및 그의 변이체를 포함하나, 이에 제한되지는 않는다. 일부 실시양태에서, 뉴클레아제는 Cas9이다. 일부 실시양태에서, Cas9는 박테리아 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) (예를 들어, SpCas9) 또는 스타필로코쿠스 아우레우스(Staphylococcus aureus) (예를 들어, SaCas9)로부터 유래된다. 일부 실시양태에서, Cas 단백질 또는 그의 변이체는, 예를 들어 문헌 [Ran et al., (2015) Nature. 520(7546); 186-91]에 기재된 바와 같이, 바이러스 벡터, 예컨대 렌티바이러스 벡터 또는 아데노-연관 바이러스 (AAV) 벡터의 패키징 능력을 초과하지 않는다. 예를 들어, 일부 실시양태에서, Cas 단백질을 코딩하는 핵산은 약 4.6 kb 미만의 길이이다.
게놈 편집의 목적을 위해, CRISPR 시스템은 tracrRNA 및 crRNA를 단일 가이드 RNA (sgRNA) 또는 단지 (gRNA)로 조합하도록 변형될 수 있다. 본원에 사용된 용어 "가이드 RNA", "gRNA" 및 "sgRNA"는 세포 내 표적 서열에 상보적이고 Cas 뉴클레아제와 회합하여 Cas 뉴클레아제를 표적 서열로 지시하는 폴리뉴클레오티드 서열을 지칭한다. 일부 실시양태에서, gRNA (예를 들어, sgRNA)는 1 내지 30개 뉴클레오티드 범위의 길이이다. 일부 실시양태에서, gRNA (예를 들어, sgRNA)는 5 내지 25개 뉴클레오티드 범위의 길이이다. 일부 실시양태에서, gRNA (예를 들어, sgRNA)는 10 내지 22개 뉴클레오티드 범위의 길이이다. 일부 실시양태에서, gRNA (예를 들어, sgRNA)는 14 내지 24개 뉴클레오티드 범위의 길이이다. 일부 실시양태에서, Cas 단백질 및 가이드 RNA (예를 들어, sgRNA)는 동일한 벡터로부터 발현된다. 일부 실시양태에서, Cas 단백질 및 가이드 RNA (예를 들어, sgRNA)는 별개의 벡터 (예를 들어, 2개 이상의 벡터)로부터 발현된다. 전형적으로, 가이드 RNA (예를 들어, gRNA 또는 sgRNA)는 표적 서열에 혼성화하고 (예를 들어 왓슨-크릭 염기 쌍형성에 의해, 예를 들어 특이적으로 결합함), 따라서 CRISPR/Cas 단백질 또는 단순 단백질을 표적 서열로 지시한다. 일부 실시양태에서, 가이드 RNA는 핵산 서열에 혼성화한다 (예를 들어, 표적화한다).
본원에 개시된 바와 같이, 재조합 유전자 편집 복합체는 Cas9-기반 아데닌 염기 편집제 (ABE)를 포함한다. rAAV에 상용성인 Cas9-기반 아데닌 염기 편집제 (ABE)는 이중-가닥 DNA 파괴를 생성하지 않으면서 표적 염기 쌍을 상이한 염기 쌍으로 직접 전환시키기 위해 개발되었다. 따라서, rAAV9-상용성 ABE 구축물을 사용하여 ACVR1-R206H 대립유전자에서 "A"를 "G"로 전환시켰다. ABE는 염기 편집제의 이중-AAV 패키징을 가능하게 하는 트랜스-스플라이싱 인테인 서열을 사용하여 AAV 패키징 크기 한계 (~ 4.7kb)보다 작은 절반으로 나뉜다. 이론에 얽매이는 것을 원하지는 않지만, AAV를 통한 전달은 AAV 패키징 능력에 의해 제한되며, 이는 전장 염기 편집제의 사용을 불가능하게 한다. 이어서 트랜스-스플라이싱 인테인에 의해 재구성되는 분할 시토신 및 아데닌 염기 편집제의 전달을 위한 이중 AAV의 적용. 일부 실시양태에서, 본원에 개시된 바와 같은 ABE는 N-말단 ABE 구축물 및 C-말단 ABE 구축물로 나뉜다. 일부 실시양태에서, ABE는 트랜스-스플라이싱 인테인 서열을 사용하는 것에 의해 나뉜다. 일부 실시양태에서, N-말단 ABE 구축물은 ACVR1-R206H 돌연변이를 갖는 프로토스페이서를 포함한다. 일부 실시양태에서, C-말단 ABE 구축물은 AAV6.2 또는 AAV9 캡시드 단백질 내로 통합된다. 일부 실시양태에서, ABE는 ACVR1-R206H 대립유전자에서 아데닌을 구아닌으로 전환시킨다.
본 개시내용은 NF-kB 프로모터 (pNF-kB)를 포함하는 제1 트랜스진 및 골 형태발생 단백질 프로모터 (pBRE)를 포함하는 제2 트랜스진을 포함하는 단리된 핵산을 제공한다. 일부 실시양태에서, pNF-kB는 가용성 폴리스타틴 (sFST)의 발현을 유도한다. 일부 실시양태에서, pBRE는 TNFR2의 발현을 유도한다. 일부 실시양태에서, 액티빈 A는 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, BMP 리간드는 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, 염증은 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, 단리된 핵산은 인간 가용성 IL1Rα (sIL1Rα) (서열식별번호: 35)의 발현을 유도한다. 류마티스 관절염을 치료하는 인터류킨 1 수용체 길항제 단백질인 아나킨라 (키네레트)는 FOP의 진행을 효과적으로 늦추는 것으로 제시되었다. 본원에 개시된 바와 같은 단리된 핵산은 예를 들어 액티빈 A 길항제, TNF 길항제 및 IL-1 길항제의 발현을 제공한다. 일부 실시양태에서, 단리된 핵산은 AAV 벡터 내로 통합된다.
일부 실시양태에서, pNF-kB는 PB2 프로모터 (서열식별번호: 30)이다. 일부 실시양태에서, pBRE는 서열식별번호: 31의 서열을 포함한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 32의 서열을 가진다.
염증 및 액티빈 A는 이소성 골화 (HO)에 수반되는 것으로 제시되었다. 액티빈 A, BMP 리간드, 및 염증성 시토카인의 수준이 플레어-업 영역에서 상승됨에 따라, 본 출원인은 rAAV9 벡터가 플레어-업에 반응하여 천연 액티빈 A 길항제, 가용성 폴리스타틴 (sFST), 및 천연 TNF 길항제, 가용성 TNFR2 (sTNFR2)를 분비할 수 있다는 것을 발견하였다. 일부 실시양태에서, sFST 및 TNFR2의 발현은 플레어-업 상태에서 액티빈 A 신호전달 경로를 억제한다. 일부 실시양태에서, sFST 및 TNFR2의 발현은 플레어-업 상태에서 TNF 신호전달 경로를 억제한다.
rAAV9의 국부 또는 전신 주사는 골격근의 형질도입에 고도로 효과적이며, 이는 플레어-업 영역에서 sFST 및 sTNFR2를 생산하여 이웃 HO의 발생을 억제한다. 일부 실시양태에서, 단리된 핵산은 가우시아 루시페라제 리포터 유전자 (eBRE/NF-kB-Luc)를 추가로 포함한다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 가우시아 루시페라제는 해양 요각류, 가우시아 프린셉스(Gaussia princeps)로부터의 20kDa 단백질이다. 생물발광 효소는 세포 배양 배지 내로 고도로 분비되어, 리포터 활성의 살아있는 세포 모니터링을 가능하게 한다. 루시페라제 반응에 의해 생성된 광 출력은 생산된 가우시아 루시페라제 단백질의 양과 상관관계가 있고, 가우시아 발현을 구동하는 프로모터의 활성을 결정하는 데 사용될 수 있다.
본 개시내용은 가용성 폴리스타틴 (sFST)을 코딩하는 핵산 서열을 포함하는 제1 트랜스진 및 TNFR2를 코딩하는 핵산 서열을 포함하는 제2 트랜스진을 포함하는 단리된 핵산을 제공한다. 일부 실시양태에서, 제1 및 제2 트랜스진은 프로모터, 예컨대 닭 β-액틴 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 pBRE/pNF-kB 프로모터이다. 일부 실시양태에서, 단리된 핵산은 인공 miRNA (ami-RNA)를 코딩하는 트랜스진을 포함한다. 일부 실시양태에서, ami-RNA는 miR-122를 포함한다. 일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산은 천연 액티빈 A 길항제, 가용성 인간 폴리스타틴 (예를 들어, FST-288) 및 천연 TNF 길항제, 가용성 인간 TNFR2를 제공하며, 이는 AAV 벡터 게놈 내로 클로닝된다. 일부 실시양태에서, AAV 벡터는 rAAV9 벡터이다.
어떠한 이론에 얽매이는 것을 원하지는 않지만, 폴리스타틴 및 sTNFR2는 액티빈 A 및 TNFα에 그의 동족 수용체에 대해 경쟁적으로 결합하고, 따라서 각각 액티빈 A 및 TNFα-유도된 신호 전달을 억제한다. 그러나, 전신 전달 후, rAAV9 벡터는 추가의 조직, 예컨대 간, 심장 및 골격근을 표적화할 수 있으며, 이는 유해 효과를 유발할 수 있다. 따라서, 본 개시내용은 AAV 벡터 게놈 내로 완벽하게 상보적인 miR-122-결합 부위를 조작함으로써 간에서 rAAV 발현을 억제하는 조직-특이적 내인성 miRNA (예를 들어, miR-122)를 제공한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 33의 서열을 포함한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 34의 서열을 포함한다. 일부 실시양태에서, rAAV 벡터는 심장 조직 (예를 들어, 심근)으로부터의 트랜스진의 발현을 탈표적화하는 1개 이상의 miRNA 결합 부위를 포함한다. 일부 실시양태에서, miRNA 결합 부위는 miR-208 결합 부위이다. 일부 실시양태에서, rAAV는 1개 이상 (예컨대, 1, 2, 3, 4개, 또는 그 초과)의 miR-208 결합 부위를 포함한다. 일부 실시양태에서, 1개 이상의 miR-208 결합 부위는 서열식별번호: 48에 제시된 서열을 포함한다.
재조합 AAV (rAAV)
본 개시내용의 단리된 핵산은 재조합 아데노-연관 바이러스 (AAV) 벡터 (rAAV 벡터)일 수 있다. 일부 실시양태에서, 본 개시내용에 기재된 바와 같은 단리된 핵산은 제1 아데노-연관 바이러스 (AAV) 역전된 말단 반복부 (ITR) 또는 그의 변이체를 포함하는 영역 (예를 들어, 제1 영역)을 포함한다. 단리된 핵산 (예를 들어, 재조합 AAV 벡터)은 캡시드 단백질 내로 패키징되고, 대상체에게 투여되고/거나 선택된 표적 세포에 전달될 수 있다. "재조합 AAV (rAAV) 벡터"는 전형적으로 최소한 트랜스진 및 그의 조절 서열, 및 5' 및 3' AAV 역전된 말단 반복부 (ITR)로 구성된다. 트랜스진은, 본원의 다른 곳에 개시된 바와 같이, 대상체의 내인성 mRNA를 표적화하는 핵산을 포함하는 1종 이상의 단백질 및/또는 억제 핵산 (예를 들어, shRNA, miRNA 등)을 코딩하는 1개 이상의 영역을 포함할 수 있다. 트랜스진은 또한 본 개시내용의 다른 곳에 기재된 바와 같이, 예를 들어 단백질 및/또는 발현 제어 서열 (예를 들어, 폴리-A 테일)을 코딩하는 영역을 포함할 수 있다.
일반적으로, ITR 서열은 길이가 약 145 bp이다. 바람직하게는, ITR을 코딩하는 실질적으로 전체 서열이 분자에 사용되지만, 이들 서열의 어느 정도의 사소한 변형이 허용된다. 이들 ITR 서열을 변형시키는 능력은 관련 기술분야의 기술 내에 있다. (예를 들어, 문헌 [Sambrook et al., "Molecular Cloning. A Laboratory Manual", 2d ed., Cold Spring Harbor Laboratory, New York (1989); 및 K. Fisher et al., J Virol., 70:520 532 (1996)]과 같은 참고문헌 참조). 본 발명에 사용된 이러한 분자의 예는 트랜스진을 함유하는 "시스-작용" 플라스미드이며, 여기서 선택된 트랜스진 서열 및 연관된 조절 요소에 5' 및 3' AAV ITR 서열이 플랭킹된다. AAV ITR 서열은 현재 확인된 포유동물 AAV 유형을 비롯한 임의의 공지된 AAV로부터 수득될 수 있다. 일부 실시양태에서, 단리된 핵산 (예를 들어, rAAV 벡터)은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh.8, AAVrh.10, AAVrh.39 및 AAVrh.43, 및 그의 변이체로부터 선택된 혈청형을 갖는 적어도 1개의 ITR을 포함한다. 일부 실시양태에서, 단리된 핵산은 AAV9 ITR을 코딩하는 영역 (예를 들어, 제1 영역)을 포함한다. 일부 실시양태에서, 단리된 핵산은 AAV6.2 ITR을 코딩하는 영역 (예를 들어, 제1 영역)을 포함한다.
일부 실시양태에서, 단리된 핵산은 제2 AAV ITR을 포함하는 영역 (예를 들어, 제2 영역, 제3 영역, 제4 영역 등)을 추가로 포함한다. 일부 실시양태에서, 제2 AAV ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh.8, AAVrh.10, AAVrh.39 및 AAVrh.43, 및 그의 변이체로부터 선택된 혈청형을 갖는다. 일부 실시양태에서, 제2 ITR은 기능적 말단 분해 부위 (TRS)가 결여된 돌연변이체 ITR이다. 용어 "말단 분해 부위가 결여된"은 ITR의 말단 분해 부위 (TRS)의 기능을 제거하는 돌연변이 (예를 들어, 센스 돌연변이, 예컨대 비-동의 돌연변이, 또는 미스센스 돌연변이)를 포함하는 AAV ITR, 또는 기능적 TRS를 코딩하는 핵산 서열이 결여된 말단절단된 AAV ITR (예를 들어, ΔTRS ITR)을 지칭할 수 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 기능적 TRS가 결여된 ITR을 포함하는 rAAV 벡터는, 예를 들어 문헌 [McCarthy (2008) Molecular Therapy 16(10):1648-1656]에 기재된 바와 같이 자기-상보적 rAAV 벡터를 생산한다.
본원에 사용된 용어 "자기-상보적 AAV 벡터" (scAAV)는 AAV의 ITR 중 1개로부터 말단 분해 부위 (TR)의 부재에 의해 생성된 이중-가닥 벡터 게놈을 함유하는 벡터를 지칭한다. TR의 부재는 TR이 존재하지 않는 벡터 말단에서 복제의 개시를 방지한다. 일반적으로, scAAV 벡터는 각각의 말단에 야생형 (wt) AAV TR 및 중간에 돌연변이된 TR (mTR)을 갖는 단일-가닥, 역전된 반복부 게놈을 생성한다. 본 발명은, 부분적으로, RNA 헤어핀 구조 (예를 들어, shRNA, miRNA, 및 ami-RNA)를 코딩하는 DNA 단편이 바이러스 게놈 복제 동안 돌연변이체 역전된 말단 반복부 (mTR)와 유사한 기능을 수행하여 자기-상보적 AAV 벡터 게놈을 생성할 수 있다는 인식에 기초한다. 예를 들어, 일부 실시양태에서, 본 개시내용은 2개의 말단의 각각에 역전된 말단 반복부 (ITR)를 갖는 단일-가닥 자기-상보적 핵산 및 헤어핀-형성 RNA (예를 들어, shRNA, miRNA, ami-RNA 등)를 코딩하는 서열과 작동가능하게 연결된 프로모터를 포함하는 중심 부분을 포함하는 rAAV (예를 들어, 자기-상보적 AAV; scAAV) 벡터를 제공한다. 일부 실시양태에서, 헤어핀-형성 RNA (예를 들어, shRNA, miRNA, ami-RNA 등)를 코딩하는 서열은 돌연변이체 ITR에 의해 정상적으로 점유된 자기-상보적 핵산의 위치에서 치환된다.
"재조합 AAV (rAAV) 벡터"는 전형적으로 최소한 트랜스진 및 그의 조절 서열, 및 5' 및 3' AAV 역전된 말단 반복부 (ITR)로 구성된다. 캡시드 단백질 내로 패키징되고 선택된 표적 세포로 전달되는 것은 이러한 재조합 AAV 벡터이다. 일부 실시양태에서, 트랜스진은 관심 폴리펩티드, 단백질, 기능적 RNA 분자 (예를 들어, miRNA, miRNA 억제제) 또는 다른 유전자 생성물을 코딩하는, 벡터 서열에 대해 이종인 핵산 서열이다. 핵산 코딩 서열은 표적 조직의 세포에서 트랜스진 전사, 번역, 및/또는 발현을 허용하는 방식으로 조절 성분에 작동가능하게 연결된다.
본 개시내용은 단일 시스-작용 야생형 ITR을 포함하는 벡터를 제공한다. 일부 실시양태에서, ITR은 5' ITR이다. 일부 실시양태에서, ITR은 3' ITR이다. 일반적으로, ITR 서열은 길이가 약 145 bp이다. 바람직하게는, ITR(들)을 코딩하는 실질적으로 전체 서열이 분자에 사용되지만, 이들 서열의 어느 정도의 사소한 변형이 허용된다. ITR 서열을 변형시키는 능력은 관련 기술분야의 기술 내에 있다. (예를 들어, 문헌 [Sambrook et al., "Molecular Cloning. A Laboratory Manual", 2d ed., Cold Spring Harbor Laboratory, New York (1989); 및 K. Fisher et al., J Virol., 70:520 532 (1996)]과 같은 참고문헌 참조). 예를 들어, ITR은 그의 말단 분해 부위 (TR)에서 돌연변이될 수 있으며, 이는 TR이 돌연변이된 벡터 말단에서 복제를 억제하고 자기-상보적 AAV의 형성을 발생시킨다. 본 개시내용에 사용된 이러한 분자의 또 다른 예는 트랜스진을 함유하는 "시스-작용" 플라스미드이며, 여기서 선택된 트랜스진 서열 및 연관된 조절 요소에 5' AAV ITR 서열 및 3' 헤어핀-형성 RNA 서열이 플랭킹된다. AAV ITR 서열은 현재 확인된 포유동물 AAV 유형을 비롯한 임의의 공지된 AAV로부터 수득될 수 있다. 일부 실시양태에서, ITR 서열은 AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVrh8, AAV9, AAV10, 및/또는 AAVrh10 ITR 서열이다.
일부 실시양태에서, 본 개시내용의 rAAV는 유사형화 rAAV이다. 예를 들어, Y의 단백질로 캡시드화된 혈청형 X의 ITR을 함유하는 유사형화 AAV 벡터는 AAVX/Y로 지정될 것이다 (예를 들어 AAV2/1은 AAV2의 ITR 및 AAV1의 캡시드를 가짐). 일부 실시양태에서, 유사형화 rAAV는 하나의 AAV 혈청형으로부터의 캡시드 단백질의 조직-특이적 표적화 능력을 또 다른 AAV 혈청형으로부터의 바이러스 DNA와 조합함으로써 트랜스진의 표적 조직으로의 표적화된 전달을 가능하게 하는 데 유용할 수 있다.
목적하는 캡시드 단백질을 갖는 재조합 AAV를 수득하는 방법은 관련 기술분야에 널리 공지되어 있다. (예를 들어, US 2003/0138772 참조, 그의 내용은 그 전문이 본원에 참조로 포함됨). 전형적으로, 방법은 AAV 캡시드 단백질; 기능적 rep 유전자; AAV 역전된 말단 반복부 (ITR) 및 트랜스진으로 구성된 재조합 AAV 벡터; 및 AAV 캡시드 단백질 내로의 재조합 AAV 벡터의 패키징을 허용하는 충분한 헬퍼 기능을 코딩하는 핵산 서열을 함유하는 숙주 세포를 배양하는 것을 수반한다. 일부 실시양태에서, 캡시드 단백질은 AAV의 cap 유전자에 의해 코딩된 구조 단백질이다. AAV는 3개의 캡시드 단백질, 비리온 단백질 1 내지 3 (VP1, VP2 및 VP3으로 명명됨)을 포함하며, 이들 모두는 대안적 스플라이싱을 통해 단일 cap 유전자로부터 전사된다. 일부 실시양태에서, VP1, VP2 및 VP3의 분자량은 각각 약 87 kDa, 약 72 kDa 및 약 62 kDa이다. 일부 실시양태에서, 번역 시, 캡시드 단백질은 바이러스 게놈 주위에 구형 60량체 단백질 쉘을 형성한다. 일부 실시양태에서, 캡시드 단백질의 기능은 바이러스 게놈을 보호하고, 게놈을 전달하고, 숙주와 상호작용하는 것이다. 일부 측면에서, 캡시드 단백질은 바이러스 게놈을 숙주에게 조직 특이적 방식으로 전달한다.
일부 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh8, AAV9, AAVrh10, AAVrh39, AAVrh43, AAV2/2-66, AAV2/2-84, AAV2/2-125로 이루어진 군으로부터 선택된 AAV 혈청형의 것이다. 일부 실시양태에서, AAV 캡시드 단백질은 비-인간 영장류로부터 유래된 혈청형, 예를 들어 scAAV.rh8, AAV.rh39, 또는 AAV.rh43 혈청형의 것이다. 일부 실시양태에서, AAV 캡시드 단백질은 AAV9 혈청형의 것이다. 일부 실시양태에서, AAV 캡시드 단백질은 AAV6.2 혈청형의 것이다.
AAV 캡시드에 rAAV 벡터를 패키징하기 위해 숙주 세포에서 배양될 성분은 숙주 세포에게 트랜스로 제공될 수 있다. 대안적으로, 요구되는 성분 (예를 들어, 재조합 AAV 벡터, rep 서열, cap 서열, 및/또는 헬퍼 기능) 중 어느 1종 이상은 관련 기술분야의 통상의 기술자에게 공지된 방법을 사용하여 요구되는 성분 중 1종 이상을 함유하도록 조작된 안정한 숙주 세포에 의해 제공될 수 있다. 가장 적합하게는, 이러한 안정한 숙주 세포는 유도성 프로모터의 제어 하에 요구되는 성분(들)을 함유할 것이다. 그러나, 요구되는 성분(들)은 구성적 프로모터의 제어 하에 있을 수 있다. 적합한 유도성 및 구성적 프로모터의 예는 본원에서, 트랜스진과 함께 사용하기에 적합한 조절 요소의 논의에서 제공된다. 또 다른 대안에서, 선택된 안정한 숙주 세포는 구성적 프로모터의 제어 하에 선택된 성분(들) 및 1개 이상의 유도성 프로모터의 제어 하에 다른 선택된 성분(들)을 함유할 수 있다. 예를 들어, HEK293 세포 (구성적 프로모터의 제어 하에 E1 헬퍼 기능을 함유함)로부터 유래되지만, 유도성 프로모터의 제어 하에 rep 및/또는 cap 단백질을 함유하는 안정한 숙주 세포가 생성될 수 있다. 또 다른 안정한 숙주 세포가 관련 기술분야의 통상의 기술자에 의해 생성될 수 있다.
본 개시내용의 rAAV를 생산하는 데 필요한 재조합 AAV 벡터, rep 서열, cap 서열 및 헬퍼 기능은 임의의 적절한 유전 요소 (벡터)를 사용하여 패키징 숙주 세포에 전달될 수 있다. 선택된 유전 요소는 본원에 기재된 것을 비롯한 임의의 적합한 방법에 의해 전달될 수 있다. 본 개시내용의 임의의 실시양태를 구축하는 데 사용되는 방법은 핵산 조작의 통상의 기술자에게 공지되어 있고, 유전자 공학, 재조합 공학, 및 합성 기술을 포함한다. 예를 들어, 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, N.Y.]을 참조한다. 유사하게, rAAV 비리온을 생성하는 방법은 널리 공지되어 있고, 적합한 방법의 선택은 본 개시내용에 대한 제한이 아니다. 예를 들어, 문헌 [K. Fisher et al., J. Virol., 70:520-532 (1993)] 및 미국 특허 번호 5,478,745를 참조한다.
일부 실시양태에서, 삼중 형질감염 방법 (미국 특허 번호 6,001,650에 상세하게 기재됨)을 사용하여 재조합 AAV가 생산될 수 있다. 전형적으로, 재조합 AAV는 숙주 세포를 AAV 입자 내로 패키징될 재조합 AAV 벡터 (트랜스진을 포함함), AAV 헬퍼 기능 벡터, 및 보조 기능 벡터로 형질감염시킴으로써 생산된다. AAV 헬퍼 기능 벡터는 "AAV 헬퍼 기능" 서열 (즉, rep 및 cap)을 코딩하며, 이는 생산적 AAV 복제 및 캡시드화를 위해 트랜스로 기능한다. 바람직하게는, AAV 헬퍼 기능 벡터는 임의의 검출가능한 야생형 AAV 비리온 (즉, 기능적 rep 및 cap 유전자를 함유하는 AAV 비리온)을 생성하지 않으면서 효율적인 AAV 벡터 생산을 지지한다. 본 개시내용에서 사용하기에 적합한 벡터의 비제한적 예는 미국 특허 번호 6,001,650에 기재된 pHLP19 및 미국 특허 번호 6,156,303에 기재된 pRep6cap6 벡터를 포함하며, 둘 다의 전문은 본원에 참조로 포함된다. 보조 기능 벡터는 AAV가 복제를 위해 의존하는 비-AAV 유래 바이러스 및/또는 세포 기능 (즉, "보조 기능")을 위한 뉴클레오티드 서열을 코딩한다. 보조 기능은 비제한적으로 AAV 유전자 전사의 활성화, 단계 특이적 AAV mRNA 스플라이싱, AAV DNA 복제, cap 발현 생성물의 합성, 및 AAV 캡시드 어셈블리에 수반되는 모이어티를 포함한, AAV 복제에 요구되는 기능을 포함한다. 바이러스-기반 보조 기능은 공지된 헬퍼 바이러스 중 임의의 것, 예컨대 아데노바이러스, 헤르페스바이러스 (단순 헤르페스 바이러스 유형-1 이외의 것), 및 백시니아 바이러스로부터 유래될 수 있다.
일부 측면에서, 본 개시내용은 형질감염된 숙주 세포를 제공한다. 용어 "형질감염"은 세포에 의한 외래 DNA의 흡수를 지칭하는 데 사용되고, 세포는 외인성 DNA가 세포 막 내부에 도입된 경우에 "형질감염"된 것이다. 다수의 형질감염 기술이 일반적으로 관련 기술분야에 공지되어 있다. 예를 들어, 문헌 [Graham et al., (1973) Virology, 52:456, Sambrook et al., (1989) Molecular Cloning, a laboratory manual, Cold Spring Harbor Laboratories, New York, Davis et al., (1986) Basic Methods in Molecular Biology, Elsevier, 및 Chu et al., (1981) Gene 13:197]을 참조한다. 이러한 기술을 이용하여 1종 이상의 외인성 핵산, 예컨대 뉴클레오티드 통합 벡터 및 다른 핵산 분자를 적합한 숙주 세포 내로 도입할 수 있다.
"숙주 세포"는 관심 물질을 보유하거나 보유할 수 있는 임의의 세포를 지칭한다. 종종 숙주 세포는 포유동물 세포이다. 일부 실시양태에서, 숙주 세포는 박테리아 세포, 효모 세포, 곤충 세포 (Sf9), 또는 포유동물 (예를 들어, 인간, 설치류, 비-인간 영장류 등) 세포이다. 일부 실시양태에서, 포유동물 세포는 HEK293 세포이다. 숙주 세포는 AAV 헬퍼 구축물, AAV 미니유전자 플라스미드, 보조 기능 벡터, 또는 재조합 AAV의 생산과 연관된 다른 전달 DNA의 수용자로서 사용될 수 있다. 상기 용어는 형질감염된 원래 세포의 자손을 포함한다. 따라서, 본원에 사용된 "숙주 세포"는 외인성 DNA 서열로 형질감염된 세포를 지칭할 수 있다. 단일 모 세포의 자손은 자연적, 우발적, 또는 고의적 돌연변이로 인해 본래의 모 세포와 형태 또는 게놈 또는 총 DNA 상보체에서 반드시 완전히 동일하지는 않을 수 있는 것으로 이해된다.
본원에 사용된 용어 "세포주"는 시험관내에서 연속적 또는 장기간 성장 및 분열이 가능한 세포의 집단을 지칭한다. 종종, 세포주는 단일 전구 세포로부터 유래된 클론 집단이다. 이러한 클론 집단의 저장 또는 전달 동안 핵형에서 자발적 또는 유도된 변화가 발생할 수 있다는 것이 관련 기술분야에 추가로 공지되어 있다. 따라서, 언급된 세포주로부터 유래된 세포는 조상 세포 또는 배양물과 정확하게 동일하지 않을 수 있고, 언급된 세포주는 이러한 변이체를 포함한다.
본원에 사용된 용어 "재조합 세포"는 외인성 DNA 절편, 예컨대 생물학적 활성 폴리펩티드의 전사 또는 생물학적 활성 핵산, 예컨대 RNA의 생산으로 이어지는 DNA 절편이 도입된 세포를 지칭한다.
일부 측면에서, 본 개시내용은 캡시드 단백질, 및 AAV ITR을 코딩하는 제1 영역 및 트랜스진을 포함하는 제2 영역을 포함하는 단리된 핵산을 포함하는 재조합 AAV를 제공하며, 여기서 트랜스진은 인공 마이크로RNA를 코딩한다. 인공 마이크로RNA는 세포 또는 조직 (예를 들어, 골격근, 건, 및 연골) 또는 대상체에서 표적 유전자의 발현을 감소시킬 수 있다. 일부 실시양태에서, rAAV는 세포, 조직 또는 대상체에서 ACVR1의 발현을 감소시키는 인공 마이크로RNA를 포함한다.
세포, 조직 또는 대상체에서 돌연변이된 ACVR1 유전자의 발현은 본 개시내용의 rAAV를 사용하여 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 감소될 수 있다. 세포, 조직 또는 대상체에서 ACVR1 유전자의 발현은 본 개시내용의 rAAV를 사용하여 75% 내지 90%만큼 감소될 수 있다. 세포, 조직 또는 대상체에서 ACVR1 유전자의 발현은 본 개시내용의 rAAV를 사용하여 80% 내지 99%만큼 감소될 수 있다.
본 개시내용의 rAAV를 생산하기 위해 목적하는 AAV 캡시드에 재조합 벡터를 패키징하는 상기 방법은 제한적인 것으로 의도되지 않고, 다른 적합한 방법이 통상의 기술자에게 명백할 것이다.
투여 방식 및 조성물
본 개시내용의 rAAV는 관련 기술분야에 공지된 임의의 적절한 방법에 따라 조성물로 대상체에게 전달될 수 있다. 예를 들어, 바람직하게는 생리학상 상용성인 담체 중에 (예를 들어, 조성물 중에) 현탁된 rAAV는 대상체, 예를 들어 숙주 동물, 예컨대 인간, 마우스, 래트, 고양이, 개, 양, 토끼, 말, 소, 염소, 돼지, 기니 피그, 햄스터, 닭, 칠면조, 또는 비-인간 영장류 (예를 들어, 마카크)에게 투여될 수 있다. 일부 실시양태에서, 숙주 동물은 인간을 포함하지 않는다. 일부 실시양태에서, 대상체는 성체이다. 일부 실시양태에서, 대상체는 소아 또는 영아이다.
일부 실시양태에서, rAAV는 서열식별번호: 1-4 중 어느 하나에 대해 하기 값 사이의 모든 값을 포함하여 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖거나, 또는 100% 동일한 코돈 최적화된 ACVR1을 포함하는 단리된 핵산을 포함한다. 일부 실시양태에서, rAAV는 서열식별번호: 1-4 중 어느 하나에 제시된 서열 (또는 그의 상보적 서열) 또는 그의 부분을 갖는 코돈 최적화된 ACVR1을 포함하는 단리된 핵산을 포함한다.
rAAV의 포유동물 대상체로의 전달은, 예를 들어 근육내 주사에 의해 또는 포유동물 대상체의 혈류 내로의 투여에 의해 이루어질 수 있다. 혈류 내로의 투여는 정맥, 동맥, 또는 임의의 다른 혈관 도관 내로의 주사에 의한 것일 수 있다. 일부 실시양태에서, rAAV는 외과 기술분야에 널리 공지된 기술인 고립 사지 관류에 의해 혈류 내로 투여되며, 상기 방법은 본질적으로 통상의 기술자가 rAAV 비리온의 투여 전에 사지를 체순환으로부터 고립시킬 수 있게 한다. 또한 근육 세포 또는 조직 내로의 형질도입을 잠재적으로 증진시키기 위해 고립 사지의 혈관계 내로 비리온을 투여하는, 미국 특허 번호 6,177,403에 기재된 고립 사지 관류 기술의 변형이 통상의 기술자에 의해 사용될 수 있다. 또한, 특정 경우에, 비리온을 대상체의 골격근 및/또는 결합 조직에 전달하는 것이 바람직할 수 있다. 재조합 AAV는 관련 기술분야에 공지된 외과적 기술을 사용하여, 바늘, 카테터 또는 관련 장치에 의한 근육 또는 조직 내로의 주사, 예를 들어 근육 또는 조직 내로의 직접 주사에 의해, 활막내 주사, 무릎 주사 등을 통해 골격근 및/또는 결합 조직에 직접 전달될 수 있다.
일부 실시양태에서, 본 개시내용에 기재된 바와 같은 rAAV는 진피간 전달 또는 진피내 전달에 의해 투여된다. 전달 절차 및 방법은 관련 기술분야에 공지되고/거나 본 개시내용에 적합한 임의의 기술일 수 있다.
일부 실시양태에서, 본 개시내용에 기재된 바와 같은 rAAV는 미세바늘 약물 전달, 예컨대 경피 적용에 의해 투여된다. 일부 실시양태에서, 본 개시내용에 기재된 바와 같은 rAAV는 제어 전달을 제공하기 위한 진피 패치의 사용에 의해 투여된다. 본원에 사용된 바와 같은 진피 패치, 피부 패치 등은 특정 용량의 조성물을 피부 내로 전달하기 위해 피부 상에 위치시키는 약물첨가된 접착성 패치를 지칭한다. 진피 또는 피부 패치는 단층 약물-함유-접착제, 다층 약물-함유-접착제, 저장소, 매트릭스 및 증기 패치를 포함할 수 있으나 이에 제한되지는 않는다. 대안적으로 또는 추가적으로, 속도는 속도 제어 막을 제공하고/거나 활성 성분을 중합체 매트릭스 및/또는 겔 중에 분산시키는 것에 의해 제어될 수 있다. 일부 실시양태에서, 침투 증진제는 패치에서 rAAV의 침투를 증진시키는 데 사용될 수 있다. 일부 실시양태에서, 본 개시내용에 기재된 바와 같은 rAAV는 정맥내 주사에 의해 투여된다. 일부 실시양태에서, rAAV는 근육내 주사에 의해 투여된다.
본 개시내용의 측면은 캡시드 단백질 및 트랜스진을 코딩하는 핵산을 포함하는 재조합 AAV를 포함하는 조성물에 관한 것이며, 여기서 트랜스진은 예를 들어 1개 이상의 코돈 최적화된 ACVR1 또는 인공 miRNA를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 핵산은 1개 이상의 AAV ITR을 추가로 포함한다. 일부 실시양태에서, 조성물은 제약상 허용되는 담체를 추가로 포함한다. 일부 실시양태에서, 조성물은 캡시드 단백질, 및 AAV ITR을 코딩하는 제1 영역 및 트랜스진을 포함하는 제2 영역을 포함하는 핵산을 포함하는 재조합 AAV를 포함하며, 여기서 트랜스진은 ACVR1을 표적화하는 인공 마이크로RNA를 코딩한다.
본 개시내용의 조성물은 rAAV를 단독으로, 또는 1종 이상의 다른 바이러스 (예를 들어, 1종 이상의 상이한 트랜스진을 코딩하는 제2 rAAV)와 조합하여 포함할 수 있다. 일부 실시양태에서, 조성물은 각각 1종 이상의 상이한 트랜스진을 갖는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10종, 또는 그 초과의 상이한 rAAV를 포함한다.
적합한 담체는 rAAV가 지시되는 적응증의 관점에서 관련 기술분야의 통상의 기술자에 의해 용이하게 선택될 수 있다. 예를 들어, 1종의 적합한 담체는 다양한 완충 용액과 함께 제제화될 수 있는 염수 (예를 들어, 포스페이트 완충 염수)를 포함한다. 다른 예시적인 담체는 멸균 염수, 락토스, 수크로스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩 오일, 참깨 오일, 및 물을 포함한다. 담체의 선택은 본 개시내용의 제한이 아니다.
임의로, 본 개시내용의 조성물은 rAAV 및 담체(들)에 더하여, 다른 통상적인 제약 성분, 예컨대 보존제, 또는 화학적 안정화제를 함유할 수 있다. 적합한 예시적인 보존제는 클로로부탄올, 소르브산칼륨, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 및 파라클로로페놀을 포함한다. 적합한 화학적 안정화제는 젤라틴 및 알부민을 포함한다.
rAAV는 목적하는 조직의 세포를 형질감염시키고 과도한 유해 효과 없이 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 투여된다. 통상적이고 제약상 허용되는 투여 경로는 선택된 기관으로의 직접 전달 (예를 들어, 간으로의 문맥내 전달), 경구, 흡입 (비강내 및 기관내 전달 포함), 안내, 정맥내, 근육내, 피하, 진피내, 종양내, 및 다른 비경구 투여 경로를 포함하나, 이에 제한되지는 않는다. 투여 경로는 원하는 경우에 조합될 수 있다.
특정한 "치료 효과"를 달성하는 데 요구되는 rAAV 비리온의 용량, 예를 들어 게놈 카피/체중 킬로그램 (GC/kg)의 용량의 단위는 rAAV 비리온의 투여 경로, 치료 효과를 달성하는 데 요구되는 유전자 또는 RNA 발현의 수준, 치료될 구체적 질환 또는 장애, 및 유전자 또는 RNA 생성물의 안정성을 포함하나 이에 제한되지는 않는 여러 인자에 기초하여 달라질 것이다. 관련 기술분야의 통상의 기술자는 상기 언급된 인자, 뿐만 아니라 관련 기술분야에 널리 공지된 다른 인자에 기초하여 특정한 질환 또는 장애를 갖는 환자를 치료하기 위한 rAAV 비리온 용량 범위를 용이하게 결정할 수 있다.
rAAV의 "유효량"은 동물을 표적 감염시키고, 목적하는 조직 (예를 들어, 결합 조직)을 표적화하기에 충분한 양이다. 유효량은 주로 대상체의 종, 연령, 체중, 건강, 및 표적화될 조직과 같은 인자에 좌우될 것이고, 따라서 동물 및 조직 사이에서 달라질 수 있다. 예를 들어, rAAV의 유효량은 일반적으로 약 109 내지 1016 게놈 카피를 함유하는 약 1 ml 내지 약 100 ml 용액의 범위이다. 일부 경우에, 약 1011 내지 1013 rAAV 게놈 카피의 투여량이 적절하다. 특정 실시양태에서, 1012 또는 1013 rAAV 게놈 카피가 골 조직을 표적화하는 데 효과적이다.
일부 실시양태에서, rAAV의 용량은 역일 (예컨대 24-시간 기간)당 1회 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 2, 3, 4, 5, 6, 또는 7 역일당 1회 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 역주 (예컨대 7 역일)당 1회 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 격주 (예를 들어, 2 역주 기간에 1회) 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 역월당 1회 (예를 들어, 30 역일에 1회) 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 6 역월당 1회 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 역년 (예를 들어, 365일 또는 윤년은 366일)당 1회 이하로 대상체에게 투여된다.
일부 실시양태에서, rAAV 조성물은, 특히 높은 rAAV 농도가 존재하는 경우에 (예를 들어, ~1013 GC/ml 이상), 조성물 중 AAV 입자의 응집을 감소시키도록 제제화된다. rAAV의 응집을 감소시키는 방법은 관련 기술분야에 널리 공지되어 있고, 예를 들어 계면활성제의 첨가, pH 조정, 염 농도 조정 등을 포함한다. (예를 들어, 문헌 [Wright FR, et al., Molecular Therapy (2005) 12, 171-178] 참조, 그의 내용은 본원에 참조로 포함됨).
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV, 및/또는 벡터를 투여하는 것은 야생형 ACVR1의 서열의 위치 206에서 구아닌에서 아데닌으로의 단일 염기 돌연변이를 포함하는 ACVR1 단백질을 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배, 또는 적어도 1000-배만큼의 감소를 발생시킨다. 일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV, 벡터를 투여하는 것은 인간 ACVR1-R206H 단백질을 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배, 또는 적어도 1000-배만큼의 감소를 발생시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV, 및/또는 벡터를 투여하는 것은 이소성 골 형성 또는 이소성 골화를 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배, 또는 적어도 1000-배만큼 호전시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV 및/또는 벡터를 투여하는 것은 중증 골관절염을 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배 또는 적어도 1000-배만큼 호전시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV 및/또는 벡터를 투여하는 것은 이소성 골 질량을 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배 또는 적어도 1000-배만큼 감소시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV 및/또는 벡터를 투여하는 것은 연골형성 원기를 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배 또는 적어도 1000-배만큼 감소시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV 및/또는 벡터를 투여하는 것은 BMP-반응성 유전자를 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배 또는 적어도 1000-배만큼 감소시킨다. 일부 실시양태에서, BMP-반응성 유전자는 ID1이다. 일부 실시양태에서, BMP-반응성 유전자는 MSX2이다. 일부 실시양태에서, BMP-반응성 유전자는 BMP 신호전달 경로에 의해 영향을 받을 수 있는 임의의 유전자이다.
본원에 사용된 개선 또는 자극은 대조군에 상대적인 것이다. 대조군은 단리된 핵산, rAAV 및 벡터의 투여 전의 상태일 수 있다. 개선 또는 자극은 단리된 핵산, rAAV, 및 벡터를 투여받지 않은 대상체에 상대적인 것이다.
일부 실시양태에서, "대조군"은 야생형 ACVR1의 서열의 위치 206에서 구아닌에서 아데닌으로의 단일 염기 돌연변이를 포함하는 인간 ACVR1-R206H 단백질 또는 ACVR1 단백질을 함유하며, 본 개시내용에 기재된 방법 및 조성물 또는 임의의 다른 방법에 의해 치료되지 않은 대상체 또는 조직을 지칭할 수 있다.
제약상 허용되는 부형제 및 담체 용액의 제제화는, 다양한 치료 요법에서 본원에 기재된 특정한 조성물을 사용하기 위한 적합한 투여 및 치료 요법의 개발과 같이, 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다.
전형적으로, 이들 제제는 적어도 약 0.1% 또는 그 초과의 활성 화합물을 함유할 수 있지만, 활성 성분(들)의 백분율은 물론 달라질 수 있고, 편리하게는 총 제제의 중량 또는 부피의 약 1 또는 2% 내지 약 70% 또는 80% 또는 그 초과일 수 있다. 당연히, 각각의 치료상-유용한 조성물 중 활성 화합물의 양은 적합한 투여량이 화합물의 임의의 주어진 단위 용량으로 수득되도록 하는 방식으로 제조될 수 있다. 용해도, 생체이용률, 생물학적 반감기, 투여 경로, 제품 보관 수명, 뿐만 아니라 다른 약리학적 고려사항과 같은 인자가 이러한 제약 제제를 제조하는 관련 기술분야의 통상의 기술자에 의해 고려될 것이고, 따라서 다양한 투여량 및 치료 요법이 바람직할 수 있다.
특정 상황에서, rAAV-기반 치료 구축물을 본원에 개시된 적합하게 제제화된 제약 조성물로 피하로, 췌장내로, 비강내로, 비경구로, 정맥내로, 근육내로, 진피내로, 척수강내로, 대퇴 수질내로, 또는 경구로, 복강내로, 또는 흡입에 의해 전달하는 것이 바람직할 것이다. 일부 실시양태에서, 미국 특허 번호 5,543,158; 5,641,515 및 5,399,363 (각각은 그 전문이 본원에 구체적으로 참조로 포함됨)에 기재된 바와 같은 투여 양식을 사용하여 rAAV를 전달할 수 있다. 일부 실시양태에서, 바람직한 투여 방식은 문맥 주사에 의한 것이다. 일부 실시양태에서, 바람직한 투여 방식은 전신 주사, 예를 들어 정맥내 주사에 의한 것이다. 일부 실시양태에서, 바람직한 투여 방식은 근육내 주사에 의한 것이다. 일부 실시양태에서, 바람직한 투여 방식은 진피내 주사에 의한 것이다.
주사가능한 용도에 적합한 제약 형태는 멸균 수용액 또는 분산액, 및 멸균 주사가능한 용액 또는 분산액의 즉석 제조를 위한 멸균 분말을 포함한다. 분산액은 또한 글리세롤, 액체 폴리에틸렌 글리콜, 및 그의 혼합물 중에서 및 오일 중에서 제조될 수 있다. 통상의 저장 및 사용 조건 하에, 이들 제제는 미생물의 성장을 방지하기 위해 보존제를 함유한다. 많은 경우에, 형태는 멸균성이고, 용이한 시린지성이 존재하는 정도로 유체이다. 이는 제조 및 저장 조건 하에 안정해야 하고, 미생물, 예컨대 박테리아 및 진균의 오염 작용에 대해 보존되어야 한다. 담체는, 예를 들어 물, 에탄올, 폴리올 (예를 들어, 글리세롤, 프로필렌 글리콜, 및 액체 폴리에틸렌 글리콜 등), 그의 적합한 혼합물, 및/또는 식물성 오일을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은, 예를 들어 레시틴과 같은 코팅의 사용에 의해, 분산액의 경우 요구되는 입자 크기의 유지에 의해 및 계면활성제의 사용에 의해 유지될 수 있다. 미생물 작용의 방지는 다양한 항박테리아제 및 항진균제, 예를 들어 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등에 의해 달성될 수 있다. 많은 경우에, 등장화제, 예를 들어 당 또는 염화나트륨을 포함하는 것이 바람직할 것이다. 주사가능한 조성물의 지속 흡수는 흡수를 지연시키는 작용제, 예를 들어, 알루미늄 모노스테아레이트 및 젤라틴을 조성물에 사용함으로써 달성될 수 있다.
주사가능한 수용액의 투여를 위해, 예를 들어 용액은 필요한 경우에 적합하게 완충될 수 있고, 액체 희석제는 먼저 충분한 염수 또는 글루코스에 의해 등장성으로 될 수 있다. 이들 특정한 수용액은 정맥내, 근육내, 피하 및 복강내 투여에 특히 적합하다. 이와 관련하여, 사용될 수 있는 멸균 수성 매질은 관련 기술분야의 통상의 기술자에게 공지되어 있을 것이다. 예를 들어, 1회 투여량을 1 ml의 등장성 NaCl 용액에 용해시키고, 1000 ml의 피하주입액에 첨가하거나 또는 제안된 주입 부위에 주사할 수 있다 (예를 들어, 문헌 ["Remington's Pharmaceutical Sciences" 15th Edition, pages 1035-1038 and 1570-1580] 참조). 투여량의 일부 변동은 숙주의 상태에 따라 필수적으로 발생할 것이다. 투여를 담당하는 사람은 어떠한 경우에도 개별 숙주에 대한 적절한 용량을 결정할 것이다.
멸균 주사가능한 용액은 필요한 양의 활성 rAAV를 필요에 따라 본원에 열거된 다양한 다른 성분과 함께 적절한 용매 중에 혼입시킨 후, 여과 멸균함으로써 제조된다. 일반적으로, 분산액은 다양한 멸균된 활성 성분을 기본 분산 매질 및 상기 열거된 것으로부터의 요구되는 다른 성분을 함유하는 멸균 비히클 내로 혼입시킴으로써 제조된다. 멸균 주사가능한 용액의 제조를 위한 멸균 분말의 경우에, 바람직한 제조 방법은 활성 성분 플러스 그의 이전에 멸균-여과된 용액으로부터 임의의 추가의 목적하는 성분의 분말을 생성하는 진공-건조 및 동결-건조 기술이다.
본원에 개시된 rAAV 조성물은 또한 중성 또는 염 형태로 제제화될 수 있다. 제약상 허용되는 염은 무기 산, 예컨대 예를 들어 염산 또는 인산, 또는 유기 산, 예컨대 아세트산, 옥살산, 타르타르산, 만델산 등에 의해 형성된 산 부가염 (단백질의 유리 아미노 기에 의해 형성됨)을 포함한다. 유리 카르복실 기에 의해 형성된 염은 또한 무기 염기, 예컨대 예를 들어 수산화나트륨, 수산화칼륨, 수산화암모늄, 수산화칼슘, 또는 수산화제2철, 및 유기 염기, 예컨대 이소프로필아민, 트리메틸아민, 히스티딘, 프로카인 등으로부터 유래될 수 있다. 제제화 시, 용액은 투여 제제와 상용성인 방식으로 및 치료상 유효한 양으로 투여될 것이다. 제제는 다양한 투여 형태, 예컨대 주사액, 약물-방출 캡슐 등으로 용이하게 투여된다.
본원에 사용된 "담체"는 임의의 및 모든 용매, 분산 매질, 비히클, 코팅, 희석제, 항박테리아제 및 항진균제, 등장화제 및 흡수 지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등을 포함한다. 제약 활성 물질을 위한 이러한 매질 및 작용제의 사용은 관련 기술분야에 널리 공지되어 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. 어구 "제약상 허용되는"은 숙주에게 투여되는 경우에 알레르기 또는 유사한 불리한 반응을 일으키지 않는 분자 물질 및 조성물을 지칭한다.
전달 비히클, 예컨대 리포솜, 나노캡슐, 마이크로입자, 마이크로구체, 지질 입자, 소포 등이 본 개시내용의 조성물을 적합한 숙주 세포 내로 도입하는 데 사용될 수 있다. 특히, rAAV 벡터 전달되는 트랜스진은 지질 입자, 리포솜, 소포, 나노구체, 또는 나노입자 등에 캡슐화된 전달을 위해 제제화될 수 있다.
이러한 제제는 본원에 개시된 핵산 또는 rAAV 구축물의 제약상 허용되는 제제의 도입을 위해 바람직할 수 있다. 리포솜의 형성 및 사용은 일반적으로 관련 기술분야의 통상의 기술자에게 공지되어 있다. 최근에, 개선된 혈청 안정성 및 순환 반감기를 갖는 리포솜이 개발되었다 (미국 특허 번호 5,741,516). 추가로, 잠재적 약물 담체로서 리포솜 및 리포솜 유사 제제의 다양한 방법이 기재되어 있다 (미국 특허 번호 5,567,434; 5,552,157; 5,565,213; 5,738,868 및 5,795,587).
리포솜은 다른 절차에 의한 형질감염에 대해 통상적으로 저항성인 다수의 세포 유형과 함께 성공적으로 사용되어 왔다. 또한, 리포솜은 바이러스-기반 전달 시스템에 전형적인 DNA 길이 제약이 없다. 리포솜은 유전자, 약물, 방사선요법제, 바이러스, 전사 인자 및 알로스테릭 이펙터를 다양한 배양된 세포주 및 동물 내로 도입하는 데 효과적으로 사용되어 왔다. 또한, 리포솜-매개 약물 전달의 유효성을 조사하는 여러 성공적인 임상 시험이 완료되었다.
리포솜은 수성 매질 중에 분산되어 다층 동심원 이중층 소포 (또한 다층 소포 (MLV)로도 명명됨)를 자발적으로 형성하는 인지질로부터 형성된다. MLV는 일반적으로 25 nm 내지 4 μm의 직경을 갖는다. MLV의 초음파처리는 코어에 수용액을 함유하는, 200 내지 500 Å 범위의 직경을 갖는 작은 단층 소포 (SUV)의 형성을 발생시킨다.
대안적으로, rAAV의 나노캡슐 제제가 사용될 수 있다. 나노캡슐은 일반적으로 물질을 안정하고 재현가능한 방식으로 포획할 수 있다. 세포내 중합체 과부하로 인한 부작용을 피하기 위해, 이러한 초미립자 (약 0.1 μm 크기)는 생체내에서 분해될 수 있는 중합체를 사용하여 설계되어야 한다. 이들 요건을 충족시키는 생분해성 폴리알킬-시아노아크릴레이트 나노입자가 사용을 위해 고려된다.
상기 기재된 전달 방법에 더하여, 하기 기술이 또한 rAAV 조성물을 숙주에 전달하는 대안적 방법으로서 고려된다. 순환계 내로 및 순환계를 통해 약물 투과의 속도 및 효능을 증진시키기 위한 장치로서 초음파영동 (즉, 초음파)이 사용되었고, 미국 특허 번호 5,656,016에 기재되어 있다. 고려되는 다른 약물 전달 대안은 골내 주사 (미국 특허 번호 5,779,708), 마이크로칩 장치 (미국 특허 번호 5,797,898), 안과용 제제 (Bourlais et al., 1998), 경피 매트릭스 (미국 특허 번호 5,770,219 및 5,783,208) 및 피드백-제어 전달 (미국 특허 번호 5,697,899)이다.
치료 방법
본원에 개시된 바와 같이, 본원에 기재된 단리된 핵산, rAAV 및 조성물은 FOP를 갖거나 갖는 것으로 의심되는 대상체를 치료하는 데 유용하다. 일부 실시양태에서, 본 개시내용의 측면은 대상체에서 이소성 골화를 억제하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용의 측면은 FOP를 갖거나 갖는 것으로 의심되는 대상체에서 플레어-업 상태를 개선시키는 방법을 제공한다. 일부 실시양태에서, 본 개시내용의 측면은 세포에서 ACVR1 발현을 억제하는 방법을 제공한다.
본원에 사용된 용어 "치료하는"은 장애, 질환의 증상, 또는 질환에 대한 소인을 다루거나, 치유하거나, 경감시키거나, 완화시키거나, 변경하거나, 해소하거나, 호전시키거나, 개선시키거나, 또는 영향을 미치기 위한 목적으로, 이소성 골화 (HO)와 연관된 질환, 예컨대 FOP, 이소성 골화 (HO)와 연관된 질환, 예컨대 FOP의 증상, 또는 이소성 골화 (HO)와 연관된 질환, 예컨대 FOP에 대한 소인 (예를 들어, FOP와 연관된 유전자, 예컨대 AVCR1에서의 1개 이상의 돌연변이)을 갖는 대상체에게 본원에 기재된 바와 같은 조성물을 적용 또는 투여하는 것을 지칭한다.
질환을 경감시키는 것은 질환의 발생 또는 진행을 지연시키는 것, 또는 질환 중증도를 감소시키는 것을 포함한다. 질환을 경감시키는 것은 반드시 치유적 결과를 요구하지는 않는다. 본원에 사용된 질환 (예컨대 HO와 연관된 질환)의 발생을 "지연시키는 것"은 질환의 진행을 연기, 방해, 둔화, 지체, 안정화, 및/또는 늦추는 것을 의미한다. 이러한 지연은 치료될 질환 및/또는 개체의 병력에 따라 다양한 길이의 시간일 수 있다. 질환의 발생을 "지연" 또는 경감시키거나, 또는 질환의 발병을 지연시키는 방법은, 방법을 사용하지 않은 경우와 비교하여, 주어진 시간 프레임 내에서 질환의 1종 이상의 증상이 발생할 확률을 감소시키고/거나 주어진 시간 프레임 내에서 증상의 정도를 감소시키는 방법이다. 이러한 비교는 전형적으로 통계적으로 유의한 결과를 제공하기에 충분한 다수의 대상체를 사용하는 임상 연구에 기초한다.
질환의 "발생" 또는 "진행"은 질환의 초기 징후 및/또는 뒤이은 진행을 의미한다. 질환의 발생은 관련 기술분야에 널리 공지된 바와 같은 표준 임상 기술을 사용하여 검출가능하고 평가될 수 있다. 그러나, 발생은 또한 검출불가능할 수 있는 진행을 지칭한다. 본 개시내용의 목적상, 발생 또는 진행은 증상의 생물학적 과정을 지칭한다. "발생"은 출현, 재발, 및 발병을 포함한다. 본원에 사용된, 이소성 골화 (HO)와 연관된 질환, 예컨대 FOP의 "발병" 또는 "발생"은 초기 발병 및/또는 재발을 포함한다.
일부 실시양태에서, 본 섹션에 개시된 바와 같은 치료 방법은 그를 필요로 하는 대상체에게 본원에 개시된 바와 같은 트랜스진을 포함하는 단리된 핵산, 재조합 AAV (rAAV), 재조합 유전자 편집 복합체, 또는 벡터를 투여하는 것을 포함한다. rAAV는 골격근 또는 결합 조직에 대한 그의 표적화를 촉진하는 변형을 포함할 수 있다. 일부 실시양태에서, 본원에 개시된 바와 같은 치료 방법은 대상체에게 캡시드 단백질 및 억제 핵산을 코딩하는 단리된 핵산을 포함하는 rAAV를 투여하는 것을 포함한다. rAAV는 억제 핵산 (예를 들어, siRNA, shRNA, miRNA 또는 amiRNA)을 포함할 수 있다. 억제 핵산은 FOP와 연관된 표적 유전자의 발현을 감소 또는 증가시킬 수 있다. 일부 실시양태에서, rAAV 또는 단리된 핵산은 이소성 골화 또는 FOP의 발생과 연관된 유전자를 표적화하는 인공 마이크로RNA를 코딩하는 트랜스진을 포함한다. 일부 실시양태에서, 표적 유전자는 AVCR1이다. 일부 실시양태에서, 표적 유전자는 돌연변이된 AVCR1이다.
세포 또는 대상체에서 ACRV1의 발현은 본 개시내용의 방법을 사용하여 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 감소될 수 있다. 세포 또는 대상체에서 ACVR1의 발현은 본 개시내용의 방법을 사용하여 75% 내지 90%만큼 감소될 수 있다. 세포 또는 대상체에서 ACVR1의 발현은 본 개시내용의 방법을 사용하여 80% 내지 99%만큼 감소될 수 있다.
이소성 골화는 본 개시내용의 방법을 사용하여 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 억제될 수 있다. FOP를 갖거나 갖는 것으로 의심되는 대상체에서의 플레어-업 상태는 본 개시내용의 방법을 사용하여 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 억제될 수 있다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 플레어-업 상태는 FOP와 같은 만성 질환의 악화를 지칭한다.
본원에 개시된 바와 같이, 서열의 "동일성"은 관련 기술분야의 통상의 기술자에게 공지된 수학적 모델, 알고리즘, 또는 컴퓨터 프로그램에 의해 다루어지는 갭 정렬 하에서의, 2개 이상의 서열 사이의 동일한 매치의 퍼센트의 측정 또는 계산을 지칭한다. 2개의 서열 (예를 들어, 핵산 또는 아미노산 서열)의 퍼센트 동일성은, 예를 들어, 베이직 로컬 얼라인먼트 서치 툴 (BLAST®), 예컨대 NBLAST® 및 XBLAST® 프로그램 (버전 2.0)을 사용하여 결정될 수 있다. 다중 서열 정렬의 경우 클러스탈 오메가(Clustal Omega)와 같은 정렬 기술이 사용될 수 있다. 다른 알고리즘 또는 정렬 방법은 스미스-워터맨(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 또는 고속 최적 전반적 서열 정렬 알고리즘 (FOGSAA)을 포함할 수 있으나 이에 제한되지는 않는다.
일부 실시양태에서, 물질의 "유효량"은 목적하는 효과를 생성하기에 (예를 들어, 골 세포 또는 골 조직을 형질도입하기에) 충분한 양이다. 일부 실시양태에서, 단리된 핵산의 유효량은 대상체의 표적 조직의 충분한 수의 표적 세포를 형질감염시키기에 (또는 rAAV-매개된 전달과 관련하여, 감염시키기에) 충분한 양이다. 일부 실시양태에서, 표적 조직은 골격근 또는 결합 조직이다. 일부 실시양태에서, 단리된 핵산 (예를 들어, rAAV를 통해 전달될 수 있는 것)의 유효량은 대상체에서 치료 이익을 갖기에, 예를 들어 이소성 골화를 억제하기에, 플레어-업 상태를 개선시키기 등에 충분한 양일 수 있다. 유효량은 다양한 인자, 예컨대 예를 들어 대상체의 종, 연령, 체중, 건강, 및 표적화될 조직에 좌우될 것이고, 따라서 본 개시내용의 다른 곳에 기재된 바와 같이 대상체 및 조직 사이에서 달라질 수 있다.
본 발명의 예시적인 실시양태는 하기 실시예에 의해 보다 상세히 기재될 것이다. 이들 실시양태는 본 발명의 예시이며, 관련 기술분야의 통상의 기술자는 예시적인 실시양태로 제한되지 않음을 인식할 것이다.
실시예
실시예 1: 유전자 부가 또는 유전자 침묵을 위한 AAV 벡터 게놈의 생성
약 97% FOP는 ACVR1 (G>A, R206H)의 이형접합, 기능 획득 돌연변이에 의해 유발되는 것으로 보고되었다. 인간 ACVR1R206H를 인간 야생형 ACVR1 (ACVR1WT)로 대체하기 위해, 인간 ACVR1 상보적 DNA의 코돈-최적화된 버전 (ACVR1opt, 야생형 코딩 서열과 비교하여 74% 뉴클레오티드 동일성)을 설계하고, 닭 b-액틴 프로모터 (CBA, 도 2a)를 함유하는 AAV 벡터 게놈 내로 클로닝하였다. 구체적으로, 닭 베타-액틴 (CBA) 프로모터 하에 코돈-최적화된 야생형 인간 ACVR1 cDNA (opt-ACVR1, ~1.5 kb)를 발현하는 AAV 벡터 게놈을 생성함으로써 유전자 부가 전략을 개시하였다 (도 2). CBA 인트론 (1080 bp)을 MBL 인트론 (384 bp) 또는 합성 인트론 (172 bp)으로 치환하여 벡터 게놈 크기를 감소시켰다 (도 2a). 이뮤노블롯팅 분석은 모든 3개의 인트론이 CBA 프로모터 하에 HEK293 세포에서 opt-ACVR1 단백질을 발현할 수 있음을 입증하였다 (도 2b). 높은 수준의 AAV-전달된 shRNA는 RNAi 기구를 교란하고 오프-타겟 침묵 효과를 유발할 수 있다고 보고되었기 때문에, 작은 침묵 RNA의 가이드 가닥을 마우스 miR-33-유래 miRNA 스캐폴드 (인공 miRNA, amiR) 내로 삽입하여 통상적인 shRNA-관련 독성 및 오프-타겟 침묵을 개선시켰다. 따라서, CBA 프로모터 하에 인간 ACVR1-R206H mRNA의 상이한 서열 부위를 표적화하는 12종의 인공 miRNA (amiR)를 발현하는 AAV 벡터 게놈을 유전자 침묵을 위해 생성하였다 (도 3a). 추가적으로, 레닐라 루시페라제 리포터 유전자에 이어 인간 ACVR1-R206H, ACVR1-WT, 또는 ACVR1-opt (코돈 최적화됨)에 특이적인 miRNA 결합 부위를 함유하는 amiR-센서 플라스미드를 생성하여, 어떤 amiR이 인간 ACVR1-WT 및/또는 ACVR1-opt mRNA 수준의 어떠한 감소도 없이 인간 ACVR1-R206H mRNA를 녹다운시키는 데 효과적인지를 스크리닝하였다 (도 3b). ACVR1-R206H 활성은 RH8 및 12를 제외하고 대부분의 amiR의 발현에 의해 현저하게 감소된 반면, 이들 RH8 및 12 amiR은 opt-ACVR1 루시페라제 활성에 대해 거의 내지 전혀 효과를 나타내지 않았다. 이러한 설계에서, amiR은 CBA 프로모터와 mCherry 리포터 유전자 사이에 인트론 삽입되었고, 이는 양성 형질도입된 세포의 시각적 추적을 가능하게 한다. ACVR1R206H를 표적화하고, ACVR1WT 또는 ACVR1opt는 표적화하지 않는 amiR-R206H를, 침묵화 효율을 나타내는 센서 플라스미드의 레닐라 활성을 측정함으로써 스크리닝하였다 (도 3c). 이들 amiR 중에서, RH3, 5, 9 및 11을 포함한 4종의 amiR은 ACVR1-WT 활성의 유의한 감소를 유도하였다 (도 3c). 이뮤노블롯팅 분석은 ACVR1-R206H의 단백질 수준이 amiR-ctrl 및 amiR-RH9, 10, 및 11과 비교하여 amiR-RH1, 2, 4, 5, 6, 및 7에 의해 실질적으로 감소되었음을 추가로 확인시켜 주었다. 주목할 것으로, WT- 및 opt-ACVR1 둘 다의 발현은 이들 amiR에 의해 영향을 받지 않았다 (도 3d, 도 30a 및 30b). 이들 결과는 amiR-RH6 및 amiR-RH7을 ACVR1R206H는 표적화하지만 ACVR1WT 및 ACVR1opt는 표적화하지 않는 가장 효과적인 유전자 사일렌서로서 확인시켜 주었다. ACVR1-R206H mRNA의 수준이 amiR-RH6 및 -RH7에 의해 가장 많이 감소되었기 때문에, 이들 amiR을 추가의 실험에 사용하였다.
실시예 2: 유전자 대체를 위한 AAV 벡터 게놈의 생성
유전자 대체 전략을 위해, CBA 프로모터, 합성 또는 MBL 인트론, amiR-ACVR1.RH6 또는 RH7, 및 코돈 최적화된 (opt-) ACVR1의 조합을 함유하는 4종의 AAV 벡터 게놈을 생성하였다 (도 4a). 유전자 침묵 플라스미드와 유사하게, 이들 플라스미드는 또한 ACVR1-WT 활성에 영향을 미치지 않으면서 ACVR1-R206H 루시페라제 활성을 감소시키는 데 효과적이었다 (도 4b). ACVR1-OPT의 증가된 루시페라제 활성과 달리, 이뮤노블롯팅 분석은 opt-ACVR1의 단백질 수준에서 차이를 나타내지 않았으며 (도 4c), 이는 이들 플라스미드에서의 amiR-RH6 또는 amiR-RH7이 opt-ACVR1 발현에 영향을 미치지 않는다는 것을 나타낸다. BRE-루시페라제 활성은 벡터 대조군과 비교하여 이들 플라스미드의 존재 하에 현저하게 감소하였고, 이는 액티빈 A-유도된 루시페라제 활성을 억제하는 그의 능력을 입증한다 (도 4d).
실시예 3: 다중 세포의 시험관내 형질도입에 효과적인 rAAV 혈청형의 스크리닝
시험관내에서 FOP의 원인이 되는 세포를 형질도입하는 데 최상의 AAV 혈청형을 확인하기 위해, 증진된 녹색 형광 단백질 (Egfp) 리포터 유전자를 발현하는 scAAV 벡터 구축물을 14종의 통상적인 AAV 캡시드 (AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh.8, AAVrh.10, AAVrh.39 및 AAVrh.43) 내로 패키징하고, 인간 FOP 환자 진피 섬유모세포-유래 유도성 만능 줄기 세포 (FOP-iPSC), 마우스 근육 근모세포주 (C2C12), 인간 골수-유래 기질 세포 (BMSC) 또는 인간 지방 조직-유래 기질 세포 (ASC)와 함께 인큐베이션하였다. 형질도입된 세포에서의 EGFP의 발현을 형광 현미경검사 (도 5) 및 항-EGFP 항체를 사용한 이뮤노블롯팅 (도 8g)에 의해 평가하였다. 거의 모든 AAV 혈청형 벡터가 C2C12 세포를 형질도입하였지만, rAAV2, rAAV3b, rAAV5, rAAV6, 및 rAAV6.2를 포함한 단지 5개의 AAV 혈청형 벡터만이 인간 FOP-iPSC를 형질도입할 수 있었다. 이들 중에서, rAAV2, rAAV5, rAAV6, 및 rAAV6.2는 또한 인간 BMSC 및 ASC를 형질도입하였다. 주목할 것으로, rAAV9는 인간 FOP-iPSC, ASC, 및 C2C12 세포에 대해 낮은 형질도입 효능을 나타낸다.
rAAV6-F129L 돌연변이체인 rAAV6.2가 시험관내에서 4종의 세포 유형 모두를 형질도입하는 가장 효과적인 혈청형이고, rAAV9가 인간 BMSC뿐만 아니라 마우스 골격을 형질도입할 수 있다는 것을 고려하여, rAAV6.2 및 rAAV9가 골격근에서 이소성 골-존재 세포를 형질도입하는 능력을 이소성 골화 (HO) 마우스 모델에서 검사하였다.
Tie2-Cre 계통-표지 실험은 Tie2-발현 세포가 섬유증식, 연골형성 및 골형성 단계를 비롯한 HO의 모든 단계에 존재하며, BMP 리간드 이식 후 및 골격근에서의 근육 손상 후 이소성 연골 및 골 형성에 기여한다는 것을 입증하였다. 이들 세포는 그의 지방생성 및 섬유발생 능력에 대해 발견된 섬유/지방생성 세포 (FAP)의 하위-집단이다. tdTomato 발현을 사용하여 이소성 골에서 Tie2+ 계열 세포를 가시화하기 위해, Tie2-cre 마우스를 Cre 리포터 Ai9 마우스와 교배시키고, 골격근에서의 근육 손상 후에 재조합 BMP2/7의 근육내 (i.m.) 주사로 처리하였다 (도 6). 4일 (섬유증식 단계) 또는 8일 (골화-전 단계) 후에, EGFP를 발현하는 rAAV6.2 또는 rAAV9를 각각 근육내로 주사하였다. HO 유도 24일 후에, HO를 X-방사선촬영에 의해 평가하고 (도 6a 및 c), 이소성 골에 존재하는 AAV-형질도입된 세포를 형광 현미경검사를 사용하여 가시화하였다 (도 6b 및 d). rAAV6.2 및 rAAV9 둘 다는 HO-존재 세포 및 골격근의 형질도입에 효과적이지만, Tie2-발현 세포의 하위-집단만이 이들 AAV 벡터에 의해 형질도입되었다 (도 6b 및 d). 유전자 대체를 위해 개발된, CBA 프로모터, MBL 인트론, amiR-RH6 또는 -RH7, 및 opt-ACVR1을 함유하는 AAV 벡터 게놈 (도 4a)을 AAV6.2 또는 AAV9 캡시드 내로 패키징하고 (도 7a), 그의 AAV 게놈 완전성을 검증하였다 (도 7b). rAAV6.2가 rAAV9보다 인간 FOP-iPSC에 대해 더 높은 시험관내 형질도입 효율을 나타내기 때문에 (도 5), rAAV6.2 벡터를 사용하여 AAV의 기능적 검증을 수행하였다 (도 8). 인간 FOP-iPSC에서 amiR-RH6 또는 amiR-RH7의 ACVR1-R206H 돌연변이체 대립유전자-특이적 침묵 효율을 검사하기 위해, AAV-형질도입된 세포로부터 추출된 mRNA를 차세대 서열분석에 적용하였다 (도 8a). R206H 대 WT 대립유전자의 전사체 비를 65.4% 대 34.6%로 나타내는 amiR-ctrl-처리한 세포와 비교하여, amiR-RH6 또는 amiR-RH7을 보유하는 rAAV6.2로 처리한 경우에 전사체 비는 각각 47.1% 대 52.9% 및 20.9% 대 79.1%만큼 변경되었다. 이 결과는 amiR-RH7이 amiR-RH6보다 인간 FOP-iPSC에서 ACVR1-R206H 돌연변이체 대립유전자-특이적 침묵에 더 효과적임을 입증한다. 주목할 것으로, amiR-RH7 및 opt-ACVR1을 보유하는 rAAV6.2는 또한 amiR-RH6 및 opt-ACVR1을 보유하는 rAAV6.2와 비교하여 인간 FOP-iPSC에서 코돈-최적화된 야생형 ACVR1 mRNA의 보다 높은 발현을 나타낸 반면, rAAV6.2.amiR-ctrl-처리한 세포에서는 ACVR1 발현이 검출되지 않았다 (도 8b). 따라서, 벡터로의 처리는 rAAV6.amiR-ctrl과 비교하여 알칼리성 포스파타제 (초기 골형성 마커) 및 무기질화 활성 (후기 골형성 마커)의 유의한 감소를 발생시켰지만 (도 8c 및 도 8d), 유형 1 콜라겐 및 골 시알로단백질을 포함한 골모세포 마커 유전자의 mRNA 수준은 amiR-RH7 및 opt-ACVR1을 보유하는 rAAV6.2에 의해 현저하게 감소되었고, amiR-RH6 및 opt-ACVR1을 보유하는 rAAV6.2 또는 rAAV6.2.amiR-ctrl에 의해서는 그렇지 않았다 (도 8e). 따라서, 이러한 결과는 amiR-RH7 및 opt-ACVR1을 보유하는 rAAV6.2가 ACVR1-R206H를 야생형 ACVR1로 대체하여 FOP-iPSC의 골형성을 억제하는 데 강력하다는 것을 나타낸다. 이어서, 대조군 벡터, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 rAAV6.2 벡터를 인간 FOP iPSC 내로 형질도입하고, 그의 발현 및 침묵 효율 및 정확도를 RT-PCR, 차세대 서열분석 (NGS), 및 전체 트랜스크립톰 분석을 사용하여 검사하였다. 65.4% ACVR1R206H 대 34.6% ACVR1WT 전사체가 대조군-발현 세포에서 발현되며, 전사체 패턴은 각각 amiR-RH6.ACVR1opt 및 amiR-RH7.ACVR1opt를 발현하는 세포에서 36.7% 대 63.3% 및 39.5% 대 60.5%로 실질적으로 변화되었다 (도 8f, 상단). EGFP를 발현하는 대조군 세포 (도 15a에 제시된 바와 같음)에 비해 ACVR1opt 발현이 또한 이들 세포에서 확인되었다 (도 8f, 하단).
인간 FOP iPSC의 골형성 잠재력을 억제하는 amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt의 능력을 검사하기 위해, 처리된 세포의 알칼리성 포스파타제 (ALP) 활성, 알리자린 레드 염색 및 골형성 유전자 발현을 검사하였다 (도 8e 및 8h). WT iPSC를 또한 건강한 공여자로부터 생성하고, 음성 대조군으로서 사용하였다. 이들 결과는 amiR-RH6.ACVR1opt 및 amiR-RH7.ACVR1opt가 둘 다 FOP iPSC의 골형성을 억제하는 데 효과적이지만, WT iPSC의 골형성에는 영향이 없거나 또는 이를 약간 증가시킨다는 것을 입증한다. 따라서, 이들 AAV 벡터는 인간 FOP 세포에 특이적으로 작용할 가능성이 있다.
ACVR1R206H 돌연변이는 액티빈 A에 반응하여 Smad1/5/8-매개된 BMP 신호전달의 활성화를 부여하는 반면에, 어떠한 BMP 신호전달도 ACVR1WT 수용체를 통해서는 정상적으로 발생하지 않는다는 것이 이전에 보고되었다. 대조군-발현 FOP iPSC에서, 액티빈 A 처리는 BMP-반응성 유전자, ID1 및 MSX2의 발현을 유의하게 상향조절하였고, 이러한 유도는 amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt를 발현하는 세포에서 제거되었다 (도 8i 및 도 31). 이들 결과를 FOP의 인간화 녹-인 마우스 모델에서 HO의 주요 기원 세포인 섬유/지방생성 전구세포 (FAP)를 사용하여 추가로 평가하고 확인하였다. 세포 표면 마커 (PDGFRα+ScaI+CD31-CD45-)를 사용하여 Acvr1(R206H)Fl;PDGFRα 마우스의 골격근으로부터 단리된 FAP의 하위세트에서 액티빈 A-유도된 골형성을 검사하였고, amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt로 처리한 경우 액티빈 A-유도된 ALP 활성 및 골형성 유전자 발현의 유의한 감소가 입증되었다 (도 8j 및 8k).
전신 주사된 rAAV6.2가 골격근을 형질도입하는 능력을 검사하기 위해, EGFP를 발현하는 rAAV6.2 (rAAV6.2.egfp)를 2개월령의 야생형 마우스에 정맥내로 (i.v.) 주사하고, 2주 후에 개별 기관 영상화를 수행하였으며, 이는 간에서 강한 EGFP 발현을 입증한 한편, 골격근에서는 발현이 검출되지 않았다 (도 9, 좌측). 인간 VEGF-166 및 나트륨 헤파린을 포함한 혈관 투과성 작용제는 rAAV6.2이 심장 및 골격근을 형질도입하는 능력을 개선시켰다 (도 9, 중간). 그러나, rAAV6.2와 비교하여, rAAV9의 정맥내 주사는 혈관 투과성 작용제의 부재 하에서도 심장 및 골격근의 형질도입에 고도로 효과적이었다 (도 9, 우측). 따라서, rAAV9 캡시드를 사용하여 유전자 대체 기구를 FOP의 마우스 모델에 전달하였다. FOP의 유도성 마우스 모델을 생성하기 위해 인간 ACVR1-R206H의 Cre 레콤비나제-의존성 조건부-온 녹-인 대립유전자를 보유하는 ACVR1(R206H)FlEx 마우스를 타목시펜-유도된 Cre 레콤비나제를 발현하는 ERT2-Cre 마우스 (ACVR1(R206H)FlEx;ERT-Cre)와 교배시켰다. 이전에 보고된 바와 같이, 자발적 HO가 타목시펜 처리의 10주 후에 다중 영역에서 발생한다. 다중 HO 부위를 갖는 amiR-ctrl-처리한 마우스와 비교하여, amiR-RH6 또는 -RH7 및 opt-ACVR1을 보유하는 rAAV9로 처리한 경우 FOP 마우스에서는 HO 부위가 거의 검출되지 않았다 (도 10). 이들 결과는 전신 전달된 AAV9 벡터가 골격근에서 ACVR1-R206H 돌연변이체 mRNA를 코돈-최적화된 야생형 ACVR1 mRNA로 대체하는 데 효과적이고, 생체내 자발적 HO의 발생을 억제한다는 것을 입증한다. 따라서, rAAV9.amiR-RH6.opt-ACVR1 또는 amiR-RH7.opt-ACVR1 벡터를 사용한 유전자 대체는 HO의 치료를 위한 유망한 접근법일 수 있다.
실시예 4: 유전자 편집을 위한 AAV 벡터 게놈의 생성
rAAV에 상용성인 Cas9-기반 아데닌 염기 편집제 (ABE)는 이중-가닥 DNA 파괴를 생성하지 않으면서 표적 염기 쌍을 상이한 염기 쌍으로 직접 전환시키기 위해 개발되었다. 따라서, ACVR1-R206H 대립유전자에서 "A"를 "G"로 전환시키기 위해 rAAV9-상용성 ABE 구축물을 개발하였다. ABE를 염기 편집제의 이중-AAV 패키징을 가능하게 하는 트랜스-스플라이싱 인테인 서열을 사용하여 AAV 패키징 크기 한계 (~ 4.7kb)보다 작은 절반으로 나누었다. N-말단 ABE 구축물은 R206H 돌연변이 부위를 보유하는 프로토스페이서를 함유하였다. C-말단 ABE 구축물은 AAV6.2 또는 AAV9 캡시드 내로 패키징되었다 (도 11).
실시예 5: 염증성 시토카인 및/또는 BMP에 반응하는 AAV 벡터 게놈의 생성
염증 및 액티빈 A는 HO에서 소정의 역할을 하는 것으로 제시되었다. 대식세포 및 비만 세포는 FOP의 마우스 모델에서 발생 중인 HO 영역에서 고도로 풍부하며, 고갈되었을 때 HO가 현저하게 감소되었다. 외상-유도된 HO의 마우스 모델에서, 아킬레스 건절단술 및 배측 화상은 손상 후 48시간 내에 TNF 및 IL-1β를 포함한 염증성 시토카인의 상향조절을 발생시켰고, 손상 1주 후에 MCP1 및 VEGF의 상승이 타액에서 지속되었다. 액티빈 A, BMP 리간드, 및 염증성 시토카인의 수준이 플레어-업 영역에서 상승됨에 따라, 플레어-업에 반응하여 천연 액티빈 A 길항제, 가용성 폴리스타틴 (sFST), 및 천연 TNF 길항제, 가용성 TNFR2 (sTNFR2)를 분비할 수 있는 rAAV9 벡터를 생성하였다. rAAV9의 국부 또는 전신 주사는 골격근의 형질도입에 고도로 효과적이며, 이는 플레어-업 영역에서 sFST 및 sTNFR2를 생산하여 이웃 HO의 발생을 억제한다 (도 12). 이를 위해, 내인성 BMP-반응성 요소 (BRE, EndolD1-BRE) 및 NF-kB-결합 부위 (pNF-kB)를 함유하는 프로모터를 가우시아 리포터 유전자를 코딩하는 AAV 벡터 게놈 내로 클로닝하였다 (eBRE/NF-kB-Luc, 도 13a). 통상적인 NF-kB-반응성 리포터 유전자 PB2-luc에서 관찰되는 유도 동역학을 재현하는, TNF 및 IL-1β를 비롯한 염증성 시토카인으로 자극된 경우에, 루시페라제 활성은 용량-의존성 방식으로 실질적으로 증가하였다 (도 13b). 통상적인 BMP-반응성 리포터 유전자 BRE-luc와 같이, 이러한 리포터 유전자도 또한 재조합 BMP4에 대해 반응성이었다 (도 13c). 루시페라제 활성의 상가적 증가가 염증성 시토카인 및 BMP4 둘 다로 처리된 경우에 eBRE/NF-kB-Luc에서 관찰되었다 (도 13d). 이들 결과는 플레어-업 영역에서 상승된 수준의 염증성 시토카인 및 액티빈 A/BMP에 반응할 수 있는 유망한 센서 플라스미드로서 eBRE/NF-kB-Luc를 나타낸다.
실시예 6: 가용성 폴리스타틴 (FST-288) 및 TNFR2를 생산하는 AAV 벡터 게놈의 생성
폴리스타틴 및 sTNFR2는 액티빈 A 및 TNFα에 그의 동족 수용체에 대해 경쟁적으로 결합하고, 따라서 각각 액티빈 A- 및 TNFα-유도된 신호 전달을 억제하는 것으로 이전에 보고되었다. 따라서, 천연 액티빈 A 길항제, 가용성 인간 폴리스타틴 (FST-288) 및 천연 TNF 길항제, 가용성 인간 TNFR2를 AAV 벡터 게놈 내로 닭 β-액틴 프로모터 (CB) 하에 클로닝하였다 (도 14a). 그러나, 전신 전달 후에, rAAV9 벡터는 또한 골에 더하여 간, 심장 및 골격근을 표적화하며, 이는 불리한 효과를 유발할 수 있다. 이를 피하기 위해, AAV 벡터 게놈 내로 완벽하게 상보적인 miR-122-결합 부위를 조작함으로써 간에서의 rAAV 발현을 억제하는 조직-특이적 내인성 miRNA를 개발하였다. 간에서의 트랜스진 발현의 침묵은 간세포에서 발현되는 풍부한 (≥60,000 카피/세포) miRNA인 miR-122, 및 사실상 모든 동물의 심장 및 골격근에서 발견되는 miRNA인 miR-1의 자연 발현을 이용하였다. miR-122에 대한 상보적 부위를 트랜스진의 3' 비번역 영역 (UTR) 내로 삽입하였다 (도 14a). AAV 벡터 게놈으로부터 생산된 sTNFR2 및 FST-288이 TNF- 및 액티빈 A-유도된 신호 전달을 억제할 수 있는지 시험하기 위해, 대조군 벡터 또는 AAV 벡터 게놈을 HEK293 세포 내로 형질감염시키고, 이들 세포로부터 상청액을 수거하였다. 대조군 상청액과 비교하여, TNF- 및 액티빈 A-유도된 활성화는 둘 다 sTNFR2 및 sFST-생산 상청액의 존재 하에 현저하게 감소되었다 (도 14b). 다음으로, 이러한 플라스미드 내의 CB 프로모터를 eBRE/NF-kB 프로모터로 교체할 것이고, 이는 염증성 시토카인 및 액티빈 A에 반응하여 분비된 TNFR2 및 FST-288을 생산할 수 있다.
실시예 7: 시험관내 및 생체내 연구
본 실시예는 장애초래 FOP 병리상태를 예방할 수 있는 신규 유전자 치료제를 기재한다. 건강한 ACVR1의 외인성 발현에 의한 유전자 대체, Acvr1R206H 대립유전자-특이적 침묵, 또는 유전자 대체 및 침묵의 조합을 보유하는 rAAV의 직접 근육 투여 (예를 들어, 상기 실시예에 기재된 바와 같음)는 인간 Acvr1R206H 녹-인 대립유전자를 보유하는 마우스에서 외상-유도된 이소성 골화 (HO)를 현저하게 감소시켰다. 추가적으로, AAV 벡터는 또한 영아기에 전신 투여된 경우에 골격근에서 외상성 HO를 억제하였다. 손상 부위에서의 섬유증, 연골형성 및 골화는 AAV-처리한 근육에서 모두 실질적으로 감소된 한편, 염증은 정상적으로 발생하였다. 유전자 대체 및 침묵의 조합을 보유하는 rAAV9 벡터의 전신 전달은 소아 및 성체 FOP 마우스 둘 다에서 진행성 HO, 악관절강직, 골다공증, 저신장 및 체중 감소의 역전에 의해 제시된 바와 같이, 만성 HO를 예방하는 데 효과적인 것으로 또한 관찰되었다. 또한, 미세 바늘 (예를 들어, 마이크로젝트 600)을 사용한 진피내 (id) 주사를 통한 골격근으로의 rAAV9 벡터의 전달은 골격근에서 FOP-유발 세포를 형질도입하는 데 효과적이어서, FOP 환자에서 HO를 유도하는 근육내 주사에 대한 우려를 경감시키는 것으로 관찰되었다.
도 15a-15d는 AAV-유전자 치료제가 ACVR1-R206H 돌연변이에 의해 증진된 골형성을 역전시킨다는 것을 보여준다. 도 15a는 ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC를 인간 FOP-iPSC에 2일 동안 형질도입하고, 골형성 조건 하에 4일 동안 배양한 것을 보여준다. 총 RNA를 cDNA 합성에 적용한 후, Egfp 발현에 대해 RT-PCR을 수행하였다. 도 15b 및 도 15d는 총 RNA를 RNA 서열분석에 적용하고, amiR-RH7.optACVR1에 비해 amiR-RH6.optACVR1을 발현하는 세포에서 상향/하향조절된 유전자에 대한 유전자 발현을 비교한 볼케이노 플롯을 생성한 것을 보여준다. 대조군 벡터와 비교하여, amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt로의 처리는 각각 45 또는 140개의 유전자를 상향조절하였고, 27 또는 87개의 유전자를 하향조절하였다 (도 15d). 도 15c는 Sca1+PDGFRa+CD31-CD45- 섬유지방생성 전구세포 (FAP)를 4주령의 Acvr1R206H;PDGFRa 마우스의 경골근으로부터 FACS 분류하고, ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터의 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 6일 동안 배양하고, 골형성 유전자 발현을 RT-PCR에 의해 평가하였다.
도 16a-16c는 시험관내 액티빈 A-유도된 골형성에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 16a는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, 액티빈 A (100 ng/ml)로 6 또는 24시간 동안 자극하고, 액티빈 A-반응성 유전자 Id1 및 Msx2의 발현을 각각 RT-PCR을 사용하여 평가하였다. 도 16b-16c는 AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 16b) 및 알리자린 레드 염색 (도 16c)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가한 것을 보여준다.
도 17a-17i는 액티빈 A 신호전달 및 외상성 이소성 골화에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 17a-17d는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 17a). AAV-처리한 세포를 액티빈 A (100 ng/ml)로 30분 동안 자극하고, 포스포-Smad1/5에 대해 이뮤노블롯팅하였다. 항-Gapdh 항체를 로딩 대조군에 사용하였다 (도 17b). AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 17c, 좌측) 및 알리자린 레드 염색 (도 17c, 우측)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가하였다. AAV-처리한 세포를 골형성 조건 하에 PBS 또는 BMP4 (50 ng/ml)와 함께 12일 동안 배양하고, 무기질화에 대해 알리자린 레드 염색 (도 17c, 우측)을 수행하였다 (도 17d). 도 17e는 EGFP를 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 Tie2-cre;Ai9 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상 1주 후에 진피내로 (i.d.) 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (좌측 상단) 및 HO 조직의 동결-절편화 (좌측 하단, 우측)를 수행한 것을 보여준다. 적색 박스는 골격근에서의 HO를 나타낸다. M, 근육; HO-BM, 이소성 골화 골수. 청색, DAPI; 적색, Tie2+ 세포; 녹색, AAV-형질도입된 세포. 도 17f-17g는 벡터 또는 CRE 레콤비나제를 발현하는 rAAV9의 5 x 1012 vg/kg을 6주령의 암컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로 i.d. 주사하고, 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였음을 보여준다. 4주 후에, 경골근에서의 Acvr1R206H 및 CRE 레콤비나제 mRNA 수준을 RT-PCR에 의해 측정하고 (도 17f), 경골근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 17g, 좌측) 및 정량화를 나타낸다 (도 17g, 우측). 도 17h는 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 2일 후에 i.d. 주사한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, 경골근에서의 HO를 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측). 도 17i는 ctrl 또는 amiR-RH6.optACVR1을 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=5)의 대퇴근에 i.d. 주사하고, 2일 후에 rBMP2/7-매트리겔 주사 및 근육 손상을 주사 부위에 사용한 것을 보여준다. 4주 후에, 대퇴근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측).
도 18a-18f는 AAV-처리한 골격근에서의 외상성 이소성 골화의 평가를 보여준다. 도 18a-18b는 연구 및 처리 설계의 다이어그램을 보여준다. EGFP를 발현하는 rAAV6.2의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상의 1주 후에 i.d. 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (도 18b, 좌측) 및 HO 조직의 동결-절편화 (도 18b, 우측)를 수행하였다. 박스는 골격근에서의 HO를 나타낸다. 도 18c-18d는 추가의 연구 및 처리 설계의 다이어그램을 보여준다. 도 18e는 ctrl, amiR-RH6, optACVR1 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 3일 후에 i.d. 주사한 것을 보여준다. 3일 후, 핀치 손상 및 1 μM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (우측). 도 18f는 추가의 연구 및 치료 설계의 다이어그램을 보여준다.
도 19a-19f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 19a-19b는 P1 PDGFRa-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템 (도 19a) 또는 AAV-처리한 뒷다리의 동결 절편 (도 19b)을 사용하여 mCherry 발현에 의해 평가한 것을 보여준다. BM: 골수. 도 19c-19e는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=10)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 19c). 경골근에서의 HO를 마이크로CT 또는 조직학을 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 19d, 좌측) 및 정량화를 나타낸다 (도 19d, 우측). 이소성 골 질량 및 연골형성 원기는 둘 다 대조군 벡터에 비해 ACVR1opt 또는 amiR-RH6.ACVR1opt로의 처리에 의해 현저하게 감소된 반면, amiR-RH6의 처리 효과는 고도로 가변적이었다 (도 19d 및 도 29a). amiR-RH6.ACVR1opt는 외상성 HO의 억제 및 정상 근육 아키텍처의 거의 완전한 재생 및 재확립에서 가장 효과적이었다.
FOP의 마우스 모델에서의 근육 손상은 혈관주위 면역 세포 침윤 (제1일-제3일), 근육 변성 및 섬유증식 반응 (제3일-제7일), 연골형성 (제7일-제14일), 및 이소성 골수를 갖는 골형성 (제14일-제28일)을 포함하여 HO의 주요 순차적 병리학적 변화를 유도하는 것으로 이전에 밝혀졌다. 도 19e는 대표적인 조직학 데이터를 보여준다. 대조군 벡터 또는 amiR-RH6.ACVR1opt로 처리된 P1 Acvr1(R206H)Fl;Cre-ERT2 새끼를 6주령까지 성숙시킨 후, 근육 손상 4주 후에 상이한 시점에서 X-방사선촬영 및 조직병리학적 평가를 수행하였다 (도 19f 및 도 29b). 도 19f는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=3)를 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 3일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 3, 7, 14, 28일 후, 경골근에서의 HO를 X-방사선촬영에 의해 평가하였다. 박스는 경골근에서의 HO를 나타낸다. 예상된 바와 같이, 연골형성 원기 및 이소성 골은 각각 손상의 7 및 14일 후에 대조군-처리된 근육에서 발생한다. 그러나, amiR-RH6.ACVR1opt-처리된 근육은 연골 및 이소성 골 형성의 증거를 거의 또는 전혀 나타내지 않았지만, 제7일에 섬유증식 반응을 나타내었고, 이는 손상의 14일 후에 사라지기 시작하였다. 염증성 대식세포 및 비만 세포의 침윤, 근육 변성 및 섬유증식을 비롯한 제3일의 초기 손상 반응은 대조군 및 amiR-RH6.ACVR1opt로 처리된 경골근 사이에서 비교적 대등하였다 (도 28b 및 29c).
도 20a-20g는 AAV-유전자 치료제의 전신 전달이 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 20a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 20b-20c는 P1 PDGFRα-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, PDGFRα 발현을 IVIS-100 광학 영상화 시스템에 의해 GFP 발현을 사용하여 평가한 것을 보여준다 (도 20b). 뒷다리에서 AAV-형질도입된 세포를 또한 형광 현미경검사를 사용하여 뒷다리에서의 mCherry 발현에 의해 평가하였다. IVIS-100 광학 영상화 시스템 (도 20b) 또는 AAV-처리한 뒷다리의 동결 절편 (도 20c). BM: 골수. 도 20d는 P1 야생형 새끼 (n=3)를 LacZ를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, AAV-형질도입된 조직의 동결-절편을 X-갈락토시다제에 대해 염색한 것을 보여준다. BM: 골수, CB: 피질 골, M: 근육. 도 20f는 연구 및 처리 방법 설계의 다이어그램을 보여준다. 도 20g는 연구 및 처리 방법 설계의 다이어그램을 보여준다. mCherry 발현은 심장, 폐, 간 및 신장에서의 발현 (도 20e)과 함께 골격근 내 PDGFRα+ FAP 및 피질 골 내 PDGFRα+ 골모세포 및 골세포의 하위세트에서 검출되었다 (도 31).
도 21a-21j는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 21a는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후에, 간에서의 Acvr1R206H 및 optACVR1 mRNA 수준을 RT-PCR에 의해 평가하였다. 전신 (도 21b), 몸통 (도 21c) 및 하체 (도 21d)의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방한다는 것을 입증한다. 화살표는 HO 영역을 나타낸다. 전신에서의 총 HO 부피 (도 21e) 및 HO 영역의 수 (도 21f)를 정량화하였다. 임상 HO 발생률의 백분율을 평가하였다 (도 21g). 슬관절의 마이크로CT 및 조직학을 수행하여 이소성 골 (도 21h, 좌측 및 중간), 관절 연골 (도 21h, 중간), 및 성장판 (도 21h, 우측)의 변성을 평가하였다. 박스는 HO 영역 및 관절 연골 및 성장판을 나타낸다. 총 비장세포 집단 내의 면역 세포의 빈도는 전신 면역 반응에 대한 AAV 벡터의 영향이 거의 내지 전혀 없음을 나타낸다 (n=6~8, 도 21i). 대퇴골을 비골두에 가교시키는 이소성 골 (도 21h) 및 슬관절에서의 중증 골관절염 (도 21j, 좌측)은 이들 마우스에서 뒷다리의 부동을 유발할 가능성이 있으며, 이는 또한 amiR-RH6.ACVR1opt 처리에 의해 실질적으로 호전되었다. 특히, 팔로바로텐 처리된 마우스와 달리, 성장판에 존재하는 연골세포는 amiR-RH6.ACVR1opt-처리된 마우스에서 정상이었다 (도 21j, 우측). 폐, 간, 신장, 심장 및 골격근의 조직병리학적 평가를 이들 마우스에서 수행하였고 (도 23), 이는 amiR-RH6.ACVR1opt 처리의 유해 효과가 거의 내지 전혀 없음을 입증하였다. 이들 결과는 rAAV9 캡시드에 의한 amiR-RH6.ACVR1opt의 전신 전달이 성체 FOP 마우스에서 자발적 HO를 예방할 수 있다는 것을 입증한다. 종합하면, ACVR1R206H-특이적 침묵 및 ACVR1opt로의 유전자 대체를 동시에 실행하는 AAV 유전자 치료제의 전신 전달은 소아 및 성체 단계에서 장애초래 FOP 병리상태를 억제하는 데 효과적이며, 이는 FOP 환자에의 임상 번역에 대한 잠재력을 제공한다.
도 22a-22f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 22a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 22b는 mCherry를 발현하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 개별 조직에서의 mCherry 발현을 주사 2주 후에 IVIS-100 광학 영상화에 의해 모니터링하였다. 도 22c-2f는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후, 정상적으로 이동하는 Acvr1R206H (ctrl) 마우스, 느리게 이동하는 Acvr1R206H;Cre-ERT2 (ctrl) 마우스, 및 정상적으로 이동하는 Acvr1R206H;Cre-ERT2 (amiR-RH6.optACVR1) 마우스를 포함한 16주령의 AAV-처리한 마우스의 움직임. 화살표는 amiR-RH6.optACVR1-처리한 마우스를 나타낸다 (도 22c). 도 22d는 슬관절 주변의 이소성 골을 보여준다. 도 22e는 AAV-처리한 비장의 종단면의 H&E 염색을 보여준다. 도 22f는 총 비장세포의 집단 내의 단핵구, 대식세포 및 호중구의 빈도를 보여준다 (n=6~8).
도 23은 성체 FOP 마우스에서의 조직 조직병리학에 대한 AAV-유전자 치료제의 효과를 보여준다. ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사하였다. 10주 후에, 폐, 간, 신장, 심장 및 골격근에서 H&E 염색을 수행하여 조직의 조직병리학을 평가하였다 (n=3).
도 24a-24h는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 24a는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRa-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다 (상단). HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다 (하단). 박스는 HO 조직을 나타낸다. 도 24b-24h는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. AAV-처리한 마우스의 생존 (도 24b) 및 체중 (도 24c)을 3주령부터 8주령까지 매주 분석하였다. 5주령의 AAV-처리한 두개골의 마이크로CT 분석은 AAV 벡터가 Acvr1R206H;PDGFRa-Cre 마우스의 악관절강직을 역전시키는 능력을 보여준다 (도 24d-24e). 3D 재구성 (도 24d, 상단) 및 2D 횡단면 (도 24d, 하단) 영상 및 개구 간격 (도 24e)을 나타낸다. 화살표는 측두하악 관절강직의 영역을 나타낸다. 대조군-처리된 Acvr1R206H 마우스의 감소된 생존 및 실질적인 체중 감소는 주로 악관절강직과 연관되었을 가능성이 있었고, 이는 개구하지 못하여 기아로 인해 조기에 사망한 모든 마우스에서 관찰되었다 (도 24d). 이들 마우스에서는 측두하악 관절 (TMJ)의 양쪽에서 HO가 발생한 반면, amiR-RH6 또는 ACVR1opt로의 처리에 의해서는 대부분의 HO가 TMJ의 오직 한쪽에서만 발생하였다. amiR-RH6.ACVR1opt 처리는 TMJ의 양쪽에서 HO를 거의 완전히 억제하여, 생존율 및 체중의 유의한 증가를 발생시켰다. 이들 결과는 Acvr1R206H-특이적 침묵 및 ACVR1opt로의 유전자 대체와 비교하여, amiR-RH6.ACVR1opt를 사용한 조합 접근법이 소아 FOP 마우스에서 TMJ에서의 조기-발병 HO를 예방하는 데 가장 효과적임을 시사한다.
골다공증이 진행성 FOP 환자의 주요 임상 특색으로 간주되었기 때문에, 5-주령의 Acvr1R206H 마우스의 척추 골 질량 및 아키텍처를 마이크로CT에 의해 평가하였으며 (도 24d), 이는 한배새끼 대조군과 비교하여 지주골 질량의 ~70% 감소를 입증하였다. 이러한 표현형은 amiR-RH6.ACVR1opt로의 처리에 의해 실질적으로 호전되었지만, amiR-RH6 및 ACVR1opt에 의해서는 그렇지 않았다. 추가적으로, 이전에 보고된 바와 같이, Acvr1R206H 마우스에서는 경추, 및 엉덩이, 앞다리, 뒷다리 및 발목의 관절을 포함한 다중 해부학적 위치에서 자발적 HO가 발생하였으며, 이는 amiR-RH6, ACVR1opt, 또는 amiR-RH6.ACVR1opt로의 처리에 의해 실질적으로 호전되었다 (도 24d).
본 개시내용에 제시된 바와 같이, PDGFRα는 치아 중간엽 줄기 세포 및 상아질모세포에서 고도로 발현되기 때문에 (도 27c), PDGFRα 구동인자를 사용하여 Acvr1R206H를 표적화하는 것은 또한 상악골 및 하악골 둘 다에서 낮은 치조골 질량을 발생시켰고, 이는 amiR-RH6.ACVR1opt로의 처리에 의해 현저하게 개선되었다 (도 24g 및 도 27d). 특히, 치아 형태 및 상아질 질량은 둘 다 Acvr1R206H 마우스에서 정상이었으며, 이는 ACVR1R206H 돌연변이가 치아 발생 및 항상성에 중요하지 않다는 것을 시사한다. (도 24d). 상악골 및 하악골의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스의 낮은 골 질량을 역전시킨다는 것을 입증한다 (도 24f-24g). 2D 단면 (도 24f) 및 횡단면 (도 24g) 영상을 나타낸다. 화살표는 치근골을 나타낸다. 전신의 마이크로CT 분석은 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방하는 AAV 벡터의 능력을 보여준다 (도 24h). 3D 재구성 (도 24h, 좌측) 및 2D 횡단면 (도 24h, 우측) 영상을 나타낸다. 다중 잔류 HO 병변이 amiR-RH6 또는 ACVR1opt로 처리된 Acvr1R206H 마우스에서 검출된 반면, amiR-RH6.ACVR1opt 처리는 신체 전반에 걸쳐 자발적 HO를 거의 완전히 예방하였다. 따라서, 악관절강직의 낮은 발생률과 함께, 영아기에서의 amiR-RH6.ACVR1opt의 단일 처리는 골격 발생 동안 FOP 마우스에서 조기-발병 골다공증 및 진행성 HO를 예방할 수 있다.
도 25a-25b는 AAV9의 전신 전달이 소아 FOP 마우스에서 HO 조직의 형질도입에 효과적임을 보여준다. 골격근 간질 내의 PDGFRα+ 전구세포가 HO의 원인이 되는 기원의 주요 세포 집단으로 공지되어 있기 때문에, Acvr1(R206H)Fl의 조건부 녹-인 대립유전자를 보유하는 마우스를 PDGFRα-cre 마우스 (Acvr1(R206H)Fl;PDGFRα)와 교배시켜, 다중 해부학적 위치에서 근조직, 건 및 인대의 조기-발병 및 광범위하게 분포된 HO 표현형을 초래하였다 (도 25a). 구체적으로, 도 25a는 5주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에서의 HO 조직의 알시안 블루 염색을 보여준다. 도 25b는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다. HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다.
도 26a-26b는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 26a는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. 정상 크기의 Acvr1R206H 마우스 (ctrl), 작은 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (ctrl), 및 정상 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (amiR-RH6.optACVR1)를 포함한, 5주령의 AAV-처리한 마우스의 움직임이 제시된다. 도 26b는 5주령의 AAV-처리한 마우스의 전신을 보여주는 X-방사선촬영을 보여준다.
도 27a-27d는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 악관절강직을 예방한다는 것을 보여준다. P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하였다. 도 27a는 5주령의 AAV-처리한 마우스의 개구 능력을 입증하는 사진을 보여준다. 도 27b는 5주령의 AAV-처리한 마우스의 개별 조직이, optACVR1 또는 amiR-RH6.optACVR1의 AAV-매개된 발현이 기아에 의한 Acvr1R206H;PDGFRa-Cre 장의 붕괴를 예방한다는 것을 입증하는 사진을 보여준다.
도 28a-28c는 치료 유전자의 발현을 제어하기 위한 AAV 벡터 게놈의 변형을 보여준다. 도 28a는 플라스미드 구축의 개략적 다이어그램을 보여준다. CMV 인핸서/닭 β-액틴 프로모터 (CBA), MBL 인트론 (MBLi), β-글로빈 폴리A 서열 (PA), 및 역전된 말단 반복부 (TR). miR-122: 간-특이적 miRNA, miR-208a: 심장 근육-특이적 miRNA, TS: 표적 서열. miR-122/miR208a-TS는 간 및 심장에서 AAV의 발현을 억제하는 데 사용된다. EndoID1-BRE: BMP-반응성 요소. pNF-kB: 염증-반응성 요소. EndoID1-BRE/pNF-kB를 함유하는 프로모터는 BMP, 액티빈 A, 및/또는 염증유발 시토카인에 반응하여 AAV의 발현을 유도하는 데 사용된다. 도 28b는 플라스미드 구축의 개략적 다이어그램을 보여준다. 도 28c는 6주령의 야생형 마우스를 PBS 또는 5 x 1013 vg/kg의 rAAV9.egfp 또는 rAAV9.egfp.MIR-TS의 i.v. 주사로 처리하고, 2주 후에, AAV 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템에 의해 EGFP 발현을 사용하여 모니터링한 것을 보여준다.
실시예 8: FOP 마우스에서의 외상성 HO에 대한 AAV 유전자 치료제의 생체내 처리 효과
시험관내 rAAV의 형질도입 효율은 투여 경로, 혈청 인자, 순환 중화 항체 및 세포외 장벽을 포함한 다중 생리학적 장벽의 존재로 인해 생체내 성능을 예측하는 것이 도전과제인 것으로 공지되어 있다. 따라서, HO가 FOP 마우스에서 주로 발생하는 골격근을 형질도입하는 rAAV6.2의 능력을 검사하기 위해, rAAV6.2-egfp 벡터를 마우스 내로 정맥내로 (i.v.) 주사하고, 개별 조직에서의 EGFP 발현을 IVIS-100 광학 영상화에 의해 모니터링하였다 (도 32a). EGFP 발현은 간에서만 검출된 반면, 골격근에서의 발현은 재조합 혈관 내피 성장 인자 (VEGF)-166, 나트륨 헤파린 및 혈청 알부민을 비롯한 혈관 작용제를 보충한 경우에 약간 증가한 것으로 관찰되었다 (도 32b). rAAV9 벡터의 i.v. 주사는 골격근을 형질도입하고, rAAV9의 근육내 (i.m.) 주사는 근육-상주 중간엽 줄기 세포 (MSC, 도 32c)를 형질도입하는 데 효과적인 것으로 이전에 밝혀졌다. i.m. 주사는 종종 FOP 환자에서 HO 병변을 유발하기 때문에, 중공 미세바늘을 사용한 rAAV9.mCherry의 경골근으로의 진피간 (i.d.) 전달을 검사하였으며, 이는 근섬유 전반에 걸친 mCherry의 발현을 입증하였다 (도 32d 및 32e).
HO-형성 FAP를 형질도입하는 i.d. 주사된 rAAV9의 능력을 검사하기 위해, 후천성 형태의 HO, 근육 손상/BMP-유도된 HO를 나타내는 마우스 모델을 FAP의 하위세트에서 mCherry를 발현하는 Tie2-cre;Rosa26mCherry 리포터 마우스에 사용하였다. 둔기 근육 외상 및 재조합 BMP2/7의 투여 1주 후에, rAAV9.egfp를 대퇴근 내로 i.d. 주사하고, 3주 후에, HO 및 EGFP 발현을 각각 X-방사선촬영 및 형광 현미경검사에 의해 평가하였다 (도 18a). EGFP는 대퇴근에서뿐만 아니라 이소성 골 내의 Tie2+ FAP에서 고도로 발현되었으며 (도 6d), 이는 i.d. 주사된 rAAV9가 HO 발생 동안 골격근에서 근세포 및 FAP를 형질도입하는 데 효과적이었음을 입증한다. rAAV6.2-처리된 이소성 골에서는 EGFP 발현이 거의 내지 전혀 없었다 (도 6a 및 6b). rAAV9의 i.d. 전달이 FOP 마우스에서 HO-형성 FAP를 형질도입할 수 있는지 직접 시험하기 위해, ACVR1(R206H)Fl의 조건부 녹-인 모델을 Cre 레콤비나제를 발현하는 rAAC9의 i.d. 주사로 처리하고, 외상-유도된 HO를 마이크로CT에 의해 평가하였다 (도 18c). 대퇴근에서의 ACVR1R206H mRNA의 Cre-매개된 유도를 RT-PCR 분석에 의해 검증하였다 (도 17f). 이는 rAAV9.Vec가 아닌 rAAV9.Cre로 처리된 대퇴근에서의 이소성 골 형성에 상응하며 (도 17g), 이는 골격근에서 HO-형성 FAP로의 rAAV9의 i.d. 전달의 유효성을 입증한다. 마지막으로, 대조군 벡터, amiR-RH6, ACVR1opt, 또는 amiR-RH6.ACVR1opt를 보유하는 rAAV9 벡터를 타목시펜-유도된 Cre 레콤비나제를 발현하는 Acvr1(R206H)Fl;Cre-ERT2 마우스의 경골근 내로 i.d. 주사하고, 경골근에서의 ACVR1R206H 및 ACVR1opt 발현의 녹다운 효율을 검증하였다 (도 18d 및 18e). 외상-유도된 HO는 대조군 AAV 벡터에 비해 치료 AAV 벡터로의 처리에 의해 실질적으로 감소되었고 (도 19d), 이는 ACVR1R206H-특이적 침묵, 유전자 대체, 및 조합 접근법이 모두 젊은 성체 FOP 마우스에서 외상성 HO를 억제하는 데 효과적이었음을 입증한다. Acvr1R206H BMSC의 BMP4-유도된 골형성이 amiR-RH6.ACVR1opt에 의해 영향을 받지 않았기 때문에 (도 19d), 근육 손상/BMP-유도된 HO에 대한 효과는 거의 내지 전혀 없었으며 (도 17i), 이는 외상성 HO에 대한 AAV 벡터의 처리 효과가 HO의 후천성 형태에는 영향을 미치지 않으면서 ACVR1R206H 수용체에 특이적이라는 것을 시사한다.
서열
>서열식별번호: 1; Opt ACVR1 핵산 서열
Figure pct00001
>서열식별번호: 2; AAV-CBA-opt-ACVR1 핵산 서열
Figure pct00002
Figure pct00003
Figure pct00004
>서열식별번호: 3; AAV-CBA-MBL-opt-ACVR1 핵산 서열
Figure pct00005
Figure pct00006
>서열식별번호: 4; AAV-PBP (합성 인트론)-opt-ACVR1 핵산 서열
Figure pct00007
Figure pct00008
Figure pct00009
>서열식별번호: 5; RH1 ami-RNA를 코딩하는 핵산 서열
Figure pct00010
>서열식별번호: 6; RH2 ami-RNA를 코딩하는 핵산 서열
Figure pct00011
>서열식별번호: 7; wtACVR1 핵산 서열
Figure pct00012
>서열식별번호: 8; ACVR1-R206H 핵산 서열
Figure pct00013
>서열식별번호: 9; ACVR1-optAVCR1 핵산 서열
Figure pct00014
>서열식별번호: 10; AAVscCB6 (amiR33-ACVR1-A7) EGFP 핵산 서열
Figure pct00015
Figure pct00016
Figure pct00017
>서열식별번호: 11; AAVscCB6 (amiR33-ACVR1-A7-14) EGFP 핵산 서열
Figure pct00018
Figure pct00019
>서열식별번호: 12; AAVscCB6 (amiR33-ACVR1-A8) EGFP 핵산 서열
Figure pct00020
Figure pct00021
>서열식별번호: 13; AAVscCB6 (amiR33-ACVR1-A8-14) EGFP 핵산 서열
Figure pct00022
Figure pct00023
Figure pct00024
>서열식별번호: 14; AAVscCB6 (amiR33-ACVR1-A9) EGFP 핵산 서열
Figure pct00025
Figure pct00026
>서열식별번호: 15; AAVscCB6 (amiR33-ACVR1-A9-14) EGFP 핵산 서열
Figure pct00027
Figure pct00028
>서열식별번호: 16; AAVscCB6 (amiR33-ACVR1-A10) EGFP 핵산 서열
Figure pct00029
Figure pct00030
>서열식별번호: 17; AAVscCB6 (amiR33-ACVR1-A10-14) EGFP 핵산 서열
Figure pct00031
Figure pct00032
>서열식별번호: 18; AAVscCB6 (amiR33-ACVR1-A11) EGFP 핵산 서열
Figure pct00033
Figure pct00034
Figure pct00035
>서열식별번호: 19; AAVscCB6 (amiR33-ACVR1-A11-14) EGFP 핵산 서열
Figure pct00036
Figure pct00037
>서열식별번호: 20; AAVscCB6 (amiR33-ACVR1-A12) EGFP 핵산 서열
Figure pct00038
Figure pct00039
>서열식별번호: 21; AAVscCB6 (amiR33-ACVR1-A12-14) EGFP 핵산 서열
Figure pct00040
Figure pct00041
Figure pct00042
>서열식별번호: 22; wtACVR1 amiR-센서 플라스미드 핵산 서열
Figure pct00043
Figure pct00044
>서열식별번호: 23; ACVR1-R206H amiR-센서 플라스미드 핵산 서열
Figure pct00045
Figure pct00046
Figure pct00047
>서열식별번호: 24; ACVR1-optACVR1 amiR-센서 플라스미드 핵산 서열
Figure pct00048
Figure pct00049
Figure pct00050
>서열식별번호: 25; AAV-CBA (합성 인트론) (amiR-33-ACVR1-A9)-opt-ACVR1
Figure pct00051
Figure pct00052
>서열식별번호: 26; AAV-CBA (합성 인트론) (amiR-33-ACVR1-A10)-opt-ACVR1 핵산 서열
Figure pct00053
Figure pct00054
Figure pct00055
>서열식별번호: 27; AAV-CBA (MBL-amiR-ACVR1-A9)-opt-ACVR1 핵산 서열
Figure pct00056
Figure pct00057
Figure pct00058
>서열식별번호: 28; AAV-CBA (MBL-amiR-ACVR1-A10)-opt-ACVR1 핵산 서열
Figure pct00059
Figure pct00060
Figure pct00061
>서열식별번호: 29; AAV-ABE C-말단 sghACVR1 핵산 서열
Figure pct00062
Figure pct00063
Figure pct00064
>서열식별번호: 30; PB2 (NF-kB 프로모터) 핵산 서열
Figure pct00065
>서열식별번호: 31; BRE 핵산 서열
Figure pct00066
>서열식별번호: 32; AAV BRE-NFkB-가우시아 핵산 서열
Figure pct00067
Figure pct00068
>서열식별번호: 33; AAV CBA-FST-TNFR2-miR122 핵산 서열
Figure pct00069
Figure pct00070
Figure pct00071
Figure pct00072
>서열식별번호: 34; AAV CBA- miR122 핵산 서열
Figure pct00073
Figure pct00074
>서열식별번호: 35; 인간 가용성 IL1Rα 핵산 서열
Figure pct00075
>서열식별번호: 36; 합성 인트론 핵산 서열
Figure pct00076
>서열식별번호: 37; MBL 인트론 핵산 서열
Figure pct00077
>서열식별번호: 38; OPT ACVR1 단백질 서열
Figure pct00078
>서열식별번호: 39; 서열식별번호: 5에 상응하는 단백질 서열
Figure pct00079
>서열식별번호: 40; 서열식별번호: 6에 상응하는 단백질 서열
Figure pct00080
>서열식별번호: 41; 서열식별번호: 7에 상응하는 wtACVR1 단백질 서열
Figure pct00081
>서열식별번호: 42; 서열식별번호: 8에 상응하는 ACVR1-R206H 단백질 서열
Figure pct00082
>서열식별번호: 43; sgACVR1 단백질 서열
Figure pct00083
>서열식별번호: 44; hspCas9 단백질 서열
Figure pct00084
>서열식별번호: 45; sFST-288 단백질 서열
Figure pct00085
>서열식별번호: 46; sTNFR2 단백질 서열
Figure pct00086
>서열식별번호: 47; miR-122 단백질 서열
Figure pct00087
서열식별번호: 48; miR-208 결합 부위
Figure pct00088
서열식별번호: 49; pAAVss-CB-PI(MBL-amiRACVR1-A9)-opt-ACVR1-miR-122T.miR-208aT
Figure pct00089
Figure pct00090
서열식별번호: 56; RH3 ami-RNA를 코딩하는 핵산 서열
Figure pct00091
서열식별번호: 57; RH4 ami-RNA를 코딩하는 핵산 서열
Figure pct00092
서열식별번호: 58; RH5 ami-RNA를 코딩하는 핵산 서열
Figure pct00093
서열식별번호: 59; RH6 ami-RNA를 코딩하는 핵산 서열
Figure pct00094
서열식별번호: 60; RH7 ami-RNA를 코딩하는 핵산 서열
Figure pct00095
서열식별번호: 61; RH8 ami-RNA를 코딩하는 핵산 서열
Figure pct00096
서열식별번호: 62; RH9 ami-RNA를 코딩하는 핵산 서열
Figure pct00097
서열식별번호: 63; RH10 ami-RNA를 코딩하는 핵산 서열
Figure pct00098
서열식별번호: 64; RH11 ami-RNA를 코딩하는 핵산 서열
Figure pct00099
서열식별번호: 65; RH12 ami-RNA를 코딩하는 핵산 서열
Figure pct00100
SEQUENCE LISTING <110> University of Massachusetts <120> DEVELOPMENT OF NOVEL GENE THERAPEUTICS FOR FIBRODYSPLASIA OSSIFICANS PROGRESSIVA <130> U0120.70152WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 63/251,822 <151> 2021-10-04 <150> US 63/121,221 <151> 2020-12-03 <160> 65 <170> PatentIn version 3.5 <210> 1 <211> 1530 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 atggtcgatg gagtgatgat cctgcctgtc ctgattatga ttgccctgcc cagccccagc 60 atggaagatg aaaaacctaa agtcaaccct aagctgtata tgtgcgtgtg cgagggcctg 120 agctgcggaa acgaggatca ctgcgagggc cagcagtgtt tcagctccct gtccatcaat 180 gacggcttcc acgtgtacca gaagggctgc tttcaggtgt atgagcaggg caagatgacc 240 tgtaagacac caccttcccc aggacaggca gtggagtgct gtcagggcga ttggtgtaac 300 cggaatatca ccgcccagct gccaacaaag ggcaagtctt tccccggcac acagaacttt 360 cacctggaag tgggcctgat catcctgagc gtggtgttcg ccgtgtgcct gctggcatgt 420 ctgctgggag tggccctgag aaagtttaag cggagaaacc aggagcggct gaatccaaga 480 gatgtggagt acggcaccat cgagggcctg atcaccacaa atgtgggcga ctctacactg 540 gccgacctgc tggatcacag ctgcaccagc ggctccggat ctggcctgcc ctttctggtg 600 cagaggaccg tggcccggca gatcaccctg ctggagtgcg tgggcaaggg ccggtacgga 660 gaagtgtgga gaggatcctg gcagggagag aacgtggcag tgaagatctt ctctagccgg 720 gatgagaagt cttggtttag agagacagag ctgtataaca cagtgatgct gaggcacgag 780 aatatcctgg gcttcatcgc ctccgacatg acctctcgcc actcctctac acagctgtgg 840 ctgatcaccc actaccacga gatgggctcc ctgtacgatt acctccagct gaccacactg 900 gacacagtgt cttgcctgcg gatcgtgctg tctatcgcca gcggcctggc acacctgcac 960 atcgagatct ttggaaccca gggcaagcca gcaatcgcac acagagatct gaagtctaag 1020 aacatcctgg tgaagaagaa tggccagtgc tgtatcgccg atctgggcct ggccgtgatg 1080 cacagccagt ccaccaacca gctggacgtg ggcaacaatc ctcgggtggg cacaaagaga 1140 tacatggccc cagaggtgct ggatgagaca atccaggtgg actgcttcga tagctataag 1200 agggtggaca tctgggcctt tggcctggtg ctgtgggagg tggcaaggag gatggtgagc 1260 aacggcatcg tggaggacta caagccaccc ttctatgacg tggtgcctaa tgatccatcc 1320 tttgaggaca tgcgcaaggt ggtgtgcgtg gatcagcaga ggcccaacat ccctaatcgc 1380 tggttcagcg accccaccct gacatccctg gccaagctga tgaaggagtg ttggtatcag 1440 aatcctagcg ccaggctgac cgccctgcgc atcaagaaaa ctctgactaa aatcgacaat 1500 agcctggata aactgaaaac cgactgctga 1530 <210> 2 <211> 6586 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt 60 tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac 120 taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatctacca gggtaatggg 180 gatcctctag aactatagct agtcgacatt gattattgac tagttattaa tagtaatcaa 240 ttacggggtc attagttcat agcccatata tggagttccg cgttacataa cttacggtaa 300 atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 360 ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 420 aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 480 tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 540 ctacttggca gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca 600 cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg tatttattta 660 ttttttaatt attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg 720 gggcggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 780 agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 840 aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc tgccttcgcc ccgtgccccg 900 ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg accgcgttac tcccacaggt 960 gagcgggcgg gacggccctt ctcctccggg ctgtaattag cgcttggttt aatgacggct 1020 tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg 1080 ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc 1140 cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag 1200 tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg 1260 gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc 1320 ggtcgggctg caaccccccc tgcacccccc tccccgagtt gctgagcacg gcccggcttc 1380 gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg 1440 gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc ggggagggct cgggggaggg 1500 gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca gccattgcct 1560 tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct gtgcggagcc 1620 gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc 1680 cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct 1740 ccctctccag cctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag 1800 ggcggggttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgttca 1860 tgccttcttc tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca 1920 ttttggcaaa gaattccgcc accatggtcg atggagtgat gatcctgcct gtcctgatta 1980 tgattgccct gcccagcccc agcatggaag atgaaaaacc taaagtcaac cctaagctgt 2040 atatgtgcgt gtgcgagggc ctgagctgcg gaaacgagga tcactgcgag ggccagcagt 2100 gtttcagctc cctgtccatc aatgacggct tccacgtgta ccagaagggc tgctttcagg 2160 tgtatgagca gggcaagatg acctgtaaga caccaccttc cccaggacag gcagtggagt 2220 gctgtcaggg cgattggtgt aaccggaata tcaccgccca gctgccaaca aagggcaagt 2280 ctttccccgg cacacagaac tttcacctgg aagtgggcct gatcatcctg agcgtggtgt 2340 tcgccgtgtg cctgctggca tgtctgctgg gagtggccct gagaaagttt aagcggagaa 2400 accaggagcg gctgaatcca agagatgtgg agtacggcac catcgagggc ctgatcacca 2460 caaatgtggg cgactctaca ctggccgacc tgctggatca cagctgcacc agcggctccg 2520 gatctggcct gccctttctg gtgcagagga ccgtggcccg gcagatcacc ctgctggagt 2580 gcgtgggcaa gggccggtac ggagaagtgt ggagaggatc ctggcaggga gagaacgtgg 2640 cagtgaagat cttctctagc cgggatgaga agtcttggtt tagagagaca gagctgtata 2700 acacagtgat gctgaggcac gagaatatcc tgggcttcat cgcctccgac atgacctctc 2760 gccactcctc tacacagctg tggctgatca cccactacca cgagatgggc tccctgtacg 2820 attacctcca gctgaccaca ctggacacag tgtcttgcct gcggatcgtg ctgtctatcg 2880 ccagcggcct ggcacacctg cacatcgaga tctttggaac ccagggcaag ccagcaatcg 2940 cacacagaga tctgaagtct aagaacatcc tggtgaagaa gaatggccag tgctgtatcg 3000 ccgatctggg cctggccgtg atgcacagcc agtccaccaa ccagctggac gtgggcaaca 3060 atcctcgggt gggcacaaag agatacatgg ccccagaggt gctggatgag acaatccagg 3120 tggactgctt cgatagctat aagagggtgg acatctgggc ctttggcctg gtgctgtggg 3180 aggtggcaag gaggatggtg agcaacggca tcgtggagga ctacaagcca cccttctatg 3240 acgtggtgcc taatgatcca tcctttgagg acatgcgcaa ggtggtgtgc gtggatcagc 3300 agaggcccaa catccctaat cgctggttca gcgaccccac cctgacatcc ctggccaagc 3360 tgatgaagga gtgttggtat cagaatccta gcgccaggct gaccgccctg cgcatcaaga 3420 aaactctgac taaaatcgac aatagcctgg ataaactgaa aaccgactgc tgacctgagg 3480 atccgatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct 3540 gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg 3600 tctctcactc ggaagcaatt cgttgatctg aatttcgacc acccataata cccattaccc 3660 tggtagataa gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt 3720 tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 3780 gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc cttaattaac 3840 ctaattcact ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac 3900 ttaatcgcct tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca 3960 ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga atgggacgcg ccctgtagcg 4020 gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 4080 ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 4140 cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 4200 tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 4260 cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 4320 ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 4380 tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 4440 aaatattaac gcttacaatt taggtggcac ttttcgggga aatgtgcgcg gaacccctat 4500 ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata 4560 aatgcttcaa taatattgaa aaaggaagag tatgattgaa caagatggat tgcacgcagg 4620 ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg 4680 ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa 4740 gaccgacctg tccggtgccc tgaatgaact gcaagacgag gcagcgcggc tatcgtggct 4800 ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga 4860 ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc 4920 cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac 4980 ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc 5040 cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact 5100 gttcgccagg ctcaaggcga gcatgcccga cggcgaggat ctcgtcgtga cccatggcga 5160 tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg 5220 ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga 5280 agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga 5340 ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgataac tgtcagacca 5400 agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 5460 ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 5520 ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 5580 cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 5640 tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 5700 tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 5760 tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 5820 tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 5880 ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 5940 acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 6000 ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 6060 gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 6120 ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 6180 ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 6240 taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 6300 cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc 6360 gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag 6420 tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt 6480 tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 6540 cagctatgac catgattacg ccagatttaa ttaaggcctt aattag 6586 <210> 3 <211> 5973 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60 ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120 ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180 ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240 agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300 ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360 tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420 atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480 ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540 gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600 cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660 tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840 aagcgaagcg cgcggcgggc gggagcaagc tttcagatcg cctggagacg ccatccacgc 900 tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggccg ggaacggtgc 960 attggaacgc ggattccccg tgccaagagt gacgtaagta ccgcctatag agtctatagg 1020 cccaccccct tggcttctta tgcatgctat actgtttttg gcttggggtc tatacacccc 1080 cgcttcctca tgtttgctgc ccgtgaccag cacgtcaacg attttgtggg cacgggcgac 1140 accgcagtgt agtctgagca gtactcgttg ctgccgcgcg cgccaccaga cataatagct 1200 gacagactaa cagactgttc ctttccatgg gtcttttctg cagtcaccgt cgccgccacc 1260 ggtgaattcc gccaccatgg tcgatggagt gatgatcctg cctgtcctga ttatgattgc 1320 cctgcccagc cccagcatgg aagatgaaaa acctaaagtc aaccctaagc tgtatatgtg 1380 cgtgtgcgag ggcctgagct gcggaaacga ggatcactgc gagggccagc agtgtttcag 1440 ctccctgtcc atcaatgacg gcttccacgt gtaccagaag ggctgctttc aggtgtatga 1500 gcagggcaag atgacctgta agacaccacc ttccccagga caggcagtgg agtgctgtca 1560 gggcgattgg tgtaaccgga atatcaccgc ccagctgcca acaaagggca agtctttccc 1620 cggcacacag aactttcacc tggaagtggg cctgatcatc ctgagcgtgg tgttcgccgt 1680 gtgcctgctg gcatgtctgc tgggagtggc cctgagaaag tttaagcgga gaaaccagga 1740 gcggctgaat ccaagagatg tggagtacgg caccatcgag ggcctgatca ccacaaatgt 1800 gggcgactct acactggccg acctgctgga tcacagctgc accagcggct ccggatctgg 1860 cctgcccttt ctggtgcaga ggaccgtggc ccggcagatc accctgctgg agtgcgtggg 1920 caagggccgg tacggagaag tgtggagagg atcctggcag ggagagaacg tggcagtgaa 1980 gatcttctct agccgggatg agaagtcttg gtttagagag acagagctgt ataacacagt 2040 gatgctgagg cacgagaata tcctgggctt catcgcctcc gacatgacct ctcgccactc 2100 ctctacacag ctgtggctga tcacccacta ccacgagatg ggctccctgt acgattacct 2160 ccagctgacc acactggaca cagtgtcttg cctgcggatc gtgctgtcta tcgccagcgg 2220 cctggcacac ctgcacatcg agatctttgg aacccagggc aagccagcaa tcgcacacag 2280 agatctgaag tctaagaaca tcctggtgaa gaagaatggc cagtgctgta tcgccgatct 2340 gggcctggcc gtgatgcaca gccagtccac caaccagctg gacgtgggca acaatcctcg 2400 ggtgggcaca aagagataca tggccccaga ggtgctggat gagacaatcc aggtggactg 2460 cttcgatagc tataagaggg tggacatctg ggcctttggc ctggtgctgt gggaggtggc 2520 aaggaggatg gtgagcaacg gcatcgtgga ggactacaag ccacccttct atgacgtggt 2580 gcctaatgat ccatcctttg aggacatgcg caaggtggtg tgcgtggatc agcagaggcc 2640 caacatccct aatcgctggt tcagcgaccc caccctgaca tccctggcca agctgatgaa 2700 ggagtgttgg tatcagaatc ctagcgccag gctgaccgcc ctgcgcatca agaaaactct 2760 gactaaaatc gacaatagcc tggataaact gaaaaccgac tgctgacctg aggatccgat 2820 ctttttccct ctgccaaaaa ttatggggac atcatgaagc cccttgagca tctgacttct 2880 ggctaataaa ggaaatttat tttcattgca atagtgtgtt ggaatttttt gtgtctctca 2940 ctcggaagca attcgttgat ctgaatttcg accacccata atacccatta ccctggtaga 3000 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 3060 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3120 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 3180 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 3240 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 3300 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 3360 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 3420 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 3480 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 3540 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 3600 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 3660 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 3720 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3780 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3840 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3900 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3960 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 4020 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 4080 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 4140 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 4200 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 4260 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 4320 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 4380 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 4440 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 4500 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 4560 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 4620 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 4680 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 4740 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4800 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4860 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4920 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4980 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 5040 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 5100 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 5160 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 5220 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 5280 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 5340 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 5400 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 5460 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 5520 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 5580 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 5640 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 5700 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 5760 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5820 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5880 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5940 tatgaccatg attacgccag atttaattaa ggc 5973 <210> 4 <211> 5814 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60 ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120 ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180 ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240 agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300 ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360 tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420 atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480 ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540 gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600 cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660 tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840 aagcgaagcg cgcggcgggc gggagcacca ccgcggtggc ggccctagag tcgatcgagg 900 aactgaaaaa ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc 960 cggatccggt ggtggtgcaa atcaaagaac tgctcctcag tggatgttgc ctttacttct 1020 aggcctgtac ggaagtgtta cttctgctct aaaagctgcg gaattgtacc cgcggccgat 1080 ccaccggtga attccgccac catggtcgat ggagtgatga tcctgcctgt cctgattatg 1140 attgccctgc ccagccccag catggaagat gaaaaaccta aagtcaaccc taagctgtat 1200 atgtgcgtgt gcgagggcct gagctgcgga aacgaggatc actgcgaggg ccagcagtgt 1260 ttcagctccc tgtccatcaa tgacggcttc cacgtgtacc agaagggctg ctttcaggtg 1320 tatgagcagg gcaagatgac ctgtaagaca ccaccttccc caggacaggc agtggagtgc 1380 tgtcagggcg attggtgtaa ccggaatatc accgcccagc tgccaacaaa gggcaagtct 1440 ttccccggca cacagaactt tcacctggaa gtgggcctga tcatcctgag cgtggtgttc 1500 gccgtgtgcc tgctggcatg tctgctggga gtggccctga gaaagtttaa gcggagaaac 1560 caggagcggc tgaatccaag agatgtggag tacggcacca tcgagggcct gatcaccaca 1620 aatgtgggcg actctacact ggccgacctg ctggatcaca gctgcaccag cggctccgga 1680 tctggcctgc cctttctggt gcagaggacc gtggcccggc agatcaccct gctggagtgc 1740 gtgggcaagg gccggtacgg agaagtgtgg agaggatcct ggcagggaga gaacgtggca 1800 gtgaagatct tctctagccg ggatgagaag tcttggttta gagagacaga gctgtataac 1860 acagtgatgc tgaggcacga gaatatcctg ggcttcatcg cctccgacat gacctctcgc 1920 cactcctcta cacagctgtg gctgatcacc cactaccacg agatgggctc cctgtacgat 1980 tacctccagc tgaccacact ggacacagtg tcttgcctgc ggatcgtgct gtctatcgcc 2040 agcggcctgg cacacctgca catcgagatc tttggaaccc agggcaagcc agcaatcgca 2100 cacagagatc tgaagtctaa gaacatcctg gtgaagaaga atggccagtg ctgtatcgcc 2160 gatctgggcc tggccgtgat gcacagccag tccaccaacc agctggacgt gggcaacaat 2220 cctcgggtgg gcacaaagag atacatggcc ccagaggtgc tggatgagac aatccaggtg 2280 gactgcttcg atagctataa gagggtggac atctgggcct ttggcctggt gctgtgggag 2340 gtggcaagga ggatggtgag caacggcatc gtggaggact acaagccacc cttctatgac 2400 gtggtgccta atgatccatc ctttgaggac atgcgcaagg tggtgtgcgt ggatcagcag 2460 aggcccaaca tccctaatcg ctggttcagc gaccccaccc tgacatccct ggccaagctg 2520 atgaaggagt gttggtatca gaatcctagc gccaggctga ccgccctgcg catcaagaaa 2580 actctgacta aaatcgacaa tagcctggat aaactgaaaa ccgactgctg acctgagggc 2640 ggccgcgtcg acggatccga tctttttccc tctgccaaaa attatgggga catcatgaag 2700 ccccttgagc atctgacttc tggctaataa aggaaattta ttttcattgc aatagtgtgt 2760 tggaattttt tgtgtctctc actcggaagc aattcgttga tctgaatttc gaccacccat 2820 aatacccatt accctggtag ataagtagca tggcgggtta atcattaact acaaggaacc 2880 cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2940 accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 3000 cagccttaat taacctaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc 3060 tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag 3120 cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggga 3180 cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc 3240 tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac 3300 gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag 3360 tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc 3420 atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg 3480 actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata 3540 agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa 3600 cgcgaatttt aacaaaatat taacgcttac aatttaggtg gcacttttcg gggaaatgtg 3660 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 3720 caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 3780 ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 3840 gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 3900 gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 3960 atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 4020 caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 4080 gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 4140 accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 4200 ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 4260 gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 4320 acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 4380 atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 4440 ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca 4500 gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 4560 gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 4620 tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 4680 taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 4740 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 4800 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 4860 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 4920 agagcgcaga taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag 4980 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 5040 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 5100 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 5160 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 5220 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 5280 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 5340 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 5400 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 5460 tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 5520 agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc 5580 aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc 5640 gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca 5700 ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa 5760 caatttcaca caggaaacag ctatgaccat gattacgcca gatttaatta aggc 5814 <210> 5 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 5 gtcttttatt tcaggtccca gatctagggc tctgcgtttg ctccaggtag tccgctgctc 60 ccttgggcct gggcccactg acagccctgg tgcctctggc cggctgcaca cctcctggcg 120 ggcagctgtg agtgtaatct ggtgagccac ttgttctggc aatacctgag tggctctgcg 180 gattacactc acggaggcct gccctgactg cccacggtgc cgtggccaaa gaggatctaa 240 gggcaccgct gagggcctac ctaaccatcg tggggaataa ggacagtgtc acccctgcag 300 gggatccggt ggtggtgc 318 <210> 6 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 6 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgagtgt aagctggtga 120 gccacttgtt ctggcaatac ctgagtggct ctgcggctta cactcacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 7 <211> 48 <212> DNA <213> Homo sapiens <400> 7 tcgagggtac aaagaacagt ggctcgccag attacactgt tggagtgc 48 <210> 8 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 8 tcgagggtac aaagaacagt ggctcaccag attacactgt tggagtgc 48 <210> 9 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 tcgagggtgc agaggaccgt ggcccggcag atcaccctgc tggagtgc 48 <210> 10 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgagtgtaat ctggtgagcc 960 acttgttctg gcaatacctg agtggctctg cggattacac tcacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 11 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 11 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgagtgtaag ctggtgagcc 960 acttgttctg gcaatacctg agtggctctg cggcttacac tcacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 12 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 12 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtgtaatc tggtgagcca 960 ctgtgttctg gcaatacctg cagtggctgt ctagattaca ccacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 13 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtgtaagc tggtgagcca 960 ctgtgttctg gcaatacctg cagtggctgt ctagcttaca ccacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 14 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtgtaatct ggtgagccac 960 tgttgttctg gcaatacctg acagtggcag atcagattac acacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 15 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtgtaagct ggtgagccac 960 tgttgttctg gcaatacctg acagtggcag atcagcttac acacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 16 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtaatctg gtgagccact 960 gtttgttctg gcaatacctg aacagtggga cgccagatta ccacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 17 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtaagctg gtgagccact 960 gtttgttctg gcaatacctg aacagtggga cgccagctta ccacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 18 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtaatctgg tgagccactg 960 ttctgttctg gcaatacctg gaacagtgcg ttaccagatt acacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 19 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtaagctgg tgagccactg 960 ttctgttctg gcaatacctg gaacagtgcg ttaccagctt acacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 20 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgaatctggt gagccactgt 960 tcttgttctg gcaatacctg agaacagtcc cccaccagat tcacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 21 <211> 5203 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120 aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180 ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240 aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300 ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360 gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420 cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480 cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540 gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780 ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840 gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900 ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgaagctggt gagccactgt 960 tcttgttctg gcaatacctg agaacagtcc cccaccagct tcacggaggc ctgccctgac 1020 tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080 cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140 actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200 ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260 gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320 gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380 tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440 tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500 tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560 gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620 agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680 actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740 acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800 agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860 agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920 tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980 cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040 gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100 tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160 tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220 taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280 tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340 gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520 cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760 caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880 aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000 aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060 tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120 caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180 ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240 gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300 aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360 ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420 atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480 gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540 gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600 atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660 aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720 actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780 aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840 tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900 ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960 agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020 tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080 aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140 gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200 atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260 gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320 gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380 tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440 accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500 ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560 cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620 agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680 ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740 tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800 ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860 cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920 gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980 tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040 cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100 cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160 tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203 <210> 22 <211> 6290 <212> DNA <213> Homo sapiens <400> 22 agatctgcgc agcaccatgg cctgaaataa cctctgaaag aggaacttgg ttaggtacct 60 tctgaggcgg aaagaaccag ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 120 gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 180 gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 240 caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 300 attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctcgg 360 cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 420 agcttgattc ttctgacaca acagtctcga acttaagctg cagaagttgg tcgtgaggca 480 ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag aaactgggct 540 tgtcgagaca gagaagactc ttgcgtttct gataggcacc tattggtctt actgacatcc 600 actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct taaggctaga 660 gtacttaata cgactcacta taggctagcc accatggctt ccaaggtgta cgaccccgag 720 caacgcaaac gcatgatcac tgggcctcag tggtgggctc gctgcaagca aatgaacgtg 780 ctggactcct tcatcaacta ctatgattcc gagaagcacg ccgagaacgc cgtgattttt 840 ctgcatggta acgctgcctc cagctacctg tggaggcacg tcgtgcctca catcgagccc 900 gtggctagat gcatcatccc tgatctgatc ggaatgggta agtccggcaa gagcgggaat 960 ggctcatatc gcctcctgga tcactacaag tacctcaccg cttggttcga gctgctgaac 1020 cttccaaaga aaatcatctt tgtgggccac gactgggggg cttgtctggc ctttcactac 1080 tcctacgagc accaagacaa gatcaaggcc atcgtccatg ctgagagtgt cgtggacgtg 1140 atcgagtcct gggacgagtg gcctgacatc gaggaggata tcgccctgat caagagcgaa 1200 gagggcgaga aaatggtgct tgagaataac ttcttcgtcg agaccatgct cccaagcaag 1260 atcatgcgga aactggagcc tgaggagttc gctgcctacc tggagccatt caaggagaag 1320 ggcgaggtta gacggcctac cctctcctgg cctcgcgaga tccctctcgt taagggaggc 1380 aagcccgacg tcgtccagat tgtccgcaac tacaacgcct accttcgggc cagcgacgat 1440 ctgcctaaga tgttcatcga gtccgaccct gggttctttt ccaacgctat tgtcgaggga 1500 gctaagaagt tccctaacac cgagttcgtg aaggtgaagg gcctccactt cagccaggag 1560 gacgctccag atgaaatggg taagtacatc aagagcttcg tggagcgcgt gctgaagaac 1620 gagcagtaat tctaggcgat cgctcgaggg tacaaagaac agtggctcgc cagattacac 1680 tgttggagtg cggccgctgg ccgcaataaa atatctttat tttcattaca tctgtgtgtt 1740 ggttttttgt gtgaggatct aaatgagtct tcggacctcg cgggggccgc ttaagcggtg 1800 gttagggttt gtctgacgcg gggggagggg gaaggaacga aacactctca ttcggaggcg 1860 gctcggggtt tggtcttggt ggccacgggc acgcagaaga gcgccgcgat cctcttaagc 1920 acccccccgc cctccgtgga ggcgggggtt tggtcggcgg gtggtaactg gcgggccgct 1980 gactcgggcg ggtcgcgcgc cccagagtgt gaccttttcg gtctgctcgc agacccccgg 2040 gcggcgccgc cgcggcggcg acgggctcgc tgggtcctag gctccatggg gaccgtatac 2100 gtggacaggc tctggagcat ccgcacgact gcggtgatat taccggagac cttctgcggg 2160 acgagccggg tcacgcggct gacgcggagc gtccgttggg cgacaaacac caggacgggg 2220 cacaggtaca ctatcttgtc acccggaggc gcgagggact gcaggagctt cagggagtgg 2280 cgcagctgct tcatccccgt ggcccgttgc tcgcgtttgc tggcggtgtc cccggaagaa 2340 atatatttgc atgtctttag ttctatgatg acacaaaccc cgcccagcgt cttgtcattg 2400 gcgaattcga acacgcagat gcagtcgggg cggcgcggtc ccaggtccac ttcgcatatt 2460 aaggtgacgc gtgtggcctc gaacaccgag cgaccctgca gcgacccgct taaaagcttg 2520 gcattccggt actgttggta aagccaccat ggccgatgct aagaacatta agaagggccc 2580 tgctcccttc taccctctgg aggatggcac cgctggcgag cagctgcaca aggccatgaa 2640 gaggtatgcc ctggtgcctg gcaccattgc cttcaccgat gcccacattg aggtggacat 2700 cacctatgcc gagtacttcg agatgtctgt gcgcctggcc gaggccatga agaggtacgg 2760 cctgaacacc aaccaccgca tcgtggtgtg ctctgagaac tctctgcagt tcttcatgcc 2820 agtgctgggc gccctgttca tcggagtggc cgtggcccct gctaacgaca tttacaacga 2880 gcgcgagctg ctgaacagca tgggcatttc tcagcctacc gtggtgttcg tgtctaagaa 2940 gggcctgcag aagatcctga acgtgcagaa gaagctgcct atcatccaga agatcatcat 3000 catggactct aagaccgact accagggctt ccagagcatg tacacattcg tgacatctca 3060 tctgcctcct ggcttcaacg agtacgactt cgtgccagag tctttcgaca gggacaaaac 3120 cattgccctg atcatgaaca gctctgggtc taccggcctg cctaagggcg tggccctgcc 3180 tcatcgcacc gcctgtgtgc gcttctctca cgcccgcgac cctattttcg gcaaccagat 3240 catccccgac accgctattc tgagcgtggt gccattccac cacggcttcg gcatgttcac 3300 caccctgggc tacctgattt gcggctttcg ggtggtgctg atgtaccgct tcgaggagga 3360 gctgttcctg cgcagcctgc aagactacaa aattcagtct gccctgctgg tgccaaccct 3420 gttcagcttc ttcgctaaga gcaccctgat cgacaagtac gacctgtcta acctgcacga 3480 gattgcctct ggcggcgccc cactgtctaa ggaggtgggc gaagccgtgg ccaagcgctt 3540 tcatctgcca ggcatccgcc agggctacgg cctgaccgag acaaccagcg ccattctgat 3600 taccccagag ggcgacgaca agcctggcgc cgtgggcaag gtggtgccat tcttcgaggc 3660 caaggtggtg gacctggaca ccggcaagac cctgggagtg aaccagcgcg gcgagctgtg 3720 tgtgcgcggc cctatgatta tgtccggcta cgtgaataac cctgaggcca caaacgccct 3780 gatcgacaag gacggctggc tgcactctgg cgacattgcc tactgggacg aggacgagca 3840 cttcttcatc gtggaccgcc tgaagtctct gatcaagtac aagggctacc aggtggcccc 3900 agccgagctg gagtctatcc tgctgcagca ccctaacatt ttcgacgccg gagtggccgg 3960 cctgcccgac gacgatgccg gcgagctgcc tgccgccgtc gtcgtgctgg aacacggcaa 4020 gaccatgacc gagaaggaga tcgtggacta tgtggccagc caggtgacaa ccgccaagaa 4080 gctgcgcggc ggagtggtgt tcgtggacga ggtgcccaag ggcctgaccg gcaagctgga 4140 cgcccgcaag atccgcgaga tcctgatcaa ggctaagaaa ggcggcaaga tcgccgtgta 4200 ataattctag agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga 4260 gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 4320 tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 4380 cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 4440 cctctacaaa tgtggtaaaa tcgataagga tccaggtggc acttttcggg gaaatgtgcg 4500 cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 4560 ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 4620 ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 4680 aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 4740 actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 4800 gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 4860 agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 4920 cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 4980 catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 5040 aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 5100 gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 5160 aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 5220 agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 5280 ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 5340 actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 5400 aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 5460 gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 5520 atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 5580 tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 5640 tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 5700 ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 5760 agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 5820 ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 5880 tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 5940 gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 6000 cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 6060 ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 6120 agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 6180 tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 6240 ctttttacgg ttcctggcct tttgctggcc ttttgctcac atggctcgac 6290 <210> 23 <211> 6290 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 agatctgcgc agcaccatgg cctgaaataa cctctgaaag aggaacttgg ttaggtacct 60 tctgaggcgg aaagaaccag ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 120 gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 180 gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 240 caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 300 attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctcgg 360 cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 420 agcttgattc ttctgacaca acagtctcga acttaagctg cagaagttgg tcgtgaggca 480 ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag aaactgggct 540 tgtcgagaca gagaagactc ttgcgtttct gataggcacc tattggtctt actgacatcc 600 actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct taaggctaga 660 gtacttaata cgactcacta taggctagcc accatggctt ccaaggtgta cgaccccgag 720 caacgcaaac gcatgatcac tgggcctcag tggtgggctc gctgcaagca aatgaacgtg 780 ctggactcct tcatcaacta ctatgattcc gagaagcacg ccgagaacgc cgtgattttt 840 ctgcatggta acgctgcctc cagctacctg tggaggcacg tcgtgcctca catcgagccc 900 gtggctagat gcatcatccc tgatctgatc ggaatgggta agtccggcaa gagcgggaat 960 ggctcatatc gcctcctgga tcactacaag tacctcaccg cttggttcga gctgctgaac 1020 cttccaaaga aaatcatctt tgtgggccac gactgggggg cttgtctggc ctttcactac 1080 tcctacgagc accaagacaa gatcaaggcc atcgtccatg ctgagagtgt cgtggacgtg 1140 atcgagtcct gggacgagtg gcctgacatc gaggaggata tcgccctgat caagagcgaa 1200 gagggcgaga aaatggtgct tgagaataac ttcttcgtcg agaccatgct cccaagcaag 1260 atcatgcgga aactggagcc tgaggagttc gctgcctacc tggagccatt caaggagaag 1320 ggcgaggtta gacggcctac cctctcctgg cctcgcgaga tccctctcgt taagggaggc 1380 aagcccgacg tcgtccagat tgtccgcaac tacaacgcct accttcgggc cagcgacgat 1440 ctgcctaaga tgttcatcga gtccgaccct gggttctttt ccaacgctat tgtcgaggga 1500 gctaagaagt tccctaacac cgagttcgtg aaggtgaagg gcctccactt cagccaggag 1560 gacgctccag atgaaatggg taagtacatc aagagcttcg tggagcgcgt gctgaagaac 1620 gagcagtaat tctaggcgat cgctcgaggg tacaaagaac agtggctcac cagattacac 1680 tgttggagtg cggccgctgg ccgcaataaa atatctttat tttcattaca tctgtgtgtt 1740 ggttttttgt gtgaggatct aaatgagtct tcggacctcg cgggggccgc ttaagcggtg 1800 gttagggttt gtctgacgcg gggggagggg gaaggaacga aacactctca ttcggaggcg 1860 gctcggggtt tggtcttggt ggccacgggc acgcagaaga gcgccgcgat cctcttaagc 1920 acccccccgc cctccgtgga ggcgggggtt tggtcggcgg gtggtaactg gcgggccgct 1980 gactcgggcg ggtcgcgcgc cccagagtgt gaccttttcg gtctgctcgc agacccccgg 2040 gcggcgccgc cgcggcggcg acgggctcgc tgggtcctag gctccatggg gaccgtatac 2100 gtggacaggc tctggagcat ccgcacgact gcggtgatat taccggagac cttctgcggg 2160 acgagccggg tcacgcggct gacgcggagc gtccgttggg cgacaaacac caggacgggg 2220 cacaggtaca ctatcttgtc acccggaggc gcgagggact gcaggagctt cagggagtgg 2280 cgcagctgct tcatccccgt ggcccgttgc tcgcgtttgc tggcggtgtc cccggaagaa 2340 atatatttgc atgtctttag ttctatgatg acacaaaccc cgcccagcgt cttgtcattg 2400 gcgaattcga acacgcagat gcagtcgggg cggcgcggtc ccaggtccac ttcgcatatt 2460 aaggtgacgc gtgtggcctc gaacaccgag cgaccctgca gcgacccgct taaaagcttg 2520 gcattccggt actgttggta aagccaccat ggccgatgct aagaacatta agaagggccc 2580 tgctcccttc taccctctgg aggatggcac cgctggcgag cagctgcaca aggccatgaa 2640 gaggtatgcc ctggtgcctg gcaccattgc cttcaccgat gcccacattg aggtggacat 2700 cacctatgcc gagtacttcg agatgtctgt gcgcctggcc gaggccatga agaggtacgg 2760 cctgaacacc aaccaccgca tcgtggtgtg ctctgagaac tctctgcagt tcttcatgcc 2820 agtgctgggc gccctgttca tcggagtggc cgtggcccct gctaacgaca tttacaacga 2880 gcgcgagctg ctgaacagca tgggcatttc tcagcctacc gtggtgttcg tgtctaagaa 2940 gggcctgcag aagatcctga acgtgcagaa gaagctgcct atcatccaga agatcatcat 3000 catggactct aagaccgact accagggctt ccagagcatg tacacattcg tgacatctca 3060 tctgcctcct ggcttcaacg agtacgactt cgtgccagag tctttcgaca gggacaaaac 3120 cattgccctg atcatgaaca gctctgggtc taccggcctg cctaagggcg tggccctgcc 3180 tcatcgcacc gcctgtgtgc gcttctctca cgcccgcgac cctattttcg gcaaccagat 3240 catccccgac accgctattc tgagcgtggt gccattccac cacggcttcg gcatgttcac 3300 caccctgggc tacctgattt gcggctttcg ggtggtgctg atgtaccgct tcgaggagga 3360 gctgttcctg cgcagcctgc aagactacaa aattcagtct gccctgctgg tgccaaccct 3420 gttcagcttc ttcgctaaga gcaccctgat cgacaagtac gacctgtcta acctgcacga 3480 gattgcctct ggcggcgccc cactgtctaa ggaggtgggc gaagccgtgg ccaagcgctt 3540 tcatctgcca ggcatccgcc agggctacgg cctgaccgag acaaccagcg ccattctgat 3600 taccccagag ggcgacgaca agcctggcgc cgtgggcaag gtggtgccat tcttcgaggc 3660 caaggtggtg gacctggaca ccggcaagac cctgggagtg aaccagcgcg gcgagctgtg 3720 tgtgcgcggc cctatgatta tgtccggcta cgtgaataac cctgaggcca caaacgccct 3780 gatcgacaag gacggctggc tgcactctgg cgacattgcc tactgggacg aggacgagca 3840 cttcttcatc gtggaccgcc tgaagtctct gatcaagtac aagggctacc aggtggcccc 3900 agccgagctg gagtctatcc tgctgcagca ccctaacatt ttcgacgccg gagtggccgg 3960 cctgcccgac gacgatgccg gcgagctgcc tgccgccgtc gtcgtgctgg aacacggcaa 4020 gaccatgacc gagaaggaga tcgtggacta tgtggccagc caggtgacaa ccgccaagaa 4080 gctgcgcggc ggagtggtgt tcgtggacga ggtgcccaag ggcctgaccg gcaagctgga 4140 cgcccgcaag atccgcgaga tcctgatcaa ggctaagaaa ggcggcaaga tcgccgtgta 4200 ataattctag agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga 4260 gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 4320 tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 4380 cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 4440 cctctacaaa tgtggtaaaa tcgataagga tccaggtggc acttttcggg gaaatgtgcg 4500 cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 4560 ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 4620 ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 4680 aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 4740 actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 4800 gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 4860 agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 4920 cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 4980 catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 5040 aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 5100 gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 5160 aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 5220 agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 5280 ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 5340 actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 5400 aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 5460 gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 5520 atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 5580 tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 5640 tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 5700 ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 5760 agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 5820 ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 5880 tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 5940 gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 6000 cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 6060 ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 6120 agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 6180 tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 6240 ctttttacgg ttcctggcct tttgctggcc ttttgctcac atggctcgac 6290 <210> 24 <211> 6290 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 agatctgcgc agcaccatgg cctgaaataa cctctgaaag aggaacttgg ttaggtacct 60 tctgaggcgg aaagaaccag ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 120 gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 180 gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 240 caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 300 attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctcgg 360 cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 420 agcttgattc ttctgacaca acagtctcga acttaagctg cagaagttgg tcgtgaggca 480 ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag aaactgggct 540 tgtcgagaca gagaagactc ttgcgtttct gataggcacc tattggtctt actgacatcc 600 actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct taaggctaga 660 gtacttaata cgactcacta taggctagcc accatggctt ccaaggtgta cgaccccgag 720 caacgcaaac gcatgatcac tgggcctcag tggtgggctc gctgcaagca aatgaacgtg 780 ctggactcct tcatcaacta ctatgattcc gagaagcacg ccgagaacgc cgtgattttt 840 ctgcatggta acgctgcctc cagctacctg tggaggcacg tcgtgcctca catcgagccc 900 gtggctagat gcatcatccc tgatctgatc ggaatgggta agtccggcaa gagcgggaat 960 ggctcatatc gcctcctgga tcactacaag tacctcaccg cttggttcga gctgctgaac 1020 cttccaaaga aaatcatctt tgtgggccac gactgggggg cttgtctggc ctttcactac 1080 tcctacgagc accaagacaa gatcaaggcc atcgtccatg ctgagagtgt cgtggacgtg 1140 atcgagtcct gggacgagtg gcctgacatc gaggaggata tcgccctgat caagagcgaa 1200 gagggcgaga aaatggtgct tgagaataac ttcttcgtcg agaccatgct cccaagcaag 1260 atcatgcgga aactggagcc tgaggagttc gctgcctacc tggagccatt caaggagaag 1320 ggcgaggtta gacggcctac cctctcctgg cctcgcgaga tccctctcgt taagggaggc 1380 aagcccgacg tcgtccagat tgtccgcaac tacaacgcct accttcgggc cagcgacgat 1440 ctgcctaaga tgttcatcga gtccgaccct gggttctttt ccaacgctat tgtcgaggga 1500 gctaagaagt tccctaacac cgagttcgtg aaggtgaagg gcctccactt cagccaggag 1560 gacgctccag atgaaatggg taagtacatc aagagcttcg tggagcgcgt gctgaagaac 1620 gagcagtaat tctaggcgat cgctcgaggg tgcagaggac cgtggcccgg cagatcaccc 1680 tgctggagtg cggccgctgg ccgcaataaa atatctttat tttcattaca tctgtgtgtt 1740 ggttttttgt gtgaggatct aaatgagtct tcggacctcg cgggggccgc ttaagcggtg 1800 gttagggttt gtctgacgcg gggggagggg gaaggaacga aacactctca ttcggaggcg 1860 gctcggggtt tggtcttggt ggccacgggc acgcagaaga gcgccgcgat cctcttaagc 1920 acccccccgc cctccgtgga ggcgggggtt tggtcggcgg gtggtaactg gcgggccgct 1980 gactcgggcg ggtcgcgcgc cccagagtgt gaccttttcg gtctgctcgc agacccccgg 2040 gcggcgccgc cgcggcggcg acgggctcgc tgggtcctag gctccatggg gaccgtatac 2100 gtggacaggc tctggagcat ccgcacgact gcggtgatat taccggagac cttctgcggg 2160 acgagccggg tcacgcggct gacgcggagc gtccgttggg cgacaaacac caggacgggg 2220 cacaggtaca ctatcttgtc acccggaggc gcgagggact gcaggagctt cagggagtgg 2280 cgcagctgct tcatccccgt ggcccgttgc tcgcgtttgc tggcggtgtc cccggaagaa 2340 atatatttgc atgtctttag ttctatgatg acacaaaccc cgcccagcgt cttgtcattg 2400 gcgaattcga acacgcagat gcagtcgggg cggcgcggtc ccaggtccac ttcgcatatt 2460 aaggtgacgc gtgtggcctc gaacaccgag cgaccctgca gcgacccgct taaaagcttg 2520 gcattccggt actgttggta aagccaccat ggccgatgct aagaacatta agaagggccc 2580 tgctcccttc taccctctgg aggatggcac cgctggcgag cagctgcaca aggccatgaa 2640 gaggtatgcc ctggtgcctg gcaccattgc cttcaccgat gcccacattg aggtggacat 2700 cacctatgcc gagtacttcg agatgtctgt gcgcctggcc gaggccatga agaggtacgg 2760 cctgaacacc aaccaccgca tcgtggtgtg ctctgagaac tctctgcagt tcttcatgcc 2820 agtgctgggc gccctgttca tcggagtggc cgtggcccct gctaacgaca tttacaacga 2880 gcgcgagctg ctgaacagca tgggcatttc tcagcctacc gtggtgttcg tgtctaagaa 2940 gggcctgcag aagatcctga acgtgcagaa gaagctgcct atcatccaga agatcatcat 3000 catggactct aagaccgact accagggctt ccagagcatg tacacattcg tgacatctca 3060 tctgcctcct ggcttcaacg agtacgactt cgtgccagag tctttcgaca gggacaaaac 3120 cattgccctg atcatgaaca gctctgggtc taccggcctg cctaagggcg tggccctgcc 3180 tcatcgcacc gcctgtgtgc gcttctctca cgcccgcgac cctattttcg gcaaccagat 3240 catccccgac accgctattc tgagcgtggt gccattccac cacggcttcg gcatgttcac 3300 caccctgggc tacctgattt gcggctttcg ggtggtgctg atgtaccgct tcgaggagga 3360 gctgttcctg cgcagcctgc aagactacaa aattcagtct gccctgctgg tgccaaccct 3420 gttcagcttc ttcgctaaga gcaccctgat cgacaagtac gacctgtcta acctgcacga 3480 gattgcctct ggcggcgccc cactgtctaa ggaggtgggc gaagccgtgg ccaagcgctt 3540 tcatctgcca ggcatccgcc agggctacgg cctgaccgag acaaccagcg ccattctgat 3600 taccccagag ggcgacgaca agcctggcgc cgtgggcaag gtggtgccat tcttcgaggc 3660 caaggtggtg gacctggaca ccggcaagac cctgggagtg aaccagcgcg gcgagctgtg 3720 tgtgcgcggc cctatgatta tgtccggcta cgtgaataac cctgaggcca caaacgccct 3780 gatcgacaag gacggctggc tgcactctgg cgacattgcc tactgggacg aggacgagca 3840 cttcttcatc gtggaccgcc tgaagtctct gatcaagtac aagggctacc aggtggcccc 3900 agccgagctg gagtctatcc tgctgcagca ccctaacatt ttcgacgccg gagtggccgg 3960 cctgcccgac gacgatgccg gcgagctgcc tgccgccgtc gtcgtgctgg aacacggcaa 4020 gaccatgacc gagaaggaga tcgtggacta tgtggccagc caggtgacaa ccgccaagaa 4080 gctgcgcggc ggagtggtgt tcgtggacga ggtgcccaag ggcctgaccg gcaagctgga 4140 cgcccgcaag atccgcgaga tcctgatcaa ggctaagaaa ggcggcaaga tcgccgtgta 4200 ataattctag agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga 4260 gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 4320 tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 4380 cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 4440 cctctacaaa tgtggtaaaa tcgataagga tccaggtggc acttttcggg gaaatgtgcg 4500 cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 4560 ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 4620 ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 4680 aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 4740 actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 4800 gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 4860 agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 4920 cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 4980 catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 5040 aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 5100 gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 5160 aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 5220 agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 5280 ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 5340 actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 5400 aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 5460 gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 5520 atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 5580 tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 5640 tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 5700 ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 5760 agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 5820 ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 5880 tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 5940 gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 6000 cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 6060 ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 6120 agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 6180 tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 6240 ctttttacgg ttcctggcct tttgctggcc ttttgctcac atggctcgac 6290 <210> 25 <211> 6091 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 25 cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60 ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120 ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180 ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240 agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300 ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360 tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420 atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480 ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540 gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600 cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660 tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840 aagcgaagcg cgcggcgggc gggagcacca ccgcggtggc ggccctagag tcgatcgagg 900 aactgaaaaa ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc 960 cagatctagg gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac 1020 tgacagccct ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtgtaatct 1080 ggtgagccac tgttgttctg gcaatacctg acagtggcag atcagattac acacggaggc 1140 ctgccctgac tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct 1200 acctaaccat cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc 1260 aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt 1320 tacttctgct ctaaaagctg cggaattgta cccgcggccg atccaccggt gaattccgcc 1380 accatggtcg atggagtgat gatcctgcct gtcctgatta tgattgccct gcccagcccc 1440 agcatggaag atgaaaaacc taaagtcaac cctaagctgt atatgtgcgt gtgcgagggc 1500 ctgagctgcg gaaacgagga tcactgcgag ggccagcagt gtttcagctc cctgtccatc 1560 aatgacggct tccacgtgta ccagaagggc tgctttcagg tgtatgagca gggcaagatg 1620 acctgtaaga caccaccttc cccaggacag gcagtggagt gctgtcaggg cgattggtgt 1680 aaccggaata tcaccgccca gctgccaaca aagggcaagt ctttccccgg cacacagaac 1740 tttcacctgg aagtgggcct gatcatcctg agcgtggtgt tcgccgtgtg cctgctggca 1800 tgtctgctgg gagtggccct gagaaagttt aagcggagaa accaggagcg gctgaatcca 1860 agagatgtgg agtacggcac catcgagggc ctgatcacca caaatgtggg cgactctaca 1920 ctggccgacc tgctggatca cagctgcacc agcggctccg gatctggcct gccctttctg 1980 gtgcagagga ccgtggcccg gcagatcacc ctgctggagt gcgtgggcaa gggccggtac 2040 ggagaagtgt ggagaggatc ctggcaggga gagaacgtgg cagtgaagat cttctctagc 2100 cgggatgaga agtcttggtt tagagagaca gagctgtata acacagtgat gctgaggcac 2160 gagaatatcc tgggcttcat cgcctccgac atgacctctc gccactcctc tacacagctg 2220 tggctgatca cccactacca cgagatgggc tccctgtacg attacctcca gctgaccaca 2280 ctggacacag tgtcttgcct gcggatcgtg ctgtctatcg ccagcggcct ggcacacctg 2340 cacatcgaga tctttggaac ccagggcaag ccagcaatcg cacacactga agtctaagaa 2400 catcctggtg aagaagaatg gccagtgctg tatcgccgat ctgggcctgg ccgtgatgca 2460 cagccagtcc accaaccagc tggacgtggg caacaatcct cgggtgggca caaagagata 2520 catggcccca gaggtgctgg atgagacaat ccaggtggac tgcttcgata gctataagag 2580 ggtggacatc tgggcctttg gcctggtgct gtgggaggtg gcaaggagga tggtgagcaa 2640 cggcatcgtg gaggactaca agccaccctt ctatgacgtg gtgcctaatg atccatcctt 2700 tgaggacatg cgcaaggtgg tgtgcgtgga tcagcagagg cccaacatcc ctaatcgctg 2760 gttcagcgac cccaccctga catccctggc caagctgatg aaggagtgtt ggtatcagaa 2820 tcctagcgcc aggctgaccg ccctgcgcat caagaaaact ctgactaaaa tcgacaatag 2880 cctggataaa ctgaaaaccg actgctgacc tgagggcggc cgcgtcgacg gatccgatct 2940 ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg 3000 ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact 3060 cggaagcaat tcgttgatct gaatttcgac cacccataat acccattacc ctggtagata 3120 agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc 3180 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3240 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ccttaattaa cctaattcac 3300 tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 3360 ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 3420 cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa 3480 gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 3540 ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 3600 ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 3660 aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 3720 gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 3780 cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 3840 attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 3900 cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 3960 tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 4020 ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 4080 ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 4140 tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 4200 gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 4260 gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 4320 acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 4380 tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 4440 caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 4500 gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 4560 cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 4620 tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 4680 agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 4740 tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 4800 ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 4860 acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 4920 ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 4980 gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 5040 gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 5100 ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 5160 gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 5220 tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 5280 cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 5340 cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 5400 ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 5460 tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 5520 cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 5580 ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 5640 aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 5700 ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 5760 tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 5820 gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 5880 gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg 5940 caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct 6000 tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta 6060 tgaccatgat tacgccagat ttaattaagg c 6091 <210> 26 <211> 6095 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60 ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120 ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180 ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240 agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300 ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360 tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420 atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480 ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540 gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600 cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660 tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840 aagcgaagcg cgcggcgggc gggagcacca ccgcggtggc ggccctagag tcgatcgagg 900 aactgaaaaa ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc 960 cagatctagg gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac 1020 tgacagccct ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtaatctg 1080 gtgagccact gtttgttctg gcaatacctg aacagtgggc gccagattac cacggaggcc 1140 tgccctgact gcccacggtg ccgtggccaa agaggatcta agggcaccgc tgagggccta 1200 cctaaccatc gtggggaata aggacagtgt cacccctgca ggggatccgg tggtggtgca 1260 aatcaaagaa ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt 1320 acttctgctc taaaagctgc ggaattgtac ccgcggccga tccaccggtg aattccgcca 1380 ccatggtcga tggagtgatg atcctgcctg tcctgattat gattgccctg cccagcccca 1440 gcatggaaga tgaaaaacct aaagtcaacc ctaagctgta tatgtgcgtg tgcgagggcc 1500 tgagctgcgg aaacgaggat cactgcgagg gccagcagtg tttcagctcc ctgtccatca 1560 atgacggctt ccacgtgtac cagaagggct gctttcaggt gtatgagcag ggcaagatga 1620 cctgtaagac accaccttcc ccaggacagg cagtggagtg ctgtcagggc gattggtgta 1680 accggaatat caccgcccag ctgccaacaa agggcaagtc tttccccggc acacagaact 1740 ttcacctgga agtgggcctg atcatcctga gcgtggtgtt cgccgtgtgc ctgctggcat 1800 gtctgctggg agtggccctg agaaagttta agcggagaaa ccaggagcgg ctgaatccaa 1860 gagatgtgga gtacggcacc atcgagggcc tgatcaccac aaatgtgggc gactctacac 1920 tggccgacct gctggatcac agctgcacca gcggctccgg atctggcctg ccctttctgg 1980 tgcagaggac cgtggcccgg cagatcaccc tgctggagtg cgtgggcaag ggccggtacg 2040 gagaagtgtg gagaggatcc tggcagggag agaacgtggc agtgaagatc ttctctagcc 2100 gggatgagaa gtcttggttt agagagacag agctgtataa cacagtgatg ctgaggcacg 2160 agaatatcct gggcttcatc gcctccgaca tgacctctcg ccactcctct acacagctgt 2220 ggctgatcac ccactaccac gagatgggct ccctgtacga ttacctccag ctgaccacac 2280 tggacacagt gtcttgcctg cggatcgtgc tgtctatcgc cagcggcctg gcacacctgc 2340 acatcgagat ctttggaacc cagggcaagc cagcaatcgc acacagagat ctgaagtcta 2400 agaacatcct ggtgaagaag aatggccagt gctgtatcgc cgatctgggc ctggccgtga 2460 tgcacagcca gtccaccaac cagctggacg tgggcaacaa tcctcgggtg ggcacaaaga 2520 gatacatggc cccagaggtg ctggatgaga caatccaggt ggactgcttc gatagctata 2580 agagggtgga catctgggcc tttggcctgg tgctgtggga ggtggcaagg aggatggtga 2640 gcaacggcat cgtggaggac tacaagccac ccttctatga cgtggtgcct aatgatccat 2700 cctttgagga catgcgcaag gtggtgtgcg tggatcagca gaggcccaac atccctaatc 2760 gctggttcag cgaccccacc ctgacatccc tggccaagct gatgaaggag tgttggtatc 2820 agaatcctag cgccaggctg accgccctgc gcatcaagaa aactctgact aaaatcgaca 2880 atagcctgga taaactgaaa accgactgct gacctgaggg cggccgcgtc gacggatccg 2940 atctttttcc ctctgccaaa aattatgggg acatcatgaa gccccttgag catctgactt 3000 ctggctaata aaggaaattt attttcattg caatagtgtg ttggaatttt ttgtgtctct 3060 cactcggaag caattcgttg atctgaattt cgaccaccca taatacccat taccctggta 3120 gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc 3180 actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 3240 ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagccttaa ttaacctaat 3300 tcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat 3360 cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat 3420 cgcccttccc aacagttgcg cagcctgaat ggcgaatggg acgcgccctg tagcggcgca 3480 ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 3540 gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 3600 caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 3660 cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg atagacggtt 3720 tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 3780 acaacactca accctatctc ggtctattct tttgatttat aagggatttt gccgatttcg 3840 gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 3900 ttaacgctta caatttaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt 3960 tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc 4020 ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc 4080 ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa 4140 aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg 4200 gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag 4260 ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc 4320 gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta 4380 cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg 4440 cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca 4500 acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac 4560 caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat 4620 taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg 4680 ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata 4740 aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta 4800 agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa 4860 atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag 4920 tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg 4980 tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact 5040 gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg 5100 taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc 5160 aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata 5220 ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta 5280 catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc 5340 ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg 5400 ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac 5460 agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg 5520 taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt 5580 atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct 5640 cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg 5700 ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata 5760 accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca 5820 gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc 5880 gttggccgat tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg 5940 agcgcaacgc aattaatgtg agttagctca ctcattaggc accccaggct ttacacttta 6000 tgcttccggc tcgtatgttg tgtggaattg tgagcggata acaatttcac acaggaaaca 6060 gctatgacca tgattacgcc agatttaatt aaggc 6095 <210> 27 <211> 6246 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60 ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120 ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180 ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240 agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300 ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360 tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420 atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480 ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540 gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600 cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660 tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840 aagcgaagcg cgcggcgggc gggagcaagc tttcagatcg cctggagacg ccatccacgc 900 tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggccg ggaacggtgc 960 attggaacgc ggattccccg tgccaagagt gacgtaagta ccgcctatag agtctatagg 1020 cccaccccct tggcttctta tgcatgctat actgtttttg gcttggggtc tatacacccc 1080 cgcttcctca tgtttgctgc ccgtgaccag cacgtcaacg attttgtggg cacgggcgac 1140 accgcagtgt agtctgagca gtactcgttg ctgccgcgcg cgccaccaga cataatagct 1200 gacagactaa cagactgttc ctttccatgg gtcttttctg caagggctct gcgtttgctc 1260 caggtagtcc gctgctccct tgggcctggg cccactgaca gccctggtgc ctctggccgg 1320 ctgcacacct cctggcgggc agctgtgtgt aatctggtga gccactgttg ttctggcaat 1380 acctgacagt ggcagatcag attacacacg gaggcctgcc ctgactgccc acggtgccgt 1440 ggccaaagag gatctaaggg caccgctgag ggcctaccta accatcgtgg ggaataagga 1500 cagtgtcacc ctgcagtcac cgtcgccgcc accggtgaat tccgccacca tggtcgatgg 1560 agtgatgatc ctgcctgtcc tgattatgat tgccctgccc agccccagca tggaagatga 1620 aaaacctaaa gtcaacccta agctgtatat gtgcgtgtgc gagggcctga gctgcggaaa 1680 cgaggatcac tgcgagggcc agcagtgttt cagctccctg tccatcaatg acggcttcca 1740 cgtgtaccag aagggctgct ttcaggtgta tgagcagggc aagatgacct gtaagacacc 1800 accttcccca ggacaggcag tggagtgctg tcagggcgat tggtgtaacc ggaatatcac 1860 cgcccagctg ccaacaaagg gcaagtcttt ccccggcaca cagaactttc acctggaagt 1920 gggcctgatc atcctgagcg tggtgttcgc cgtgtgcctg ctggcatgtc tgctgggagt 1980 ggccctgaga aagtttaagc ggagaaacca ggagcggctg aatccaagag atgtggagta 2040 cggcaccatc gagggcctga tcaccacaaa tgtgggcgac tctacactgg ccgacctgct 2100 ggatcacagc tgcaccagcg gctccggatc tggcctgccc tttctggtgc agaggaccgt 2160 ggcccggcag atcaccctgc tggagtgcgt gggcaagggc cggtacggag aagtgtggag 2220 aggatcctgg cagggagaga acgtggcagt gaagatcttc tctagccggg atgagaagtc 2280 ttggtttaga gagacagagc tgtataacac agtgatgctg aggcacgaga atatcctggg 2340 cttcatcgcc tccgacatga cctctcgcca ctcctctaca cagctgtggc tgatcaccca 2400 ctaccacgag atgggctccc tgtacgatta cctccagctg accacactgg acacagtgtc 2460 ttgcctgcgg atcgtgctgt ctatcgccag cggcctggca cacctgcaca tcgagatctt 2520 tggaacccag ggcaagccag caatcgcaca cagagatctg aagtctaaga acatcctggt 2580 gaagaagaat ggccagtgct gtatcgccga tctgggcctg gccgtgatgc acagccagtc 2640 caccaaccag ctggacgtgg gcaacaatcc tcgggtgggc acaaagagat acatggcccc 2700 agaggtgctg gatgagacaa tccaggtgga ctgcttcgat agctataaga gggtggacat 2760 ctgggccttt ggcctggtgc tgtgggaggt ggcaaggagg atggtgagca acggcatcgt 2820 ggaggactac aagccaccct tctatgacgt ggtgcctaat gatccatcct ttgaggacat 2880 gcgcaaggtg gtgtgcgtgg atcagcagag gcccaacatc cctaatcgct ggttcagcga 2940 ccccaccctg acatccctgg ccaagctgat gaaggagtgt tggtatcaga atcctagcgc 3000 caggctgacc gccctgcgca tcaagaaaac tctgactaaa atcgacaata gcctggataa 3060 actgaaaacc gactgctgac ctgaggatcc gatctttttc cctctgccaa aaattatggg 3120 gacatcatga agccccttga gcatctgact tctggctaat aaaggaaatt tattttcatt 3180 gcaatagtgt gttggaattt tttgtgtctc tcactcggaa gcaattcgtt gatctgaatt 3240 tcgaccaccc ataataccca ttaccctggt agataagtag catggcgggt taatcattaa 3300 ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 3360 tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 3420 cgagcgagcg cgcagcctta attaacctaa ttcactggcc gtcgttttac aacgtcgtga 3480 ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 3540 ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 3600 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 3660 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 3720 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 3780 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 3840 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 3900 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 3960 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 4020 acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttagg tggcactttt 4080 cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 4140 ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 4200 agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 4260 tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 4320 gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 4380 gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 4440 attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 4500 gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 4560 agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 4620 ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 4680 cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 4740 gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4800 cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4860 gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4920 ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4980 acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 5040 ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 5100 aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc 5160 aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 5220 ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 5280 ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 5340 actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 5400 caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 5460 gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 5520 ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 5580 cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 5640 cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 5700 acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 5760 ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 5820 gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 5880 tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat 5940 accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag 6000 cgcccaatac gcaaaccgcc tctccccgcg cgttggccga ttcattaatg cagctggcac 6060 gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt gagttagctc 6120 actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt 6180 gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc cagatttaat 6240 taaggc 6246 <210> 28 <211> 6246 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60 ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120 ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180 ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240 agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300 ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360 tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420 atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480 ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540 gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600 cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660 tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720 gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780 agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840 aagcgaagcg cgcggcgggc gggagcaagc tttcagatcg cctggagacg ccatccacgc 900 tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggccg ggaacggtgc 960 attggaacgc ggattccccg tgccaagagt gacgtaagta ccgcctatag agtctatagg 1020 cccaccccct tggcttctta tgcatgctat actgtttttg gcttggggtc tatacacccc 1080 cgcttcctca tgtttgctgc ccgtgaccag cacgtcaacg attttgtggg cacgggcgac 1140 accgcagtgt agtctgagca gtactcgttg ctgccgcgcg cgccaccaga cataatagct 1200 gacagactaa cagactgttc ctttccatgg gtcttttctg caagggctct gcgtttgctc 1260 caggtagtcc gctgctccct tgggcctggg cccactgaca gccctggtgc ctctggccgg 1320 ctgcacacct cctggcgggc agctgtggta atctggtgag ccactgtttg ttctggcaat 1380 acctgaacag tgggacgcca gattaccacg gaggcctgcc ctgactgccc acggtgccgt 1440 ggccaaagag gatctaaggg caccgctgag ggcctaccta accatcgtgg ggaataagga 1500 cagtgtcacc ctgcagtcac cgtcgccgcc accggtgaat tccgccacca tggtcgatgg 1560 agtgatgatc ctgcctgtcc tgattatgat tgccctgccc agccccagca tggaagatga 1620 aaaacctaaa gtcaacccta agctgtatat gtgcgtgtgc gagggcctga gctgcggaaa 1680 cgaggatcac tgcgagggcc agcagtgttt cagctccctg tccatcaatg acggcttcca 1740 cgtgtaccag aagggctgct ttcaggtgta tgagcagggc aagatgacct gtaagacacc 1800 accttcccca ggacaggcag tggagtgctg tcagggcgat tggtgtaacc ggaatatcac 1860 cgcccagctg ccaacaaagg gcaagtcttt ccccggcaca cagaactttc acctggaagt 1920 gggcctgatc atcctgagcg tggtgttcgc cgtgtgcctg ctggcatgtc tgctgggagt 1980 ggccctgaga aagtttaagc ggagaaacca ggagcggctg aatccaagag atgtggagta 2040 cggcaccatc gagggcctga tcaccacaaa tgtgggcgac tctacactgg ccgacctgct 2100 ggatcacagc tgcaccagcg gctccggatc tggcctgccc tttctggtgc agaggaccgt 2160 ggcccggcag atcaccctgc tggagtgcgt gggcaagggc cggtacggag aagtgtggag 2220 aggatcctgg cagggagaga acgtggcagt gaagatcttc tctagccggg atgagaagtc 2280 ttggtttaga gagacagagc tgtataacac agtgatgctg aggcacgaga atatcctggg 2340 cttcatcgcc tccgacatga cctctcgcca ctcctctaca cagctgtggc tgatcaccca 2400 ctaccacgag atgggctccc tgtacgatta cctccagctg accacactgg acacagtgtc 2460 ttgcctgcgg atcgtgctgt ctatcgccag cggcctggca cacctgcaca tcgagatctt 2520 tggaacccag ggcaagccag caatcgcaca cagagatctg aagtctaaga acatcctggt 2580 gaagaagaat ggccagtgct gtatcgccga tctgggcctg gccgtgatgc acagccagtc 2640 caccaaccag ctggacgtgg gcaacaatcc tcgggtgggc acaaagagat acatggcccc 2700 agaggtgctg gatgagacaa tccaggtgga ctgcttcgat agctataaga gggtggacat 2760 ctgggccttt ggcctggtgc tgtgggaggt ggcaaggagg atggtgagca acggcatcgt 2820 ggaggactac aagccaccct tctatgacgt ggtgcctaat gatccatcct ttgaggacat 2880 gcgcaaggtg gtgtgcgtgg atcagcagag gcccaacatc cctaatcgct ggttcagcga 2940 ccccaccctg acatccctgg ccaagctgat gaaggagtgt tggtatcaga atcctagcgc 3000 caggctgacc gccctgcgca tcaagaaaac tctgactaaa atcgacaata gcctggataa 3060 actgaaaacc gactgctgac ctgaggatcc gatctttttc cctctgccaa aaattatggg 3120 gacatcatga agccccttga gcatctgact tctggctaat aaaggaaatt tattttcatt 3180 gcaatagtgt gttggaattt tttgtgtctc tcactcggaa gcaattcgtt gatctgaatt 3240 tcgaccaccc ataataccca ttaccctggt agataagtag catggcgggt taatcattaa 3300 ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 3360 tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 3420 cgagcgagcg cgcagcctta attaacctaa ttcactggcc gtcgttttac aacgtcgtga 3480 ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 3540 ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 3600 tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 3660 cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 3720 ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 3780 gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 3840 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 3900 ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 3960 ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 4020 acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttagg tggcactttt 4080 cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 4140 ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 4200 agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 4260 tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 4320 gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 4380 gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 4440 attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 4500 gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 4560 agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 4620 ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 4680 cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 4740 gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4800 cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4860 gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4920 ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4980 acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 5040 ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 5100 aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc 5160 aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 5220 ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 5280 ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 5340 actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 5400 caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 5460 gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 5520 ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 5580 cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 5640 cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 5700 acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 5760 ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 5820 gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 5880 tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat 5940 accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag 6000 cgcccaatac gcaaaccgcc tctccccgcg cgttggccga ttcattaatg cagctggcac 6060 gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt gagttagctc 6120 actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt 6180 gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc cagatttaat 6240 taaggc 6246 <210> 29 <211> 7380 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 ccaactccat cactaggggt tcctgcggcc gcaaggtcgg gcaggaagag ggcctatttc 60 ccatgattcc ttcatatttg catatacgat acaaggctgt tagagagata attagaatta 120 atttgactgt aaacacaaag atattagtac aaaatacgtg acgtagaaag taataatttc 180 ttgggtagtt tgcagtttta aaattatgtt ttaaaatgga ctatcatatg cttaccgtaa 240 cttgaaagta tttcgatttc ttggctttat atatcttgtg gaaaggacga aacaccggct 300 caccagatta cactgtgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 360 atcaacttga aaaagtggca ccgagtcggt gctttttttc tcgagccata gagcccaccg 420 catccccagc atgcctgcta ttgtcttccc aatcctcccc cttgctgtcc tgccccaccc 480 caccccccag aatagaatga cacctactca gacaatgcga tgcaatttcc tcattttatt 540 aggaaaggac agtgggagtg gcaccttcca gggtcaagga aggcacgggg gaggggcaaa 600 caacagatgg ctggcaacta gaaggcacag tcgcaccacg gaattgtcag tgcccaacag 660 ccgagcccct gtccagcagc gggcaaggca ggcggcgatg agttccgccg tggcaagaac 720 taaccaggat ttatacaagg aggagaaaat gaaagccata cgggaagcaa tagcatgata 780 caaaggcatt aaagcagcgt atccacatag cgtaaaagga gcaacatagt taagaatacc 840 agtcaatctt tcacaaattt tgtaatccag aggttgatta tcagatctta gactttcctc 900 ttcttcttgg gctcgaattc gctgccgtcg gcggttcttt ttgagccgcc agagtcacct 960 cccagctgag acaggtcgat ccgtgtctcg tacaggccgg tgatgctctg gtggatcagg 1020 gtggcgtcca gcacctcttt ggtgctggtg tacctcttcc ggtcgatggt ggtgtcaaag 1080 tacttgaagg cggcaggggc tcccagattg gtcagggtaa acaggtggat gatattctcg 1140 gcctgctctc tgatgggctt atcccggtgc ttgttgtagg cggacagcac tttgtccaga 1200 ttagcgtcgg ccaggatcac tctcttggag aactcgctga tctgctcgat gatctcgtcc 1260 aggtagtgct tgtgctgttc cacaaacagc tgtttctgct cattatcctc gggggagccc 1320 ttcagcttct catagtggct ggccaggtac aggaagttca catatttgga gggcagggcc 1380 agttcgtttc ccttctgcag ttcgccggca gaggccagca ttctcttccg gccgttttcc 1440 agctcgaaca gggagtactt aggcagcttg atgatcaggt cctttttcac ttctttgtag 1500 cccttggctt ccagaaagtc gatgggattc ttctcgaagc tgcttctttc catgatggtg 1560 atccccagca gctctttcac actcttcagt ttcttggact tgcccttttc cactttggcc 1620 accaccagca cagaataggc cacggtgggg ctgtcgaagc cgccgtactt cttagggtcc 1680 cagtccttct ttctggcgat cagcttatcg ctgttcctct tgggcaggat agactctttg 1740 ctgaagccgc ctgtctgcac ctcggtcttt ttcacgatat tcacttgggg catgctcagc 1800 actttccgca cggtggcaaa atcccggccc ttatcccaca cgatctcccc ggtttcgccg 1860 tttgtctcga tcagaggccg cttccggatc tcgccgttgg ccagggtaat ctcggtcttg 1920 aaaaagttca tgatgttgct gtagaagaag tacttggcgg tagccttgcc gatttcctgc 1980 tcgctcttgg cgatcatctt ccgcacgtcg tacaccttgt agtcgccgta cacgaactcg 2040 ctttccagct tagggtactt tttgatcagg gcggttccca cgacggcgtt caggtaggcg 2100 tcgtgggcgt ggtggtagtt gttgatctcg cgcactttgt aaaactggaa atccttccgg 2160 aaatcggaca ccagcttgga cttcagggtg atcactttca cttcccggat cagcttgtca 2220 ttctcgtcgt acttagtgtt catccgggag tccaggatct gtgccacgtg ctttgtgatc 2280 tgccgggttt ccaccagctg tctcttgatg aagccggcct tatccagttc gctcaggccg 2340 cctctctcgg ccttggtcag attgtcgaac tttctctggg taatcagctt ggcgttcagc 2400 agctgccgcc agtagttctt catcttcttc acgacctctt cggagggcac gttgtcgctc 2460 ttgccccggt tcttgtcgct tctggtcagc accttgttgt cgatggagtc gtccttcaga 2520 aagctctgag gcacgatatg gtccacatcg tagtcggaca gccggttgat gtccagttcc 2580 tggtccacgt acatatcccg cccattctgc aggtagtaca ggtacagctt ctcgttctgc 2640 agctgggtgt tttccacggg gtgttctttc aggatctggc tgcccagctc tttgatgccc 2700 tcttcgatcc gcttcattct ctcgcggctg ttcttctgtc ccttctgggt ggtctggttc 2760 tctctggcca tttcgatcac gatgttctcg ggcttgtgcc ggcccatcac tttcacgagc 2820 tcgtccacca ccttcactgt ctgcaggatg cccttcttaa tggcggggct gccggccaga 2880 ttggcaatgt gctcgtgcag gctatcgccc tggccggaca cctgggcttt ctggatgtcc 2940 tctttaaagg tcaggctgtc gtcgtggatc agctgcatga agtttctgtt ggcgaagccg 3000 tcggacttca ggaaatccag gattgtcttg ccggactgct tgtcccggat gccgttgatc 3060 agcttccggc tcagcctgcc ccagccggtg tatctccgcc gcttcagctg cttcatcact 3120 ttgtcgtcga acaggtgggc ataggttttc agccgttcct cgatcatctc tctgtcctca 3180 aacagtgtca gggtcagcac gatatcttcc agaatgtcct cgttttcctc attgtccagg 3240 aagtccttgt ccttgataat tttcagcaga tcgtggtatg tgcccaggga ggcgttgaac 3300 cgatcttcca cgccggagat ttccacggag tcgaagcaat tgctggcgat aaagccattc 3360 ttcagggcga agttgtgatc ccgctccacg ccgatgtcgt acacgttctg ctttcccagg 3420 tatttccgtg tagcaatctt gatgactttc cgcttcttct ttggtgactc gaactcgctt 3480 ccgtcggctg tccgtttcat ggtggcaccg gtccaacctg aaaaaaagtg atttcaggca 3540 ggtgctccag gtaattaaac attaataccc caccaaccaa ccatccctta aacccttacc 3600 tcttgctcag ctaattacag cccggaggag aagggccgtc ccgcccgctc acctgtggga 3660 gtaacgcggt cagtcagagc cggggcgggc ggcgcgaggc ggcggcggag cggggcacgg 3720 ggcgaaggca gcgtcgcagc gactcccgcc cgccgcgcgc ttcgcttttt atagggccgc 3780 cgccgccgcc gcctcgccat aaaaggaaac tttcggagcg cgccgctctg attggctgcc 3840 gccgcacctc tccgcctcgc cccgccccgc ccctcgcccc gccccgcccc gcctggcgcg 3900 cgcccccccc ccccccccgc ccccatcgct gcacaaaata attaaaaaat aaataaatac 3960 aaaattgggg gtggggaggg gggggagatg gggagagtga agcagaacgt ggggctcacc 4020 tcgaccatgg taatagcgat gactaatacg tagatgtact gccaagtagg aaagtcccat 4080 aaggtcatgt actgggcaca atgccaggcg ggccatttac cgtcattgac gtcaataggg 4140 ggcgtacttg gcatatgata cacttgatgt actgccaagt gggcagttta ccgtaaatac 4200 tccacccatt gacgtcaatg gaaagtccct attggcgtta ctattgacgt caatgggcgg 4260 gggtcgttgg gcggtcagcc aggcgggcca tttaccgtaa gttatgtaac gggtaccctg 4320 atctagaggc cgcaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 4380 tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 4440 tcagtgagcg agcgagcgcg cagccttaat taaatctggc gtaatcatgg tcatagctgt 4500 ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 4560 agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4620 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4680 cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc 4740 gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat 4800 ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaccgcag caaaaggcca 4860 ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 4920 atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 4980 aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 5040 gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 5100 ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 5160 ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 5220 acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 5280 gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat 5340 ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 5400 ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 5460 gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 5520 ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 5580 agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 5640 ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 5700 gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 5760 catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat 5820 cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg 5880 cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata 5940 gtttgcgcaa cgttgttacc attactacag gcatcgtggt gtcacgctcg tcgtttggta 6000 tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt 6060 gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag 6120 tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa 6180 gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc 6240 gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt 6300 taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc 6360 tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 6420 ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 6480 taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 6540 tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 6600 aaataggggt tccgcgcaca tttccccgaa agatgccacc tgaaattata aacgttaata 6660 ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 6720 aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 6780 cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 6840 ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 6900 cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 6960 ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 7020 gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 7080 cgccgctaca gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat 7140 cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 7200 taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat 7260 taggttaatt aaggctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc 7320 gtcgggcgac ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg 7380 <210> 30 <211> 247 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 tgagctcaca gaggggactt tccgagagat ctacagaggg gactttccga gagcgagctt 60 gggctgcagg tcgaccgtcc atccattcac agcgcttcta taaaggcgcc agctgaggcg 120 cctactactc caaccgcgac tgcagcgagc aactgagaag actggataga gccggcggtt 180 ccgcgaacga gcagtgaccg cgctcccacc cagctctgct ctgcagctcc accagtgtct 240 ctctaga 247 <210> 31 <211> 220 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 31 gcttcgcgcc ctaagtctgc aggtgacggg ctcaggggcg ggggctgggt gggggggagc 60 ggagaatgct ccagcccagt ttgccgtctc catggcgacc gcccgcgcgg cgccagcctg 120 acagcccgtc cgggttttat gaatgggtga cgtcacgggc ctggcgtcta acggtctgag 180 ccgcttgttc agacgctgac acagaccagc ccgggaaagg 220 <210> 32 <211> 4688 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgccgcgtcg acattgatta ttgactctgg tcgttacata 180 acttacggta aatggcccgc ctggctgacc gcccaacgac cccgcccatt gacgtcaata 240 atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 300 tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 360 cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 420 tgggactttc ctacttggca gtacatctac tcgaggccac gttctgcttc acgcttcgcg 480 ccctaagtct gcaggtgacg ggctcagggg cgggggctgg gtggggggga gcggagaatg 540 ctccagccca gtttgccgtc tccatggcga ccgcccgcgc ggcgccagcc tgacagcccg 600 tccgggtttt atgaatgggt gacgtcacgg gcctggcgtc taacggtctg agccgcttgt 660 tcagacgctg acacagacca gcccgggaaa ggtgagctca cagaggggac tttccgagag 720 atctacagag gggactttcc gagagcgagc ttgggctgca ggtcgaccgt ccatccattc 780 acagcgcttc tataaaggcg ccagctgagg cgcctactac tccaaccgcg actgcagcga 840 gcaactgaga agactggata gagccggcgg ttccgcgaac gagcagtgac cgcgctccca 900 cccagctctg ctctgcagct ccaccagtgt ctctctagag ccaccgcggt ggcggcccta 960 gagtcgatcg aggaactgaa aaaccagaaa gttaactggt aagtttagtc tttttgtctt 1020 ttatttcagg tcccggatcc ggtggtggtg caaatcaaag aactgctcct cagtggatgt 1080 tgcctttact tctaggcctg tacggaagtg ttacttctgc tctaaaagct gcggaattgt 1140 acccgcggcc gatccaccgg tcgccaccat ctagcatggg agtcaaagtt ctgtttgccc 1200 tgatctgcat cgctgtggcc gaggccaagc ccaccgagaa caacgaagac ttcaacatcg 1260 tggccgtggc cagcaacttc gcgaccacgg atctcgatgc tgaccgcggg aagttgcccg 1320 gcaagaagct gccgctggag gtgctcaaag agatggaagc caatgcccgg aaagctggct 1380 gcaccagggg ctgtctgatc tgcctgtccc acatcaagtg cacgcccaag atgaagaagt 1440 tcatcccagg acgctgccac acctacgaag gcgacaaaga gtccgcacag ggcggcatag 1500 gcgaggcgat cgtcgacatt cctgagattc ctgggttcaa ggacttggag cccatggagc 1560 agttcatcgc acaggtcgat ctgtgtgtgg actgcacaac tggctgcctc aaagggcttg 1620 ccaacgtgca gtgttctgac ctgctcaaga agtggctgcc gcaacgctgt gcgacctttg 1680 ccagcaagat ccagggccag gtggacaaga tcaagggggc cggtggtgac tagctcgacg 1740 ctgatcagcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 1800 gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 1860 tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 1920 caagggggag gattgggaag acaaggccgc aggaacccct agtgatggag ttggccactc 1980 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 2040 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcctga 2100 tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatacgt caaagcaacc 2160 atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt 2220 gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct 2280 cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 2340 atttagtgct ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg gttcacgtag 2400 tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 2460 tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcgggct attcttttga 2520 tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa 2580 atttaacgcg aattttaaca aaatattaac gtttacaatt ttatggtgca ctctcagtac 2640 aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc 2700 gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg 2760 gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct 2820 cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt agacgtcagg 2880 tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc 2940 aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag 3000 gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg 3060 ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt 3120 gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt 3180 tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt 3240 attatcccgt attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa 3300 tgacttggtt gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag 3360 agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac 3420 aacgatcgga ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac 3480 tcgccttgat cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac 3540 cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac 3600 tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact 3660 tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg 3720 tgggtctcgc ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt 3780 tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat 3840 aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta 3900 gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa 3960 tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga 4020 aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac 4080 aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt 4140 tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc tagtgtagcc 4200 gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat 4260 cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag 4320 acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc 4380 cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag 4440 cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac 4500 aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg 4560 gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct 4620 atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc 4680 tcacatgt 4688 <210> 33 <211> 5806 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgccgcgtcg acattgatta ttgactctgg tcgttacata 180 acttacggta aatggcccgc ctggctgacc gcccaacgac cccgcccatt gacgtcaata 240 atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 300 tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 360 cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 420 tgggactttc ctacttggca gtacatctac tcgaggccac gttctgcttc actctcccca 480 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 540 cgatgggggc gggggggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggccctag agtcgatcga ggaactgaaa 780 aaccagaaag ttaactggta agtttagtct ttttgtcttt tatttcaggt cccggatccg 840 gtggtggtgc aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt 900 acggaagtgt tacttctgct ctaaaagctg cggaattgta cccgcggccg atccaccggt 960 gccaccatgg tccgcgcgag gcaccagccg ggtgggcttt gcctcctgct gctgctgctc 1020 tgccagttca tggaggaccg cagtgcccag gctgggaact gctggctccg tcaagcgaag 1080 aacggccgct gccaggtcct gtacaagacc gaactgagca aggaggagtg ctgcagcacc 1140 ggccggctga gcacctcgtg gaccgaggag gacgtgaatg acaacacact cttcaagtgg 1200 atgattttca acgggggcgc ccccaactgc atcccctgta aagaaacgtg tgagaacgtg 1260 gactgtggac ctgggaaaaa atgccgaatg aacaagaaga acaaaccccg ctgcgtctgc 1320 gccccggatt gttccaacat cacctggaag ggtccagtct gcgggctgga tgggaaaacc 1380 taccgcaatg aatgtgcact cctaaaggca agatgtaaag agcagccaga actggaagtc 1440 cagtaccaag gcagatgtaa aaagacttgt cgggatgttt tctgtccagg cagctccaca 1500 tgtgtggtgg accagaccaa taatgcctac tgtgtgacct gtaatcggat ttgcccagag 1560 cctgcttcct ctgagcaata tctctgtggg aatgatggag tcacctactc cagtgcctgc 1620 cacctgagaa aggctacctg cctgctgggc agatctattg gattagccta tgagggaaag 1680 tgtatcaaag caaagtcctg tgaagatatc cagtgcactg gtgggaaaaa atgtttatgg 1740 gatttcaagg ttgggagagg ccggtgttcc ctctgtgatg agctgtgccc tgacagtaag 1800 tcggatgagc ctgtctgtgc cagtgacaat gccacttatg ccagcgagtg tgccatgaag 1860 gaagctgcct gctcctcagg tgtgctactg gaagtaaagc actccggatc ttgcaacgga 1920 tccggagagg gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct 1980 atggcgcccg tcgccgtctg ggccgcgctg gccgtcggac tggagctctg ggctgcggcg 2040 cacgccttgc ccgcccaggt ggcatttaca ccctacgccc cggagcccgg gagcacatgc 2100 cggctcagag aatactatga ccagacagct cagatgtgct gcagcaaatg ctcgccgggc 2160 caacatgcaa aagtcttctg taccaagacc tcggacaccg tgtgtgactc ctgtgaggac 2220 agcacataca cccagctctg gaactgggtt cccgagtgct tgagctgtgg ctcccgctgt 2280 agctctgacc aggtggaaac tcaagcctgc actcgggaac agaaccgcat ctgcacctgc 2340 aggcccggct ggtactgcgc gctgagcaag caggaggggt gccggctgtg cgcgccgctg 2400 cgcaagtgcc gcccgggctt cggcgtggcc agaccaggaa ctgaaacatc agacgtggtg 2460 tgcaagccct gtgccccggg gacgttctcc aacacgactt catccacgga tatttgcagg 2520 ccccaccaga tctgtaacgt ggtggccatc cctgggaatg caagcatgga tgcagtctgc 2580 acgtccacgt cccccacccg gagtatggcc ccaggggcag tacacttacc ccagccagtg 2640 tccacacgat cccaacacac gcagccaact ccagaaccca gcactgctcc aagcacctcc 2700 ttcctgctcc caatgggccc cagcccccca gctgaaggga gcactggcga cttcgctctt 2760 ccagtttgag cggccgccaa acaccattgt cacactccaa caaacaccat tgtcacactc 2820 caacaaacac cattgtcaca ctccagcggc cgcacgcgtt gatcagcctc gactgtgcct 2880 tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 2940 gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 3000 tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 3060 aaggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 3120 cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 3180 gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca 3240 tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc 3300 gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 3360 ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 3420 cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 3480 gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 3540 gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 3600 ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt 3660 tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 3720 atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag 3780 ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc 3840 ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt 3900 tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag 3960 gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg 4020 cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 4080 caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 4140 ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 4200 gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 4260 gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 4320 atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 4380 caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 4440 gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 4500 accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 4560 ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 4620 gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 4680 acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 4740 atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 4800 ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca 4860 gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 4920 gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 4980 tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 5040 taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 5100 cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 5160 gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 5220 gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 5280 agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 5340 aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 5400 agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 5460 cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 5520 accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 5580 aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 5640 ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 5700 cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 5760 gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgt 5806 <210> 34 <211> 4555 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgccgcgtcg acattgatta ttgactctgg tcgttacata 180 acttacggta aatggcccgc ctggctgacc gcccaacgac cccgcccatt gacgtcaata 240 atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 300 tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 360 cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 420 tgggactttc ctacttggca gtacatctac tcgaggccac gttctgcttc actctcccca 480 tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 540 cgatgggggc gggggggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600 gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660 aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720 cgggcgggag cgggatcagc caccgcggtg gcggccctag agtcgatcga ggaactgaaa 780 aaccagaaag ttaactggta agtttagtct ttttgtcttt tatttcaggt cccggatccg 840 gtggtggtgc aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt 900 acggaagtgt tacttctgct ctaaaagctg cggaattgta cccgcggccg atccaccggt 960 cgccaccatc tagcatggga gtcaaagttc tgtttgccct gatctgcatc gctgtggccg 1020 aggccaagcc caccgagaac aacgaagact tcaacatcgt ggccgtggcc agcaacttcg 1080 cgaccacgga tctcgatgct gaccgcggga agttgcccgg caagaagctg ccgctggagg 1140 tgctcaaaga gatggaagcc aatgcccgga aagctggctg caccaggggc tgtctgatct 1200 gcctgtccca catcaagtgc acgcccaaga tgaagaagtt catcccagga cgctgccaca 1260 cctacgaagg cgacaaagag tccgcacagg gcggcatagg cgaggcgatc gtcgacattc 1320 ctgagattcc tgggttcaag gacttggagc ccatggagca gttcatcgca caggtcgatc 1380 tgtgtgtgga ctgcacaact ggctgcctca aagggcttgc caacgtgcag tgttctgacc 1440 tgctcaagaa gtggctgccg caacgctgtg cgacctttgc cagcaagatc cagggccagg 1500 tggacaagat caagggggcc ggtggtgact agctcgacgc tcaaacacca ttgtcacact 1560 ccaacaaaca ccattgtcac actccaacaa acaccattgt cacactccag atcagcctcg 1620 actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 1680 ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 1740 ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 1800 tgggaagaca aggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 1860 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 1920 ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcctgatgc ggtattttct 1980 ccttacgcat ctgtgcggta tttcacaccg catacgtcaa agcaaccata gtacgcgccc 2040 tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt 2100 gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc 2160 ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta 2220 cggcacctcg accccaaaaa acttgatttg ggtgatggtt cacgtagtgg gccatcgccc 2280 tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg 2340 ttccaaactg gaacaacact caaccctatc tcgggctatt cttttgattt ataagggatt 2400 ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat 2460 tttaacaaaa tattaacgtt tacaatttta tggtgcactc tcagtacaat ctgctctgat 2520 gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 2580 tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 2640 cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta 2700 tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg 2760 ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 2820 ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 2880 attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 2940 gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 3000 ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 3060 cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 3120 gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 3180 tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 3240 gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 3300 ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 3360 tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 3420 gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 3480 caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 3540 cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 3600 atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 3660 gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 3720 attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 3780 cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 3840 atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 3900 tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 3960 ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 4020 ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 4080 cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 4140 gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 4200 gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 4260 acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 4320 gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 4380 agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 4440 tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 4500 agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgt 4555 <210> 35 <211> 537 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 atggaaatct gcagaggcct ccgcagtcac ctaatcactc tcctcctctt cctgttccat 60 tcagagacga tctgccgacc ctctgggaga aaatccagca agatgcaagc cttcagaatc 120 tgggatgtta accagaagac cttctatctg aggaacaacc aactagttgc tggatacttg 180 caaggaccaa atgtcaattt agaagaaaag atagatgtgg tacccattga gcctcatgct 240 ctgttcttgg gaatccatgg agggaagatg tgcctgtcct gtgtcaagtc tggtgatgag 300 accagactcc agctggaggc agttaacatc actgacctga gcgagaacag aaagcaggac 360 aagcgcttcg ccttcatccg ctcagacagt ggccccacca ccagttttga gtctgccgcc 420 tgccccggtt ggttcctctg cacagcgatg gaagctgacc agcccgtcag cctcaccaat 480 atgcctgacg aaggcgtcat ggtcaccaaa ttctacttcc aggaggacga gtagtaa 537 <210> 36 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 gaactgaaaa accagaaagt taactggtaa gtttagtctt tttgtctttt atttcaggtc 60 ccggatccgg tggtggtgca aatcaaagaa ctgctcctca gtggatgttg cctttacttc 120 aggcctgtac ggaagtgtta cttctgctct aaaagctgcg gaattgtacc c 171 <210> 37 <211> 384 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 60 atccagcctc cgcggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga 120 cgtaagtacc gcctatagag tctataggcc cacccccttg gcttcttatg catgctatac 180 tgtttttggc ttggggtcta tacacccccg cttcctcatg tttgctgccc gtgaccagca 240 cgtcaacgat tttgtgggca cgggcgacac cgcagtgtag tctgagcagt actcgttgct 300 gccgcgcgcg ccaccagaca taatagctga cagactaaca gactgttcct ttccatgggt 360 cttttctgca gtcaccgtcg ccgc 384 <210> 38 <211> 509 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 38 Met Val Asp Gly Val Met Ile Leu Pro Val Leu Ile Met Ile Ala Leu 1 5 10 15 Pro Ser Pro Ser Met Glu Asp Glu Lys Pro Lys Val Asn Pro Lys Leu 20 25 30 Tyr Met Cys Val Cys Glu Gly Leu Ser Cys Gly Asn Glu Asp His Cys 35 40 45 Glu Gly Gln Gln Cys Phe Ser Ser Leu Ser Ile Asn Asp Gly Phe His 50 55 60 Val Tyr Gln Lys Gly Cys Phe Gln Val Tyr Glu Gln Gly Lys Met Thr 65 70 75 80 Cys Lys Thr Pro Pro Ser Pro Gly Gln Ala Val Glu Cys Cys Gln Gly 85 90 95 Asp Trp Cys Asn Arg Asn Ile Thr Ala Gln Leu Pro Thr Lys Gly Lys 100 105 110 Ser Phe Pro Gly Thr Gln Asn Phe His Leu Glu Val Gly Leu Ile Ile 115 120 125 Leu Ser Val Val Phe Ala Val Cys Leu Leu Ala Cys Leu Leu Gly Val 130 135 140 Ala Leu Arg Lys Phe Lys Arg Arg Asn Gln Glu Arg Leu Asn Pro Arg 145 150 155 160 Asp Val Glu Tyr Gly Thr Ile Glu Gly Leu Ile Thr Thr Asn Val Gly 165 170 175 Asp Ser Thr Leu Ala Asp Leu Leu Asp His Ser Cys Thr Ser Gly Ser 180 185 190 Gly Ser Gly Leu Pro Phe Leu Val Gln Arg Thr Val Ala Arg Gln Ile 195 200 205 Thr Leu Leu Glu Cys Val Gly Lys Gly Arg Tyr Gly Glu Val Trp Arg 210 215 220 Gly Ser Trp Gln Gly Glu Asn Val Ala Val Lys Ile Phe Ser Ser Arg 225 230 235 240 Asp Glu Lys Ser Trp Phe Arg Glu Thr Glu Leu Tyr Asn Thr Val Met 245 250 255 Leu Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ser Asp Met Thr Ser 260 265 270 Arg His Ser Ser Thr Gln Leu Trp Leu Ile Thr His Tyr His Glu Met 275 280 285 Gly Ser Leu Tyr Asp Tyr Leu Gln Leu Thr Thr Leu Asp Thr Val Ser 290 295 300 Cys Leu Arg Ile Val Leu Ser Ile Ala Ser Gly Leu Ala His Leu His 305 310 315 320 Ile Glu Ile Phe Gly Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp 325 330 335 Leu Lys Ser Lys Asn Ile Leu Val Lys Lys Asn Gly Gln Cys Cys Ile 340 345 350 Ala Asp Leu Gly Leu Ala Val Met His Ser Gln Ser Thr Asn Gln Leu 355 360 365 Asp Val Gly Asn Asn Pro Arg Val Gly Thr Lys Arg Tyr Met Ala Pro 370 375 380 Glu Val Leu Asp Glu Thr Ile Gln Val Asp Cys Phe Asp Ser Tyr Lys 385 390 395 400 Arg Val Asp Ile Trp Ala Phe Gly Leu Val Leu Trp Glu Val Ala Arg 405 410 415 Arg Met Val Ser Asn Gly Ile Val Glu Asp Tyr Lys Pro Pro Phe Tyr 420 425 430 Asp Val Val Pro Asn Asp Pro Ser Phe Glu Asp Met Arg Lys Val Val 435 440 445 Cys Val Asp Gln Gln Arg Pro Asn Ile Pro Asn Arg Trp Phe Ser Asp 450 455 460 Pro Thr Leu Thr Ser Leu Ala Lys Leu Met Lys Glu Cys Trp Tyr Gln 465 470 475 480 Asn Pro Ser Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys Thr Leu Thr 485 490 495 Lys Ile Asp Asn Ser Leu Asp Lys Leu Lys Thr Asp Cys 500 505 <210> 39 <211> 100 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 39 Val Phe Tyr Phe Arg Ser Gln Ile Gly Ser Ala Phe Ala Pro Gly Ser 1 5 10 15 Pro Leu Leu Pro Trp Ala Trp Ala His Gln Pro Trp Cys Leu Trp Pro 20 25 30 Ala Ala His Leu Leu Ala Gly Ser Cys Glu Cys Asn Leu Val Ser His 35 40 45 Leu Phe Trp Gln Tyr Leu Ser Gly Ser Ala Asp Tyr Thr His Gly Gly 50 55 60 Leu Pro Leu Pro Thr Val Pro Trp Pro Lys Arg Ile Gly His Arg Gly 65 70 75 80 Pro Thr Pro Ser Trp Gly Ile Arg Thr Val Ser Pro Leu Gln Gly Ile 85 90 95 Arg Trp Trp Cys 100 <210> 40 <211> 87 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 40 Arg Ala Leu Arg Leu Leu Gln Val Val Arg Cys Ser Leu Gly Pro Gly 1 5 10 15 Pro Thr Asp Ser Pro Gly Ala Ser Gly Arg Leu His Thr Ser Trp Arg 20 25 30 Ala Ala Val Ser Val Ser Trp Ala Thr Cys Ser Gly Asn Thr Val Ala 35 40 45 Leu Arg Leu Thr Leu Thr Glu Ala Cys Pro Asp Cys Pro Arg Cys Arg 50 55 60 Gly Gln Arg Gly Ser Lys Gly Thr Ala Glu Gly Leu Pro Asn His Arg 65 70 75 80 Gly Glu Gly Gln Cys His Pro 85 <210> 41 <211> 16 <212> PRT <213> Homo sapiens <400> 41 Ser Arg Val Gln Arg Thr Val Ala Arg Gln Ile Thr Leu Leu Glu Cys 1 5 10 15 <210> 42 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 42 Ser Arg Val Gln Arg Thr Val Ala Arg Gln Ile Thr Leu Leu Glu Cys 1 5 10 15 <210> 43 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 43 Gly Ser Pro Asp Tyr Thr Val 1 5 <210> 44 <211> 795 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 44 Val Thr Ser Gln Leu Arg Gln Val Asp Pro Cys Leu Val Gln Ala Gly 1 5 10 15 Asp Ala Leu Val Asp Gln Gly Gly Val Gln His Leu Phe Gly Ala Gly 20 25 30 Val Pro Leu Pro Val Asp Gly Gly Val Lys Val Leu Glu Gly Gly Arg 35 40 45 Gly Ser Gln Ile Gly Gln Gly Lys Gln Val Asp Asp Ile Leu Gly Leu 50 55 60 Leu Ser Asp Gly Leu Ile Pro Val Leu Val Val Gly Gly Gln His Phe 65 70 75 80 Val Gln Ile Ser Val Gly Gln Asp His Ser Leu Gly Glu Leu Ala Asp 85 90 95 Leu Leu Asp Asp Leu Val Gln Val Val Leu Val Leu Phe His Lys Gln 100 105 110 Leu Phe Leu Leu Ile Ile Leu Gly Gly Ala Leu Gln Leu Leu Ile Val 115 120 125 Ala Gly Gln Val Gln Glu Val His Ile Phe Gly Gly Gln Gly Gln Phe 130 135 140 Val Ser Leu Leu Gln Phe Ala Gly Arg Gly Gln His Ser Leu Pro Ala 145 150 155 160 Val Phe Gln Leu Glu Gln Gly Val Leu Arg Gln Leu Asp Asp Gln Val 165 170 175 Leu Phe His Phe Phe Val Ala Leu Gly Phe Gln Lys Val Asp Gly Ile 180 185 190 Leu Leu Glu Ala Ala Ser Phe His Asp Gly Asp Pro Gln Gln Leu Phe 195 200 205 His Thr Leu Gln Phe Leu Gly Leu Ala Leu Phe His Phe Gly His His 210 215 220 Gln His Arg Ile Gly His Gly Gly Ala Val Glu Ala Ala Val Leu Leu 225 230 235 240 Arg Val Pro Val Leu Leu Ser Gly Asp Gln Leu Ile Ala Val Pro Leu 245 250 255 Gly Gln Asp Arg Leu Phe Ala Glu Ala Ala Cys Leu His Leu Gly Leu 260 265 270 Phe His Asp Ile His Leu Gly His Ala Gln His Phe Pro His Gly Gly 275 280 285 Lys Ile Pro Ala Leu Ile Pro His Asp Leu Pro Gly Phe Ala Val Cys 290 295 300 Leu Asp Gln Arg Pro Leu Pro Asp Leu Ala Val Gly Gln Gly Asn Leu 305 310 315 320 Gly Leu Glu Lys Val His Asp Val Ala Val Glu Glu Val Leu Gly Gly 325 330 335 Ser Leu Ala Asp Phe Leu Leu Ala Leu Gly Asp His Leu Pro His Val 340 345 350 Val His Leu Val Val Ala Val His Glu Leu Ala Phe Gln Leu Arg Val 355 360 365 Leu Phe Asp Gln Gly Gly Ser His Asp Gly Val Gln Val Gly Val Val 370 375 380 Gly Val Val Val Val Val Asp Leu Ala His Phe Val Lys Leu Glu Ile 385 390 395 400 Leu Pro Glu Ile Gly His Gln Leu Gly Leu Gln Gly Asp His Phe His 405 410 415 Phe Pro Asp Gln Leu Val Ile Leu Val Val Leu Ser Val His Pro Gly 420 425 430 Val Gln Asp Leu Cys His Val Leu Cys Asp Leu Pro Gly Phe His Gln 435 440 445 Leu Ser Leu Asp Glu Ala Gly Leu Ile Gln Phe Ala Gln Ala Ala Ser 450 455 460 Leu Gly Leu Gly Gln Ile Val Glu Leu Ser Leu Gly Asn Gln Leu Gly 465 470 475 480 Val Gln Gln Leu Pro Pro Val Val Leu His Leu Leu His Asp Leu Phe 485 490 495 Gly Gly His Val Val Ala Leu Ala Pro Val Leu Val Ala Ser Gly Gln 500 505 510 His Leu Val Val Asp Gly Val Val Leu Gln Lys Ala Leu Arg His Asp 515 520 525 Met Val His Ile Val Val Gly Gln Pro Val Asp Val Gln Phe Leu Val 530 535 540 His Val His Ile Pro Pro Ile Leu Gln Val Val Gln Val Gln Leu Leu 545 550 555 560 Val Leu Gln Leu Gly Val Phe His Gly Val Phe Phe Gln Asp Leu Ala 565 570 575 Ala Gln Leu Phe Asp Ala Leu Phe Asp Pro Leu His Ser Leu Ala Ala 580 585 590 Val Leu Leu Ser Leu Leu Gly Gly Leu Val Leu Ser Gly His Phe Asp 595 600 605 His Asp Val Leu Gly Leu Val Pro Ala His His Phe His Glu Leu Val 610 615 620 His His Leu His Cys Leu Gln Asp Ala Leu Leu Asn Gly Gly Ala Ala 625 630 635 640 Gly Gln Ile Gly Asn Val Leu Val Gln Ala Ile Ala Leu Ala Gly His 645 650 655 Leu Gly Phe Leu Asp Val Leu Phe Lys Gly Gln Ala Val Val Val Asp 660 665 670 Gln Leu His Glu Val Ser Val Gly Glu Ala Val Gly Leu Gln Glu Ile 675 680 685 Gln Asp Cys Leu Ala Gly Leu Leu Val Pro Asp Ala Val Asp Gln Leu 690 695 700 Pro Ala Gln Pro Ala Pro Ala Gly Val Ser Pro Pro Leu Gln Leu Leu 705 710 715 720 His His Phe Val Val Glu Gln Val Gly Ile Gly Phe Gln Pro Phe Leu 725 730 735 Asp His Leu Ser Val Leu Lys Gln Cys Gln Gly Gln His Asp Ile Phe 740 745 750 Gln Asn Val Leu Val Phe Leu Ile Val Gln Glu Val Leu Val Leu Asp 755 760 765 Asn Phe Gln Gln Ile Val Val Cys Ala Gln Gly Gly Val Glu Pro Ile 770 775 780 Phe His Ala Gly Asp Phe His Gly Val Glu Ala 785 790 795 <210> 45 <211> 317 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 45 Met Val Arg Ala Arg His Gln Pro Gly Gly Leu Cys Leu Leu Leu Leu 1 5 10 15 Leu Leu Cys Gln Phe Met Glu Asp Arg Ser Ala Gln Ala Gly Asn Cys 20 25 30 Trp Leu Arg Gln Ala Lys Asn Gly Arg Cys Gln Val Leu Tyr Lys Thr 35 40 45 Glu Leu Ser Lys Glu Glu Cys Cys Ser Thr Gly Arg Leu Ser Thr Ser 50 55 60 Trp Thr Glu Glu Asp Val Asn Asp Asn Thr Leu Phe Lys Trp Met Ile 65 70 75 80 Phe Asn Gly Gly Ala Pro Asn Cys Ile Pro Cys Lys Glu Thr Cys Glu 85 90 95 Asn Val Asp Cys Gly Pro Gly Lys Lys Cys Arg Met Asn Lys Lys Asn 100 105 110 Lys Pro Arg Cys Val Cys Ala Pro Asp Cys Ser Asn Ile Thr Trp Lys 115 120 125 Gly Pro Val Cys Gly Leu Asp Gly Lys Thr Tyr Arg Asn Glu Cys Ala 130 135 140 Leu Leu Lys Ala Arg Cys Lys Glu Gln Pro Glu Leu Glu Val Gln Tyr 145 150 155 160 Gln Gly Arg Cys Lys Lys Thr Cys Arg Asp Val Phe Cys Pro Gly Ser 165 170 175 Ser Thr Cys Val Val Asp Gln Thr Asn Asn Ala Tyr Cys Val Thr Cys 180 185 190 Asn Arg Ile Cys Pro Glu Pro Ala Ser Ser Glu Gln Tyr Leu Cys Gly 195 200 205 Asn Asp Gly Val Thr Tyr Ser Ser Ala Cys His Leu Arg Lys Ala Thr 210 215 220 Cys Leu Leu Gly Arg Ser Ile Gly Leu Ala Tyr Glu Gly Lys Cys Ile 225 230 235 240 Lys Ala Lys Ser Cys Glu Asp Ile Gln Cys Thr Gly Gly Lys Lys Cys 245 250 255 Leu Trp Asp Phe Lys Val Gly Arg Gly Arg Cys Ser Leu Cys Asp Glu 260 265 270 Leu Cys Pro Asp Ser Lys Ser Asp Glu Pro Val Cys Ala Ser Asp Asn 275 280 285 Ala Thr Tyr Ala Ser Glu Cys Ala Met Lys Glu Ala Ala Cys Ser Ser 290 295 300 Gly Val Leu Leu Glu Val Lys His Ser Gly Ser Cys Asn 305 310 315 <210> 46 <211> 262 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 46 Met Ala Pro Val Ala Val Trp Ala Ala Leu Ala Val Gly Leu Glu Leu 1 5 10 15 Trp Ala Ala Ala His Ala Leu Pro Ala Gln Val Ala Phe Thr Pro Tyr 20 25 30 Ala Pro Glu Pro Gly Ser Thr Cys Arg Leu Arg Glu Tyr Tyr Asp Gln 35 40 45 Thr Ala Gln Met Cys Cys Ser Lys Cys Ser Pro Gly Gln His Ala Lys 50 55 60 Val Phe Cys Thr Lys Thr Ser Asp Thr Val Cys Asp Ser Cys Glu Asp 65 70 75 80 Ser Thr Tyr Thr Gln Leu Trp Asn Trp Val Pro Glu Cys Leu Ser Cys 85 90 95 Gly Ser Arg Cys Ser Ser Asp Gln Val Glu Thr Gln Ala Cys Thr Arg 100 105 110 Glu Gln Asn Arg Ile Cys Thr Cys Arg Pro Gly Trp Tyr Cys Ala Leu 115 120 125 Ser Lys Gln Glu Gly Cys Arg Leu Cys Ala Pro Leu Arg Lys Cys Arg 130 135 140 Pro Gly Phe Gly Val Ala Arg Pro Gly Thr Glu Thr Ser Asp Val Val 145 150 155 160 Cys Lys Pro Cys Ala Pro Gly Thr Phe Ser Asn Thr Thr Ser Ser Thr 165 170 175 Asp Ile Cys Arg Pro His Gln Ile Cys Asn Val Val Ala Ile Pro Gly 180 185 190 Asn Ala Ser Met Asp Ala Val Cys Thr Ser Thr Ser Pro Thr Arg Ser 195 200 205 Met Ala Pro Gly Ala Val His Leu Pro Gln Pro Val Ser Thr Arg Ser 210 215 220 Gln His Thr Gln Pro Thr Pro Glu Pro Ser Thr Ala Pro Ser Thr Ser 225 230 235 240 Phe Leu Leu Pro Met Gly Pro Ser Pro Pro Ala Glu Gly Ser Thr Gly 245 250 255 Asp Phe Ala Leu Pro Val 260 <210> 47 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 47 Gln Thr Pro Leu Ser His Ser Asn Lys His His Cys His Thr Pro Thr 1 5 10 15 Asn Thr Ile Val Thr Leu 20 <210> 48 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 acaagctttt tgctcgtctt atacaagctt tttgctcgtc ttatacaagc tttttgctcg 60 tcttat 66 <210> 49 <211> 3563 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180 atcctctaga actatagcta gtcgacattg attattgact agttattaat agtaatcaat 240 tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300 tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360 tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420 aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 480 caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 540 tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc cacgttctgc 600 ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa 660 ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg gcggggcggg 720 gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc 780 tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg 840 cgcggcgggc gggagcaagc tttcagatcg cctggagacg ccatccacgc tgttttgacc 900 tccatagaag acaccgggac cgatccagcc tccgcggccg ggaacggtgc attggaacgc 960 ggattccccg tgccaagagt gacgtaagta ccgcctatag agtctatagg cccaccccct 1020 tggcttctta tgcatgctat actgtttttg gcttggggtc tatacacccc cgcttcctca 1080 tgtttgctgc ccgtgaccag cacgtcaacg attttgtggg cacgggcgac accgcagtgt 1140 agtctgagca gtactcgttg ctgccgcgcg cgccaccaga cataatagct gacagactaa 1200 cagactgttc ctttccatgg gtcttttctg caagggctct gcgtttgctc caggtagtcc 1260 gctgctccct tgggcctggg cccactgaca gccctggtgc ctctggccgg ctgcacacct 1320 cctggcgggc agctgtgtgt aatctggtga gccactgttg ttctggcaat acctgacagt 1380 ggcagatcag attacacacg gaggcctgcc ctgactgccc acggtgccgt ggccaaagag 1440 gatctaaggg caccgctgag ggcctaccta accatcgtgg ggaataagga cagtgtcacc 1500 ctgcagtcac cgtcgccgcc accggtgaat tccgccacca tggtcgatgg agtgatgatc 1560 ctgcctgtcc tgattatgat tgccctgccc agccccagca tggaagatga aaaacctaaa 1620 gtcaacccta agctgtatat gtgcgtgtgc gagggcctga gctgcggaaa cgaggatcac 1680 tgcgagggcc agcagtgttt cagctccctg tccatcaatg acggcttcca cgtgtaccag 1740 aagggctgct ttcaggtgta tgagcagggc aagatgacct gtaagacacc accttcccca 1800 ggacaggcag tggagtgctg tcagggcgat tggtgtaacc ggaatatcac cgcccagctg 1860 ccaacaaagg gcaagtcttt ccccggcaca cagaactttc acctggaagt gggcctgatc 1920 atcctgagcg tggtgttcgc cgtgtgcctg ctggcatgtc tgctgggagt ggccctgaga 1980 aagtttaagc ggagaaacca ggagcggctg aatccaagag atgtggagta cggcaccatc 2040 gagggcctga tcaccacaaa tgtgggcgac tctacactgg ccgacctgct ggatcacagc 2100 tgcaccagcg gctccggatc tggcctgccc tttctggtgc agaggaccgt ggcccggcag 2160 atcaccctgc tggagtgcgt gggcaagggc cggtacggag aagtgtggag aggatcctgg 2220 cagggagaga acgtggcagt gaagatcttc tctagccggg atgagaagtc ttggtttaga 2280 gagacagagc tgtataacac agtgatgctg aggcacgaga atatcctggg cttcatcgcc 2340 tccgacatga cctctcgcca ctcctctaca cagctgtggc tgatcaccca ctaccacgag 2400 atgggctccc tgtacgatta cctccagctg accacactgg acacagtgtc ttgcctgcgg 2460 atcgtgctgt ctatcgccag cggcctggca cacctgcaca tcgagatctt tggaacccag 2520 ggcaagccag caatcgcaca cagagatctg aagtctaaga acatcctggt gaagaagaat 2580 ggccagtgct gtatcgccga tctgggcctg gccgtgatgc acagccagtc caccaaccag 2640 ctggacgtgg gcaacaatcc tcgggtgggc acaaagagat acatggcccc agaggtgctg 2700 gatgagacaa tccaggtgga ctgcttcgat agctataaga gggtggacat ctgggccttt 2760 ggcctggtgc tgtgggaggt ggcaaggagg atggtgagca acggcatcgt ggaggactac 2820 aagccaccct tctatgacgt ggtgcctaat gatccatcct ttgaggacat gcgcaaggtg 2880 gtgtgcgtgg atcagcagag gcccaacatc cctaatcgct ggttcagcga ccccaccctg 2940 acatccctgg ccaagctgat gaaggagtgt tggtatcaga atcctagcgc caggctgacc 3000 gccctgcgca tcaagaaaac tctgactaaa atcgacaata gcctggataa actgaaaacc 3060 gactgctgac ctgaacaagc tttttgctcg tcttatacaa gctttttgct cgtcttatac 3120 aagctttttg ctcgtcttat acaaacacca ttgtcacact ccaacaaaca ccattgtcac 3180 actccaacaa acaccattgt cacactccat gaggatccga tctttttccc tctgccaaaa 3240 attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 3300 ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagc aattcgttga 3360 tctgaatttc gaccacccat aatacccatt accctggtag ataagtagca tggcgggtta 3420 atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3480 tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 3540 tcagtgagcg agcgagcgcg cag 3563 <210> 50 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> modified_base <222> (1)..(3) <223> n is a, g, c, or t <220> <221> misc_feature <222> (1)..(3) <223> n is a, c, g, or t <220> <221> modified_base <222> (24)..(24) <223> r is g or a <220> <221> modified_base <222> (45)..(47) <223> n is a, g, c, or t <220> <221> misc_feature <222> (45)..(47) <223> n is a, c, g, or t <400> 50 nnnggtacaa agaacagtgg ctcrccagat tacactgttg gagtnnn 47 <210> 51 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <220> <221> modified_base <222> (1)..(3) <223> n is a, g, c, or t <220> <221> misc_feature <222> (1)..(3) <223> n is a, c, g, or t <220> <221> modified_base <222> (45)..(47) <223> n is a, g, c, or t <220> <221> misc_feature <222> (45)..(47) <223> n is a, c, g, or t <400> 51 nnnggtacaa agaacagtgg ctcaccagat tacactgttg gagtnnn 47 <210> 52 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 52 Arg Thr Val Ala His Gln Ile Thr Leu 1 5 <210> 53 <211> 47 <212> DNA <213> Homo sapiens <220> <221> modified_base <222> (1)..(3) <223> n is a, g, c, or t <220> <221> misc_feature <222> (1)..(3) <223> n is a, c, g, or t <220> <221> modified_base <222> (45)..(47) <223> n is a, g, c, or t <220> <221> misc_feature <222> (45)..(47) <223> n is a, c, g, or t <400> 53 nnnggtacaa agaacagtgg ctcgccagat tacactgttg gagtnnn 47 <210> 54 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 54 Arg Thr Val Ala Arg Gln Ile Thr Leu 1 5 <210> 55 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 ggctcaccag attacactgt tgg 23 <210> 56 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtggtgta atctggtgag 120 ccactgtgtt ctggcaatac ctgcagtggc tgtctagatt acaccacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 57 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtggtgta agctggtgag 120 ccactgtgtt ctggcaatac ctgcagtggc tgtctagctt acaccacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 58 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgtgtaa gctggtgagc 120 cactgttgtt ctggcaatac ctgacagtgg cagatcagct tacacacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 59 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgtgtaa tctggtgagc 120 cactgttgtt ctggcaatac ctgacagtgg cagatcagat tacacacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 60 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtggtaat ctggtgagcc 120 actgtttgtt ctggcaatac ctgaacagtg ggacgccaga ttaccacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 61 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtggtaag ctggtgagcc 120 actgtttgtt ctggcaatac ctgaacagtg ggacgccagc ttaccacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 62 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgtaatc tggtgagcca 120 ctgttctgtt ctggcaatac ctggaacagt gcgttaccag attacacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 63 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 63 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgtaagc tggtgagcca 120 ctgttctgtt ctggcaatac ctggaacagt gcgttaccag cttacacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 64 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgaatct ggtgagccac 120 tgttcttgtt ctggcaatac ctgagaacag tcccccacca gattcacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269 <210> 65 <211> 269 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60 cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgaagct ggtgagccac 120 tgttcttgtt ctggcaatac ctgagaacag tcccccacca gcttcacgga ggcctgccct 180 gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240 catcgtgggg aataaggaca gtgtcaccc 269

Claims (100)

  1. ACVR1을 코딩하는 코돈 최적화된 핵산 서열에 작동가능하게 연결된 프로모터를 포함하는 트랜스진을 포함하는 단리된 핵산.
  2. 제1항에 있어서, 벡터 내에 위치하는 단리된 핵산.
  3. 제1항에 있어서, 프로모터가 닭 베타-액틴 (CBA) 프로모터인 단리된 핵산.
  4. 제3항에 있어서, CBA 프로모터가 벡터 내에 CBA 인트론을 포함하는 것인 단리된 핵산.
  5. 제3항에 있어서, CBA 프로모터가 벡터 내에 서열식별번호: 37에 제시된 바와 같은 서열을 포함하는 매스바이올로직스 신규 (MBL) 인트론을 포함하는 것인 단리된 핵산.
  6. 제3항에 있어서, CBA 프로모터가 벡터 내에 서열식별번호: 36에 제시된 바와 같은 서열을 포함하는 합성 인트론을 포함하는 것인 단리된 핵산.
  7. 제5항 또는 제6항에 있어서, MBL 인트론 및/또는 합성 인트론이 벡터 게놈의 크기를 감소시키는 것인 단리된 핵산.
  8. 제7항에 있어서, 벡터 게놈의 크기가 적어도 15-25%만큼 감소되는 것인 단리된 핵산.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 인트론이 프로모터와 ACVR1을 코딩하는 트랜스진 서열 사이에 존재하는 것인 단리된 핵산.
  10. 제1항에 있어서, ACVR1이 서열식별번호: 1에 제시된 바와 같은 서열을 포함하는 것인 단리된 핵산.
  11. 제2항에 있어서, 벡터가 플라스미드, 바크미드, 코스미드, 바이러스, 폐쇄형-단부 선형 DNA (ceDNA), 또는 바큘로바이러스 벡터인 단리된 핵산.
  12. 제11항에 있어서, 벡터가 아데노-연관 바이러스 (AAV) 벡터인 단리된 핵산.
  13. 제1항 내지 제10항 중 어느 한 항에 있어서, 트랜스진에 AAV 역전된 말단 반복부 (ITR)가 플랭킹된 것인 단리된 핵산.
  14. 서열식별번호: 2-4 중 어느 하나에 제시된 서열을 포함하는, 제1항 내지 제13항 중 어느 한 항의 단리된 핵산을 포함하는 벡터.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, ACVR1-R206H에 의한 골 형태발생 단백질 (BMP) 신호전달의 활성화를 감소시키는 단리된 핵산 또는 벡터.
  16. ACVR1 단백질을 코딩하는 내인성 mRNA와 혼성화하여 그의 발현을 억제하기에 충분한, 대상체의 내인성 mRNA와 상보적인 서열을 갖는 핵산을 포함하는 인공 miRNA (ami-RNA)를 포함하는 단리된 핵산.
  17. 제16항에 있어서, ACVR1 단백질이 야생형 ACVR1의 서열의 위치 206에서 구아닌에서 아데닌으로의 단일 염기 돌연변이를 포함하는 것인 단리된 핵산.
  18. 제16항 또는 제17항에 있어서, ACVR1 단백질이 인간 ACVR1-R206H인 단리된 핵산.
  19. 제16항에 있어서, ami-RNA가 서열식별번호: 5, 6 및 56-65 중 어느 하나에 제시된 서열에 의해 코딩된 것인 단리된 핵산.
  20. 제16항에 있어서, 벡터 내에 위치하는 단리된 핵산.
  21. 제16항에 있어서, 프로모터가 닭 베타-액틴 (CBA) 프로모터인 단리된 핵산.
  22. 제20항에 있어서, 벡터가 플라스미드, 바크미드, 코스미드, 바이러스, 폐쇄형-단부 선형 DNA (ceDNA), 또는 바큘로바이러스 벡터인 단리된 핵산.
  23. 제22항에 있어서, 바이러스 벡터가 아데노-연관 바이러스 (AAV) 벡터인 단리된 핵산.
  24. 제23항에 있어서, AAV 벡터가 적어도 1개의 역전된 말단 반복부 (ITR)를 포함하는 것인 단리된 핵산.
  25. 제16항 내지 제24항 중 어느 한 항에 있어서, ami-RNA가 인간 miRNA 백본, 임의로 인간 miR-33 백본을 포함하는 것인 단리된 핵산.
  26. 서열식별번호: 5, 6, 및 56-65 중 어느 하나에 제시된 서열을 포함하는, 제16항 내지 제25항 중 어느 한 항의 단리된 핵산을 포함하는 벡터.
  27. 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터.
  28. 제27항에 있어서, 인간 야생형 ACVR1을 표적화하는 마이크로RNA와 상보적인 1개 이상의 miRNA 결합 부위를 포함하는 벡터.
  29. 제27항에 있어서, 인간 코돈 최적화된 ACVR1을 표적화하는 마이크로RNA와 상보적인 1개 이상의 miRNA 결합 부위를 포함하는 벡터.
  30. 제27항에 있어서, 인간 ACVR1-R206H를 표적화하는 마이크로RNA와 상보적인 1개 이상의 miRNA 결합 부위를 포함하는 벡터.
  31. 제27항 내지 제30항 중 어느 한 항에 있어서, 레닐라 루시페라제 리포터 유전자를 추가로 포함하는 벡터.
  32. 제27항에 있어서, 숙주 세포를 추가로 포함하며, 임의로 여기서 숙주 세포는 진핵 세포이고, 추가로 임의로 여기서 숙주 세포는 포유동물 세포인 벡터.
  33. 제32항에 있어서, 포유동물 세포가 HEK293 세포인 벡터.
  34. 제27항에 있어서, 서열식별번호: 5, 6 및 56-65 중 어느 하나에 제시된 서열을 포함하며, ACVR1-R206H의 발현을 감소시키는 벡터.
  35. 제34항에 있어서, 서열이 서열식별번호: 59 또는 60인 벡터.
  36. (a) ACVR1 단백질을 코딩하는 내인성 mRNA와 혼성화하여 그의 발현을 억제하기에 충분한, 대상체의 내인성 mRNA와 상보적인 서열을 갖는 핵산을 포함하는 인공 miRNA (ami-RNA)를 코딩하는 제1 영역; 및
    (b) ACVR1을 코딩하는 코돈 최적화된 핵산 서열을 포함하는 트랜스진을 코딩하는 제2 영역
    을 포함하는 단리된 핵산.
  37. 제36항에 있어서, 바이러스 벡터 내에 위치하는 단리된 핵산.
  38. 제37항에 있어서, 바이러스 벡터가 아데노-연관 바이러스 (AAV) 벡터인 단리된 핵산.
  39. 제38항에 있어서, AAV 벡터가 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh.8, AAV9, AAVrh.10, AAVrh39, 및 AAVrh.43으로부터 선택된 캡시드 단백질에 의해 캡시드화된 것인 단리된 핵산.
  40. 제36항에 있어서, ami-RNA 및 트랜스진이 프로모터에 작동가능하게 연결된 것인 단리된 핵산.
  41. 제40항에 있어서, 프로모터가 닭 베타-액틴 (CBA) 프로모터인 단리된 핵산.
  42. 제41항에 있어서, CBA 프로모터가 벡터 내에 CBA 인트론을 포함하는 것인 단리된 핵산.
  43. 제41항에 있어서, CBA 프로모터가 벡터 내에 서열식별번호: 37에 제시된 바와 같은 서열을 포함하는 매스바이올로직스 신규 (MBL) 인트론을 포함하는 것인 단리된 핵산.
  44. 제36항에 있어서, ACVR1 단백질이 구아닌에서 아데닌으로의 단일 염기 돌연변이를 갖는 돌연변이된 단백질인 단리된 핵산.
  45. 제36항에 있어서, ACVR1 단백질이 인간 ACVR1-R206H인 단리된 핵산.
  46. 제36항 내지 제41항 중 어느 한 항에 있어서, 서열식별번호: 25-28 중 어느 하나에 제시된 서열을 포함하는 단리된 핵산.
  47. 제36항 내지 제46항 중 어느 한 항에 있어서, ami-RNA가 인간 miRNA 백본, 임의로 인간 miR-33 백본을 포함하는 것인 단리된 핵산.
  48. 제36항 내지 제47항 중 어느 한 항에 있어서, ami-RNA 및 트랜스진이 ACVR1-R206H를 야생형 ACVR1로 대체하는 것인 단리된 핵산.
  49. 서열식별번호: 25-28 중 어느 하나에 제시된 서열을 포함하는 벡터.
  50. 제49항에 있어서, 숙주 세포를 추가로 포함하며, 임의로 여기서 숙주 세포는 진핵 세포이고, 추가로 임의로 여기서 숙주 세포는 포유동물 세포인 벡터.
  51. 제50항에 있어서, 포유동물 세포가 HEK293 세포인 벡터.
  52. (a) ACVR1 유전자의 표적 핵산 서열에 특이적으로 혼성화하는 단일 가이드 RNA (sgRNA);
    (b) 제1 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제1 rAAV 입자; 및
    (c) 제2 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제2 rAAV 입자
    를 포함하는 재조합 유전자 편집 복합체.
  53. 제52항에 있어서, 제1 재조합 유전자 편집 단백질이 Cas9-기반 아데닌 염기 편집제 (ABE) N-말단 부분 및 그의 단편을 포함하는 것인 재조합 유전자 편집 복합체.
  54. 제52항에 있어서, 제2 재조합 유전자 편집 단백질이 Cas9-기반 아데닌 염기 편집제 (ABE) C-말단 부분 및 그의 단편을 포함하는 것인 재조합 유전자 편집 복합체.
  55. 제52항에 있어서, 프로토스페이서 인접 모티프를 추가로 포함하는 재조합 유전자 편집 복합체.
  56. 제52항 내지 제55항 중 어느 한 항에 있어서, 재조합 유전자 편집 단백질이 Crisper/Cas9 시스템의 단백질인 재조합 유전자 편집 복합체.
  57. 제52항 내지 제56항 중 어느 한 항에 있어서, 제1 및 제2 rAAV 입자가 AAV9 캡시드 단백질 또는 그의 변이체를 포함하는 것인 재조합 유전자 편집 복합체.
  58. 제52항 내지 제56항 중 어느 한 항에 있어서, 제1 및 제2 rAAV 입자가 AAV6.2 캡시드 단백질 또는 그의 변이체를 포함하는 것인 재조합 유전자 편집 복합체.
  59. 제53항 또는 제54항에 있어서, 각각의 N-말단 ABE 구축물 및 C-말단 ABE 구축물이 트랜스-스플라이싱 인테인 서열을 사용하는 것에 의해 나뉘는 것인 재조합 유전자 편집 복합체.
  60. 제52항에 있어서, N-말단 ABE 구축물이 ACVR1-R206H 돌연변이를 갖는 프로토스페이서를 포함하는 것인 재조합 유전자 편집 복합체.
  61. 제52항에 있어서, C-말단 ABE 구축물이 AAV6.2 또는 AAV9 캡시드 단백질 내로 통합된 것인 재조합 유전자 편집 복합체.
  62. 제52항에 있어서, ABE가 ACVR1-R206H 대립유전자에서 아데닌을 구아닌으로 전환시키는 것인 재조합 유전자 편집 복합체.
  63. (a) 제1항 내지 제13항, 제15항 내지 제25항, 및 제36항 내지 제48항 중 어느 한 항의 단리된 핵산; 및
    (b) 적어도 1개의 AAV 캡시드 단백질
    을 포함하는 재조합 아데노-연관 바이러스 (rAAV).
  64. 제63항에 있어서, 캡시드 단백질이 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh.8, AAV9, AAVrh.10, AAVrh39, 및 AAVrh.43으로부터 선택된 혈청형의 것인 재조합 rAAV.
  65. 제63항에 있어서, rAAV가 자기-상보적 AAV (scAAV)인 재조합 rAAV.
  66. NF-kB 프로모터 (pNF-kB)를 포함하는 제1 트랜스진 및 골 형태발생 단백질 프로모터 (pBRE)를 포함하는 제2 트랜스진을 포함하며, AAV 벡터 내로 통합된 단리된 핵산.
  67. 제66항에 있어서, AAV 벡터가 rAAV9 벡터인 단리된 핵산.
  68. 제66항 또는 제67항에 있어서, AAV 벡터가 적어도 1개의 역전된 말단 반복부 (ITR)를 포함하는 것인 단리된 핵산.
  69. 제66항 내지 제68항 중 어느 한 항에 있어서, 가우시아 리포터 유전자 (eBRE/NF-kB-Luc)를 추가로 포함하는 단리된 핵산.
  70. 제66항 내지 제68항 중 어느 한 항에 있어서, pNF-kB가 가용성 폴리스타틴 (sFST)의 발현을 유도하는 것인 단리된 핵산.
  71. 제66항 내지 제70항 중 어느 한 항에 있어서, pBRE가 TNFR2의 발현을 유도하는 것인 단리된 핵산.
  72. 제66항 내지 제71항 중 어느 한 항에 있어서, 액티빈 A, BMP 리간드, 및/또는 염증이 sFST 및 TNFR2의 발현을 촉발하는 것인 단리된 핵산.
  73. 제72항에 있어서, 염증이 염증성 시토카인에 의해 유도되는 것인 단리된 핵산.
  74. 제72항에 있어서, sFST 및 TNFR2의 발현이 플레어-업 상태에서 액티빈 A 및/또는 TNF 신호전달 경로를 억제하는 것인 단리된 핵산.
  75. 제66항에 있어서, pNF-kB가 PB2 프로모터 (서열식별번호: 30)인 단리된 핵산.
  76. 제66항에 있어서, pBRE가 서열식별번호: 31의 서열을 포함하는 것인 단리된 핵산.
  77. 제66항 내지 제76항 중 어느 한 항에 있어서, 서열식별번호: 32의 서열을 포함하는 단리된 핵산.
  78. 제66항 내지 제77항 중 어느 한 항에 있어서, 인간 가용성 IL1Rα (서열식별번호: 35)의 발현을 추가로 유도하는 단리된 핵산.
  79. 가용성 폴리스타틴 (sFST)을 코딩하는 핵산 서열을 포함하는 제1 트랜스진 및 TNFR2를 코딩하는 핵산 서열을 포함하는 제2 트랜스진을 포함하며, 여기서 제1 및 제2 트랜스진은 프로모터에 작동가능하게 연결된 것인 단리된 핵산.
  80. 제79항에 있어서, 인공 miRNA (ami-RNA)를 코딩하는 트랜스진을 추가로 포함하는 단리된 핵산.
  81. 제80항에 있어서, ami-RNA가 miR-122를 포함하는 것인 단리된 핵산.
  82. 제80항에 있어서, miR-122가 3'-비번역 영역 (3'-UTR)에 위치하는 것인 단리된 핵산.
  83. 제79항에 있어서, 프로모터가 닭 베타-액틴 (CBA) 프로모터인 단리된 핵산.
  84. 제79항에 있어서, 프로모터가 pBRE/pNF-kB 프로모터인 단리된 핵산.
  85. 제79항 내지 제84항 중 어느 한 항에 있어서, 벡터 내에 위치하는 단리된 핵산.
  86. 제85항에 있어서, 벡터가 AAV 벡터인 단리된 핵산.
  87. 제79항 내지 제86항 중 어느 한 항에 있어서, 서열식별번호: 33의 서열을 포함하는 단리된 핵산.
  88. 제80항 내지 제82항 중 어느 한 항에 있어서, miR-122가 서열식별번호: 34의 서열을 포함하는 재조합 AAV 벡터 내로 통합된 것인 단리된 핵산.
  89. 제79항 내지 제87항 중 어느 한 항에 있어서, sFST 및/또는 TNFR2의 발현이 TNF 및 액티빈 A의 활성화를 억제하는 것인 단리된 핵산.
  90. 진행성 골화성 섬유이형성증 (FOP)을 갖거나 갖는 것으로 의심되는 대상체에게 제1항 내지 제13항, 제15항 내지 제25항, 제36항 내지 제48항 및 제65항 내지 제88항 중 어느 한 항의 단리된 핵산, 제14항, 제26항 내지 제35항 및 제49항 내지 제51항 중 어느 한 항의 벡터, 제51항 내지 제61항 중 어느 한 항의 재조합 유전자 편집 복합체, 또는 제62항 내지 제64항 중 어느 한 항의 rAAV를 투여하는 것을 포함하는, 상기 대상체를 치료하는 방법.
  91. 대상체에게 제1항 내지 제13항, 제15항 내지 제25항, 제36항 내지 제48항 및 제65항 내지 제88항 중 어느 한 항의 단리된 핵산, 제14항, 제26항 내지 제35항 및 제49항 내지 제51항 중 어느 한 항의 벡터, 제51항 내지 제61항 중 어느 한 항의 재조합 유전자 편집 복합체, 또는 제62항 내지 제64항 중 어느 한 항의 rAAV를 투여하는 것을 포함하는, 대상체에서 이소성 골화를 억제하는 방법.
  92. 진행성 골화성 섬유이형성증 (FOP)을 갖거나 갖는 것으로 의심되는 대상체에게 제1항 내지 제13항, 제15항 내지 제25항, 제36항 내지 제48항 및 제65항 내지 제88항 중 어느 한 항의 단리된 핵산, 제14항, 제26항 내지 제35항 및 제49항 내지 제51항 중 어느 한 항의 벡터, 제51항 내지 제61항 중 어느 한 항의 재조합 유전자 편집 복합체, 또는 제62항 내지 제64항 중 어느 한 항의 rAAV를 투여하는 것을 포함하는, 상기 대상체에서 플레어-업 상태를 개선시키는 방법.
  93. 세포에 제1항 내지 제13항, 제15항 내지 제25항, 제36항 내지 제48항 및 제65항 내지 제88항 중 어느 한 항의 단리된 핵산, 제14항, 제26항 내지 제35항 및 제49항 내지 제51항 중 어느 한 항의 벡터, 제51항 내지 제61항 중 어느 한 항의 재조합 유전자 편집 복합체, 또는 제62항 내지 제64항 중 어느 한 항의 rAAV를 전달하는 것을 포함하는, 세포에서 ACVR1 발현을 억제하는 방법.
  94. 제90항 내지 제93항 중 어느 한 항에 있어서, 대상체가 돌연변이체 ACVR1 단백질, 임의로 ACVR1-R206H 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.
  95. 제90항 내지 제94항 중 어느 한 항에 있어서, 대상체가 포유동물 대상체, 임의로 인간 대상체인 방법.
  96. 제90항 내지 제95항 중 어느 한 항에 있어서, 투여 또는 전달이 주사에 의해 이루어지고, 임의로 여기서 주사는 정맥내 주사인 방법.
  97. 제90항 내지 제95항 중 어느 한 항에 있어서, 투여 또는 전달이 제62항 내지 제64항 중 어느 한 항의 rAAV를 포함하는 조직 또는 이식편을 대상체 내로 이식하는 것에 의해 이루어지는 것인 방법.
  98. 제90항 내지 제95항 중 어느 한 항에 있어서, 투여 또는 전달이 진피간 전달에 의해 이루어지는 것인 방법.
  99. 제90항 내지 제97항 중 어느 한 항에 있어서, 투여 또는 전달이 대상체에서 이소성 골화의 감소 및/또는 플레어-업 상태의 감소를 발생시키는 것인 방법.
  100. 제90항 내지 제97항 중 어느 한 항에 있어서, 투여 또는 전달이 돌연변이체 ACVR1 단백질의 감소된 발현을 발생시키는 것인 방법.
KR1020237022052A 2020-12-03 2021-12-02 진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의개발 KR20230117177A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063121221P 2020-12-03 2020-12-03
US63/121,221 2020-12-03
US202163251822P 2021-10-04 2021-10-04
US63/251,822 2021-10-04
PCT/US2021/061653 WO2022120080A1 (en) 2020-12-03 2021-12-02 Development of novel gene therapeutics for fibrodysplasia ossificans progressiva

Publications (1)

Publication Number Publication Date
KR20230117177A true KR20230117177A (ko) 2023-08-07

Family

ID=81850431

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237022052A KR20230117177A (ko) 2020-12-03 2021-12-02 진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의개발

Country Status (4)

Country Link
US (2) US11674154B2 (ko)
EP (1) EP4255457A1 (ko)
KR (1) KR20230117177A (ko)
WO (1) WO2022120080A1 (ko)

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5549910A (en) 1989-03-31 1996-08-27 The Regents Of The University Of California Preparation of liposome and lipid complex compositions
US5252334A (en) 1989-09-08 1993-10-12 Cygnus Therapeutic Systems Solid matrix system for transdermal drug delivery
JP3218637B2 (ja) 1990-07-26 2001-10-15 大正製薬株式会社 安定なリポソーム水懸濁液
JP2958076B2 (ja) 1990-08-27 1999-10-06 株式会社ビタミン研究所 遺伝子導入用多重膜リポソーム及び遺伝子捕捉多重膜リポソーム製剤並びにその製法
US5399363A (en) 1991-01-25 1995-03-21 Eastman Kodak Company Surface modified anticancer nanoparticles
US5478745A (en) 1992-12-04 1995-12-26 University Of Pittsburgh Recombinant viral vector system
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
US5741516A (en) 1994-06-20 1998-04-21 Inex Pharmaceuticals Corporation Sphingosomes for enhanced drug delivery
US5795587A (en) 1995-01-23 1998-08-18 University Of Pittsburgh Stable lipid-comprising drug delivery complexes and methods for their production
US5697899A (en) 1995-02-07 1997-12-16 Gensia Feedback controlled drug delivery system
IE80468B1 (en) 1995-04-04 1998-07-29 Elan Corp Plc Controlled release biodegradable nanoparticles containing insulin
US5738868A (en) 1995-07-18 1998-04-14 Lipogenics Ltd. Liposome compositions and kits therefor
US6001650A (en) 1995-08-03 1999-12-14 Avigen, Inc. High-efficiency wild-type-free AAV helper functions
US5656016A (en) 1996-03-18 1997-08-12 Abbott Laboratories Sonophoretic drug delivery system
US5797898A (en) 1996-07-02 1998-08-25 Massachusetts Institute Of Technology Microchip drug delivery devices
US5783208A (en) 1996-07-19 1998-07-21 Theratech, Inc. Transdermal drug delivery matrix for coadministering estradiol and another steroid
US5779708A (en) 1996-08-15 1998-07-14 Cyberdent, Inc. Intraosseous drug delivery device and method
US6156303A (en) 1997-06-11 2000-12-05 University Of Washington Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom
DE69942782D1 (de) * 1998-11-27 2010-10-28 Ucb Sa Zusammensetzungen und Verfahren zur Erhöhung der Knochenmineralisierung
US8859752B2 (en) * 2006-04-18 2014-10-14 The Trustees Of The University Of Pennsylvania SIRNA-based therapy of Fibrodyplasia Ossificans Progressiva (FOP)
WO2007127428A2 (en) * 2006-04-28 2007-11-08 University Of Florida Research Foundation, Inc. Double-stranded/self-complementary vectors with a truncated cba promoter and methods of gene delivery
US8785395B2 (en) * 2010-05-03 2014-07-22 The Texas A & M University System Adult stem cells/progenitor cells and stem cell proteins for treatment of eye injuries and diseases
DE102013111099B4 (de) * 2013-10-08 2023-11-30 Eberhard Karls Universität Tübingen Medizinische Fakultät Permanente Genkorrektur mittels nukleotidmodifizierter messenger RNA
WO2016131009A1 (en) * 2015-02-13 2016-08-18 University Of Massachusetts Compositions and methods for transient delivery of nucleases
US11046955B2 (en) * 2015-04-24 2021-06-29 University Of Massachusetts Modified AAV constructs and uses thereof
WO2020118011A1 (en) * 2018-12-06 2020-06-11 Alexion Pharmaceuticals, Inc. Anti-alk2 antibodies and uses thereof
JP2022520148A (ja) * 2018-12-06 2022-03-29 アークトゥラス・セラピューティクス・インコーポレイテッド 修飾タンパク質および関連の処置方法

Also Published As

Publication number Publication date
US20220177915A1 (en) 2022-06-09
US20230295662A1 (en) 2023-09-21
EP4255457A1 (en) 2023-10-11
WO2022120080A1 (en) 2022-06-09
US11674154B2 (en) 2023-06-13

Similar Documents

Publication Publication Date Title
AU2021204620A1 (en) Central nervous system targeting polynucleotides
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
KR20180097631A (ko) 핵산을 와우 및 전정 세포에 전달하기 위한 물질 및 방법
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
JP2023036921A (ja) 蝸牛および前庭細胞に核酸を送達するための物質および方法
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
US20040003420A1 (en) Modified recombinase
KR102628872B1 (ko) 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법
CN111733174B (zh) 一种分离的核酸分子及其用途
US11939594B2 (en) Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins
BRPI0806354A2 (pt) plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados
KR101921698B1 (ko) 재조합에 의해 제조된 인간 인자 ⅷ 및 ⅸ
CA3060523A1 (en) A platform for t lymphocyte genome engineering and in vivo high-throughput screening thereof
CN112912112A (zh) 肝特异性核酸调节元件以及其方法及用途
KR20210151916A (ko) 뒤시엔느 근육 이영양증의 치료를 위한 aav 벡터-매개된 큰 돌연변이 핫스팟의 결실
EP1943265A2 (en) Regulatable fusion promoters
CN108992665B (zh) 基于重组减毒单增李斯特菌的宫颈癌治疗性疫苗
CN114008209A (zh) Aav介导的枫糖尿症(msud)基因疗法
CN109010819B (zh) 重组减毒李斯特菌在制备宫颈癌治疗性疫苗中的应用
EP1395612A2 (en) Modified recombinase
KR20220142502A (ko) 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도
KR20230117177A (ko) 진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의개발
KR20240032025A (ko) 내이의 세포 유형-특이적 유전자 발현을 위한 조성물 및 방법
CN113260704B (zh) CYP4V2和RdCVF在制备药物中的用途
NL2027815B1 (en) Genomic integration