KR20230117177A - 진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의개발 - Google Patents
진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의개발 Download PDFInfo
- Publication number
- KR20230117177A KR20230117177A KR1020237022052A KR20237022052A KR20230117177A KR 20230117177 A KR20230117177 A KR 20230117177A KR 1020237022052 A KR1020237022052 A KR 1020237022052A KR 20237022052 A KR20237022052 A KR 20237022052A KR 20230117177 A KR20230117177 A KR 20230117177A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- isolated nucleic
- vector
- acvr1
- aav
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1138—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/45—Transferases (2)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
- A61K48/0066—Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/08—Drugs for skeletal disorders for bone diseases, e.g. rachitism, Paget's disease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/11—Protein-serine/threonine kinases (2.7.11)
- C12Y207/1103—Receptor protein serine/threonine kinase (2.7.11.30)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/14—Type of nucleic acid interfering N.A.
- C12N2310/141—MicroRNAs, miRNAs
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/34—Allele or polymorphism specific uses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/008—Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
Abstract
일부 측면에서, 본 개시내용은 대상체에서 진행성 골화성 섬유이형성증 (FOP)을 치료하기 위한 조성물 및 방법에 관한 것이다. 일부 측면에서, 본 개시내용은 근육 세포 또는 결합 조직에서 돌연변이된 AVCR1 유전자의 발현을 억제하는 (예를 들어, 감소시키는) 트랜스진을 발현하도록 구성된 단리된 핵산, 및 벡터, 예컨대 rAAV 벡터를 제공한다.
Description
관련 출원에 대한 상호 참조
본 출원은 35 U.S.C. 119(e) 하에 2020년 12월 3일에 출원된 발명의 명칭 "DEVELOPMENT OF NOVEL GENE THERAPEUTICS FOR FIBRODYSPLASIA OSSIFICANS PROGRESSIVA"의 미국 가출원 번호 63/121,221 및 2021년 10월 4일에 출원된 발명의 명칭 "DEVELOPMENT OF NOVEL GENE THERAPEUTICS FOR FIBRODYSPLASIA OSSIFICANS PROGRESSIVA"의 미국 가출원 번호 63/251,822의 이익을 주장하며, 이들 각각의 전체 개시내용은 그 전문이 본원에 참조로 포함된다.
EFS-웹을 통해 텍스트 파일로서 제출된 서열 목록에 대한 참조
본 출원은 EFS-웹을 통해 ASCII 포맷으로 제출된 서열 목록을 함유하며, 이는 그 전문이 본원에 참조로 포함된다. 2021년 12월 2일에 생성된 ASCII 파일은 U012070152WO00-SEQ-SXT로 명명되고, 232,210 바이트 크기이다.
진행성 골화성 섬유이형성증 (FOP)은 1.36백만명 내지 2백만명당 1명의 발생률로 발생한다. 환자는 골격근 및 결합 조직에서 비정상적 골 형성을 나타낸다. 이러한 이소성 골화 (HO)는 골격근, 건, 및 연골에서의 진행성 골격외 골 형성을 통해 부동 및 중증 통증으로 이어진다. 그러나, 증상 완화로서 강렬한 통증 및 부종을 감소시킬 수 있는, 플레어-업 상태를 위한 고용량의 코르티코스테로이드를 제외하고는, 어떠한 효과적인 치료도 현재 이용가능하지 않다.
본 개시내용의 측면은 진행성 골화성 섬유이형성증 (FOP)을 치료하거나 또는 FOP와 연관된 플레어-업 상태를 감소시키기 위한 조성물 및 방법에 관한 것이다. 본 개시내용은, 부분적으로, 돌연변이된 ACVR1 유전자 발현의 억제, 이소성 골화 감소, 및 야생형 ACVR1 유전자 발현의 촉진을 필요로 하는 대상체에서 돌연변이된 ACVR1 유전자의 발현을 억제하고, 이소성 골화를 감소시키고, 야생형 ACVR1 유전자의 발현을 촉진하는 1종 이상의 트랜스진, 예컨대 억제 핵산 또는 코돈 최적화된 단백질을 코딩하는 단리된 핵산 및 발현 구축물을 기초로 한다.
따라서, 일부 측면에서, 본 개시내용은 ACVR1을 코딩하는 코돈 최적화된 핵산 서열에 작동가능하게 연결된 프로모터를 포함하는 트랜스진을 포함하는 단리된 핵산을 제공한다.
일부 실시양태에서, 단리된 핵산은 벡터 내에 위치한다. 일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 CBA 인트론을 포함한다. 일부 실시양태에서, CBA 프로모터는 서열식별번호(SEQ ID NO): 37에 제시된 바와 같은 서열을 포함하는 매스바이올로직스(MassBiologics) 신규 (MBL) 인트론을 포함한다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 서열식별번호: 36에 제시된 바와 같은 서열을 포함하는 합성 인트론을 포함한다.
일부 실시양태에서, MBL 인트론은 (예를 들어, CBA 프로모터 등을 갖는 벡터 게놈의 크기에 비해) 벡터 게놈의 크기를 감소시킨다. 일부 실시양태에서, 합성 인트론은 벡터 게놈의 크기를 감소시킨다. 일부 실시양태에서, 벡터 게놈의 크기는 적어도 15-25%만큼 감소된다.
일부 실시양태에서, 인트론은 프로모터와 코돈 최적화된 ACVR1을 코딩하는 트랜스진 서열 사이에 존재한다. 일부 실시양태에서, 코돈 최적화된 ACVR1은 서열식별번호: 1에 제시된 바와 같은 서열을 포함한다.
일부 실시양태에서, 벡터는 플라스미드이다. 일부 실시양태에서, 벡터는 바크미드이다. 일부 실시양태에서, 벡터는 코스미드이다. 일부 실시양태에서, 벡터는 바이러스, 폐쇄형-단부 선형 DNA (ceDNA)이다. 일부 실시양태에서, 벡터는 바큘로바이러스 벡터이다. 일부 실시양태에서, 벡터는 아데노-연관 바이러스 (AAV) 벡터이다.
일부 실시양태에서, 트랜스진에 AAV 역전된 말단 반복부 (ITR)가 플랭킹된다.
일부 실시양태에서, 본 개시내용은 서열식별번호: 2-4 중 어느 하나에 제시된 서열을 포함하는 단리된 핵산을 포함하는 벡터를 제공한다. 일부 실시양태에서, 단리된 핵산 또는 벡터는 ACVR1-R206H에 의한 골 형태발생 단백질 (BMP) 신호전달의 활성화를 감소시킨다.
일부 측면에서, 본 개시내용은 내인성 mRNA와 혼성화하여 그의 발현을 억제하기에 충분한, 대상체의 내인성 mRNA와 상보적인 서열을 갖는 핵산을 포함하는 인공 miRNA (ami-RNA)를 포함하는 단리된 핵산을 제공한다. 일부 실시양태에서, 내인성 mRNA는 ACVR1 단백질을 코딩한다.
일부 실시양태에서, ACVR1 단백질은 야생형 ACVR1의 서열의 위치 206에서 구아닌에서 아데닌으로의 단일 염기 돌연변이를 포함한다. 일부 실시양태에서, ACVR1 단백질은 인간 ACVR1-R206H이다. 일부 실시양태에서, ami-RNA는 서열식별번호: 5, 6 및 56-65 중 어느 하나에 제시된 서열에 의해 코딩된다.
일부 실시양태에서, 단리된 핵산은 벡터 내에 위치한다. 일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 벡터는 플라스미드이다. 일부 실시양태에서, 벡터는 바크미드이다. 일부 실시양태에서, 벡터는 코스미드이다. 일부 실시양태에서, 벡터는 바이러스, 폐쇄형-단부 선형 DNA (ceDNA)이다. 일부 실시양태에서, 벡터는 바큘로바이러스 벡터이다. 일부 실시양태에서, 벡터는 아데노-연관 바이러스 (AAV) 벡터이다.
일부 실시양태에서, 바이러스 벡터는 아데노-연관 바이러스 (AAV) 벡터이다. 일부 실시양태에서, AAV 벡터는 적어도 1개의 역전된 말단 반복부 (ITR)를 포함한다. 일부 실시양태에서, ami-RNA는 인간 miRNA 백본을 포함한다. 일부 실시양태에서, ami-RNA는 인간 miR-33 백본이다.
일부 실시양태에서, 본 개시내용은 서열식별번호: 5, 6, 10-21 및 56-65 중 어느 하나에 제시된 서열을 포함하는 단리된 핵산을 포함하는 벡터를 제공한다. 일부 실시양태에서, 본 개시내용은 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터를 제공한다.
일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 인간 야생형 ACVR1을 표적화하는 마이크로RNA와 상보적인 1개 이상의 miRNA 결합 부위를 포함한다. 일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 인간 코돈 최적화된 ACVR1에 상보적인 1개 이상의 miRNA 결합 부위를 포함한다. 일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 인간 ACVR1-R206H에 상보적인 1개 이상의 miRNA 결합 부위를 포함한다.
일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 레닐라 루시페라제 리포터 유전자를 추가로 포함한다. 일부 실시양태에서, 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터는 숙주 세포를 추가로 포함한다. 일부 실시양태에서, 숙주 세포는 진핵 세포이다. 일부 실시양태에서, 숙주 세포는 포유동물 세포이다. 일부 실시양태에서, 포유동물 세포는 HEK293 세포이다.
일부 실시양태에서, 벡터는 서열식별번호: 5, 6, 10-16, 18-21 및 56-65 중 어느 하나에 제시된 서열을 포함하며, ACVR1-R206H의 발현을 감소시킨다. 일부 실시양태에서, 서열은 서열식별번호: 59 또는 60이다.
본 개시내용은 (a) ACVR1 단백질을 코딩하는 내인성 mRNA와 혼성화하여 그의 발현을 억제하기에 충분한, 대상체의 내인성 mRNA와 상보적인 서열을 갖는 핵산을 포함하는 인공 miRNA (ami-RNA)를 코딩하는 제1 영역; 및 (b) ACVR1을 코딩하는 코돈 최적화된 핵산 서열을 포함하는 트랜스진을 코딩하는 제2 영역을 포함하는 단리된 핵산을 제공한다.
일부 실시양태에서, 단리된 핵산은 바이러스 벡터 내에 위치한다. 일부 실시양태에서, 바이러스 벡터는 아데노-연관 바이러스 (AAV) 벡터이다. 일부 실시양태에서, AAV 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh.8, AAV9, AAVrh.10, AAVrh39, 및 AAVrh.43으로부터 선택된 캡시드 단백질에 의해 캡시드화된다.
일부 실시양태에서, ami-RNA 및 트랜스진은 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 CBA 인트론을 포함한다.
일부 실시양태에서, CBA 프로모터는 벡터 내에 서열식별번호: 37에 제시된 바와 같은 서열을 포함하는 매스바이올로직스 신규 (MBL) 인트론을 포함한다. 일부 실시양태에서, ACVR1 단백질은 구아닌에서 아데닌으로의 단일 염기 돌연변이를 갖는 돌연변이된 단백질이다. 일부 실시양태에서, ACVR1 단백질은 인간 ACVR1-R206H이다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 25-28 중 어느 하나에 제시된 서열을 포함한다.
일부 실시양태에서, ami-RNA는 인간 miRNA 백본을 포함한다. 일부 실시양태에서, 인간 miRNA 백본은 인간 miR-33 백본이다.
일부 실시양태에서, ami-RNA 및 트랜스진은 ACVR1-R206H를 야생형 ACVR1로 대체한다. 일부 실시양태에서, 본 개시내용은 서열식별번호: 25-28 중 어느 하나에 제시된 서열을 포함하는 벡터를 제공한다. 일부 실시양태에서, 벡터는 숙주 세포를 추가로 포함한다. 일부 실시양태에서, 숙주 세포는 진핵 세포이다. 일부 실시양태에서, 숙주 세포는 포유동물 세포이다. 일부 실시양태에서, 포유동물 세포는 HEK293 세포이다.
본 개시내용은 (a) ACVR1 유전자의 표적 핵산 서열에 특이적으로 혼성화하는 단일 가이드 RNA (sgRNA); (b) 제1 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제1 rAAV 입자; 및 (c) 제2 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제2 rAAV 입자를 포함하는 재조합 유전자 편집 복합체를 제공한다.
일부 실시양태에서, 제1 재조합 유전자 편집 단백질은 Cas9-기반 아데닌 염기 편집제 (ABE) N-말단 부분 및 그의 단편을 포함한다.
일부 실시양태에서, 제2 재조합 유전자 편집 단백질은 Cas9-기반 아데닌 염기 편집제 (ABE) C-말단 부분 및 그의 단편을 포함한다.
일부 실시양태에서, 재조합 유전자 편집 복합체는 프로토스페이서 인접 모티프를 추가로 포함한다. 일부 실시양태에서, 재조합 유전자 편집 단백질은 Crisper/Cas9 시스템의 단백질이다. 일부 실시양태에서, 제1 및 제2 rAAV 입자는 AAV9 캡시드 단백질 또는 그의 변이체를 포함한다. 일부 실시양태에서, 제1 및 제2 rAAV 입자는 AAV6.2 캡시드 단백질 또는 그의 변이체를 포함한다.
일부 실시양태에서, 각각의 N-말단 ABE 구축물 및 C-말단 ABE 구축물은 트랜스-스플라이싱 인테인 서열을 사용하는 것에 의해 나뉜다. 일부 실시양태에서, N-말단 ABE 구축물은 ACVR1-R206H 돌연변이를 갖는 프로토스페이서를 포함한다. 일부 실시양태에서, C-말단 ABE 구축물은 AAV6.2 또는 AAV9 캡시드 단백질 내로 통합된다. 일부 실시양태에서, ABE는 ACVR1-R206H 대립유전자에서 아데닌을 구아닌으로 전환시킨다.
본 개시내용은 (a) 본원에 개시된 바와 같은 단리된 핵산 및 (b) 적어도 1개의 AAV 캡시드 단백질을 포함하는 재조합 아데노-연관 바이러스 (rAAV)를 제공한다.
일부 실시양태에서, 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh.8, AAV9, AAVrh.10, AAVrh39, 및 AAVrh.43으로부터 선택된 혈청형의 것이다. 일부 실시양태에서, rAAV는 자기-상보적 AAV (scAAV)이다.
일부 측면에서, 본 개시내용은 NF-kB 프로모터 (pNF-kB)를 포함하는 제1 트랜스진 및 골 형태발생 단백질 프로모터 (pBRE)를 포함하는 제2 트랜스진을 포함하며, AAV 벡터 내로 통합된 단리된 핵산을 제공한다.
일부 실시양태에서, AAV 벡터는 rAAV9 벡터이다. 일부 실시양태에서, AAV 벡터는 적어도 1개의 역전된 말단 반복부 (ITR)를 포함한다.
일부 실시양태에서, 단리된 핵산은 가우시아 리포터 유전자 (eBRE/NF-kB-Luc)를 추가로 포함한다. 일부 실시양태에서, pNF-kB는 가용성 폴리스타틴 (sFST)의 발현을 유도한다. 일부 실시양태에서, pBRE는 TNFR2의 발현을 유도한다.
일부 실시양태에서, 액티빈 A는 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, BMP 리간드는 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, 염증은 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, 염증은 염증성 시토카인에 의해 유도된다. 일부 실시양태에서, sFST 및 TNFR2의 발현은 플레어-업 상태에서 액티빈 A 및/또는 TNF 신호전달 경로를 억제한다.
일부 실시양태에서, pNF-kB는 PB2 프로모터 (서열식별번호: 30)이다. 일부 실시양태에서, pBRE는 서열식별번호: 31의 서열을 포함한다.
일부 실시양태에서, 단리된 핵산은 서열식별번호: 32의 서열을 포함한다. 일부 실시양태에서, 단리된 핵산은 인간 가용성 IL1Rα (서열식별번호: 35)의 발현을 추가로 유도한다.
본 개시내용은 가용성 폴리스타틴 (sFST)을 코딩하는 핵산 서열을 포함하는 제1 트랜스진 및 TNFR2를 코딩하는 핵산 서열을 포함하는 제2 트랜스진을 포함하며, 여기서 제1 및 제2 트랜스진은 프로모터에 작동가능하게 연결된 것인 단리된 핵산을 제공한다.
일부 실시양태에서, 단리된 핵산은 인공 miRNA (ami-RNA)를 코딩하는 트랜스진을 추가로 포함한다. 일부 실시양태에서, ami-RNA는 miR-122를 포함한다.
일부 실시양태에서, miR-122는 3'-비번역 영역 (3'-UTR)에 위치한다.
일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 프로모터는 pBRE/pNF-kB 프로모터이다.
일부 실시양태에서, 단리된 핵산은 벡터 내에 위치한다. 일부 실시양태에서, 벡터는 AAV 벡터이다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 33의 서열을 포함한다. 일부 실시양태에서, miR-122는 서열식별번호: 34의 서열을 포함하는 재조합 AAV 벡터 내로 통합된다.
일부 실시양태에서, sFST 및/또는 TNFR2의 발현은 TNF 및 액티빈 A의 활성화를 억제한다.
본 개시내용은 진행성 골화성 섬유이형성증 (FOP)을 갖거나 갖는 것으로 의심되는 대상체를 치료하는 방법을 제공한다. 본 개시내용은 대상체에서 이소성 골화를 억제하는 방법을 제공한다. 본 개시내용은 대상체에서 이소성 골화를 억제하는 방법을 제공한다. 본 개시내용은 진행성 골화성 섬유이형성증 (FOP)을 갖거나 갖는 것으로 의심되는 대상체에서 플레어-업 상태를 개선시키는 방법을 제공한다. 본 개시내용은 세포에 단리된 핵산을 전달하는 것을 포함하는, 세포에서 ACVR1 발현을 억제하는 방법을 제공한다.
일부 실시양태에서, 본원에 개시된 바와 같은 방법은 대상체에게 본원에 개시된 바와 같은 단리된 핵산, 벡터, 재조합 유전자 편집 복합체 또는 rAAV를 투여하는 것을 포함한다.
일부 실시양태에서, 대상체는 돌연변이체 ACVR1 단백질을 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 돌연변이체 ACVR1 단백질은 ACVR1-R206H 단백질이다.
일부 실시양태에서, 대상체는 포유동물 대상체이다. 일부 실시양태에서, 포유동물 대상체는 인간 대상체이다.
일부 실시양태에서, 투여 또는 전달은 주사에 의해 이루어진다. 일부 실시양태에서, 주사는 정맥내 주사이다.
일부 실시양태에서, 투여 또는 전달은 본원에 개시된 바와 같은 rAAV를 포함하는 조직 또는 이식편을 대상체 내로 이식하는 것에 의해 이루어진다.
일부 실시양태에서, 투여 또는 전달은 본원에 개시된 바와 같은 rAAV를 대상체 내로 진피간 전달하는 것에 의해 이루어진다.
일부 실시양태에서, 투여 또는 전달은 이소성 골화의 감소를 발생시킨다. 일부 실시양태에서, 투여 또는 전달은 대상체에서 플레어-업 상태의 감소를 발생시킨다. 일부 실시양태에서, 투여 또는 전달은 돌연변이체 ACVR1 단백질의 감소된 발현을 발생시킨다.
도 1a-1b는 진행성 골화성 섬유이형성증 (FOP)에 수반되는 메카니즘 및 신호전달 경로를 보여준다. 도 1a는 FOP 돌연변이를 보여주는 개략적 다이어그램을 예시한다. 도 1b는 정상 대상체 및 FOP 환자에서의 BMP/액티빈 A 신호전달 경로를 보여준다. 약어: SP, 신호 펩티드; LBD, 리간드 결합 도메인; TM, 막횡단; GS, gly-ser-풍부 도메인.
도 2a-2b는 유전자 부가를 위한 AAV 벡터 게놈의 생성을 보여준다. 도 2a는 플라스미드 구축의 개략적 다이어그램을 보여준다. CBA 프로모터는 닭 베타-액틴 인트론, MBL 인트론, 또는 합성 인트론에 작동가능하게 연결된다. 도 2b는 opt-ACVR1의 발현의 검증을 보여준다. 벡터 게놈을 HEK293 세포 내로 일시적으로 형질감염시키고, 세포 용해물을 항-ACVR1 항체로의 이뮤노블롯팅에 적용하였다. 항-Hsp90 항체를 로딩 대조군에 사용하였다.
도 3a-3d는 유전자 침묵을 위한 AAV 벡터 게놈의 생성을 보여준다. 도 3a는 인간 ACVR1-R206H miRNA (amiR-ACVR1.R206H)의 상이한 서열 부위를 표적화하는 12개의 인공 miRNA (amiR) 및 인간 ACVR1-R206H, -WT (야생형), 또는 -opt (최적화된 것)에 대한 amiR-센서 플라스미드 (도 3b)를 보여주는 개략적 다이어그램이다. 도 3c는 amiR-ctrl (대조군) 또는 amiR-ACVR1.R206H를 amiR-센서 플라스미드와 함께 HEK293 세포 내로 일시적으로 형질감염시키고, 루시페라제 검정을 수행하여 레닐라 및 반딧불이 활성을 측정하였음을 보여준다. 레닐라 대 반딧불이의 보다 낮은 비는 amiR의 보다 높은 침묵 효능을 나타낸다. 도 3d는 amiR-ctrl 또는 amiR-ACVR1.R206H를 HEK293 내로 일시적으로 형질감염시키고, 세포 용해물을 항-ACVR1 항체를 사용한 이뮤노블롯팅에 적용한 것을 보여주는 영상을 도시한다. 항-Hsp90 항체를 로딩 대조군에 사용하였다. 약어: Fluc, 반딧불이 루시페라제; Rluc, 레닐라 루시페라제.
도 4a-4d는 유전자 대체를 위한 AAV 벡터 게놈의 생성을 보여준다. 도 4a는 합성 인트론 (서열식별번호: 36) 또는 MBL 인트론 (서열식별번호: 37), 인공 miRNA (amiR; RH6 또는 RH7) ACVR1을 함유하는 플라스미드 구축의 개략적 다이어그램이다. 도 4b는 벡터 또는 4종의 AAV 벡터 게놈 (합성 인트론을 갖는 RH6 또는 RH7 및 MBL 인트론을 갖는 RH6 또는 RH7)을 amiR-센서 플라스미드와 함께 HEK293 세포 내로 일시적으로 형질감염시킨 후에 루시페라제 활성을 측정한 그래프를 보여주며, 루시페라제 검정을 수행하여 레닐라 및 반딧불이 활성을 측정하였다. 도 4c는 항-ACVR1 항체를 사용한 이뮤노블롯팅에 의해 평가된 opt-ACVR1 발현을 보여준다. 항-Hsp90 항체를 로딩 대조군에 사용하였다. 도 4d는 벡터 대조군 또는 AAV 벡터 게놈을 BRE-luc 리포터 유전자와 함께 HEK293 세포 내로 일시적으로 형질감염시키고, 액티빈 A (100 ng/ml)로 처리한 후에 BRE-루시페라제 활성을 측정한 그래프를 보여준다. 24시간 후에, 액티빈 A 신호전달 활성을 루시페라제 검정에 의해 측정하였다. 값은 평균 ± SD로 나타내어지고: 독립표본 양측 스튜던트 t-검정 또는 일원 ANOVA 검정에 의해 **, P < 0.01 및 ***, P < 0.001.
도 5는 다중 세포의 시험관내 형질도입에 효과적인 rAAV 혈청형의 스크리닝을 보여준다. PBS (대조군) 또는 EGFP를 발현하는 14종의 상이한 rAAV 혈청형 (AAV1, AAV2, AAV3b, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAV.rh8, AAV.rh10, AAV.rh39 및 AAV.rh43) 5 x 1010 GC를 표시된 세포와 함께 2일 동안 인큐베이션하고, 골형성 조건 하에 4일 동안 배양하였다. AAV의 형질도입을 에피형광 현미경검사를 사용하여 GFP 발현에 의해 평가하였다. 축척 막대: 400 μm.
도 6a-6d는 rAAV6.2 및 rAAV9가 골격근에서 이소성 골-존재 세포를 형질도입한다는 것을 보여준다. rBMP2/7 주사 및 근육 손상의 4일 후 (도 6a 및 6b) 또는 8일 후 (도 6c 및 6d)에, rAAV6.2.egfp 또는 rAAV9.egfp의 5 x 1012 vg/kg을 각각 2개월령의 수컷 Tie2-cre;Ai9 마우스 (n=3)에 근육내로 주사하였다. 전신 X-방사선촬영 (도 6a 및 6c) 및 이환된 조직의 동결-절편화 (도 6b 및 6d)를 처리된 마우스에서 수행하였다. 청색 영상은 DAPI에 상응하고; 적색 영상은 Tie2+ 세포에 상응하고; 녹색 영상은 AAV-형질도입된 세포에 상응한다. 약어: M, 근육; HO-BM, 이소성 골화 골수.
도 7a-7b는 유전자 대체를 위한 rAAV6.2 및 rAAV9 벡터의 생성을 보여준다. 도 7a는 MBL 인트론 (서열식별번호: 37), rAAV6.2 또는 rAAV9, amiR-RH6 또는 amiR-RH7, 및 코돈 최적화된 ACVR1을 함유하는 rAAV 벡터의 생성의 개략적 다이어그램이다. 도 7b는 소화 후에 amiR-RH6 또는 -RH7을 함유하는 rAAV6.2의 게놈 완전성을 평가하기 위한 전기영동 후의 겔 영상을 보여준다. 약어: ss, 단일-가닥.
도 8a-8k는 유전자 대체에 대한 rAAV6.2 벡터의 시험관내 기능적 검증을 보여준다. 인간 FOP-iPSC를 5 x 1010 GC의 벡터 (ACVR1-WT 또는 ACVR1-R206H와 조합된 rAAV6.2-amiR-ctrl, -amiRH6, 또는 -amiRH7)로 2일 동안 처리하고, 골형성 조건 하에 4일 동안 배양하였다. 총 RNA를 cDNA 합성에 적용한 후, 차세대 서열분석 (NGS) (도 8a) 또는 RT-PCR 분석 (도 8b)을 수행하였다. 알칼리성 포스파타제 활성 (ALP) (도 8c) 및 알리자린 레드 염색 (도 8d)을 수행하여, 각각 골형성 배양 6일 및 21일 째의 골모세포 분화를 평가하였다. 도 8e는 유형 1 콜라겐 (Col1a1) 및 골 시알로단백질 (ibsp)을 포함한 골모세포 마커 유전자의 mRNA 수준이 amiR-RH7 및 opt-ACVR1을 보유하는 rAAV6.2에 의해 현저하게 감소되었지만, amiR-RH6 및 opt-ACVR1을 보유하는 rAAV6.2 또는 rAAV6.2.amiR-ctrl에 의해서는 그러하지 않음을 보여준다. 값은 평균 ± SD로 나타내어지고: 모든 패널에서 독립표본 양측 스튜던트 t-검정에 의해 **, P < 0.01, ***, P < 0.001 및 ****, P < 0.0001. 도 8f는 ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 tAAV6.2 벡터 5 x 1010 GC를 인간 FOP-iPSC에 형질도입하고, 골형성 조건 하에 4일 동안 배양한 것을 보여준다. 총 RNA를 cDNA 합성에 적용한 후, ACVR1opt mRNA 발현에 대해 차세대 서열분석 (NGS) (상단 도면) 또는 RT-PCR (하단 도면)을 수행하였다. 도 8g는 인간 FOP 환자-유래 iPSC를 PBS, 또는 동일한 CBA-Egfp 트랜스진으로 패키징된 14종의 상이한 AAV 캡시드 5 x 1010 게놈 카피 (GC)로 처리한 것을 보여준다. 2일 후에, EGFP 발현을 항-GFP 항체를 사용한 이뮤노블롯팅에 의해 평가하였다. 항-HSP90 항체를 로딩 대조군에 사용하였다. 도 8h-8k는 ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 AAV6.2 벡터 5 x 1010 GC를 건강한 공여자 (WT-iPSC) 또는 FOP 환자 (R206H-iPSC)로부터 유래된 인간 iPSC에 형질도입한 것을 보여준다. 골형성 유전자 발현을 RT-PCR에 의해 평가하였다 (도 8h). AAV-처리한 세포를 PBS 또는 액티빈 A (100 ng/ml)와 함께 6시간 동안 인큐베이션하고, ID1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 8i). 도 8j는 PDGFRa+Sca1+CD31-CD45- 섬유지방생성 전구세포 (FAP)를 4주령의 Acvr1(R206H)Fl;PDGFRα 마우스의 소화된 경골근으로부터 FACS 분류하고, ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 6일 동안 배양하고, ALP 활성을 골모세포 분화에 대해 평가하였다 (도 8k). 값은 평균 ± SD로 나타내어지고: 일원 ANOVA 검정에 의해 ns, 유의하지 않음; *, P <0.05; **, P < 0.01; ***, P < 0.001; ****, P < 0.0001.
도 9는 마우스에서의 전신 주사된 rAAV6.2 또는 rAAV9의 조직 분포를 보여준다. 혈관 투과성 (VP) 작용제 또는 rAAV6의 존재 또는 부재 하의 rAAV6.2.egfp 5 x 1013 vg/kg을 2개월령의 수컷 마우스 (n=3) 내로 정맥내로 주사하고, 2주 후에, 뇌, 심장, 폐, 비장, 간, 신장 및 뒷다리에서의 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템을 사용하여 EGFP 발현에 의해 평가하였다.
도 10a-10b는 FOP 마우스 모델에서의 rAAV9 벡터의 치료 효과를 보여준다. 타목시펜의 5회 연속 주사의 3일 후, 6주령의 수컷 ACVR1(R206H)FIEx;ERT-Cre 마우스에게 5 x 1013 vg/kg의 rAAV9 벡터 (amiR-RH6 및 opt-ACVR1을 보유하는 rAAV9 벡터, amiR-RH7 및 opt-ACVR1을 보유하는 rAAV9 벡터, 및 amiR 및 대조군을 보유하는 rAAV9 벡터)를 정맥내로 주사하였다. 10주 후에, 자발적 이소성 골화 (HO)를 마이크로CT에 의해 평가하였다. 처리된 마우스 (도 10a, n=5) 및 HO 부위의 대표적인 3D-재구성 마이크로CT 영상을 정량화하였다 (도 10b).
도 11은 ACVR1-R206H 편집을 위한 Cas9-기반 아데닌 염기 편집제 (ABE)의 플라스미드 구축을 보여주는 개략적 다이어그램을 예시한다. C-말단 ABE 구축물 (좌측 영상)은 AAV6.2 또는 AAV9 캡시드 내로 패키징된다. N-말단 ABE 구축물 (우측 영상)은 R206H 돌연변이 부위를 갖는 프로토스페이서를 함유한다.
도 12는 FOP에 대한 AAV-매개된 치료 접근법을 보여주는 개략적 다이어그램이다. 프로모터인 pBRE 및 pNF-κB는 각각 액티빈 A/BMP 리간드 및 염증에 반응하여 가용성 폴리스타틴 (sFST) 및 TNFR2의 발현을 유도한다. rAAV9 벡터의 근육내 또는 정맥내 주사 3일 후에, ACVR1(R206H)FIEx;ERT-Cre 마우스에서 심장독소-유도된 근육 손상을 실행하여 HO를 발생시킬 것이다. 골격근 내 손상-유도된 플레어-업 영역에서의 액티빈 A 및 TNF의 상향조절은 이소성 골에서 액티빈 A 및 TNF 신호전달을 억제하는 가용성 FST 및 TNFR2의 생산을 발생시킨다. 약어: pBRE, BMP-반응성 요소; pNF-κB, NF-κB-결합 부위.
도 13a-13d는 염증성 시토카인 및/또는 골 형태발생 단백질 (BMP)에 반응하는 AAV 벡터 게놈의 생성을 보여준다. 도 13a는 pBRE 및 pNF-kB 프로모터, ITR, 및 가우시아 리포터 유전자를 갖는 플라스미드 구축의 개략적 다이어그램이다. 도 13b-13d는 HEK293 세포를 PB2-luc 또는 AAV 벡터 게놈 (eBRE/NF-κB-luc)으로 일시적으로 형질감염시키고, 24시간 후에, 세포를 상이한 농도의 TNF 또는 IL-1β (도 13b), BMP4 (도 13c), 또는 조합물 (도 13d)로 자극한 후의 결과를 보여준다. 루시페라제 검정을 사용하여 벡터의 반응성을 측정하였다. 값은 평균 ± SD로 나타내어지고: 모든 패널에서 독립표본 양측 스튜던트 t-검정에 의해 *, P < 0.05, **, P < 0.01, ***, 및 P < 0.001.
도 14a-14b는 가용성 폴리스타틴 (FST-288) 및 TNFR2를 생산하는 AAV 벡터 게놈의 생성을 보여준다. 도 14a는 플라스미드 구축의 개략적 다이어그램이다. 도 14b는 HEK293 세포를 대조군 벡터 또는 FST-288 및 sTNFR2를 코딩하는 AAV 벡터 게놈으로 형질감염시키고, 48시간 후에 상청액을 수거한 후의 결과를 보여준다. PB2-luc 또는 3TP-lux를 HEK293 세포 내로 형질감염시키고, 24시간 후에, 배양 배지를 신선한 배지: 상이한 농도의 TNF 또는 액티빈 A를 함유하는 수거한 상청액 (1:1)으로 교체하였다. 24시간 후에, 루시페라제 검정을 수행하여 TNF-유도된 NF-kB 및 액티빈 A-유도된 SMAD 활성화를 평가하였다. 값은 평균 ± SD로 나타내어지고: 모든 패널에서 독립표본 양측 스튜던트 t-검정에 의해 ns, 유의하지 않음, *, P < 0.05, **, P < 0.01, ****, 및 P < 0.0001.
도 15a-15d는 AAV-유전자 치료제가 ACVR1-R206H 돌연변이에 의해 증진된 골형성을 역전시킨다는 것을 보여준다. 도 15a는 ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC를 인간 FOP-iPSC에 2일 동안 형질도입하고, 골형성 조건 하에 4일 동안 배양한 것을 보여준다. 총 RNA를 cDNA 합성에 적용한 후, Egfp 발현에 대해 RT-PCR을 수행하였다. 도 15b는 총 RNA를 RNA 서열분석에 적용하고, amiR-RH7.optACVR1에 비해 amiR-RH6.optACVR1을 발현하는 세포에서 상향/하향조절된 유전자에 대한 유전자 발현을 비교한 볼케이노 플롯을 생성한 것을 보여준다. 도 15c는 Sca1+PDGFRa+CD31-CD45- 섬유지방생성 전구세포 (FAP)를 4주령의 Acvr1R206H;PDGFRa 마우스의 경골근으로부터 FACS 분류하고, ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터의 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 6일 동안 배양하고, 골형성 유전자 발현을 RT-PCR에 의해 평가하였다. 도 15d는 ctrl-발현 세포에 비해 amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt를 발현하는 세포에서 상향조절된 및 하향조절된 유전자에 대한 유전자 발현을 보여주는 볼케이노 플롯을 나타낸 것을 보여준다.
도 16a-16c는 시험관내 액티빈 A-유도된 골형성에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 16a는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, 액티빈 A (100 ng/ml)로 6 또는 24시간 동안 자극하고, 액티빈 A-반응성 유전자 Id1 및 Msx2의 발현을 각각 RT-PCR을 사용하여 평가하였다. 도 16b-16c는 AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 16b) 및 알리자린 레드 염색 (도 16c)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가한 것을 보여준다.
도 17a-17i는 액티빈 A 신호전달 및 외상성 이소성 골화에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 17a-17d는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 17a). AAV-처리한 세포를 액티빈 A (100 ng/ml)로 30분 동안 자극하고, 포스포-Smad1/5에 대해 이뮤노블롯팅하였다. 항-Gapdh 항체를 로딩 대조군에 사용하였다 (도 17b). AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 17c, 좌측) 및 알리자린 레드 염색 (도 17c, 우측)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가하였다. AAV-처리한 세포를 골형성 조건 하에 PBS 또는 BMP4 (50 ng/ml)와 함께 12일 동안 배양하고, 무기질화에 대해 알리자린 레드 염색 (도 17c, 우측)을 수행하였다 (도 17d). 도 17e는 EGFP를 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 Tie2-cre;Ai9 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상 1주 후에 진피내로 (i.d.) 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (좌측 상단) 및 HO 조직의 동결-절편화 (좌측 하단, 우측)를 수행한 것을 보여준다. 박스는 골격근에서의 HO를 나타낸다. M, 근육; HO-BM, 이소성 골화 골수. 청색, DAPI; 적색, Tie2+ 세포; 녹색, AAV-형질도입된 세포. 도 17f-17g는 벡터 또는 CRE 레콤비나제를 발현하는 rAAV9의 5 x 1012 vg/kg을 6주령의 암컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로 i.d. 주사하고, 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였음을 보여준다. 4주 후에, 경골근에서의 Acvr1R206H 및 CRE 레콤비나제 mRNA 수준을 RT-PCR에 의해 측정하고 (도 17f), 경골근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 17g, 좌측) 및 정량화를 나타낸다 (도 17g, 우측). 도 17h는 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 2일 후에 i.d. 주사한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, 경골근에서의 HO를 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측). 도 17i는 ctrl 또는 amiR-RH6.optACVR1을 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=5)의 대퇴근에 i.d. 주사하고, 2일 후에 rBMP2/7-매트리겔 주사 및 근육 손상을 주사 부위에 사용한 것을 보여준다. 4주 후에, 대퇴근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측).
도 18a-18f는 AAV-처리한 골격근에서의 외상성 이소성 골화의 평가를 보여준다. 도 18a-18b는 연구 및 처리 설계의 다이어그램을 보여준다. EGFP를 발현하는 rAAV6.2의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상의 1주 후에 i.d. 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (도 18b, 좌측) 및 HO 조직의 동결-절편화 (도 18b, 우측)를 수행하였다. 박스는 골격근에서의 HO를 나타낸다. 도 18c-18d는 추가의 연구 및 처리 설계의 다이어그램을 보여준다. 도 18e는 ctrl, amiR-RH6, optACVR1 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 3일 후에 i.d. 주사한 것을 보여준다. 3일 후, 핀치 손상 및 1 μM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (우측). 도 18f는 추가의 연구 및 치료 설계의 다이어그램을 보여준다.
도 19a-19f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 19a-19b는 P1 PDGFRa-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템 (도 19a) 또는 AAV-처리한 뒷다리의 동결 절편 (도 19b)을 사용하여 mCherry 발현에 의해 평가한 것을 보여준다. BM: 골수. 도 19c-19e는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=10)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 19c). 경골근에서의 HO를 마이크로CT 또는 조직학을 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 19d, 좌측) 및 정량화를 나타낸다 (도 19d, 우측). 도 19e는 대표적인 조직학 데이터를 보여준다. 도 19f는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=3)를 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 3일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 3, 7, 14, 28일 후, 경골근에서의 HO를 X-방사선촬영에 의해 평가하였다. 박스는 경골근에서의 HO를 나타낸다.
도 20a-20g는 AAV-유전자 치료제의 전신 전달이 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 20a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 20b-20c는 P1 PDGFRα-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, PDGFRα 발현을 IVIS-100 광학 영상화 시스템에 의해 GFP 발현을 사용하여 평가한 것을 보여준다 (도 20b). 뒷다리에서 AAV-형질도입된 세포를 또한 형광 현미경검사를 사용하여 뒷다리에서의 mCherry 발현에 의해 평가하였다. IVIS-100 광학 영상화 시스템 (도 20b) 또는 AAV-처리한 뒷다리의 동결 절편 (도 20c). BM: 골수. 도 20d는 P1 야생형 새끼 (n=3)를 LacZ를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, AAV-형질도입된 조직의 동결-절편을 X-갈락토시다제에 대해 염색한 것을 보여준다. BM: 골수, CB: 피질 골, M: 근육. 도 20e는 P1 PDGFRα-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, PDGFRα 발현을 IVIS-100 광학 영상화 시스템에 의해 GFP 발현을 사용하여 평가한 것을 보여준다. 도 20f는 연구 및 처리 방법 설계의 다이어그램을 보여준다. 도 20g는 연구 및 처리 방법 설계의 다이어그램을 보여준다.
도 21a-21j는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 21a는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후에, 간에서의 Acvr1R206H 및 optACVR1 mRNA 수준을 RT-PCR에 의해 평가하였다. 전신 (도 21b), 몸통 (도 21c) 및 하체 (도 21d)의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방한다는 것을 입증한다. 화살표는 HO 영역을 나타낸다. 전신에서의 총 HO 부피 (도 21e) 및 HO 영역의 수 (도 21f)를 정량화하였다. 임상 HO 발생률의 백분율을 평가하였다 (도 21g). 슬관절의 마이크로CT 및 조직학을 수행하여 이소성 골 (도 21h, 좌측 및 중간), 관절 연골 (도 21h, 중간), 및 성장판 (도 21h, 우측)의 변성을 평가하였다. 박스는 HO 영역 및 관절 연골 및 성장판을 나타낸다. 총 비장세포 집단 내의 면역 세포의 빈도는 전신 면역 반응에 대한 AAV 벡터의 영향이 거의 내지 전혀 없음을 나타낸다 (n=6~8, 도 21i). 도 21j는 관절 연골 (좌측 영상) 및 성장판 (우측 영상)의 변성의 마이크로CT 및 조직학 영상을 보여준다.
도 22a-22f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 22a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 22b는 mCherry를 발현하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 개별 조직에서의 mCherry 발현을 주사 2주 후에 IVIS-100 광학 영상화에 의해 모니터링하였다. 도 22c-2f는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후, 정상적으로 이동하는 Acvr1R206H (ctrl) 마우스, 느리게 이동하는 Acvr1R206H;Cre-ERT2 (ctrl) 마우스, 및 정상적으로 이동하는 Acvr1R206H;Cre-ERT2 (amiR-RH6.optACVR1) 마우스를 포함한 16주령의 AAV-처리한 마우스의 움직임. 화살표는 amiR-RH6.optACVR1-처리한 마우스를 나타낸다 (도 22c). 도 22d는 슬관절 주변의 이소성 골을 보여준다. 도 22e는 AAV-처리한 비장의 종단면의 H&E 염색을 보여준다. 도 22f는 총 비장세포의 집단 내의 단핵구, 대식세포 및 호중구의 빈도를 보여준다 (n=6~8).
도 23은 성체 FOP 마우스에서의 조직 조직병리학에 대한 AAV-유전자 치료제의 효과를 보여준다. ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사하였다. 10주 후에, 폐, 간, 신장, 심장 및 골격근에서 H&E 염색을 수행하여 조직의 조직병리학을 평가하였다 (n=3).
도 24a-24h는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 24a는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRa-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다 (상단). HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다 (하단). 박스는 HO 조직을 나타낸다. 도 24b-24h는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. AAV-처리한 마우스의 생존 (도 24b) 및 체중 (도 24c)을 3주령부터 8주령까지 매주 분석하였다. 5주령의 AAV-처리한 두개골의 마이크로CT 분석은 AAV 벡터가 Acvr1R206H;PDGFRa-Cre 마우스의 악관절강직을 역전시키는 능력을 보여준다 (도 24d-24e). 3D 재구성 (도 24d, 상단) 및 2D 횡단면 (도 24d, 하단) 영상 및 개구 간격 (도 24e)을 나타낸다. 화살표는 측두하악 관절강직의 영역을 나타낸다. 상악골 및 하악골의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스의 낮은 골 질량을 역전시킨다는 것을 입증한다 (도 24f-24g). 마이크로CT 분석은 AAV-처리한 마우스의 상악골 및 하악골을 보여주었다. 2D 단면 (도 24f) 및 횡단면 (도 24g) 영상을 나타낸다. 화살표는 치근골을 나타낸다. 전신의 마이크로CT 분석은 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방하는 AAV 벡터의 능력을 보여준다 (도 24h). 마이크로CT 분석은 AAV-처리한 마우스의 전신을 보여주었다. 3D 재구성 (도 24h, 좌측) 및 2D 횡단면 (도 24h, 우측) 영상을 나타낸다.
도 25a-25b는 AAV9의 전신 전달이 소아 FOP 마우스에서 HO 조직의 형질도입에 효과적이라는 것을 보여준다. 도 25a는 5주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에서의 HO 조직의 알시안 블루 염색을 보여준다. 도 25b는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다. HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다.
도 26a-26b는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 26a는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. 정상 크기의 Acvr1R206H 마우스 (ctrl), 작은 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (ctrl), 및 정상 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (amiR-RH6.optACVR1)를 포함한, 5주령의 AAV-처리한 마우스의 움직임이 제시된다. 도 26b는 5주령의 AAV-처리한 마우스의 전신을 보여주는 X-방사선촬영을 보여준다.
도 27a-27d는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 악관절강직을 예방한다는 것을 보여준다. P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하였다. 도 27a는 5주령의 AAV-처리한 마우스의 개구 능력을 입증하는 사진을 보여준다. 도 27b는 5주령의 AAV-처리한 마우스의 개별 조직이, optACVR1 또는 amiR-RH6.optACVR1의 AAV-매개된 발현이 기아에 의한 Acvr1R206H; PDGFRa-Cre 장의 붕괴를 예방한다는 것을 입증하는 사진을 보여준다. 도 27c는 2개월령의 PDGFRa-GFP 마우스 (n=3)의 하악골의 동결 절편을 형광 현미경검사에 의해 치조골의 뿌리에서의 PDGFRa 발현에 대해 평가한 것을 보여준다. DAPI: 핵 염색. 도 27d는 AAV-처리한 마우스의 상악골 및 하악골의 2D 시상면 절편 영상을 보여주는 마이크로CT 분석을 보여준다. 화살표는 치아에서의 치조골의 뿌리를 나타낸다.
도 28a-28c는 치료 유전자의 발현을 제어하기 위한 AAV 벡터 게놈의 변형을 보여준다. 도 28a는 플라스미드 구축의 개략적 다이어그램을 보여준다. CMV 인핸서/닭 β-액틴 프로모터 (CBA), MBL 인트론 (MBLi), β-글로빈 폴리A 서열 (PA), 및 역전된 말단 반복부 (TR). miR-122: 간-특이적 miRNA, miR-208a: 심장 근육-특이적 miRNA, TS: 표적 서열. miR-122/miR208a-TS는 간 및 심장에서 AAV의 발현을 억제하는 데 사용된다. EndoID1-BRE: BMP-반응성 요소. pNF-kB: 염증-반응성 요소. EndoID1-BRE/pNF-kB를 함유하는 프로모터는 BMP, 액티빈 A, 및/또는 염증유발 시토카인에 반응하여 AAV의 발현을 유도하는 데 사용된다. 도 28b는 플라스미드 구축의 개략적 다이어그램을 보여준다. 도 28c는 6주령의 야생형 마우스를 PBS 또는 5 x 1013 vg/kg의 rAAV9.egfp 또는 rAAV9.egfp.MIR-TS의 i.v. 주사로 처리하고, 2주 후에, AAV 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템에 의해 EGFP 발현을 사용하여 모니터링한 것을 보여준다.
도 29a-29c는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 외상성 HO를 예방한다는 것을 보여준다. P1 Acvr1R206H;Cre-ERT2 새끼 (n=10)를 ctrl, amiR-RH6, ACVR1opt, 또는 amiR-RH6.ACVR1opt를 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스에게 타목시펜 (10 mg/kg)을 i.p. 주사하였다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였다. 경골근에서의 이소성 골을 마이크로CT 또는 조직학을 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 29a, 상단 도면)을 나타낸다. ctrl 또는 amiR-RH6.ACVR1opt를 보유하는 rAAV9의 1011 GC로 처리된 P1 Acvr1R206H;Cre-ERT2 새끼 (n=3)를 6주령까지 성숙시키고, 타목시펜으로 i.p. 주사하였다. 3일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였다. 7, 14, 및 28일 후에, 경골근에서의 HO를 조직학에 의해 평가하였다 (도 29b). 제3일에 손상된 영역의 종단면을 F4/80에 대해 면역염색하였다 (도 29c).
도 30a 및 30b는 유전자 대체, 침묵 및 조합을 위한 생성된 AAV 벡터 게놈을 보여준다. 도 30a는 인간 ACVR1R206H, ACVR1WT, 또는 ACVR1opt cDNA를 코딩하는 포유동물 발현 벡터 (pcDNA6, pAAV)의 개략적 다이어그램을 보여준다. 도 30b는 대조군, 또는 4종의 조합 벡터를 인간 ACVR1R206H, ACVR1WT, 또는 ACVR1opt를 발현하는 플라스미드와 함께 HEK293 세포 내로 일시적으로 형질감염시키고, 인간 ACVR1 mRNA 수준을 RT-PCR에 의해 평가한 것을 보여준다.
도 31은 시험관내 액티빈 A-유도된 골형성에 대한 AAV 유전자 치료제의 효과를 보여준다. ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 AAV6.2 벡터의 5 x 1010 GC를 인간 iPSC에 형질도입하고, 2일 후에, 세포를 PBS 또는 액티빈 A (100 ng/ml)와 함께 6시간 동안 인큐베이션하고, MSX2 mRNA 수준을 RT-PCR에 의해 측정하고, HPRT에 대해 정규화하였다.
도 32a-32e는 마우스에서의 rAAV6.2 또는 rAAV9의 생체분포를 보여준다. 5 x 1013 vg/kg의 rAAV6.2.egfp를 단독으로 (도 32a) 또는 혈관 투과성 작용제와 함께 (VP, 인간 VEGF-166 + 나트륨 헤파린 + 혈청 알부민, 도 32b) 2-개월령의 수컷 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템을 사용하여 EGFP 발현에 의해 평가하였다. 도 32c는 5 x 1013 vg/kg의 rAAV9.egfp를 2-개월령의 수컷 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템을 사용하여 EGFP 발현에 의해 평가한 것을 보여준다. 도 32d 및 32e는 mCherry를 발현하는 rAAV9의 5 x 1012 vg/kg을 2-개월령의 수컷 야생형 마우스 (n=3)의 경골근에 진피간으로 (i.d.) 주사한 것을 보여준다. 2주 후, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템 (도 32d) 또는 AAV-처리한 뒷다리의 동결 절편 (도 32e)을 사용하여 mCherry 발현에 의해 평가하였다.
도 2a-2b는 유전자 부가를 위한 AAV 벡터 게놈의 생성을 보여준다. 도 2a는 플라스미드 구축의 개략적 다이어그램을 보여준다. CBA 프로모터는 닭 베타-액틴 인트론, MBL 인트론, 또는 합성 인트론에 작동가능하게 연결된다. 도 2b는 opt-ACVR1의 발현의 검증을 보여준다. 벡터 게놈을 HEK293 세포 내로 일시적으로 형질감염시키고, 세포 용해물을 항-ACVR1 항체로의 이뮤노블롯팅에 적용하였다. 항-Hsp90 항체를 로딩 대조군에 사용하였다.
도 3a-3d는 유전자 침묵을 위한 AAV 벡터 게놈의 생성을 보여준다. 도 3a는 인간 ACVR1-R206H miRNA (amiR-ACVR1.R206H)의 상이한 서열 부위를 표적화하는 12개의 인공 miRNA (amiR) 및 인간 ACVR1-R206H, -WT (야생형), 또는 -opt (최적화된 것)에 대한 amiR-센서 플라스미드 (도 3b)를 보여주는 개략적 다이어그램이다. 도 3c는 amiR-ctrl (대조군) 또는 amiR-ACVR1.R206H를 amiR-센서 플라스미드와 함께 HEK293 세포 내로 일시적으로 형질감염시키고, 루시페라제 검정을 수행하여 레닐라 및 반딧불이 활성을 측정하였음을 보여준다. 레닐라 대 반딧불이의 보다 낮은 비는 amiR의 보다 높은 침묵 효능을 나타낸다. 도 3d는 amiR-ctrl 또는 amiR-ACVR1.R206H를 HEK293 내로 일시적으로 형질감염시키고, 세포 용해물을 항-ACVR1 항체를 사용한 이뮤노블롯팅에 적용한 것을 보여주는 영상을 도시한다. 항-Hsp90 항체를 로딩 대조군에 사용하였다. 약어: Fluc, 반딧불이 루시페라제; Rluc, 레닐라 루시페라제.
도 4a-4d는 유전자 대체를 위한 AAV 벡터 게놈의 생성을 보여준다. 도 4a는 합성 인트론 (서열식별번호: 36) 또는 MBL 인트론 (서열식별번호: 37), 인공 miRNA (amiR; RH6 또는 RH7) ACVR1을 함유하는 플라스미드 구축의 개략적 다이어그램이다. 도 4b는 벡터 또는 4종의 AAV 벡터 게놈 (합성 인트론을 갖는 RH6 또는 RH7 및 MBL 인트론을 갖는 RH6 또는 RH7)을 amiR-센서 플라스미드와 함께 HEK293 세포 내로 일시적으로 형질감염시킨 후에 루시페라제 활성을 측정한 그래프를 보여주며, 루시페라제 검정을 수행하여 레닐라 및 반딧불이 활성을 측정하였다. 도 4c는 항-ACVR1 항체를 사용한 이뮤노블롯팅에 의해 평가된 opt-ACVR1 발현을 보여준다. 항-Hsp90 항체를 로딩 대조군에 사용하였다. 도 4d는 벡터 대조군 또는 AAV 벡터 게놈을 BRE-luc 리포터 유전자와 함께 HEK293 세포 내로 일시적으로 형질감염시키고, 액티빈 A (100 ng/ml)로 처리한 후에 BRE-루시페라제 활성을 측정한 그래프를 보여준다. 24시간 후에, 액티빈 A 신호전달 활성을 루시페라제 검정에 의해 측정하였다. 값은 평균 ± SD로 나타내어지고: 독립표본 양측 스튜던트 t-검정 또는 일원 ANOVA 검정에 의해 **, P < 0.01 및 ***, P < 0.001.
도 5는 다중 세포의 시험관내 형질도입에 효과적인 rAAV 혈청형의 스크리닝을 보여준다. PBS (대조군) 또는 EGFP를 발현하는 14종의 상이한 rAAV 혈청형 (AAV1, AAV2, AAV3b, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAV.rh8, AAV.rh10, AAV.rh39 및 AAV.rh43) 5 x 1010 GC를 표시된 세포와 함께 2일 동안 인큐베이션하고, 골형성 조건 하에 4일 동안 배양하였다. AAV의 형질도입을 에피형광 현미경검사를 사용하여 GFP 발현에 의해 평가하였다. 축척 막대: 400 μm.
도 6a-6d는 rAAV6.2 및 rAAV9가 골격근에서 이소성 골-존재 세포를 형질도입한다는 것을 보여준다. rBMP2/7 주사 및 근육 손상의 4일 후 (도 6a 및 6b) 또는 8일 후 (도 6c 및 6d)에, rAAV6.2.egfp 또는 rAAV9.egfp의 5 x 1012 vg/kg을 각각 2개월령의 수컷 Tie2-cre;Ai9 마우스 (n=3)에 근육내로 주사하였다. 전신 X-방사선촬영 (도 6a 및 6c) 및 이환된 조직의 동결-절편화 (도 6b 및 6d)를 처리된 마우스에서 수행하였다. 청색 영상은 DAPI에 상응하고; 적색 영상은 Tie2+ 세포에 상응하고; 녹색 영상은 AAV-형질도입된 세포에 상응한다. 약어: M, 근육; HO-BM, 이소성 골화 골수.
도 7a-7b는 유전자 대체를 위한 rAAV6.2 및 rAAV9 벡터의 생성을 보여준다. 도 7a는 MBL 인트론 (서열식별번호: 37), rAAV6.2 또는 rAAV9, amiR-RH6 또는 amiR-RH7, 및 코돈 최적화된 ACVR1을 함유하는 rAAV 벡터의 생성의 개략적 다이어그램이다. 도 7b는 소화 후에 amiR-RH6 또는 -RH7을 함유하는 rAAV6.2의 게놈 완전성을 평가하기 위한 전기영동 후의 겔 영상을 보여준다. 약어: ss, 단일-가닥.
도 8a-8k는 유전자 대체에 대한 rAAV6.2 벡터의 시험관내 기능적 검증을 보여준다. 인간 FOP-iPSC를 5 x 1010 GC의 벡터 (ACVR1-WT 또는 ACVR1-R206H와 조합된 rAAV6.2-amiR-ctrl, -amiRH6, 또는 -amiRH7)로 2일 동안 처리하고, 골형성 조건 하에 4일 동안 배양하였다. 총 RNA를 cDNA 합성에 적용한 후, 차세대 서열분석 (NGS) (도 8a) 또는 RT-PCR 분석 (도 8b)을 수행하였다. 알칼리성 포스파타제 활성 (ALP) (도 8c) 및 알리자린 레드 염색 (도 8d)을 수행하여, 각각 골형성 배양 6일 및 21일 째의 골모세포 분화를 평가하였다. 도 8e는 유형 1 콜라겐 (Col1a1) 및 골 시알로단백질 (ibsp)을 포함한 골모세포 마커 유전자의 mRNA 수준이 amiR-RH7 및 opt-ACVR1을 보유하는 rAAV6.2에 의해 현저하게 감소되었지만, amiR-RH6 및 opt-ACVR1을 보유하는 rAAV6.2 또는 rAAV6.2.amiR-ctrl에 의해서는 그러하지 않음을 보여준다. 값은 평균 ± SD로 나타내어지고: 모든 패널에서 독립표본 양측 스튜던트 t-검정에 의해 **, P < 0.01, ***, P < 0.001 및 ****, P < 0.0001. 도 8f는 ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 tAAV6.2 벡터 5 x 1010 GC를 인간 FOP-iPSC에 형질도입하고, 골형성 조건 하에 4일 동안 배양한 것을 보여준다. 총 RNA를 cDNA 합성에 적용한 후, ACVR1opt mRNA 발현에 대해 차세대 서열분석 (NGS) (상단 도면) 또는 RT-PCR (하단 도면)을 수행하였다. 도 8g는 인간 FOP 환자-유래 iPSC를 PBS, 또는 동일한 CBA-Egfp 트랜스진으로 패키징된 14종의 상이한 AAV 캡시드 5 x 1010 게놈 카피 (GC)로 처리한 것을 보여준다. 2일 후에, EGFP 발현을 항-GFP 항체를 사용한 이뮤노블롯팅에 의해 평가하였다. 항-HSP90 항체를 로딩 대조군에 사용하였다. 도 8h-8k는 ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 AAV6.2 벡터 5 x 1010 GC를 건강한 공여자 (WT-iPSC) 또는 FOP 환자 (R206H-iPSC)로부터 유래된 인간 iPSC에 형질도입한 것을 보여준다. 골형성 유전자 발현을 RT-PCR에 의해 평가하였다 (도 8h). AAV-처리한 세포를 PBS 또는 액티빈 A (100 ng/ml)와 함께 6시간 동안 인큐베이션하고, ID1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 8i). 도 8j는 PDGFRa+Sca1+CD31-CD45- 섬유지방생성 전구세포 (FAP)를 4주령의 Acvr1(R206H)Fl;PDGFRα 마우스의 소화된 경골근으로부터 FACS 분류하고, ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 6일 동안 배양하고, ALP 활성을 골모세포 분화에 대해 평가하였다 (도 8k). 값은 평균 ± SD로 나타내어지고: 일원 ANOVA 검정에 의해 ns, 유의하지 않음; *, P <0.05; **, P < 0.01; ***, P < 0.001; ****, P < 0.0001.
도 9는 마우스에서의 전신 주사된 rAAV6.2 또는 rAAV9의 조직 분포를 보여준다. 혈관 투과성 (VP) 작용제 또는 rAAV6의 존재 또는 부재 하의 rAAV6.2.egfp 5 x 1013 vg/kg을 2개월령의 수컷 마우스 (n=3) 내로 정맥내로 주사하고, 2주 후에, 뇌, 심장, 폐, 비장, 간, 신장 및 뒷다리에서의 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템을 사용하여 EGFP 발현에 의해 평가하였다.
도 10a-10b는 FOP 마우스 모델에서의 rAAV9 벡터의 치료 효과를 보여준다. 타목시펜의 5회 연속 주사의 3일 후, 6주령의 수컷 ACVR1(R206H)FIEx;ERT-Cre 마우스에게 5 x 1013 vg/kg의 rAAV9 벡터 (amiR-RH6 및 opt-ACVR1을 보유하는 rAAV9 벡터, amiR-RH7 및 opt-ACVR1을 보유하는 rAAV9 벡터, 및 amiR 및 대조군을 보유하는 rAAV9 벡터)를 정맥내로 주사하였다. 10주 후에, 자발적 이소성 골화 (HO)를 마이크로CT에 의해 평가하였다. 처리된 마우스 (도 10a, n=5) 및 HO 부위의 대표적인 3D-재구성 마이크로CT 영상을 정량화하였다 (도 10b).
도 11은 ACVR1-R206H 편집을 위한 Cas9-기반 아데닌 염기 편집제 (ABE)의 플라스미드 구축을 보여주는 개략적 다이어그램을 예시한다. C-말단 ABE 구축물 (좌측 영상)은 AAV6.2 또는 AAV9 캡시드 내로 패키징된다. N-말단 ABE 구축물 (우측 영상)은 R206H 돌연변이 부위를 갖는 프로토스페이서를 함유한다.
도 12는 FOP에 대한 AAV-매개된 치료 접근법을 보여주는 개략적 다이어그램이다. 프로모터인 pBRE 및 pNF-κB는 각각 액티빈 A/BMP 리간드 및 염증에 반응하여 가용성 폴리스타틴 (sFST) 및 TNFR2의 발현을 유도한다. rAAV9 벡터의 근육내 또는 정맥내 주사 3일 후에, ACVR1(R206H)FIEx;ERT-Cre 마우스에서 심장독소-유도된 근육 손상을 실행하여 HO를 발생시킬 것이다. 골격근 내 손상-유도된 플레어-업 영역에서의 액티빈 A 및 TNF의 상향조절은 이소성 골에서 액티빈 A 및 TNF 신호전달을 억제하는 가용성 FST 및 TNFR2의 생산을 발생시킨다. 약어: pBRE, BMP-반응성 요소; pNF-κB, NF-κB-결합 부위.
도 13a-13d는 염증성 시토카인 및/또는 골 형태발생 단백질 (BMP)에 반응하는 AAV 벡터 게놈의 생성을 보여준다. 도 13a는 pBRE 및 pNF-kB 프로모터, ITR, 및 가우시아 리포터 유전자를 갖는 플라스미드 구축의 개략적 다이어그램이다. 도 13b-13d는 HEK293 세포를 PB2-luc 또는 AAV 벡터 게놈 (eBRE/NF-κB-luc)으로 일시적으로 형질감염시키고, 24시간 후에, 세포를 상이한 농도의 TNF 또는 IL-1β (도 13b), BMP4 (도 13c), 또는 조합물 (도 13d)로 자극한 후의 결과를 보여준다. 루시페라제 검정을 사용하여 벡터의 반응성을 측정하였다. 값은 평균 ± SD로 나타내어지고: 모든 패널에서 독립표본 양측 스튜던트 t-검정에 의해 *, P < 0.05, **, P < 0.01, ***, 및 P < 0.001.
도 14a-14b는 가용성 폴리스타틴 (FST-288) 및 TNFR2를 생산하는 AAV 벡터 게놈의 생성을 보여준다. 도 14a는 플라스미드 구축의 개략적 다이어그램이다. 도 14b는 HEK293 세포를 대조군 벡터 또는 FST-288 및 sTNFR2를 코딩하는 AAV 벡터 게놈으로 형질감염시키고, 48시간 후에 상청액을 수거한 후의 결과를 보여준다. PB2-luc 또는 3TP-lux를 HEK293 세포 내로 형질감염시키고, 24시간 후에, 배양 배지를 신선한 배지: 상이한 농도의 TNF 또는 액티빈 A를 함유하는 수거한 상청액 (1:1)으로 교체하였다. 24시간 후에, 루시페라제 검정을 수행하여 TNF-유도된 NF-kB 및 액티빈 A-유도된 SMAD 활성화를 평가하였다. 값은 평균 ± SD로 나타내어지고: 모든 패널에서 독립표본 양측 스튜던트 t-검정에 의해 ns, 유의하지 않음, *, P < 0.05, **, P < 0.01, ****, 및 P < 0.0001.
도 15a-15d는 AAV-유전자 치료제가 ACVR1-R206H 돌연변이에 의해 증진된 골형성을 역전시킨다는 것을 보여준다. 도 15a는 ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC를 인간 FOP-iPSC에 2일 동안 형질도입하고, 골형성 조건 하에 4일 동안 배양한 것을 보여준다. 총 RNA를 cDNA 합성에 적용한 후, Egfp 발현에 대해 RT-PCR을 수행하였다. 도 15b는 총 RNA를 RNA 서열분석에 적용하고, amiR-RH7.optACVR1에 비해 amiR-RH6.optACVR1을 발현하는 세포에서 상향/하향조절된 유전자에 대한 유전자 발현을 비교한 볼케이노 플롯을 생성한 것을 보여준다. 도 15c는 Sca1+PDGFRa+CD31-CD45- 섬유지방생성 전구세포 (FAP)를 4주령의 Acvr1R206H;PDGFRa 마우스의 경골근으로부터 FACS 분류하고, ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터의 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 6일 동안 배양하고, 골형성 유전자 발현을 RT-PCR에 의해 평가하였다. 도 15d는 ctrl-발현 세포에 비해 amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt를 발현하는 세포에서 상향조절된 및 하향조절된 유전자에 대한 유전자 발현을 보여주는 볼케이노 플롯을 나타낸 것을 보여준다.
도 16a-16c는 시험관내 액티빈 A-유도된 골형성에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 16a는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, 액티빈 A (100 ng/ml)로 6 또는 24시간 동안 자극하고, 액티빈 A-반응성 유전자 Id1 및 Msx2의 발현을 각각 RT-PCR을 사용하여 평가하였다. 도 16b-16c는 AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 16b) 및 알리자린 레드 염색 (도 16c)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가한 것을 보여준다.
도 17a-17i는 액티빈 A 신호전달 및 외상성 이소성 골화에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 17a-17d는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 17a). AAV-처리한 세포를 액티빈 A (100 ng/ml)로 30분 동안 자극하고, 포스포-Smad1/5에 대해 이뮤노블롯팅하였다. 항-Gapdh 항체를 로딩 대조군에 사용하였다 (도 17b). AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 17c, 좌측) 및 알리자린 레드 염색 (도 17c, 우측)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가하였다. AAV-처리한 세포를 골형성 조건 하에 PBS 또는 BMP4 (50 ng/ml)와 함께 12일 동안 배양하고, 무기질화에 대해 알리자린 레드 염색 (도 17c, 우측)을 수행하였다 (도 17d). 도 17e는 EGFP를 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 Tie2-cre;Ai9 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상 1주 후에 진피내로 (i.d.) 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (좌측 상단) 및 HO 조직의 동결-절편화 (좌측 하단, 우측)를 수행한 것을 보여준다. 박스는 골격근에서의 HO를 나타낸다. M, 근육; HO-BM, 이소성 골화 골수. 청색, DAPI; 적색, Tie2+ 세포; 녹색, AAV-형질도입된 세포. 도 17f-17g는 벡터 또는 CRE 레콤비나제를 발현하는 rAAV9의 5 x 1012 vg/kg을 6주령의 암컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로 i.d. 주사하고, 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였음을 보여준다. 4주 후에, 경골근에서의 Acvr1R206H 및 CRE 레콤비나제 mRNA 수준을 RT-PCR에 의해 측정하고 (도 17f), 경골근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 17g, 좌측) 및 정량화를 나타낸다 (도 17g, 우측). 도 17h는 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 2일 후에 i.d. 주사한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, 경골근에서의 HO를 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측). 도 17i는 ctrl 또는 amiR-RH6.optACVR1을 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=5)의 대퇴근에 i.d. 주사하고, 2일 후에 rBMP2/7-매트리겔 주사 및 근육 손상을 주사 부위에 사용한 것을 보여준다. 4주 후에, 대퇴근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측).
도 18a-18f는 AAV-처리한 골격근에서의 외상성 이소성 골화의 평가를 보여준다. 도 18a-18b는 연구 및 처리 설계의 다이어그램을 보여준다. EGFP를 발현하는 rAAV6.2의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상의 1주 후에 i.d. 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (도 18b, 좌측) 및 HO 조직의 동결-절편화 (도 18b, 우측)를 수행하였다. 박스는 골격근에서의 HO를 나타낸다. 도 18c-18d는 추가의 연구 및 처리 설계의 다이어그램을 보여준다. 도 18e는 ctrl, amiR-RH6, optACVR1 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 3일 후에 i.d. 주사한 것을 보여준다. 3일 후, 핀치 손상 및 1 μM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (우측). 도 18f는 추가의 연구 및 치료 설계의 다이어그램을 보여준다.
도 19a-19f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 19a-19b는 P1 PDGFRa-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템 (도 19a) 또는 AAV-처리한 뒷다리의 동결 절편 (도 19b)을 사용하여 mCherry 발현에 의해 평가한 것을 보여준다. BM: 골수. 도 19c-19e는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=10)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 19c). 경골근에서의 HO를 마이크로CT 또는 조직학을 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 19d, 좌측) 및 정량화를 나타낸다 (도 19d, 우측). 도 19e는 대표적인 조직학 데이터를 보여준다. 도 19f는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=3)를 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 3일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 3, 7, 14, 28일 후, 경골근에서의 HO를 X-방사선촬영에 의해 평가하였다. 박스는 경골근에서의 HO를 나타낸다.
도 20a-20g는 AAV-유전자 치료제의 전신 전달이 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 20a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 20b-20c는 P1 PDGFRα-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, PDGFRα 발현을 IVIS-100 광학 영상화 시스템에 의해 GFP 발현을 사용하여 평가한 것을 보여준다 (도 20b). 뒷다리에서 AAV-형질도입된 세포를 또한 형광 현미경검사를 사용하여 뒷다리에서의 mCherry 발현에 의해 평가하였다. IVIS-100 광학 영상화 시스템 (도 20b) 또는 AAV-처리한 뒷다리의 동결 절편 (도 20c). BM: 골수. 도 20d는 P1 야생형 새끼 (n=3)를 LacZ를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, AAV-형질도입된 조직의 동결-절편을 X-갈락토시다제에 대해 염색한 것을 보여준다. BM: 골수, CB: 피질 골, M: 근육. 도 20e는 P1 PDGFRα-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, PDGFRα 발현을 IVIS-100 광학 영상화 시스템에 의해 GFP 발현을 사용하여 평가한 것을 보여준다. 도 20f는 연구 및 처리 방법 설계의 다이어그램을 보여준다. 도 20g는 연구 및 처리 방법 설계의 다이어그램을 보여준다.
도 21a-21j는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 21a는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후에, 간에서의 Acvr1R206H 및 optACVR1 mRNA 수준을 RT-PCR에 의해 평가하였다. 전신 (도 21b), 몸통 (도 21c) 및 하체 (도 21d)의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방한다는 것을 입증한다. 화살표는 HO 영역을 나타낸다. 전신에서의 총 HO 부피 (도 21e) 및 HO 영역의 수 (도 21f)를 정량화하였다. 임상 HO 발생률의 백분율을 평가하였다 (도 21g). 슬관절의 마이크로CT 및 조직학을 수행하여 이소성 골 (도 21h, 좌측 및 중간), 관절 연골 (도 21h, 중간), 및 성장판 (도 21h, 우측)의 변성을 평가하였다. 박스는 HO 영역 및 관절 연골 및 성장판을 나타낸다. 총 비장세포 집단 내의 면역 세포의 빈도는 전신 면역 반응에 대한 AAV 벡터의 영향이 거의 내지 전혀 없음을 나타낸다 (n=6~8, 도 21i). 도 21j는 관절 연골 (좌측 영상) 및 성장판 (우측 영상)의 변성의 마이크로CT 및 조직학 영상을 보여준다.
도 22a-22f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 22a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 22b는 mCherry를 발현하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 개별 조직에서의 mCherry 발현을 주사 2주 후에 IVIS-100 광학 영상화에 의해 모니터링하였다. 도 22c-2f는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후, 정상적으로 이동하는 Acvr1R206H (ctrl) 마우스, 느리게 이동하는 Acvr1R206H;Cre-ERT2 (ctrl) 마우스, 및 정상적으로 이동하는 Acvr1R206H;Cre-ERT2 (amiR-RH6.optACVR1) 마우스를 포함한 16주령의 AAV-처리한 마우스의 움직임. 화살표는 amiR-RH6.optACVR1-처리한 마우스를 나타낸다 (도 22c). 도 22d는 슬관절 주변의 이소성 골을 보여준다. 도 22e는 AAV-처리한 비장의 종단면의 H&E 염색을 보여준다. 도 22f는 총 비장세포의 집단 내의 단핵구, 대식세포 및 호중구의 빈도를 보여준다 (n=6~8).
도 23은 성체 FOP 마우스에서의 조직 조직병리학에 대한 AAV-유전자 치료제의 효과를 보여준다. ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사하였다. 10주 후에, 폐, 간, 신장, 심장 및 골격근에서 H&E 염색을 수행하여 조직의 조직병리학을 평가하였다 (n=3).
도 24a-24h는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 24a는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRa-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다 (상단). HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다 (하단). 박스는 HO 조직을 나타낸다. 도 24b-24h는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. AAV-처리한 마우스의 생존 (도 24b) 및 체중 (도 24c)을 3주령부터 8주령까지 매주 분석하였다. 5주령의 AAV-처리한 두개골의 마이크로CT 분석은 AAV 벡터가 Acvr1R206H;PDGFRa-Cre 마우스의 악관절강직을 역전시키는 능력을 보여준다 (도 24d-24e). 3D 재구성 (도 24d, 상단) 및 2D 횡단면 (도 24d, 하단) 영상 및 개구 간격 (도 24e)을 나타낸다. 화살표는 측두하악 관절강직의 영역을 나타낸다. 상악골 및 하악골의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스의 낮은 골 질량을 역전시킨다는 것을 입증한다 (도 24f-24g). 마이크로CT 분석은 AAV-처리한 마우스의 상악골 및 하악골을 보여주었다. 2D 단면 (도 24f) 및 횡단면 (도 24g) 영상을 나타낸다. 화살표는 치근골을 나타낸다. 전신의 마이크로CT 분석은 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방하는 AAV 벡터의 능력을 보여준다 (도 24h). 마이크로CT 분석은 AAV-처리한 마우스의 전신을 보여주었다. 3D 재구성 (도 24h, 좌측) 및 2D 횡단면 (도 24h, 우측) 영상을 나타낸다.
도 25a-25b는 AAV9의 전신 전달이 소아 FOP 마우스에서 HO 조직의 형질도입에 효과적이라는 것을 보여준다. 도 25a는 5주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에서의 HO 조직의 알시안 블루 염색을 보여준다. 도 25b는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다. HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다.
도 26a-26b는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 26a는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. 정상 크기의 Acvr1R206H 마우스 (ctrl), 작은 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (ctrl), 및 정상 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (amiR-RH6.optACVR1)를 포함한, 5주령의 AAV-처리한 마우스의 움직임이 제시된다. 도 26b는 5주령의 AAV-처리한 마우스의 전신을 보여주는 X-방사선촬영을 보여준다.
도 27a-27d는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 악관절강직을 예방한다는 것을 보여준다. P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하였다. 도 27a는 5주령의 AAV-처리한 마우스의 개구 능력을 입증하는 사진을 보여준다. 도 27b는 5주령의 AAV-처리한 마우스의 개별 조직이, optACVR1 또는 amiR-RH6.optACVR1의 AAV-매개된 발현이 기아에 의한 Acvr1R206H; PDGFRa-Cre 장의 붕괴를 예방한다는 것을 입증하는 사진을 보여준다. 도 27c는 2개월령의 PDGFRa-GFP 마우스 (n=3)의 하악골의 동결 절편을 형광 현미경검사에 의해 치조골의 뿌리에서의 PDGFRa 발현에 대해 평가한 것을 보여준다. DAPI: 핵 염색. 도 27d는 AAV-처리한 마우스의 상악골 및 하악골의 2D 시상면 절편 영상을 보여주는 마이크로CT 분석을 보여준다. 화살표는 치아에서의 치조골의 뿌리를 나타낸다.
도 28a-28c는 치료 유전자의 발현을 제어하기 위한 AAV 벡터 게놈의 변형을 보여준다. 도 28a는 플라스미드 구축의 개략적 다이어그램을 보여준다. CMV 인핸서/닭 β-액틴 프로모터 (CBA), MBL 인트론 (MBLi), β-글로빈 폴리A 서열 (PA), 및 역전된 말단 반복부 (TR). miR-122: 간-특이적 miRNA, miR-208a: 심장 근육-특이적 miRNA, TS: 표적 서열. miR-122/miR208a-TS는 간 및 심장에서 AAV의 발현을 억제하는 데 사용된다. EndoID1-BRE: BMP-반응성 요소. pNF-kB: 염증-반응성 요소. EndoID1-BRE/pNF-kB를 함유하는 프로모터는 BMP, 액티빈 A, 및/또는 염증유발 시토카인에 반응하여 AAV의 발현을 유도하는 데 사용된다. 도 28b는 플라스미드 구축의 개략적 다이어그램을 보여준다. 도 28c는 6주령의 야생형 마우스를 PBS 또는 5 x 1013 vg/kg의 rAAV9.egfp 또는 rAAV9.egfp.MIR-TS의 i.v. 주사로 처리하고, 2주 후에, AAV 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템에 의해 EGFP 발현을 사용하여 모니터링한 것을 보여준다.
도 29a-29c는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 외상성 HO를 예방한다는 것을 보여준다. P1 Acvr1R206H;Cre-ERT2 새끼 (n=10)를 ctrl, amiR-RH6, ACVR1opt, 또는 amiR-RH6.ACVR1opt를 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스에게 타목시펜 (10 mg/kg)을 i.p. 주사하였다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였다. 경골근에서의 이소성 골을 마이크로CT 또는 조직학을 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 29a, 상단 도면)을 나타낸다. ctrl 또는 amiR-RH6.ACVR1opt를 보유하는 rAAV9의 1011 GC로 처리된 P1 Acvr1R206H;Cre-ERT2 새끼 (n=3)를 6주령까지 성숙시키고, 타목시펜으로 i.p. 주사하였다. 3일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였다. 7, 14, 및 28일 후에, 경골근에서의 HO를 조직학에 의해 평가하였다 (도 29b). 제3일에 손상된 영역의 종단면을 F4/80에 대해 면역염색하였다 (도 29c).
도 30a 및 30b는 유전자 대체, 침묵 및 조합을 위한 생성된 AAV 벡터 게놈을 보여준다. 도 30a는 인간 ACVR1R206H, ACVR1WT, 또는 ACVR1opt cDNA를 코딩하는 포유동물 발현 벡터 (pcDNA6, pAAV)의 개략적 다이어그램을 보여준다. 도 30b는 대조군, 또는 4종의 조합 벡터를 인간 ACVR1R206H, ACVR1WT, 또는 ACVR1opt를 발현하는 플라스미드와 함께 HEK293 세포 내로 일시적으로 형질감염시키고, 인간 ACVR1 mRNA 수준을 RT-PCR에 의해 평가한 것을 보여준다.
도 31은 시험관내 액티빈 A-유도된 골형성에 대한 AAV 유전자 치료제의 효과를 보여준다. ctrl, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 AAV6.2 벡터의 5 x 1010 GC를 인간 iPSC에 형질도입하고, 2일 후에, 세포를 PBS 또는 액티빈 A (100 ng/ml)와 함께 6시간 동안 인큐베이션하고, MSX2 mRNA 수준을 RT-PCR에 의해 측정하고, HPRT에 대해 정규화하였다.
도 32a-32e는 마우스에서의 rAAV6.2 또는 rAAV9의 생체분포를 보여준다. 5 x 1013 vg/kg의 rAAV6.2.egfp를 단독으로 (도 32a) 또는 혈관 투과성 작용제와 함께 (VP, 인간 VEGF-166 + 나트륨 헤파린 + 혈청 알부민, 도 32b) 2-개월령의 수컷 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템을 사용하여 EGFP 발현에 의해 평가하였다. 도 32c는 5 x 1013 vg/kg의 rAAV9.egfp를 2-개월령의 수컷 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템을 사용하여 EGFP 발현에 의해 평가한 것을 보여준다. 도 32d 및 32e는 mCherry를 발현하는 rAAV9의 5 x 1012 vg/kg을 2-개월령의 수컷 야생형 마우스 (n=3)의 경골근에 진피간으로 (i.d.) 주사한 것을 보여준다. 2주 후, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템 (도 32d) 또는 AAV-처리한 뒷다리의 동결 절편 (도 32e)을 사용하여 mCherry 발현에 의해 평가하였다.
본 개시내용의 측면은 진행성 골화성 섬유이형성증 (FOP) 및 플레어-업 상태를 치료하기 위한 방법 및 조성물에 관한 것이다. 본 개시내용은 부분적으로, 돌연변이된 액티빈 A 유형 1 수용체 (ACVR1)의 발현을 감소시키는 조성물 (예를 들어, 단리된 핵산, 벡터, rAAV 등)을 기초로 한다. 일부 실시양태에서, 본원에 개시된 바와 같은 조성물 (AAV-매개된 유전자 전달 플랫폼)은 대상체에서 비정상적 골 형성을 갖는 이환 조직, 예컨대 골격근, 건 및 연골에 전달되는 경우에, 예를 들어 액티빈 A 길항제 및/또는 TNF 길항제를 유도함으로써 적어도 이소성 골화 및/또는 플레어-업 상태를 억제한다. 따라서, 본 개시내용에 의해 기재된 방법 및 조성물은 일부 실시양태에서 FOP와 연관된 질환 및 장애의 치료에 유용하다.
단리된 핵산
트랜스진 (예를 들어 억제 RNA, 예컨대 shRNA, miRNA 등)을 대상체에게 전달하기 위한 조성물 및 방법이 본 개시내용에 제공된다. 조성물은 전형적으로 골 대사를 조정하고/거나 FOP를 치료할 수 있는 트랜스진 (예를 들어, 단백질, 억제 핵산 등)을 코딩하는 단리된 핵산을 포함한다. 예를 들어, 일부 실시양태에서, 트랜스진은 표적 단백질, 예컨대 골 형성을 촉진하는 것과 연관된 표적 단백질의 발현을 감소시킨다.
일부 실시양태에서, 본 개시내용에 기재된 바와 같은 단리된 핵산, 벡터, 재조합 유전자 편집 복합체 또는 rAAV는 적어도 1개의 코돈 최적화된 ACVR1 (예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 코돈 최적화된 ACVR1)을 코딩하는 트랜스진을 포함한다. 일부 실시양태에서, 코돈 최적화된 ACVR1은 야생형 ACVR1이다. 일부 실시양태에서, 재조합 ACVR1 유전자의 코돈 조성은 ACVR1의 아미노산 서열을 변경시키지 않으면서 개선 또는 최적화될 수 있다. 일부 실시양태에서, 코돈 최적화된 ACVR1은 ACVR1-R206H의 경쟁적 억제제이다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 코돈 최적화된 ACVR1은 결합에 대해 돌연변이된 ACVR1, 예컨대 ACVR1-R206H와 경쟁한다.
일부 실시양태에서, 코돈 최적화된 ACVR1은 서열식별번호: 1에 제시된 바와 같은 서열을 포함한다. 일부 실시양태에서, 코돈 최적화된 ACVR1을 포함하는 벡터 구축물은 서열식별번호: 2-4에 제시된 바와 같은 서열을 포함한다. 일부 실시양태에서, 코돈 최적화된 ACVR1을 운반하는 rAAV-매개된 유전자 전달은 유전자 부가 플랫폼이다. 일부 실시양태에서, 코돈-최적화된 야생형 인간 ACVR1 cDNA는 크기가 약 1.5 kb이다 (도 2).
일부 실시양태에서, 트랜스진은 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 프로모터는 코돈 최적화된 ACVR1의 발현을 유도하는 데 적합한 임의의 프로모터일 수 있다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 CBA 인트론을 포함한다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 매스바이올로직스 신규 (MBL) 인트론 (예를 들어, 서열식별번호: 37)을 포함한다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 합성 인트론을 포함한다. 일부 실시양태에서, CBA 인트론은 MBL 인트론 또는 합성 인트론에 의해 치환될 수 있다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 합성 인트론은 부분적으로 내인성 인트론으로 치환될 수 있고, 이는 증진된 mRNA 생산으로 이어질 수 있다. 일부 실시양태에서, CBA 프로모터는 코돈 최적화된 ACVR1을 위해 설계된 벡터 구축물에 적합한 임의의 프로모터를 포함할 수 있다. 일부 측면에서, MBL 인트론 및/또는 합성 인트론의 사용은 벡터 게놈의 크기를 감소시키고, 바람직하게는 적어도 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 또는 25%만큼 감소된다. 일부 실시양태에서, 트랜스진에 AAV 역전된 말단 반복부 (ITR)가 플랭킹된다.
일부 실시양태에서, 단리된 핵산, 벡터, 또는 rAAV는 1종 이상 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10종, 또는 그 초과)의 억제 핵산, 예를 들어 dsRNA, siRNA, shRNA, miRNA, 인공 마이크로RNA (ami-RNA) 등을 코딩한다. 일반적으로, 억제 핵산은 FOP와 연관된 유전자 생성물 (예를 들어, 단백질) (예를 들어, ACVR1)을 코딩하는 유전자의 적어도 2개 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25개 또는 그 초과)의 연속 염기에 특이적으로 결합한다 (예를 들어, 혼성화한다). 본원에 사용된 "연속 염기"는 (예를 들어, 핵산 분자의 일부로서) 서로 (예를 들어, 1개 이상의 포스포디에스테르 결합 등에 의해) 공유 결합된 2개 이상의 뉴클레오티드 염기를 지칭한다. 일부 실시양태에서, 적어도 1종의 억제 핵산은 FOP와 연관된 유전자 생성물 (예를 들어, 단백질) (예를 들어, ACVR1)을 코딩하는 유전자의 2개 이상 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25개, 또는 그 초과)의 연속 뉴클레오티드 염기와 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95%, 약 99% 또는 약 100% 동일하다.
"마이크로RNA" 또는 "miRNA"는 전사 또는 번역후 유전자 침묵을 매개할 수 있는 작은 비-코딩 RNA 분자이다. 전형적으로, miRNA는 1차 miRNA (pri-miRNA)로 지칭되는 헤어핀 또는 스템-루프 (예를 들어, 자기-상보성, 단일-가닥 백본을 가짐) 듀플렉스 구조로서 전사되고, 이는 효소적으로 (예를 들어, 드로샤, DGCR8, 파샤 등에 의해) pre-miRNA로 프로세싱된다. pri-miRNA의 길이는 다양할 수 있다. 일부 실시양태에서, pri-miRNA는 약 100 내지 약 5000개 염기 쌍 (예를 들어, 약 100, 약 200, 약 500, 약 1000, 약 1200, 약 1500, 약 1800, 또는 약 2000개 염기 쌍) 길이 범위이다. 일부 실시양태에서, pri-miRNA는 200개 초과의 염기 쌍 길이 (예를 들어, 2500, 5000, 7000, 9000개, 또는 그 초과의 염기 쌍 길이)이다.
헤어핀 또는 스템-루프 듀플렉스 구조를 또한 특징으로 하는 pre-miRNA도 또한 길이가 다양할 수 있다. 일부 실시양태에서, pre-miRNA는 크기가 약 40개 염기 쌍 길이 내지 약 500개 염기 쌍 길이 범위이다. 일부 실시양태에서, pre-miRNA는 크기가 약 50 내지 100개 염기 쌍 길이 범위이다. 일부 실시양태에서, pre-miRNA는 크기가 약 50 내지 약 90개 염기 쌍 길이 (예를 들어, 약 50, 약 52, 약 54, 약 56, 약 58, 약 60, 약 62, 약 64, 약 66, 약 68, 약 70, 약 72, 약 74, 약 76, 약 78, 약 80, 약 82, 약 84, 약 86, 약 88, 또는 약 90개 염기 쌍 길이) 범위이다.
일반적으로, pre-miRNA는 세포질 내로 유출되고, 다이서에 의해 효소적으로 프로세싱되어 먼저 불완전한 miRNA/miRNA* 듀플렉스 및 이어서 단일-가닥 성숙 miRNA 분자가 생산되고, 이는 후속적으로 RNA-유도된 침묵 복합체 (RISC) 내로 로딩된다. 전형적으로, 성숙 miRNA 분자는 크기가 약 19 내지 약 30개 염기 쌍 길이 범위이다. 일부 실시양태에서, 성숙 miRNA 분자는 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 또는 30개 염기 쌍 길이이다.
일부 측면에서, 본 개시내용은 1개 이상의 인공 miRNA를 코딩하는 단리된 핵산, 벡터 (예를 들어, rAAV 벡터)를 제공한다. 본원에 사용된 "인공 miRNA" 또는 "amiRNA"는, 예를 들어 문헌 [Eamens et al., (2014), Methods Mol. Biol. 1062:211-224]에 기재된 바와 같이, miRNA 및 miRNA* (예를 들어, miRNA 듀플렉스의 패신저 가닥) 서열이 표적화된 유전자의 고도로 효율적인 RNA 침묵을 지시하는 상응하는 amiRNA/amiRNA* 서열로 대체된, 내인성 pri-miRNA 또는 pre-miRNA (예를 들어, 기능적 성숙 miRNA를 생산할 수 있는 전구체 miRNA인 miRNA 백본)를 지칭한다. 예를 들어, 일부 실시양태에서, 인공 miRNA는 골 대사 조정 (예를 들어, 골 형성 억제제) miRNA를 코딩하는 서열이 내인성 miR-33 성숙 miRNA-코딩 서열 대신 삽입된, miR-33 pri-miRNA 백본을 포함한다. 일부 실시양태에서, 본 개시내용에 기재된 바와 같은 miRNA (예를 들어, 인공 miRNA)는 miR-33 백본 서열을 포함한다.
일부 실시양태에서, 벡터는 플라스미드, 바크미드, 코스미드, 바이러스, 폐쇄형-단부 선형 DNA (ceDNA), 또는 바큘로바이러스 벡터이다.
일부 실시양태에서, 본 개시내용은 ACVR1 단백질을 코딩하는, AVCR1 유전자를 표적화하는 인공 miRNA를 코딩하는 트랜스진을 포함하는 단리된 핵산을 제공한다. ACVR1 (ALK2)은 세포외 리간드 결합 도메인 (LBD), 막횡단 도메인 (TM), 글리신-세린-풍부 도메인 (GS) 및 세린/트레오닌 키나제 도메인을 함유하는 유형 1 BMP 수용체이다. ACVR1에서의 상염색체 우성 돌연변이는 단일유전자 골격 희귀 질환인 FOP의 발생으로 이어진다. 대다수의 FOP 환자는 전형적인 단일 점 돌연변이 (ACVR1-R206H, G>A)를 보유하며, 이는 골 형태발생 단백질 (BMP) 신호전달 경로의 자발적 활성화를 발생시킨다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 액티빈 A도 또한 FOP에서 ACVR1에 대한 리간드로서 확인된다. 정상 조건 하에, 야생형 ACVR1 수용체에 대한 액티빈 A 결합은 SMAD2/3 경로를 통한 TGF-β 신호전달로 이어지고, 이는 야생형 ACVR1에서 BMP 신호전달의 경쟁적 억제제로서 기능한다. ACVR1이 돌연변이되는 경우, ACVR1-R206H 수용체에 대한 액티빈 A 결합은 SMAD1/5/9 경로를 통해 BMP 신호전달을 활성화시켜 골 형성을 발생시킨다.
일부 측면에서, 본 개시내용은 ACVR1 발현을 감소시키는 데 사용되는 인공 마이크로RNA를 코딩하는 트랜스진을 포함하는 단리된 핵산에 관한 것이다. 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 발현을 억제하는 데 사용된다. 일부 실시양태에서, ACVR1은 돌연변이된다. 일부 실시양태에서, FOP와 연관된 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13개의 돌연변이 ACVR1 돌연변이가 확인된다 (도 1a). 일부 실시양태에서, ACVR1은 단일 점 돌연변이 (ACVR1-R206H, G>A)를 보유한다. 일부 실시양태에서, ACVR1 돌연변이는 인간 ACVR1-R206H이다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, FOP 환자의 대략 97%는 ACVR1 유전자에서 상염색체 우성 돌연변이 (G>A)를 보유하며, 위치 206에서 아르기닌의 히스티딘으로의 치환 (R206H, G>A)을 갖는다 (도 1a). 일부 실시양태에서, 마이크로RNA에 대한 벡터 구축물에 사용되는 바와 같은 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 마이크로RNA에 대한 벡터 구축물에 사용되는 바와 같은 프로모터는 마이크로RNA의 발현에 적합한 임의의 프로모터일 수 있다.
일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 적어도 6개의 연속 뉴클레오티드를 표적화한다 (예를 들어, 그에 결합하거나, 또는 그와 상보성인 영역을 포함한다). 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 6 내지 30개의 연속 뉴클레오티드를 표적화한다 (예를 들어, 그에 결합하거나, 또는 그와 상보성인 영역을 포함한다). 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 12-24개의 연속 뉴클레오티드를 표적화한다. 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 9-27개의 연속 뉴클레오티드를 표적화한다. 일부 실시양태에서, 인공 마이크로RNA는 ACVR1 유전자의 적어도 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 연속 뉴클레오티드를 표적화한다.
일부 실시양태에서, 인공 마이크로RNA는 6-50개 뉴클레오티드 길이이다. 일부 실시양태에서, 인공 마이크로RNA는 8-24개 뉴클레오티드 길이이다. 일부 실시양태에서, 인공 마이크로RNA는 12-36개 뉴클레오티드 길이이다. 일부 실시양태에서, 인공 마이크로RNA는 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개 뉴클레오티드 길이이다.
일부 실시양태에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 표적 유전자의 발현을 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 감소시킨다. 일부 측면에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 표적 유전자의 발현을 75% 내지 90%만큼 감소시킨다. 일부 측면에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 표적 유전자의 발현을 80% 내지 99%만큼 감소시킨다. 일부 실시양태에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 ACVR1 유전자의 발현을 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 감소시킨다. 일부 실시양태에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 ACVR1 유전자의 발현을 75% 내지 90%만큼 감소시킨다. 일부 측면에서, 단리된 억제 핵산, 예컨대 인공 마이크로RNA는 ACVR1 유전자의 발현을 80% 내지 99%만큼 감소시킨다.
트랜스진을 포함하는 영역 (예를 들어, 제2 영역, 제3 영역, 제4 영역 등)은 단리된 핵산의 임의의 적합한 위치에 위치할 수 있다. 영역은 예를 들어 인트론, 5' 또는 3' 비번역 영역 등을 포함하는 핵산의 임의의 비번역 부분에 위치할 수 있다.
일부 경우에, 단백질을 코딩하는 핵산 서열 (예를 들어, 단백질 코딩 서열)의 제1 코돈의 상류에 영역 (예를 들어, 제2 영역, 제3 영역, 제4 영역 등)이 위치하는 것이 바람직할 수 있다. 예를 들어, 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 2000개 뉴클레오티드 사이에 위치할 수 있다. 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 1000개 뉴클레오티드 사이에 위치할 수 있다. 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 500개 뉴클레오티드 사이에 위치할 수 있다. 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 250개 뉴클레오티드 사이에 위치할 수 있다. 영역은 단백질 코딩 서열의 제1 코돈과 제1 코돈의 상류의 150개 뉴클레오티드 사이에 위치할 수 있다.
일부 경우에 (예를 들어, 트랜스진에 단백질 코딩 서열이 결여된 경우에), 트랜스진의 폴리-A 테일의 상류에 영역 (예를 들어, 제2 영역, 제3 영역, 제4 영역 등)이 위치하는 것이 바람직할 수 있다. 예를 들어, 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 2000개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 1000개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 500개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 250개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 150개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 100개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 50개 뉴클레오티드 사이에 위치할 수 있다. 영역은 폴리-A 테일의 제1 염기와 제1 염기의 상류의 20개 뉴클레오티드 사이에 위치할 수 있다. 일부 실시양태에서, 영역은 프로모터 서열의 마지막 뉴클레오티드 염기와 폴리-A 테일 서열의 제1 뉴클레오티드 염기 사이에 위치한다.
일부 경우에, 영역은 트랜스진의 폴리-A 테일의 마지막 염기의 하류에 위치할 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 2000개 뉴클레오티드 위치 사이에 있을 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 1000개 뉴클레오티드 위치 사이에 있을 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 500개 뉴클레오티드 위치 사이에 있을 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 250개 뉴클레오티드 위치 사이에 있을 수 있다. 영역은 폴리-A 테일의 마지막 염기와 마지막 염기의 하류의 150개 뉴클레오티드 위치 사이에 있을 수 있다.
트랜스진이 1개 초과의 miRNA를 코딩하는 경우에, 각각의 miRNA는 트랜스진 내의 임의의 적합한 위치에 위치할 수 있는 것으로 인지되어야 한다. 예를 들어, 제1 miRNA를 코딩하는 핵산은 트랜스진의 인트론에 위치할 수 있고, 제2 miRNA를 코딩하는 핵산 서열은 또 다른 비번역 영역에 (예를 들어, 단백질 코딩 서열의 마지막 코돈과 트랜스진의 폴리-A 테일의 제1 염기 사이에) 위치할 수 있다.
일부 실시양태에서, 트랜스진은 1개 이상의 발현 제어 서열 (예를 들어, 프로모터 등)을 코딩하는 핵산 서열을 추가로 포함한다. 발현 제어 서열은 적절한 전사 개시, 종결, 프로모터 및 인핸서 서열; 효율적인 RNA 프로세싱 신호, 예컨대 스플라이싱 및 폴리아데닐화 (폴리A) 신호; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 증진시키는 서열 (즉, 코작 컨센서스 서열); 단백질 안정성을 증진시키는 서열; 및 원하는 경우에, 코딩된 생성물의 분비를 증진시키는 서열을 포함한다. 천연, 구성적, 유도성 및/또는 조직-특이적인 프로모터를 비롯한 많은 수의 발현 제어 서열이 관련 기술분야에 공지되어 있고 이용될 수 있다.
"프로모터"는 유전자의 특이적 전사를 개시하는 데 요구되는, 세포의 합성 기구 또는 도입된 합성 기구에 의해 인식되는 DNA 서열을 지칭한다. 어구 "작동가능하게 위치한", "제어 하" 또는 "전사 제어 하"는 프로모터가 RNA 폴리머라제 개시 및 유전자의 발현을 제어하기 위해 핵산과 관련하여 정확한 위치 및 배향으로 있음을 의미한다.
단백질을 코딩하는 핵산의 경우, 폴리아데닐화 서열은 일반적으로 트랜스진 서열 다음에 및 3' AAV ITR 서열 앞에 삽입된다. 본 개시내용에 유용한 rAAV 구축물은 또한 바람직하게는 프로모터/인핸서 서열과 트랜스진 사이에 위치하는 인트론을 함유할 수 있다. 본원에 개시된 바와 같이, 하나의 가능한 인트론 서열은 SV-40으로부터 유래되고, SV-40 T 인트론 서열로 지칭된다. 사용될 수 있는 또 다른 벡터 요소는 내부 리보솜 진입 부위 (IRES)이다. IRES 서열은 단일 유전자 전사체로부터 1종 초과의 폴리펩티드를 생산하는 데 사용된다. IRES 서열은 1개 초과의 폴리펩티드 쇄를 함유하는 단백질을 생산하는 데 사용될 것이다. 이들 및 다른 공통 벡터 요소의 선택은 통상적이며, 많은 이러한 서열이 이용가능하다 [예를 들어, 문헌 [Sambrook et al.] 및 그에 인용된 참고문헌, 예를 들어 페이지 3.18 3.26 및 16.17 16.27 및 문헌 [Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1989] 참조]. 일부 실시양태에서, 구제역 바이러스 2A 서열은 폴리단백질에 포함되고; 이는 폴리단백질의 절단을 매개하는 것으로 밝혀진 작은 펩티드 (대략 18개 아미노산 길이)이다 (Ryan, M D et al., EMBO, 1994; 4: 928-933; Mattion, N M et al., J Virology, November 1996; p. 8124-8127; Furler, S et al., Gene Therapy, 2001; 8: 864-873; 및 Halpin, C et al., The Plant Journal, 1999; 4: 453-459). 2A 서열의 절단 활성은 플라스미드 및 유전자 요법 벡터 (AAV 및 레트로바이러스)를 포함한 인공 시스템에서 이전에 입증되었다 (Ryan, M D et al., EMBO, 1994; 4: 928-933; Mattion, N M et al., J Virology, November 1996; p. 8124-8127; Furler, S et al., Gene Therapy, 2001; 8: 864-873; and Halpin, C et al., The Plant Journal, 1999; 4: 453-459; de Felipe, P et al., Gene Therapy, 1999; 6: 198-208; de Felipe, P et al., Human Gene Therapy, 2000; 11: 1921-1931.; 및 Klump, H et al., Gene Therapy, 2001; 8: 811-817).
구성적 프로모터의 예는, 비제한적으로, 레트로바이러스 라우스 육종 바이러스 (RSV) LTR 프로모터 (임의로 RSV 인핸서를 가짐), 시토메갈로바이러스 (CMV) 프로모터 (임의로 CMV 인핸서를 가짐) [예를 들어, 문헌 [Boshart et al., Cell, 41:521-530 (1985)] 참조], SV40 프로모터, 디히드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제 (PGK) 프로모터, 및 EF1α 프로모터 [인비트로젠(Invitrogen)]를 포함한다. 일부 실시양태에서, 프로모터는 증진된 닭 β-액틴 프로모터이다. 일부 실시양태에서, 프로모터는 U6 프로모터이다.
유도성 프로모터는 유전자 발현의 조절을 가능하게 하고, 외인적으로 공급된 화합물, 환경 요인, 예컨대 온도, 또는 특정 생리학적 상태, 예를 들어 급성기, 세포의 특정한 분화 상태의 존재에 의해, 또는 오직 복제 세포에서만 조절될 수 있다. 유도성 프로모터 및 유도성 시스템은 비제한적으로 인비트로젠, 클론테크(Clontech) 및 아리아드(Ariad)를 포함한 다양한 상업적 공급원으로부터 입수가능하다. 많은 다른 시스템이 기재되어 있고, 관련 기술분야의 통상의 기술자에 의해 용이하게 선택될 수 있다. 외인적으로 공급되는 프로모터에 의해 조절되는 유도성 프로모터의 예는 아연-유도성 양 메탈로티오닌 (MT) 프로모터, 덱사메타손 (Dex)-유도성 마우스 유방 종양 바이러스 (MMTV) 프로모터, T7 폴리머라제 프로모터 시스템 (WO 98/10088); 엑디손 곤충 프로모터 (No et al., Proc. Natl. Acad. Sci. USA, 93:3346-3351 (1996)), 테트라시클린-억제성 시스템 (Gossen et al., Proc. Natl. Acad. Sci. USA, 89:5547-5551 (1992)), 테트라시클린-유도성 시스템 (Gossen et al., Science, 268:1766-1769 (1995), 또한 문헌 [Harvey et al., Curr. Opin. Chem. Biol., 2:512-518 (1998)] 참조), RU486-유도성 시스템 (Wang et al., Nat. Biotech., 15:239-243 (1997) 및 Wang et al., Gene Ther., 4:432-441 (1997)) 및 라파마이신-유도성 시스템 (Magari et al., J. Clin. Invest., 100:2865-2872 (1997))을 포함한다. 이와 관련하여 유용할 수 있는 또 다른 유형의 유도성 프로모터는 특정 생리학적 상태, 예를 들어 온도, 급성기, 세포의 특정한 분화 상태에 의해, 또는 오직 복제 세포에서만 조절되는 것이다.
또 다른 실시양태에서, 트랜스진에 대한 천연 프로모터가 사용될 것이다. 천연 프로모터는 트랜스진의 발현이 천연 발현을 모방할 것을 목적으로 하는 경우에 바람직할 수 있다. 천연 프로모터는 트랜스진의 발현이 일시적으로 또는 발생적으로, 또는 조직-특이적 방식으로, 또는 특이적 전사 자극에 반응하여 조절되어야 하는 경우에 사용될 수 있다. 추가 실시양태에서, 다른 천연 발현 제어 요소, 예컨대 인핸서 요소, 폴리아데닐화 부위 또는 코작 컨센서스 서열이 또한 천연 발현을 모방하기 위해 사용될 수 있다.
본 개시내용의 측면은 1개 초과의 프로모터 (예를 들어, 2, 3, 4, 5개, 또는 그 초과의 프로모터)를 포함하는 단리된 핵산에 관한 것이다. 예를 들어, 단백질을 코딩하는 제1 영역 및 억제 RNA (예를 들어, miRNA)를 코딩하는 제2 영역을 포함하는 트랜스진을 갖는 구축물과 관련하여, 제1 프로모터 서열 (예를 들어, 단백질 코딩 영역에 작동가능하게 연결된 제1 프로모터 서열)을 사용하여 단백질 코딩 영역의 발현을 구동하고, 제2 프로모터 서열 (예를 들어, 억제 RNA 코딩 영역에 작동가능하게 연결된 제2 프로모터 서열)을 사용하여 억제 RNA 코딩 영역의 발현을 구동하는 것이 바람직할 수 있다. 일반적으로, 제1 프로모터 서열 및 제2 프로모터 서열은 동일한 프로모터 서열 또는 상이한 프로모터 서열일 수 있다. 일부 실시양태에서, 제1 프로모터 서열 (예를 들어, 단백질 코딩 영역의 발현을 구동하는 프로모터)은 RNA 폴리머라제 III (polIII) 프로모터 서열이다. polIII 프로모터 서열의 비제한적 예는 U6 및 H1 프로모터 서열을 포함한다. 일부 실시양태에서, 제2 프로모터 서열 (예를 들어, 억제 RNA의 발현을 구동하는 프로모터 서열)은 RNA 폴리머라제 II (polII) 프로모터 서열이다. polII 프로모터 서열의 비제한적 예는 7, T3, SP6, RSV 및 시토메갈로바이러스 프로모터 서열을 포함한다. 일부 실시양태에서, polIII 프로모터 서열은 억제 RNA (예를 들어, miRNA) 코딩 영역의 발현을 구동한다. 일부 실시양태에서, polII 프로모터 서열은 단백질 코딩 영역의 발현을 구동한다. 일부 실시양태에서, 제1 프로모터 서열 (예를 들어, 단백질 코딩 영역의 발현을 구동하는 프로모터)은 BMP 반응 요소 (pBRE) 프로모터 서열이고, 제2 프로모터 서열 (예를 들어, 억제 RNA 코딩 영역에 작동가능하게 연결된 제2 프로모터 서열)은 NF-kB 프로모터 서열이다.
본원에 개시된 바와 같이, 표적 유전자 ACVR1의 발현을 감소시키는 인공 마이크로RNA (ami-RNA)는 서열식별번호: 5에 제시된 서열에 의해 코딩된 RH1 ami-RNA, 서열식별번호: 6에 제시된 서열에 의해 코딩된 RH2 ami-RNA, 서열식별번호: 56에 제시된 서열에 의해 코딩된 RH3 ami-RNA, 서열식별번호: 57에 제시된 서열에 의해 코딩된 RH4 ami-RNA, 서열식별번호: 58에 제시된 서열에 의해 코딩된 RH5 ami-RNA, 서열식별번호: 59에 제시된 서열에 의해 코딩된 RH6 ami-RNA, 서열식별번호: 60에 제시된 서열에 의해 코딩된 RH7 ami-RNA, 서열식별번호: 61에 제시된 서열에 의해 코딩된 RH8 ami-RNA, 서열식별번호: 62에 제시된 서열에 의해 코딩된 RH9 ami-RNA, 서열식별번호: 63에 제시된 서열에 의해 코딩된 RH10 ami-RNA, 서열식별번호: 64에 제시된 서열에 의해 코딩된 RH11 ami-RNA, 및 서열식별번호: 65에 제시된 서열에 의해 코딩된 RH12 ami-RNA로부터 선택된다 (도 3). 일부 실시양태에서, 표적 유전자 ACVR1의 발현을 감소시키는 ami-RNA는 서열식별번호: 5에 제시된 서열에 의해 코딩된 RH1 ami-RNA, 서열식별번호: 6에 제시된 서열에 의해 코딩된 RH2 ami-RNA, 서열식별번호: 57에 제시된 서열에 의해 코딩된 RH4 ami-RNA, 서열식별번호: 58에 제시된 서열에 의해 코딩된 RH5 ami-RNA, 서열식별번호: 59에 제시된 서열에 의해 코딩된 RH6 ami-RNA, 및 서열식별번호: 60에 제시된 서열에 의해 코딩된 RH7 ami-RNA이다. 일부 실시양태에서, 표적 유전자 ACVR1의 발현을 감소시키는 ami-RNA는 야생형 ACVR1의 발현에 영향을 미치지 않는다. 일부 실시양태에서, 표적 유전자 ACVR1의 발현을 감소시키는 ami-RNA는 코돈 최적화된 ACVR1의 발현에 영향을 미치지 않는다. 일부 실시양태에서, 돌연변이된 ACVR1을 표적화하는 ami-RNA를 운반하는 rAAV-매개된 유전자 전달은 본원에 개시된 바와 같은 유전자 대체 플랫폼이다.
본 개시내용의 측면은 ACVR1 발현을 감소시키기 위한 인공 마이크로RNA를 코딩하는 트랜스진 및 적어도 1개의 코돈 최적화된 ACVR1 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 코돈 최적화된 ACVR1)을 코딩하는 트랜스진을 포함하는 단리된 핵산을 포함하는 단리된 핵산에 관한 것이다. 일부 실시양태에서, amiR-ACVR1-RH (예를 들어, amiR-33) 및 코돈 최적화된 ACVR1의 공동발현은 ACVR1-R206H mRNA를 야생형 ACVR1 mRNA로 대체한다. 본원에 사용된 ACVR1-R206H mRNA를 야생형 ACVR1 mRNA로 "대체한다"는 것은 돌연변이된 ACVR1 유전자 (예를 들어, ACVR1-R206H)의 발현이 코돈 최적화된 ACVR1의 경쟁적 결합으로 인해 감소 또는 억제된다는 것을 의미한다. 일부 실시양태에서, 돌연변이된 ACVR1 유전자 (예를 들어, ACVR1-R206H)의 적어도 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및 그 안의 모든 범위 및 하위범위가 감소 또는 억제된다. 일부 실시양태에서, 야생형 ACVR1 유전자 (예를 들어, 코돈 최적화된 ACVR1)의 적어도 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및 그 안의 모든 범위 및 하위범위가 돌연변이된 ACVR1 유전자 (예를 들어, ACVR1-R206H)를 대체한다.
일부 측면에서, ACVR1 발현을 감소시키기 위한 인공 마이크로RNA를 코딩하는 트랜스진 및 적어도 1개의 코돈 최적화된 ACVR1을 코딩하는 트랜스진을 포함하는 단리된 핵산을 포함하는 단리된 핵산은 프로모터를 포함한다. 일부 실시양태에서, 벡터 구축물에 사용되는 바와 같은 프로모터는 닭 베타-액틴 (CBA) 프로모터이다. 일부 실시양태에서, 벡터 구축물에 사용되는 바와 같은 프로모터는 임의의 프로모터 적합한 유전자 대체 플랫폼일 수 있다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 매스바이올로직스 신규 (MBL) 인트론을 포함한다. 일부 실시양태에서, CBA 프로모터는 벡터 내에 합성 인트론을 포함한다. 일부 실시양태에서, CBA 인트론은 본원에 개시된 바와 같은 단리된 핵산에서 MBL 인트론 또는 합성 인트론에 의해 치환될 수 있다.
유전자 편집 분자
일부 측면에서, 본 개시내용은 ACVR1 유전자의 표적 핵산 서열에 특이적으로 혼성화하는 단일 가이드 RNA (sgRNA), 제1 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제1 rAAV 입자, 및 제2 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제2 rAAV 입자를 포함하는 재조합 유전자 편집 복합체를 제공한다.
일부 실시양태에서, 제1 재조합 유전자 편집 단백질은 Cas9-기반 아데닌 염기 편집제 (ABE) N-말단 부분 및 그의 단편을 포함한다. 일부 실시양태에서, 제2 재조합 유전자 편집 단백질은 Cas9-기반 아데닌 염기 편집제 (ABE) C-말단 부분 및 그의 단편을 포함한다.
일부 실시양태에서, 재조합 유전자 편집 복합체는 프로토스페이서 인접 모티프를 추가로 포함한다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 프로토스페이서 인접 모티프 (PAM)는 CRISPR 박테리아 적응 면역계에서 Cas9 뉴클레아제에 의해 표적화되는 DNA 서열 바로 다음의 2-6-염기 쌍 DNA 서열이다. PAM은 침입 바이러스 또는 플라스미드의 성분이지만, 박테리아 숙주 게놈에서는 발견되지 않고, 따라서 박테리아 CRISPR 유전자좌의 성분이 아니다.
본원에 사용된 "유전자 편집 복합체"는, 예를 들어 표적 DNA에서 1개 이상의 이중 가닥 파괴 (DSB)를 유발함으로써 게놈 서열 (예를 들어, 유전자 서열)을 부가, 파괴 또는 변화시키도록 구성된 생물학적 활성 분자 (예를 들어, 단백질, 1개 이상의 단백질, 핵산, 1개 이상의 핵산, 또는 상기의 임의의 조합)를 지칭한다. 유전자 편집 복합체의 예는 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN), 아연 핑거 뉴클레아제 (ZFN), 조작된 메가뉴클레아제 재조작된 귀소 엔도뉴클레아제, CRISPR/Cas 시스템, 및 메가뉴클레아제 (예를 들어, 메가뉴클레아제 I-SceI)를 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 유전자 편집 복합체는 Cas9, Cas6, Cpf1, CRISPR RNA (crRNA), 트랜스-활성화 crRNA (tracrRNA), 및 그의 변이체를 포함하나 이에 제한되지는 않는, CRISPR/Cas 시스템과 관련된 단백질 또는 분자 (예를 들어, 재조합 유전자 편집 단백질)를 포함한다.
일부 실시양태에서, 재조합 유전자 편집 단백질은 뉴클레아제이다. 본원에 사용된 용어 "엔도뉴클레아제" 및 "뉴클레아제"는 폴리뉴클레오티드 쇄 내의 포스포디에스테르 결합 또는 결합들을 절단하는 효소를 지칭한다. 뉴클레아제는 자연 발생이거나 또는 유전자 조작될 수 있다. 유전자 조작된 뉴클레아제는 게놈 편집에 특히 유용하고, 일반적으로 4가지 패밀리: 아연 핑거 뉴클레아제 (ZFN), 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN), 메가뉴클레아제 (예를 들어, 조작된 메가뉴클레아제) 및 CRISPR-연관 단백질 (Cas 뉴클레아제)로 분류된다. 일부 실시양태에서, 뉴클레아제는 ZFN이다. 일부 실시양태에서, ZFN은 FokI 절단 도메인을 포함한다. 일부 실시양태에서, ZFN은 Cys2His2 폴드 기를 포함한다. 일부 실시양태에서, 뉴클레아제는 TALEN이다. 일부 실시양태에서, TALEN은 FokI 절단 도메인을 포함한다. 일부 실시양태에서, 뉴클레아제는 메가뉴클레아제이다. 메가뉴클레아제의 예는 I-SceI, I-CreI, I-DmoI, 및 그의 조합 (예를 들어, E-DreI, DmoCre)을 포함하나 이에 제한되지는 않는다.
용어 "CRISPR"은 염기 서열의 짧은 반복을 함유하는 DNA 유전자좌인 "클러스터링된 규칙적 간격의 짧은 회문식 반복부"를 지칭한다. CRISPR 유전자좌는 외래 유전 물질에 대한 저항성을 부여하는 원핵 적응 면역계의 부분을 형성한다. 각각의 CRISPR 유전자좌에는 바이러스 게놈 물질로부터 유래된 "스페이서 DNA"의 짧은 절편이 플랭킹된다. 유형 II CRISPR 시스템에서, 스페이서 DNA는 전사활성화 RNA (tracrRNA)에 혼성화하고, CRISPR-RNA (crRNA)로 프로세싱되고, 후속적으로 CRISPR-연관 뉴클레아제 (Cas 뉴클레아제)와 회합하여 외래 DNA를 인식하고 분해하는 복합체를 형성한다. 특정 실시양태에서, 뉴클레아제는 CRISPR-연관 뉴클레아제 (Cas 뉴클레아제)이다. CRISPR 뉴클레아제의 예는 Cas9, dCas9, Cas6, Cpf1 및 그의 변이체를 포함하나, 이에 제한되지는 않는다. 일부 실시양태에서, 뉴클레아제는 Cas9이다. 일부 실시양태에서, Cas9는 박테리아 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) (예를 들어, SpCas9) 또는 스타필로코쿠스 아우레우스(Staphylococcus aureus) (예를 들어, SaCas9)로부터 유래된다. 일부 실시양태에서, Cas 단백질 또는 그의 변이체는, 예를 들어 문헌 [Ran et al., (2015) Nature. 520(7546); 186-91]에 기재된 바와 같이, 바이러스 벡터, 예컨대 렌티바이러스 벡터 또는 아데노-연관 바이러스 (AAV) 벡터의 패키징 능력을 초과하지 않는다. 예를 들어, 일부 실시양태에서, Cas 단백질을 코딩하는 핵산은 약 4.6 kb 미만의 길이이다.
게놈 편집의 목적을 위해, CRISPR 시스템은 tracrRNA 및 crRNA를 단일 가이드 RNA (sgRNA) 또는 단지 (gRNA)로 조합하도록 변형될 수 있다. 본원에 사용된 용어 "가이드 RNA", "gRNA" 및 "sgRNA"는 세포 내 표적 서열에 상보적이고 Cas 뉴클레아제와 회합하여 Cas 뉴클레아제를 표적 서열로 지시하는 폴리뉴클레오티드 서열을 지칭한다. 일부 실시양태에서, gRNA (예를 들어, sgRNA)는 1 내지 30개 뉴클레오티드 범위의 길이이다. 일부 실시양태에서, gRNA (예를 들어, sgRNA)는 5 내지 25개 뉴클레오티드 범위의 길이이다. 일부 실시양태에서, gRNA (예를 들어, sgRNA)는 10 내지 22개 뉴클레오티드 범위의 길이이다. 일부 실시양태에서, gRNA (예를 들어, sgRNA)는 14 내지 24개 뉴클레오티드 범위의 길이이다. 일부 실시양태에서, Cas 단백질 및 가이드 RNA (예를 들어, sgRNA)는 동일한 벡터로부터 발현된다. 일부 실시양태에서, Cas 단백질 및 가이드 RNA (예를 들어, sgRNA)는 별개의 벡터 (예를 들어, 2개 이상의 벡터)로부터 발현된다. 전형적으로, 가이드 RNA (예를 들어, gRNA 또는 sgRNA)는 표적 서열에 혼성화하고 (예를 들어 왓슨-크릭 염기 쌍형성에 의해, 예를 들어 특이적으로 결합함), 따라서 CRISPR/Cas 단백질 또는 단순 단백질을 표적 서열로 지시한다. 일부 실시양태에서, 가이드 RNA는 핵산 서열에 혼성화한다 (예를 들어, 표적화한다).
본원에 개시된 바와 같이, 재조합 유전자 편집 복합체는 Cas9-기반 아데닌 염기 편집제 (ABE)를 포함한다. rAAV에 상용성인 Cas9-기반 아데닌 염기 편집제 (ABE)는 이중-가닥 DNA 파괴를 생성하지 않으면서 표적 염기 쌍을 상이한 염기 쌍으로 직접 전환시키기 위해 개발되었다. 따라서, rAAV9-상용성 ABE 구축물을 사용하여 ACVR1-R206H 대립유전자에서 "A"를 "G"로 전환시켰다. ABE는 염기 편집제의 이중-AAV 패키징을 가능하게 하는 트랜스-스플라이싱 인테인 서열을 사용하여 AAV 패키징 크기 한계 (~ 4.7kb)보다 작은 절반으로 나뉜다. 이론에 얽매이는 것을 원하지는 않지만, AAV를 통한 전달은 AAV 패키징 능력에 의해 제한되며, 이는 전장 염기 편집제의 사용을 불가능하게 한다. 이어서 트랜스-스플라이싱 인테인에 의해 재구성되는 분할 시토신 및 아데닌 염기 편집제의 전달을 위한 이중 AAV의 적용. 일부 실시양태에서, 본원에 개시된 바와 같은 ABE는 N-말단 ABE 구축물 및 C-말단 ABE 구축물로 나뉜다. 일부 실시양태에서, ABE는 트랜스-스플라이싱 인테인 서열을 사용하는 것에 의해 나뉜다. 일부 실시양태에서, N-말단 ABE 구축물은 ACVR1-R206H 돌연변이를 갖는 프로토스페이서를 포함한다. 일부 실시양태에서, C-말단 ABE 구축물은 AAV6.2 또는 AAV9 캡시드 단백질 내로 통합된다. 일부 실시양태에서, ABE는 ACVR1-R206H 대립유전자에서 아데닌을 구아닌으로 전환시킨다.
본 개시내용은 NF-kB 프로모터 (pNF-kB)를 포함하는 제1 트랜스진 및 골 형태발생 단백질 프로모터 (pBRE)를 포함하는 제2 트랜스진을 포함하는 단리된 핵산을 제공한다. 일부 실시양태에서, pNF-kB는 가용성 폴리스타틴 (sFST)의 발현을 유도한다. 일부 실시양태에서, pBRE는 TNFR2의 발현을 유도한다. 일부 실시양태에서, 액티빈 A는 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, BMP 리간드는 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, 염증은 sFST 및 TNFR2의 발현을 촉발한다. 일부 실시양태에서, 단리된 핵산은 인간 가용성 IL1Rα (sIL1Rα) (서열식별번호: 35)의 발현을 유도한다. 류마티스 관절염을 치료하는 인터류킨 1 수용체 길항제 단백질인 아나킨라 (키네레트)는 FOP의 진행을 효과적으로 늦추는 것으로 제시되었다. 본원에 개시된 바와 같은 단리된 핵산은 예를 들어 액티빈 A 길항제, TNF 길항제 및 IL-1 길항제의 발현을 제공한다. 일부 실시양태에서, 단리된 핵산은 AAV 벡터 내로 통합된다.
일부 실시양태에서, pNF-kB는 PB2 프로모터 (서열식별번호: 30)이다. 일부 실시양태에서, pBRE는 서열식별번호: 31의 서열을 포함한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 32의 서열을 가진다.
염증 및 액티빈 A는 이소성 골화 (HO)에 수반되는 것으로 제시되었다. 액티빈 A, BMP 리간드, 및 염증성 시토카인의 수준이 플레어-업 영역에서 상승됨에 따라, 본 출원인은 rAAV9 벡터가 플레어-업에 반응하여 천연 액티빈 A 길항제, 가용성 폴리스타틴 (sFST), 및 천연 TNF 길항제, 가용성 TNFR2 (sTNFR2)를 분비할 수 있다는 것을 발견하였다. 일부 실시양태에서, sFST 및 TNFR2의 발현은 플레어-업 상태에서 액티빈 A 신호전달 경로를 억제한다. 일부 실시양태에서, sFST 및 TNFR2의 발현은 플레어-업 상태에서 TNF 신호전달 경로를 억제한다.
rAAV9의 국부 또는 전신 주사는 골격근의 형질도입에 고도로 효과적이며, 이는 플레어-업 영역에서 sFST 및 sTNFR2를 생산하여 이웃 HO의 발생을 억제한다. 일부 실시양태에서, 단리된 핵산은 가우시아 루시페라제 리포터 유전자 (eBRE/NF-kB-Luc)를 추가로 포함한다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 가우시아 루시페라제는 해양 요각류, 가우시아 프린셉스(Gaussia princeps)로부터의 20kDa 단백질이다. 생물발광 효소는 세포 배양 배지 내로 고도로 분비되어, 리포터 활성의 살아있는 세포 모니터링을 가능하게 한다. 루시페라제 반응에 의해 생성된 광 출력은 생산된 가우시아 루시페라제 단백질의 양과 상관관계가 있고, 가우시아 발현을 구동하는 프로모터의 활성을 결정하는 데 사용될 수 있다.
본 개시내용은 가용성 폴리스타틴 (sFST)을 코딩하는 핵산 서열을 포함하는 제1 트랜스진 및 TNFR2를 코딩하는 핵산 서열을 포함하는 제2 트랜스진을 포함하는 단리된 핵산을 제공한다. 일부 실시양태에서, 제1 및 제2 트랜스진은 프로모터, 예컨대 닭 β-액틴 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 프로모터는 pBRE/pNF-kB 프로모터이다. 일부 실시양태에서, 단리된 핵산은 인공 miRNA (ami-RNA)를 코딩하는 트랜스진을 포함한다. 일부 실시양태에서, ami-RNA는 miR-122를 포함한다. 일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산은 천연 액티빈 A 길항제, 가용성 인간 폴리스타틴 (예를 들어, FST-288) 및 천연 TNF 길항제, 가용성 인간 TNFR2를 제공하며, 이는 AAV 벡터 게놈 내로 클로닝된다. 일부 실시양태에서, AAV 벡터는 rAAV9 벡터이다.
어떠한 이론에 얽매이는 것을 원하지는 않지만, 폴리스타틴 및 sTNFR2는 액티빈 A 및 TNFα에 그의 동족 수용체에 대해 경쟁적으로 결합하고, 따라서 각각 액티빈 A 및 TNFα-유도된 신호 전달을 억제한다. 그러나, 전신 전달 후, rAAV9 벡터는 추가의 조직, 예컨대 간, 심장 및 골격근을 표적화할 수 있으며, 이는 유해 효과를 유발할 수 있다. 따라서, 본 개시내용은 AAV 벡터 게놈 내로 완벽하게 상보적인 miR-122-결합 부위를 조작함으로써 간에서 rAAV 발현을 억제하는 조직-특이적 내인성 miRNA (예를 들어, miR-122)를 제공한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 33의 서열을 포함한다. 일부 실시양태에서, 단리된 핵산은 서열식별번호: 34의 서열을 포함한다. 일부 실시양태에서, rAAV 벡터는 심장 조직 (예를 들어, 심근)으로부터의 트랜스진의 발현을 탈표적화하는 1개 이상의 miRNA 결합 부위를 포함한다. 일부 실시양태에서, miRNA 결합 부위는 miR-208 결합 부위이다. 일부 실시양태에서, rAAV는 1개 이상 (예컨대, 1, 2, 3, 4개, 또는 그 초과)의 miR-208 결합 부위를 포함한다. 일부 실시양태에서, 1개 이상의 miR-208 결합 부위는 서열식별번호: 48에 제시된 서열을 포함한다.
재조합 AAV (rAAV)
본 개시내용의 단리된 핵산은 재조합 아데노-연관 바이러스 (AAV) 벡터 (rAAV 벡터)일 수 있다. 일부 실시양태에서, 본 개시내용에 기재된 바와 같은 단리된 핵산은 제1 아데노-연관 바이러스 (AAV) 역전된 말단 반복부 (ITR) 또는 그의 변이체를 포함하는 영역 (예를 들어, 제1 영역)을 포함한다. 단리된 핵산 (예를 들어, 재조합 AAV 벡터)은 캡시드 단백질 내로 패키징되고, 대상체에게 투여되고/거나 선택된 표적 세포에 전달될 수 있다. "재조합 AAV (rAAV) 벡터"는 전형적으로 최소한 트랜스진 및 그의 조절 서열, 및 5' 및 3' AAV 역전된 말단 반복부 (ITR)로 구성된다. 트랜스진은, 본원의 다른 곳에 개시된 바와 같이, 대상체의 내인성 mRNA를 표적화하는 핵산을 포함하는 1종 이상의 단백질 및/또는 억제 핵산 (예를 들어, shRNA, miRNA 등)을 코딩하는 1개 이상의 영역을 포함할 수 있다. 트랜스진은 또한 본 개시내용의 다른 곳에 기재된 바와 같이, 예를 들어 단백질 및/또는 발현 제어 서열 (예를 들어, 폴리-A 테일)을 코딩하는 영역을 포함할 수 있다.
일반적으로, ITR 서열은 길이가 약 145 bp이다. 바람직하게는, ITR을 코딩하는 실질적으로 전체 서열이 분자에 사용되지만, 이들 서열의 어느 정도의 사소한 변형이 허용된다. 이들 ITR 서열을 변형시키는 능력은 관련 기술분야의 기술 내에 있다. (예를 들어, 문헌 [Sambrook et al., "Molecular Cloning. A Laboratory Manual", 2d ed., Cold Spring Harbor Laboratory, New York (1989); 및 K. Fisher et al., J Virol., 70:520 532 (1996)]과 같은 참고문헌 참조). 본 발명에 사용된 이러한 분자의 예는 트랜스진을 함유하는 "시스-작용" 플라스미드이며, 여기서 선택된 트랜스진 서열 및 연관된 조절 요소에 5' 및 3' AAV ITR 서열이 플랭킹된다. AAV ITR 서열은 현재 확인된 포유동물 AAV 유형을 비롯한 임의의 공지된 AAV로부터 수득될 수 있다. 일부 실시양태에서, 단리된 핵산 (예를 들어, rAAV 벡터)은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh.8, AAVrh.10, AAVrh.39 및 AAVrh.43, 및 그의 변이체로부터 선택된 혈청형을 갖는 적어도 1개의 ITR을 포함한다. 일부 실시양태에서, 단리된 핵산은 AAV9 ITR을 코딩하는 영역 (예를 들어, 제1 영역)을 포함한다. 일부 실시양태에서, 단리된 핵산은 AAV6.2 ITR을 코딩하는 영역 (예를 들어, 제1 영역)을 포함한다.
일부 실시양태에서, 단리된 핵산은 제2 AAV ITR을 포함하는 영역 (예를 들어, 제2 영역, 제3 영역, 제4 영역 등)을 추가로 포함한다. 일부 실시양태에서, 제2 AAV ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh.8, AAVrh.10, AAVrh.39 및 AAVrh.43, 및 그의 변이체로부터 선택된 혈청형을 갖는다. 일부 실시양태에서, 제2 ITR은 기능적 말단 분해 부위 (TRS)가 결여된 돌연변이체 ITR이다. 용어 "말단 분해 부위가 결여된"은 ITR의 말단 분해 부위 (TRS)의 기능을 제거하는 돌연변이 (예를 들어, 센스 돌연변이, 예컨대 비-동의 돌연변이, 또는 미스센스 돌연변이)를 포함하는 AAV ITR, 또는 기능적 TRS를 코딩하는 핵산 서열이 결여된 말단절단된 AAV ITR (예를 들어, ΔTRS ITR)을 지칭할 수 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 기능적 TRS가 결여된 ITR을 포함하는 rAAV 벡터는, 예를 들어 문헌 [McCarthy (2008) Molecular Therapy 16(10):1648-1656]에 기재된 바와 같이 자기-상보적 rAAV 벡터를 생산한다.
본원에 사용된 용어 "자기-상보적 AAV 벡터" (scAAV)는 AAV의 ITR 중 1개로부터 말단 분해 부위 (TR)의 부재에 의해 생성된 이중-가닥 벡터 게놈을 함유하는 벡터를 지칭한다. TR의 부재는 TR이 존재하지 않는 벡터 말단에서 복제의 개시를 방지한다. 일반적으로, scAAV 벡터는 각각의 말단에 야생형 (wt) AAV TR 및 중간에 돌연변이된 TR (mTR)을 갖는 단일-가닥, 역전된 반복부 게놈을 생성한다. 본 발명은, 부분적으로, RNA 헤어핀 구조 (예를 들어, shRNA, miRNA, 및 ami-RNA)를 코딩하는 DNA 단편이 바이러스 게놈 복제 동안 돌연변이체 역전된 말단 반복부 (mTR)와 유사한 기능을 수행하여 자기-상보적 AAV 벡터 게놈을 생성할 수 있다는 인식에 기초한다. 예를 들어, 일부 실시양태에서, 본 개시내용은 2개의 말단의 각각에 역전된 말단 반복부 (ITR)를 갖는 단일-가닥 자기-상보적 핵산 및 헤어핀-형성 RNA (예를 들어, shRNA, miRNA, ami-RNA 등)를 코딩하는 서열과 작동가능하게 연결된 프로모터를 포함하는 중심 부분을 포함하는 rAAV (예를 들어, 자기-상보적 AAV; scAAV) 벡터를 제공한다. 일부 실시양태에서, 헤어핀-형성 RNA (예를 들어, shRNA, miRNA, ami-RNA 등)를 코딩하는 서열은 돌연변이체 ITR에 의해 정상적으로 점유된 자기-상보적 핵산의 위치에서 치환된다.
"재조합 AAV (rAAV) 벡터"는 전형적으로 최소한 트랜스진 및 그의 조절 서열, 및 5' 및 3' AAV 역전된 말단 반복부 (ITR)로 구성된다. 캡시드 단백질 내로 패키징되고 선택된 표적 세포로 전달되는 것은 이러한 재조합 AAV 벡터이다. 일부 실시양태에서, 트랜스진은 관심 폴리펩티드, 단백질, 기능적 RNA 분자 (예를 들어, miRNA, miRNA 억제제) 또는 다른 유전자 생성물을 코딩하는, 벡터 서열에 대해 이종인 핵산 서열이다. 핵산 코딩 서열은 표적 조직의 세포에서 트랜스진 전사, 번역, 및/또는 발현을 허용하는 방식으로 조절 성분에 작동가능하게 연결된다.
본 개시내용은 단일 시스-작용 야생형 ITR을 포함하는 벡터를 제공한다. 일부 실시양태에서, ITR은 5' ITR이다. 일부 실시양태에서, ITR은 3' ITR이다. 일반적으로, ITR 서열은 길이가 약 145 bp이다. 바람직하게는, ITR(들)을 코딩하는 실질적으로 전체 서열이 분자에 사용되지만, 이들 서열의 어느 정도의 사소한 변형이 허용된다. ITR 서열을 변형시키는 능력은 관련 기술분야의 기술 내에 있다. (예를 들어, 문헌 [Sambrook et al., "Molecular Cloning. A Laboratory Manual", 2d ed., Cold Spring Harbor Laboratory, New York (1989); 및 K. Fisher et al., J Virol., 70:520 532 (1996)]과 같은 참고문헌 참조). 예를 들어, ITR은 그의 말단 분해 부위 (TR)에서 돌연변이될 수 있으며, 이는 TR이 돌연변이된 벡터 말단에서 복제를 억제하고 자기-상보적 AAV의 형성을 발생시킨다. 본 개시내용에 사용된 이러한 분자의 또 다른 예는 트랜스진을 함유하는 "시스-작용" 플라스미드이며, 여기서 선택된 트랜스진 서열 및 연관된 조절 요소에 5' AAV ITR 서열 및 3' 헤어핀-형성 RNA 서열이 플랭킹된다. AAV ITR 서열은 현재 확인된 포유동물 AAV 유형을 비롯한 임의의 공지된 AAV로부터 수득될 수 있다. 일부 실시양태에서, ITR 서열은 AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAVrh8, AAV9, AAV10, 및/또는 AAVrh10 ITR 서열이다.
일부 실시양태에서, 본 개시내용의 rAAV는 유사형화 rAAV이다. 예를 들어, Y의 단백질로 캡시드화된 혈청형 X의 ITR을 함유하는 유사형화 AAV 벡터는 AAVX/Y로 지정될 것이다 (예를 들어 AAV2/1은 AAV2의 ITR 및 AAV1의 캡시드를 가짐). 일부 실시양태에서, 유사형화 rAAV는 하나의 AAV 혈청형으로부터의 캡시드 단백질의 조직-특이적 표적화 능력을 또 다른 AAV 혈청형으로부터의 바이러스 DNA와 조합함으로써 트랜스진의 표적 조직으로의 표적화된 전달을 가능하게 하는 데 유용할 수 있다.
목적하는 캡시드 단백질을 갖는 재조합 AAV를 수득하는 방법은 관련 기술분야에 널리 공지되어 있다. (예를 들어, US 2003/0138772 참조, 그의 내용은 그 전문이 본원에 참조로 포함됨). 전형적으로, 방법은 AAV 캡시드 단백질; 기능적 rep 유전자; AAV 역전된 말단 반복부 (ITR) 및 트랜스진으로 구성된 재조합 AAV 벡터; 및 AAV 캡시드 단백질 내로의 재조합 AAV 벡터의 패키징을 허용하는 충분한 헬퍼 기능을 코딩하는 핵산 서열을 함유하는 숙주 세포를 배양하는 것을 수반한다. 일부 실시양태에서, 캡시드 단백질은 AAV의 cap 유전자에 의해 코딩된 구조 단백질이다. AAV는 3개의 캡시드 단백질, 비리온 단백질 1 내지 3 (VP1, VP2 및 VP3으로 명명됨)을 포함하며, 이들 모두는 대안적 스플라이싱을 통해 단일 cap 유전자로부터 전사된다. 일부 실시양태에서, VP1, VP2 및 VP3의 분자량은 각각 약 87 kDa, 약 72 kDa 및 약 62 kDa이다. 일부 실시양태에서, 번역 시, 캡시드 단백질은 바이러스 게놈 주위에 구형 60량체 단백질 쉘을 형성한다. 일부 실시양태에서, 캡시드 단백질의 기능은 바이러스 게놈을 보호하고, 게놈을 전달하고, 숙주와 상호작용하는 것이다. 일부 측면에서, 캡시드 단백질은 바이러스 게놈을 숙주에게 조직 특이적 방식으로 전달한다.
일부 실시양태에서, AAV 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh8, AAV9, AAVrh10, AAVrh39, AAVrh43, AAV2/2-66, AAV2/2-84, AAV2/2-125로 이루어진 군으로부터 선택된 AAV 혈청형의 것이다. 일부 실시양태에서, AAV 캡시드 단백질은 비-인간 영장류로부터 유래된 혈청형, 예를 들어 scAAV.rh8, AAV.rh39, 또는 AAV.rh43 혈청형의 것이다. 일부 실시양태에서, AAV 캡시드 단백질은 AAV9 혈청형의 것이다. 일부 실시양태에서, AAV 캡시드 단백질은 AAV6.2 혈청형의 것이다.
AAV 캡시드에 rAAV 벡터를 패키징하기 위해 숙주 세포에서 배양될 성분은 숙주 세포에게 트랜스로 제공될 수 있다. 대안적으로, 요구되는 성분 (예를 들어, 재조합 AAV 벡터, rep 서열, cap 서열, 및/또는 헬퍼 기능) 중 어느 1종 이상은 관련 기술분야의 통상의 기술자에게 공지된 방법을 사용하여 요구되는 성분 중 1종 이상을 함유하도록 조작된 안정한 숙주 세포에 의해 제공될 수 있다. 가장 적합하게는, 이러한 안정한 숙주 세포는 유도성 프로모터의 제어 하에 요구되는 성분(들)을 함유할 것이다. 그러나, 요구되는 성분(들)은 구성적 프로모터의 제어 하에 있을 수 있다. 적합한 유도성 및 구성적 프로모터의 예는 본원에서, 트랜스진과 함께 사용하기에 적합한 조절 요소의 논의에서 제공된다. 또 다른 대안에서, 선택된 안정한 숙주 세포는 구성적 프로모터의 제어 하에 선택된 성분(들) 및 1개 이상의 유도성 프로모터의 제어 하에 다른 선택된 성분(들)을 함유할 수 있다. 예를 들어, HEK293 세포 (구성적 프로모터의 제어 하에 E1 헬퍼 기능을 함유함)로부터 유래되지만, 유도성 프로모터의 제어 하에 rep 및/또는 cap 단백질을 함유하는 안정한 숙주 세포가 생성될 수 있다. 또 다른 안정한 숙주 세포가 관련 기술분야의 통상의 기술자에 의해 생성될 수 있다.
본 개시내용의 rAAV를 생산하는 데 필요한 재조합 AAV 벡터, rep 서열, cap 서열 및 헬퍼 기능은 임의의 적절한 유전 요소 (벡터)를 사용하여 패키징 숙주 세포에 전달될 수 있다. 선택된 유전 요소는 본원에 기재된 것을 비롯한 임의의 적합한 방법에 의해 전달될 수 있다. 본 개시내용의 임의의 실시양태를 구축하는 데 사용되는 방법은 핵산 조작의 통상의 기술자에게 공지되어 있고, 유전자 공학, 재조합 공학, 및 합성 기술을 포함한다. 예를 들어, 문헌 [Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, N.Y.]을 참조한다. 유사하게, rAAV 비리온을 생성하는 방법은 널리 공지되어 있고, 적합한 방법의 선택은 본 개시내용에 대한 제한이 아니다. 예를 들어, 문헌 [K. Fisher et al., J. Virol., 70:520-532 (1993)] 및 미국 특허 번호 5,478,745를 참조한다.
일부 실시양태에서, 삼중 형질감염 방법 (미국 특허 번호 6,001,650에 상세하게 기재됨)을 사용하여 재조합 AAV가 생산될 수 있다. 전형적으로, 재조합 AAV는 숙주 세포를 AAV 입자 내로 패키징될 재조합 AAV 벡터 (트랜스진을 포함함), AAV 헬퍼 기능 벡터, 및 보조 기능 벡터로 형질감염시킴으로써 생산된다. AAV 헬퍼 기능 벡터는 "AAV 헬퍼 기능" 서열 (즉, rep 및 cap)을 코딩하며, 이는 생산적 AAV 복제 및 캡시드화를 위해 트랜스로 기능한다. 바람직하게는, AAV 헬퍼 기능 벡터는 임의의 검출가능한 야생형 AAV 비리온 (즉, 기능적 rep 및 cap 유전자를 함유하는 AAV 비리온)을 생성하지 않으면서 효율적인 AAV 벡터 생산을 지지한다. 본 개시내용에서 사용하기에 적합한 벡터의 비제한적 예는 미국 특허 번호 6,001,650에 기재된 pHLP19 및 미국 특허 번호 6,156,303에 기재된 pRep6cap6 벡터를 포함하며, 둘 다의 전문은 본원에 참조로 포함된다. 보조 기능 벡터는 AAV가 복제를 위해 의존하는 비-AAV 유래 바이러스 및/또는 세포 기능 (즉, "보조 기능")을 위한 뉴클레오티드 서열을 코딩한다. 보조 기능은 비제한적으로 AAV 유전자 전사의 활성화, 단계 특이적 AAV mRNA 스플라이싱, AAV DNA 복제, cap 발현 생성물의 합성, 및 AAV 캡시드 어셈블리에 수반되는 모이어티를 포함한, AAV 복제에 요구되는 기능을 포함한다. 바이러스-기반 보조 기능은 공지된 헬퍼 바이러스 중 임의의 것, 예컨대 아데노바이러스, 헤르페스바이러스 (단순 헤르페스 바이러스 유형-1 이외의 것), 및 백시니아 바이러스로부터 유래될 수 있다.
일부 측면에서, 본 개시내용은 형질감염된 숙주 세포를 제공한다. 용어 "형질감염"은 세포에 의한 외래 DNA의 흡수를 지칭하는 데 사용되고, 세포는 외인성 DNA가 세포 막 내부에 도입된 경우에 "형질감염"된 것이다. 다수의 형질감염 기술이 일반적으로 관련 기술분야에 공지되어 있다. 예를 들어, 문헌 [Graham et al., (1973) Virology, 52:456, Sambrook et al., (1989) Molecular Cloning, a laboratory manual, Cold Spring Harbor Laboratories, New York, Davis et al., (1986) Basic Methods in Molecular Biology, Elsevier, 및 Chu et al., (1981) Gene 13:197]을 참조한다. 이러한 기술을 이용하여 1종 이상의 외인성 핵산, 예컨대 뉴클레오티드 통합 벡터 및 다른 핵산 분자를 적합한 숙주 세포 내로 도입할 수 있다.
"숙주 세포"는 관심 물질을 보유하거나 보유할 수 있는 임의의 세포를 지칭한다. 종종 숙주 세포는 포유동물 세포이다. 일부 실시양태에서, 숙주 세포는 박테리아 세포, 효모 세포, 곤충 세포 (Sf9), 또는 포유동물 (예를 들어, 인간, 설치류, 비-인간 영장류 등) 세포이다. 일부 실시양태에서, 포유동물 세포는 HEK293 세포이다. 숙주 세포는 AAV 헬퍼 구축물, AAV 미니유전자 플라스미드, 보조 기능 벡터, 또는 재조합 AAV의 생산과 연관된 다른 전달 DNA의 수용자로서 사용될 수 있다. 상기 용어는 형질감염된 원래 세포의 자손을 포함한다. 따라서, 본원에 사용된 "숙주 세포"는 외인성 DNA 서열로 형질감염된 세포를 지칭할 수 있다. 단일 모 세포의 자손은 자연적, 우발적, 또는 고의적 돌연변이로 인해 본래의 모 세포와 형태 또는 게놈 또는 총 DNA 상보체에서 반드시 완전히 동일하지는 않을 수 있는 것으로 이해된다.
본원에 사용된 용어 "세포주"는 시험관내에서 연속적 또는 장기간 성장 및 분열이 가능한 세포의 집단을 지칭한다. 종종, 세포주는 단일 전구 세포로부터 유래된 클론 집단이다. 이러한 클론 집단의 저장 또는 전달 동안 핵형에서 자발적 또는 유도된 변화가 발생할 수 있다는 것이 관련 기술분야에 추가로 공지되어 있다. 따라서, 언급된 세포주로부터 유래된 세포는 조상 세포 또는 배양물과 정확하게 동일하지 않을 수 있고, 언급된 세포주는 이러한 변이체를 포함한다.
본원에 사용된 용어 "재조합 세포"는 외인성 DNA 절편, 예컨대 생물학적 활성 폴리펩티드의 전사 또는 생물학적 활성 핵산, 예컨대 RNA의 생산으로 이어지는 DNA 절편이 도입된 세포를 지칭한다.
일부 측면에서, 본 개시내용은 캡시드 단백질, 및 AAV ITR을 코딩하는 제1 영역 및 트랜스진을 포함하는 제2 영역을 포함하는 단리된 핵산을 포함하는 재조합 AAV를 제공하며, 여기서 트랜스진은 인공 마이크로RNA를 코딩한다. 인공 마이크로RNA는 세포 또는 조직 (예를 들어, 골격근, 건, 및 연골) 또는 대상체에서 표적 유전자의 발현을 감소시킬 수 있다. 일부 실시양태에서, rAAV는 세포, 조직 또는 대상체에서 ACVR1의 발현을 감소시키는 인공 마이크로RNA를 포함한다.
세포, 조직 또는 대상체에서 돌연변이된 ACVR1 유전자의 발현은 본 개시내용의 rAAV를 사용하여 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 감소될 수 있다. 세포, 조직 또는 대상체에서 ACVR1 유전자의 발현은 본 개시내용의 rAAV를 사용하여 75% 내지 90%만큼 감소될 수 있다. 세포, 조직 또는 대상체에서 ACVR1 유전자의 발현은 본 개시내용의 rAAV를 사용하여 80% 내지 99%만큼 감소될 수 있다.
본 개시내용의 rAAV를 생산하기 위해 목적하는 AAV 캡시드에 재조합 벡터를 패키징하는 상기 방법은 제한적인 것으로 의도되지 않고, 다른 적합한 방법이 통상의 기술자에게 명백할 것이다.
투여 방식 및 조성물
본 개시내용의 rAAV는 관련 기술분야에 공지된 임의의 적절한 방법에 따라 조성물로 대상체에게 전달될 수 있다. 예를 들어, 바람직하게는 생리학상 상용성인 담체 중에 (예를 들어, 조성물 중에) 현탁된 rAAV는 대상체, 예를 들어 숙주 동물, 예컨대 인간, 마우스, 래트, 고양이, 개, 양, 토끼, 말, 소, 염소, 돼지, 기니 피그, 햄스터, 닭, 칠면조, 또는 비-인간 영장류 (예를 들어, 마카크)에게 투여될 수 있다. 일부 실시양태에서, 숙주 동물은 인간을 포함하지 않는다. 일부 실시양태에서, 대상체는 성체이다. 일부 실시양태에서, 대상체는 소아 또는 영아이다.
일부 실시양태에서, rAAV는 서열식별번호: 1-4 중 어느 하나에 대해 하기 값 사이의 모든 값을 포함하여 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖거나, 또는 100% 동일한 코돈 최적화된 ACVR1을 포함하는 단리된 핵산을 포함한다. 일부 실시양태에서, rAAV는 서열식별번호: 1-4 중 어느 하나에 제시된 서열 (또는 그의 상보적 서열) 또는 그의 부분을 갖는 코돈 최적화된 ACVR1을 포함하는 단리된 핵산을 포함한다.
rAAV의 포유동물 대상체로의 전달은, 예를 들어 근육내 주사에 의해 또는 포유동물 대상체의 혈류 내로의 투여에 의해 이루어질 수 있다. 혈류 내로의 투여는 정맥, 동맥, 또는 임의의 다른 혈관 도관 내로의 주사에 의한 것일 수 있다. 일부 실시양태에서, rAAV는 외과 기술분야에 널리 공지된 기술인 고립 사지 관류에 의해 혈류 내로 투여되며, 상기 방법은 본질적으로 통상의 기술자가 rAAV 비리온의 투여 전에 사지를 체순환으로부터 고립시킬 수 있게 한다. 또한 근육 세포 또는 조직 내로의 형질도입을 잠재적으로 증진시키기 위해 고립 사지의 혈관계 내로 비리온을 투여하는, 미국 특허 번호 6,177,403에 기재된 고립 사지 관류 기술의 변형이 통상의 기술자에 의해 사용될 수 있다. 또한, 특정 경우에, 비리온을 대상체의 골격근 및/또는 결합 조직에 전달하는 것이 바람직할 수 있다. 재조합 AAV는 관련 기술분야에 공지된 외과적 기술을 사용하여, 바늘, 카테터 또는 관련 장치에 의한 근육 또는 조직 내로의 주사, 예를 들어 근육 또는 조직 내로의 직접 주사에 의해, 활막내 주사, 무릎 주사 등을 통해 골격근 및/또는 결합 조직에 직접 전달될 수 있다.
일부 실시양태에서, 본 개시내용에 기재된 바와 같은 rAAV는 진피간 전달 또는 진피내 전달에 의해 투여된다. 전달 절차 및 방법은 관련 기술분야에 공지되고/거나 본 개시내용에 적합한 임의의 기술일 수 있다.
일부 실시양태에서, 본 개시내용에 기재된 바와 같은 rAAV는 미세바늘 약물 전달, 예컨대 경피 적용에 의해 투여된다. 일부 실시양태에서, 본 개시내용에 기재된 바와 같은 rAAV는 제어 전달을 제공하기 위한 진피 패치의 사용에 의해 투여된다. 본원에 사용된 바와 같은 진피 패치, 피부 패치 등은 특정 용량의 조성물을 피부 내로 전달하기 위해 피부 상에 위치시키는 약물첨가된 접착성 패치를 지칭한다. 진피 또는 피부 패치는 단층 약물-함유-접착제, 다층 약물-함유-접착제, 저장소, 매트릭스 및 증기 패치를 포함할 수 있으나 이에 제한되지는 않는다. 대안적으로 또는 추가적으로, 속도는 속도 제어 막을 제공하고/거나 활성 성분을 중합체 매트릭스 및/또는 겔 중에 분산시키는 것에 의해 제어될 수 있다. 일부 실시양태에서, 침투 증진제는 패치에서 rAAV의 침투를 증진시키는 데 사용될 수 있다. 일부 실시양태에서, 본 개시내용에 기재된 바와 같은 rAAV는 정맥내 주사에 의해 투여된다. 일부 실시양태에서, rAAV는 근육내 주사에 의해 투여된다.
본 개시내용의 측면은 캡시드 단백질 및 트랜스진을 코딩하는 핵산을 포함하는 재조합 AAV를 포함하는 조성물에 관한 것이며, 여기서 트랜스진은 예를 들어 1개 이상의 코돈 최적화된 ACVR1 또는 인공 miRNA를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 핵산은 1개 이상의 AAV ITR을 추가로 포함한다. 일부 실시양태에서, 조성물은 제약상 허용되는 담체를 추가로 포함한다. 일부 실시양태에서, 조성물은 캡시드 단백질, 및 AAV ITR을 코딩하는 제1 영역 및 트랜스진을 포함하는 제2 영역을 포함하는 핵산을 포함하는 재조합 AAV를 포함하며, 여기서 트랜스진은 ACVR1을 표적화하는 인공 마이크로RNA를 코딩한다.
본 개시내용의 조성물은 rAAV를 단독으로, 또는 1종 이상의 다른 바이러스 (예를 들어, 1종 이상의 상이한 트랜스진을 코딩하는 제2 rAAV)와 조합하여 포함할 수 있다. 일부 실시양태에서, 조성물은 각각 1종 이상의 상이한 트랜스진을 갖는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10종, 또는 그 초과의 상이한 rAAV를 포함한다.
적합한 담체는 rAAV가 지시되는 적응증의 관점에서 관련 기술분야의 통상의 기술자에 의해 용이하게 선택될 수 있다. 예를 들어, 1종의 적합한 담체는 다양한 완충 용액과 함께 제제화될 수 있는 염수 (예를 들어, 포스페이트 완충 염수)를 포함한다. 다른 예시적인 담체는 멸균 염수, 락토스, 수크로스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩 오일, 참깨 오일, 및 물을 포함한다. 담체의 선택은 본 개시내용의 제한이 아니다.
임의로, 본 개시내용의 조성물은 rAAV 및 담체(들)에 더하여, 다른 통상적인 제약 성분, 예컨대 보존제, 또는 화학적 안정화제를 함유할 수 있다. 적합한 예시적인 보존제는 클로로부탄올, 소르브산칼륨, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 및 파라클로로페놀을 포함한다. 적합한 화학적 안정화제는 젤라틴 및 알부민을 포함한다.
rAAV는 목적하는 조직의 세포를 형질감염시키고 과도한 유해 효과 없이 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 투여된다. 통상적이고 제약상 허용되는 투여 경로는 선택된 기관으로의 직접 전달 (예를 들어, 간으로의 문맥내 전달), 경구, 흡입 (비강내 및 기관내 전달 포함), 안내, 정맥내, 근육내, 피하, 진피내, 종양내, 및 다른 비경구 투여 경로를 포함하나, 이에 제한되지는 않는다. 투여 경로는 원하는 경우에 조합될 수 있다.
특정한 "치료 효과"를 달성하는 데 요구되는 rAAV 비리온의 용량, 예를 들어 게놈 카피/체중 킬로그램 (GC/kg)의 용량의 단위는 rAAV 비리온의 투여 경로, 치료 효과를 달성하는 데 요구되는 유전자 또는 RNA 발현의 수준, 치료될 구체적 질환 또는 장애, 및 유전자 또는 RNA 생성물의 안정성을 포함하나 이에 제한되지는 않는 여러 인자에 기초하여 달라질 것이다. 관련 기술분야의 통상의 기술자는 상기 언급된 인자, 뿐만 아니라 관련 기술분야에 널리 공지된 다른 인자에 기초하여 특정한 질환 또는 장애를 갖는 환자를 치료하기 위한 rAAV 비리온 용량 범위를 용이하게 결정할 수 있다.
rAAV의 "유효량"은 동물을 표적 감염시키고, 목적하는 조직 (예를 들어, 결합 조직)을 표적화하기에 충분한 양이다. 유효량은 주로 대상체의 종, 연령, 체중, 건강, 및 표적화될 조직과 같은 인자에 좌우될 것이고, 따라서 동물 및 조직 사이에서 달라질 수 있다. 예를 들어, rAAV의 유효량은 일반적으로 약 109 내지 1016 게놈 카피를 함유하는 약 1 ml 내지 약 100 ml 용액의 범위이다. 일부 경우에, 약 1011 내지 1013 rAAV 게놈 카피의 투여량이 적절하다. 특정 실시양태에서, 1012 또는 1013 rAAV 게놈 카피가 골 조직을 표적화하는 데 효과적이다.
일부 실시양태에서, rAAV의 용량은 역일 (예컨대 24-시간 기간)당 1회 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 2, 3, 4, 5, 6, 또는 7 역일당 1회 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 역주 (예컨대 7 역일)당 1회 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 격주 (예를 들어, 2 역주 기간에 1회) 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 역월당 1회 (예를 들어, 30 역일에 1회) 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 6 역월당 1회 이하로 대상체에게 투여된다. 일부 실시양태에서, rAAV의 용량은 역년 (예를 들어, 365일 또는 윤년은 366일)당 1회 이하로 대상체에게 투여된다.
일부 실시양태에서, rAAV 조성물은, 특히 높은 rAAV 농도가 존재하는 경우에 (예를 들어, ~1013 GC/ml 이상), 조성물 중 AAV 입자의 응집을 감소시키도록 제제화된다. rAAV의 응집을 감소시키는 방법은 관련 기술분야에 널리 공지되어 있고, 예를 들어 계면활성제의 첨가, pH 조정, 염 농도 조정 등을 포함한다. (예를 들어, 문헌 [Wright FR, et al., Molecular Therapy (2005) 12, 171-178] 참조, 그의 내용은 본원에 참조로 포함됨).
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV, 및/또는 벡터를 투여하는 것은 야생형 ACVR1의 서열의 위치 206에서 구아닌에서 아데닌으로의 단일 염기 돌연변이를 포함하는 ACVR1 단백질을 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배, 또는 적어도 1000-배만큼의 감소를 발생시킨다. 일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV, 벡터를 투여하는 것은 인간 ACVR1-R206H 단백질을 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배, 또는 적어도 1000-배만큼의 감소를 발생시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV, 및/또는 벡터를 투여하는 것은 이소성 골 형성 또는 이소성 골화를 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배, 또는 적어도 1000-배만큼 호전시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV 및/또는 벡터를 투여하는 것은 중증 골관절염을 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배 또는 적어도 1000-배만큼 호전시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV 및/또는 벡터를 투여하는 것은 이소성 골 질량을 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배 또는 적어도 1000-배만큼 감소시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV 및/또는 벡터를 투여하는 것은 연골형성 원기를 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배 또는 적어도 1000-배만큼 감소시킨다.
일부 실시양태에서, 본원에 개시된 바와 같은 단리된 핵산, rAAV 및/또는 벡터를 투여하는 것은 BMP-반응성 유전자를 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%만큼, 또는 적어도 2-배, 적어도 5-배, 적어도 10-배, 적어도 20-배, 적어도 50-배, 적어도 100-배 또는 적어도 1000-배만큼 감소시킨다. 일부 실시양태에서, BMP-반응성 유전자는 ID1이다. 일부 실시양태에서, BMP-반응성 유전자는 MSX2이다. 일부 실시양태에서, BMP-반응성 유전자는 BMP 신호전달 경로에 의해 영향을 받을 수 있는 임의의 유전자이다.
본원에 사용된 개선 또는 자극은 대조군에 상대적인 것이다. 대조군은 단리된 핵산, rAAV 및 벡터의 투여 전의 상태일 수 있다. 개선 또는 자극은 단리된 핵산, rAAV, 및 벡터를 투여받지 않은 대상체에 상대적인 것이다.
일부 실시양태에서, "대조군"은 야생형 ACVR1의 서열의 위치 206에서 구아닌에서 아데닌으로의 단일 염기 돌연변이를 포함하는 인간 ACVR1-R206H 단백질 또는 ACVR1 단백질을 함유하며, 본 개시내용에 기재된 방법 및 조성물 또는 임의의 다른 방법에 의해 치료되지 않은 대상체 또는 조직을 지칭할 수 있다.
제약상 허용되는 부형제 및 담체 용액의 제제화는, 다양한 치료 요법에서 본원에 기재된 특정한 조성물을 사용하기 위한 적합한 투여 및 치료 요법의 개발과 같이, 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다.
전형적으로, 이들 제제는 적어도 약 0.1% 또는 그 초과의 활성 화합물을 함유할 수 있지만, 활성 성분(들)의 백분율은 물론 달라질 수 있고, 편리하게는 총 제제의 중량 또는 부피의 약 1 또는 2% 내지 약 70% 또는 80% 또는 그 초과일 수 있다. 당연히, 각각의 치료상-유용한 조성물 중 활성 화합물의 양은 적합한 투여량이 화합물의 임의의 주어진 단위 용량으로 수득되도록 하는 방식으로 제조될 수 있다. 용해도, 생체이용률, 생물학적 반감기, 투여 경로, 제품 보관 수명, 뿐만 아니라 다른 약리학적 고려사항과 같은 인자가 이러한 제약 제제를 제조하는 관련 기술분야의 통상의 기술자에 의해 고려될 것이고, 따라서 다양한 투여량 및 치료 요법이 바람직할 수 있다.
특정 상황에서, rAAV-기반 치료 구축물을 본원에 개시된 적합하게 제제화된 제약 조성물로 피하로, 췌장내로, 비강내로, 비경구로, 정맥내로, 근육내로, 진피내로, 척수강내로, 대퇴 수질내로, 또는 경구로, 복강내로, 또는 흡입에 의해 전달하는 것이 바람직할 것이다. 일부 실시양태에서, 미국 특허 번호 5,543,158; 5,641,515 및 5,399,363 (각각은 그 전문이 본원에 구체적으로 참조로 포함됨)에 기재된 바와 같은 투여 양식을 사용하여 rAAV를 전달할 수 있다. 일부 실시양태에서, 바람직한 투여 방식은 문맥 주사에 의한 것이다. 일부 실시양태에서, 바람직한 투여 방식은 전신 주사, 예를 들어 정맥내 주사에 의한 것이다. 일부 실시양태에서, 바람직한 투여 방식은 근육내 주사에 의한 것이다. 일부 실시양태에서, 바람직한 투여 방식은 진피내 주사에 의한 것이다.
주사가능한 용도에 적합한 제약 형태는 멸균 수용액 또는 분산액, 및 멸균 주사가능한 용액 또는 분산액의 즉석 제조를 위한 멸균 분말을 포함한다. 분산액은 또한 글리세롤, 액체 폴리에틸렌 글리콜, 및 그의 혼합물 중에서 및 오일 중에서 제조될 수 있다. 통상의 저장 및 사용 조건 하에, 이들 제제는 미생물의 성장을 방지하기 위해 보존제를 함유한다. 많은 경우에, 형태는 멸균성이고, 용이한 시린지성이 존재하는 정도로 유체이다. 이는 제조 및 저장 조건 하에 안정해야 하고, 미생물, 예컨대 박테리아 및 진균의 오염 작용에 대해 보존되어야 한다. 담체는, 예를 들어 물, 에탄올, 폴리올 (예를 들어, 글리세롤, 프로필렌 글리콜, 및 액체 폴리에틸렌 글리콜 등), 그의 적합한 혼합물, 및/또는 식물성 오일을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은, 예를 들어 레시틴과 같은 코팅의 사용에 의해, 분산액의 경우 요구되는 입자 크기의 유지에 의해 및 계면활성제의 사용에 의해 유지될 수 있다. 미생물 작용의 방지는 다양한 항박테리아제 및 항진균제, 예를 들어 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등에 의해 달성될 수 있다. 많은 경우에, 등장화제, 예를 들어 당 또는 염화나트륨을 포함하는 것이 바람직할 것이다. 주사가능한 조성물의 지속 흡수는 흡수를 지연시키는 작용제, 예를 들어, 알루미늄 모노스테아레이트 및 젤라틴을 조성물에 사용함으로써 달성될 수 있다.
주사가능한 수용액의 투여를 위해, 예를 들어 용액은 필요한 경우에 적합하게 완충될 수 있고, 액체 희석제는 먼저 충분한 염수 또는 글루코스에 의해 등장성으로 될 수 있다. 이들 특정한 수용액은 정맥내, 근육내, 피하 및 복강내 투여에 특히 적합하다. 이와 관련하여, 사용될 수 있는 멸균 수성 매질은 관련 기술분야의 통상의 기술자에게 공지되어 있을 것이다. 예를 들어, 1회 투여량을 1 ml의 등장성 NaCl 용액에 용해시키고, 1000 ml의 피하주입액에 첨가하거나 또는 제안된 주입 부위에 주사할 수 있다 (예를 들어, 문헌 ["Remington's Pharmaceutical Sciences" 15th Edition, pages 1035-1038 and 1570-1580] 참조). 투여량의 일부 변동은 숙주의 상태에 따라 필수적으로 발생할 것이다. 투여를 담당하는 사람은 어떠한 경우에도 개별 숙주에 대한 적절한 용량을 결정할 것이다.
멸균 주사가능한 용액은 필요한 양의 활성 rAAV를 필요에 따라 본원에 열거된 다양한 다른 성분과 함께 적절한 용매 중에 혼입시킨 후, 여과 멸균함으로써 제조된다. 일반적으로, 분산액은 다양한 멸균된 활성 성분을 기본 분산 매질 및 상기 열거된 것으로부터의 요구되는 다른 성분을 함유하는 멸균 비히클 내로 혼입시킴으로써 제조된다. 멸균 주사가능한 용액의 제조를 위한 멸균 분말의 경우에, 바람직한 제조 방법은 활성 성분 플러스 그의 이전에 멸균-여과된 용액으로부터 임의의 추가의 목적하는 성분의 분말을 생성하는 진공-건조 및 동결-건조 기술이다.
본원에 개시된 rAAV 조성물은 또한 중성 또는 염 형태로 제제화될 수 있다. 제약상 허용되는 염은 무기 산, 예컨대 예를 들어 염산 또는 인산, 또는 유기 산, 예컨대 아세트산, 옥살산, 타르타르산, 만델산 등에 의해 형성된 산 부가염 (단백질의 유리 아미노 기에 의해 형성됨)을 포함한다. 유리 카르복실 기에 의해 형성된 염은 또한 무기 염기, 예컨대 예를 들어 수산화나트륨, 수산화칼륨, 수산화암모늄, 수산화칼슘, 또는 수산화제2철, 및 유기 염기, 예컨대 이소프로필아민, 트리메틸아민, 히스티딘, 프로카인 등으로부터 유래될 수 있다. 제제화 시, 용액은 투여 제제와 상용성인 방식으로 및 치료상 유효한 양으로 투여될 것이다. 제제는 다양한 투여 형태, 예컨대 주사액, 약물-방출 캡슐 등으로 용이하게 투여된다.
본원에 사용된 "담체"는 임의의 및 모든 용매, 분산 매질, 비히클, 코팅, 희석제, 항박테리아제 및 항진균제, 등장화제 및 흡수 지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등을 포함한다. 제약 활성 물질을 위한 이러한 매질 및 작용제의 사용은 관련 기술분야에 널리 공지되어 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. 어구 "제약상 허용되는"은 숙주에게 투여되는 경우에 알레르기 또는 유사한 불리한 반응을 일으키지 않는 분자 물질 및 조성물을 지칭한다.
전달 비히클, 예컨대 리포솜, 나노캡슐, 마이크로입자, 마이크로구체, 지질 입자, 소포 등이 본 개시내용의 조성물을 적합한 숙주 세포 내로 도입하는 데 사용될 수 있다. 특히, rAAV 벡터 전달되는 트랜스진은 지질 입자, 리포솜, 소포, 나노구체, 또는 나노입자 등에 캡슐화된 전달을 위해 제제화될 수 있다.
이러한 제제는 본원에 개시된 핵산 또는 rAAV 구축물의 제약상 허용되는 제제의 도입을 위해 바람직할 수 있다. 리포솜의 형성 및 사용은 일반적으로 관련 기술분야의 통상의 기술자에게 공지되어 있다. 최근에, 개선된 혈청 안정성 및 순환 반감기를 갖는 리포솜이 개발되었다 (미국 특허 번호 5,741,516). 추가로, 잠재적 약물 담체로서 리포솜 및 리포솜 유사 제제의 다양한 방법이 기재되어 있다 (미국 특허 번호 5,567,434; 5,552,157; 5,565,213; 5,738,868 및 5,795,587).
리포솜은 다른 절차에 의한 형질감염에 대해 통상적으로 저항성인 다수의 세포 유형과 함께 성공적으로 사용되어 왔다. 또한, 리포솜은 바이러스-기반 전달 시스템에 전형적인 DNA 길이 제약이 없다. 리포솜은 유전자, 약물, 방사선요법제, 바이러스, 전사 인자 및 알로스테릭 이펙터를 다양한 배양된 세포주 및 동물 내로 도입하는 데 효과적으로 사용되어 왔다. 또한, 리포솜-매개 약물 전달의 유효성을 조사하는 여러 성공적인 임상 시험이 완료되었다.
리포솜은 수성 매질 중에 분산되어 다층 동심원 이중층 소포 (또한 다층 소포 (MLV)로도 명명됨)를 자발적으로 형성하는 인지질로부터 형성된다. MLV는 일반적으로 25 nm 내지 4 μm의 직경을 갖는다. MLV의 초음파처리는 코어에 수용액을 함유하는, 200 내지 500 Å 범위의 직경을 갖는 작은 단층 소포 (SUV)의 형성을 발생시킨다.
대안적으로, rAAV의 나노캡슐 제제가 사용될 수 있다. 나노캡슐은 일반적으로 물질을 안정하고 재현가능한 방식으로 포획할 수 있다. 세포내 중합체 과부하로 인한 부작용을 피하기 위해, 이러한 초미립자 (약 0.1 μm 크기)는 생체내에서 분해될 수 있는 중합체를 사용하여 설계되어야 한다. 이들 요건을 충족시키는 생분해성 폴리알킬-시아노아크릴레이트 나노입자가 사용을 위해 고려된다.
상기 기재된 전달 방법에 더하여, 하기 기술이 또한 rAAV 조성물을 숙주에 전달하는 대안적 방법으로서 고려된다. 순환계 내로 및 순환계를 통해 약물 투과의 속도 및 효능을 증진시키기 위한 장치로서 초음파영동 (즉, 초음파)이 사용되었고, 미국 특허 번호 5,656,016에 기재되어 있다. 고려되는 다른 약물 전달 대안은 골내 주사 (미국 특허 번호 5,779,708), 마이크로칩 장치 (미국 특허 번호 5,797,898), 안과용 제제 (Bourlais et al., 1998), 경피 매트릭스 (미국 특허 번호 5,770,219 및 5,783,208) 및 피드백-제어 전달 (미국 특허 번호 5,697,899)이다.
치료 방법
본원에 개시된 바와 같이, 본원에 기재된 단리된 핵산, rAAV 및 조성물은 FOP를 갖거나 갖는 것으로 의심되는 대상체를 치료하는 데 유용하다. 일부 실시양태에서, 본 개시내용의 측면은 대상체에서 이소성 골화를 억제하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용의 측면은 FOP를 갖거나 갖는 것으로 의심되는 대상체에서 플레어-업 상태를 개선시키는 방법을 제공한다. 일부 실시양태에서, 본 개시내용의 측면은 세포에서 ACVR1 발현을 억제하는 방법을 제공한다.
본원에 사용된 용어 "치료하는"은 장애, 질환의 증상, 또는 질환에 대한 소인을 다루거나, 치유하거나, 경감시키거나, 완화시키거나, 변경하거나, 해소하거나, 호전시키거나, 개선시키거나, 또는 영향을 미치기 위한 목적으로, 이소성 골화 (HO)와 연관된 질환, 예컨대 FOP, 이소성 골화 (HO)와 연관된 질환, 예컨대 FOP의 증상, 또는 이소성 골화 (HO)와 연관된 질환, 예컨대 FOP에 대한 소인 (예를 들어, FOP와 연관된 유전자, 예컨대 AVCR1에서의 1개 이상의 돌연변이)을 갖는 대상체에게 본원에 기재된 바와 같은 조성물을 적용 또는 투여하는 것을 지칭한다.
질환을 경감시키는 것은 질환의 발생 또는 진행을 지연시키는 것, 또는 질환 중증도를 감소시키는 것을 포함한다. 질환을 경감시키는 것은 반드시 치유적 결과를 요구하지는 않는다. 본원에 사용된 질환 (예컨대 HO와 연관된 질환)의 발생을 "지연시키는 것"은 질환의 진행을 연기, 방해, 둔화, 지체, 안정화, 및/또는 늦추는 것을 의미한다. 이러한 지연은 치료될 질환 및/또는 개체의 병력에 따라 다양한 길이의 시간일 수 있다. 질환의 발생을 "지연" 또는 경감시키거나, 또는 질환의 발병을 지연시키는 방법은, 방법을 사용하지 않은 경우와 비교하여, 주어진 시간 프레임 내에서 질환의 1종 이상의 증상이 발생할 확률을 감소시키고/거나 주어진 시간 프레임 내에서 증상의 정도를 감소시키는 방법이다. 이러한 비교는 전형적으로 통계적으로 유의한 결과를 제공하기에 충분한 다수의 대상체를 사용하는 임상 연구에 기초한다.
질환의 "발생" 또는 "진행"은 질환의 초기 징후 및/또는 뒤이은 진행을 의미한다. 질환의 발생은 관련 기술분야에 널리 공지된 바와 같은 표준 임상 기술을 사용하여 검출가능하고 평가될 수 있다. 그러나, 발생은 또한 검출불가능할 수 있는 진행을 지칭한다. 본 개시내용의 목적상, 발생 또는 진행은 증상의 생물학적 과정을 지칭한다. "발생"은 출현, 재발, 및 발병을 포함한다. 본원에 사용된, 이소성 골화 (HO)와 연관된 질환, 예컨대 FOP의 "발병" 또는 "발생"은 초기 발병 및/또는 재발을 포함한다.
일부 실시양태에서, 본 섹션에 개시된 바와 같은 치료 방법은 그를 필요로 하는 대상체에게 본원에 개시된 바와 같은 트랜스진을 포함하는 단리된 핵산, 재조합 AAV (rAAV), 재조합 유전자 편집 복합체, 또는 벡터를 투여하는 것을 포함한다. rAAV는 골격근 또는 결합 조직에 대한 그의 표적화를 촉진하는 변형을 포함할 수 있다. 일부 실시양태에서, 본원에 개시된 바와 같은 치료 방법은 대상체에게 캡시드 단백질 및 억제 핵산을 코딩하는 단리된 핵산을 포함하는 rAAV를 투여하는 것을 포함한다. rAAV는 억제 핵산 (예를 들어, siRNA, shRNA, miRNA 또는 amiRNA)을 포함할 수 있다. 억제 핵산은 FOP와 연관된 표적 유전자의 발현을 감소 또는 증가시킬 수 있다. 일부 실시양태에서, rAAV 또는 단리된 핵산은 이소성 골화 또는 FOP의 발생과 연관된 유전자를 표적화하는 인공 마이크로RNA를 코딩하는 트랜스진을 포함한다. 일부 실시양태에서, 표적 유전자는 AVCR1이다. 일부 실시양태에서, 표적 유전자는 돌연변이된 AVCR1이다.
세포 또는 대상체에서 ACRV1의 발현은 본 개시내용의 방법을 사용하여 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 감소될 수 있다. 세포 또는 대상체에서 ACVR1의 발현은 본 개시내용의 방법을 사용하여 75% 내지 90%만큼 감소될 수 있다. 세포 또는 대상체에서 ACVR1의 발현은 본 개시내용의 방법을 사용하여 80% 내지 99%만큼 감소될 수 있다.
이소성 골화는 본 개시내용의 방법을 사용하여 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 억제될 수 있다. FOP를 갖거나 갖는 것으로 의심되는 대상체에서의 플레어-업 상태는 본 개시내용의 방법을 사용하여 50% 내지 99% (예를 들어, 50% 및 99%를 포함한 그 사이의 임의의 정수)만큼 억제될 수 있다. 어떠한 이론에 얽매이는 것을 원하지는 않지만, 플레어-업 상태는 FOP와 같은 만성 질환의 악화를 지칭한다.
본원에 개시된 바와 같이, 서열의 "동일성"은 관련 기술분야의 통상의 기술자에게 공지된 수학적 모델, 알고리즘, 또는 컴퓨터 프로그램에 의해 다루어지는 갭 정렬 하에서의, 2개 이상의 서열 사이의 동일한 매치의 퍼센트의 측정 또는 계산을 지칭한다. 2개의 서열 (예를 들어, 핵산 또는 아미노산 서열)의 퍼센트 동일성은, 예를 들어, 베이직 로컬 얼라인먼트 서치 툴 (BLAST®), 예컨대 NBLAST® 및 XBLAST® 프로그램 (버전 2.0)을 사용하여 결정될 수 있다. 다중 서열 정렬의 경우 클러스탈 오메가(Clustal Omega)와 같은 정렬 기술이 사용될 수 있다. 다른 알고리즘 또는 정렬 방법은 스미스-워터맨(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 또는 고속 최적 전반적 서열 정렬 알고리즘 (FOGSAA)을 포함할 수 있으나 이에 제한되지는 않는다.
일부 실시양태에서, 물질의 "유효량"은 목적하는 효과를 생성하기에 (예를 들어, 골 세포 또는 골 조직을 형질도입하기에) 충분한 양이다. 일부 실시양태에서, 단리된 핵산의 유효량은 대상체의 표적 조직의 충분한 수의 표적 세포를 형질감염시키기에 (또는 rAAV-매개된 전달과 관련하여, 감염시키기에) 충분한 양이다. 일부 실시양태에서, 표적 조직은 골격근 또는 결합 조직이다. 일부 실시양태에서, 단리된 핵산 (예를 들어, rAAV를 통해 전달될 수 있는 것)의 유효량은 대상체에서 치료 이익을 갖기에, 예를 들어 이소성 골화를 억제하기에, 플레어-업 상태를 개선시키기 등에 충분한 양일 수 있다. 유효량은 다양한 인자, 예컨대 예를 들어 대상체의 종, 연령, 체중, 건강, 및 표적화될 조직에 좌우될 것이고, 따라서 본 개시내용의 다른 곳에 기재된 바와 같이 대상체 및 조직 사이에서 달라질 수 있다.
본 발명의 예시적인 실시양태는 하기 실시예에 의해 보다 상세히 기재될 것이다. 이들 실시양태는 본 발명의 예시이며, 관련 기술분야의 통상의 기술자는 예시적인 실시양태로 제한되지 않음을 인식할 것이다.
실시예
실시예 1: 유전자 부가 또는 유전자 침묵을 위한 AAV 벡터 게놈의 생성
약 97% FOP는 ACVR1 (G>A, R206H)의 이형접합, 기능 획득 돌연변이에 의해 유발되는 것으로 보고되었다. 인간 ACVR1R206H를 인간 야생형 ACVR1 (ACVR1WT)로 대체하기 위해, 인간 ACVR1 상보적 DNA의 코돈-최적화된 버전 (ACVR1opt, 야생형 코딩 서열과 비교하여 74% 뉴클레오티드 동일성)을 설계하고, 닭 b-액틴 프로모터 (CBA, 도 2a)를 함유하는 AAV 벡터 게놈 내로 클로닝하였다. 구체적으로, 닭 베타-액틴 (CBA) 프로모터 하에 코돈-최적화된 야생형 인간 ACVR1 cDNA (opt-ACVR1, ~1.5 kb)를 발현하는 AAV 벡터 게놈을 생성함으로써 유전자 부가 전략을 개시하였다 (도 2). CBA 인트론 (1080 bp)을 MBL 인트론 (384 bp) 또는 합성 인트론 (172 bp)으로 치환하여 벡터 게놈 크기를 감소시켰다 (도 2a). 이뮤노블롯팅 분석은 모든 3개의 인트론이 CBA 프로모터 하에 HEK293 세포에서 opt-ACVR1 단백질을 발현할 수 있음을 입증하였다 (도 2b). 높은 수준의 AAV-전달된 shRNA는 RNAi 기구를 교란하고 오프-타겟 침묵 효과를 유발할 수 있다고 보고되었기 때문에, 작은 침묵 RNA의 가이드 가닥을 마우스 miR-33-유래 miRNA 스캐폴드 (인공 miRNA, amiR) 내로 삽입하여 통상적인 shRNA-관련 독성 및 오프-타겟 침묵을 개선시켰다. 따라서, CBA 프로모터 하에 인간 ACVR1-R206H mRNA의 상이한 서열 부위를 표적화하는 12종의 인공 miRNA (amiR)를 발현하는 AAV 벡터 게놈을 유전자 침묵을 위해 생성하였다 (도 3a). 추가적으로, 레닐라 루시페라제 리포터 유전자에 이어 인간 ACVR1-R206H, ACVR1-WT, 또는 ACVR1-opt (코돈 최적화됨)에 특이적인 miRNA 결합 부위를 함유하는 amiR-센서 플라스미드를 생성하여, 어떤 amiR이 인간 ACVR1-WT 및/또는 ACVR1-opt mRNA 수준의 어떠한 감소도 없이 인간 ACVR1-R206H mRNA를 녹다운시키는 데 효과적인지를 스크리닝하였다 (도 3b). ACVR1-R206H 활성은 RH8 및 12를 제외하고 대부분의 amiR의 발현에 의해 현저하게 감소된 반면, 이들 RH8 및 12 amiR은 opt-ACVR1 루시페라제 활성에 대해 거의 내지 전혀 효과를 나타내지 않았다. 이러한 설계에서, amiR은 CBA 프로모터와 mCherry 리포터 유전자 사이에 인트론 삽입되었고, 이는 양성 형질도입된 세포의 시각적 추적을 가능하게 한다. ACVR1R206H를 표적화하고, ACVR1WT 또는 ACVR1opt는 표적화하지 않는 amiR-R206H를, 침묵화 효율을 나타내는 센서 플라스미드의 레닐라 활성을 측정함으로써 스크리닝하였다 (도 3c). 이들 amiR 중에서, RH3, 5, 9 및 11을 포함한 4종의 amiR은 ACVR1-WT 활성의 유의한 감소를 유도하였다 (도 3c). 이뮤노블롯팅 분석은 ACVR1-R206H의 단백질 수준이 amiR-ctrl 및 amiR-RH9, 10, 및 11과 비교하여 amiR-RH1, 2, 4, 5, 6, 및 7에 의해 실질적으로 감소되었음을 추가로 확인시켜 주었다. 주목할 것으로, WT- 및 opt-ACVR1 둘 다의 발현은 이들 amiR에 의해 영향을 받지 않았다 (도 3d, 도 30a 및 30b). 이들 결과는 amiR-RH6 및 amiR-RH7을 ACVR1R206H는 표적화하지만 ACVR1WT 및 ACVR1opt는 표적화하지 않는 가장 효과적인 유전자 사일렌서로서 확인시켜 주었다. ACVR1-R206H mRNA의 수준이 amiR-RH6 및 -RH7에 의해 가장 많이 감소되었기 때문에, 이들 amiR을 추가의 실험에 사용하였다.
실시예 2: 유전자 대체를 위한 AAV 벡터 게놈의 생성
유전자 대체 전략을 위해, CBA 프로모터, 합성 또는 MBL 인트론, amiR-ACVR1.RH6 또는 RH7, 및 코돈 최적화된 (opt-) ACVR1의 조합을 함유하는 4종의 AAV 벡터 게놈을 생성하였다 (도 4a). 유전자 침묵 플라스미드와 유사하게, 이들 플라스미드는 또한 ACVR1-WT 활성에 영향을 미치지 않으면서 ACVR1-R206H 루시페라제 활성을 감소시키는 데 효과적이었다 (도 4b). ACVR1-OPT의 증가된 루시페라제 활성과 달리, 이뮤노블롯팅 분석은 opt-ACVR1의 단백질 수준에서 차이를 나타내지 않았으며 (도 4c), 이는 이들 플라스미드에서의 amiR-RH6 또는 amiR-RH7이 opt-ACVR1 발현에 영향을 미치지 않는다는 것을 나타낸다. BRE-루시페라제 활성은 벡터 대조군과 비교하여 이들 플라스미드의 존재 하에 현저하게 감소하였고, 이는 액티빈 A-유도된 루시페라제 활성을 억제하는 그의 능력을 입증한다 (도 4d).
실시예 3: 다중 세포의 시험관내 형질도입에 효과적인 rAAV 혈청형의 스크리닝
시험관내에서 FOP의 원인이 되는 세포를 형질도입하는 데 최상의 AAV 혈청형을 확인하기 위해, 증진된 녹색 형광 단백질 (Egfp) 리포터 유전자를 발현하는 scAAV 벡터 구축물을 14종의 통상적인 AAV 캡시드 (AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, AAVrh.8, AAVrh.10, AAVrh.39 및 AAVrh.43) 내로 패키징하고, 인간 FOP 환자 진피 섬유모세포-유래 유도성 만능 줄기 세포 (FOP-iPSC), 마우스 근육 근모세포주 (C2C12), 인간 골수-유래 기질 세포 (BMSC) 또는 인간 지방 조직-유래 기질 세포 (ASC)와 함께 인큐베이션하였다. 형질도입된 세포에서의 EGFP의 발현을 형광 현미경검사 (도 5) 및 항-EGFP 항체를 사용한 이뮤노블롯팅 (도 8g)에 의해 평가하였다. 거의 모든 AAV 혈청형 벡터가 C2C12 세포를 형질도입하였지만, rAAV2, rAAV3b, rAAV5, rAAV6, 및 rAAV6.2를 포함한 단지 5개의 AAV 혈청형 벡터만이 인간 FOP-iPSC를 형질도입할 수 있었다. 이들 중에서, rAAV2, rAAV5, rAAV6, 및 rAAV6.2는 또한 인간 BMSC 및 ASC를 형질도입하였다. 주목할 것으로, rAAV9는 인간 FOP-iPSC, ASC, 및 C2C12 세포에 대해 낮은 형질도입 효능을 나타낸다.
rAAV6-F129L 돌연변이체인 rAAV6.2가 시험관내에서 4종의 세포 유형 모두를 형질도입하는 가장 효과적인 혈청형이고, rAAV9가 인간 BMSC뿐만 아니라 마우스 골격을 형질도입할 수 있다는 것을 고려하여, rAAV6.2 및 rAAV9가 골격근에서 이소성 골-존재 세포를 형질도입하는 능력을 이소성 골화 (HO) 마우스 모델에서 검사하였다.
Tie2-Cre 계통-표지 실험은 Tie2-발현 세포가 섬유증식, 연골형성 및 골형성 단계를 비롯한 HO의 모든 단계에 존재하며, BMP 리간드 이식 후 및 골격근에서의 근육 손상 후 이소성 연골 및 골 형성에 기여한다는 것을 입증하였다. 이들 세포는 그의 지방생성 및 섬유발생 능력에 대해 발견된 섬유/지방생성 세포 (FAP)의 하위-집단이다. tdTomato 발현을 사용하여 이소성 골에서 Tie2+ 계열 세포를 가시화하기 위해, Tie2-cre 마우스를 Cre 리포터 Ai9 마우스와 교배시키고, 골격근에서의 근육 손상 후에 재조합 BMP2/7의 근육내 (i.m.) 주사로 처리하였다 (도 6). 4일 (섬유증식 단계) 또는 8일 (골화-전 단계) 후에, EGFP를 발현하는 rAAV6.2 또는 rAAV9를 각각 근육내로 주사하였다. HO 유도 24일 후에, HO를 X-방사선촬영에 의해 평가하고 (도 6a 및 c), 이소성 골에 존재하는 AAV-형질도입된 세포를 형광 현미경검사를 사용하여 가시화하였다 (도 6b 및 d). rAAV6.2 및 rAAV9 둘 다는 HO-존재 세포 및 골격근의 형질도입에 효과적이지만, Tie2-발현 세포의 하위-집단만이 이들 AAV 벡터에 의해 형질도입되었다 (도 6b 및 d). 유전자 대체를 위해 개발된, CBA 프로모터, MBL 인트론, amiR-RH6 또는 -RH7, 및 opt-ACVR1을 함유하는 AAV 벡터 게놈 (도 4a)을 AAV6.2 또는 AAV9 캡시드 내로 패키징하고 (도 7a), 그의 AAV 게놈 완전성을 검증하였다 (도 7b). rAAV6.2가 rAAV9보다 인간 FOP-iPSC에 대해 더 높은 시험관내 형질도입 효율을 나타내기 때문에 (도 5), rAAV6.2 벡터를 사용하여 AAV의 기능적 검증을 수행하였다 (도 8). 인간 FOP-iPSC에서 amiR-RH6 또는 amiR-RH7의 ACVR1-R206H 돌연변이체 대립유전자-특이적 침묵 효율을 검사하기 위해, AAV-형질도입된 세포로부터 추출된 mRNA를 차세대 서열분석에 적용하였다 (도 8a). R206H 대 WT 대립유전자의 전사체 비를 65.4% 대 34.6%로 나타내는 amiR-ctrl-처리한 세포와 비교하여, amiR-RH6 또는 amiR-RH7을 보유하는 rAAV6.2로 처리한 경우에 전사체 비는 각각 47.1% 대 52.9% 및 20.9% 대 79.1%만큼 변경되었다. 이 결과는 amiR-RH7이 amiR-RH6보다 인간 FOP-iPSC에서 ACVR1-R206H 돌연변이체 대립유전자-특이적 침묵에 더 효과적임을 입증한다. 주목할 것으로, amiR-RH7 및 opt-ACVR1을 보유하는 rAAV6.2는 또한 amiR-RH6 및 opt-ACVR1을 보유하는 rAAV6.2와 비교하여 인간 FOP-iPSC에서 코돈-최적화된 야생형 ACVR1 mRNA의 보다 높은 발현을 나타낸 반면, rAAV6.2.amiR-ctrl-처리한 세포에서는 ACVR1 발현이 검출되지 않았다 (도 8b). 따라서, 벡터로의 처리는 rAAV6.amiR-ctrl과 비교하여 알칼리성 포스파타제 (초기 골형성 마커) 및 무기질화 활성 (후기 골형성 마커)의 유의한 감소를 발생시켰지만 (도 8c 및 도 8d), 유형 1 콜라겐 및 골 시알로단백질을 포함한 골모세포 마커 유전자의 mRNA 수준은 amiR-RH7 및 opt-ACVR1을 보유하는 rAAV6.2에 의해 현저하게 감소되었고, amiR-RH6 및 opt-ACVR1을 보유하는 rAAV6.2 또는 rAAV6.2.amiR-ctrl에 의해서는 그렇지 않았다 (도 8e). 따라서, 이러한 결과는 amiR-RH7 및 opt-ACVR1을 보유하는 rAAV6.2가 ACVR1-R206H를 야생형 ACVR1로 대체하여 FOP-iPSC의 골형성을 억제하는 데 강력하다는 것을 나타낸다. 이어서, 대조군 벡터, amiR-RH6.ACVR1opt, 또는 amiR-RH7.ACVR1opt를 보유하는 rAAV6.2 벡터를 인간 FOP iPSC 내로 형질도입하고, 그의 발현 및 침묵 효율 및 정확도를 RT-PCR, 차세대 서열분석 (NGS), 및 전체 트랜스크립톰 분석을 사용하여 검사하였다. 65.4% ACVR1R206H 대 34.6% ACVR1WT 전사체가 대조군-발현 세포에서 발현되며, 전사체 패턴은 각각 amiR-RH6.ACVR1opt 및 amiR-RH7.ACVR1opt를 발현하는 세포에서 36.7% 대 63.3% 및 39.5% 대 60.5%로 실질적으로 변화되었다 (도 8f, 상단). EGFP를 발현하는 대조군 세포 (도 15a에 제시된 바와 같음)에 비해 ACVR1opt 발현이 또한 이들 세포에서 확인되었다 (도 8f, 하단).
인간 FOP iPSC의 골형성 잠재력을 억제하는 amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt의 능력을 검사하기 위해, 처리된 세포의 알칼리성 포스파타제 (ALP) 활성, 알리자린 레드 염색 및 골형성 유전자 발현을 검사하였다 (도 8e 및 8h). WT iPSC를 또한 건강한 공여자로부터 생성하고, 음성 대조군으로서 사용하였다. 이들 결과는 amiR-RH6.ACVR1opt 및 amiR-RH7.ACVR1opt가 둘 다 FOP iPSC의 골형성을 억제하는 데 효과적이지만, WT iPSC의 골형성에는 영향이 없거나 또는 이를 약간 증가시킨다는 것을 입증한다. 따라서, 이들 AAV 벡터는 인간 FOP 세포에 특이적으로 작용할 가능성이 있다.
ACVR1R206H 돌연변이는 액티빈 A에 반응하여 Smad1/5/8-매개된 BMP 신호전달의 활성화를 부여하는 반면에, 어떠한 BMP 신호전달도 ACVR1WT 수용체를 통해서는 정상적으로 발생하지 않는다는 것이 이전에 보고되었다. 대조군-발현 FOP iPSC에서, 액티빈 A 처리는 BMP-반응성 유전자, ID1 및 MSX2의 발현을 유의하게 상향조절하였고, 이러한 유도는 amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt를 발현하는 세포에서 제거되었다 (도 8i 및 도 31). 이들 결과를 FOP의 인간화 녹-인 마우스 모델에서 HO의 주요 기원 세포인 섬유/지방생성 전구세포 (FAP)를 사용하여 추가로 평가하고 확인하였다. 세포 표면 마커 (PDGFRα+ScaI+CD31-CD45-)를 사용하여 Acvr1(R206H)Fl;PDGFRα 마우스의 골격근으로부터 단리된 FAP의 하위세트에서 액티빈 A-유도된 골형성을 검사하였고, amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt로 처리한 경우 액티빈 A-유도된 ALP 활성 및 골형성 유전자 발현의 유의한 감소가 입증되었다 (도 8j 및 8k).
전신 주사된 rAAV6.2가 골격근을 형질도입하는 능력을 검사하기 위해, EGFP를 발현하는 rAAV6.2 (rAAV6.2.egfp)를 2개월령의 야생형 마우스에 정맥내로 (i.v.) 주사하고, 2주 후에 개별 기관 영상화를 수행하였으며, 이는 간에서 강한 EGFP 발현을 입증한 한편, 골격근에서는 발현이 검출되지 않았다 (도 9, 좌측). 인간 VEGF-166 및 나트륨 헤파린을 포함한 혈관 투과성 작용제는 rAAV6.2이 심장 및 골격근을 형질도입하는 능력을 개선시켰다 (도 9, 중간). 그러나, rAAV6.2와 비교하여, rAAV9의 정맥내 주사는 혈관 투과성 작용제의 부재 하에서도 심장 및 골격근의 형질도입에 고도로 효과적이었다 (도 9, 우측). 따라서, rAAV9 캡시드를 사용하여 유전자 대체 기구를 FOP의 마우스 모델에 전달하였다. FOP의 유도성 마우스 모델을 생성하기 위해 인간 ACVR1-R206H의 Cre 레콤비나제-의존성 조건부-온 녹-인 대립유전자를 보유하는 ACVR1(R206H)FlEx 마우스를 타목시펜-유도된 Cre 레콤비나제를 발현하는 ERT2-Cre 마우스 (ACVR1(R206H)FlEx;ERT-Cre)와 교배시켰다. 이전에 보고된 바와 같이, 자발적 HO가 타목시펜 처리의 10주 후에 다중 영역에서 발생한다. 다중 HO 부위를 갖는 amiR-ctrl-처리한 마우스와 비교하여, amiR-RH6 또는 -RH7 및 opt-ACVR1을 보유하는 rAAV9로 처리한 경우 FOP 마우스에서는 HO 부위가 거의 검출되지 않았다 (도 10). 이들 결과는 전신 전달된 AAV9 벡터가 골격근에서 ACVR1-R206H 돌연변이체 mRNA를 코돈-최적화된 야생형 ACVR1 mRNA로 대체하는 데 효과적이고, 생체내 자발적 HO의 발생을 억제한다는 것을 입증한다. 따라서, rAAV9.amiR-RH6.opt-ACVR1 또는 amiR-RH7.opt-ACVR1 벡터를 사용한 유전자 대체는 HO의 치료를 위한 유망한 접근법일 수 있다.
실시예 4: 유전자 편집을 위한 AAV 벡터 게놈의 생성
rAAV에 상용성인 Cas9-기반 아데닌 염기 편집제 (ABE)는 이중-가닥 DNA 파괴를 생성하지 않으면서 표적 염기 쌍을 상이한 염기 쌍으로 직접 전환시키기 위해 개발되었다. 따라서, ACVR1-R206H 대립유전자에서 "A"를 "G"로 전환시키기 위해 rAAV9-상용성 ABE 구축물을 개발하였다. ABE를 염기 편집제의 이중-AAV 패키징을 가능하게 하는 트랜스-스플라이싱 인테인 서열을 사용하여 AAV 패키징 크기 한계 (~ 4.7kb)보다 작은 절반으로 나누었다. N-말단 ABE 구축물은 R206H 돌연변이 부위를 보유하는 프로토스페이서를 함유하였다. C-말단 ABE 구축물은 AAV6.2 또는 AAV9 캡시드 내로 패키징되었다 (도 11).
실시예 5: 염증성 시토카인 및/또는 BMP에 반응하는 AAV 벡터 게놈의 생성
염증 및 액티빈 A는 HO에서 소정의 역할을 하는 것으로 제시되었다. 대식세포 및 비만 세포는 FOP의 마우스 모델에서 발생 중인 HO 영역에서 고도로 풍부하며, 고갈되었을 때 HO가 현저하게 감소되었다. 외상-유도된 HO의 마우스 모델에서, 아킬레스 건절단술 및 배측 화상은 손상 후 48시간 내에 TNF 및 IL-1β를 포함한 염증성 시토카인의 상향조절을 발생시켰고, 손상 1주 후에 MCP1 및 VEGF의 상승이 타액에서 지속되었다. 액티빈 A, BMP 리간드, 및 염증성 시토카인의 수준이 플레어-업 영역에서 상승됨에 따라, 플레어-업에 반응하여 천연 액티빈 A 길항제, 가용성 폴리스타틴 (sFST), 및 천연 TNF 길항제, 가용성 TNFR2 (sTNFR2)를 분비할 수 있는 rAAV9 벡터를 생성하였다. rAAV9의 국부 또는 전신 주사는 골격근의 형질도입에 고도로 효과적이며, 이는 플레어-업 영역에서 sFST 및 sTNFR2를 생산하여 이웃 HO의 발생을 억제한다 (도 12). 이를 위해, 내인성 BMP-반응성 요소 (BRE, EndolD1-BRE) 및 NF-kB-결합 부위 (pNF-kB)를 함유하는 프로모터를 가우시아 리포터 유전자를 코딩하는 AAV 벡터 게놈 내로 클로닝하였다 (eBRE/NF-kB-Luc, 도 13a). 통상적인 NF-kB-반응성 리포터 유전자 PB2-luc에서 관찰되는 유도 동역학을 재현하는, TNF 및 IL-1β를 비롯한 염증성 시토카인으로 자극된 경우에, 루시페라제 활성은 용량-의존성 방식으로 실질적으로 증가하였다 (도 13b). 통상적인 BMP-반응성 리포터 유전자 BRE-luc와 같이, 이러한 리포터 유전자도 또한 재조합 BMP4에 대해 반응성이었다 (도 13c). 루시페라제 활성의 상가적 증가가 염증성 시토카인 및 BMP4 둘 다로 처리된 경우에 eBRE/NF-kB-Luc에서 관찰되었다 (도 13d). 이들 결과는 플레어-업 영역에서 상승된 수준의 염증성 시토카인 및 액티빈 A/BMP에 반응할 수 있는 유망한 센서 플라스미드로서 eBRE/NF-kB-Luc를 나타낸다.
실시예 6: 가용성 폴리스타틴 (FST-288) 및 TNFR2를 생산하는 AAV 벡터 게놈의 생성
폴리스타틴 및 sTNFR2는 액티빈 A 및 TNFα에 그의 동족 수용체에 대해 경쟁적으로 결합하고, 따라서 각각 액티빈 A- 및 TNFα-유도된 신호 전달을 억제하는 것으로 이전에 보고되었다. 따라서, 천연 액티빈 A 길항제, 가용성 인간 폴리스타틴 (FST-288) 및 천연 TNF 길항제, 가용성 인간 TNFR2를 AAV 벡터 게놈 내로 닭 β-액틴 프로모터 (CB) 하에 클로닝하였다 (도 14a). 그러나, 전신 전달 후에, rAAV9 벡터는 또한 골에 더하여 간, 심장 및 골격근을 표적화하며, 이는 불리한 효과를 유발할 수 있다. 이를 피하기 위해, AAV 벡터 게놈 내로 완벽하게 상보적인 miR-122-결합 부위를 조작함으로써 간에서의 rAAV 발현을 억제하는 조직-특이적 내인성 miRNA를 개발하였다. 간에서의 트랜스진 발현의 침묵은 간세포에서 발현되는 풍부한 (≥60,000 카피/세포) miRNA인 miR-122, 및 사실상 모든 동물의 심장 및 골격근에서 발견되는 miRNA인 miR-1의 자연 발현을 이용하였다. miR-122에 대한 상보적 부위를 트랜스진의 3' 비번역 영역 (UTR) 내로 삽입하였다 (도 14a). AAV 벡터 게놈으로부터 생산된 sTNFR2 및 FST-288이 TNF- 및 액티빈 A-유도된 신호 전달을 억제할 수 있는지 시험하기 위해, 대조군 벡터 또는 AAV 벡터 게놈을 HEK293 세포 내로 형질감염시키고, 이들 세포로부터 상청액을 수거하였다. 대조군 상청액과 비교하여, TNF- 및 액티빈 A-유도된 활성화는 둘 다 sTNFR2 및 sFST-생산 상청액의 존재 하에 현저하게 감소되었다 (도 14b). 다음으로, 이러한 플라스미드 내의 CB 프로모터를 eBRE/NF-kB 프로모터로 교체할 것이고, 이는 염증성 시토카인 및 액티빈 A에 반응하여 분비된 TNFR2 및 FST-288을 생산할 수 있다.
실시예 7: 시험관내 및 생체내 연구
본 실시예는 장애초래 FOP 병리상태를 예방할 수 있는 신규 유전자 치료제를 기재한다. 건강한 ACVR1의 외인성 발현에 의한 유전자 대체, Acvr1R206H 대립유전자-특이적 침묵, 또는 유전자 대체 및 침묵의 조합을 보유하는 rAAV의 직접 근육 투여 (예를 들어, 상기 실시예에 기재된 바와 같음)는 인간 Acvr1R206H 녹-인 대립유전자를 보유하는 마우스에서 외상-유도된 이소성 골화 (HO)를 현저하게 감소시켰다. 추가적으로, AAV 벡터는 또한 영아기에 전신 투여된 경우에 골격근에서 외상성 HO를 억제하였다. 손상 부위에서의 섬유증, 연골형성 및 골화는 AAV-처리한 근육에서 모두 실질적으로 감소된 한편, 염증은 정상적으로 발생하였다. 유전자 대체 및 침묵의 조합을 보유하는 rAAV9 벡터의 전신 전달은 소아 및 성체 FOP 마우스 둘 다에서 진행성 HO, 악관절강직, 골다공증, 저신장 및 체중 감소의 역전에 의해 제시된 바와 같이, 만성 HO를 예방하는 데 효과적인 것으로 또한 관찰되었다. 또한, 미세 바늘 (예를 들어, 마이크로젝트 600)을 사용한 진피내 (id) 주사를 통한 골격근으로의 rAAV9 벡터의 전달은 골격근에서 FOP-유발 세포를 형질도입하는 데 효과적이어서, FOP 환자에서 HO를 유도하는 근육내 주사에 대한 우려를 경감시키는 것으로 관찰되었다.
도 15a-15d는 AAV-유전자 치료제가 ACVR1-R206H 돌연변이에 의해 증진된 골형성을 역전시킨다는 것을 보여준다. 도 15a는 ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC를 인간 FOP-iPSC에 2일 동안 형질도입하고, 골형성 조건 하에 4일 동안 배양한 것을 보여준다. 총 RNA를 cDNA 합성에 적용한 후, Egfp 발현에 대해 RT-PCR을 수행하였다. 도 15b 및 도 15d는 총 RNA를 RNA 서열분석에 적용하고, amiR-RH7.optACVR1에 비해 amiR-RH6.optACVR1을 발현하는 세포에서 상향/하향조절된 유전자에 대한 유전자 발현을 비교한 볼케이노 플롯을 생성한 것을 보여준다. 대조군 벡터와 비교하여, amiR-RH6.ACVR1opt 또는 amiR-RH7.ACVR1opt로의 처리는 각각 45 또는 140개의 유전자를 상향조절하였고, 27 또는 87개의 유전자를 하향조절하였다 (도 15d). 도 15c는 Sca1+PDGFRa+CD31-CD45- 섬유지방생성 전구세포 (FAP)를 4주령의 Acvr1R206H;PDGFRa 마우스의 경골근으로부터 FACS 분류하고, ctrl, amiR-RH6.optACVR1, 또는 amiR-RH7.optACVR1을 보유하는 AAV6.2 벡터의 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 6일 동안 배양하고, 골형성 유전자 발현을 RT-PCR에 의해 평가하였다.
도 16a-16c는 시험관내 액티빈 A-유도된 골형성에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 16a는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, 액티빈 A (100 ng/ml)로 6 또는 24시간 동안 자극하고, 액티빈 A-반응성 유전자 Id1 및 Msx2의 발현을 각각 RT-PCR을 사용하여 평가하였다. 도 16b-16c는 AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 16b) 및 알리자린 레드 염색 (도 16c)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가한 것을 보여준다.
도 17a-17i는 액티빈 A 신호전달 및 외상성 이소성 골화에 대한 AAV-유전자 치료제의 효과를 보여준다. 도 17a-17d는 1차 골수-유래 기질 세포 (BMSC)를 4주령의 Acvr1R206H;Prx1 대퇴골로부터 단리하고, ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 AAV6.2 벡터 5 x 1010 GC로 처리한 것을 보여준다. 2일 후, AAV-처리한 세포를 골형성 조건 하에 4일 동안 배양하고, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 17a). AAV-처리한 세포를 액티빈 A (100 ng/ml)로 30분 동안 자극하고, 포스포-Smad1/5에 대해 이뮤노블롯팅하였다. 항-Gapdh 항체를 로딩 대조군에 사용하였다 (도 17b). AAV-처리한 세포를 골형성 조건 하에 PBS 또는 액티빈 A (50 ng/ml)와 함께 배양하고, ALP (도 17c, 좌측) 및 알리자린 레드 염색 (도 17c, 우측)을 수행하여 골형성 배양 6일 및 12일째에 골모세포 분화를 각각 평가하였다. AAV-처리한 세포를 골형성 조건 하에 PBS 또는 BMP4 (50 ng/ml)와 함께 12일 동안 배양하고, 무기질화에 대해 알리자린 레드 염색 (도 17c, 우측)을 수행하였다 (도 17d). 도 17e는 EGFP를 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 Tie2-cre;Ai9 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상 1주 후에 진피내로 (i.d.) 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (좌측 상단) 및 HO 조직의 동결-절편화 (좌측 하단, 우측)를 수행한 것을 보여준다. 적색 박스는 골격근에서의 HO를 나타낸다. M, 근육; HO-BM, 이소성 골화 골수. 청색, DAPI; 적색, Tie2+ 세포; 녹색, AAV-형질도입된 세포. 도 17f-17g는 벡터 또는 CRE 레콤비나제를 발현하는 rAAV9의 5 x 1012 vg/kg을 6주령의 암컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로 i.d. 주사하고, 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였음을 보여준다. 4주 후에, 경골근에서의 Acvr1R206H 및 CRE 레콤비나제 mRNA 수준을 RT-PCR에 의해 측정하고 (도 17f), 경골근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 17g, 좌측) 및 정량화를 나타낸다 (도 17g, 우측). 도 17h는 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 2일 후에 i.d. 주사한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, 경골근에서의 HO를 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측). 도 17i는 ctrl 또는 amiR-RH6.optACVR1을 발현하는 rAAV9의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=5)의 대퇴근에 i.d. 주사하고, 2일 후에 rBMP2/7-매트리겔 주사 및 근육 손상을 주사 부위에 사용한 것을 보여준다. 4주 후에, 대퇴근에서의 HO를 X-방사선촬영 및 마이크로CT를 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (좌측) 및 정량화를 나타낸다 (우측).
도 18a-18f는 AAV-처리한 골격근에서의 외상성 이소성 골화의 평가를 보여준다. 도 18a-18b는 연구 및 처리 설계의 다이어그램을 보여준다. EGFP를 발현하는 rAAV6.2의 5 x 1012 vg/kg을 2개월령의 수컷 야생형 마우스 (n=3)의 대퇴근 내로, rBMP2/7-매트리겔 주사 및 근육 손상의 1주 후에 i.d. 주사하고, 처리된 마우스에서 뒷다리의 X-방사선촬영 (도 18b, 좌측) 및 HO 조직의 동결-절편화 (도 18b, 우측)를 수행하였다. 박스는 골격근에서의 HO를 나타낸다. 도 18c-18d는 추가의 연구 및 처리 설계의 다이어그램을 보여준다. 도 18e는 ctrl, amiR-RH6, optACVR1 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1012 vg/kg을 6주령의 수컷 Acvr1R206H;Cre-ERT2 마우스 (n=8)의 경골근 내로, 타목시펜 (10 mg/kg)의 5회 복강내 (i.p.) 주사의 3일 후에 i.d. 주사한 것을 보여준다. 3일 후, 핀치 손상 및 1 μM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (우측). 도 18f는 추가의 연구 및 치료 설계의 다이어그램을 보여준다.
도 19a-19f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 19a-19b는 P1 PDGFRa-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템 (도 19a) 또는 AAV-처리한 뒷다리의 동결 절편 (도 19b)을 사용하여 mCherry 발현에 의해 평가한 것을 보여준다. BM: 골수. 도 19c-19e는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=10)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 2일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 4주 후, Acvr1R206H 및 optAcvr1 mRNA 수준을 RT-PCR에 의해 측정하였다 (도 19c). 경골근에서의 HO를 마이크로CT 또는 조직학을 사용하여 평가하였다. HO 부피의 3D 재구성 영상 (도 19d, 좌측) 및 정량화를 나타낸다 (도 19d, 우측). 이소성 골 질량 및 연골형성 원기는 둘 다 대조군 벡터에 비해 ACVR1opt 또는 amiR-RH6.ACVR1opt로의 처리에 의해 현저하게 감소된 반면, amiR-RH6의 처리 효과는 고도로 가변적이었다 (도 19d 및 도 29a). amiR-RH6.ACVR1opt는 외상성 HO의 억제 및 정상 근육 아키텍처의 거의 완전한 재생 및 재확립에서 가장 효과적이었다.
FOP의 마우스 모델에서의 근육 손상은 혈관주위 면역 세포 침윤 (제1일-제3일), 근육 변성 및 섬유증식 반응 (제3일-제7일), 연골형성 (제7일-제14일), 및 이소성 골수를 갖는 골형성 (제14일-제28일)을 포함하여 HO의 주요 순차적 병리학적 변화를 유도하는 것으로 이전에 밝혀졌다. 도 19e는 대표적인 조직학 데이터를 보여준다. 대조군 벡터 또는 amiR-RH6.ACVR1opt로 처리된 P1 Acvr1(R206H)Fl;Cre-ERT2 새끼를 6주령까지 성숙시킨 후, 근육 손상 4주 후에 상이한 시점에서 X-방사선촬영 및 조직병리학적 평가를 수행하였다 (도 19f 및 도 29b). 도 19f는 P1 Acvr1R206H;Cre-ERT2 새끼 (n=3)를 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 6주 후에, 마우스를 타목시펜 (10 mg/kg)의 i.p. 주사로 5회 처리한 것을 보여준다. 3일 후, 핀치 손상 및 1 mM 심장독소를 주사 부위에 사용하였고, 3, 7, 14, 28일 후, 경골근에서의 HO를 X-방사선촬영에 의해 평가하였다. 박스는 경골근에서의 HO를 나타낸다. 예상된 바와 같이, 연골형성 원기 및 이소성 골은 각각 손상의 7 및 14일 후에 대조군-처리된 근육에서 발생한다. 그러나, amiR-RH6.ACVR1opt-처리된 근육은 연골 및 이소성 골 형성의 증거를 거의 또는 전혀 나타내지 않았지만, 제7일에 섬유증식 반응을 나타내었고, 이는 손상의 14일 후에 사라지기 시작하였다. 염증성 대식세포 및 비만 세포의 침윤, 근육 변성 및 섬유증식을 비롯한 제3일의 초기 손상 반응은 대조군 및 amiR-RH6.ACVR1opt로 처리된 경골근 사이에서 비교적 대등하였다 (도 28b 및 29c).
도 20a-20g는 AAV-유전자 치료제의 전신 전달이 외상성 이소성 골화를 예방한다는 것을 보여준다. 도 20a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 20b-20c는 P1 PDGFRα-GFP 새끼 (n=3)를 mCherry를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, PDGFRα 발현을 IVIS-100 광학 영상화 시스템에 의해 GFP 발현을 사용하여 평가한 것을 보여준다 (도 20b). 뒷다리에서 AAV-형질도입된 세포를 또한 형광 현미경검사를 사용하여 뒷다리에서의 mCherry 발현에 의해 평가하였다. IVIS-100 광학 영상화 시스템 (도 20b) 또는 AAV-처리한 뒷다리의 동결 절편 (도 20c). BM: 골수. 도 20d는 P1 야생형 새끼 (n=3)를 LacZ를 발현하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하고, 2주 후에, AAV-형질도입된 조직의 동결-절편을 X-갈락토시다제에 대해 염색한 것을 보여준다. BM: 골수, CB: 피질 골, M: 근육. 도 20f는 연구 및 처리 방법 설계의 다이어그램을 보여준다. 도 20g는 연구 및 처리 방법 설계의 다이어그램을 보여준다. mCherry 발현은 심장, 폐, 간 및 신장에서의 발현 (도 20e)과 함께 골격근 내 PDGFRα+ FAP 및 피질 골 내 PDGFRα+ 골모세포 및 골세포의 하위세트에서 검출되었다 (도 31).
도 21a-21j는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 21a는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후에, 간에서의 Acvr1R206H 및 optACVR1 mRNA 수준을 RT-PCR에 의해 평가하였다. 전신 (도 21b), 몸통 (도 21c) 및 하체 (도 21d)의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방한다는 것을 입증한다. 화살표는 HO 영역을 나타낸다. 전신에서의 총 HO 부피 (도 21e) 및 HO 영역의 수 (도 21f)를 정량화하였다. 임상 HO 발생률의 백분율을 평가하였다 (도 21g). 슬관절의 마이크로CT 및 조직학을 수행하여 이소성 골 (도 21h, 좌측 및 중간), 관절 연골 (도 21h, 중간), 및 성장판 (도 21h, 우측)의 변성을 평가하였다. 박스는 HO 영역 및 관절 연골 및 성장판을 나타낸다. 총 비장세포 집단 내의 면역 세포의 빈도는 전신 면역 반응에 대한 AAV 벡터의 영향이 거의 내지 전혀 없음을 나타낸다 (n=6~8, 도 21i). 대퇴골을 비골두에 가교시키는 이소성 골 (도 21h) 및 슬관절에서의 중증 골관절염 (도 21j, 좌측)은 이들 마우스에서 뒷다리의 부동을 유발할 가능성이 있으며, 이는 또한 amiR-RH6.ACVR1opt 처리에 의해 실질적으로 호전되었다. 특히, 팔로바로텐 처리된 마우스와 달리, 성장판에 존재하는 연골세포는 amiR-RH6.ACVR1opt-처리된 마우스에서 정상이었다 (도 21j, 우측). 폐, 간, 신장, 심장 및 골격근의 조직병리학적 평가를 이들 마우스에서 수행하였고 (도 23), 이는 amiR-RH6.ACVR1opt 처리의 유해 효과가 거의 내지 전혀 없음을 입증하였다. 이들 결과는 rAAV9 캡시드에 의한 amiR-RH6.ACVR1opt의 전신 전달이 성체 FOP 마우스에서 자발적 HO를 예방할 수 있다는 것을 입증한다. 종합하면, ACVR1R206H-특이적 침묵 및 ACVR1opt로의 유전자 대체를 동시에 실행하는 AAV 유전자 치료제의 전신 전달은 소아 및 성체 단계에서 장애초래 FOP 병리상태를 억제하는 데 효과적이며, 이는 FOP 환자에의 임상 번역에 대한 잠재력을 제공한다.
도 22a-22f는 AAV-유전자 치료제의 전신 전달이 성체 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 22a는 연구 및 치료 설계의 다이어그램을 보여준다. 도 22b는 mCherry를 발현하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 개별 조직에서의 mCherry 발현을 주사 2주 후에 IVIS-100 광학 영상화에 의해 모니터링하였다. 도 22c-2f는 ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=10)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사한 것을 보여준다. 10주 후, 정상적으로 이동하는 Acvr1R206H (ctrl) 마우스, 느리게 이동하는 Acvr1R206H;Cre-ERT2 (ctrl) 마우스, 및 정상적으로 이동하는 Acvr1R206H;Cre-ERT2 (amiR-RH6.optACVR1) 마우스를 포함한 16주령의 AAV-처리한 마우스의 움직임. 화살표는 amiR-RH6.optACVR1-처리한 마우스를 나타낸다 (도 22c). 도 22d는 슬관절 주변의 이소성 골을 보여준다. 도 22e는 AAV-처리한 비장의 종단면의 H&E 염색을 보여준다. 도 22f는 총 비장세포의 집단 내의 단핵구, 대식세포 및 호중구의 빈도를 보여준다 (n=6~8).
도 23은 성체 FOP 마우스에서의 조직 조직병리학에 대한 AAV-유전자 치료제의 효과를 보여준다. ctrl 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 5 x 1013 vg/kg을 6주령의 Acvr1R206H;Cre-ERT2 마우스 (n=3)에, 타목시펜 (10 mg/kg)의 5회 연속 i.p. 주사의 3일 후에 i.v. 주사하였다. 10주 후에, 폐, 간, 신장, 심장 및 골격근에서 H&E 염색을 수행하여 조직의 조직병리학을 평가하였다 (n=3).
도 24a-24h는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 24a는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRa-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다 (상단). HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다 (하단). 박스는 HO 조직을 나타낸다. 도 24b-24h는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. AAV-처리한 마우스의 생존 (도 24b) 및 체중 (도 24c)을 3주령부터 8주령까지 매주 분석하였다. 5주령의 AAV-처리한 두개골의 마이크로CT 분석은 AAV 벡터가 Acvr1R206H;PDGFRa-Cre 마우스의 악관절강직을 역전시키는 능력을 보여준다 (도 24d-24e). 3D 재구성 (도 24d, 상단) 및 2D 횡단면 (도 24d, 하단) 영상 및 개구 간격 (도 24e)을 나타낸다. 화살표는 측두하악 관절강직의 영역을 나타낸다. 대조군-처리된 Acvr1R206H 마우스의 감소된 생존 및 실질적인 체중 감소는 주로 악관절강직과 연관되었을 가능성이 있었고, 이는 개구하지 못하여 기아로 인해 조기에 사망한 모든 마우스에서 관찰되었다 (도 24d). 이들 마우스에서는 측두하악 관절 (TMJ)의 양쪽에서 HO가 발생한 반면, amiR-RH6 또는 ACVR1opt로의 처리에 의해서는 대부분의 HO가 TMJ의 오직 한쪽에서만 발생하였다. amiR-RH6.ACVR1opt 처리는 TMJ의 양쪽에서 HO를 거의 완전히 억제하여, 생존율 및 체중의 유의한 증가를 발생시켰다. 이들 결과는 Acvr1R206H-특이적 침묵 및 ACVR1opt로의 유전자 대체와 비교하여, amiR-RH6.ACVR1opt를 사용한 조합 접근법이 소아 FOP 마우스에서 TMJ에서의 조기-발병 HO를 예방하는 데 가장 효과적임을 시사한다.
골다공증이 진행성 FOP 환자의 주요 임상 특색으로 간주되었기 때문에, 5-주령의 Acvr1R206H 마우스의 척추 골 질량 및 아키텍처를 마이크로CT에 의해 평가하였으며 (도 24d), 이는 한배새끼 대조군과 비교하여 지주골 질량의 ~70% 감소를 입증하였다. 이러한 표현형은 amiR-RH6.ACVR1opt로의 처리에 의해 실질적으로 호전되었지만, amiR-RH6 및 ACVR1opt에 의해서는 그렇지 않았다. 추가적으로, 이전에 보고된 바와 같이, Acvr1R206H 마우스에서는 경추, 및 엉덩이, 앞다리, 뒷다리 및 발목의 관절을 포함한 다중 해부학적 위치에서 자발적 HO가 발생하였으며, 이는 amiR-RH6, ACVR1opt, 또는 amiR-RH6.ACVR1opt로의 처리에 의해 실질적으로 호전되었다 (도 24d).
본 개시내용에 제시된 바와 같이, PDGFRα는 치아 중간엽 줄기 세포 및 상아질모세포에서 고도로 발현되기 때문에 (도 27c), PDGFRα 구동인자를 사용하여 Acvr1R206H를 표적화하는 것은 또한 상악골 및 하악골 둘 다에서 낮은 치조골 질량을 발생시켰고, 이는 amiR-RH6.ACVR1opt로의 처리에 의해 현저하게 개선되었다 (도 24g 및 도 27d). 특히, 치아 형태 및 상아질 질량은 둘 다 Acvr1R206H 마우스에서 정상이었으며, 이는 ACVR1R206H 돌연변이가 치아 발생 및 항상성에 중요하지 않다는 것을 시사한다. (도 24d). 상악골 및 하악골의 마이크로CT 분석은 amiR-RH6.optACVR1의 AAV-매개된 발현이 Acvr1R206H;PDGFRa-Cre 마우스의 낮은 골 질량을 역전시킨다는 것을 입증한다 (도 24f-24g). 2D 단면 (도 24f) 및 횡단면 (도 24g) 영상을 나타낸다. 화살표는 치근골을 나타낸다. 전신의 마이크로CT 분석은 Acvr1R206H;PDGFRa-Cre 마우스에서 만성 HO를 예방하는 AAV 벡터의 능력을 보여준다 (도 24h). 3D 재구성 (도 24h, 좌측) 및 2D 횡단면 (도 24h, 우측) 영상을 나타낸다. 다중 잔류 HO 병변이 amiR-RH6 또는 ACVR1opt로 처리된 Acvr1R206H 마우스에서 검출된 반면, amiR-RH6.ACVR1opt 처리는 신체 전반에 걸쳐 자발적 HO를 거의 완전히 예방하였다. 따라서, 악관절강직의 낮은 발생률과 함께, 영아기에서의 amiR-RH6.ACVR1opt의 단일 처리는 골격 발생 동안 FOP 마우스에서 조기-발병 골다공증 및 진행성 HO를 예방할 수 있다.
도 25a-25b는 AAV9의 전신 전달이 소아 FOP 마우스에서 HO 조직의 형질도입에 효과적임을 보여준다. 골격근 간질 내의 PDGFRα+ 전구세포가 HO의 원인이 되는 기원의 주요 세포 집단으로 공지되어 있기 때문에, Acvr1(R206H)Fl의 조건부 녹-인 대립유전자를 보유하는 마우스를 PDGFRα-cre 마우스 (Acvr1(R206H)Fl;PDGFRα)와 교배시켜, 다중 해부학적 위치에서 근조직, 건 및 인대의 조기-발병 및 광범위하게 분포된 HO 표현형을 초래하였다 (도 25a). 구체적으로, 도 25a는 5주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에서의 HO 조직의 알시안 블루 염색을 보여준다. 도 25b는 LacZ를 발현하는 rAAV9의 5 x 1013 vg/kg을 3주령의 Acvr1R206H;PDGFRα-Cre 마우스 (n=3)에 i.v. 주사하고, 2주 후에, 전신 X-방사선촬영을 수행하여 HO 부위를 찾아낸 것을 보여준다. HO 조직의 동결-절편을 X-갈락토시다제에 대해 염색하였다.
도 26a-26b는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 만성 이소성 골화를 예방한다는 것을 보여준다. 도 26a는 P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리한 것을 보여준다. 정상 크기의 Acvr1R206H 마우스 (ctrl), 작은 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (ctrl), 및 정상 크기의 Acvr1R206H;PDGFRa-Cre 마우스 (amiR-RH6.optACVR1)를 포함한, 5주령의 AAV-처리한 마우스의 움직임이 제시된다. 도 26b는 5주령의 AAV-처리한 마우스의 전신을 보여주는 X-방사선촬영을 보여준다.
도 27a-27d는 AAV-유전자 치료제의 전신 전달이 소아 FOP 마우스에서 악관절강직을 예방한다는 것을 보여준다. P1 Acvr1R206H;PDGFRa-Cre 새끼 (n=12)를 ctrl, amiR-RH6, optACVR1, 또는 amiR-RH6.optACVR1을 보유하는 rAAV9의 1011 GC로 안면 정맥 주사를 통해 처리하였다. 도 27a는 5주령의 AAV-처리한 마우스의 개구 능력을 입증하는 사진을 보여준다. 도 27b는 5주령의 AAV-처리한 마우스의 개별 조직이, optACVR1 또는 amiR-RH6.optACVR1의 AAV-매개된 발현이 기아에 의한 Acvr1R206H;PDGFRa-Cre 장의 붕괴를 예방한다는 것을 입증하는 사진을 보여준다.
도 28a-28c는 치료 유전자의 발현을 제어하기 위한 AAV 벡터 게놈의 변형을 보여준다. 도 28a는 플라스미드 구축의 개략적 다이어그램을 보여준다. CMV 인핸서/닭 β-액틴 프로모터 (CBA), MBL 인트론 (MBLi), β-글로빈 폴리A 서열 (PA), 및 역전된 말단 반복부 (TR). miR-122: 간-특이적 miRNA, miR-208a: 심장 근육-특이적 miRNA, TS: 표적 서열. miR-122/miR208a-TS는 간 및 심장에서 AAV의 발현을 억제하는 데 사용된다. EndoID1-BRE: BMP-반응성 요소. pNF-kB: 염증-반응성 요소. EndoID1-BRE/pNF-kB를 함유하는 프로모터는 BMP, 액티빈 A, 및/또는 염증유발 시토카인에 반응하여 AAV의 발현을 유도하는 데 사용된다. 도 28b는 플라스미드 구축의 개략적 다이어그램을 보여준다. 도 28c는 6주령의 야생형 마우스를 PBS 또는 5 x 1013 vg/kg의 rAAV9.egfp 또는 rAAV9.egfp.MIR-TS의 i.v. 주사로 처리하고, 2주 후에, AAV 벡터의 조직 분포를 IVIS-100 광학 영상화 시스템에 의해 EGFP 발현을 사용하여 모니터링한 것을 보여준다.
실시예 8: FOP 마우스에서의 외상성 HO에 대한 AAV 유전자 치료제의 생체내 처리 효과
시험관내 rAAV의 형질도입 효율은 투여 경로, 혈청 인자, 순환 중화 항체 및 세포외 장벽을 포함한 다중 생리학적 장벽의 존재로 인해 생체내 성능을 예측하는 것이 도전과제인 것으로 공지되어 있다. 따라서, HO가 FOP 마우스에서 주로 발생하는 골격근을 형질도입하는 rAAV6.2의 능력을 검사하기 위해, rAAV6.2-egfp 벡터를 마우스 내로 정맥내로 (i.v.) 주사하고, 개별 조직에서의 EGFP 발현을 IVIS-100 광학 영상화에 의해 모니터링하였다 (도 32a). EGFP 발현은 간에서만 검출된 반면, 골격근에서의 발현은 재조합 혈관 내피 성장 인자 (VEGF)-166, 나트륨 헤파린 및 혈청 알부민을 비롯한 혈관 작용제를 보충한 경우에 약간 증가한 것으로 관찰되었다 (도 32b). rAAV9 벡터의 i.v. 주사는 골격근을 형질도입하고, rAAV9의 근육내 (i.m.) 주사는 근육-상주 중간엽 줄기 세포 (MSC, 도 32c)를 형질도입하는 데 효과적인 것으로 이전에 밝혀졌다. i.m. 주사는 종종 FOP 환자에서 HO 병변을 유발하기 때문에, 중공 미세바늘을 사용한 rAAV9.mCherry의 경골근으로의 진피간 (i.d.) 전달을 검사하였으며, 이는 근섬유 전반에 걸친 mCherry의 발현을 입증하였다 (도 32d 및 32e).
HO-형성 FAP를 형질도입하는 i.d. 주사된 rAAV9의 능력을 검사하기 위해, 후천성 형태의 HO, 근육 손상/BMP-유도된 HO를 나타내는 마우스 모델을 FAP의 하위세트에서 mCherry를 발현하는 Tie2-cre;Rosa26mCherry 리포터 마우스에 사용하였다. 둔기 근육 외상 및 재조합 BMP2/7의 투여 1주 후에, rAAV9.egfp를 대퇴근 내로 i.d. 주사하고, 3주 후에, HO 및 EGFP 발현을 각각 X-방사선촬영 및 형광 현미경검사에 의해 평가하였다 (도 18a). EGFP는 대퇴근에서뿐만 아니라 이소성 골 내의 Tie2+ FAP에서 고도로 발현되었으며 (도 6d), 이는 i.d. 주사된 rAAV9가 HO 발생 동안 골격근에서 근세포 및 FAP를 형질도입하는 데 효과적이었음을 입증한다. rAAV6.2-처리된 이소성 골에서는 EGFP 발현이 거의 내지 전혀 없었다 (도 6a 및 6b). rAAV9의 i.d. 전달이 FOP 마우스에서 HO-형성 FAP를 형질도입할 수 있는지 직접 시험하기 위해, ACVR1(R206H)Fl의 조건부 녹-인 모델을 Cre 레콤비나제를 발현하는 rAAC9의 i.d. 주사로 처리하고, 외상-유도된 HO를 마이크로CT에 의해 평가하였다 (도 18c). 대퇴근에서의 ACVR1R206H mRNA의 Cre-매개된 유도를 RT-PCR 분석에 의해 검증하였다 (도 17f). 이는 rAAV9.Vec가 아닌 rAAV9.Cre로 처리된 대퇴근에서의 이소성 골 형성에 상응하며 (도 17g), 이는 골격근에서 HO-형성 FAP로의 rAAV9의 i.d. 전달의 유효성을 입증한다. 마지막으로, 대조군 벡터, amiR-RH6, ACVR1opt, 또는 amiR-RH6.ACVR1opt를 보유하는 rAAV9 벡터를 타목시펜-유도된 Cre 레콤비나제를 발현하는 Acvr1(R206H)Fl;Cre-ERT2 마우스의 경골근 내로 i.d. 주사하고, 경골근에서의 ACVR1R206H 및 ACVR1opt 발현의 녹다운 효율을 검증하였다 (도 18d 및 18e). 외상-유도된 HO는 대조군 AAV 벡터에 비해 치료 AAV 벡터로의 처리에 의해 실질적으로 감소되었고 (도 19d), 이는 ACVR1R206H-특이적 침묵, 유전자 대체, 및 조합 접근법이 모두 젊은 성체 FOP 마우스에서 외상성 HO를 억제하는 데 효과적이었음을 입증한다. Acvr1R206H BMSC의 BMP4-유도된 골형성이 amiR-RH6.ACVR1opt에 의해 영향을 받지 않았기 때문에 (도 19d), 근육 손상/BMP-유도된 HO에 대한 효과는 거의 내지 전혀 없었으며 (도 17i), 이는 외상성 HO에 대한 AAV 벡터의 처리 효과가 HO의 후천성 형태에는 영향을 미치지 않으면서 ACVR1R206H 수용체에 특이적이라는 것을 시사한다.
서열
>서열식별번호: 1; Opt ACVR1 핵산 서열
>서열식별번호: 2; AAV-CBA-opt-ACVR1 핵산 서열
>서열식별번호: 3; AAV-CBA-MBL-opt-ACVR1 핵산 서열
>서열식별번호: 4; AAV-PBP (합성 인트론)-opt-ACVR1 핵산 서열
>서열식별번호: 5; RH1 ami-RNA를 코딩하는 핵산 서열
>서열식별번호: 6; RH2 ami-RNA를 코딩하는 핵산 서열
>서열식별번호: 7; wtACVR1 핵산 서열
>서열식별번호: 8; ACVR1-R206H 핵산 서열
>서열식별번호: 9; ACVR1-optAVCR1 핵산 서열
>서열식별번호: 10; AAVscCB6 (amiR33-ACVR1-A7) EGFP 핵산 서열
>서열식별번호: 11; AAVscCB6 (amiR33-ACVR1-A7-14) EGFP 핵산 서열
>서열식별번호: 12; AAVscCB6 (amiR33-ACVR1-A8) EGFP 핵산 서열
>서열식별번호: 13; AAVscCB6 (amiR33-ACVR1-A8-14) EGFP 핵산 서열
>서열식별번호: 14; AAVscCB6 (amiR33-ACVR1-A9) EGFP 핵산 서열
>서열식별번호: 15; AAVscCB6 (amiR33-ACVR1-A9-14) EGFP 핵산 서열
>서열식별번호: 16; AAVscCB6 (amiR33-ACVR1-A10) EGFP 핵산 서열
>서열식별번호: 17; AAVscCB6 (amiR33-ACVR1-A10-14) EGFP 핵산 서열
>서열식별번호: 18; AAVscCB6 (amiR33-ACVR1-A11) EGFP 핵산 서열
>서열식별번호: 19; AAVscCB6 (amiR33-ACVR1-A11-14) EGFP 핵산 서열
>서열식별번호: 20; AAVscCB6 (amiR33-ACVR1-A12) EGFP 핵산 서열
>서열식별번호: 21; AAVscCB6 (amiR33-ACVR1-A12-14) EGFP 핵산 서열
>서열식별번호: 22; wtACVR1 amiR-센서 플라스미드 핵산 서열
>서열식별번호: 23; ACVR1-R206H amiR-센서 플라스미드 핵산 서열
>서열식별번호: 24; ACVR1-optACVR1 amiR-센서 플라스미드 핵산 서열
>서열식별번호: 25; AAV-CBA (합성 인트론) (amiR-33-ACVR1-A9)-opt-ACVR1
>서열식별번호: 26; AAV-CBA (합성 인트론) (amiR-33-ACVR1-A10)-opt-ACVR1 핵산 서열
>서열식별번호: 27; AAV-CBA (MBL-amiR-ACVR1-A9)-opt-ACVR1 핵산 서열
>서열식별번호: 28; AAV-CBA (MBL-amiR-ACVR1-A10)-opt-ACVR1 핵산 서열
>서열식별번호: 29; AAV-ABE C-말단 sghACVR1 핵산 서열
>서열식별번호: 30; PB2 (NF-kB 프로모터) 핵산 서열
>서열식별번호: 31; BRE 핵산 서열
>서열식별번호: 32; AAV BRE-NFkB-가우시아 핵산 서열
>서열식별번호: 33; AAV CBA-FST-TNFR2-miR122 핵산 서열
>서열식별번호: 34; AAV CBA- miR122 핵산 서열
>서열식별번호: 35; 인간 가용성 IL1Rα 핵산 서열
>서열식별번호: 36; 합성 인트론 핵산 서열
>서열식별번호: 37; MBL 인트론 핵산 서열
>서열식별번호: 38; OPT ACVR1 단백질 서열
>서열식별번호: 39; 서열식별번호: 5에 상응하는 단백질 서열
>서열식별번호: 40; 서열식별번호: 6에 상응하는 단백질 서열
>서열식별번호: 41; 서열식별번호: 7에 상응하는 wtACVR1 단백질 서열
>서열식별번호: 42; 서열식별번호: 8에 상응하는 ACVR1-R206H 단백질 서열
>서열식별번호: 43; sgACVR1 단백질 서열
>서열식별번호: 44; hspCas9 단백질 서열
>서열식별번호: 45; sFST-288 단백질 서열
>서열식별번호: 46; sTNFR2 단백질 서열
>서열식별번호: 47; miR-122 단백질 서열
서열식별번호: 48; miR-208 결합 부위
서열식별번호: 49; pAAVss-CB-PI(MBL-amiRACVR1-A9)-opt-ACVR1-miR-122T.miR-208aT
서열식별번호: 56; RH3 ami-RNA를 코딩하는 핵산 서열
서열식별번호: 57; RH4 ami-RNA를 코딩하는 핵산 서열
서열식별번호: 58; RH5 ami-RNA를 코딩하는 핵산 서열
서열식별번호: 59; RH6 ami-RNA를 코딩하는 핵산 서열
서열식별번호: 60; RH7 ami-RNA를 코딩하는 핵산 서열
서열식별번호: 61; RH8 ami-RNA를 코딩하는 핵산 서열
서열식별번호: 62; RH9 ami-RNA를 코딩하는 핵산 서열
서열식별번호: 63; RH10 ami-RNA를 코딩하는 핵산 서열
서열식별번호: 64; RH11 ami-RNA를 코딩하는 핵산 서열
서열식별번호: 65; RH12 ami-RNA를 코딩하는 핵산 서열
SEQUENCE LISTING
<110> University of Massachusetts
<120> DEVELOPMENT OF NOVEL GENE THERAPEUTICS FOR FIBRODYSPLASIA
OSSIFICANS PROGRESSIVA
<130> U0120.70152WO00
<140> Not Yet Assigned
<141> Concurrently Herewith
<150> US 63/251,822
<151> 2021-10-04
<150> US 63/121,221
<151> 2020-12-03
<160> 65
<170> PatentIn version 3.5
<210> 1
<211> 1530
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 1
atggtcgatg gagtgatgat cctgcctgtc ctgattatga ttgccctgcc cagccccagc 60
atggaagatg aaaaacctaa agtcaaccct aagctgtata tgtgcgtgtg cgagggcctg 120
agctgcggaa acgaggatca ctgcgagggc cagcagtgtt tcagctccct gtccatcaat 180
gacggcttcc acgtgtacca gaagggctgc tttcaggtgt atgagcaggg caagatgacc 240
tgtaagacac caccttcccc aggacaggca gtggagtgct gtcagggcga ttggtgtaac 300
cggaatatca ccgcccagct gccaacaaag ggcaagtctt tccccggcac acagaacttt 360
cacctggaag tgggcctgat catcctgagc gtggtgttcg ccgtgtgcct gctggcatgt 420
ctgctgggag tggccctgag aaagtttaag cggagaaacc aggagcggct gaatccaaga 480
gatgtggagt acggcaccat cgagggcctg atcaccacaa atgtgggcga ctctacactg 540
gccgacctgc tggatcacag ctgcaccagc ggctccggat ctggcctgcc ctttctggtg 600
cagaggaccg tggcccggca gatcaccctg ctggagtgcg tgggcaaggg ccggtacgga 660
gaagtgtgga gaggatcctg gcagggagag aacgtggcag tgaagatctt ctctagccgg 720
gatgagaagt cttggtttag agagacagag ctgtataaca cagtgatgct gaggcacgag 780
aatatcctgg gcttcatcgc ctccgacatg acctctcgcc actcctctac acagctgtgg 840
ctgatcaccc actaccacga gatgggctcc ctgtacgatt acctccagct gaccacactg 900
gacacagtgt cttgcctgcg gatcgtgctg tctatcgcca gcggcctggc acacctgcac 960
atcgagatct ttggaaccca gggcaagcca gcaatcgcac acagagatct gaagtctaag 1020
aacatcctgg tgaagaagaa tggccagtgc tgtatcgccg atctgggcct ggccgtgatg 1080
cacagccagt ccaccaacca gctggacgtg ggcaacaatc ctcgggtggg cacaaagaga 1140
tacatggccc cagaggtgct ggatgagaca atccaggtgg actgcttcga tagctataag 1200
agggtggaca tctgggcctt tggcctggtg ctgtgggagg tggcaaggag gatggtgagc 1260
aacggcatcg tggaggacta caagccaccc ttctatgacg tggtgcctaa tgatccatcc 1320
tttgaggaca tgcgcaaggt ggtgtgcgtg gatcagcaga ggcccaacat ccctaatcgc 1380
tggttcagcg accccaccct gacatccctg gccaagctga tgaaggagtg ttggtatcag 1440
aatcctagcg ccaggctgac cgccctgcgc atcaagaaaa ctctgactaa aatcgacaat 1500
agcctggata aactgaaaac cgactgctga 1530
<210> 2
<211> 6586
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 2
gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt 60
tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac 120
taggggttcc ttgtagttaa tgattaaccc gccatgctac ttatctacca gggtaatggg 180
gatcctctag aactatagct agtcgacatt gattattgac tagttattaa tagtaatcaa 240
ttacggggtc attagttcat agcccatata tggagttccg cgttacataa cttacggtaa 300
atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 360
ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 420
aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 480
tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 540
ctacttggca gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca 600
cgttctgctt cactctcccc atctcccccc cctccccacc cccaattttg tatttattta 660
ttttttaatt attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg 720
gggcggggcg gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc 780
agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 840
aaaagcgaag cgcgcggcgg gcggggagtc gctgcgacgc tgccttcgcc ccgtgccccg 900
ctccgccgcc gcctcgcgcc gcccgccccg gctctgactg accgcgttac tcccacaggt 960
gagcgggcgg gacggccctt ctcctccggg ctgtaattag cgcttggttt aatgacggct 1020
tgtttctttt ctgtggctgc gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg 1080
ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc 1140
cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag 1200
tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg 1260
gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc 1320
ggtcgggctg caaccccccc tgcacccccc tccccgagtt gctgagcacg gcccggcttc 1380
gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg 1440
gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc ggggagggct cgggggaggg 1500
gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca gccattgcct 1560
tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct gtgcggagcc 1620
gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc 1680
cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct 1740
ccctctccag cctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag 1800
ggcggggttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgttca 1860
tgccttcttc tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca 1920
ttttggcaaa gaattccgcc accatggtcg atggagtgat gatcctgcct gtcctgatta 1980
tgattgccct gcccagcccc agcatggaag atgaaaaacc taaagtcaac cctaagctgt 2040
atatgtgcgt gtgcgagggc ctgagctgcg gaaacgagga tcactgcgag ggccagcagt 2100
gtttcagctc cctgtccatc aatgacggct tccacgtgta ccagaagggc tgctttcagg 2160
tgtatgagca gggcaagatg acctgtaaga caccaccttc cccaggacag gcagtggagt 2220
gctgtcaggg cgattggtgt aaccggaata tcaccgccca gctgccaaca aagggcaagt 2280
ctttccccgg cacacagaac tttcacctgg aagtgggcct gatcatcctg agcgtggtgt 2340
tcgccgtgtg cctgctggca tgtctgctgg gagtggccct gagaaagttt aagcggagaa 2400
accaggagcg gctgaatcca agagatgtgg agtacggcac catcgagggc ctgatcacca 2460
caaatgtggg cgactctaca ctggccgacc tgctggatca cagctgcacc agcggctccg 2520
gatctggcct gccctttctg gtgcagagga ccgtggcccg gcagatcacc ctgctggagt 2580
gcgtgggcaa gggccggtac ggagaagtgt ggagaggatc ctggcaggga gagaacgtgg 2640
cagtgaagat cttctctagc cgggatgaga agtcttggtt tagagagaca gagctgtata 2700
acacagtgat gctgaggcac gagaatatcc tgggcttcat cgcctccgac atgacctctc 2760
gccactcctc tacacagctg tggctgatca cccactacca cgagatgggc tccctgtacg 2820
attacctcca gctgaccaca ctggacacag tgtcttgcct gcggatcgtg ctgtctatcg 2880
ccagcggcct ggcacacctg cacatcgaga tctttggaac ccagggcaag ccagcaatcg 2940
cacacagaga tctgaagtct aagaacatcc tggtgaagaa gaatggccag tgctgtatcg 3000
ccgatctggg cctggccgtg atgcacagcc agtccaccaa ccagctggac gtgggcaaca 3060
atcctcgggt gggcacaaag agatacatgg ccccagaggt gctggatgag acaatccagg 3120
tggactgctt cgatagctat aagagggtgg acatctgggc ctttggcctg gtgctgtggg 3180
aggtggcaag gaggatggtg agcaacggca tcgtggagga ctacaagcca cccttctatg 3240
acgtggtgcc taatgatcca tcctttgagg acatgcgcaa ggtggtgtgc gtggatcagc 3300
agaggcccaa catccctaat cgctggttca gcgaccccac cctgacatcc ctggccaagc 3360
tgatgaagga gtgttggtat cagaatccta gcgccaggct gaccgccctg cgcatcaaga 3420
aaactctgac taaaatcgac aatagcctgg ataaactgaa aaccgactgc tgacctgagg 3480
atccgatctt tttccctctg ccaaaaatta tggggacatc atgaagcccc ttgagcatct 3540
gacttctggc taataaagga aatttatttt cattgcaata gtgtgttgga attttttgtg 3600
tctctcactc ggaagcaatt cgttgatctg aatttcgacc acccataata cccattaccc 3660
tggtagataa gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt 3720
tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 3780
gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcagc cttaattaac 3840
ctaattcact ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac 3900
ttaatcgcct tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca 3960
ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga atgggacgcg ccctgtagcg 4020
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 4080
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 4140
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 4200
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 4260
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 4320
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 4380
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 4440
aaatattaac gcttacaatt taggtggcac ttttcgggga aatgtgcgcg gaacccctat 4500
ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata 4560
aatgcttcaa taatattgaa aaaggaagag tatgattgaa caagatggat tgcacgcagg 4620
ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg 4680
ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa 4740
gaccgacctg tccggtgccc tgaatgaact gcaagacgag gcagcgcggc tatcgtggct 4800
ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga 4860
ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc 4920
cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac 4980
ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc 5040
cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact 5100
gttcgccagg ctcaaggcga gcatgcccga cggcgaggat ctcgtcgtga cccatggcga 5160
tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg 5220
ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga 5280
agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga 5340
ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgataac tgtcagacca 5400
agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 5460
ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 5520
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 5580
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 5640
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 5700
tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 5760
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 5820
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 5880
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 5940
acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 6000
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 6060
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 6120
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 6180
ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 6240
taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 6300
cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc 6360
gcgttggccg attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag 6420
tgagcgcaac gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt 6480
tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 6540
cagctatgac catgattacg ccagatttaa ttaaggcctt aattag 6586
<210> 3
<211> 5973
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 3
cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60
ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120
ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180
ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240
agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300
ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360
tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420
atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480
ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540
gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600
cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660
tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840
aagcgaagcg cgcggcgggc gggagcaagc tttcagatcg cctggagacg ccatccacgc 900
tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggccg ggaacggtgc 960
attggaacgc ggattccccg tgccaagagt gacgtaagta ccgcctatag agtctatagg 1020
cccaccccct tggcttctta tgcatgctat actgtttttg gcttggggtc tatacacccc 1080
cgcttcctca tgtttgctgc ccgtgaccag cacgtcaacg attttgtggg cacgggcgac 1140
accgcagtgt agtctgagca gtactcgttg ctgccgcgcg cgccaccaga cataatagct 1200
gacagactaa cagactgttc ctttccatgg gtcttttctg cagtcaccgt cgccgccacc 1260
ggtgaattcc gccaccatgg tcgatggagt gatgatcctg cctgtcctga ttatgattgc 1320
cctgcccagc cccagcatgg aagatgaaaa acctaaagtc aaccctaagc tgtatatgtg 1380
cgtgtgcgag ggcctgagct gcggaaacga ggatcactgc gagggccagc agtgtttcag 1440
ctccctgtcc atcaatgacg gcttccacgt gtaccagaag ggctgctttc aggtgtatga 1500
gcagggcaag atgacctgta agacaccacc ttccccagga caggcagtgg agtgctgtca 1560
gggcgattgg tgtaaccgga atatcaccgc ccagctgcca acaaagggca agtctttccc 1620
cggcacacag aactttcacc tggaagtggg cctgatcatc ctgagcgtgg tgttcgccgt 1680
gtgcctgctg gcatgtctgc tgggagtggc cctgagaaag tttaagcgga gaaaccagga 1740
gcggctgaat ccaagagatg tggagtacgg caccatcgag ggcctgatca ccacaaatgt 1800
gggcgactct acactggccg acctgctgga tcacagctgc accagcggct ccggatctgg 1860
cctgcccttt ctggtgcaga ggaccgtggc ccggcagatc accctgctgg agtgcgtggg 1920
caagggccgg tacggagaag tgtggagagg atcctggcag ggagagaacg tggcagtgaa 1980
gatcttctct agccgggatg agaagtcttg gtttagagag acagagctgt ataacacagt 2040
gatgctgagg cacgagaata tcctgggctt catcgcctcc gacatgacct ctcgccactc 2100
ctctacacag ctgtggctga tcacccacta ccacgagatg ggctccctgt acgattacct 2160
ccagctgacc acactggaca cagtgtcttg cctgcggatc gtgctgtcta tcgccagcgg 2220
cctggcacac ctgcacatcg agatctttgg aacccagggc aagccagcaa tcgcacacag 2280
agatctgaag tctaagaaca tcctggtgaa gaagaatggc cagtgctgta tcgccgatct 2340
gggcctggcc gtgatgcaca gccagtccac caaccagctg gacgtgggca acaatcctcg 2400
ggtgggcaca aagagataca tggccccaga ggtgctggat gagacaatcc aggtggactg 2460
cttcgatagc tataagaggg tggacatctg ggcctttggc ctggtgctgt gggaggtggc 2520
aaggaggatg gtgagcaacg gcatcgtgga ggactacaag ccacccttct atgacgtggt 2580
gcctaatgat ccatcctttg aggacatgcg caaggtggtg tgcgtggatc agcagaggcc 2640
caacatccct aatcgctggt tcagcgaccc caccctgaca tccctggcca agctgatgaa 2700
ggagtgttgg tatcagaatc ctagcgccag gctgaccgcc ctgcgcatca agaaaactct 2760
gactaaaatc gacaatagcc tggataaact gaaaaccgac tgctgacctg aggatccgat 2820
ctttttccct ctgccaaaaa ttatggggac atcatgaagc cccttgagca tctgacttct 2880
ggctaataaa ggaaatttat tttcattgca atagtgtgtt ggaatttttt gtgtctctca 2940
ctcggaagca attcgttgat ctgaatttcg accacccata atacccatta ccctggtaga 3000
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 3060
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 3120
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 3180
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 3240
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 3300
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 3360
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 3420
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 3480
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 3540
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 3600
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 3660
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 3720
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3780
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3840
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3900
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3960
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 4020
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 4080
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 4140
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 4200
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 4260
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 4320
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 4380
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 4440
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 4500
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 4560
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 4620
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 4680
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 4740
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4800
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4860
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4920
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4980
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 5040
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 5100
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 5160
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 5220
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 5280
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 5340
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 5400
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 5460
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 5520
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 5580
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 5640
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 5700
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 5760
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5820
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5880
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5940
tatgaccatg attacgccag atttaattaa ggc 5973
<210> 4
<211> 5814
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 4
cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60
ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120
ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180
ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240
agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300
ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360
tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420
atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480
ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540
gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600
cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660
tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840
aagcgaagcg cgcggcgggc gggagcacca ccgcggtggc ggccctagag tcgatcgagg 900
aactgaaaaa ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc 960
cggatccggt ggtggtgcaa atcaaagaac tgctcctcag tggatgttgc ctttacttct 1020
aggcctgtac ggaagtgtta cttctgctct aaaagctgcg gaattgtacc cgcggccgat 1080
ccaccggtga attccgccac catggtcgat ggagtgatga tcctgcctgt cctgattatg 1140
attgccctgc ccagccccag catggaagat gaaaaaccta aagtcaaccc taagctgtat 1200
atgtgcgtgt gcgagggcct gagctgcgga aacgaggatc actgcgaggg ccagcagtgt 1260
ttcagctccc tgtccatcaa tgacggcttc cacgtgtacc agaagggctg ctttcaggtg 1320
tatgagcagg gcaagatgac ctgtaagaca ccaccttccc caggacaggc agtggagtgc 1380
tgtcagggcg attggtgtaa ccggaatatc accgcccagc tgccaacaaa gggcaagtct 1440
ttccccggca cacagaactt tcacctggaa gtgggcctga tcatcctgag cgtggtgttc 1500
gccgtgtgcc tgctggcatg tctgctggga gtggccctga gaaagtttaa gcggagaaac 1560
caggagcggc tgaatccaag agatgtggag tacggcacca tcgagggcct gatcaccaca 1620
aatgtgggcg actctacact ggccgacctg ctggatcaca gctgcaccag cggctccgga 1680
tctggcctgc cctttctggt gcagaggacc gtggcccggc agatcaccct gctggagtgc 1740
gtgggcaagg gccggtacgg agaagtgtgg agaggatcct ggcagggaga gaacgtggca 1800
gtgaagatct tctctagccg ggatgagaag tcttggttta gagagacaga gctgtataac 1860
acagtgatgc tgaggcacga gaatatcctg ggcttcatcg cctccgacat gacctctcgc 1920
cactcctcta cacagctgtg gctgatcacc cactaccacg agatgggctc cctgtacgat 1980
tacctccagc tgaccacact ggacacagtg tcttgcctgc ggatcgtgct gtctatcgcc 2040
agcggcctgg cacacctgca catcgagatc tttggaaccc agggcaagcc agcaatcgca 2100
cacagagatc tgaagtctaa gaacatcctg gtgaagaaga atggccagtg ctgtatcgcc 2160
gatctgggcc tggccgtgat gcacagccag tccaccaacc agctggacgt gggcaacaat 2220
cctcgggtgg gcacaaagag atacatggcc ccagaggtgc tggatgagac aatccaggtg 2280
gactgcttcg atagctataa gagggtggac atctgggcct ttggcctggt gctgtgggag 2340
gtggcaagga ggatggtgag caacggcatc gtggaggact acaagccacc cttctatgac 2400
gtggtgccta atgatccatc ctttgaggac atgcgcaagg tggtgtgcgt ggatcagcag 2460
aggcccaaca tccctaatcg ctggttcagc gaccccaccc tgacatccct ggccaagctg 2520
atgaaggagt gttggtatca gaatcctagc gccaggctga ccgccctgcg catcaagaaa 2580
actctgacta aaatcgacaa tagcctggat aaactgaaaa ccgactgctg acctgagggc 2640
ggccgcgtcg acggatccga tctttttccc tctgccaaaa attatgggga catcatgaag 2700
ccccttgagc atctgacttc tggctaataa aggaaattta ttttcattgc aatagtgtgt 2760
tggaattttt tgtgtctctc actcggaagc aattcgttga tctgaatttc gaccacccat 2820
aatacccatt accctggtag ataagtagca tggcgggtta atcattaact acaaggaacc 2880
cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg aggccgggcg 2940
accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg 3000
cagccttaat taacctaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc 3060
tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag 3120
cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggga 3180
cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc 3240
tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac 3300
gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag 3360
tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac gtagtgggcc 3420
atcgccctga tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg 3480
actcttgttc caaactggaa caacactcaa ccctatctcg gtctattctt ttgatttata 3540
agggattttg ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa 3600
cgcgaatttt aacaaaatat taacgcttac aatttaggtg gcacttttcg gggaaatgtg 3660
cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 3720
caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 3780
ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 3840
gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 3900
gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 3960
atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 4020
caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 4080
gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 4140
accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 4200
ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 4260
gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 4320
acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 4380
atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 4440
ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca 4500
gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 4560
gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 4620
tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 4680
taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 4740
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 4800
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 4860
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 4920
agagcgcaga taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag 4980
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 5040
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 5100
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 5160
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 5220
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 5280
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 5340
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 5400
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta 5460
tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc 5520
agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc 5580
aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc 5640
gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca 5700
ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa 5760
caatttcaca caggaaacag ctatgaccat gattacgcca gatttaatta aggc 5814
<210> 5
<211> 318
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 5
gtcttttatt tcaggtccca gatctagggc tctgcgtttg ctccaggtag tccgctgctc 60
ccttgggcct gggcccactg acagccctgg tgcctctggc cggctgcaca cctcctggcg 120
ggcagctgtg agtgtaatct ggtgagccac ttgttctggc aatacctgag tggctctgcg 180
gattacactc acggaggcct gccctgactg cccacggtgc cgtggccaaa gaggatctaa 240
gggcaccgct gagggcctac ctaaccatcg tggggaataa ggacagtgtc acccctgcag 300
gggatccggt ggtggtgc 318
<210> 6
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 6
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgagtgt aagctggtga 120
gccacttgtt ctggcaatac ctgagtggct ctgcggctta cactcacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 7
<211> 48
<212> DNA
<213> Homo sapiens
<400> 7
tcgagggtac aaagaacagt ggctcgccag attacactgt tggagtgc 48
<210> 8
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 8
tcgagggtac aaagaacagt ggctcaccag attacactgt tggagtgc 48
<210> 9
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 9
tcgagggtgc agaggaccgt ggcccggcag atcaccctgc tggagtgc 48
<210> 10
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 10
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgagtgtaat ctggtgagcc 960
acttgttctg gcaatacctg agtggctctg cggattacac tcacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 11
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 11
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgagtgtaag ctggtgagcc 960
acttgttctg gcaatacctg agtggctctg cggcttacac tcacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 12
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 12
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtgtaatc tggtgagcca 960
ctgtgttctg gcaatacctg cagtggctgt ctagattaca ccacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 13
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 13
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtgtaagc tggtgagcca 960
ctgtgttctg gcaatacctg cagtggctgt ctagcttaca ccacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 14
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 14
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtgtaatct ggtgagccac 960
tgttgttctg gcaatacctg acagtggcag atcagattac acacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 15
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 15
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtgtaagct ggtgagccac 960
tgttgttctg gcaatacctg acagtggcag atcagcttac acacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 16
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 16
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtaatctg gtgagccact 960
gtttgttctg gcaatacctg aacagtggga cgccagatta ccacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 17
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 17
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtaagctg gtgagccact 960
gtttgttctg gcaatacctg aacagtggga cgccagctta ccacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 18
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 18
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtaatctgg tgagccactg 960
ttctgttctg gcaatacctg gaacagtgcg ttaccagatt acacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 19
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 19
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtaagctgg tgagccactg 960
ttctgttctg gcaatacctg gaacagtgcg ttaccagctt acacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 20
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 20
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgaatctggt gagccactgt 960
tcttgttctg gcaatacctg agaacagtcc cccaccagat tcacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 21
<211> 5203
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 21
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgtagcc atgctctagg 120
aagatcaatt cggtacaatt cacgcgtcga cattgattat tgactagctc tggtcgttac 180
ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc cattgacgtc 240
aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac gtcaatgggt 300
ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata tgccaagtac 360
gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc agtacatgac 420
cttatgggac tttcctactt ggcagtacat ctactcgagg ccacgttctg cttcactctc 480
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 540
gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggcctaga gtcgacgagg aactgaaaaa 780
ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc cagatctagg 840
gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac tgacagccct 900
ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgaagctggt gagccactgt 960
tcttgttctg gcaatacctg agaacagtcc cccaccagct tcacggaggc ctgccctgac 1020
tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct acctaaccat 1080
cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc aaatcaaaga 1140
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 1200
ctaaaagctg cggaattgta cccgcggccg atccaccggt cgccaccatg gtgagcaagg 1260
gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg 1320
gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc 1380
tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc 1440
tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct 1500
tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg 1560
gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg 1620
agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca 1680
actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga 1740
acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc 1800
agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc 1860
agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg 1920
tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaaagc ggccatcaag 1980
cttatcgata ccgtcgacta gagctcgctg atcagcctcg actgtgcctt ctagttgcca 2040
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 2100
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 2160
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca attaggtaga 2220
taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg agttggccac 2280
tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc 2340
gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agccttaatt aacctaattc 2400
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 2460
ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 2520
cccttcccaa cagttgcgca gcctgaatgg cgaatgggac gcgccctgta gcggcgcatt 2580
aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 2640
gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 2700
agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 2760
caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 2820
tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 2880
aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc cgatttcggc 2940
ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 3000
aacgcttaca atttaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta 3060
tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt 3120
caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc 3180
ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa 3240
gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt 3300
aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt 3360
ctgctatgtg gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc 3420
atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg 3480
gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg 3540
gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac 3600
atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca 3660
aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta 3720
actggcgaac tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat 3780
aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa 3840
tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag 3900
ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat 3960
agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt 4020
tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg 4080
aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga 4140
gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta 4200
atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa 4260
gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact 4320
gttcttctag tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca 4380
tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt 4440
accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg 4500
ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag 4560
cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta 4620
agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat 4680
ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg 4740
tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc 4800
ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac 4860
cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc 4920
gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt 4980
tggccgattc attaatgcag ctggcacgac aggtttcccg actggaaagc gggcagtgag 5040
cgcaacgcaa ttaatgtgag ttagctcact cattaggcac cccaggcttt acactttatg 5100
cttccggctc gtatgttgtg tggaattgtg agcggataac aatttcacac aggaaacagc 5160
tatgaccatg attacgccag atttaattaa ggccttaatt agg 5203
<210> 22
<211> 6290
<212> DNA
<213> Homo sapiens
<400> 22
agatctgcgc agcaccatgg cctgaaataa cctctgaaag aggaacttgg ttaggtacct 60
tctgaggcgg aaagaaccag ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 120
gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 180
gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 240
caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 300
attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctcgg 360
cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 420
agcttgattc ttctgacaca acagtctcga acttaagctg cagaagttgg tcgtgaggca 480
ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag aaactgggct 540
tgtcgagaca gagaagactc ttgcgtttct gataggcacc tattggtctt actgacatcc 600
actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct taaggctaga 660
gtacttaata cgactcacta taggctagcc accatggctt ccaaggtgta cgaccccgag 720
caacgcaaac gcatgatcac tgggcctcag tggtgggctc gctgcaagca aatgaacgtg 780
ctggactcct tcatcaacta ctatgattcc gagaagcacg ccgagaacgc cgtgattttt 840
ctgcatggta acgctgcctc cagctacctg tggaggcacg tcgtgcctca catcgagccc 900
gtggctagat gcatcatccc tgatctgatc ggaatgggta agtccggcaa gagcgggaat 960
ggctcatatc gcctcctgga tcactacaag tacctcaccg cttggttcga gctgctgaac 1020
cttccaaaga aaatcatctt tgtgggccac gactgggggg cttgtctggc ctttcactac 1080
tcctacgagc accaagacaa gatcaaggcc atcgtccatg ctgagagtgt cgtggacgtg 1140
atcgagtcct gggacgagtg gcctgacatc gaggaggata tcgccctgat caagagcgaa 1200
gagggcgaga aaatggtgct tgagaataac ttcttcgtcg agaccatgct cccaagcaag 1260
atcatgcgga aactggagcc tgaggagttc gctgcctacc tggagccatt caaggagaag 1320
ggcgaggtta gacggcctac cctctcctgg cctcgcgaga tccctctcgt taagggaggc 1380
aagcccgacg tcgtccagat tgtccgcaac tacaacgcct accttcgggc cagcgacgat 1440
ctgcctaaga tgttcatcga gtccgaccct gggttctttt ccaacgctat tgtcgaggga 1500
gctaagaagt tccctaacac cgagttcgtg aaggtgaagg gcctccactt cagccaggag 1560
gacgctccag atgaaatggg taagtacatc aagagcttcg tggagcgcgt gctgaagaac 1620
gagcagtaat tctaggcgat cgctcgaggg tacaaagaac agtggctcgc cagattacac 1680
tgttggagtg cggccgctgg ccgcaataaa atatctttat tttcattaca tctgtgtgtt 1740
ggttttttgt gtgaggatct aaatgagtct tcggacctcg cgggggccgc ttaagcggtg 1800
gttagggttt gtctgacgcg gggggagggg gaaggaacga aacactctca ttcggaggcg 1860
gctcggggtt tggtcttggt ggccacgggc acgcagaaga gcgccgcgat cctcttaagc 1920
acccccccgc cctccgtgga ggcgggggtt tggtcggcgg gtggtaactg gcgggccgct 1980
gactcgggcg ggtcgcgcgc cccagagtgt gaccttttcg gtctgctcgc agacccccgg 2040
gcggcgccgc cgcggcggcg acgggctcgc tgggtcctag gctccatggg gaccgtatac 2100
gtggacaggc tctggagcat ccgcacgact gcggtgatat taccggagac cttctgcggg 2160
acgagccggg tcacgcggct gacgcggagc gtccgttggg cgacaaacac caggacgggg 2220
cacaggtaca ctatcttgtc acccggaggc gcgagggact gcaggagctt cagggagtgg 2280
cgcagctgct tcatccccgt ggcccgttgc tcgcgtttgc tggcggtgtc cccggaagaa 2340
atatatttgc atgtctttag ttctatgatg acacaaaccc cgcccagcgt cttgtcattg 2400
gcgaattcga acacgcagat gcagtcgggg cggcgcggtc ccaggtccac ttcgcatatt 2460
aaggtgacgc gtgtggcctc gaacaccgag cgaccctgca gcgacccgct taaaagcttg 2520
gcattccggt actgttggta aagccaccat ggccgatgct aagaacatta agaagggccc 2580
tgctcccttc taccctctgg aggatggcac cgctggcgag cagctgcaca aggccatgaa 2640
gaggtatgcc ctggtgcctg gcaccattgc cttcaccgat gcccacattg aggtggacat 2700
cacctatgcc gagtacttcg agatgtctgt gcgcctggcc gaggccatga agaggtacgg 2760
cctgaacacc aaccaccgca tcgtggtgtg ctctgagaac tctctgcagt tcttcatgcc 2820
agtgctgggc gccctgttca tcggagtggc cgtggcccct gctaacgaca tttacaacga 2880
gcgcgagctg ctgaacagca tgggcatttc tcagcctacc gtggtgttcg tgtctaagaa 2940
gggcctgcag aagatcctga acgtgcagaa gaagctgcct atcatccaga agatcatcat 3000
catggactct aagaccgact accagggctt ccagagcatg tacacattcg tgacatctca 3060
tctgcctcct ggcttcaacg agtacgactt cgtgccagag tctttcgaca gggacaaaac 3120
cattgccctg atcatgaaca gctctgggtc taccggcctg cctaagggcg tggccctgcc 3180
tcatcgcacc gcctgtgtgc gcttctctca cgcccgcgac cctattttcg gcaaccagat 3240
catccccgac accgctattc tgagcgtggt gccattccac cacggcttcg gcatgttcac 3300
caccctgggc tacctgattt gcggctttcg ggtggtgctg atgtaccgct tcgaggagga 3360
gctgttcctg cgcagcctgc aagactacaa aattcagtct gccctgctgg tgccaaccct 3420
gttcagcttc ttcgctaaga gcaccctgat cgacaagtac gacctgtcta acctgcacga 3480
gattgcctct ggcggcgccc cactgtctaa ggaggtgggc gaagccgtgg ccaagcgctt 3540
tcatctgcca ggcatccgcc agggctacgg cctgaccgag acaaccagcg ccattctgat 3600
taccccagag ggcgacgaca agcctggcgc cgtgggcaag gtggtgccat tcttcgaggc 3660
caaggtggtg gacctggaca ccggcaagac cctgggagtg aaccagcgcg gcgagctgtg 3720
tgtgcgcggc cctatgatta tgtccggcta cgtgaataac cctgaggcca caaacgccct 3780
gatcgacaag gacggctggc tgcactctgg cgacattgcc tactgggacg aggacgagca 3840
cttcttcatc gtggaccgcc tgaagtctct gatcaagtac aagggctacc aggtggcccc 3900
agccgagctg gagtctatcc tgctgcagca ccctaacatt ttcgacgccg gagtggccgg 3960
cctgcccgac gacgatgccg gcgagctgcc tgccgccgtc gtcgtgctgg aacacggcaa 4020
gaccatgacc gagaaggaga tcgtggacta tgtggccagc caggtgacaa ccgccaagaa 4080
gctgcgcggc ggagtggtgt tcgtggacga ggtgcccaag ggcctgaccg gcaagctgga 4140
cgcccgcaag atccgcgaga tcctgatcaa ggctaagaaa ggcggcaaga tcgccgtgta 4200
ataattctag agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga 4260
gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 4320
tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 4380
cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 4440
cctctacaaa tgtggtaaaa tcgataagga tccaggtggc acttttcggg gaaatgtgcg 4500
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 4560
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 4620
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 4680
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 4740
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 4800
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 4860
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 4920
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 4980
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 5040
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 5100
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 5160
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 5220
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 5280
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 5340
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 5400
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 5460
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 5520
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 5580
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 5640
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 5700
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 5760
agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 5820
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 5880
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 5940
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 6000
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 6060
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 6120
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 6180
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 6240
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atggctcgac 6290
<210> 23
<211> 6290
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 23
agatctgcgc agcaccatgg cctgaaataa cctctgaaag aggaacttgg ttaggtacct 60
tctgaggcgg aaagaaccag ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 120
gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 180
gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 240
caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 300
attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctcgg 360
cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 420
agcttgattc ttctgacaca acagtctcga acttaagctg cagaagttgg tcgtgaggca 480
ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag aaactgggct 540
tgtcgagaca gagaagactc ttgcgtttct gataggcacc tattggtctt actgacatcc 600
actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct taaggctaga 660
gtacttaata cgactcacta taggctagcc accatggctt ccaaggtgta cgaccccgag 720
caacgcaaac gcatgatcac tgggcctcag tggtgggctc gctgcaagca aatgaacgtg 780
ctggactcct tcatcaacta ctatgattcc gagaagcacg ccgagaacgc cgtgattttt 840
ctgcatggta acgctgcctc cagctacctg tggaggcacg tcgtgcctca catcgagccc 900
gtggctagat gcatcatccc tgatctgatc ggaatgggta agtccggcaa gagcgggaat 960
ggctcatatc gcctcctgga tcactacaag tacctcaccg cttggttcga gctgctgaac 1020
cttccaaaga aaatcatctt tgtgggccac gactgggggg cttgtctggc ctttcactac 1080
tcctacgagc accaagacaa gatcaaggcc atcgtccatg ctgagagtgt cgtggacgtg 1140
atcgagtcct gggacgagtg gcctgacatc gaggaggata tcgccctgat caagagcgaa 1200
gagggcgaga aaatggtgct tgagaataac ttcttcgtcg agaccatgct cccaagcaag 1260
atcatgcgga aactggagcc tgaggagttc gctgcctacc tggagccatt caaggagaag 1320
ggcgaggtta gacggcctac cctctcctgg cctcgcgaga tccctctcgt taagggaggc 1380
aagcccgacg tcgtccagat tgtccgcaac tacaacgcct accttcgggc cagcgacgat 1440
ctgcctaaga tgttcatcga gtccgaccct gggttctttt ccaacgctat tgtcgaggga 1500
gctaagaagt tccctaacac cgagttcgtg aaggtgaagg gcctccactt cagccaggag 1560
gacgctccag atgaaatggg taagtacatc aagagcttcg tggagcgcgt gctgaagaac 1620
gagcagtaat tctaggcgat cgctcgaggg tacaaagaac agtggctcac cagattacac 1680
tgttggagtg cggccgctgg ccgcaataaa atatctttat tttcattaca tctgtgtgtt 1740
ggttttttgt gtgaggatct aaatgagtct tcggacctcg cgggggccgc ttaagcggtg 1800
gttagggttt gtctgacgcg gggggagggg gaaggaacga aacactctca ttcggaggcg 1860
gctcggggtt tggtcttggt ggccacgggc acgcagaaga gcgccgcgat cctcttaagc 1920
acccccccgc cctccgtgga ggcgggggtt tggtcggcgg gtggtaactg gcgggccgct 1980
gactcgggcg ggtcgcgcgc cccagagtgt gaccttttcg gtctgctcgc agacccccgg 2040
gcggcgccgc cgcggcggcg acgggctcgc tgggtcctag gctccatggg gaccgtatac 2100
gtggacaggc tctggagcat ccgcacgact gcggtgatat taccggagac cttctgcggg 2160
acgagccggg tcacgcggct gacgcggagc gtccgttggg cgacaaacac caggacgggg 2220
cacaggtaca ctatcttgtc acccggaggc gcgagggact gcaggagctt cagggagtgg 2280
cgcagctgct tcatccccgt ggcccgttgc tcgcgtttgc tggcggtgtc cccggaagaa 2340
atatatttgc atgtctttag ttctatgatg acacaaaccc cgcccagcgt cttgtcattg 2400
gcgaattcga acacgcagat gcagtcgggg cggcgcggtc ccaggtccac ttcgcatatt 2460
aaggtgacgc gtgtggcctc gaacaccgag cgaccctgca gcgacccgct taaaagcttg 2520
gcattccggt actgttggta aagccaccat ggccgatgct aagaacatta agaagggccc 2580
tgctcccttc taccctctgg aggatggcac cgctggcgag cagctgcaca aggccatgaa 2640
gaggtatgcc ctggtgcctg gcaccattgc cttcaccgat gcccacattg aggtggacat 2700
cacctatgcc gagtacttcg agatgtctgt gcgcctggcc gaggccatga agaggtacgg 2760
cctgaacacc aaccaccgca tcgtggtgtg ctctgagaac tctctgcagt tcttcatgcc 2820
agtgctgggc gccctgttca tcggagtggc cgtggcccct gctaacgaca tttacaacga 2880
gcgcgagctg ctgaacagca tgggcatttc tcagcctacc gtggtgttcg tgtctaagaa 2940
gggcctgcag aagatcctga acgtgcagaa gaagctgcct atcatccaga agatcatcat 3000
catggactct aagaccgact accagggctt ccagagcatg tacacattcg tgacatctca 3060
tctgcctcct ggcttcaacg agtacgactt cgtgccagag tctttcgaca gggacaaaac 3120
cattgccctg atcatgaaca gctctgggtc taccggcctg cctaagggcg tggccctgcc 3180
tcatcgcacc gcctgtgtgc gcttctctca cgcccgcgac cctattttcg gcaaccagat 3240
catccccgac accgctattc tgagcgtggt gccattccac cacggcttcg gcatgttcac 3300
caccctgggc tacctgattt gcggctttcg ggtggtgctg atgtaccgct tcgaggagga 3360
gctgttcctg cgcagcctgc aagactacaa aattcagtct gccctgctgg tgccaaccct 3420
gttcagcttc ttcgctaaga gcaccctgat cgacaagtac gacctgtcta acctgcacga 3480
gattgcctct ggcggcgccc cactgtctaa ggaggtgggc gaagccgtgg ccaagcgctt 3540
tcatctgcca ggcatccgcc agggctacgg cctgaccgag acaaccagcg ccattctgat 3600
taccccagag ggcgacgaca agcctggcgc cgtgggcaag gtggtgccat tcttcgaggc 3660
caaggtggtg gacctggaca ccggcaagac cctgggagtg aaccagcgcg gcgagctgtg 3720
tgtgcgcggc cctatgatta tgtccggcta cgtgaataac cctgaggcca caaacgccct 3780
gatcgacaag gacggctggc tgcactctgg cgacattgcc tactgggacg aggacgagca 3840
cttcttcatc gtggaccgcc tgaagtctct gatcaagtac aagggctacc aggtggcccc 3900
agccgagctg gagtctatcc tgctgcagca ccctaacatt ttcgacgccg gagtggccgg 3960
cctgcccgac gacgatgccg gcgagctgcc tgccgccgtc gtcgtgctgg aacacggcaa 4020
gaccatgacc gagaaggaga tcgtggacta tgtggccagc caggtgacaa ccgccaagaa 4080
gctgcgcggc ggagtggtgt tcgtggacga ggtgcccaag ggcctgaccg gcaagctgga 4140
cgcccgcaag atccgcgaga tcctgatcaa ggctaagaaa ggcggcaaga tcgccgtgta 4200
ataattctag agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga 4260
gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 4320
tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 4380
cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 4440
cctctacaaa tgtggtaaaa tcgataagga tccaggtggc acttttcggg gaaatgtgcg 4500
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 4560
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 4620
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 4680
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 4740
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 4800
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 4860
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 4920
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 4980
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 5040
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 5100
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 5160
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 5220
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 5280
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 5340
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 5400
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 5460
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 5520
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 5580
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 5640
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 5700
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 5760
agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 5820
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 5880
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 5940
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 6000
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 6060
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 6120
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 6180
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 6240
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atggctcgac 6290
<210> 24
<211> 6290
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 24
agatctgcgc agcaccatgg cctgaaataa cctctgaaag aggaacttgg ttaggtacct 60
tctgaggcgg aaagaaccag ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 120
gctccccagc aggcagaagt atgcaaagca tgcatctcaa ttagtcagca accaggtgtg 180
gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag catgcatctc aattagtcag 240
caaccatagt cccgccccta actccgccca tcccgcccct aactccgccc agttccgccc 300
attctccgcc ccatggctga ctaatttttt ttatttatgc agaggccgag gccgcctcgg 360
cctctgagct attccagaag tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa 420
agcttgattc ttctgacaca acagtctcga acttaagctg cagaagttgg tcgtgaggca 480
ctgggcaggt aagtatcaag gttacaagac aggtttaagg agaccaatag aaactgggct 540
tgtcgagaca gagaagactc ttgcgtttct gataggcacc tattggtctt actgacatcc 600
actttgcctt tctctccaca ggtgtccact cccagttcaa ttacagctct taaggctaga 660
gtacttaata cgactcacta taggctagcc accatggctt ccaaggtgta cgaccccgag 720
caacgcaaac gcatgatcac tgggcctcag tggtgggctc gctgcaagca aatgaacgtg 780
ctggactcct tcatcaacta ctatgattcc gagaagcacg ccgagaacgc cgtgattttt 840
ctgcatggta acgctgcctc cagctacctg tggaggcacg tcgtgcctca catcgagccc 900
gtggctagat gcatcatccc tgatctgatc ggaatgggta agtccggcaa gagcgggaat 960
ggctcatatc gcctcctgga tcactacaag tacctcaccg cttggttcga gctgctgaac 1020
cttccaaaga aaatcatctt tgtgggccac gactgggggg cttgtctggc ctttcactac 1080
tcctacgagc accaagacaa gatcaaggcc atcgtccatg ctgagagtgt cgtggacgtg 1140
atcgagtcct gggacgagtg gcctgacatc gaggaggata tcgccctgat caagagcgaa 1200
gagggcgaga aaatggtgct tgagaataac ttcttcgtcg agaccatgct cccaagcaag 1260
atcatgcgga aactggagcc tgaggagttc gctgcctacc tggagccatt caaggagaag 1320
ggcgaggtta gacggcctac cctctcctgg cctcgcgaga tccctctcgt taagggaggc 1380
aagcccgacg tcgtccagat tgtccgcaac tacaacgcct accttcgggc cagcgacgat 1440
ctgcctaaga tgttcatcga gtccgaccct gggttctttt ccaacgctat tgtcgaggga 1500
gctaagaagt tccctaacac cgagttcgtg aaggtgaagg gcctccactt cagccaggag 1560
gacgctccag atgaaatggg taagtacatc aagagcttcg tggagcgcgt gctgaagaac 1620
gagcagtaat tctaggcgat cgctcgaggg tgcagaggac cgtggcccgg cagatcaccc 1680
tgctggagtg cggccgctgg ccgcaataaa atatctttat tttcattaca tctgtgtgtt 1740
ggttttttgt gtgaggatct aaatgagtct tcggacctcg cgggggccgc ttaagcggtg 1800
gttagggttt gtctgacgcg gggggagggg gaaggaacga aacactctca ttcggaggcg 1860
gctcggggtt tggtcttggt ggccacgggc acgcagaaga gcgccgcgat cctcttaagc 1920
acccccccgc cctccgtgga ggcgggggtt tggtcggcgg gtggtaactg gcgggccgct 1980
gactcgggcg ggtcgcgcgc cccagagtgt gaccttttcg gtctgctcgc agacccccgg 2040
gcggcgccgc cgcggcggcg acgggctcgc tgggtcctag gctccatggg gaccgtatac 2100
gtggacaggc tctggagcat ccgcacgact gcggtgatat taccggagac cttctgcggg 2160
acgagccggg tcacgcggct gacgcggagc gtccgttggg cgacaaacac caggacgggg 2220
cacaggtaca ctatcttgtc acccggaggc gcgagggact gcaggagctt cagggagtgg 2280
cgcagctgct tcatccccgt ggcccgttgc tcgcgtttgc tggcggtgtc cccggaagaa 2340
atatatttgc atgtctttag ttctatgatg acacaaaccc cgcccagcgt cttgtcattg 2400
gcgaattcga acacgcagat gcagtcgggg cggcgcggtc ccaggtccac ttcgcatatt 2460
aaggtgacgc gtgtggcctc gaacaccgag cgaccctgca gcgacccgct taaaagcttg 2520
gcattccggt actgttggta aagccaccat ggccgatgct aagaacatta agaagggccc 2580
tgctcccttc taccctctgg aggatggcac cgctggcgag cagctgcaca aggccatgaa 2640
gaggtatgcc ctggtgcctg gcaccattgc cttcaccgat gcccacattg aggtggacat 2700
cacctatgcc gagtacttcg agatgtctgt gcgcctggcc gaggccatga agaggtacgg 2760
cctgaacacc aaccaccgca tcgtggtgtg ctctgagaac tctctgcagt tcttcatgcc 2820
agtgctgggc gccctgttca tcggagtggc cgtggcccct gctaacgaca tttacaacga 2880
gcgcgagctg ctgaacagca tgggcatttc tcagcctacc gtggtgttcg tgtctaagaa 2940
gggcctgcag aagatcctga acgtgcagaa gaagctgcct atcatccaga agatcatcat 3000
catggactct aagaccgact accagggctt ccagagcatg tacacattcg tgacatctca 3060
tctgcctcct ggcttcaacg agtacgactt cgtgccagag tctttcgaca gggacaaaac 3120
cattgccctg atcatgaaca gctctgggtc taccggcctg cctaagggcg tggccctgcc 3180
tcatcgcacc gcctgtgtgc gcttctctca cgcccgcgac cctattttcg gcaaccagat 3240
catccccgac accgctattc tgagcgtggt gccattccac cacggcttcg gcatgttcac 3300
caccctgggc tacctgattt gcggctttcg ggtggtgctg atgtaccgct tcgaggagga 3360
gctgttcctg cgcagcctgc aagactacaa aattcagtct gccctgctgg tgccaaccct 3420
gttcagcttc ttcgctaaga gcaccctgat cgacaagtac gacctgtcta acctgcacga 3480
gattgcctct ggcggcgccc cactgtctaa ggaggtgggc gaagccgtgg ccaagcgctt 3540
tcatctgcca ggcatccgcc agggctacgg cctgaccgag acaaccagcg ccattctgat 3600
taccccagag ggcgacgaca agcctggcgc cgtgggcaag gtggtgccat tcttcgaggc 3660
caaggtggtg gacctggaca ccggcaagac cctgggagtg aaccagcgcg gcgagctgtg 3720
tgtgcgcggc cctatgatta tgtccggcta cgtgaataac cctgaggcca caaacgccct 3780
gatcgacaag gacggctggc tgcactctgg cgacattgcc tactgggacg aggacgagca 3840
cttcttcatc gtggaccgcc tgaagtctct gatcaagtac aagggctacc aggtggcccc 3900
agccgagctg gagtctatcc tgctgcagca ccctaacatt ttcgacgccg gagtggccgg 3960
cctgcccgac gacgatgccg gcgagctgcc tgccgccgtc gtcgtgctgg aacacggcaa 4020
gaccatgacc gagaaggaga tcgtggacta tgtggccagc caggtgacaa ccgccaagaa 4080
gctgcgcggc ggagtggtgt tcgtggacga ggtgcccaag ggcctgaccg gcaagctgga 4140
cgcccgcaag atccgcgaga tcctgatcaa ggctaagaaa ggcggcaaga tcgccgtgta 4200
ataattctag agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga 4260
gtttggacaa accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga 4320
tgctattgct ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg 4380
cattcatttt atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa 4440
cctctacaaa tgtggtaaaa tcgataagga tccaggtggc acttttcggg gaaatgtgcg 4500
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 4560
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 4620
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 4680
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 4740
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 4800
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 4860
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 4920
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 4980
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 5040
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 5100
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 5160
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 5220
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 5280
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 5340
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 5400
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 5460
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 5520
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 5580
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 5640
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 5700
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 5760
agcgcagata ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa 5820
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 5880
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 5940
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 6000
cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa 6060
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 6120
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 6180
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 6240
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atggctcgac 6290
<210> 25
<211> 6091
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 25
cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60
ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120
ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180
ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240
agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300
ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360
tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420
atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480
ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540
gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600
cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660
tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840
aagcgaagcg cgcggcgggc gggagcacca ccgcggtggc ggccctagag tcgatcgagg 900
aactgaaaaa ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc 960
cagatctagg gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac 1020
tgacagccct ggtgcctctg gccggctgca cacctcctgg cgggcagctg tgtgtaatct 1080
ggtgagccac tgttgttctg gcaatacctg acagtggcag atcagattac acacggaggc 1140
ctgccctgac tgcccacggt gccgtggcca aagaggatct aagggcaccg ctgagggcct 1200
acctaaccat cgtggggaat aaggacagtg tcacccctgc aggggatccg gtggtggtgc 1260
aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt 1320
tacttctgct ctaaaagctg cggaattgta cccgcggccg atccaccggt gaattccgcc 1380
accatggtcg atggagtgat gatcctgcct gtcctgatta tgattgccct gcccagcccc 1440
agcatggaag atgaaaaacc taaagtcaac cctaagctgt atatgtgcgt gtgcgagggc 1500
ctgagctgcg gaaacgagga tcactgcgag ggccagcagt gtttcagctc cctgtccatc 1560
aatgacggct tccacgtgta ccagaagggc tgctttcagg tgtatgagca gggcaagatg 1620
acctgtaaga caccaccttc cccaggacag gcagtggagt gctgtcaggg cgattggtgt 1680
aaccggaata tcaccgccca gctgccaaca aagggcaagt ctttccccgg cacacagaac 1740
tttcacctgg aagtgggcct gatcatcctg agcgtggtgt tcgccgtgtg cctgctggca 1800
tgtctgctgg gagtggccct gagaaagttt aagcggagaa accaggagcg gctgaatcca 1860
agagatgtgg agtacggcac catcgagggc ctgatcacca caaatgtggg cgactctaca 1920
ctggccgacc tgctggatca cagctgcacc agcggctccg gatctggcct gccctttctg 1980
gtgcagagga ccgtggcccg gcagatcacc ctgctggagt gcgtgggcaa gggccggtac 2040
ggagaagtgt ggagaggatc ctggcaggga gagaacgtgg cagtgaagat cttctctagc 2100
cgggatgaga agtcttggtt tagagagaca gagctgtata acacagtgat gctgaggcac 2160
gagaatatcc tgggcttcat cgcctccgac atgacctctc gccactcctc tacacagctg 2220
tggctgatca cccactacca cgagatgggc tccctgtacg attacctcca gctgaccaca 2280
ctggacacag tgtcttgcct gcggatcgtg ctgtctatcg ccagcggcct ggcacacctg 2340
cacatcgaga tctttggaac ccagggcaag ccagcaatcg cacacactga agtctaagaa 2400
catcctggtg aagaagaatg gccagtgctg tatcgccgat ctgggcctgg ccgtgatgca 2460
cagccagtcc accaaccagc tggacgtggg caacaatcct cgggtgggca caaagagata 2520
catggcccca gaggtgctgg atgagacaat ccaggtggac tgcttcgata gctataagag 2580
ggtggacatc tgggcctttg gcctggtgct gtgggaggtg gcaaggagga tggtgagcaa 2640
cggcatcgtg gaggactaca agccaccctt ctatgacgtg gtgcctaatg atccatcctt 2700
tgaggacatg cgcaaggtgg tgtgcgtgga tcagcagagg cccaacatcc ctaatcgctg 2760
gttcagcgac cccaccctga catccctggc caagctgatg aaggagtgtt ggtatcagaa 2820
tcctagcgcc aggctgaccg ccctgcgcat caagaaaact ctgactaaaa tcgacaatag 2880
cctggataaa ctgaaaaccg actgctgacc tgagggcggc cgcgtcgacg gatccgatct 2940
ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg 3000
ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact 3060
cggaagcaat tcgttgatct gaatttcgac cacccataat acccattacc ctggtagata 3120
agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc 3180
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3240
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ccttaattaa cctaattcac 3300
tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 3360
ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 3420
cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa 3480
gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 3540
ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 3600
ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 3660
aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 3720
gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 3780
cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 3840
attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 3900
cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 3960
tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 4020
ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 4080
ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 4140
tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 4200
gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 4260
gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 4320
acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 4380
tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 4440
caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 4500
gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 4560
cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 4620
tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 4680
agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 4740
tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 4800
ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 4860
acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 4920
ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 4980
gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 5040
gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 5100
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 5160
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 5220
tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 5280
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 5340
cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 5400
ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 5460
tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 5520
cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 5580
ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 5640
aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 5700
ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 5760
tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 5820
gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 5880
gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg 5940
caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct 6000
tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta 6060
tgaccatgat tacgccagat ttaattaagg c 6091
<210> 26
<211> 6095
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 26
cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60
ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120
ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180
ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240
agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300
ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360
tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420
atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480
ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540
gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600
cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660
tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840
aagcgaagcg cgcggcgggc gggagcacca ccgcggtggc ggccctagag tcgatcgagg 900
aactgaaaaa ccagaaagtt aactggtaag tttagtcttt ttgtctttta tttcaggtcc 960
cagatctagg gctctgcgtt tgctccaggt agtccgctgc tcccttgggc ctgggcccac 1020
tgacagccct ggtgcctctg gccggctgca cacctcctgg cgggcagctg tggtaatctg 1080
gtgagccact gtttgttctg gcaatacctg aacagtgggc gccagattac cacggaggcc 1140
tgccctgact gcccacggtg ccgtggccaa agaggatcta agggcaccgc tgagggccta 1200
cctaaccatc gtggggaata aggacagtgt cacccctgca ggggatccgg tggtggtgca 1260
aatcaaagaa ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt 1320
acttctgctc taaaagctgc ggaattgtac ccgcggccga tccaccggtg aattccgcca 1380
ccatggtcga tggagtgatg atcctgcctg tcctgattat gattgccctg cccagcccca 1440
gcatggaaga tgaaaaacct aaagtcaacc ctaagctgta tatgtgcgtg tgcgagggcc 1500
tgagctgcgg aaacgaggat cactgcgagg gccagcagtg tttcagctcc ctgtccatca 1560
atgacggctt ccacgtgtac cagaagggct gctttcaggt gtatgagcag ggcaagatga 1620
cctgtaagac accaccttcc ccaggacagg cagtggagtg ctgtcagggc gattggtgta 1680
accggaatat caccgcccag ctgccaacaa agggcaagtc tttccccggc acacagaact 1740
ttcacctgga agtgggcctg atcatcctga gcgtggtgtt cgccgtgtgc ctgctggcat 1800
gtctgctggg agtggccctg agaaagttta agcggagaaa ccaggagcgg ctgaatccaa 1860
gagatgtgga gtacggcacc atcgagggcc tgatcaccac aaatgtgggc gactctacac 1920
tggccgacct gctggatcac agctgcacca gcggctccgg atctggcctg ccctttctgg 1980
tgcagaggac cgtggcccgg cagatcaccc tgctggagtg cgtgggcaag ggccggtacg 2040
gagaagtgtg gagaggatcc tggcagggag agaacgtggc agtgaagatc ttctctagcc 2100
gggatgagaa gtcttggttt agagagacag agctgtataa cacagtgatg ctgaggcacg 2160
agaatatcct gggcttcatc gcctccgaca tgacctctcg ccactcctct acacagctgt 2220
ggctgatcac ccactaccac gagatgggct ccctgtacga ttacctccag ctgaccacac 2280
tggacacagt gtcttgcctg cggatcgtgc tgtctatcgc cagcggcctg gcacacctgc 2340
acatcgagat ctttggaacc cagggcaagc cagcaatcgc acacagagat ctgaagtcta 2400
agaacatcct ggtgaagaag aatggccagt gctgtatcgc cgatctgggc ctggccgtga 2460
tgcacagcca gtccaccaac cagctggacg tgggcaacaa tcctcgggtg ggcacaaaga 2520
gatacatggc cccagaggtg ctggatgaga caatccaggt ggactgcttc gatagctata 2580
agagggtgga catctgggcc tttggcctgg tgctgtggga ggtggcaagg aggatggtga 2640
gcaacggcat cgtggaggac tacaagccac ccttctatga cgtggtgcct aatgatccat 2700
cctttgagga catgcgcaag gtggtgtgcg tggatcagca gaggcccaac atccctaatc 2760
gctggttcag cgaccccacc ctgacatccc tggccaagct gatgaaggag tgttggtatc 2820
agaatcctag cgccaggctg accgccctgc gcatcaagaa aactctgact aaaatcgaca 2880
atagcctgga taaactgaaa accgactgct gacctgaggg cggccgcgtc gacggatccg 2940
atctttttcc ctctgccaaa aattatgggg acatcatgaa gccccttgag catctgactt 3000
ctggctaata aaggaaattt attttcattg caatagtgtg ttggaatttt ttgtgtctct 3060
cactcggaag caattcgttg atctgaattt cgaccaccca taatacccat taccctggta 3120
gataagtagc atggcgggtt aatcattaac tacaaggaac ccctagtgat ggagttggcc 3180
actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 3240
ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagccttaa ttaacctaat 3300
tcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat 3360
cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat 3420
cgcccttccc aacagttgcg cagcctgaat ggcgaatggg acgcgccctg tagcggcgca 3480
ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 3540
gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 3600
caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 3660
cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg atagacggtt 3720
tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 3780
acaacactca accctatctc ggtctattct tttgatttat aagggatttt gccgatttcg 3840
gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 3900
ttaacgctta caatttaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt 3960
tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc 4020
ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc 4080
ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa 4140
aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg 4200
gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag 4260
ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc 4320
gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta 4380
cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg 4440
cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca 4500
acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac 4560
caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat 4620
taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg 4680
ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata 4740
aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta 4800
agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa 4860
atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag 4920
tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg 4980
tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact 5040
gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg 5100
taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc 5160
aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata 5220
ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta 5280
catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc 5340
ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg 5400
ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac 5460
agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg 5520
taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt 5580
atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct 5640
cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg 5700
ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata 5760
accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca 5820
gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc 5880
gttggccgat tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg 5940
agcgcaacgc aattaatgtg agttagctca ctcattaggc accccaggct ttacacttta 6000
tgcttccggc tcgtatgttg tgtggaattg tgagcggata acaatttcac acaggaaaca 6060
gctatgacca tgattacgcc agatttaatt aaggc 6095
<210> 27
<211> 6246
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 27
cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60
ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120
ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180
ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240
agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300
ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360
tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420
atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480
ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540
gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600
cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660
tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840
aagcgaagcg cgcggcgggc gggagcaagc tttcagatcg cctggagacg ccatccacgc 900
tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggccg ggaacggtgc 960
attggaacgc ggattccccg tgccaagagt gacgtaagta ccgcctatag agtctatagg 1020
cccaccccct tggcttctta tgcatgctat actgtttttg gcttggggtc tatacacccc 1080
cgcttcctca tgtttgctgc ccgtgaccag cacgtcaacg attttgtggg cacgggcgac 1140
accgcagtgt agtctgagca gtactcgttg ctgccgcgcg cgccaccaga cataatagct 1200
gacagactaa cagactgttc ctttccatgg gtcttttctg caagggctct gcgtttgctc 1260
caggtagtcc gctgctccct tgggcctggg cccactgaca gccctggtgc ctctggccgg 1320
ctgcacacct cctggcgggc agctgtgtgt aatctggtga gccactgttg ttctggcaat 1380
acctgacagt ggcagatcag attacacacg gaggcctgcc ctgactgccc acggtgccgt 1440
ggccaaagag gatctaaggg caccgctgag ggcctaccta accatcgtgg ggaataagga 1500
cagtgtcacc ctgcagtcac cgtcgccgcc accggtgaat tccgccacca tggtcgatgg 1560
agtgatgatc ctgcctgtcc tgattatgat tgccctgccc agccccagca tggaagatga 1620
aaaacctaaa gtcaacccta agctgtatat gtgcgtgtgc gagggcctga gctgcggaaa 1680
cgaggatcac tgcgagggcc agcagtgttt cagctccctg tccatcaatg acggcttcca 1740
cgtgtaccag aagggctgct ttcaggtgta tgagcagggc aagatgacct gtaagacacc 1800
accttcccca ggacaggcag tggagtgctg tcagggcgat tggtgtaacc ggaatatcac 1860
cgcccagctg ccaacaaagg gcaagtcttt ccccggcaca cagaactttc acctggaagt 1920
gggcctgatc atcctgagcg tggtgttcgc cgtgtgcctg ctggcatgtc tgctgggagt 1980
ggccctgaga aagtttaagc ggagaaacca ggagcggctg aatccaagag atgtggagta 2040
cggcaccatc gagggcctga tcaccacaaa tgtgggcgac tctacactgg ccgacctgct 2100
ggatcacagc tgcaccagcg gctccggatc tggcctgccc tttctggtgc agaggaccgt 2160
ggcccggcag atcaccctgc tggagtgcgt gggcaagggc cggtacggag aagtgtggag 2220
aggatcctgg cagggagaga acgtggcagt gaagatcttc tctagccggg atgagaagtc 2280
ttggtttaga gagacagagc tgtataacac agtgatgctg aggcacgaga atatcctggg 2340
cttcatcgcc tccgacatga cctctcgcca ctcctctaca cagctgtggc tgatcaccca 2400
ctaccacgag atgggctccc tgtacgatta cctccagctg accacactgg acacagtgtc 2460
ttgcctgcgg atcgtgctgt ctatcgccag cggcctggca cacctgcaca tcgagatctt 2520
tggaacccag ggcaagccag caatcgcaca cagagatctg aagtctaaga acatcctggt 2580
gaagaagaat ggccagtgct gtatcgccga tctgggcctg gccgtgatgc acagccagtc 2640
caccaaccag ctggacgtgg gcaacaatcc tcgggtgggc acaaagagat acatggcccc 2700
agaggtgctg gatgagacaa tccaggtgga ctgcttcgat agctataaga gggtggacat 2760
ctgggccttt ggcctggtgc tgtgggaggt ggcaaggagg atggtgagca acggcatcgt 2820
ggaggactac aagccaccct tctatgacgt ggtgcctaat gatccatcct ttgaggacat 2880
gcgcaaggtg gtgtgcgtgg atcagcagag gcccaacatc cctaatcgct ggttcagcga 2940
ccccaccctg acatccctgg ccaagctgat gaaggagtgt tggtatcaga atcctagcgc 3000
caggctgacc gccctgcgca tcaagaaaac tctgactaaa atcgacaata gcctggataa 3060
actgaaaacc gactgctgac ctgaggatcc gatctttttc cctctgccaa aaattatggg 3120
gacatcatga agccccttga gcatctgact tctggctaat aaaggaaatt tattttcatt 3180
gcaatagtgt gttggaattt tttgtgtctc tcactcggaa gcaattcgtt gatctgaatt 3240
tcgaccaccc ataataccca ttaccctggt agataagtag catggcgggt taatcattaa 3300
ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 3360
tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 3420
cgagcgagcg cgcagcctta attaacctaa ttcactggcc gtcgttttac aacgtcgtga 3480
ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 3540
ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 3600
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 3660
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 3720
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 3780
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 3840
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 3900
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 3960
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 4020
acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttagg tggcactttt 4080
cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 4140
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 4200
agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 4260
tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 4320
gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 4380
gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 4440
attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 4500
gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 4560
agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 4620
ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 4680
cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 4740
gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4800
cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4860
gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4920
ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4980
acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 5040
ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 5100
aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc 5160
aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 5220
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 5280
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 5340
actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 5400
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 5460
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 5520
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 5580
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 5640
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 5700
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 5760
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 5820
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 5880
tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat 5940
accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag 6000
cgcccaatac gcaaaccgcc tctccccgcg cgttggccga ttcattaatg cagctggcac 6060
gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt gagttagctc 6120
actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt 6180
gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc cagatttaat 6240
taaggc 6246
<210> 28
<211> 6246
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 28
cttaattagg ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg 60
ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa 120
ctccatcact aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag 180
ggtaatgggg atcctctaga actatagcta gtcgacattg attattgact agttattaat 240
agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac 300
ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa 360
tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt 420
atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc 480
ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat 540
gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc 600
cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 660
tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg 720
gcggggcggg gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag 780
agcggcgcgc tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa 840
aagcgaagcg cgcggcgggc gggagcaagc tttcagatcg cctggagacg ccatccacgc 900
tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggccg ggaacggtgc 960
attggaacgc ggattccccg tgccaagagt gacgtaagta ccgcctatag agtctatagg 1020
cccaccccct tggcttctta tgcatgctat actgtttttg gcttggggtc tatacacccc 1080
cgcttcctca tgtttgctgc ccgtgaccag cacgtcaacg attttgtggg cacgggcgac 1140
accgcagtgt agtctgagca gtactcgttg ctgccgcgcg cgccaccaga cataatagct 1200
gacagactaa cagactgttc ctttccatgg gtcttttctg caagggctct gcgtttgctc 1260
caggtagtcc gctgctccct tgggcctggg cccactgaca gccctggtgc ctctggccgg 1320
ctgcacacct cctggcgggc agctgtggta atctggtgag ccactgtttg ttctggcaat 1380
acctgaacag tgggacgcca gattaccacg gaggcctgcc ctgactgccc acggtgccgt 1440
ggccaaagag gatctaaggg caccgctgag ggcctaccta accatcgtgg ggaataagga 1500
cagtgtcacc ctgcagtcac cgtcgccgcc accggtgaat tccgccacca tggtcgatgg 1560
agtgatgatc ctgcctgtcc tgattatgat tgccctgccc agccccagca tggaagatga 1620
aaaacctaaa gtcaacccta agctgtatat gtgcgtgtgc gagggcctga gctgcggaaa 1680
cgaggatcac tgcgagggcc agcagtgttt cagctccctg tccatcaatg acggcttcca 1740
cgtgtaccag aagggctgct ttcaggtgta tgagcagggc aagatgacct gtaagacacc 1800
accttcccca ggacaggcag tggagtgctg tcagggcgat tggtgtaacc ggaatatcac 1860
cgcccagctg ccaacaaagg gcaagtcttt ccccggcaca cagaactttc acctggaagt 1920
gggcctgatc atcctgagcg tggtgttcgc cgtgtgcctg ctggcatgtc tgctgggagt 1980
ggccctgaga aagtttaagc ggagaaacca ggagcggctg aatccaagag atgtggagta 2040
cggcaccatc gagggcctga tcaccacaaa tgtgggcgac tctacactgg ccgacctgct 2100
ggatcacagc tgcaccagcg gctccggatc tggcctgccc tttctggtgc agaggaccgt 2160
ggcccggcag atcaccctgc tggagtgcgt gggcaagggc cggtacggag aagtgtggag 2220
aggatcctgg cagggagaga acgtggcagt gaagatcttc tctagccggg atgagaagtc 2280
ttggtttaga gagacagagc tgtataacac agtgatgctg aggcacgaga atatcctggg 2340
cttcatcgcc tccgacatga cctctcgcca ctcctctaca cagctgtggc tgatcaccca 2400
ctaccacgag atgggctccc tgtacgatta cctccagctg accacactgg acacagtgtc 2460
ttgcctgcgg atcgtgctgt ctatcgccag cggcctggca cacctgcaca tcgagatctt 2520
tggaacccag ggcaagccag caatcgcaca cagagatctg aagtctaaga acatcctggt 2580
gaagaagaat ggccagtgct gtatcgccga tctgggcctg gccgtgatgc acagccagtc 2640
caccaaccag ctggacgtgg gcaacaatcc tcgggtgggc acaaagagat acatggcccc 2700
agaggtgctg gatgagacaa tccaggtgga ctgcttcgat agctataaga gggtggacat 2760
ctgggccttt ggcctggtgc tgtgggaggt ggcaaggagg atggtgagca acggcatcgt 2820
ggaggactac aagccaccct tctatgacgt ggtgcctaat gatccatcct ttgaggacat 2880
gcgcaaggtg gtgtgcgtgg atcagcagag gcccaacatc cctaatcgct ggttcagcga 2940
ccccaccctg acatccctgg ccaagctgat gaaggagtgt tggtatcaga atcctagcgc 3000
caggctgacc gccctgcgca tcaagaaaac tctgactaaa atcgacaata gcctggataa 3060
actgaaaacc gactgctgac ctgaggatcc gatctttttc cctctgccaa aaattatggg 3120
gacatcatga agccccttga gcatctgact tctggctaat aaaggaaatt tattttcatt 3180
gcaatagtgt gttggaattt tttgtgtctc tcactcggaa gcaattcgtt gatctgaatt 3240
tcgaccaccc ataataccca ttaccctggt agataagtag catggcgggt taatcattaa 3300
ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 3360
tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 3420
cgagcgagcg cgcagcctta attaacctaa ttcactggcc gtcgttttac aacgtcgtga 3480
ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 3540
ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 3600
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg 3660
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc 3720
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg 3780
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc 3840
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt 3900
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc 3960
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta 4020
acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttagg tggcactttt 4080
cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 4140
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 4200
agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 4260
tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 4320
gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 4380
gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 4440
attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 4500
gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 4560
agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 4620
ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 4680
cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 4740
gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4800
cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4860
gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4920
ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4980
acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 5040
ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 5100
aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc 5160
aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 5220
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 5280
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 5340
actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 5400
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 5460
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 5520
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 5580
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 5640
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 5700
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 5760
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 5820
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 5880
tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat 5940
accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag 6000
cgcccaatac gcaaaccgcc tctccccgcg cgttggccga ttcattaatg cagctggcac 6060
gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt gagttagctc 6120
actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt 6180
gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacgc cagatttaat 6240
taaggc 6246
<210> 29
<211> 7380
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 29
ccaactccat cactaggggt tcctgcggcc gcaaggtcgg gcaggaagag ggcctatttc 60
ccatgattcc ttcatatttg catatacgat acaaggctgt tagagagata attagaatta 120
atttgactgt aaacacaaag atattagtac aaaatacgtg acgtagaaag taataatttc 180
ttgggtagtt tgcagtttta aaattatgtt ttaaaatgga ctatcatatg cttaccgtaa 240
cttgaaagta tttcgatttc ttggctttat atatcttgtg gaaaggacga aacaccggct 300
caccagatta cactgtgttt tagagctaga aatagcaagt taaaataagg ctagtccgtt 360
atcaacttga aaaagtggca ccgagtcggt gctttttttc tcgagccata gagcccaccg 420
catccccagc atgcctgcta ttgtcttccc aatcctcccc cttgctgtcc tgccccaccc 480
caccccccag aatagaatga cacctactca gacaatgcga tgcaatttcc tcattttatt 540
aggaaaggac agtgggagtg gcaccttcca gggtcaagga aggcacgggg gaggggcaaa 600
caacagatgg ctggcaacta gaaggcacag tcgcaccacg gaattgtcag tgcccaacag 660
ccgagcccct gtccagcagc gggcaaggca ggcggcgatg agttccgccg tggcaagaac 720
taaccaggat ttatacaagg aggagaaaat gaaagccata cgggaagcaa tagcatgata 780
caaaggcatt aaagcagcgt atccacatag cgtaaaagga gcaacatagt taagaatacc 840
agtcaatctt tcacaaattt tgtaatccag aggttgatta tcagatctta gactttcctc 900
ttcttcttgg gctcgaattc gctgccgtcg gcggttcttt ttgagccgcc agagtcacct 960
cccagctgag acaggtcgat ccgtgtctcg tacaggccgg tgatgctctg gtggatcagg 1020
gtggcgtcca gcacctcttt ggtgctggtg tacctcttcc ggtcgatggt ggtgtcaaag 1080
tacttgaagg cggcaggggc tcccagattg gtcagggtaa acaggtggat gatattctcg 1140
gcctgctctc tgatgggctt atcccggtgc ttgttgtagg cggacagcac tttgtccaga 1200
ttagcgtcgg ccaggatcac tctcttggag aactcgctga tctgctcgat gatctcgtcc 1260
aggtagtgct tgtgctgttc cacaaacagc tgtttctgct cattatcctc gggggagccc 1320
ttcagcttct catagtggct ggccaggtac aggaagttca catatttgga gggcagggcc 1380
agttcgtttc ccttctgcag ttcgccggca gaggccagca ttctcttccg gccgttttcc 1440
agctcgaaca gggagtactt aggcagcttg atgatcaggt cctttttcac ttctttgtag 1500
cccttggctt ccagaaagtc gatgggattc ttctcgaagc tgcttctttc catgatggtg 1560
atccccagca gctctttcac actcttcagt ttcttggact tgcccttttc cactttggcc 1620
accaccagca cagaataggc cacggtgggg ctgtcgaagc cgccgtactt cttagggtcc 1680
cagtccttct ttctggcgat cagcttatcg ctgttcctct tgggcaggat agactctttg 1740
ctgaagccgc ctgtctgcac ctcggtcttt ttcacgatat tcacttgggg catgctcagc 1800
actttccgca cggtggcaaa atcccggccc ttatcccaca cgatctcccc ggtttcgccg 1860
tttgtctcga tcagaggccg cttccggatc tcgccgttgg ccagggtaat ctcggtcttg 1920
aaaaagttca tgatgttgct gtagaagaag tacttggcgg tagccttgcc gatttcctgc 1980
tcgctcttgg cgatcatctt ccgcacgtcg tacaccttgt agtcgccgta cacgaactcg 2040
ctttccagct tagggtactt tttgatcagg gcggttccca cgacggcgtt caggtaggcg 2100
tcgtgggcgt ggtggtagtt gttgatctcg cgcactttgt aaaactggaa atccttccgg 2160
aaatcggaca ccagcttgga cttcagggtg atcactttca cttcccggat cagcttgtca 2220
ttctcgtcgt acttagtgtt catccgggag tccaggatct gtgccacgtg ctttgtgatc 2280
tgccgggttt ccaccagctg tctcttgatg aagccggcct tatccagttc gctcaggccg 2340
cctctctcgg ccttggtcag attgtcgaac tttctctggg taatcagctt ggcgttcagc 2400
agctgccgcc agtagttctt catcttcttc acgacctctt cggagggcac gttgtcgctc 2460
ttgccccggt tcttgtcgct tctggtcagc accttgttgt cgatggagtc gtccttcaga 2520
aagctctgag gcacgatatg gtccacatcg tagtcggaca gccggttgat gtccagttcc 2580
tggtccacgt acatatcccg cccattctgc aggtagtaca ggtacagctt ctcgttctgc 2640
agctgggtgt tttccacggg gtgttctttc aggatctggc tgcccagctc tttgatgccc 2700
tcttcgatcc gcttcattct ctcgcggctg ttcttctgtc ccttctgggt ggtctggttc 2760
tctctggcca tttcgatcac gatgttctcg ggcttgtgcc ggcccatcac tttcacgagc 2820
tcgtccacca ccttcactgt ctgcaggatg cccttcttaa tggcggggct gccggccaga 2880
ttggcaatgt gctcgtgcag gctatcgccc tggccggaca cctgggcttt ctggatgtcc 2940
tctttaaagg tcaggctgtc gtcgtggatc agctgcatga agtttctgtt ggcgaagccg 3000
tcggacttca ggaaatccag gattgtcttg ccggactgct tgtcccggat gccgttgatc 3060
agcttccggc tcagcctgcc ccagccggtg tatctccgcc gcttcagctg cttcatcact 3120
ttgtcgtcga acaggtgggc ataggttttc agccgttcct cgatcatctc tctgtcctca 3180
aacagtgtca gggtcagcac gatatcttcc agaatgtcct cgttttcctc attgtccagg 3240
aagtccttgt ccttgataat tttcagcaga tcgtggtatg tgcccaggga ggcgttgaac 3300
cgatcttcca cgccggagat ttccacggag tcgaagcaat tgctggcgat aaagccattc 3360
ttcagggcga agttgtgatc ccgctccacg ccgatgtcgt acacgttctg ctttcccagg 3420
tatttccgtg tagcaatctt gatgactttc cgcttcttct ttggtgactc gaactcgctt 3480
ccgtcggctg tccgtttcat ggtggcaccg gtccaacctg aaaaaaagtg atttcaggca 3540
ggtgctccag gtaattaaac attaataccc caccaaccaa ccatccctta aacccttacc 3600
tcttgctcag ctaattacag cccggaggag aagggccgtc ccgcccgctc acctgtggga 3660
gtaacgcggt cagtcagagc cggggcgggc ggcgcgaggc ggcggcggag cggggcacgg 3720
ggcgaaggca gcgtcgcagc gactcccgcc cgccgcgcgc ttcgcttttt atagggccgc 3780
cgccgccgcc gcctcgccat aaaaggaaac tttcggagcg cgccgctctg attggctgcc 3840
gccgcacctc tccgcctcgc cccgccccgc ccctcgcccc gccccgcccc gcctggcgcg 3900
cgcccccccc ccccccccgc ccccatcgct gcacaaaata attaaaaaat aaataaatac 3960
aaaattgggg gtggggaggg gggggagatg gggagagtga agcagaacgt ggggctcacc 4020
tcgaccatgg taatagcgat gactaatacg tagatgtact gccaagtagg aaagtcccat 4080
aaggtcatgt actgggcaca atgccaggcg ggccatttac cgtcattgac gtcaataggg 4140
ggcgtacttg gcatatgata cacttgatgt actgccaagt gggcagttta ccgtaaatac 4200
tccacccatt gacgtcaatg gaaagtccct attggcgtta ctattgacgt caatgggcgg 4260
gggtcgttgg gcggtcagcc aggcgggcca tttaccgtaa gttatgtaac gggtaccctg 4320
atctagaggc cgcaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 4380
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 4440
tcagtgagcg agcgagcgcg cagccttaat taaatctggc gtaatcatgg tcatagctgt 4500
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc ggaagcataa 4560
agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg ttgcgctcac 4620
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 4680
cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc 4740
gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat 4800
ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaccgcag caaaaggcca 4860
ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 4920
atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 4980
aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 5040
gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 5100
ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 5160
ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 5220
acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 5280
gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat 5340
ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 5400
ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 5460
gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 5520
ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 5580
agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 5640
ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 5700
gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 5760
catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat 5820
cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg 5880
cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata 5940
gtttgcgcaa cgttgttacc attactacag gcatcgtggt gtcacgctcg tcgtttggta 6000
tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt 6060
gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag 6120
tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa 6180
gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc 6240
gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt 6300
taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc 6360
tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 6420
ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 6480
taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 6540
tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 6600
aaataggggt tccgcgcaca tttccccgaa agatgccacc tgaaattata aacgttaata 6660
ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 6720
aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 6780
cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 6840
ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 6900
cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 6960
ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 7020
gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 7080
cgccgctaca gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat 7140
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 7200
taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat 7260
taggttaatt aaggctgcgc gctcgctcgc tcactgaggc cgcccgggca aagcccgggc 7320
gtcgggcgac ctttggtcgc ccggcctcag tgagcgagcg agcgcgcaga gagggagtgg 7380
<210> 30
<211> 247
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 30
tgagctcaca gaggggactt tccgagagat ctacagaggg gactttccga gagcgagctt 60
gggctgcagg tcgaccgtcc atccattcac agcgcttcta taaaggcgcc agctgaggcg 120
cctactactc caaccgcgac tgcagcgagc aactgagaag actggataga gccggcggtt 180
ccgcgaacga gcagtgaccg cgctcccacc cagctctgct ctgcagctcc accagtgtct 240
ctctaga 247
<210> 31
<211> 220
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 31
gcttcgcgcc ctaagtctgc aggtgacggg ctcaggggcg ggggctgggt gggggggagc 60
ggagaatgct ccagcccagt ttgccgtctc catggcgacc gcccgcgcgg cgccagcctg 120
acagcccgtc cgggttttat gaatgggtga cgtcacgggc ctggcgtcta acggtctgag 180
ccgcttgttc agacgctgac acagaccagc ccgggaaagg 220
<210> 32
<211> 4688
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 32
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgccgcgtcg acattgatta ttgactctgg tcgttacata 180
acttacggta aatggcccgc ctggctgacc gcccaacgac cccgcccatt gacgtcaata 240
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 300
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 360
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 420
tgggactttc ctacttggca gtacatctac tcgaggccac gttctgcttc acgcttcgcg 480
ccctaagtct gcaggtgacg ggctcagggg cgggggctgg gtggggggga gcggagaatg 540
ctccagccca gtttgccgtc tccatggcga ccgcccgcgc ggcgccagcc tgacagcccg 600
tccgggtttt atgaatgggt gacgtcacgg gcctggcgtc taacggtctg agccgcttgt 660
tcagacgctg acacagacca gcccgggaaa ggtgagctca cagaggggac tttccgagag 720
atctacagag gggactttcc gagagcgagc ttgggctgca ggtcgaccgt ccatccattc 780
acagcgcttc tataaaggcg ccagctgagg cgcctactac tccaaccgcg actgcagcga 840
gcaactgaga agactggata gagccggcgg ttccgcgaac gagcagtgac cgcgctccca 900
cccagctctg ctctgcagct ccaccagtgt ctctctagag ccaccgcggt ggcggcccta 960
gagtcgatcg aggaactgaa aaaccagaaa gttaactggt aagtttagtc tttttgtctt 1020
ttatttcagg tcccggatcc ggtggtggtg caaatcaaag aactgctcct cagtggatgt 1080
tgcctttact tctaggcctg tacggaagtg ttacttctgc tctaaaagct gcggaattgt 1140
acccgcggcc gatccaccgg tcgccaccat ctagcatggg agtcaaagtt ctgtttgccc 1200
tgatctgcat cgctgtggcc gaggccaagc ccaccgagaa caacgaagac ttcaacatcg 1260
tggccgtggc cagcaacttc gcgaccacgg atctcgatgc tgaccgcggg aagttgcccg 1320
gcaagaagct gccgctggag gtgctcaaag agatggaagc caatgcccgg aaagctggct 1380
gcaccagggg ctgtctgatc tgcctgtccc acatcaagtg cacgcccaag atgaagaagt 1440
tcatcccagg acgctgccac acctacgaag gcgacaaaga gtccgcacag ggcggcatag 1500
gcgaggcgat cgtcgacatt cctgagattc ctgggttcaa ggacttggag cccatggagc 1560
agttcatcgc acaggtcgat ctgtgtgtgg actgcacaac tggctgcctc aaagggcttg 1620
ccaacgtgca gtgttctgac ctgctcaaga agtggctgcc gcaacgctgt gcgacctttg 1680
ccagcaagat ccagggccag gtggacaaga tcaagggggc cggtggtgac tagctcgacg 1740
ctgatcagcc tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt 1800
gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat 1860
tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag 1920
caagggggag gattgggaag acaaggccgc aggaacccct agtgatggag ttggccactc 1980
cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 2040
gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcctga 2100
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatacgt caaagcaacc 2160
atagtacgcg ccctgtagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt 2220
gaccgctaca cttgccagcg ccctagcgcc cgctcctttc gctttcttcc cttcctttct 2280
cgccacgttc gccggctttc cccgtcaagc tctaaatcgg gggctccctt tagggttccg 2340
atttagtgct ttacggcacc tcgaccccaa aaaacttgat ttgggtgatg gttcacgtag 2400
tgggccatcg ccctgataga cggtttttcg ccctttgacg ttggagtcca cgttctttaa 2460
tagtggactc ttgttccaaa ctggaacaac actcaaccct atctcgggct attcttttga 2520
tttataaggg attttgccga tttcggccta ttggttaaaa aatgagctga tttaacaaaa 2580
atttaacgcg aattttaaca aaatattaac gtttacaatt ttatggtgca ctctcagtac 2640
aatctgctct gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc 2700
gccctgacgg gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg 2760
gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct 2820
cgtgatacgc ctatttttat aggttaatgt catgataata atggtttctt agacgtcagg 2880
tggcactttt cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc 2940
aaatatgtat ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag 3000
gaagagtatg agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg 3060
ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt 3120
gggtgcacga gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt 3180
tcgccccgaa gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt 3240
attatcccgt attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa 3300
tgacttggtt gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag 3360
agaattatgc agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac 3420
aacgatcgga ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac 3480
tcgccttgat cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac 3540
cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac 3600
tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact 3660
tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg 3720
tgggtctcgc ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt 3780
tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat 3840
aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta 3900
gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa 3960
tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga 4020
aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac 4080
aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt 4140
tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc tagtgtagcc 4200
gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat 4260
cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag 4320
acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc 4380
cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag 4440
cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac 4500
aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg 4560
gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct 4620
atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc 4680
tcacatgt 4688
<210> 33
<211> 5806
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 33
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgccgcgtcg acattgatta ttgactctgg tcgttacata 180
acttacggta aatggcccgc ctggctgacc gcccaacgac cccgcccatt gacgtcaata 240
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 300
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 360
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 420
tgggactttc ctacttggca gtacatctac tcgaggccac gttctgcttc actctcccca 480
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 540
cgatgggggc gggggggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggccctag agtcgatcga ggaactgaaa 780
aaccagaaag ttaactggta agtttagtct ttttgtcttt tatttcaggt cccggatccg 840
gtggtggtgc aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt 900
acggaagtgt tacttctgct ctaaaagctg cggaattgta cccgcggccg atccaccggt 960
gccaccatgg tccgcgcgag gcaccagccg ggtgggcttt gcctcctgct gctgctgctc 1020
tgccagttca tggaggaccg cagtgcccag gctgggaact gctggctccg tcaagcgaag 1080
aacggccgct gccaggtcct gtacaagacc gaactgagca aggaggagtg ctgcagcacc 1140
ggccggctga gcacctcgtg gaccgaggag gacgtgaatg acaacacact cttcaagtgg 1200
atgattttca acgggggcgc ccccaactgc atcccctgta aagaaacgtg tgagaacgtg 1260
gactgtggac ctgggaaaaa atgccgaatg aacaagaaga acaaaccccg ctgcgtctgc 1320
gccccggatt gttccaacat cacctggaag ggtccagtct gcgggctgga tgggaaaacc 1380
taccgcaatg aatgtgcact cctaaaggca agatgtaaag agcagccaga actggaagtc 1440
cagtaccaag gcagatgtaa aaagacttgt cgggatgttt tctgtccagg cagctccaca 1500
tgtgtggtgg accagaccaa taatgcctac tgtgtgacct gtaatcggat ttgcccagag 1560
cctgcttcct ctgagcaata tctctgtggg aatgatggag tcacctactc cagtgcctgc 1620
cacctgagaa aggctacctg cctgctgggc agatctattg gattagccta tgagggaaag 1680
tgtatcaaag caaagtcctg tgaagatatc cagtgcactg gtgggaaaaa atgtttatgg 1740
gatttcaagg ttgggagagg ccggtgttcc ctctgtgatg agctgtgccc tgacagtaag 1800
tcggatgagc ctgtctgtgc cagtgacaat gccacttatg ccagcgagtg tgccatgaag 1860
gaagctgcct gctcctcagg tgtgctactg gaagtaaagc actccggatc ttgcaacgga 1920
tccggagagg gcagaggaag tctgctaaca tgcggtgacg tcgaggagaa tcctggacct 1980
atggcgcccg tcgccgtctg ggccgcgctg gccgtcggac tggagctctg ggctgcggcg 2040
cacgccttgc ccgcccaggt ggcatttaca ccctacgccc cggagcccgg gagcacatgc 2100
cggctcagag aatactatga ccagacagct cagatgtgct gcagcaaatg ctcgccgggc 2160
caacatgcaa aagtcttctg taccaagacc tcggacaccg tgtgtgactc ctgtgaggac 2220
agcacataca cccagctctg gaactgggtt cccgagtgct tgagctgtgg ctcccgctgt 2280
agctctgacc aggtggaaac tcaagcctgc actcgggaac agaaccgcat ctgcacctgc 2340
aggcccggct ggtactgcgc gctgagcaag caggaggggt gccggctgtg cgcgccgctg 2400
cgcaagtgcc gcccgggctt cggcgtggcc agaccaggaa ctgaaacatc agacgtggtg 2460
tgcaagccct gtgccccggg gacgttctcc aacacgactt catccacgga tatttgcagg 2520
ccccaccaga tctgtaacgt ggtggccatc cctgggaatg caagcatgga tgcagtctgc 2580
acgtccacgt cccccacccg gagtatggcc ccaggggcag tacacttacc ccagccagtg 2640
tccacacgat cccaacacac gcagccaact ccagaaccca gcactgctcc aagcacctcc 2700
ttcctgctcc caatgggccc cagcccccca gctgaaggga gcactggcga cttcgctctt 2760
ccagtttgag cggccgccaa acaccattgt cacactccaa caaacaccat tgtcacactc 2820
caacaaacac cattgtcaca ctccagcggc cgcacgcgtt gatcagcctc gactgtgcct 2880
tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt 2940
gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg 3000
tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac 3060
aaggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct 3120
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg cggcctcagt 3180
gagcgagcga gcgcgcagct gcctgcaggg gcgcctgatg cggtattttc tccttacgca 3240
tctgtgcggt atttcacacc gcatacgtca aagcaaccat agtacgcgcc ctgtagcggc 3300
gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 3360
ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 3420
cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 3480
gaccccaaaa aacttgattt gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 3540
gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 3600
ggaacaacac tcaaccctat ctcgggctat tcttttgatt tataagggat tttgccgatt 3660
tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 3720
atattaacgt ttacaatttt atggtgcact ctcagtacaa tctgctctga tgccgcatag 3780
ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc 3840
ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt 3900
tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag 3960
gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg 4020
cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga 4080
caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat 4140
ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca 4200
gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc 4260
gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca 4320
atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg 4380
caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca 4440
gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata 4500
accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag 4560
ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg 4620
gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca 4680
acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta 4740
atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct 4800
ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca 4860
gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag 4920
gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat 4980
tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt 5040
taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa 5100
cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga 5160
gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg 5220
gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc 5280
agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag 5340
aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc 5400
agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg 5460
cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac 5520
accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga 5580
aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt 5640
ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag 5700
cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg 5760
gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgt 5806
<210> 34
<211> 4555
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 34
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgccgcgtcg acattgatta ttgactctgg tcgttacata 180
acttacggta aatggcccgc ctggctgacc gcccaacgac cccgcccatt gacgtcaata 240
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag 300
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc 360
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta 420
tgggactttc ctacttggca gtacatctac tcgaggccac gttctgcttc actctcccca 480
tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta ttttgtgcag 540
cgatgggggc gggggggggg gggggggggg cgcgcgccag gcggggcggg gcggggcgag 600
gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg cgcgctccga 660
aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg 720
cgggcgggag cgggatcagc caccgcggtg gcggccctag agtcgatcga ggaactgaaa 780
aaccagaaag ttaactggta agtttagtct ttttgtcttt tatttcaggt cccggatccg 840
gtggtggtgc aaatcaaaga actgctcctc agtggatgtt gcctttactt ctaggcctgt 900
acggaagtgt tacttctgct ctaaaagctg cggaattgta cccgcggccg atccaccggt 960
cgccaccatc tagcatggga gtcaaagttc tgtttgccct gatctgcatc gctgtggccg 1020
aggccaagcc caccgagaac aacgaagact tcaacatcgt ggccgtggcc agcaacttcg 1080
cgaccacgga tctcgatgct gaccgcggga agttgcccgg caagaagctg ccgctggagg 1140
tgctcaaaga gatggaagcc aatgcccgga aagctggctg caccaggggc tgtctgatct 1200
gcctgtccca catcaagtgc acgcccaaga tgaagaagtt catcccagga cgctgccaca 1260
cctacgaagg cgacaaagag tccgcacagg gcggcatagg cgaggcgatc gtcgacattc 1320
ctgagattcc tgggttcaag gacttggagc ccatggagca gttcatcgca caggtcgatc 1380
tgtgtgtgga ctgcacaact ggctgcctca aagggcttgc caacgtgcag tgttctgacc 1440
tgctcaagaa gtggctgccg caacgctgtg cgacctttgc cagcaagatc cagggccagg 1500
tggacaagat caagggggcc ggtggtgact agctcgacgc tcaaacacca ttgtcacact 1560
ccaacaaaca ccattgtcac actccaacaa acaccattgt cacactccag atcagcctcg 1620
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 1680
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 1740
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 1800
tgggaagaca aggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 1860
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 1920
ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcctgatgc ggtattttct 1980
ccttacgcat ctgtgcggta tttcacaccg catacgtcaa agcaaccata gtacgcgccc 2040
tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt 2100
gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc 2160
ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta 2220
cggcacctcg accccaaaaa acttgatttg ggtgatggtt cacgtagtgg gccatcgccc 2280
tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg 2340
ttccaaactg gaacaacact caaccctatc tcgggctatt cttttgattt ataagggatt 2400
ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat 2460
tttaacaaaa tattaacgtt tacaatttta tggtgcactc tcagtacaat ctgctctgat 2520
gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 2580
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 2640
cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt gatacgccta 2700
tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg cacttttcgg 2760
ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 2820
ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 2880
attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 2940
gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 3000
ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 3060
cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 3120
gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 3180
tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 3240
gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 3300
ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 3360
tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 3420
gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 3480
caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 3540
cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 3600
atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 3660
gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 3720
attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 3780
cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 3840
atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 3900
tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 3960
ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 4020
ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 4080
cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 4140
gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 4200
gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 4260
acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 4320
gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 4380
agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 4440
tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 4500
agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgt 4555
<210> 35
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 35
atggaaatct gcagaggcct ccgcagtcac ctaatcactc tcctcctctt cctgttccat 60
tcagagacga tctgccgacc ctctgggaga aaatccagca agatgcaagc cttcagaatc 120
tgggatgtta accagaagac cttctatctg aggaacaacc aactagttgc tggatacttg 180
caaggaccaa atgtcaattt agaagaaaag atagatgtgg tacccattga gcctcatgct 240
ctgttcttgg gaatccatgg agggaagatg tgcctgtcct gtgtcaagtc tggtgatgag 300
accagactcc agctggaggc agttaacatc actgacctga gcgagaacag aaagcaggac 360
aagcgcttcg ccttcatccg ctcagacagt ggccccacca ccagttttga gtctgccgcc 420
tgccccggtt ggttcctctg cacagcgatg gaagctgacc agcccgtcag cctcaccaat 480
atgcctgacg aaggcgtcat ggtcaccaaa ttctacttcc aggaggacga gtagtaa 537
<210> 36
<211> 171
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 36
gaactgaaaa accagaaagt taactggtaa gtttagtctt tttgtctttt atttcaggtc 60
ccggatccgg tggtggtgca aatcaaagaa ctgctcctca gtggatgttg cctttacttc 120
aggcctgtac ggaagtgtta cttctgctct aaaagctgcg gaattgtacc c 171
<210> 37
<211> 384
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 37
tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 60
atccagcctc cgcggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga 120
cgtaagtacc gcctatagag tctataggcc cacccccttg gcttcttatg catgctatac 180
tgtttttggc ttggggtcta tacacccccg cttcctcatg tttgctgccc gtgaccagca 240
cgtcaacgat tttgtgggca cgggcgacac cgcagtgtag tctgagcagt actcgttgct 300
gccgcgcgcg ccaccagaca taatagctga cagactaaca gactgttcct ttccatgggt 360
cttttctgca gtcaccgtcg ccgc 384
<210> 38
<211> 509
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 38
Met Val Asp Gly Val Met Ile Leu Pro Val Leu Ile Met Ile Ala Leu
1 5 10 15
Pro Ser Pro Ser Met Glu Asp Glu Lys Pro Lys Val Asn Pro Lys Leu
20 25 30
Tyr Met Cys Val Cys Glu Gly Leu Ser Cys Gly Asn Glu Asp His Cys
35 40 45
Glu Gly Gln Gln Cys Phe Ser Ser Leu Ser Ile Asn Asp Gly Phe His
50 55 60
Val Tyr Gln Lys Gly Cys Phe Gln Val Tyr Glu Gln Gly Lys Met Thr
65 70 75 80
Cys Lys Thr Pro Pro Ser Pro Gly Gln Ala Val Glu Cys Cys Gln Gly
85 90 95
Asp Trp Cys Asn Arg Asn Ile Thr Ala Gln Leu Pro Thr Lys Gly Lys
100 105 110
Ser Phe Pro Gly Thr Gln Asn Phe His Leu Glu Val Gly Leu Ile Ile
115 120 125
Leu Ser Val Val Phe Ala Val Cys Leu Leu Ala Cys Leu Leu Gly Val
130 135 140
Ala Leu Arg Lys Phe Lys Arg Arg Asn Gln Glu Arg Leu Asn Pro Arg
145 150 155 160
Asp Val Glu Tyr Gly Thr Ile Glu Gly Leu Ile Thr Thr Asn Val Gly
165 170 175
Asp Ser Thr Leu Ala Asp Leu Leu Asp His Ser Cys Thr Ser Gly Ser
180 185 190
Gly Ser Gly Leu Pro Phe Leu Val Gln Arg Thr Val Ala Arg Gln Ile
195 200 205
Thr Leu Leu Glu Cys Val Gly Lys Gly Arg Tyr Gly Glu Val Trp Arg
210 215 220
Gly Ser Trp Gln Gly Glu Asn Val Ala Val Lys Ile Phe Ser Ser Arg
225 230 235 240
Asp Glu Lys Ser Trp Phe Arg Glu Thr Glu Leu Tyr Asn Thr Val Met
245 250 255
Leu Arg His Glu Asn Ile Leu Gly Phe Ile Ala Ser Asp Met Thr Ser
260 265 270
Arg His Ser Ser Thr Gln Leu Trp Leu Ile Thr His Tyr His Glu Met
275 280 285
Gly Ser Leu Tyr Asp Tyr Leu Gln Leu Thr Thr Leu Asp Thr Val Ser
290 295 300
Cys Leu Arg Ile Val Leu Ser Ile Ala Ser Gly Leu Ala His Leu His
305 310 315 320
Ile Glu Ile Phe Gly Thr Gln Gly Lys Pro Ala Ile Ala His Arg Asp
325 330 335
Leu Lys Ser Lys Asn Ile Leu Val Lys Lys Asn Gly Gln Cys Cys Ile
340 345 350
Ala Asp Leu Gly Leu Ala Val Met His Ser Gln Ser Thr Asn Gln Leu
355 360 365
Asp Val Gly Asn Asn Pro Arg Val Gly Thr Lys Arg Tyr Met Ala Pro
370 375 380
Glu Val Leu Asp Glu Thr Ile Gln Val Asp Cys Phe Asp Ser Tyr Lys
385 390 395 400
Arg Val Asp Ile Trp Ala Phe Gly Leu Val Leu Trp Glu Val Ala Arg
405 410 415
Arg Met Val Ser Asn Gly Ile Val Glu Asp Tyr Lys Pro Pro Phe Tyr
420 425 430
Asp Val Val Pro Asn Asp Pro Ser Phe Glu Asp Met Arg Lys Val Val
435 440 445
Cys Val Asp Gln Gln Arg Pro Asn Ile Pro Asn Arg Trp Phe Ser Asp
450 455 460
Pro Thr Leu Thr Ser Leu Ala Lys Leu Met Lys Glu Cys Trp Tyr Gln
465 470 475 480
Asn Pro Ser Ala Arg Leu Thr Ala Leu Arg Ile Lys Lys Thr Leu Thr
485 490 495
Lys Ile Asp Asn Ser Leu Asp Lys Leu Lys Thr Asp Cys
500 505
<210> 39
<211> 100
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 39
Val Phe Tyr Phe Arg Ser Gln Ile Gly Ser Ala Phe Ala Pro Gly Ser
1 5 10 15
Pro Leu Leu Pro Trp Ala Trp Ala His Gln Pro Trp Cys Leu Trp Pro
20 25 30
Ala Ala His Leu Leu Ala Gly Ser Cys Glu Cys Asn Leu Val Ser His
35 40 45
Leu Phe Trp Gln Tyr Leu Ser Gly Ser Ala Asp Tyr Thr His Gly Gly
50 55 60
Leu Pro Leu Pro Thr Val Pro Trp Pro Lys Arg Ile Gly His Arg Gly
65 70 75 80
Pro Thr Pro Ser Trp Gly Ile Arg Thr Val Ser Pro Leu Gln Gly Ile
85 90 95
Arg Trp Trp Cys
100
<210> 40
<211> 87
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 40
Arg Ala Leu Arg Leu Leu Gln Val Val Arg Cys Ser Leu Gly Pro Gly
1 5 10 15
Pro Thr Asp Ser Pro Gly Ala Ser Gly Arg Leu His Thr Ser Trp Arg
20 25 30
Ala Ala Val Ser Val Ser Trp Ala Thr Cys Ser Gly Asn Thr Val Ala
35 40 45
Leu Arg Leu Thr Leu Thr Glu Ala Cys Pro Asp Cys Pro Arg Cys Arg
50 55 60
Gly Gln Arg Gly Ser Lys Gly Thr Ala Glu Gly Leu Pro Asn His Arg
65 70 75 80
Gly Glu Gly Gln Cys His Pro
85
<210> 41
<211> 16
<212> PRT
<213> Homo sapiens
<400> 41
Ser Arg Val Gln Arg Thr Val Ala Arg Gln Ile Thr Leu Leu Glu Cys
1 5 10 15
<210> 42
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 42
Ser Arg Val Gln Arg Thr Val Ala Arg Gln Ile Thr Leu Leu Glu Cys
1 5 10 15
<210> 43
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 43
Gly Ser Pro Asp Tyr Thr Val
1 5
<210> 44
<211> 795
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 44
Val Thr Ser Gln Leu Arg Gln Val Asp Pro Cys Leu Val Gln Ala Gly
1 5 10 15
Asp Ala Leu Val Asp Gln Gly Gly Val Gln His Leu Phe Gly Ala Gly
20 25 30
Val Pro Leu Pro Val Asp Gly Gly Val Lys Val Leu Glu Gly Gly Arg
35 40 45
Gly Ser Gln Ile Gly Gln Gly Lys Gln Val Asp Asp Ile Leu Gly Leu
50 55 60
Leu Ser Asp Gly Leu Ile Pro Val Leu Val Val Gly Gly Gln His Phe
65 70 75 80
Val Gln Ile Ser Val Gly Gln Asp His Ser Leu Gly Glu Leu Ala Asp
85 90 95
Leu Leu Asp Asp Leu Val Gln Val Val Leu Val Leu Phe His Lys Gln
100 105 110
Leu Phe Leu Leu Ile Ile Leu Gly Gly Ala Leu Gln Leu Leu Ile Val
115 120 125
Ala Gly Gln Val Gln Glu Val His Ile Phe Gly Gly Gln Gly Gln Phe
130 135 140
Val Ser Leu Leu Gln Phe Ala Gly Arg Gly Gln His Ser Leu Pro Ala
145 150 155 160
Val Phe Gln Leu Glu Gln Gly Val Leu Arg Gln Leu Asp Asp Gln Val
165 170 175
Leu Phe His Phe Phe Val Ala Leu Gly Phe Gln Lys Val Asp Gly Ile
180 185 190
Leu Leu Glu Ala Ala Ser Phe His Asp Gly Asp Pro Gln Gln Leu Phe
195 200 205
His Thr Leu Gln Phe Leu Gly Leu Ala Leu Phe His Phe Gly His His
210 215 220
Gln His Arg Ile Gly His Gly Gly Ala Val Glu Ala Ala Val Leu Leu
225 230 235 240
Arg Val Pro Val Leu Leu Ser Gly Asp Gln Leu Ile Ala Val Pro Leu
245 250 255
Gly Gln Asp Arg Leu Phe Ala Glu Ala Ala Cys Leu His Leu Gly Leu
260 265 270
Phe His Asp Ile His Leu Gly His Ala Gln His Phe Pro His Gly Gly
275 280 285
Lys Ile Pro Ala Leu Ile Pro His Asp Leu Pro Gly Phe Ala Val Cys
290 295 300
Leu Asp Gln Arg Pro Leu Pro Asp Leu Ala Val Gly Gln Gly Asn Leu
305 310 315 320
Gly Leu Glu Lys Val His Asp Val Ala Val Glu Glu Val Leu Gly Gly
325 330 335
Ser Leu Ala Asp Phe Leu Leu Ala Leu Gly Asp His Leu Pro His Val
340 345 350
Val His Leu Val Val Ala Val His Glu Leu Ala Phe Gln Leu Arg Val
355 360 365
Leu Phe Asp Gln Gly Gly Ser His Asp Gly Val Gln Val Gly Val Val
370 375 380
Gly Val Val Val Val Val Asp Leu Ala His Phe Val Lys Leu Glu Ile
385 390 395 400
Leu Pro Glu Ile Gly His Gln Leu Gly Leu Gln Gly Asp His Phe His
405 410 415
Phe Pro Asp Gln Leu Val Ile Leu Val Val Leu Ser Val His Pro Gly
420 425 430
Val Gln Asp Leu Cys His Val Leu Cys Asp Leu Pro Gly Phe His Gln
435 440 445
Leu Ser Leu Asp Glu Ala Gly Leu Ile Gln Phe Ala Gln Ala Ala Ser
450 455 460
Leu Gly Leu Gly Gln Ile Val Glu Leu Ser Leu Gly Asn Gln Leu Gly
465 470 475 480
Val Gln Gln Leu Pro Pro Val Val Leu His Leu Leu His Asp Leu Phe
485 490 495
Gly Gly His Val Val Ala Leu Ala Pro Val Leu Val Ala Ser Gly Gln
500 505 510
His Leu Val Val Asp Gly Val Val Leu Gln Lys Ala Leu Arg His Asp
515 520 525
Met Val His Ile Val Val Gly Gln Pro Val Asp Val Gln Phe Leu Val
530 535 540
His Val His Ile Pro Pro Ile Leu Gln Val Val Gln Val Gln Leu Leu
545 550 555 560
Val Leu Gln Leu Gly Val Phe His Gly Val Phe Phe Gln Asp Leu Ala
565 570 575
Ala Gln Leu Phe Asp Ala Leu Phe Asp Pro Leu His Ser Leu Ala Ala
580 585 590
Val Leu Leu Ser Leu Leu Gly Gly Leu Val Leu Ser Gly His Phe Asp
595 600 605
His Asp Val Leu Gly Leu Val Pro Ala His His Phe His Glu Leu Val
610 615 620
His His Leu His Cys Leu Gln Asp Ala Leu Leu Asn Gly Gly Ala Ala
625 630 635 640
Gly Gln Ile Gly Asn Val Leu Val Gln Ala Ile Ala Leu Ala Gly His
645 650 655
Leu Gly Phe Leu Asp Val Leu Phe Lys Gly Gln Ala Val Val Val Asp
660 665 670
Gln Leu His Glu Val Ser Val Gly Glu Ala Val Gly Leu Gln Glu Ile
675 680 685
Gln Asp Cys Leu Ala Gly Leu Leu Val Pro Asp Ala Val Asp Gln Leu
690 695 700
Pro Ala Gln Pro Ala Pro Ala Gly Val Ser Pro Pro Leu Gln Leu Leu
705 710 715 720
His His Phe Val Val Glu Gln Val Gly Ile Gly Phe Gln Pro Phe Leu
725 730 735
Asp His Leu Ser Val Leu Lys Gln Cys Gln Gly Gln His Asp Ile Phe
740 745 750
Gln Asn Val Leu Val Phe Leu Ile Val Gln Glu Val Leu Val Leu Asp
755 760 765
Asn Phe Gln Gln Ile Val Val Cys Ala Gln Gly Gly Val Glu Pro Ile
770 775 780
Phe His Ala Gly Asp Phe His Gly Val Glu Ala
785 790 795
<210> 45
<211> 317
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 45
Met Val Arg Ala Arg His Gln Pro Gly Gly Leu Cys Leu Leu Leu Leu
1 5 10 15
Leu Leu Cys Gln Phe Met Glu Asp Arg Ser Ala Gln Ala Gly Asn Cys
20 25 30
Trp Leu Arg Gln Ala Lys Asn Gly Arg Cys Gln Val Leu Tyr Lys Thr
35 40 45
Glu Leu Ser Lys Glu Glu Cys Cys Ser Thr Gly Arg Leu Ser Thr Ser
50 55 60
Trp Thr Glu Glu Asp Val Asn Asp Asn Thr Leu Phe Lys Trp Met Ile
65 70 75 80
Phe Asn Gly Gly Ala Pro Asn Cys Ile Pro Cys Lys Glu Thr Cys Glu
85 90 95
Asn Val Asp Cys Gly Pro Gly Lys Lys Cys Arg Met Asn Lys Lys Asn
100 105 110
Lys Pro Arg Cys Val Cys Ala Pro Asp Cys Ser Asn Ile Thr Trp Lys
115 120 125
Gly Pro Val Cys Gly Leu Asp Gly Lys Thr Tyr Arg Asn Glu Cys Ala
130 135 140
Leu Leu Lys Ala Arg Cys Lys Glu Gln Pro Glu Leu Glu Val Gln Tyr
145 150 155 160
Gln Gly Arg Cys Lys Lys Thr Cys Arg Asp Val Phe Cys Pro Gly Ser
165 170 175
Ser Thr Cys Val Val Asp Gln Thr Asn Asn Ala Tyr Cys Val Thr Cys
180 185 190
Asn Arg Ile Cys Pro Glu Pro Ala Ser Ser Glu Gln Tyr Leu Cys Gly
195 200 205
Asn Asp Gly Val Thr Tyr Ser Ser Ala Cys His Leu Arg Lys Ala Thr
210 215 220
Cys Leu Leu Gly Arg Ser Ile Gly Leu Ala Tyr Glu Gly Lys Cys Ile
225 230 235 240
Lys Ala Lys Ser Cys Glu Asp Ile Gln Cys Thr Gly Gly Lys Lys Cys
245 250 255
Leu Trp Asp Phe Lys Val Gly Arg Gly Arg Cys Ser Leu Cys Asp Glu
260 265 270
Leu Cys Pro Asp Ser Lys Ser Asp Glu Pro Val Cys Ala Ser Asp Asn
275 280 285
Ala Thr Tyr Ala Ser Glu Cys Ala Met Lys Glu Ala Ala Cys Ser Ser
290 295 300
Gly Val Leu Leu Glu Val Lys His Ser Gly Ser Cys Asn
305 310 315
<210> 46
<211> 262
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 46
Met Ala Pro Val Ala Val Trp Ala Ala Leu Ala Val Gly Leu Glu Leu
1 5 10 15
Trp Ala Ala Ala His Ala Leu Pro Ala Gln Val Ala Phe Thr Pro Tyr
20 25 30
Ala Pro Glu Pro Gly Ser Thr Cys Arg Leu Arg Glu Tyr Tyr Asp Gln
35 40 45
Thr Ala Gln Met Cys Cys Ser Lys Cys Ser Pro Gly Gln His Ala Lys
50 55 60
Val Phe Cys Thr Lys Thr Ser Asp Thr Val Cys Asp Ser Cys Glu Asp
65 70 75 80
Ser Thr Tyr Thr Gln Leu Trp Asn Trp Val Pro Glu Cys Leu Ser Cys
85 90 95
Gly Ser Arg Cys Ser Ser Asp Gln Val Glu Thr Gln Ala Cys Thr Arg
100 105 110
Glu Gln Asn Arg Ile Cys Thr Cys Arg Pro Gly Trp Tyr Cys Ala Leu
115 120 125
Ser Lys Gln Glu Gly Cys Arg Leu Cys Ala Pro Leu Arg Lys Cys Arg
130 135 140
Pro Gly Phe Gly Val Ala Arg Pro Gly Thr Glu Thr Ser Asp Val Val
145 150 155 160
Cys Lys Pro Cys Ala Pro Gly Thr Phe Ser Asn Thr Thr Ser Ser Thr
165 170 175
Asp Ile Cys Arg Pro His Gln Ile Cys Asn Val Val Ala Ile Pro Gly
180 185 190
Asn Ala Ser Met Asp Ala Val Cys Thr Ser Thr Ser Pro Thr Arg Ser
195 200 205
Met Ala Pro Gly Ala Val His Leu Pro Gln Pro Val Ser Thr Arg Ser
210 215 220
Gln His Thr Gln Pro Thr Pro Glu Pro Ser Thr Ala Pro Ser Thr Ser
225 230 235 240
Phe Leu Leu Pro Met Gly Pro Ser Pro Pro Ala Glu Gly Ser Thr Gly
245 250 255
Asp Phe Ala Leu Pro Val
260
<210> 47
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 47
Gln Thr Pro Leu Ser His Ser Asn Lys His His Cys His Thr Pro Thr
1 5 10 15
Asn Thr Ile Val Thr Leu
20
<210> 48
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 48
acaagctttt tgctcgtctt atacaagctt tttgctcgtc ttatacaagc tttttgctcg 60
tcttat 66
<210> 49
<211> 3563
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 49
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180
atcctctaga actatagcta gtcgacattg attattgact agttattaat agtaatcaat 240
tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300
tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360
tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420
aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 480
caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 540
tacttggcag tacatctacg tattagtcat cgctattacc atgtcgaggc cacgttctgc 600
ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa 660
ttattttgtg cagcgatggg ggcggggggg gggggcgcgc gccaggcggg gcggggcggg 720
gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc 780
tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg 840
cgcggcgggc gggagcaagc tttcagatcg cctggagacg ccatccacgc tgttttgacc 900
tccatagaag acaccgggac cgatccagcc tccgcggccg ggaacggtgc attggaacgc 960
ggattccccg tgccaagagt gacgtaagta ccgcctatag agtctatagg cccaccccct 1020
tggcttctta tgcatgctat actgtttttg gcttggggtc tatacacccc cgcttcctca 1080
tgtttgctgc ccgtgaccag cacgtcaacg attttgtggg cacgggcgac accgcagtgt 1140
agtctgagca gtactcgttg ctgccgcgcg cgccaccaga cataatagct gacagactaa 1200
cagactgttc ctttccatgg gtcttttctg caagggctct gcgtttgctc caggtagtcc 1260
gctgctccct tgggcctggg cccactgaca gccctggtgc ctctggccgg ctgcacacct 1320
cctggcgggc agctgtgtgt aatctggtga gccactgttg ttctggcaat acctgacagt 1380
ggcagatcag attacacacg gaggcctgcc ctgactgccc acggtgccgt ggccaaagag 1440
gatctaaggg caccgctgag ggcctaccta accatcgtgg ggaataagga cagtgtcacc 1500
ctgcagtcac cgtcgccgcc accggtgaat tccgccacca tggtcgatgg agtgatgatc 1560
ctgcctgtcc tgattatgat tgccctgccc agccccagca tggaagatga aaaacctaaa 1620
gtcaacccta agctgtatat gtgcgtgtgc gagggcctga gctgcggaaa cgaggatcac 1680
tgcgagggcc agcagtgttt cagctccctg tccatcaatg acggcttcca cgtgtaccag 1740
aagggctgct ttcaggtgta tgagcagggc aagatgacct gtaagacacc accttcccca 1800
ggacaggcag tggagtgctg tcagggcgat tggtgtaacc ggaatatcac cgcccagctg 1860
ccaacaaagg gcaagtcttt ccccggcaca cagaactttc acctggaagt gggcctgatc 1920
atcctgagcg tggtgttcgc cgtgtgcctg ctggcatgtc tgctgggagt ggccctgaga 1980
aagtttaagc ggagaaacca ggagcggctg aatccaagag atgtggagta cggcaccatc 2040
gagggcctga tcaccacaaa tgtgggcgac tctacactgg ccgacctgct ggatcacagc 2100
tgcaccagcg gctccggatc tggcctgccc tttctggtgc agaggaccgt ggcccggcag 2160
atcaccctgc tggagtgcgt gggcaagggc cggtacggag aagtgtggag aggatcctgg 2220
cagggagaga acgtggcagt gaagatcttc tctagccggg atgagaagtc ttggtttaga 2280
gagacagagc tgtataacac agtgatgctg aggcacgaga atatcctggg cttcatcgcc 2340
tccgacatga cctctcgcca ctcctctaca cagctgtggc tgatcaccca ctaccacgag 2400
atgggctccc tgtacgatta cctccagctg accacactgg acacagtgtc ttgcctgcgg 2460
atcgtgctgt ctatcgccag cggcctggca cacctgcaca tcgagatctt tggaacccag 2520
ggcaagccag caatcgcaca cagagatctg aagtctaaga acatcctggt gaagaagaat 2580
ggccagtgct gtatcgccga tctgggcctg gccgtgatgc acagccagtc caccaaccag 2640
ctggacgtgg gcaacaatcc tcgggtgggc acaaagagat acatggcccc agaggtgctg 2700
gatgagacaa tccaggtgga ctgcttcgat agctataaga gggtggacat ctgggccttt 2760
ggcctggtgc tgtgggaggt ggcaaggagg atggtgagca acggcatcgt ggaggactac 2820
aagccaccct tctatgacgt ggtgcctaat gatccatcct ttgaggacat gcgcaaggtg 2880
gtgtgcgtgg atcagcagag gcccaacatc cctaatcgct ggttcagcga ccccaccctg 2940
acatccctgg ccaagctgat gaaggagtgt tggtatcaga atcctagcgc caggctgacc 3000
gccctgcgca tcaagaaaac tctgactaaa atcgacaata gcctggataa actgaaaacc 3060
gactgctgac ctgaacaagc tttttgctcg tcttatacaa gctttttgct cgtcttatac 3120
aagctttttg ctcgtcttat acaaacacca ttgtcacact ccaacaaaca ccattgtcac 3180
actccaacaa acaccattgt cacactccat gaggatccga tctttttccc tctgccaaaa 3240
attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 3300
ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcggaagc aattcgttga 3360
tctgaatttc gaccacccat aatacccatt accctggtag ataagtagca tggcgggtta 3420
atcattaact acaaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 3480
tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 3540
tcagtgagcg agcgagcgcg cag 3563
<210> 50
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> modified_base
<222> (1)..(3)
<223> n is a, g, c, or t
<220>
<221> misc_feature
<222> (1)..(3)
<223> n is a, c, g, or t
<220>
<221> modified_base
<222> (24)..(24)
<223> r is g or a
<220>
<221> modified_base
<222> (45)..(47)
<223> n is a, g, c, or t
<220>
<221> misc_feature
<222> (45)..(47)
<223> n is a, c, g, or t
<400> 50
nnnggtacaa agaacagtgg ctcrccagat tacactgttg gagtnnn 47
<210> 51
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> modified_base
<222> (1)..(3)
<223> n is a, g, c, or t
<220>
<221> misc_feature
<222> (1)..(3)
<223> n is a, c, g, or t
<220>
<221> modified_base
<222> (45)..(47)
<223> n is a, g, c, or t
<220>
<221> misc_feature
<222> (45)..(47)
<223> n is a, c, g, or t
<400> 51
nnnggtacaa agaacagtgg ctcaccagat tacactgttg gagtnnn 47
<210> 52
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 52
Arg Thr Val Ala His Gln Ile Thr Leu
1 5
<210> 53
<211> 47
<212> DNA
<213> Homo sapiens
<220>
<221> modified_base
<222> (1)..(3)
<223> n is a, g, c, or t
<220>
<221> misc_feature
<222> (1)..(3)
<223> n is a, c, g, or t
<220>
<221> modified_base
<222> (45)..(47)
<223> n is a, g, c, or t
<220>
<221> misc_feature
<222> (45)..(47)
<223> n is a, c, g, or t
<400> 53
nnnggtacaa agaacagtgg ctcgccagat tacactgttg gagtnnn 47
<210> 54
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 54
Arg Thr Val Ala Arg Gln Ile Thr Leu
1 5
<210> 55
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 55
ggctcaccag attacactgt tgg 23
<210> 56
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 56
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtggtgta atctggtgag 120
ccactgtgtt ctggcaatac ctgcagtggc tgtctagatt acaccacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 57
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 57
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtggtgta agctggtgag 120
ccactgtgtt ctggcaatac ctgcagtggc tgtctagctt acaccacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 58
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 58
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgtgtaa gctggtgagc 120
cactgttgtt ctggcaatac ctgacagtgg cagatcagct tacacacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 59
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 59
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgtgtaa tctggtgagc 120
cactgttgtt ctggcaatac ctgacagtgg cagatcagat tacacacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 60
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 60
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtggtaat ctggtgagcc 120
actgtttgtt ctggcaatac ctgaacagtg ggacgccaga ttaccacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 61
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 61
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtggtaag ctggtgagcc 120
actgtttgtt ctggcaatac ctgaacagtg ggacgccagc ttaccacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 62
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 62
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgtaatc tggtgagcca 120
ctgttctgtt ctggcaatac ctggaacagt gcgttaccag attacacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 63
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 63
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgtaagc tggtgagcca 120
ctgttctgtt ctggcaatac ctggaacagt gcgttaccag cttacacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 64
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 64
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgaatct ggtgagccac 120
tgttcttgtt ctggcaatac ctgagaacag tcccccacca gattcacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
<210> 65
<211> 269
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 65
agggctctgc gtttgctcca ggtagtccgc tgctcccttg ggcctgggcc cactgacagc 60
cctggtgcct ctggccggct gcacacctcc tggcgggcag ctgtgaagct ggtgagccac 120
tgttcttgtt ctggcaatac ctgagaacag tcccccacca gcttcacgga ggcctgccct 180
gactgcccac ggtgccgtgg ccaaagagga tctaagggca ccgctgaggg cctacctaac 240
catcgtgggg aataaggaca gtgtcaccc 269
Claims (100)
- ACVR1을 코딩하는 코돈 최적화된 핵산 서열에 작동가능하게 연결된 프로모터를 포함하는 트랜스진을 포함하는 단리된 핵산.
- 제1항에 있어서, 벡터 내에 위치하는 단리된 핵산.
- 제1항에 있어서, 프로모터가 닭 베타-액틴 (CBA) 프로모터인 단리된 핵산.
- 제3항에 있어서, CBA 프로모터가 벡터 내에 CBA 인트론을 포함하는 것인 단리된 핵산.
- 제3항에 있어서, CBA 프로모터가 벡터 내에 서열식별번호: 37에 제시된 바와 같은 서열을 포함하는 매스바이올로직스 신규 (MBL) 인트론을 포함하는 것인 단리된 핵산.
- 제3항에 있어서, CBA 프로모터가 벡터 내에 서열식별번호: 36에 제시된 바와 같은 서열을 포함하는 합성 인트론을 포함하는 것인 단리된 핵산.
- 제5항 또는 제6항에 있어서, MBL 인트론 및/또는 합성 인트론이 벡터 게놈의 크기를 감소시키는 것인 단리된 핵산.
- 제7항에 있어서, 벡터 게놈의 크기가 적어도 15-25%만큼 감소되는 것인 단리된 핵산.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 인트론이 프로모터와 ACVR1을 코딩하는 트랜스진 서열 사이에 존재하는 것인 단리된 핵산.
- 제1항에 있어서, ACVR1이 서열식별번호: 1에 제시된 바와 같은 서열을 포함하는 것인 단리된 핵산.
- 제2항에 있어서, 벡터가 플라스미드, 바크미드, 코스미드, 바이러스, 폐쇄형-단부 선형 DNA (ceDNA), 또는 바큘로바이러스 벡터인 단리된 핵산.
- 제11항에 있어서, 벡터가 아데노-연관 바이러스 (AAV) 벡터인 단리된 핵산.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 트랜스진에 AAV 역전된 말단 반복부 (ITR)가 플랭킹된 것인 단리된 핵산.
- 서열식별번호: 2-4 중 어느 하나에 제시된 서열을 포함하는, 제1항 내지 제13항 중 어느 한 항의 단리된 핵산을 포함하는 벡터.
- 제1항 내지 제14항 중 어느 한 항에 있어서, ACVR1-R206H에 의한 골 형태발생 단백질 (BMP) 신호전달의 활성화를 감소시키는 단리된 핵산 또는 벡터.
- ACVR1 단백질을 코딩하는 내인성 mRNA와 혼성화하여 그의 발현을 억제하기에 충분한, 대상체의 내인성 mRNA와 상보적인 서열을 갖는 핵산을 포함하는 인공 miRNA (ami-RNA)를 포함하는 단리된 핵산.
- 제16항에 있어서, ACVR1 단백질이 야생형 ACVR1의 서열의 위치 206에서 구아닌에서 아데닌으로의 단일 염기 돌연변이를 포함하는 것인 단리된 핵산.
- 제16항 또는 제17항에 있어서, ACVR1 단백질이 인간 ACVR1-R206H인 단리된 핵산.
- 제16항에 있어서, ami-RNA가 서열식별번호: 5, 6 및 56-65 중 어느 하나에 제시된 서열에 의해 코딩된 것인 단리된 핵산.
- 제16항에 있어서, 벡터 내에 위치하는 단리된 핵산.
- 제16항에 있어서, 프로모터가 닭 베타-액틴 (CBA) 프로모터인 단리된 핵산.
- 제20항에 있어서, 벡터가 플라스미드, 바크미드, 코스미드, 바이러스, 폐쇄형-단부 선형 DNA (ceDNA), 또는 바큘로바이러스 벡터인 단리된 핵산.
- 제22항에 있어서, 바이러스 벡터가 아데노-연관 바이러스 (AAV) 벡터인 단리된 핵산.
- 제23항에 있어서, AAV 벡터가 적어도 1개의 역전된 말단 반복부 (ITR)를 포함하는 것인 단리된 핵산.
- 제16항 내지 제24항 중 어느 한 항에 있어서, ami-RNA가 인간 miRNA 백본, 임의로 인간 miR-33 백본을 포함하는 것인 단리된 핵산.
- 서열식별번호: 5, 6, 및 56-65 중 어느 하나에 제시된 서열을 포함하는, 제16항 내지 제25항 중 어느 한 항의 단리된 핵산을 포함하는 벡터.
- 서열식별번호: 22-24 중 어느 하나에 제시된 서열을 포함하는 벡터.
- 제27항에 있어서, 인간 야생형 ACVR1을 표적화하는 마이크로RNA와 상보적인 1개 이상의 miRNA 결합 부위를 포함하는 벡터.
- 제27항에 있어서, 인간 코돈 최적화된 ACVR1을 표적화하는 마이크로RNA와 상보적인 1개 이상의 miRNA 결합 부위를 포함하는 벡터.
- 제27항에 있어서, 인간 ACVR1-R206H를 표적화하는 마이크로RNA와 상보적인 1개 이상의 miRNA 결합 부위를 포함하는 벡터.
- 제27항 내지 제30항 중 어느 한 항에 있어서, 레닐라 루시페라제 리포터 유전자를 추가로 포함하는 벡터.
- 제27항에 있어서, 숙주 세포를 추가로 포함하며, 임의로 여기서 숙주 세포는 진핵 세포이고, 추가로 임의로 여기서 숙주 세포는 포유동물 세포인 벡터.
- 제32항에 있어서, 포유동물 세포가 HEK293 세포인 벡터.
- 제27항에 있어서, 서열식별번호: 5, 6 및 56-65 중 어느 하나에 제시된 서열을 포함하며, ACVR1-R206H의 발현을 감소시키는 벡터.
- 제34항에 있어서, 서열이 서열식별번호: 59 또는 60인 벡터.
- (a) ACVR1 단백질을 코딩하는 내인성 mRNA와 혼성화하여 그의 발현을 억제하기에 충분한, 대상체의 내인성 mRNA와 상보적인 서열을 갖는 핵산을 포함하는 인공 miRNA (ami-RNA)를 코딩하는 제1 영역; 및
(b) ACVR1을 코딩하는 코돈 최적화된 핵산 서열을 포함하는 트랜스진을 코딩하는 제2 영역
을 포함하는 단리된 핵산. - 제36항에 있어서, 바이러스 벡터 내에 위치하는 단리된 핵산.
- 제37항에 있어서, 바이러스 벡터가 아데노-연관 바이러스 (AAV) 벡터인 단리된 핵산.
- 제38항에 있어서, AAV 벡터가 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh.8, AAV9, AAVrh.10, AAVrh39, 및 AAVrh.43으로부터 선택된 캡시드 단백질에 의해 캡시드화된 것인 단리된 핵산.
- 제36항에 있어서, ami-RNA 및 트랜스진이 프로모터에 작동가능하게 연결된 것인 단리된 핵산.
- 제40항에 있어서, 프로모터가 닭 베타-액틴 (CBA) 프로모터인 단리된 핵산.
- 제41항에 있어서, CBA 프로모터가 벡터 내에 CBA 인트론을 포함하는 것인 단리된 핵산.
- 제41항에 있어서, CBA 프로모터가 벡터 내에 서열식별번호: 37에 제시된 바와 같은 서열을 포함하는 매스바이올로직스 신규 (MBL) 인트론을 포함하는 것인 단리된 핵산.
- 제36항에 있어서, ACVR1 단백질이 구아닌에서 아데닌으로의 단일 염기 돌연변이를 갖는 돌연변이된 단백질인 단리된 핵산.
- 제36항에 있어서, ACVR1 단백질이 인간 ACVR1-R206H인 단리된 핵산.
- 제36항 내지 제41항 중 어느 한 항에 있어서, 서열식별번호: 25-28 중 어느 하나에 제시된 서열을 포함하는 단리된 핵산.
- 제36항 내지 제46항 중 어느 한 항에 있어서, ami-RNA가 인간 miRNA 백본, 임의로 인간 miR-33 백본을 포함하는 것인 단리된 핵산.
- 제36항 내지 제47항 중 어느 한 항에 있어서, ami-RNA 및 트랜스진이 ACVR1-R206H를 야생형 ACVR1로 대체하는 것인 단리된 핵산.
- 서열식별번호: 25-28 중 어느 하나에 제시된 서열을 포함하는 벡터.
- 제49항에 있어서, 숙주 세포를 추가로 포함하며, 임의로 여기서 숙주 세포는 진핵 세포이고, 추가로 임의로 여기서 숙주 세포는 포유동물 세포인 벡터.
- 제50항에 있어서, 포유동물 세포가 HEK293 세포인 벡터.
- (a) ACVR1 유전자의 표적 핵산 서열에 특이적으로 혼성화하는 단일 가이드 RNA (sgRNA);
(b) 제1 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제1 rAAV 입자; 및
(c) 제2 재조합 유전자 편집 단백질 또는 그의 단편을 코딩하는 제2 rAAV 입자
를 포함하는 재조합 유전자 편집 복합체. - 제52항에 있어서, 제1 재조합 유전자 편집 단백질이 Cas9-기반 아데닌 염기 편집제 (ABE) N-말단 부분 및 그의 단편을 포함하는 것인 재조합 유전자 편집 복합체.
- 제52항에 있어서, 제2 재조합 유전자 편집 단백질이 Cas9-기반 아데닌 염기 편집제 (ABE) C-말단 부분 및 그의 단편을 포함하는 것인 재조합 유전자 편집 복합체.
- 제52항에 있어서, 프로토스페이서 인접 모티프를 추가로 포함하는 재조합 유전자 편집 복합체.
- 제52항 내지 제55항 중 어느 한 항에 있어서, 재조합 유전자 편집 단백질이 Crisper/Cas9 시스템의 단백질인 재조합 유전자 편집 복합체.
- 제52항 내지 제56항 중 어느 한 항에 있어서, 제1 및 제2 rAAV 입자가 AAV9 캡시드 단백질 또는 그의 변이체를 포함하는 것인 재조합 유전자 편집 복합체.
- 제52항 내지 제56항 중 어느 한 항에 있어서, 제1 및 제2 rAAV 입자가 AAV6.2 캡시드 단백질 또는 그의 변이체를 포함하는 것인 재조합 유전자 편집 복합체.
- 제53항 또는 제54항에 있어서, 각각의 N-말단 ABE 구축물 및 C-말단 ABE 구축물이 트랜스-스플라이싱 인테인 서열을 사용하는 것에 의해 나뉘는 것인 재조합 유전자 편집 복합체.
- 제52항에 있어서, N-말단 ABE 구축물이 ACVR1-R206H 돌연변이를 갖는 프로토스페이서를 포함하는 것인 재조합 유전자 편집 복합체.
- 제52항에 있어서, C-말단 ABE 구축물이 AAV6.2 또는 AAV9 캡시드 단백질 내로 통합된 것인 재조합 유전자 편집 복합체.
- 제52항에 있어서, ABE가 ACVR1-R206H 대립유전자에서 아데닌을 구아닌으로 전환시키는 것인 재조합 유전자 편집 복합체.
- (a) 제1항 내지 제13항, 제15항 내지 제25항, 및 제36항 내지 제48항 중 어느 한 항의 단리된 핵산; 및
(b) 적어도 1개의 AAV 캡시드 단백질
을 포함하는 재조합 아데노-연관 바이러스 (rAAV). - 제63항에 있어서, 캡시드 단백질이 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAVrh.8, AAV9, AAVrh.10, AAVrh39, 및 AAVrh.43으로부터 선택된 혈청형의 것인 재조합 rAAV.
- 제63항에 있어서, rAAV가 자기-상보적 AAV (scAAV)인 재조합 rAAV.
- NF-kB 프로모터 (pNF-kB)를 포함하는 제1 트랜스진 및 골 형태발생 단백질 프로모터 (pBRE)를 포함하는 제2 트랜스진을 포함하며, AAV 벡터 내로 통합된 단리된 핵산.
- 제66항에 있어서, AAV 벡터가 rAAV9 벡터인 단리된 핵산.
- 제66항 또는 제67항에 있어서, AAV 벡터가 적어도 1개의 역전된 말단 반복부 (ITR)를 포함하는 것인 단리된 핵산.
- 제66항 내지 제68항 중 어느 한 항에 있어서, 가우시아 리포터 유전자 (eBRE/NF-kB-Luc)를 추가로 포함하는 단리된 핵산.
- 제66항 내지 제68항 중 어느 한 항에 있어서, pNF-kB가 가용성 폴리스타틴 (sFST)의 발현을 유도하는 것인 단리된 핵산.
- 제66항 내지 제70항 중 어느 한 항에 있어서, pBRE가 TNFR2의 발현을 유도하는 것인 단리된 핵산.
- 제66항 내지 제71항 중 어느 한 항에 있어서, 액티빈 A, BMP 리간드, 및/또는 염증이 sFST 및 TNFR2의 발현을 촉발하는 것인 단리된 핵산.
- 제72항에 있어서, 염증이 염증성 시토카인에 의해 유도되는 것인 단리된 핵산.
- 제72항에 있어서, sFST 및 TNFR2의 발현이 플레어-업 상태에서 액티빈 A 및/또는 TNF 신호전달 경로를 억제하는 것인 단리된 핵산.
- 제66항에 있어서, pNF-kB가 PB2 프로모터 (서열식별번호: 30)인 단리된 핵산.
- 제66항에 있어서, pBRE가 서열식별번호: 31의 서열을 포함하는 것인 단리된 핵산.
- 제66항 내지 제76항 중 어느 한 항에 있어서, 서열식별번호: 32의 서열을 포함하는 단리된 핵산.
- 제66항 내지 제77항 중 어느 한 항에 있어서, 인간 가용성 IL1Rα (서열식별번호: 35)의 발현을 추가로 유도하는 단리된 핵산.
- 가용성 폴리스타틴 (sFST)을 코딩하는 핵산 서열을 포함하는 제1 트랜스진 및 TNFR2를 코딩하는 핵산 서열을 포함하는 제2 트랜스진을 포함하며, 여기서 제1 및 제2 트랜스진은 프로모터에 작동가능하게 연결된 것인 단리된 핵산.
- 제79항에 있어서, 인공 miRNA (ami-RNA)를 코딩하는 트랜스진을 추가로 포함하는 단리된 핵산.
- 제80항에 있어서, ami-RNA가 miR-122를 포함하는 것인 단리된 핵산.
- 제80항에 있어서, miR-122가 3'-비번역 영역 (3'-UTR)에 위치하는 것인 단리된 핵산.
- 제79항에 있어서, 프로모터가 닭 베타-액틴 (CBA) 프로모터인 단리된 핵산.
- 제79항에 있어서, 프로모터가 pBRE/pNF-kB 프로모터인 단리된 핵산.
- 제79항 내지 제84항 중 어느 한 항에 있어서, 벡터 내에 위치하는 단리된 핵산.
- 제85항에 있어서, 벡터가 AAV 벡터인 단리된 핵산.
- 제79항 내지 제86항 중 어느 한 항에 있어서, 서열식별번호: 33의 서열을 포함하는 단리된 핵산.
- 제80항 내지 제82항 중 어느 한 항에 있어서, miR-122가 서열식별번호: 34의 서열을 포함하는 재조합 AAV 벡터 내로 통합된 것인 단리된 핵산.
- 제79항 내지 제87항 중 어느 한 항에 있어서, sFST 및/또는 TNFR2의 발현이 TNF 및 액티빈 A의 활성화를 억제하는 것인 단리된 핵산.
- 진행성 골화성 섬유이형성증 (FOP)을 갖거나 갖는 것으로 의심되는 대상체에게 제1항 내지 제13항, 제15항 내지 제25항, 제36항 내지 제48항 및 제65항 내지 제88항 중 어느 한 항의 단리된 핵산, 제14항, 제26항 내지 제35항 및 제49항 내지 제51항 중 어느 한 항의 벡터, 제51항 내지 제61항 중 어느 한 항의 재조합 유전자 편집 복합체, 또는 제62항 내지 제64항 중 어느 한 항의 rAAV를 투여하는 것을 포함하는, 상기 대상체를 치료하는 방법.
- 대상체에게 제1항 내지 제13항, 제15항 내지 제25항, 제36항 내지 제48항 및 제65항 내지 제88항 중 어느 한 항의 단리된 핵산, 제14항, 제26항 내지 제35항 및 제49항 내지 제51항 중 어느 한 항의 벡터, 제51항 내지 제61항 중 어느 한 항의 재조합 유전자 편집 복합체, 또는 제62항 내지 제64항 중 어느 한 항의 rAAV를 투여하는 것을 포함하는, 대상체에서 이소성 골화를 억제하는 방법.
- 진행성 골화성 섬유이형성증 (FOP)을 갖거나 갖는 것으로 의심되는 대상체에게 제1항 내지 제13항, 제15항 내지 제25항, 제36항 내지 제48항 및 제65항 내지 제88항 중 어느 한 항의 단리된 핵산, 제14항, 제26항 내지 제35항 및 제49항 내지 제51항 중 어느 한 항의 벡터, 제51항 내지 제61항 중 어느 한 항의 재조합 유전자 편집 복합체, 또는 제62항 내지 제64항 중 어느 한 항의 rAAV를 투여하는 것을 포함하는, 상기 대상체에서 플레어-업 상태를 개선시키는 방법.
- 세포에 제1항 내지 제13항, 제15항 내지 제25항, 제36항 내지 제48항 및 제65항 내지 제88항 중 어느 한 항의 단리된 핵산, 제14항, 제26항 내지 제35항 및 제49항 내지 제51항 중 어느 한 항의 벡터, 제51항 내지 제61항 중 어느 한 항의 재조합 유전자 편집 복합체, 또는 제62항 내지 제64항 중 어느 한 항의 rAAV를 전달하는 것을 포함하는, 세포에서 ACVR1 발현을 억제하는 방법.
- 제90항 내지 제93항 중 어느 한 항에 있어서, 대상체가 돌연변이체 ACVR1 단백질, 임의로 ACVR1-R206H 단백질을 코딩하는 핵산 서열을 포함하는 것인 방법.
- 제90항 내지 제94항 중 어느 한 항에 있어서, 대상체가 포유동물 대상체, 임의로 인간 대상체인 방법.
- 제90항 내지 제95항 중 어느 한 항에 있어서, 투여 또는 전달이 주사에 의해 이루어지고, 임의로 여기서 주사는 정맥내 주사인 방법.
- 제90항 내지 제95항 중 어느 한 항에 있어서, 투여 또는 전달이 제62항 내지 제64항 중 어느 한 항의 rAAV를 포함하는 조직 또는 이식편을 대상체 내로 이식하는 것에 의해 이루어지는 것인 방법.
- 제90항 내지 제95항 중 어느 한 항에 있어서, 투여 또는 전달이 진피간 전달에 의해 이루어지는 것인 방법.
- 제90항 내지 제97항 중 어느 한 항에 있어서, 투여 또는 전달이 대상체에서 이소성 골화의 감소 및/또는 플레어-업 상태의 감소를 발생시키는 것인 방법.
- 제90항 내지 제97항 중 어느 한 항에 있어서, 투여 또는 전달이 돌연변이체 ACVR1 단백질의 감소된 발현을 발생시키는 것인 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063121221P | 2020-12-03 | 2020-12-03 | |
US63/121,221 | 2020-12-03 | ||
US202163251822P | 2021-10-04 | 2021-10-04 | |
US63/251,822 | 2021-10-04 | ||
PCT/US2021/061653 WO2022120080A1 (en) | 2020-12-03 | 2021-12-02 | Development of novel gene therapeutics for fibrodysplasia ossificans progressiva |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230117177A true KR20230117177A (ko) | 2023-08-07 |
Family
ID=81850431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237022052A KR20230117177A (ko) | 2020-12-03 | 2021-12-02 | 진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의개발 |
Country Status (4)
Country | Link |
---|---|
US (2) | US11674154B2 (ko) |
EP (1) | EP4255457A1 (ko) |
KR (1) | KR20230117177A (ko) |
WO (1) | WO2022120080A1 (ko) |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5549910A (en) | 1989-03-31 | 1996-08-27 | The Regents Of The University Of California | Preparation of liposome and lipid complex compositions |
US5252334A (en) | 1989-09-08 | 1993-10-12 | Cygnus Therapeutic Systems | Solid matrix system for transdermal drug delivery |
JP3218637B2 (ja) | 1990-07-26 | 2001-10-15 | 大正製薬株式会社 | 安定なリポソーム水懸濁液 |
JP2958076B2 (ja) | 1990-08-27 | 1999-10-06 | 株式会社ビタミン研究所 | 遺伝子導入用多重膜リポソーム及び遺伝子捕捉多重膜リポソーム製剤並びにその製法 |
US5399363A (en) | 1991-01-25 | 1995-03-21 | Eastman Kodak Company | Surface modified anticancer nanoparticles |
US5478745A (en) | 1992-12-04 | 1995-12-26 | University Of Pittsburgh | Recombinant viral vector system |
US5543158A (en) | 1993-07-23 | 1996-08-06 | Massachusetts Institute Of Technology | Biodegradable injectable nanoparticles |
US5741516A (en) | 1994-06-20 | 1998-04-21 | Inex Pharmaceuticals Corporation | Sphingosomes for enhanced drug delivery |
US5795587A (en) | 1995-01-23 | 1998-08-18 | University Of Pittsburgh | Stable lipid-comprising drug delivery complexes and methods for their production |
US5697899A (en) | 1995-02-07 | 1997-12-16 | Gensia | Feedback controlled drug delivery system |
IE80468B1 (en) | 1995-04-04 | 1998-07-29 | Elan Corp Plc | Controlled release biodegradable nanoparticles containing insulin |
US5738868A (en) | 1995-07-18 | 1998-04-14 | Lipogenics Ltd. | Liposome compositions and kits therefor |
US6001650A (en) | 1995-08-03 | 1999-12-14 | Avigen, Inc. | High-efficiency wild-type-free AAV helper functions |
US5656016A (en) | 1996-03-18 | 1997-08-12 | Abbott Laboratories | Sonophoretic drug delivery system |
US5797898A (en) | 1996-07-02 | 1998-08-25 | Massachusetts Institute Of Technology | Microchip drug delivery devices |
US5783208A (en) | 1996-07-19 | 1998-07-21 | Theratech, Inc. | Transdermal drug delivery matrix for coadministering estradiol and another steroid |
US5779708A (en) | 1996-08-15 | 1998-07-14 | Cyberdent, Inc. | Intraosseous drug delivery device and method |
US6156303A (en) | 1997-06-11 | 2000-12-05 | University Of Washington | Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom |
DE69942782D1 (de) * | 1998-11-27 | 2010-10-28 | Ucb Sa | Zusammensetzungen und Verfahren zur Erhöhung der Knochenmineralisierung |
US8859752B2 (en) * | 2006-04-18 | 2014-10-14 | The Trustees Of The University Of Pennsylvania | SIRNA-based therapy of Fibrodyplasia Ossificans Progressiva (FOP) |
WO2007127428A2 (en) * | 2006-04-28 | 2007-11-08 | University Of Florida Research Foundation, Inc. | Double-stranded/self-complementary vectors with a truncated cba promoter and methods of gene delivery |
US8785395B2 (en) * | 2010-05-03 | 2014-07-22 | The Texas A & M University System | Adult stem cells/progenitor cells and stem cell proteins for treatment of eye injuries and diseases |
DE102013111099B4 (de) * | 2013-10-08 | 2023-11-30 | Eberhard Karls Universität Tübingen Medizinische Fakultät | Permanente Genkorrektur mittels nukleotidmodifizierter messenger RNA |
WO2016131009A1 (en) * | 2015-02-13 | 2016-08-18 | University Of Massachusetts | Compositions and methods for transient delivery of nucleases |
US11046955B2 (en) * | 2015-04-24 | 2021-06-29 | University Of Massachusetts | Modified AAV constructs and uses thereof |
WO2020118011A1 (en) * | 2018-12-06 | 2020-06-11 | Alexion Pharmaceuticals, Inc. | Anti-alk2 antibodies and uses thereof |
JP2022520148A (ja) * | 2018-12-06 | 2022-03-29 | アークトゥラス・セラピューティクス・インコーポレイテッド | 修飾タンパク質および関連の処置方法 |
-
2021
- 2021-12-02 EP EP21901481.8A patent/EP4255457A1/en active Pending
- 2021-12-02 WO PCT/US2021/061653 patent/WO2022120080A1/en unknown
- 2021-12-02 US US17/541,141 patent/US11674154B2/en active Active
- 2021-12-02 KR KR1020237022052A patent/KR20230117177A/ko unknown
-
2023
- 2023-04-21 US US18/304,472 patent/US20230295662A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220177915A1 (en) | 2022-06-09 |
US20230295662A1 (en) | 2023-09-21 |
EP4255457A1 (en) | 2023-10-11 |
WO2022120080A1 (en) | 2022-06-09 |
US11674154B2 (en) | 2023-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021204620A1 (en) | Central nervous system targeting polynucleotides | |
AU774643B2 (en) | Compositions and methods for use in recombinational cloning of nucleic acids | |
KR20180097631A (ko) | 핵산을 와우 및 전정 세포에 전달하기 위한 물질 및 방법 | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
JP2023036921A (ja) | 蝸牛および前庭細胞に核酸を送達するための物質および方法 | |
AU2016343979A1 (en) | Delivery of central nervous system targeting polynucleotides | |
US20040003420A1 (en) | Modified recombinase | |
KR102628872B1 (ko) | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 | |
CN111733174B (zh) | 一种分离的核酸分子及其用途 | |
US11939594B2 (en) | Engraftable cell-based immunotherapy for long-term delivery of therapeutic proteins | |
BRPI0806354A2 (pt) | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados | |
KR101921698B1 (ko) | 재조합에 의해 제조된 인간 인자 ⅷ 및 ⅸ | |
CA3060523A1 (en) | A platform for t lymphocyte genome engineering and in vivo high-throughput screening thereof | |
CN112912112A (zh) | 肝特异性核酸调节元件以及其方法及用途 | |
KR20210151916A (ko) | 뒤시엔느 근육 이영양증의 치료를 위한 aav 벡터-매개된 큰 돌연변이 핫스팟의 결실 | |
EP1943265A2 (en) | Regulatable fusion promoters | |
CN108992665B (zh) | 基于重组减毒单增李斯特菌的宫颈癌治疗性疫苗 | |
CN114008209A (zh) | Aav介导的枫糖尿症(msud)基因疗法 | |
CN109010819B (zh) | 重组减毒李斯特菌在制备宫颈癌治疗性疫苗中的应用 | |
EP1395612A2 (en) | Modified recombinase | |
KR20220142502A (ko) | 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도 | |
KR20230117177A (ko) | 진행성 골화성 섬유이형성증을 위한 신규 유전자 치료제의개발 | |
KR20240032025A (ko) | 내이의 세포 유형-특이적 유전자 발현을 위한 조성물 및 방법 | |
CN113260704B (zh) | CYP4V2和RdCVF在制备药物中的用途 | |
NL2027815B1 (en) | Genomic integration |