KR20220107222A - 마이크로디스트로핀 유전자 치료 작제물 및 이의 용도 - Google Patents

마이크로디스트로핀 유전자 치료 작제물 및 이의 용도 Download PDF

Info

Publication number
KR20220107222A
KR20220107222A KR1020227021099A KR20227021099A KR20220107222A KR 20220107222 A KR20220107222 A KR 20220107222A KR 1020227021099 A KR1020227021099 A KR 1020227021099A KR 20227021099 A KR20227021099 A KR 20227021099A KR 20220107222 A KR20220107222 A KR 20220107222A
Authority
KR
South Korea
Prior art keywords
nucleic acid
seq
acid sequence
dystrophin
aav
Prior art date
Application number
KR1020227021099A
Other languages
English (en)
Inventor
춘핑 치아오
데빈 맥두걸드
예 리우
올리비에 다노스
Original Assignee
리젠엑스바이오 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 리젠엑스바이오 인크. filed Critical 리젠엑스바이오 인크.
Publication of KR20220107222A publication Critical patent/KR20220107222A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4707Muscular dystrophy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • A61K35/761Adenovirus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/1703Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • A61K38/1709Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4707Muscular dystrophy
    • C07K14/4708Duchenne dystrophy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/035Animal model for multifactorial diseases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14151Methods of production or purification of viral material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Epidemiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Neurology (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

유전자 요법에 사용하기 위한 마이크로디스트로핀 단백질을 인코딩하는 새로운 유전자 작제물에 부분적으로 기초한 발명이 제공된다. 근육 세포 및/또는 CNS 세포에서 바이러스 벡터에 의해 발현될 때 대상체에 대한 효능, 역가 및 안전성과 관련하여 개선된 요법을 위해 마이크로디스트로핀 유전자 작제물 및 발현 카세트를 조작하였다.

Description

마이크로디스트로핀 유전자 치료 작제물 및 이의 용도
0. 서열 목록
본원은 ASCII 형식으로 전자적으로 제출되었고, 그 전체 내용이 참조로 포함된 서열 목록을 포함한다. 2020년 11월 25일에 생성된 ASCII 사본의 이름은 38013_0009P1_Sequence_Listing.txt이며 크기는 249,417바이트이다.
1. 발명의 분야
본 발명은 새로운 마이크로디스트로핀 및 유전자 요법 벡터, 예컨대 새로운 마이크로디스트로핀을 인코딩하는 재조합 AAV 벡터뿐만 아니라 그의 조성물 및 용도 및 그를 사용한 치료 방법에 관한 것이다.
2. 배경
디스트로핀병증(dystrophinopathy)이라고 하는 신경근육 질환 그룹은 DMD 유전자의 돌연변이로 인해 발생한다. 각 디스트로핀병증은 뚜렷한 표현형을 가지며, 모든 환자는 근육 강도 쇠약 및 궁극적으로 다양한 중증도의 심근병증을 앓고 있다. 뒤센(Duchenne) 근이영양증(DMD)은 3,600 내지 9,200명의 살아있는 남성 출생 중 약 1명에게 영향을 미치는 심각한 X 관련 진행성 신경근육 질환이다. 이 장애는 디스트로핀 단백질의 발현을 없애는 디스트로핀 유전자의 틀이동 돌연변이에 의해 유발된다. 디스트로핀 단백질, 골격근, 궁극적으로 심장 및 호흡기 근육(예를 들어, 늑골간 근육 및 횡격막)의 결여로 인해 퇴화되어 조기 사망을 유발한다. 진행성 쇠약 및 근위축은 유년기에 시작된다. 병든 개인은 호흡 곤란, 호흡기 감염 및 삼키는 문제를 경험한다. 거의 모든 DMD 환자에서 심근병증이 발생한다. 심장 관여에 의해 악화된 폐렴은 가장 흔한 사망 원인이며 30대 이전에 자주 발생한다.
베커 근이영양증(BMD)은 DMD보다 증상이 덜 심각하지만 여전히 조기 사망으로 이어진다. DMD와 비교하여, BMD는 나중에 발병하는 골격근 쇠약이 특징이다. DMD 환자는 13세 이전에 휠체어에 의존하는 반면, BMD 환자는 16세 이후에 보행을 하지 못하고 휠체어가 필요하다. BMD 환자는 또한 DMD 환자와 달리 목 굽힘근 강도의 보존을 나타낸다. 경미한 골격근 관여에도 불구하고, DMD-관련 확장성 심근병증(DCM)으로 인한 심부전은 평균적으로 40대 중반에 발생하는 BMD의 흔한 이환율 및 가장 흔한 사망 원인이다.
디스트로핀은 DMD 유전자에 의해 인코딩된 세포질 단백질이며 세포골격 액틴 필라멘트를 막 단백질에 연결하는 기능을 한다. 일반적으로, 골격근 및 심장근에 주로 위치하는 디스트로핀 단백질은 뇌에서 발현되는 양이 적고 수축 장치의 액틴을 각 근섬유를 둘러싸고 있는 결합 조직의 층에 연결하여 근섬유 수축 시 충격흡수장치(shock absorber) 역할을 한다. 근육에서, 디스트로핀은 횡문근형질 막의 세포질면에 국한된다.
DMD 유전자는 알려진 가장 큰 인간 유전자이다. DMD 또는 BMD를 유발하는 가장 흔한 돌연변이는 하나 이상의 엑손의 큰 결실 돌연변이(60-70%)지만, 그러나 중복 돌연변이(5-10%) 및 단일 뉴클레오티드 변이체 (소형 결실 또는 삽입, 단일-염기 변화, 및 스플라이스 부위 변화가 DMD를 갖는 남성에서 병원성 변이체의 대략 25-35% 및 BMD를 갖는 남성의 약 10-20%를 차지하는 것 포함)는 또한 병원성 디스트로핀 변이체를 야기할 수 있다. DMD에서, 돌연변이는 조기 정지 코돈 및 말단절단된, 비기능적 또는 불안정한 단백질을 초래하는 프레임 이동으로 종종 이어진다. 넌센스 점 돌연변이는 동일한 결과를 갖는 조기 종결 코돈을 또한 초래할 수 있다. DMD를 유발하는 돌연변이는 임의의 엑손에 영향을 미칠 수 있지만, 엑손 2-20 및 45-55는 대규모 결실 및 중복 돌연변이에 대한 일반적인 핫스팟이다. 프레임 내 결실은 환자가 말단절단된, 부분적으로 기능적인 디스트로핀을 발현하는 덜 심각한 베커 근이영양증(BMD)을 초래한다.
전장 디스트로핀은 기능에 기여하는 다수의 하위 도메인을 포함하는 큰(427 kDa) 단백질이다. 이들 하위도메인은 아미노-말단으로부터 카복시-말단을 향하여 순서대로 N-말단 액틴-결합 도메인, 중앙의 소위 "막대(rod)" 도메인, 시스테인-풍부 도메인, 마지막으로 카복시-말단 도메인 또는 영역을 포함한다. 막대 도메인은 하기 순서로 4개의 프롤린-풍부 힌지 도메인(약어 H)과 24개의 스펙트린-유사 반복부(약어 R)로 구성되어 있다: 제1 힌지 도메인 (H1), 3개의 스펙트린-유사 반복부 (R1, R2, R3), 제2 힌지 도메인 (H2), 16개 초과의 스펙트린-유사 반복부 (R4, R5, R6, R7, R8, R9, R10, R11, R12, R13, R14, R15, R16, R17, R18, R19), 제3 힌지 도메인 (H3), 5개 초과의 스펙트린-유사 반복부 (R20, R21, R22, R23, R24), 및 제4 힌지 도메인 (H4) (WW 도메인 포함). 막대 도메인 다음에는, 시스테인-풍부 도메인 및 COOH (C)-말단 (CT) 도메인이 있다.
다양한 희귀 질환을 잠재적으로 치료하기 위한 아데노 관련 바이러스(AAV) 매개 유전자 요법의 사용이 발전함에 따라, AAV가 DMD, BMD 및 덜 심각한 디스트로핀병증을 치료하는 데 사용될 수 있다는 희망과 관심이 있었다. AAV 벡터의 페이로드 크기에 대한 제한으로 인해, 전장 단백질의 적어도 일부 기능을 유지하면서 비필수 하위도메인을 제거하는 더 작은 버전의 디스트로핀인 마이크로- 또는 미니-디스트로핀을 만드는 데 관심이 집중되었다. DMD에 대한 동물 모델인 mdx 마우스에서 AAV-매개 미니디스트로핀 유전자 요법은 근육에서 효율적인 발현 및 개선된 근육 기능을 나타내는 것으로 보고되었다(예를 들어, [Wang 등, J. Orthop. Res. 27:421 (2009)] 참조).
따라서, DMD 또는 BMD를 갖는 대상체의 형질도입된 세포에서 효과적인 수준으로 발현될 수 있고 바람직하게는 치료 단백질에 대한 면역 반응을 최소화할 수 있는 마이크로- 또는 미니-디스트로핀을 인코딩하는 AAV 벡터가 당업계에 필요하다.
3. 발명의 요약
유전자 요법에 사용하기 위한 마이크로디스트로핀 단백질을 인코딩하는 새로운 유전자 작제물에 부분적으로 기초한 발명이 제공된다. 근육 세포 및/또는 CNS 세포에서 바이러스 벡터에 의해 발현될 때 대상체에 대한 효능, 역가(potency) 및 안전성과 관련하여 개선된 요법을 위해 마이크로디스트로핀 유전자 작제물 및 발현 카세트를 조작하였다. 생체내 치료 모델에 기초하여, 본 개시내용의 마이크로디스트로핀 유전자 요법은 그립 강도(grip strength), 최대 및 특정 근육 강도의 측정된 개선 및/또는 기관 및 근육 중량의 감소를 나타내었다. 따라서, 개선된 유전자 요법 벡터, 예를 들어, 마이크로디스트로핀 단백질의 유전자 요법 발현을 위한 이들 작제물을 포함하는 재조합 AAV 벡터, 예컨대 재조합 AAV8 또는 AAV9 벡터, 및 치료 방법에서 이들 유전자 요법 벡터를 사용하는 방법 및 본원에 기재된 바와 같이 이들 유전자 요법 벡터를 제조하는 방법이 제공된다.
N-말단 액틴 결합 도메인 및 힌지, 막대 및 스펙트린 도메인의 하위세트, 이어서 시스테인-풍부 도메인, 및 선택적으로 C-말단 도메인의 모든 또는 일부, 예를 들어 나선 1-함유 부분을 포함하는 마이크로디스트로핀 단백질 및 이를 인코딩하는 핵산 작제물이 제공된다. 특정 구현예에서, 마이크로디스트로핀은 C-말단 도메인의 전부 또는 일부, 또는 그의 α1-신트로핀 및/또는 α-디스트로브레빈 결합 부분을 갖는다. C-말단 도메인을 갖는 마이크로디스트로핀, 또는 그의 α1-신트로핀 및/또는 α-디스트로브레빈 결합 부분은 개선된 심장-보호 활성을 가질 수 있고/있거나 약화된 심장근 기능의 개선 또는 진행 감소/지연을 초래할 수 있다.
작제물을 인코딩하는 예시적인 마이크로디스트로핀은 도 1a22에 예시되어 있다. 본원에 기재된 구현예는 아미노 말단으로부터 카복시 말단까지 하기를 갖는 마이크로디스트로핀 단백질이다:
ABD-H1-R1-R2-R3-H3-R24-H4-CR,
ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT
ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT, 또는
ABD-H1-R1-R2-R16-R17-R24-H4-CR,
여기서 ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R3은 디스트로핀의 스펙트린 3 영역이고, H3은 디스트로핀의 힌지 3 영역이고, R16은 디스트로핀의 스펙트린 16 영역이고, R17은 디스트로핀의 스펙트린 17 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, CR은 디스트로핀의 시스테인-풍부 영역, 또는 β-디스트로글리칸에 결합하는 그의 적어도 일부이고, 그리고 CT는 디스트로핀의 C-말단 영역의 적어도 일부이고, 상기 일부는 α1-신트로핀 결합 부위 및/또는 α-디스트로브레빈 결합 부위를 포함한다. 특정 구현예에서, CT 도메인은 서열번호: 35, 70, 또는 83의 아미노산 서열을 갖는다. 특정 구현예에서, H3 도메인은 서열번호: 11의 전체 서열이다. CR 도메인은 전장 CR 도메인 또는 단축 CR 도메인, 특히 β-디스트로글리칸에 결합하는 단축 CR 도메인일 수 있다. 특정 구현예에서, CR 도메인은 서열번호: 15 또는 90의 아미노산 서열을 갖는다. 특정 구현예에서, 내인성 링커 서열은 도메인을 연결하고, 예를 들어 내인성 인간 디스트로핀 단백질에서 R23과 R24 사이의 링커의 전체 또는 3개 아미노산 부분은 H3 도메인 및 R24 도메인을 연결한다. 대안적으로, 일부 구현예에서, H3은 디스트로핀(H2)의 힌지 2 영역으로 치환될 수 있다.
본원에 제공된 마이크로디스트로핀은 (1) 액틴, β-디스트로글리칸, α1-신트로핀, α-디스트로브레빈, 및 nNOS (α1-신트로핀을 통해 간접적으로 결합하는 nNOS 포함) 중 하나, 조합 또는 모두에 결합하는 것; (2) 동물 모델(예를 들어, 본원에 기재된 mdx 마우스 모델에서) 또는 인간 대상체에서 개선된 근육 기능을 촉진하거나 근육 기능 감소의 진행을 늦추는 것; 및/또는 (3) 동물 모델 또는 인간 환자에서 심장 보호 기능을 갖거나 심장근 기능의 개선 또는 심장 기능 장애의 약화를 촉진하거나 심장 기능의 퇴행의 진행을 늦추는 것과 같은 디스트로핀 기능 (도 13 참조)을 나타낸다.
특정 구현예에서, 마이크로디스트로핀은 서열번호: 1, 2, 79, 91, 92, 또는 93의 아미노산 서열을 갖는다.
유전자 요법에 사용하기 위한 이식유전자(transgene) 또는 유전자 카세트를 포함하는 마이크로디스트로핀을 인코딩하는 핵산이 본원에서 제공된다. 구현예에서, 마이크로디스트로핀은 서열번호: 20, 21, 81, 101, 102, 또는 103의 뉴클레오티드 서열 또는 서열번호: 1, 2, 79, 91, 92, 또는 93의 아미노산 서열을 인코딩하는 임의의 뉴클레오티드 서열에 의해 인코딩된다. 예시적인 작제물은 도 1a22에 예시되어 있다. 특정 구현예에서, 작제물은 마이크로디스트로핀 인코딩 서열의 인트론 5'를 포함한다. 일부 구현예에서, 인트론의 길이는 100개 미만의 뉴클레오티드이다. 특정 구현예에서, 작제물은 인간 면역글로불린 중쇄 가변 영역(VH) 4(VH4) 인트론을 포함하고 인트론은 마이크로디스트로핀 인코딩 서열의 5'에 위치한다. VH4 인트론의 존재는 VH4 인트론을 갖지 않는 핵산 작제물로부터의 발현에 비해 세포에서 마이크로디스트로핀의 개선된 발현을 유도할 수 있다.
본원에서 제공되는 이식유전자는 근육 세포(골격근, 심장근 및/또는 평활근 포함) 및/또는 CNS 세포와 같은 적절한 세포 유형에서 마이크로디스트로핀의 발현을 유도하는 프로모터를 함유한다. 재조합 AAV 벡터 요법과 같은 유전자 요법에 사용되는 이식유전자의 크기를 줄이는 것은 재조합 AAV 벡터의 효능 및 효율성을 개선시킬 수 있다. 프로모터는 근육 특이적 프로모터, CNS 특이적 프로모터, 또는 둘 모두인 이식유전자가 본원에 제공된다. 특정 구현예에서, 프로모터는 길이가 350kb 미만인 근육 특이적 프로모터이다. 일부 구현예에서, 프로모터는 SPc5-12 프로모터(서열번호: 39)이다. 프로모터는 마이크로디스트로핀의 발현을 지시하는 말단절단된 SPc5-12 프로모터(서열번호: 40)이고 본원에 보다 완전하게 기재된 바와 같은 SPc5-12 프로모터보다 짧은 이식유전자가 본원에 제공된다. 특정 구현예에서, 프로모터는 CNS 특이적 프로모터이다.
또한, 마이크로디스트로핀 코딩 서열은 증가된 발현을 위해 코돈 최적화된 이식유전자 또는 유전자 카세트가 제공된다. 추가로 또는 대안적으로, 마이크로디스트로핀 코딩 서열 및/또는 이식유전자 서열은 CpG가 고갈되어 면역원성을 감소시킬 수 있다. 일부 구현예에서, 마이크로디스트로핀 이식유전자는 2개 미만의 CpG 섬, 또는 1개의 CpG 섬(특히, 본원에 정의된 바와 같음)을 갖고 특정 구현예에서 CpG 섬을 갖지 않는다. 2개 미만, 1개 미만 또는 0개의 CpG 섬을 갖는 이식유전자는 2개 초과의 CpG 섬을 갖는 마이크로디스트로핀 작제물과 비교하여 항-약물 항체 역가(titer)에 의해 측정시 감소된 면역원성을 갖는다.
예시적인 유전자 카세트 또는 이식유전자를 인코딩하는 서열번호: 53, 54, 55, 56, 82, 104, 105, 또는 106의 뉴클레오티드 서열을 포함하는 핵산이 본원에서 제공된다.
본원에 기재된 이식유전자를 전달하기 위한 재조합 벡터는 비-복제 재조합 아데노-관련 바이러스 벡터(rAAV)를 포함하고, AAV8 또는 AAV9 혈청형 또는 마이크로디스트로핀 코딩 서열을, 근육 세포로 전달하기에 적합한 임의의 다른 혈청형일 수 있으며, 상기 세포는 골격근 및 심장근 둘 다, 및/또는 마이크로디스트로핀을 발현하고 환자에게 추가적인 이점을 제공하고/하거나 근육 세포에 전달할 CNS 세포를 포함한다.
또한, 약제학적으로 허용 가능한 부형제를 포함하는 본원에서 제공되는 마이크로디스트로핀을 인코딩하는 재조합 벡터를 포함하는 약제학적 조성물 및 필요로 하는 대상체에게 본원에 기재된 유전자 요법 벡터를 투여함으로써 임의의 디스트로핀병증, 예컨대 뒤센(Duchenne) 근이영양증 (DMD) 및 베커(Duchenne) 근이영양증 (BMD), X 관련 확장성 심근병증뿐만 아니라 DMD 또는 BMD 여성 보인자에 대한 치료 방법이 제공된다. 마이크로디스트로핀이 근육(골격근, 심장근 및/또는 평활근 포함) 및/또는 CNS에 전달되도록 이를 필요로 하는 대상체에게 투여함으로써, 본원에 기재된 이식유전자 또는 유전자 카세트를 함유하는 rAAV의 투여에 의해, 디스트로핀병증, 예컨대 뒤센 근이영양증 (DMD) 및 베커 근이영양증 (BMD), X 관련 확장성 심근증을 치료하고, 그 증상을 개선하거나 관리하는 방법이 제공된다. 특정 구현예에서, rAAV는 전신 투여된다.
또한, 바이러스 벡터, 특히 AAV 기반 바이러스 벡터의 제조 방법, 및 이를 생산하기 위한 숙주 세포가 제공된다. 특정 구현예에서, AAV ITR이 플랭킹된 시스 발현 카세트로서, 인간 세포에서 이식유전자의 발현을 제어할 발현 제어 요소에 작동가능하게 연결된 치료 마이크로디스트로핀을 인코딩하는 이식유전자를 포함하는 시스 발현 카세트; AAV ITR이 결여된 트랜스 발현 카세트로서, 배양 중인 숙주 세포에서 AAV rep 및 캡시드 단백질의 발현을 구동하고 rep 및 cap 단백질을 트랜스로 공급하는 발현 제어 요소에 작동가능하게 연결된 AAV rep 및 캡시드 단백질을 인코딩하는 트랜스 발현 카세트; AAV 캡시드 단백질에 의한 인공 게놈의 복제 및 패키징을 허용하기 위한 충분한 아데노바이러스 헬퍼 기능을 포함하는 인공 게놈을 함유하는 숙주 세포를 배양하는 단계; 및 세포 배양물로부터 인공 게놈을 캡시드화하는 재조합 AAV를 회수하는 단계를 포함하는, 재조합 AAV를 생산하는 방법이 제공된다.
본 발명은 마이크로디스트로핀 벡터의 구축 및 제조 및 유효성을 입증하는 시험관내 및 생체내 검정을 기술하는 하기 실시예에 의해 설명된다.
예시적인 구현예
1. 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열을 포함하는 핵산 조성물로서, 상기 마이크로디스트로핀 단백질은 아미노 말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인: ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT을 포함하거나 이로 구성되고, 여기서 ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R3은 디스트로핀의 스펙트린 3 영역이고, H3은 디스트로핀의 힌지 3 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, H4는 디스트로핀의 힌지 4 영역이고, CR은 디스트로핀의 시스테인-풍부 영역 또는 이의 β-디스트로글리칸 결합 부분이고, 그리고 CT는 디스트로핀의 C-말단 영역 또는 α1-신트로핀 결합 부위 또는 디스트로브레빈 결합 부위를 포함하는 C-말단 영역의 일부인, 핵산 조성물.
2. 구현예 1에 있어서, (1) 서열번호: 1 또는 91의 아미노산 서열을 갖는 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열, 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 치료적으로 기능적인 마이크로디스트로핀 단백질을 인코딩하는 그의 역보체를 포함하거나, 또는 (2) 서열번호: 20 또는 100의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 상기 핵산 서열은 치료적으로 기능적인 마이크로디스트로핀 단백질을 인코딩하는, 핵산 조성물.
3. 구현예 1에 있어서, (1) 서열번호: 79의 아미노산 서열을 갖는 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열, 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 치료적으로 기능적인 마이크로디스트로핀 단백질을 인코딩하는 그의 역보체를 포함하거나, 또는 (2) 서열번호: 81의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 상기 핵산은 치료적으로 기능적인 마이크로디스트로핀 단백질을 인코딩하는, 핵산 조성물.
4. 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열의 5' 말단에 커플링된 인트론(I)을 포함하는 핵산 서열을 포함하는 핵산 조성물로서, 상기 마이크로디스트로핀 단백질은 아미노 말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인: ABD-H1-R1-R2-R3-H3-R24-H4-CR을 포함하거나 이로 구성되고, ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R3은 디스트로핀의 스펙트린 3 영역이고, H3은 디스트로핀의 힌지 3 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, H4는 디스트로핀의 힌지 4 영역이고, CR은 디스트로핀의 시스테인-풍부 영역인, 핵산 조성물.
5. 구현예 4에 있어서, (1) 서열번호: 2의 아미노산 서열을 갖는 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나, 또는 (2) 서열번호: 21의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 상기 핵산은 치료적으로 기능적인 디스트로핀을 인코딩하는, 핵산 조성물.
6. 구현예 1 내지 3에 있어서, 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열의 5' 말단에 커플링된 인트론(I)을 추가로 포함하는, 핵산 조성물.
7. 구현예 4 내지 6 중 어느 하나에 있어서, I는 마이크로디스트로핀 인코딩 서열의 5'에 위치한 인간 면역글로불린 중쇄 가변 영역 (VH) 4 인트론(VH4) 또는 SV40 인트론 또는 키메라 인트론인, 핵산 조성물.
8. 구현예 7에 있어서, VH4 인트론을 인코딩하는 핵산 서열은 서열번호: 41의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 VH4 인트론 서열이 결여된 기준 핵산에 비해 마이크로디스트로핀 발현을 증가시키고; 키메라 인트론을 인코딩하는 핵산 서열은 서열번호: 75의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 키메라 인트론 서열이 결여된 기준 핵산에 비해 마이크로디스트로핀 발현을 증가시키거나; 또는 SV40 인트론을 인코딩하는 핵산 서열은 서열번호: 76의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 키메라 인트론 서열이 결여된 기준 핵산에 비해 마이크로디스트로핀 발현을 증가시키는, 핵산 조성물.
9. 구현예 1-3 또는 6-8 중 어느 하나에 있어서, CT 도메인을 인코딩하는 핵산 서열은 서열번호: 35의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CT 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 α1-신트로핀, β-신트로핀, 및/또는 디스트로브레빈에 대한 마이크로디스트로핀의 결합을 증가시키고; 상기 CT 도메인을 인코딩하는 핵산 서열은 서열번호: 70의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CT 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 α1-신트로핀, β-신트로핀, 및/또는 디스트로브레빈에 대한 마이크로디스트로핀의 결합을 증가시키거나; 또는 최소 CT 도메인을 인코딩하는 핵산 서열은 서열번호: 80의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CT 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 α1-신트로핀에 대한 마이크로디스트로핀 단백질의 결합을 증가시키는, 핵산 조성물.
10. 구현예 9에 있어서, CT 도메인은 서열번호: 16 또는 83의 아미노산 서열을 갖거나 서열번호: 84의 아미노산 서열을 포함하는, 핵산 조성물.
11. 전술한 구현예 중 어느 하나에 있어서, CR 도메인을 인코딩하는 핵산 서열은 서열번호: 34 또는 69의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CR 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 β-디스트로글리칸에 대한 마이크로디스트로핀의 결합을 증가시키고; CR 도메인을 인코딩하는 핵산 서열은 서열번호: 100 또는 109의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CR 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 β-디스트로글리칸에 대한 마이크로디스트로핀의 결합을 증가시키는, 핵산 조성물.
12. 구현예 11에 있어서, CR 도메인은 서열번호: 15 또는 90의 아미노산 서열을 갖는, 핵산 조성물.
13. 전술한 구현예 중 어느 하나에 있어서, 상기 ABD를 인코딩하는 핵산 서열은 서열번호: 22 또는 57 또는 서열번호: 22 또는 57에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H1을 인코딩하는 핵산 서열은 서열번호: 24 또는 59 또는 서열번호: 24 또는 59에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R1을 인코딩하는 핵산 서열은 서열번호: 26 또는 61 또는 서열번호: 26 또는 61에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R2를 인코딩하는 핵산 서열은 서열번호: 27 또는 62 또는 서열번호: 27 또는 62에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R3을 인코딩하는 핵산 서열은 서열번호: 29 또는 64 또는 서열번호: 29 또는 64에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H2를 인코딩하는 핵산 서열은 서열번호: 38 또는 서열번호: 38에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H3을 인코딩하는 핵산 서열은 서열번호: 30 또는 65 또는 서열번호: 30 또는 65에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R24를 인코딩하는 핵산 서열은 서열번호: 32 또는 67 또는 서열번호: 32 또는 67에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H4를 인코딩하는 핵산 서열은 서열번호: 33 또는 68 또는 서열번호: 33 또는 68에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열로 구성되고; CR을 인코딩하는 핵산 서열은 서열번호: 34, 69, 100 또는 109 또는 서열번호: 34, 69, 100 또는 109에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; CT를 인코딩하는 핵산 서열은, 존재할 경우, 서열번호: 35, 70, 또는 80 또는 서열번호: 35, 70, 또는 80에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; 그리고 선택적으로, I 핵산 서열은 서열번호: 41의 핵산 서열 또는 마이크로디스트로핀을 인코딩하는 핵산 서열의 5' 말단에서 커플링된 서열번호: 41에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열인, 핵산 조성물.
14. 전술한 구현예 중 어느 하나에 있어서, ABD를 인코딩하는 핵산 서열은 서열번호: 22 또는 57로 구성되고; H1을 인코딩하는 핵산 서열은 서열번호: 24 또는 59로 구성되고; R1을 인코딩하는 핵산 서열은 서열번호: 26 또는 61로 구성되고; R2를 인코딩하는 핵산 서열은 서열번호: 27 또는 62로 구성되고; R3을 인코딩하는 핵산 서열은 서열번호: 29 또는 64로 구성되고; H2를 인코딩하는 핵산 서열은 서열번호: 38로 구성되고; H3을 인코딩하는 핵산 서열은 서열번호: 30 또는 65로 구성되고; H4를 인코딩하는 핵산 서열은 서열번호: 33 또는 68로 구성되고; R24를 인코딩하는 핵산 서열은 서열번호: 32 또는 67로 구성되고; CR을 인코딩하는 핵산 서열은 서열번호: 34, 69, 100, 또는 109로 구성되고; I는 서열번호: 41로 구성되고/거나; CT를 인코딩하는 핵산 서열은 서열번호: 35, 70 또는 80으로 구성되는, 핵산 조성물.
15. 전술한 구현예 중 어느 하나에 있어서, 상기 마이크로 디스트로핀 단백질은 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 서열: ABD-L1-H1-L2-R1-R2-L3-R3-H3-L4-R24-H4-CR-CT 또는 ABD-L1-H1-L2-R1-R2-L3-R3-H3-L4-R24-H4-CR을 포함하거나 이로 구성되고, 여기서 L1, L2, L3, 및 L4는 링커인, 핵산 조성물.
16. 전술한 구현예 중 어느 하나에 있어서, 상기 L1을 인코딩하는 핵산 서열은 서열번호: 23 또는 58을 포함하거나 이로 구성되고, L2는 서열번호: 25 또는 60을 포함하거나 이로 구성되고, L3은 서열번호: 28 또는 63을 포함하거나 이로 구성되고, 그리고 L4는 서열번호: 31, 36, 37, 66, 71 또는 72를 포함하거나 이로 구성되는, 핵산 조성물.
17. 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열을 포함하는 핵산 조성물로서, 상기 마이크로디스트로핀 단백질은 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인: ABD-H1-R1-R2-R16-R17-R24-H4-CR을 포함하거나 이로 구성되고, 여기서 ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R16은 디스트로핀의 스펙트린 16 영역이고, R17은 디스트로핀의 스펙트린 17 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, H4는 디스트로핀의 힌지 4 영역이고, 그리고 CR은 디스트로핀의 시스테인-풍부 영역인, 핵산 조성물.
18. 구현예 17에 있어서, (1) 서열번호: 93의 아미노산 서열을 갖는 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나, 또는 (2) 서열번호: 103의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 상기 핵산은 치료적으로 기능적인 마이크로디스트로핀을 인코딩하는, 핵산 조성물.
19. 구현예 17 또는 18에 있어서, CR 도메인의 C-말단 말단에 α1-신트로핀 결합 부위 및/또는 디스트로브레빈 결합 부위를 포함하는 CT 도메인을 인코딩하는 뉴클레오티드 서열을 추가로 포함하는, 핵산 조성물.
20. 구현예 19에 있어서, (1) 서열번호: 92의 아미노산 서열을 갖는 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나, 또는 (2) 서열번호: 102의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 상기 핵산은 치료적으로 기능적인 마이크로디스트로핀을 인코딩하는, 핵산 조성물.
21. 구현예 19 또는 20에 있어서, 상기 CT 도메인을 인코딩하는 핵산 서열은 서열번호: 35의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CT 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 α1-신트로핀, β-신트로핀, 및/또는 디스트로브레빈에 대한 마이크로디스트로핀의 결합을 증가시키고; 상기 CT 도메인을 인코딩하는 핵산 서열은 서열번호: 70의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CT 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 α1-신트로핀, β-신트로핀, 및/또는 디스트로브레빈에 대한 마이크로디스트로핀의 결합을 증가시키거나; 또는 최소 CT 도메인을 인코딩하는 핵산 서열은 서열번호: 80의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CT 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 α1-신트로핀에 대한 마이크로디스트로핀 단백질의 결합을 증가시키는, 핵산 조성물.
22. 구현예 17 내지 21 중 어느 하나에 있어서, 상기 ABD를 인코딩하는 핵산 서열은 서열번호: 22 또는 57 또는 서열번호: 22 또는 57에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H1을 인코딩하는 핵산 서열은 서열번호: 24 또는 59 또는 서열번호: 24 또는 59에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R1을 인코딩하는 핵산 서열은 서열번호: 26 또는 61 또는 서열번호: 26 또는 61에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R2를 인코딩하는 핵산 서열은 서열번호: 27 또는 62 또는 서열번호: 27 또는 62에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R16을 인코딩하는 핵산 서열은 서열번호: 94 또는 98 또는 서열번호: 94 또는 98에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되거나; R17을 인코딩하는 핵산 서열은 서열번호: 95 또는 99 또는 서열번호: 95 또는 99에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R24를 인코딩하는 핵산 서열은 서열번호: 32 또는 67 또는 서열번호: 32 또는 67에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H4를 인코딩하는 핵산 서열은 서열번호: 33 또는 68 또는 서열번호: 33 또는 68에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열로 구성되고; CR을 인코딩하는 핵산 서열은 서열번호: 34, 69, 100 또는 109 또는 서열번호: 34 또는 69에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; CT를 인코딩하는 핵산 서열은 서열번호: 35, 70, 또는 80 또는 기능적 활성을 갖는 마이크로디스트로핀을 인코딩하는 서열번호: 35, 70, 또는 80에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되는, 핵산 조성물.
23. 구현예 17 내지 22 중 어느 하나에 있어서, 상기 ABD를 인코딩하는 핵산 서열은 서열번호: 22 또는 57로 구성되고; H1을 인코딩하는 핵산 서열은 서열번호: 24 또는 59로 구성되고; R1을 인코딩하는 핵산 서열은 서열번호: 26 또는 61로 구성되고; R2를 인코딩하는 핵산 서열은 서열번호: 27 또는 62로 구성되고; R16을 인코딩하는 핵산 서열은 서열번호: 94 또는 98로 구성되고; R17을 인코딩하는 핵산 서열은 서열번호: 95 또는 99로 구성되고; H4를 인코딩하는 핵산 서열은 서열번호: 33 또는 68로 구성되고; R24는 서열번호: 32 또는 67로 구성되고; CR을 인코딩하는 핵산 서열은 서열번호: 34, 69, 100 또는 109로 구성되고; 그리고 존재할 경우, CT를 인코딩하는 핵산 서열은 서열번호: 35, 70 또는 80으로 구성되는, 핵산 조성물.
24. 구현예 17 내지 23에 있어서, 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열의 5' 말단에 커플링된 인트론(I)을 추가로 포함하는, 핵산 조성물.
25. 구현예 24에 있어서, I는 마이크로디스트로핀 인코딩 서열의 5'에 위치한 인간 면역글로불린 중쇄 가변 영역 (VH) 4 인트론(VH4) 또는 SV40 인트론 또는 키메라 인트론인, 핵산 조성물.
26. 구현예 25에 있어서, 상기 VH4 인트론을 인코딩하는 핵산 서열은 서열번호: 41의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 VH4 인트론 서열이 결여된 기준 핵산에 비해 마이크로디스트로핀 발현을 증가시키고; 키메라 인트론을 인코딩하는 핵산 서열은 서열번호: 75의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 키메라 인트론 서열이 결여된 기준 핵산에 비해 마이크로디스트로핀 발현을 증가시키거나; 또는 SV40 인트론을 인코딩하는 핵산 서열은 서열번호: 76의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 키메라 인트론 서열이 결여된 기준 핵산에 비해 마이크로디스트로핀 발현을 증가시키는, 핵산 조성물.
27. 구현예 17 내지 26 중 어느 하나에 있어서, 상기 마이크로 디스트로핀 단백질은 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 서열: ABD-L1-H1-L2-R1-R2-L3-R16-L4.1-R17-L4.2-R24-H4-CR-CT 또는 ABD-L1-H1-L2-R1-R2-L3-R16-L4.1-R17-L4.2-R24-H4-CR을 포함하거나 이로 구성되고, 여기서 L1, L2, L3, L4.1 및 L4.2는 링커인, 핵산 조성물.
28. 구현예 27에 있어서, 상기 L1을 인코딩하는 핵산 서열은 서열번호: 23 또는 58을 포함하거나 이로 구성되고; L2를 인코딩하는 핵산 서열은 서열번호: 25 또는 60을 포함하거나 이로 구성되고; L3을 인코딩하는 핵산 서열은 서열번호: 28 또는 63을 포함하거나 이로 구성되고; L4.1을 인코딩하는 핵산 서열은 서열번호: 107 또는 125를 포함하거나 이로 구성되고; 그리고 L4.2를 인코딩하는 핵산 서열은 서열번호: 108 또는 126을 포함하거나 이로 구성되는, 핵산 조성물.
29. 전술한 구현예 중 어느 하나에 있어서, 상기 핵산은 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열에 작동가능하게 연결된 근육 및/또는 CNS 조직에서 발현을 촉진하는 전사 조절 요소를 포함하는 핵산 벡터인, 핵산 조성물.
30. 구현예 29에 있어서, 상기 전사 조절 요소는 근육 특이적 프로모터, 선택적으로 골격근, 평활근 또는/또는 심장근 특이적 프로모터를 포함하는, 핵산 조성물.
31. 구현예 29 또는 30에 있어서, 상기 프로모터는 SPc5-12 또는 그의 전사적 활성 부분인, 핵산 조성물.
32. 구현예 31에 있어서, 상기 프로모터는 서열번호: 39 또는 40의 핵산 서열로 구성되는, 핵산 조성물.
33. 구현예 29에 있어서, 상기 전사 조절 요소는 CNS 특이적 프로모터를 포함하는, 핵산 조성물.
34. 구현예 29에 있어서, 상기 프로모터는 CB7 프로모터, 사이토메갈로바이러스 (CMV) 프로모터, 라우스(Rous) 육종 바이러스 (RSV) 프로모터, MMT 프로모터, EF-1 알파 프로모터 (서열번호: 118), UB6 프로모터, 닭 베타-액틴 프로모터, CAG 프로모터 (서열번호: 116), RPE65 프로모터, 옵신 프로모터, TBG (티록신 결합 글로불린) 프로모터, APOA2 프로모터, SERPINA1 (hAAT) 프로모터, MIR122 프로모터, 또는 유도성 프로모터 예컨대 저산소증 유도성 또는 라파마이신 유도성 프로모터인, 핵산 조성물.
35. 구현예 29 또는 30에 있어서, 상기 근육 특이적 전사 조절 요소는 CK1 프로모터, CK4 프로모터, CK5 프로모터, CK6 프로모터, CK7 프로모터, CK8 프로모터 (서열번호: 115), MCK 프로모터 (또는 이의 말단절단 형태) (서열번호: 121), 데스민 프로모터 (서열번호: 119), MHCK7 프로모터 (서열번호: 120), enh358MCK 프로모터, dMCK 프로모터, 또는 tMCK 프로모터 중 하나인, 핵산 조성물.
36. 전술한 구현예 중 어느 하나에 있어서, 상기 뉴클레오티드 서열은 마이크로디스트로핀을 인코딩하는 뉴클레오티드 서열의 폴리아데닐화 신호 3'을 포함하는, 핵산 조성물.
37. 구현예 36에 있어서, 상기 폴리아데닐화 신호는 서열번호: 42의 뉴클레오티드 서열을 갖는, 핵산 조성물.
38. 전술한 구현예 중 어느 하나에 있어서, 상기 핵산은 5'로부터 3'로: (i) AAV ITR - 전사 조절 요소-N-말단으로부터 C-말단까지 배열된 마이크로디스트로핀을 인코딩하는 핵산 서열 도메인 ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT- 폴리아데닐화 서열 - AAV ITR; (ii) AAV ITR-전사 조절 요소 - N-말단으로부터 C-말단까지 배열된 마이크로디스트로핀을 인코딩하는 핵산 서열 도메인 ABD-H1-R1-R2-R3-H3-R24-H4-CR - 폴리아데닐화 서열 - AAV ITR; (iii) AAV ITR - 전사 조절 요소-N-말단으로부터 C-말단까지 배열된 마이크로디스트로핀을 인코딩하는 핵산 서열 도메인 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT- 폴리아데닐화 서열 - AAV ITR; 또는 (iv) AAV ITR-전사 조절 요소-N-말단으로부터 C-말단까지 배열된 마이크로디스트로핀을 인코딩하는 핵산 서열 도메인 ABD-H1-R1-R2-R16-R17-R24-H4-CR - 폴리아데닐화 서열 - AAV ITR를 포함하는 AAV 벡터 뉴클레오티드 서열을 포함하고, 상기 AAV ITR은 선택적으로 AAV2 ITR인, 핵산 조성물.
39. 전술한 구현예 중 어느 하나에 있어서, 상기 뉴클레오티드 서열은 CpG 서열에 대해 코돈 최적화 및/또는 고갈되는, 핵산 조성물.
40. 전술한 구현예 중 어느 하나에 있어서, 2개 또는 1개 미만의 CpG 섬을 갖거나 CpG 섬이 없는, 핵산 조성물.
41. 구현예 40에 있어서, 0 초과의 CpG 섬을 갖는 마이크로디스트로핀 작제물과 비교하여 항-약물 항체 역가에 의해 측정된 바와 같이 인간 대상체에게 투여될 때 감소된 면역원성을 나타내는, 핵산 조성물.
42. 전술한 구현예 중 어느 하나에 있어서, 서열번호: 53, 54, 55, 56, 82, 104, 105, 또는 106의 핵산 서열을 포함하는, 핵산 조성물.
43. 전술한 구현예 중 어느 하나에 있어서, 핵산 서열의 5' 및 3' 말단에 AAV ITR을 포함하는 AAV 벡터 뉴클레오티드 서열을 포함하고, 상기 AAV ITR은 선택적으로 AAV2 ITR인, 핵산 조성물.
44. 구현예 43에 있어서, 상기 5' ITR이 서열번호: 73의 뉴클레오티드 서열을 포함하거나 이로 구성되고, 3' ITR이 서열번호: 74의 뉴클레오티드 서열을 포함하거나 이로 구성되는, 핵산 조성물.
45. 전술한 구현예 중 어느 하나의 핵산 조성물을 포함하는 발현 카세트를 포함하는, rAAV 입자.
46. 구현예 45에 있어서, AAV 유형 1 (AAV1), 유형 2 (AAV2), 유형 3 (AAV3), 유형 4 (AAV4), 유형 5 (AAV5), 유형 6 (AAV6), 유형 7 (AAV7), 유형 8 (AAV8), 유형 rh8 (AAVrh8), 유형 9 (AAV9), 유형 PHP.B (AAVPHP.B), 유형 hu37 (AAV.hu37), 유형 hu31 (AAV.hu31), 유형 hu32 (AAV.hu32), 유형 rh10 (AAVrh10), 유형 rh20 (AAVrh20), 유형 rh39 (AAVrh39), 및 유형 rh74 (AAVrh74)로부터 선택되는 적어도 하나의 AAV 유형으로부터의 캡시드 단백질을 갖는, rAAV 입자.
47. 구현예 45 또는 46에 있어서, 상기 캡시드 단백질은 서열번호: 77(AAV8 캡시드)과 적어도 95% 동일한 아미노산 서열을 갖거나 서열번호: 77의 아미노산 서열을 갖는, rAAV 입자.
48. 구현예 45 또는 46에 있어서, 상기 캡시드 단백질은 서열번호: 78 (AAV9 캡시드)과 적어도 95% 동일한 아미노산 서열을 갖거나 서열번호 78의 아미노산 서열을 갖는, rAAV 입자.
49. 구현예 45 내지 48 중 어느 하나의 치료 유효량의 rAAV 입자 및 약제학적으로 허용 가능한 담체를 포함하는, 약제학적 조성물.
50. 이식유전자를 세포에 전달하는 방법으로서, 상기 방법은 상기 세포를 구현예 45 내지 49 중 어느 하나의 rAAV 입자와 접촉시키는 단계를 포함하고, 상기 세포는 벡터와 접촉되는, 방법.
51. 치료를 필요로 하는 인간 대상체에서 디스트로핀병증을 치료하기 위한 약제학적 조성물로서, 구현예 45 내지 49 중 어느 하나의 rAAV 입자의 치료 유효량을 포함하고, 선택적으로 상기 rAAV 입자는 상기 대상체의 순환계, 근육 조직 또는 CNS에 투여하기 위해 제형화되는, 약제학적 조성물.
52. 치료를 필요로 하는 인간 대상체에서 디스트로핀병증을 치료하는 방법으로서,
마이크로디스트로핀 단백질을 방출하는 저장소(depot)가 상기 대상체의 근육에 형성되도록, 구현예 45 내지 49 중 어느 하나의 rAAV 입자의 치료 유효량을 포함하는 약제학적 조성물을 대상체에게 투여하는 단계를 포함하는, 방법.
53. 예방을 필요로 하는 인간 대상체의 자손에 대한 디스트로핀병증의 전파를 예방하는 방법으로서,
마이크로디스트로핀을 인코딩하는 핵산이 상기 대상체의 생식계 내로 혼입되도록, 구현예 45 내지 49 중 어느 하나의 rAAV 입자의 치료 유효량을 포함하는 약제학적 조성물을 상기 대상체에게 투여하는 단계를 포함하는, 방법.
54. 구현예 51 내지 53에 있어서, 상기 디스트로핀병증은 DMD, BMD, X 관련 확장성 심근병증이거나 대상체는 DMD 또는 BMD의 여성 보인자인, 약제학적 조성물 또는 방법.
55. 구현예 51 내지 54에 있어서, 상기 조성물은 디스트로핀병증 치료에 효과적인 적어도 제2 제제와 함께 투여되는, 약제학적 조성물 또는 방법.
56. 구현예 55에 있어서, 상기 제2 제제는 DMD 유전자의 엑손 스키핑을 유발하는 안티센스 올리고뉴클레오티드, 항-마이오스타틴 항체, 넌센스 돌연변이의 리보솜 초과번역(read-through)을 촉진하는 제제, 조기 정지 코돈, 동화 스테로이드 및 코르티코스테로이드를 억제하는 제제로 구성되는 군으로부터 선택되는, 약제학적 조성물 또는 방법.
57. 구현예 51 내지 56 중 어느 하나에 있어서, 상기 투여는 환자의 그립 강도를 개선하고, 최대 및 특정 근육력을 증가시키고/시키거나 기관 및 근육 중량을 감소시키는, 약제학적 조성물 또는 방법.
58. 구현예 51 내지 57 중 어느 하나에 있어서, 상기 rAAV 입자의 투여는 심장 기능을 개선 또는 유지하거나 심장 기능의 쇠퇴를 늦추는, 약제학적 조성물 또는 방법.
59. 구현예 51 내지 58 중 어느 하나에 있어서, 상기 rAAV 입자의 투여는 근육량 또는 근육 강도를 증가시키거나 근육량 또는 근육 강도를 유지하거나 근육량 또는 근육 강도의 손실 가능성을 감소시키는, 약제학적 조성물 또는 방법.
60. 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인 ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT을 포함하거나 이로 구성되는 마이크로디스트로핀 단백질로서, ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R3은 디스트로핀의 스펙트린 3 영역이고, H3은 디스트로핀의 힌지 3 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, CR은 디스트로핀의 시스테인-풍부 영역이고, 그리고 CT는 α1-신트로핀 결합 부위, β-신트로핀 결합 부위, 및/또는 디스트로브레빈 부위를 포함하는 디스트로핀의 C-말단 영역의 적어도 일부인, 마이크로디스트로핀 단백질.
61. 구현예 60에 있어서, 서열번호: 1, 79, 또는 91의 아미노산 서열을 포함하거나 이로 구성되는, 마이크로디스트로핀 단백질.
62. 구현예 60 또는 61에 있어서, 상기 CT 도메인은 α1-신트로핀 결합 부위를 포함하는 말단절단된 CT 도메인인, 마이크로디스트로핀 단백질.
63. 구현예 60 내지 62 중 어느 하나에 있어서, 상기 CT 도메인은 서열번호: 16 또는 83의 아미노산 서열을 포함하거나 이로 구성되거나 서열번호: 84의 아미노산 서열을 포함하는, 마이크로디스트로핀 단백질.
64. 구현예 60 내지 63 중 어느 하나에 있어서, CR 도메인은 β-디스트로글리칸 결합 부위를 포함하는, 마이크로디스트로핀 단백질.
65. 구현예 60 내지 64 중 어느 하나에 있어서, 상기 CR 도메인은 서열번호: 15 또는 90의 아미노산 서열을 포함하거나 이로 구성된 것인, 마이크로디스트로핀 단백질.
66. 구현예 60 내지 66 중 어느 하나에 있어서, ABD는 서열번호: 3 또는 서열번호: 3과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; H1은 서열번호: 5 또는 서열번호: 5와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; R1은 서열번호: 7 또는 서열번호: 7과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; R2는 서열번호: 8 또는 서열번호: 8과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; H3은 서열번호: 11 또는 서열번호: 11과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; R24는 서열번호: 13 또는 서열번호: 13과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; H4은 서열번호: 14 또는 서열번호: 14와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; CR은 서열번호: 15 또는 90 또는 서열번호: 15 또는 90과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; 그리고 CT는 서열번호: 16 또는 83 또는 서열번호: 16 또는 83과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되는, 마이크로디스트로핀 단백질.
67. 구현예 60 내지 66 중 어느 하나에 있어서, ABD는 서열번호: 3으로 구성되고, H1은 서열번호: 5로 구성되고; R1은 서열번호: 7로 구성되고; R2는 서열번호: 8로 구성되고; R3은 서열번호: 10으로 구성되고; H3은 서열번호: 11로 구성되고; R24는 서열번호: 13으로 구성되고; H4은 서열번호: 14로 구성되고; CR은 서열번호: 15 또는 90로 구성되거나; 또는 CT는 서열번호: 16 또는 83으로 구성되는, 마이크로디스트로핀 단백질.
68. 구현예 60 내지 67 중 어느 하나에 있어서, 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인: ABD-L1-H1-L2-R1-R2-L3-R3-H3-L4-R24-H4-CR-CT을 포함하고, L1, L2, L3, 및 L4는 링커인, 마이크로디스트로핀 단백질.
69. 구현예 68에 있어서, 상기 L1, L2, L3, 및 L4의 아미노산 서열은 각각 서열번호: 4, 6, 9, 및 12로 구성되는, 마이크로디스트로핀 단백질.
70. 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인 ABD-H1-R1-R2-R16-R17-R24-H4-CR을 포함하거나 이로 구성되는 마이크로디스트로핀 단백질로서, 상기 ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R16은 디스트로핀의 스펙트린 16 영역이고, R17은 디스트로핀의 스펙트린 17 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, 그리고 CR은 디스트로핀의 시스테인-풍부 영역인, 마이크로디스트로핀 단백질.
71. 구현예 70에 있어서, 서열번호: 93의 아미노산 서열을 포함하거나 이로 구성되는, 마이크로디스트로핀 단백질.
72. 구현예 70에 있어서, 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT을 포함하거나 이로 구성되고, CT는 α1-신트로핀 결합 부위 또는 디스트로브레빈 결합 부위를 포함하는 디스트로핀의 C-말단 영역의 적어도 일부인, 마이크로디스트로핀 단백질.
73. 구현예 72에 있어서, 상기 CT 도메인은 서열번호: 16 또는 83의 아미노산 서열을 포함하거나 이로 구성되거나 서열번호: 84의 아미노산 서열을 포함하는, 마이크로디스트로핀 단백질.
74. 구현예 72 또는 73에 있어서, 서열번호: 92의 아미노산 서열을 포함하거나 이로 구성되는, 마이크로디스트로핀 단백질.
75. 구현예 70 내지 74 중 어느 하나에 있어서, H4 도메인은 β-디스트로글리칸 결합 부위를 포함하는, 마이크로디스트로핀 단백질.
76. 구현예 70 내지 75 중 어느 하나에 있어서, ABD는 서열번호: 3 또는 서열번호: 3과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; H1은 서열번호: 5 또는 서열번호: 5와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; R1은 서열번호: 7 또는 서열번호: 7과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; R2는 서열번호: 8 또는 서열번호: 8과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; R16은 서열번호: 86 또는 서열번호: 86과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; R17은 서열번호: 87 또는 서열번호: 87과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; R24는 서열번호: 13 또는 서열번호: 13과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; H4은 서열번호: 14 또는 서열번호: 14와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; 그리고 CR은 서열번호: 15 또는 90 또는 서열번호: 15 또는 90과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되는, 마이크로디스트로핀 단백질;
77. 구현예 70 내지 76 중 어느 하나에 있어서, 상기 CR 도메인의 C 말단에 CT 도메인을 포함하거나 이로 구성되고, CT는 서열번호: 16 또는 83 또는 서열번호: 16 또는 83과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되는, 마이크로디스트로핀 단백질.
78. 구현예 70 내지 77 중 어느 하나에 있어서, ABD는 서열번호: 3으로 구성되고, H1은 서열번호: 5로 구성되고; R1은 서열번호: 7로 구성되고; R2는 서열번호: 8로 구성되고; R16은 서열번호: 86으로 구성되고; R17은 서열번호: 87로 구성되고; R24는 서열번호: 13으로 구성되고; H4은 서열번호: 14로 구성되고; 그리고 CR은 서열번호: 15 또는 90로 구성되고/거나; CT는 서열번호: 16 또는 83으로 구성되는, 마이크로디스트로핀 단백질.
79. 구현예 70 내지 78 중 어느 하나에 있어서, 상기 CT는 서열번호: 16 또는 83으로 구성되는, 마이크로디스트로핀 단백질.
80. 구현예 70 내지 80 중 어느 하나에 있어서, 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인: ABD-L1-H1-L2-R1-R2-L3-R16-L4.1-R17-L4.2-R24-H4-CR-CT 또는 ABD-L1-H1-L2-R1-R2-L3-R16-L4.1-R17-L4.2-R24-H4-CR을 포함하고, 여기서 L1, L2, L3, L4.1 및 L4.2는 링커인, 마이크로디스트로핀 단백질.
81. 구현예 80에 있어서, 상기 L1, L2, L3, L4.1 및 L4.2의 아미노산 서열은 각각 서열번호: 4, 6, 9, 110, 및 89로 구성되는, 마이크로디스트로핀 단백질.
82. 치료를 필요로 하는 인간 대상체에서 디스트로핀병증을 치료하는 방법으로서, 구현예 60 내지 81 중 어느 하나에 따른 마이크로디스트로핀 단백질의 치료 유효량을 상기 인간 대상의 순환계, 근육 조직 및/또는 뇌척수액에 전달하는 단계를 포함하는, 방법.
83. 인간 대상체에서 디스트로핀병증의 치료용 약제학적 조성물로서, 상기 인간 대상체의 순환계, 근육 조직 및/또는 뇌척수액으로의 전달을 위해 제형화된 구현예 60 내지 81 중 어느 하나에 따른 마이크로디스트로핀 단백질의 치료 유효량을 포함하는, 약제학적 조성물.
84. 구현예 82 또는 83에 있어서, 상기 디스트로핀병증은 DMD, BMD 또는 X 관련 확장성 심근병증인, 방법 또는 약제학적 조성물.
85. 구현예 82 내지 84 중 어느 하나에 있어서, 상기 CT 도메인은 α1-신트로핀 결합 부위, β-신트로핀 결합 부위, 및/또는 디스트로브레빈 결합 부위를 포함하는, 방법 또는 약제학적 조성물.
86. 구현예 85에 있어서, 상기 CT 도메인은 α1-신트로핀 결합 부위를 포함하는 말단절단된 CT 도메인인, 방법 또는 약제학적 조성물.
87. 구현예 82 내지 86 중 어느 하나에 있어서, H4는 β-디스트로글리칸 결합 부위를 포함하는, 방법 또는 약제학적 조성물.
88. 재조합 AAV를 생성하는 방법으로서,
(a) 다음을 포함하는 숙주 세포를 배양하는 단계:
(i) 시스 발현 카세트를 포함하는 인공 게놈으로서, 구현예 38 내지 44 중 어느 하나의 핵산 조성물을 포함하는, 인공 게놈;
(ii) AAV ITR이 결여된 트랜스 발현 카세트로서, 배양 중인 숙주 세포에서 상기 AAV rep 및 캡시드 단백질의 발현을 유도하고 상기 rep 및 cap 단백질을 트랜스로 공급하는 발현 조절 요소에 작동가능하게 연결된 AAV rep 및 캡시드 단백질을 인코딩하는, 트랜스 발현 카세트;
(iii) AAV 캡시드 단백질에 의한 인공 게놈의 복제 및 패키징을 허용하기 위한 충분한 아데노바이러스 헬퍼 기능; 및
(b) 세포 배양물로부터 인공 게놈을 캡슐화하는 재조합 AAV를 회수하는 단계를 포함하는, 방법.
89. 숙주 세포로서,
a. 시스 발현 카세트를 포함하는 인공 게놈으로서, 구현예 38 내지 44 중 어느 하나의 핵산 조성물을 포함하는, 인공 게놈;
b. AAV ITR이 결여된 트랜스 발현 카세트로서, 배양 중인 숙주 세포에서 상기 AAV rep 및 캡시드 단백질의 발현을 유도하고 상기 rep 및 cap 단백질을 트랜스로 공급하는 발현 조절 요소에 작동가능하게 연결된 AAV rep 및 캡시드 단백질을 인코딩하는, 트랜스 발현 카세트; 및
c. AAV 캡시드 단백질에 의한 인공 게놈의 복제 및 패키징을 허용하기 위한 충분한 아데노바이러스 헬퍼 기능을 포함하는, 숙주 세포.
4. 도면의 간단한 설명
도 1a-c. 도 1a는 유전자 요법을 위한 시스-플라스미드에서 사용하기 위한 벡터 유전자 발현 카세트 및 마이크로디스트로핀 작제물을 예시한다. 각 구성 요소의 DNA 길이 및 완전한 이식유전자가 각 작제물에 대해 나열된다. SPc5-12: 합성 근육 특이적 프로모터; Mini-SPc: 말단절단 합성 근육 특이적 프로모터; CT1.5: 말단절단/최소 CT 도메인; VH4: 인간 면역글로불린 중쇄 가변 영역 인트론; ABD: 액틴 결합 도메인; H: 힌지; R: 막대; CR: 시스테인 풍부 도메인; CT: C-말단 도메인; smPA: 작은 polyA; ABD: 액틴 결합 도메인 1 (ABD1). 도 1b-c는 플라스미드 RGX-DYS1, RGX-DYS3 및 RGX-DYS5로부터 발현된 마이크로디스트로핀 단백질의 상대적 크기를 나타내는 웨스턴 블롯(디스트로핀에 대한 항체(1c7))에 의해 검출된 단백질 밴드를 도시한다.
도 2a-f는 다양한 복용량에서 리포터 AAV 벡터 AAV8-GFP (a-c) 및 AAV8-VH4-GFP (d-f)로 감염 3일 후 분화된 C2C12 세포의 형광 현미경검사를 도시한다 (이미지 위에 표시됨: 5 x 10e5 vg/세포 (a, d), 1 x 10e5 vg/세포 (b, e), 0.2 x 10e5 vg/세포 (c, f)). 스케일 바: 200 μM. vg: 벡터 게놈.
도 3은 3개의 상이한 복용량: 5 x 10e5 vg/세포, 1 x 10e5 vg/세포, 및 0.2 x 10e5 vg/세포에서 AAV8-GFP 및 AAV8-VH4-GFP 벡터로 감염 3일 후에 측정된 형질도입된 C2C12 세포의 평균 형광 강도(단위)를 나타낸다.
도 4a-c는 AAV8-CAG-GFP로 감염 6일 후 분화된 C2C12 세포의 형광 현미경검사를 도시한다. 이미지 A-C는 동일한 배율에서 투과광 및 GFP 채널이 있는 EVOSTM 현미경을 사용하여 매일 촬영하였다. A, GFP 채널로 설정된 현미경 이미지; B, 세포의 합류를 관찰하기 위한 명시야(또는 위상차); C, 감염된 세포의 수가 약 50%인 것을 관찰하기 위해 A와 B를 병합한 이미지.
도 5a-h는 디스트로핀 단백질의 면역형광 염색에 의한 기준 대조군(RGX-DYS-RS, a-d)과 비교하여 마이크로디스트로핀 벡터(RGX-DYS1-03, e-h)의 시험관내 효능 시험을 도시한다. 각 복용량에 대해 3개의 복제가 있었다(각 이미지 위에 표시됨): 1e12 vg/ml (a, e), 4e11 vg/ml (b, f), 1.6e11 vg/ml (c, g), 및 6.4e10 vg/ml (d, h).
도 6은 벡터 역가의 척도로서 각각의 벡터에 대한 마우스 근육 세포주 C2C12 세포에서의 감염성 데이터를 제공한다. 각각의 벡터 배치 RGX-DYS1-01, RGX-DYS1-02, RGX-DYS2-01, RGX-DYS3-01, RGX-DYS3-02, RGX-DYS4-01, 및 RGX-DYS1-RS에 대한 정규화 데이터(벡터 카피 수/기준 대조군)를 나타낸다. DYS1의 초기 배치(RGX-DYS1-RS)를 기반으로 하는 내부 대조군 벡터는 참조 표준(1.0)으로 간주되었다.
도 7은 mRNA 발현의 척도로서, 각각 동일한 프로세스(RGX-DYS1-01, RGX-DYS1-02, RGX-DYS2-01, RGX-DYS3-01, RGX-DYS3-02, RGX-DYS4-01, 및 RGX-DYS1-RS)를 사용하는 서로 다른 생산 배치의 각 벡터에 대한 마우스 근육 세포주 C2C12 세포의 마이크로디스트로핀 데이터를 제공한다. C2C12 세포(1e5 vg/세포 및 5e4 vg/세포)를 감염시키기 위해 2개의 다른 벡터 복용량이 사용되었다. 각 배치의 mRNA 발현 수준은 마이크로디스트로핀에 대한 프라이머/프로브와 동일한 cDNA 샘플의 내인성 대조군 마우스 GAPDH 사이의 qPCR에서 배수 변화(델타 CT)로 계산되었다. 그래프는 배수 증가를 보여주고 RGX-DYS1-RS는 100% 참조 표준으로 간주되어 1로 설정되었다.
도 8은 체중(g)의 주간 변화를 나타낸다. 데이터는 평균 ± SEM으로 제시된다. mdx RGX-DYS1 그룹의 경우 n = 12; mdx 비히클 그룹의 경우 n= 13; BL10 비히클 그룹의 경우 n = 14.
도 9a-b는 마우스 근육 및 기관 중량 측정치(체중, g/kg에 대해 정규화됨)를 도시한다. 사두근 및 비장근 가중치는 도 9a에 도시되어 있고, 삼두근 및 TA 가중치는 도 9b에 도시되어 있다. 데이터는 평균 ± SEM으로 제시된다. mdx RGX-DYS1 그룹의 경우 n = 12; mdx 비히클 그룹의 경우 n= 13; BL10 비히클 그룹의 경우 n = 14. ***P ≤ 0.001 (일원분산분석 (one-way ANOVA)); ###P ≤ 0.001 (t-시험).
도 10은 그립 강도 측정(KGF/kg)을 도시한다. *-일원분산분석 (***P ≤ 0.001); #- t-시험 (### p ≤ 0.001). 팔뚝 근육 그립 힘은 근육 무게에 의해 각 마우스에 대해 정규화되었다. mdx RGX-DYS1 그룹의 경우 n 12; mdx 비히클 그룹의 경우 n= 13; BL10 비히클 그룹의 경우 n = 14.
도 11은 비히클로 처리된 mdx 마우스와 비교하여 RGX-DYS1 처리된 mdx 마우스에서 근육력의 상당한 개선이 밝혀진 처리 후 6주째의 시험관내 근육 강도 수축력 분석을 예시한다. 최대 힘(mN)과 특정 힘(kN/m2)이 표시된다. ***, 일원분산분석에 의한 p< 0.001. ###, t-검정을 통한 p < 0.001. mdx RGX-DYS1 그룹의 n = 12; mdx 비히클 그룹의 경우 n= 13; BL10 비히클 그룹의 경우 n = 14.
도 12 ddPCR 방법에 의한 골격근, 심장근 및 간에서의 벡터 카피수 (vg/이배체 게놈). Stilla Technologies의 Naica Crystal Digital PCR 시스템을 사용하였다. 각 처리된 조직에 대해 n = 13. 열거된 숫자는 평균 ± 표준 편차이다. 벡터 카피 수는 2X 마이크로디스트로핀 이식유전자 카피 수/내인성 대조군 마우스 글루카곤 카피 수로 계산되었다. 주사되지 않은 mdx 간 샘플(n=13)을 음성 대조군 샘플로 사용하였다. TA, 전경골근 근육; EDL, 장지신근.
도 13은 야생형 디스트로핀 또는 디스트로브레빈과 α1- 및 β1-신트로핀 결합 부위, 예를 들어 액틴 세포골격과의 RGX-DYS1, 및 디스트로핀 관련 단백질 복합체 (DAPC)를 함유하는 마이크로디스트로핀 사이의 상호작용을 보여주는 근형질막의 예시이다. 디스트로브레빈, α1-신트로핀, 및 β1-신트로핀 결합 부위를 갖는 RGX-DYS1은 α1-신트로핀을 통해 nNOS를 근형질막에 부분적으로 모집하고 고정할 것으로 생각된다.
도 14 mdx RGX-DYS1, mdx 대조군 및 WT 대조군으로부터의 비복근 근육에 대한 면역형광 염색. 동결 절편을 항-α-디스트로브레빈, 항-β-디스트로글리칸, 항-nNos, 항-디스트로핀(항-dys) 및 항-α-신트로핀으로 염색하였다. 이차 항체는 CY3로 표지되었고 모든 절편은 장착하기 전에 DAPI로 대조염색되었다.
도 15: AAV-μ-디스트로핀 벡터 주입 비복근 근육 조직에서 추출한 디스트로핀에 대한 웨스턴 블롯. 레인 1 내지 4 = AAV8-RGX-DYS1 주입 mdx 마우스의 단백질 샘플, 레인 5 내지 8 = AAV8-RGX-DYS5 주입 mdx 마우스의 단백질 샘플, 및 레인 9 내지 12 = AAV8-RGX-DYS3 주입 mdx 마우스의 단백질 샘플. α1-액틴은 각 레인에서 로딩 대조군으로서 역할을 한다. Mdx(레인 13)는 주사되지 않은 mdx 마우스를 나타낸다. 디스트로핀 블롯을 위해, 마우스 항-디스트로핀 단클론성 항체를 사용하였다(1:100 희석). 항-알파1-액틴 블롯을 위해, 다클론성 항체를 1:10,000 희석 계수로 사용하였고, 2차(항토끼)항체를 1:20,000으로 사용하였다.
도 16a-c: 웨스턴 블롯에 의한 μ-디스트로핀 밴드의 정량화(패널 A), ddPCR에 의한 AAV-μ-Dys 벡터 카피 수(패널 B), 및 AAV-μ-Dys 벡터 카피 수에 의해 정규화된 μ-디스트로핀 밴드의 정량화(패널 C). * p< 0.05; ** P < 0.01; ***P<0001.
도 17a-b: 골격근(비복근)에서 μ-디스트로핀 및 야생형(WT) 디스트로핀의 mRNA 발현. 골격근에서 전체 RNA를 추출하고 cDNA를 합성하였다. μ-디스트로핀, WT-디스트로핀 및 내인성 대조군 글리세르알데하이드 3-포스페이트 탈수소효소 (GAPDH) mRNA의 카피 수는 디지털 PCR (Naica Crystal Digital PCR system, Stilla technologies)을 사용하여 측정되었다. a. GAPDH에 의해 정규화된 상대적 μ- 또는 WT-디스트로핀 mRNA 발현. B6-WT 골격근에서 WT-디스트로핀 대 GAPDH의 비율은 1로 간주되었다. b. 단일 세포에서 상대적 μ- 또는 WT-디스트로핀 mRNA 발현. μ- 또는 WT-디스트로핀 mRNA 발현 카피 수는 GAPDH 및 세포당 게놈 카피 수에 의해 정규화되었다.
도 18. mdx 마우스에서 추출한 비복근 근육, 조직 절편을 제조하고 디스트로브레빈, β-디스트로글리칸 및 신트로핀을 포함하는 디스트로핀 및 디스트로핀 관련 단백질 복합체에 대해 면역형광(IF) 염색한다. 마우스는 다음과 같이 처리되었다: Bl6 (미처리 야생형 마우스); RGX-DYS1 (마우스 ID 3553, 및 마우스 ID 3588); RGX-DYS3 (마우스 ID 5, 및 마우스 ID 7); 및 RGX-DYS5 (마우스 ID 9, 및 마우스 ID 11). 대물 렌즈: 40x.
도 19a-c: 골격근에서의 신트로핀 발현. a. mdx 마우스에서 추출한 비복근 근육, 조직 절편을 제조하고 신트로핀에 대해 면역형광(IF) 염색한다. 마우스는 다음과 같이 처리되었다: Bl6 (미처리 야생형 마우스); RGX-DYS1 (마우스 ID 3553, 및 마우스 ID 3588); RGX-DYS3 (마우스 ID 5, 및 마우스 ID 7); 및 RGX-DYS5 (마우스 ID 9, 및 마우스 ID 11). 대물 렌즈: 40x. b. 근육 조직 용해물의 신트로핀에 대한 웨스턴 블롯. c. 웨스턴 블롯 밴드의 정량화. *, p< 0.05; ***, p < 0.0001. d. 전체 근육막 단백질의 신트로핀에 대한 웨스턴 블롯. e. 웨스턴 블롯 밴드의 정량화.
도 20a-c: 골격근에서의 nNOS 발현. a. nNOS에 대한 면역형광 염색. b. nNOS에 대한 웨스턴 블롯. c. 웨스턴 블롯 밴드의 정량화.
도 21a-e: 위성 세포의 형질도입 및 μ-디스트로핀 유전자를 인코딩하는 AAV 벡터에 의한 세포 재생 개선. a-b. RGX-DYS1 처리 mdx 마우스(패널 A) 및 미처리 mdx 마우스(패널 B)의 RNAScope 이미지로 μ-디스트로핀(빨간색) 및 pax7 위성 세포(녹색)의 공동 발현을 보여준다. AAV 이식유전자 및 Pax7 mRNA 발현 서비스의 RNAscope 다중 형광 분석은 Advanced Cell Diagnostics Inc (Newark, CA)에서 수행되었다. c. AAV-DMD 형질도입된 위성 세포의 백분율. d. RNAscope 이미지의 전체 위성 세포 카운팅. e. ddPCR에 의해 밝혀진 상이한 그룹의 골격근에서의 Pax7 mRNA 발현. μ-디스트로핀에 대한 프라임 및 프로브는 이전에 설명한 것과 동일하였다. B6-WT 골격근에서 GAPDH에 대한 pax7의 비율은 1로 간주되었다. 처리되지 않은 mdx 마우스와 비교하여 **, p< 0.01; ***, p < 0.001; ****, p<0.0001.
도 22: 추가의 변형된 μ-디스트로핀 작제물의 예시. 짧은 CR: 시스테인-풍부 도메인은 야생형 디스트로핀보다 150bp 더 짧다. R16/R17: 디스트로핀 스펙트린-유사 반복부 16 및 17.
도 23a-c: AAV8-μ-디스트로핀 작제물의 상이한 버전에 의한 C2C12 근관의 시험관내 감염. C2C12 근아세포를 분화 배지에서 유도한 다음 AAV 벡터로 감염시켰다. 웨스턴 블롯 또는 mRNA 발현을 위해 감염 5일 후에 세포를 수확하였다. 1: 음성 대조군; 2: RGX-DYS8; 3: RGX-DYS7; 4: RGX-DYS6; 5: RGX-DYS3; 6: RGX-DYS5; 7: RGX-DYS1; 8: RGX-DYS1; 9: RGX-DYS1; 10: RGX-DYS1; 11: RGX-DYS1. a. C2C12 세포로부터의 μ-디스트로핀 발현의 웨스턴 블롯 분석. b. 웨스턴 블롯 분석의 정량화. c. ddPCR에 의한 μ-디스트로핀 mRNA 발현의 검출.
5. 상세한 설명
예를 들어, 도 1a도 22에 도시된 바와 같은 마이크로디스트로핀 단백질 및 이를 인코딩하는 핵산 조성물 및 rAAV 벡터, 뿐만 아니라 이와 관련된 약제학적 조성물 및 치료 방법이 제공된다.
5.1. 정의
용어 "AAV" 또는 "아데노 관련 바이러스"는 바이러스의 파보바이러스(Parvoviridae) 속 내의 디펜도파보바이러스를 지칭한다. AAV는 자연 발생 "야생형" 바이러스로부터 유래된 AAV, 자연 발생 cap 유전자에 의해 인코딩된 캡시드 단백질을 포함하는 캡시드 내로 패키징된 rAAV 게놈으로부터 및/또는 비-자연 캡시드 cap 유전자에 의해 인코딩된 캡시드 단백질을 포함하는 캡시드에 패키징된 rAAV 게놈로부터 AAV일 수 있다. 후자의 예는 변형된 서열 및/또는 자연 발생 캡시드의 아미노산 서열 내로 펩티드 삽입을 갖는 캡시드 단백질을 갖는 rAAV를 포함한다.
용어 "rAAV"는 "재조합 AAV"를 지칭한다. 일부 구현예에서, 재조합 AAV는 rep 및 cap 유전자의 일부 또는 전부가 이종성 서열로 대체된 AAV 게놈을 갖는다.
용어 "rep-cap 헬퍼 플라스미드"는 바이러스 rep 및 cap 유전자 기능을 제공하고 기능적 rep 및/또는 cap 유전자 서열이 결여된 rAAV 게놈으로부터 AAV의 생산을 돕는 플라스미드를 지칭한다.
용어 "cap 유전자"는 바이러스의 캡시드 코트를 형성하거나 형성하는 데 도움이 되는 캡시드 단백질을 인코딩하는 핵산 서열을 의미한다. AAV의 경우, 캡시드 단백질은 VP1, VP2 또는 VP3일 수 있다.
용어 "rep 유전자"는 바이러스의 복제 및 생산에 필요한 비구조적 단백질을 인코딩하는 핵산 서열을 지칭한다.
용어 "핵산" 및 "뉴클레오티드 서열"은 DNA 분자(예를 들어, cDNA 또는 게놈 DNA), RNA 분자(예를 들어, mRNA), DNA와 RNA 분자의 조합 또는 하이브리드 DNA/RNA 분자, 및 DNA 또는 RNA 분자의 유사체를 포함한다. 이러한 유사체는 예를 들어 이노신 또는 트리틸화 염기를 포함하지만 이에 제한되지 않는 뉴클레오티드 유사체를 사용하여 생성될 수 있다. 이러한 유사체는 또한 분자에 유익한 특성, 예를 들어, 뉴클레아제 내성 또는 세포막을 횡단하는 증가된 능력을 부여하는 변형된 백본을 포함하는 DNA 또는 RNA 분자를 포함할 수 있다. 핵산 또는 뉴클레오티드 서열은 단일 가닥, 이중 가닥일 수 있고, 단일 가닥 및 이중 가닥 부분 모두를 함유할 수 있고, 삼중 가닥 부분을 함유할 수 있지만, 바람직하게는 이중 가닥 DNA이다.
본원에 개시된 바와 같은 아미노산 잔기는 전체 폴리펩티드 구조 및/또는 기능을 유지하거나 실질적으로 유지하기 위해 보존적 치환에 의해 변형될 수 있다. 본원에서 사용된 바와 같이, "보존적 아미노산 치환"은 소수성 아미노산 (즉, Ala, Cys, Gly, Pro, Met, Val, lie, 및 Leu)이 다른 소수성 아미노산으로 치환될 수 있고; 부피가 큰 측쇄를 가진 소수성 아미노산(즉, Phe, Tyr 및 Trp)은 부피가 큰 측쇄를 가진 다른 소수성 아미노산으로 치환될 수 있고; 양전하를 띤 측쇄가 있는 아미노산(즉, Arg, His 및 Lys)은 양전하를 띤 측쇄가 있는 다른 아미노산으로 치환될 수 있고; 음전하를 띤 측쇄가 있는 아미노산(즉, Asp 및 Glu)은 음전하를 띤 측쇄가 있는 다른 아미노산으로 치환될 수 있고; 그리고 극성 비하전 측쇄를 갖는 아미노산(즉, Ser, Thr, Asn 및 Gln)은 극성 비하전 측쇄를 갖는 다른 아미노산으로 치환될 수 있음을 나타낸다.
용어들 "대상체", "숙주" 및 "환자"는 상호교환적으로 사용된다. 대상체는 바람직하게는 포유동물 예컨대 비-영장류 (예를 들어, 소, 피그, 말, 고양이, 개, 랫트 등) 또는 영장류 (예를 들어, 원숭이 및 인간), 가장 바람직하게는 인간이다.
용어 "치료학적으로 기능적인 마이크로디스트로핀"은 마이크로디스트로핀이 본원의 섹션 5.4에 기재된 치료적 유용성을 위한 검정 중 하나 이상에서 또는 본원의 섹션 5.5에 기재된 치료 방법의 평가에서 치료 효능을 나타내는 것을 의미한다.
용어들 "대상체", "숙주" 및 "환자"는 상호교환적으로 사용된다. 대상체는 바람직하게는 포유동물 예컨대 비-영장류 (예를 들어, 소, 피그, 말, 고양이, 개, 랫트 등) 또는 영장류 (예를 들어, 원숭이 및 인간), 가장 바람직하게는 인간이다.
용어 "치료제"는 질환 또는 장애가 이식유전자에 의해 제공되는 기능과 관련된 경우, 질환 또는 장애와 관련된 증상을 치료, 관리 또는 개선하는데 사용될 수 있는 임의의 제제를 지칭한다. "치료 유효량"은 앓고 있는 대상체에게 투여될 때, 표적 질환 또는 장애의 치료 또는 관리에서 적어도 하나의 치료적 이익을 제공하는 제제의 양 (예를 들어, 이식유전자에 의해 발현된 생성물의 양)을 지칭한다. 또한, 본 발명의 제제에 대한 치료 유효량은 질환 또는 장애의 치료 또는 관리에서 적어도 하나의 치료적 이점을 제공하는 제제 단독의 양, 또는 다른 요법과 조합된 경우의 양을 의미한다.
용어 "예방제"는 질환 또는 장애가 이식유전자에 의해 제공될 기능과 관련된 경우 질환 또는 장애의 진행을 예방, 가능성 감소, 지연 또는 감속에 사용할 수 있는 모든 제제를 의미한다. "예방적 유효량"은 그 소인이 있는 대상체에게 투여될 때, 표적 질환 또는 장애의 예방 또는 지연에 있어서 적어도 하나의 예방적 이점을 제공하는 예방제의 양(예를 들어, 이식유전자에 의해 발현되는 생성물의 양)을 지칭한다. 예방적 유효량은 또한 표적 질환 또는 장애의 발병을 예방하거나, 그의 가능성을 감소시키거나, 또는 그의 발생을 지연시키는데 충분한 제제의 양; 또는 표적 질환이나 장애의 진행을 늦추는데 충분한 제제의 양; 표적 질환 또는 장애의 발병의 지연 또는 최소화에 충분한 양; 또는 그의 재발 또는 확산을 예방하거나, 또는 지연시키기에 충분한 양을 지칭할 수 있다. 예방적 유효량은 또한 표적 질환 또는 장애의 증상의 악화를 예방하거나 지연시키기에 충분한 제제의 양을 나타낼 수 있다. 추가로, 본 발명의 예방제에 대한 예방적 유효량은 질환 또는 장애의 예방 또는 지연에서 적어도 하나의 예방적 이점을 제공하는 예방제 단독, 또는 다른 제제와 조합된 경우의 양을 의미한다.
본 발명의 예방제는 표적 질환 또는 장애에 "소인이 있는" 대상체에게 투여될 수 있다. 질환 또는 장애에 "소인이 있는" 대상체는 질환 또는 장애의 발생과 관련된 증상을 나타내거나, 또는 이러한 질환 또는 장애를 위한 유전적 구성, 환경적 노출, 또는 다른 위험 인자를 갖지만, 증상이 아직 질환 또는 장애로 진단되는 수준에 있지 않은 대상체이다. 예를 들어, (이식유전자에 의해 제공될) 누락된 유전자와 관련된 질환의 가족력이 있는 환자는 소인이 있는 환자로 자격이 있을 수 있다. 또한, 원발성 종양의 제거 후에도 지속되는 휴면 종양이 있는 환자는 종양의 재발의 소인이 있는 환자로 자격이 될 수 있다.
용어 "CpG 섬"는 높은 빈도로 디뉴클레오티드 CpG(예를 들어, C(사이토신) 염기 다음에, G(구아닌) 염기(CpG)가 바로 이어짐)를 함유하는 게놈의 독특한 영역을 의미하므로, 따라서 CpG 섬의 G+C 함량은 해도 DNA보다 훨씬 높다. CpG 섬은 뉴클레오타이드 길이, 뉴클레오타이드 구성 및 CpG 디뉴클레오타이드의 빈도를 분석하여 식별할 수 있다. 임의의 특정 뉴클레오티드 서열 또는 게놈 내의 CpG 섬 함량은 하기 기준을 사용하여 측정될 수 있다: 100 초과의 해도 크기, 50.0% 초과의 GC 퍼센트, 및 절편 내의 Gs 및 Cs의 수에 기초하여 예상되는 수에 대한 CG 디뉴클레오티드의 관찰된 수의 0.6 초과의 비 (0.6 초과의 Obs/Exp).
Obs/Exp CpG = CpG의 수 * N / (C의 수 * G의 수)
여기서 N = 서열 길이.
world-wide-web.urogene.org/cgi-bin/methprimer/methprimer.cgi, world-wide-web.cpgislands.usc.edu/, world-wide-web.ebi.ac.uk/Tools/emboss/cpgplot/index.html 및 world-wide-web.bioinformatics.org/sms2/cpg_islands.html과 같은 다양한 소프트웨어 도구를 이러한 계산에 사용할 수 있다. (또한 [Gardiner-Garden and Frommer, J Mol Biol. 1987 Jul 20;196(2):261-82; Li LC and Dahiya R. MethPrimer: designing primers for methylation PCRs. Bioinformatics. 2002 Nov;18(11):1427-31.]를 참조). 한 구현예에서 CpG 섬을 식별하는 알고리즘은 www.urogene.org/cgi-bin/methprimer/methprimer.cgi에서 찾을 수 있다.
5.2. 마이크로디스트로핀 이식유전자
5.2.1 마이크로디스트로핀
본원에 기재된 구현예는 아미노-말단으로부터 카복시 말단까지 ABD-H1-R1-R2-R3-H3-R24-H4-CR (예를 들어, 서열번호: 2) 또는 ABD1-H1-R1-R2-R16-R17-R24-H4-CR (서열번호: 93)를 갖는 마이크로디스트로핀 단백질을 포함하고, ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R3은 디스트로핀의 스펙트린 3 영역이고, H3은 디스트로핀의 힌지 3 영역이고, R16은 디스트로핀의 스펙트린 16 영역이고, R17은 디스트로핀의 스펙트린 17 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, H4는 디스트로핀의 힌지 4 영역이고, CR은 디스트로핀의 시스테인-풍부 영역이다.
상술한 바와 같이, 본 발명에 따른 마이크로디스트로핀은 ABD-H1-R1-R2-R3-R24-H4 또는 ABD-H1-R1-R2-R16-R17-R24-H4를 포함한다. NH2 말단과 디스트로핀의 막대 도메인 영역은 세포골격 액틴에 직접 결합하지만 교차 연결하지는 않는다. 야생형 디스트로핀의 막대 도메인은 스펙트린의 삼중 나선 반복과 유사한 24개의 반복 단위로 구성된다. 이 반복 단위는 디스트로핀 단백질의 대부분을 차지하며 분자에 β-스펙트린과 유사한 가요성 막대 유사 구조를 제공하는 것으로 생각된다. 이러한 α-나선 꼬인 코일 반복은 4개의 프롤린이 풍부한 힌지 영역에 의해 중단된다. 24번째 반복의 말단에는 WW 도메인이 바로 뒤따른 제4 힌지 영역이 있다[Blake, D. 등, Function and Genetics of Dystrophin and Dystrophin-Related Proteins in Muscle. Physiol. Rev. 82: 291-329, 2002]. 본원에 개시된 마이크로디스트로핀은 R4 내지 R23을 포함하지 않거나, 또는 대안적으로 R3(또는 일부 구현예에서는 R4) 내지 R15 및 R18 내지 R23을 포함하지 않고 (즉, 마이크로디스트로핀이 R16 및 R17을 포함하지만, 특정 구현예는 R3을 포함하지 않음), 4개의 힌지 영역 또는 그의 부분 중 2개 또는 3개만을 포함한다. 구현예는 nNOS를 근형질막에 고정시키는 것으로 이해되는 디스트로핀 스펙트린-유사 반복부 16 및 17을 함유할 수 있다. 일부 구현예에서, 새로운 아미노산 잔기 또는 링커는 마이크로디스트로핀 내로 도입되지 않는다.
일부 구현예에서, 마이크로디스트로핀은 H3(예를 들어, 서열번호: 1, 2, 또는 79)을 포함한다. 구현예에서, H3은 N-말단에서 C-말단까지의 전체 내인성 H3 도메인, 예를 들어, 서열번호: 11일 수 있다. 달리 말하면, 일부 마이크로디스트로핀 구현예는 H3 도메인의 단편을 함유하지 않지만 전체 H3 도메인을 함유한다. 일부 구현예에서, R3 도메인의 C-말단 아미노산은 H3 도메인의 N-말단 아미노산에 직접 커플링(또는 공유 결합)된다. 일부 구현예에서, H3 도메인의 N-말단 아미노산에 커플링된 R3 도메인의 C-말단 아미노산은 Q이다. 일부 구현예에서, R3 도메인에 커플링된 H3 도메인의 5' 아미노산은 Q이다.
다른 구현예에서, 마이크로디스트로핀은 H3 대신에 H2를 포함한다. H2는 전체 내인성 H2 도메인(서열번호: 19)일 수 있다. 이러한 마이크로디스트로핀 단백질 구현예는 아미노 말단에서 카복시 말단까지: ABD-H1-R1-R2-R3-H2-R24-H4-CR을 갖는다. 일부 구현예에서, 힌지 도메인의 N-말단 아미노산에 커플링된 R3 도메인의 C-말단 아미노산은 Q이다. 다른 구현예에서, R3 도메인에 커플링된 H2 도메인의 N-말단 아미노산은 P이다. 특정 구현예에서, R3 도메인의 C-말단 아미노산은 힌지 도메인의 N-말단 아미노산에 직접 커플링되고, 여기서 힌지 도메인의 N-말단 아미노산은 P 또는 Q이다. 또 다른 구현예에서, R3 도메인의 C-말단 아미노산은 H2 도메인의 N-말단 아미노산에 직접 커플링되고, 여기서 H2 도메인의 N-말단 아미노산은 P이다.
어느 한 이론에 얽매이지 않고, 유도된 마이크로디스트로핀 단백질에 완전한 활성을 전달하기 위해 완전한 힌지 도메인은 임의의 마이크로디스트로핀 구성체에 적절할 수 있다. 디스트로핀의 힌지 세그먼트는 본질적으로 프롤린이 풍부한 것으로 인식되어 단백질 생성물에 가요성을 부여할 수 있다(Koenig and Kunkel, 265(6):4560-4566, 1990). 힌지의 일부가 삭제되면, 특히 하나 이상의 프롤린 잔기가 제거되면, 가요성이 줄어들 수 있으므로 DAP 복합체에서 다른 단백질과의 상호 작용을 방해하여 효능을 감소시킬 수 있다.
본원에 개시된 마이크로디스트로핀은 CR 도메인(서열번호: 15에서 단일 밑줄(UniProtKB-P11532 aa 3307-3354)로 표시되는 ZZ 도메인을 함유함)에 대한 야생형 디스트로핀 H4 서열(WW 도메인을 함유)을 포함한다. WW 도메인은 여러 신호전달 및 조절 분자에서 발견되는 단백질 결합 모듈이다. WW 도메인은 src 상동성-3(SH3) 도메인과 유사한 방식으로 프롤린-풍부 기질에 결합한다. β-디스트로글리칸의 세포질 도메인은 프롤린이 풍부하기 때문에 이 영역은 β-디스트로글리칸과 디스트로핀 사이의 상호작용을 매개한다. WW 도메인은 힌지 4(H4 영역)에 있다. CR 도메인은 α-악티닌의 것과 유사하고 세포 내 Ca2 +에 결합할 수 있는 두 개의 EF-핸드 모티브를 함유한다. ZZ 도메인은 Zn2 +와 같은 2가 금속 양이온에 대한 배위 자리를 형성할 것으로 예측되는 다수의 보존된 시스테인 잔기를 함유한다. ZZ 도메인은 많은 유형의 아연 핑거와 유사하며 핵 및 세포질 단백질 모두에서 발견된다. 디스트로핀의 ZZ 도메인은 Ca2 + 의존적 방식으로 칼모듈린에 결합한다. 따라서 ZZ 도메인은 기능적 칼모듈린 결합 부위를 나타낼 수 있으며 다른 디스트로핀 관련 단백질과의 칼모듈린 결합에 대한 연루를 가질 수 있다.
특정 구현예는 ZZ 도메인을 포함하는 CR 도메인의 말단절단 부분을 포함한다. 예를 들어, 마이크로디스트로핀 단백질은 아미노 말단으로부터 카복시 말단까지를 포함한다: ABD-H1-R1-R2-R3-H3-R24-H4-CR(짧은)-CT (예를 들어, 서열번호: 91, 도 22에서 RGX-DYS6 참조). 특정 구현예에서, CR 도메인은 예를 들어 서열번호: 90의 아미노산 서열을 갖는다.
AAV 벡터의 전형적인 패키징 한계를 극복하기 위해, 임상 용도로 개발된 많은 마이크로디스트로핀 유전자에는 CT 도메인이 결여되어 있다. 여러 연구자들은 DAPC가 조립을 위해 C-말단 도메인을 필요로 하지 않거나 C-말단이 필수적이지 않다고 지적하였다 [Crawford, 등, J Cell Biol, 2000, 150(6):1399-1409; 및 Ramos, J.N, 등 Molecular Therapy 2019, 27(3):1-13]. 그럼에도 불구하고 디스트로핀 단백질의 CT 도메인은 심근병증에 유익한 효과를 제공할 수 있다. 심장근에서 디스트로핀의 CT 도메인과 β-디스트로글리칸 사이의 특별한 상호작용은 원형질막 계면에 직접적인 분자 상호작용이 존재하는 것으로 나타났으며, 이는 심근세포막에 DAP 복합체를 고정시키는 데 CT 도메인의 직접적인 역할을 나타낸다 [Stevenson, S., 등, Spatial relationship of the C-terminal domains of dystrophin and beta-dystroglycan in cardiac muscle support a direct molecular interaction at the plasma membrane interface. Circ Res, 1998. 82(1): p. 82-93]. 274명의 뒤센(Duchenne) 및 베터(Becker) 근이영양증 환자에 대한 연구에서 디스트로핀 유전자형-심장 표현형 교정은 N-말단 액틴 결합 도메인(ABD1)의 존재와 CR 도메인과 CT 도메인의 존재가 심근병증의 위험을 감소시키는 것으로 밝혀졌으며, 이는 추가로 디스트로핀 단백질의 CT 도메인에 대한 유익한 심장-보호 효과를 지적한다[Tandon, A., 등, Dystrophin genotype-cardiac phenotype correlations in Duchenne and Becker muscular dystrophies using cardiac magnetic resonance imaging. Am J Cardiol, 2015. 115(7): p. 967-71]. 또한, mdx 마우스의 골격근에서 CT 도메인의 꼬인 코일 모티프의 나선 1을 함유하는 마이크로디스트로핀 유전자의 과다발현은 동원 α1-신트로핀 및 α-디스트로브레빈을 증가시켰고, 이는 근형질막에 동원된 신호전달 단백질을 위한 모듈 어댑터로서 역할을 하는 DAP 복합체의 구성원이다 [Koo, T., 등, Delivery of AAV2/9-microdystrophin genes incorporating helix 1 of the coiled-coil motif in the C-terminal domain of dystrophin improves muscle pathology and restores the level of α1-syntrophin and α-dystrobrevin in skeletal muscles of mdx mice. Hum Gene Ther, 2011. 22(11): p. 1379-88]. 더 긴 버전의 마이크로디스트로핀의 과발현은 또한 더 짧은 버전과 비교하여 mdx 마우스에서 수축 유발 근육 손상 연장에 대한 근육 저항을 개선하였다 [Koo, T., 등 2011, 상기].
DMD 환자에서 현저하게 감소된 심장 기능이 지속되는 것으로 나타났다. 신경 산화질소 합성효소(nNOS) 기능을 회복시키는 치료는 수축기 혈압, 분획 단축 및 박출률을 크게 개선하고 차례로 심장 섬유증을 감소시켜 심장 기능을 개선함으로써 유익한 것으로 생각된다. 심장 섬유증의 진행은 환자가 좌심실(LV) 팽창 및 비대를 먼저 나타내기 때문에 표시되며, 이는 확장성 심근병증(DCM)으로 알려진 단계로 진행된다.
디스트로핀의 CT 도메인은 막대 도메인에서와 유사한 α-나선 이중나선을 형성할 것으로 예측되는 2개의 폴리펩타이드 스트레치를 포함한다(아래 표 1의 서열번호: 16에서 단일 밑줄로 표시된 H1 및 이중 밑줄로 표시된 H2 참조). 각 이중나선에 류신이 "d" 위치에서 우세한 류신 지퍼에서 발견되는 것과 유사한 보존된 반복 헵타드(a,b,c,d,e,f,g)n가 있다. 이 도메인은 CC(이중나선) 도메인으로 명명되었다. 디스트로핀의 CC 영역은 디스트로브레빈의 결합 부위를 형성하고 α1-신트로핀 및 다른 디스트로핀 관련 단백질 간의 상호작용을 조절할 수 있다.
신트로핀 동형, α1-신트로핀 및 β1-신트로핀 모두 디스트로핀 엑손 73 및 74에서 하나 초과의 결합 부위를 통해 디스트로핀과 직접 상호작용하는 것으로 생각된다(Yang 등, JBC 270(10):4975-8 (1995)). α1- 및 β1-신트로핀은 디스트로핀 C-말단 도메인에 개별적으로 결합하고, α1-신트로핀에 대한 결합 부위는 적어도 아미노산 잔기 3447 내지 3481 내에 존재하는 반면, β1-신트로핀에 대한 결합 부위는 아미노산 잔기 3495 내지 3535 내에 존재한다(표 1, 서열번호: 16, 이탤릭체). 알파1-(α1-) 신트로핀과 알파-신트로핀은 전체적으로 상호교환적으로 사용된다.
마이크로디스트로핀 유전자 카세트의 C-말단(CT) 도메인에 있는 꼬인 코일 모티프의 나선 1(아래 표 1에서 서열번호: 16 내의 단일 밑줄 친 서열로 표시된 H1 참조)은 심근세포 보호, 및 다르게는 디스트로핀 관련 (당)단백질 (DAP) 복합체 (DAPC) 안정화에 유리할 수 있다. DAPC는 중요한 신호 역할과 구조적 역할에 참여할 수 있다. 확실히, 산화질소(NO) 생성의 표시가 있었고, 복합체의 불안정화 및 손실로 인해 다른 기능이 변경될 수 있다는 징후가 있었다.
예상외로, 본원에 개시된 특정 마이크로디스트로핀 작제물은 nNOS는 물론 알파-신트로핀, 알파-디스트로브레빈 및 베타-디스트로글리칸에 결합하고 이를 모집하는 것으로 밝혀졌다. nNOS에 결합하는 디스트로핀의 C-말단 도메인을 포함하는 마이크로디스트로핀 작제물의 맥락에서, nNOS에 대한 결합은 근육 조직에서 발현된 마이크로디스트로핀 작제물이 형질도입된 근육 조직의 절편에서 근형막내 또는 그 근처에서 알파-신트로핀, 알파-디스트로브레빈 및 nNOS 각각을 확인하기 위해 적절한 항체를 사용한 면역염색에 의해 결정되었음을 의미한다. 아래 섹션 6.5 및 6.7의 예 5 및 7을 참조한다. 특정 구현예에서, 마이크로디스트로핀 단백질은, C-말단 도메인을 함유하지 않는 필적하는(그러나 다른 것은 동일한 아미노산 서열을 가짐, 즉 "기준 마이크로디스트로핀 단백질"임) 마이크로디스트로핀에 비해 α1-신트로핀, β-신트로핀 및/또는 디스트로브레빈에 대한 "결합을 증가하는" C-말단 도메인을 갖고, 이는, 기준 마이크로디스트로핀 단백질 (C-말단 도메인을 갖지 않는 것을 제외하고는 동일한 서열 및 디스트로핀 성분을 가짐)로 처리된 mdx 마우스 근육과 비교하여, C-말단 도메인을 갖는 마이크로디스트로핀으로 처리된 mdx 마우스 근육에서 α1-신트로핀, β-신트로핀, α-디스트로브레빈, β-디스트로글리칸 또는 nNOS를 포함하는 하나 이상의 DAPC 성분에 대한 근육 절편의 면역염색 또는 근육 조직 용해물 또는 근육 막 제제의 웨스턴 블롯 분석에 의해 근육 막에서 하나 이상의 DAPC 성분의 더 높은 수준에 의해 결정 시, DAPC가 C-말단 도메인을 갖지 않는 (그러나 마이크로디스트로핀과 동일한 아미노산 서열을 갖는) 기준 마이크로디스트로핀보다 더 큰 정도로 근형질막에 안정화되거나 고정되는 것을 의미한다(하기 섹션 6.5 및 6.7 참조).
일부 구현예에서, 디스트로핀의 C-말단 도메인을 포함하는 마이크로디스트로핀 작제물은 C-말단 도메인에 신트로핀 결합 부위 및/또는 디스트로브레빈 결합 부위를 포함한다. 일부 구현예에서, α1-신트로핀 결합 부위를 포함하는 C-말단 도메인은 말단절단 C-말단 도메인이다. 특정 구현예에서, 말단절단 C-말단 도메인의 아미노산 서열은 서열번호: 83이다. 특정 구현예에서, 말단절단 C-말단 도메인은 아미노산 서열 MENSNGSYLNDSISPNESIDDEHLLIQHYCQSLNQ(α1-신트로핀 결합 부위)(서열번호: 84)를 포함한다. 특정 구현예에서, 말단절단 C-말단 도메인은 α1-신트로핀 결합 부위를 포함하고, 상기 결합 부위는 아미노산 서열 MENSNGSYLNDSISPNESIDDEHLLIQHYCQSLNQ (서열번호: 84)를 갖지만 β1-신트로핀 또는 디스트로브레빈 결합 부위는 갖지 않는다.
본 개시내용의 마이크로디스트로핀 작제물은 또한, 마이크로디스트로핀 작제물의 투여 다음에, 심근 대식세포 농도의 감소, 부착 분자의 발현의 감소, 및/또는 정규화 심전도(ECG) 판독, 예를 들어 말단 수축기 부피 (좌심실), 말단 확장기 부피, 뇌졸중 부피, 박출률, 심박수, 또는 심박출량에 의해 측정되는 바와 같은 진행성 심실 섬유증을 예방할 수 있다. 말단 수축기 부피 및 다른 심장 판독은 MRI (자성 공명 단층촬영), 심장 CT (전산화단층촬영법) 또는 SPECT (단일 광자 방출 전산화단층촬영법)를 사용하여 측정할 수도 있다. 본 발명의 마이크로디스트로핀 작제물의 투여 후 심장 기능 개선은 또한 DBA/2J-mdx 마우스 모델에서 테스트될 수 있다.
따라서, 본원에 기재된 구현예는 꼬인 코일 모티프의 나선 1을 포함하는 CT 도메인의 전부 또는 일부를 추가로 포함할 수 있다. 예를 들어, 마이크로디스트로핀 단백질은 아미노 말단으로부터 카복시 말단까지를 포함한다: ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT (예를 들어, 서열번호: 1, 79 또는 91) 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT (예를 들어, 서열번호: 92). 일부 구현예에서, CT는 도 14에 예시된 바와 같은 α1-신트로핀 결합 부위 및/또는 디스트로브레빈 결합 부위를 포함하는 디스트로핀의 C-말단 도메인의 적어도 일부이다. 특정 구현예에서, CT 도메인은 α1-신트로핀 결합 부위를 포함하고 β1-신트로핀 또는 디스트로브레빈 결합 부위를 가지 않으며, 예를 들어, 이는 부분적으로 nNOS를 동원하고 α1-신트로핀을 통해 근형질막에 고정시키는 기능을 하는 서열번호: 83의 아미노산 서열을 갖는다. 일부 구현예에서, CT는 서열번호: 16 또는 83의 아미노산 서열을 포함한다.
마이크로디스트로핀 구현예는 하기 제시된 바와 같이 도메인에 연결된 링커 (L1, L2, L3, L4, L4.1 및/또는 L4.2) 또는 그의 일부를 추가로 포함할 수 있다: ABD1-L1-H1-L2-R1-R2-L3-R3-H3-L4-R24-H4-CR-CT (예를 들어, 서열번호: 1, 79, 또는 91), ABD1-L1-H1-L2-R1-R2-L3-R3-H3-L4-R24-H4-CR (예를 들어, 서열번호: 2), ABD1-L1-H1-L2-R1-R2-L3-R16-L4.1-R17-L4.2-R24-H4-CR (예를 들어, 서열번호: 92), 또는 ABD1-L1-H1-L2-R1-R2-L3-R16-L4.1-R17-L4.2-R24-H4-CR-CT (예를 들어, 서열번호: 93). L1은 ABD1을 H1에 커플링할 수 있는 내인성 링커 L1(예를 들어, 서열번호: 4)일 수 있다. L2는 H1을 R1에 커플링할 수 있는 내인성 링커 L2(예를 들어, 서열번호: 6)일 수 있다. L3은 R2를 R3 또는 R16에 커플링할 수 있는 내인성 링커 L3(예를 들어, 서열번호: 9)일 수 있다.
L4는 또한 H3와 R24를 커플링할 수 있는 내인성 링커일 수 있다. 일부 구현예에서, L4는 3개의 아미노산, 예를 들어 천연 디스트로핀 서열에서 R24에 선행하는 TLE(서열번호: 12)이다. 다른 구현예에서, L4는 천연 디스트로핀 서열에서 R24에 선행하는 4개의 아미노산(서열번호: 17) 또는 R24에 선행하는 2개의 아미노산(서열번호: 18)일 수 있다. 다른 구현예에서, H3과 R24 사이에는 링커, L4 또는 달리 존재하지 않는다. 위에서 언급한 바와 같이 H3의 5' 말단에는 링커가 존재하지 않고 오히려 R3이 H3, 또는 대안적으로 H2에 직접 커플링된다.
L4.1은 R16과 R17을 커플링할 수 있는 내인성 링커일 수 있다. 일부 구현예에서, L4.1은 2개의 아미노산, 예를 들어 천연 디스트로핀 서열에서 R17에 선행하는 SV(서열번호: 110)이다. 다른 구현예에서, L4.2는 내인성 링커 또는 R17 및 R24를 커플링할 수 있는 내인성 링커의 일부일 수 있다. 일부 구현예에서, L4.2는 4개의 아미노산, 예를 들어 R17 및 R24 (서열번호: 89)에 선행하는 TLE (서열번호: 12)에 이어지는 Q이다.
구체적으로 기술되지 않은 마이크로디스트로핀 기타 도메인의 상기 기재된 성분은 하기 표 1에 제공된 바와 같은 아미노산 서열을 가질 수 있다. 본원에 제공된 도메인의 아미노산 서열은 본원에 참고로 포함된 UniProtKB-P11532(DMD_HUMAN)의 디스트로핀 동형에 해당한다. 다른 구현예는 UniProtKB-A0A075B6G3(A0A075B6G3_HUMAN)(본원에 참고로 포함됨)과 같이 당업계에 공지된 자연 발생 기능성 디스트로핀 동형으로부터의 도메인을 포함할 수 있으며, 여기서 예를 들어 R24는 서열번호: 13의 아미노산 3에서 Q에 대해 치환된 R을 갖는다.
Figure pct00001
Figure pct00002
본 개시내용은 또한 각 도메인 및 링커의 기능이 실질적으로 유지되고/거나 이러한 변이체를 포함하는 마이크로디스트로핀의 치료적 효능이 실질적으로 유지되는 한 이러한 서열의 변이체를 고려한다. 기능적 활성은 (1) 액틴, β-디스트로글리칸, α1-신트로핀, α-디스트로브레빈 및 nNOS 중 하나, 이들의 조합 또는 모두에 대한 결합; (2) 동물 모델(예를 들어, 본 명세서에 기재된 mdx 마우스 모델에서) 또는 인간 대상체에서 개선된 근육 기능; 및/또는 (3) 동물 모델 또는 인간 환자에서 심장근 기능의 심장 보호 또는 개선을 포함한다. 특히, 마이크로디스트로핀은 서열번호: 3 또는 서열번호: 3과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성되고; 서열번호: 5 또는 서열번호: 5와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 H1; 서열번호: 7 또는 서열번호: 7과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 아미노산 서열로 구성된 R1; 서열번호: 8 또는 서열번호: 8과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 R2; 서열번호: 19 또는 서열번호: 19와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 H2; 서열번호: 11 또는 서열번호: 11과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 H3; 서열번호: 13 또는 서열번호: 13과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 R24; 서열번호: 14 또는 서열번호: 14와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 H4; 서열번호: 15 또는 90 또는 서열번호: 15 또는 90과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 CR; 서열번호: 16 또는 83 또는 서열번호: 16 또는 83과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 CT, 또는 서열번호: 84를 포함하는 CT로 구성된 ABD를 포함할 수 있다. 대안적인 구현예는 전술한 바와 같고, 단, H3 도메인는 마찬가지로 기능적 활성을 갖는 마이크로디스트로핀을 인코딩하는, 서열번호: 19 또는 서열번호: 19와 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 H2 도메인으로 교체된다. 전술한 것에 추가하여, 마이크로디스트로핀은 하기와 같은 서열을 포함하거나 이로 구성된 상기 기재된 위치에 링커를 포함할 수 있다: 서열번호: 4 또는 서열번호: 4에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 L1; 서열번호: 6 또는 서열번호: 6에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 L2; 서열번호: 9 또는 서열번호: 9에 대해 적어도 50% 동일성을 갖는 아미노산 서열로 구성된 L3 또는 L3 잔기 둘 다에 대한 보존적 치환을 갖는 변이체; 및 서열번호: 12, 17, 또는 18 또는 서열번호: 12, 17, 또는 18에 대해 적어도 50%, 적어도 75% 서열 동일성을 갖는 아미노산 서열로 구성된 L4
특정 구현예에서, 마이크로디스트로핀은 서열번호: 3 또는 서열번호: 3과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 ABD; 서열번호: 5 또는 서열번호: 5와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 H1; 서열번호: 7 또는 서열번호: 7과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 R1; 서열번호: 8 또는 서열번호: 8과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 R2; 서열번호: 86 또는 서열번호: 86과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 R16; 서열번호: 87 또는 서열번호: 87과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 R17; 서열번호: 13 또는 서열번호: 13과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 R24; 서열번호: 14 또는 서열번호: 14와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 H4; 서열번호: 15 또는 90 또는 서열번호: 15 또는 90과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 CR; 서열번호: 16 또는 83 또는 서열번호: 16 또는 83과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 CT, 또는 서열번호: 84를 포함하는 CT를 포함할 수 있다. 전술한 것에 추가하여, 마이크로디스트로핀은 하기와 같은 서열을 포함하거나 이로 구성된 상기 기재된 위치에 링커를 포함할 수 있다: 서열번호: 4 또는 서열번호: 4에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 L1; 서열번호: 6 또는 서열번호: 6에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 아미노산 서열로 구성된 L2; 서열번호: 9 또는 서열번호: 9에 대해 적어도 50% 동일성을 갖는 아미노산 서열로 구성된 L3 또는 L3 잔기 둘 다에 대한 보존적 치환을 갖는 변이체; 서열번호: 110 또는 서열번호: 110.에 대해 적어도 50%, 적어도 75% 서열 동일성을 갖는 아미노산 서열로 구성된 L4.1; 및 서열번호: 89 또는 서열번호: 89에 대해 적어도 50%, 적어도 75% 서열 동일성을 갖는 아미노산 서열로 구성된 L4.2.
표 2는 본 개시내용에 따른 마이크로디스트로핀 구현예의 아미노산 서열을 제공한다. 다른 구현예는 서열번호: 1, 2, 79, 91, 92, 또는 93에 의해 정의된 바와 같은 마이크로디스트로핀의 치환된 변이체인 것으로 또한 고려된다. 예를 들어, 서열번호: 1, 2, 79, 91, 92, 또는 93에 보존적 치환이 이루어질 수 있고 그의 기능적 활성을 실질적으로 유지할 수 있다. 구현예에서, 마이크로디스트로핀은 서열번호: 1, 2, 79, 91, 92, 또는 93의 아미노산 서열에 대해 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 서열 동일성을 가질 수 있고 하기 섹션 5.4에 개시된 동물 모델에서의 시험관내 검정 또는 생체내 검정 중 하나 이상에 의해 결정된 바와 같이 기능적 마이크로디스트로핀 활성을 유지할 수 있다.
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
5.2. 2 마이크로디스트로핀을 인코딩하는 핵산 조성물
본 개시내용의 또 다른 양태는 본원에 기재된 바와 같은 마이크로디스트로핀을 인코딩하는 뉴클레오티드 서열을 포함하는 핵산이다. 이러한 핵산은 아래와 같이 N-말단으로부터 C-말단까지 배열된 도메인을 갖는 마이크로디스트로핀을 인코딩하는 뉴클레오티드 서열을 포함한다: ABD1-H1-R1-R2-R3-H3-R24-H4-CR-CT, ABD1-H1-R1-R2-R3-H3-R24-H4-CR, ABD1-H1-R1-R2-R16-R17-R24-H4-CR-CT, 또는 ABD1-H1-R1-R2-R16-R17-R24-H4-CR. 뉴클레오티드 서열은 도메인을 인코딩하는 임의의 뉴클레오티드 서열일 수 있다. 뉴클레오티드 서열은 적절한 맥락에서 발현을 위해 CpG 섬이 코돈 최적화 및/또는 고갈될 수 있다. 특정 구현예에서, 뉴클레오티드 서열은 서열번호: 1, 2, 79, 91, 92, 또는 93의 아미노산 서열을 갖는 마이크로디스트로핀을 인코딩한다. 뉴클레오티드 서열은 서열번호: 1, 서열번호: 2, 서열번호: 79, 서열번호: 91, 서열번호: 92, 또는 서열번호: 93의 마이크로디스트로핀을 포함하는 마이크로디스트로핀을 인코딩하는 임의의 서열일 수 있으며, 이러한 뉴클레오티드 서열은 코드의 축퇴로 인해 다를 수 있다. 표 3 및 4는 DMD 도메인을 인코딩하는 예시적인 뉴클레오티드 서열을 제공한다. 표 3은 구성요소에 대한 야생형 DMD 뉴클레오티드 서열을 제공하고 표 4는 하기와 같이 CpG 섬이 코돈 최적화 및/또는 CpG 결핍된 서열을 포함하는 본원의 작제물에 사용된 DMD 구성요소에 대한 뉴클레오티드 서열을 제공한다:
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
일부 구현예에서, 이러한 조성물은 서열번호: 22 또는 서열번호: 22에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 ABD1을 인코딩하는 핵산 서열; 서열번호: 24 또는 서열번호: 24에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 H1을 인코딩하는 핵산 서열; 서열번호: 26 또는 서열번호: 26과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 R1을 인코딩하는 핵산 서열; 서열번호: 27 또는 서열번호: 27과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 R2를 인코딩하는 핵산 서열; 서열번호: 29 또는 서열번호: 29에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 R3을 인코딩하는 핵산 서열; 서열번호: 30 또는 서열번호: 30에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 H3을 인코딩하는 핵산 서열; 서열번호: 32 또는 서열번호: 32에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 R24를 인코딩하는 핵산 서열; 서열번호: 33 또는 서열번호: 33과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열로 구성된 H4를 인코딩하는 핵산 서열; 서열번호: 34 또는 109 또는 서열번호: 34 또는 109에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 CR을 인코딩하는 핵산 서열; 및/또는 서열번호: 35 또는 서열번호: 35에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 CT를 인코딩하는 핵산 서열을 포함하고, 상기 서열은 기능적 활성을 갖는 마이크로디스트로핀을 인코딩한다. 대안적인 구현예는 전술한 바와 같고, 단, H3 핵산 서열은 서열번호: 38 또는 서열번호: 38에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 H2를 인코딩하는 핵산으로 대체되고, 마찬가지로 상기 기능적 활성을 갖는 마이크로디스트로핀을 인코딩한다.
일부 구현예에서, 이러한 조성물은 서열번호: 22 또는 서열번호: 22에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 3의 ABD1 도메인을 인코딩하는 ABD1을 인코딩하는 핵산 서열; 서열번호: 24 또는 서열번호: 24에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 5의 H1 도메인을 인코딩하는 H1을 인코딩하는 핵산 서열; 서열번호: 26 또는 서열번호: 26과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 7의 R1 도메인을 인코딩하는 R1을 인코딩하는 핵산 서열; 서열번호: 27 또는 서열번호: 27과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 8의 R2 도메인을 인코딩하는 R2를 인코딩하는 핵산 서열; 서열번호: 29 또는 서열번호: 29에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 10의 R3 도메인을 인코딩하는 R3을 인코딩하는 핵산 서열; 서열번호: 30 또는 서열번호: 30에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 11의 H3 도메인을 인코딩하는 H3을 인코딩하는 핵산 서열; 서열번호: 32 또는 서열번호: 32에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 13의 R24 도메인을 인코딩하는 R24를 인코딩하는 핵산 서열; 서열번호: 33 또는 서열번호: 33과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 14의 H4 도메인을 인코딩하는 H4를 인코딩하는 핵산 서열; 서열번호: 34 또는 109 또는 서열번호: 34 또는 109에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 15 또는 90의 CR 도메인을 인코딩하는 CR을 인코딩하는 핵산 서열; 및/또는 서열번호: 35 또는 80 또는 서열번호: 35 또는 80과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 16 또는 83의 CT 도메인을 인코딩하는 CT를 인코딩하는 핵산 서열을 포함한다. 대안적인 구현예는 전술한 바와 같고, 단, H3 핵산 서열은 서열번호: 38 또는 서열번호: 38과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 19의 H2 도메인을 인코딩하는 H2를 인코딩하는 핵산으로 대체된다.
전술한 것에 추가하여, 핵산 조성물은 선택적으로 하기 서열을 포함하거나 이로 구성된 상기 기재된 위치에서 링커를 인코딩하는 뉴클레오티드 서열을 포함할 수 있다: 서열번호: 23 또는 서열번호: 23에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 서열로 구성된 L1을 인코딩하는 핵산 서열 (예를 들어, 서열번호: 4의 L1 도메인을 인코딩함); 서열번호: 25 또는 서열번호: 25에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 서열로 구성된 L2를 인코딩하는 핵산 서열 (예를 들어, 서열번호: 6의 L2 도메인을 인코딩함); 서열번호: 9의 L3 도메인 또는 L3 잔기 둘 다에 대한 보존적 치환을 갖는 변이체를 인코딩하는, 서열번호: 28 또는 서열번호: 28과 적어도 50% 동일성을 갖는 서열로 구성된 L3을 인코딩하는 핵산 서열; 및 서열번호: 31, 36, 또는 37 또는 서열번호: 31, 36, 또는 37 에 대해 적어도 50%, 적어도 75% 서열 동일성을 갖는 서열로 구성된 L4를 인코딩하는 핵산 서열 (예를 들어, 서열번호: 12, 17, 또는 18의 L4 도메인 또는 임의의 L4 잔기 중 임의의 것에 대한 보존적 치환을 갖는 변이체를 인코딩함).
일부 구현예에서, 이러한 조성물은 서열번호: 22 또는 서열번호: 22에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 ABD1을 인코딩하는 핵산 서열; 서열번호: 24 또는 서열번호: 24에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 H1을 인코딩하는 핵산 서열; 서열번호: 26 또는 서열번호: 26과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 R1을 인코딩하는 핵산 서열; 서열번호: 27 또는 서열번호: 27과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 R2를 인코딩하는 핵산 서열; 서열번호: 94 또는 서열번호: 94에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 R16을 인코딩하는 핵산 서열; 서열번호: 95 또는 서열번호: 95에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 R17을 인코딩하는 핵산 서열; 서열번호: 32 또는 서열번호: 32에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 R24를 인코딩하는 핵산 서열; 서열번호: 33 또는 서열번호: 33과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열로 구성된 H4를 인코딩하는 핵산 서열; 서열번호: 34 또는 109 또는 서열번호: 34 또는 109에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 CR을 인코딩하는 핵산 서열; 및/또는 서열번호: 35 또는 서열번호: 35에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 CT를 인코딩하는 핵산 서열을 포함하고, 상기 서열은 기능적 활성을 갖는 마이크로디스트로핀을 인코딩한다. 대안적인 구현예는 전술한 바와 같고, 단, H3 핵산 서열은 서열번호: 38 또는 서열번호: 38에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성된 H2를 인코딩하는 핵산으로 대체되고, 마찬가지로 상기 기능적 활성을 갖는 마이크로디스트로핀을 인코딩한다.
일부 구현예에서, 이러한 조성물은 서열번호: 22 또는 서열번호: 22에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 3의 ABD1 도메인을 인코딩하는 ABD1을 인코딩하는 핵산 서열; 서열번호: 24 또는 서열번호: 24에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 5의 H1 도메인을 인코딩하는 H1을 인코딩하는 핵산 서열; 서열번호: 26 또는 서열번호: 26과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 7의 R1 도메인을 인코딩하는 R1을 인코딩하는 핵산 서열; 서열번호: 27 또는 서열번호: 27과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 8의 R2 도메인을 인코딩하는 R2를 인코딩하는 핵산 서열; 서열번호: 94 또는 서열번호: 94에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 86의 R16 도메인을 인코딩하는 R16을 인코딩하는 핵산 서열; 서열번호: 95 또는 서열번호: 95에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 87의 R17 도메인을 인코딩하는 R17을 인코딩하는 핵산 서열; 서열번호: 32 또는 서열번호: 32에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 13의 R24 도메인을 인코딩하는 R24를 인코딩하는 핵산 서열; 서열번호: 33 또는 서열번호: 33과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 14의 H4 도메인을 인코딩하는 H4를 인코딩하는 핵산 서열; 서열번호: 34 또는 109 또는 서열번호: 34 또는 109에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 15 또는 90의 CR 도메인을 인코딩하는 CR을 인코딩하는 핵산 서열; 및/또는 서열번호: 35 또는 80 또는 서열번호: 35 또는 80과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 16 또는 83의 CT 도메인을 인코딩하는 CT를 인코딩하는 핵산 서열을 포함한다. 대안적인 구현예는 전술한 바와 같고, 단, H3 핵산 서열은 서열번호: 38 또는 서열번호: 38과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고 서열번호: 19의 H2 도메인을 인코딩하는 H2를 인코딩하는 핵산으로 대체된다.
전술한 것에 추가하여, 핵산 조성물은 선택적으로 하기 서열을 포함하거나 이로 구성된 상기 기재된 위치에서 링커를 인코딩하는 뉴클레오티드 서열을 포함할 수 있다: 서열번호: 23 또는 서열번호: 23에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 서열로 구성된 L1을 인코딩하는 핵산 서열 (예를 들어, 서열번호: 4의 L1 도메인을 인코딩함); 서열번호: 25 또는 서열번호: 25에 대해 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 서열 동일성을 갖는 서열로 구성된 L2를 인코딩하는 핵산 서열 (예를 들어, 서열번호: 6의 L2 도메인을 인코딩함); 서열번호: 9의 L3 도메인 또는 L3 잔기 둘 다에 대한 보존적 치환을 갖는 변이체를 인코딩하는, 서열번호: 28 또는 서열번호: 28과 적어도 50% 동일성을 갖는 서열로 구성된 L3을 인코딩하는 핵산 서열; 서열번호: 125 또는 서열번호: 125에 대해 적어도 50%, 적어도 75% 서열 동일성을 갖는 서열로 구성된 L4.1을 인코딩하는 핵산 서열 (예를 들어, 서열번호: 110의 L4.1 도메인 또는 임의의 L4.1 잔기에 대한 보존적 치환을 갖는 변이체를 인코딩함); 및 서열번호: 126 또는 서열번호: 126에 대해 적어도 50%, 적어도 75% 서열 동일성을 갖는 서열로 구성된 L4.2를 인코딩하는 핵산 서열 (예를 들어, 서열번호: 89의 L4.2 도메인 또는 임의의 L4.2 잔기에 대한 보존적 치환을 갖는 변이체를 인코딩함).
다양한 구현예에서, 핵산은 서열번호: 1, 서열번호: 2, 서열번호: 79, 서열번호: 91, 서열번호: 92, 또는 서열번호: 93의 아미노산 서열을 갖는 마이크로디스트로핀을 인코딩하는 뉴클레오티드 서열을 포함한다. 구현예에서, 핵산은 (서열번호: 1, 서열번호: 2, 서열번호: 79, 서열번호: 91, 서열번호: 92, 및 서열번호: 93의 마이크로디스트로핀을 각각 인코딩하는) 서열번호: 20, 서열번호: 21, 서열번호: 81, 서열번호: 101, 서열번호: 102, 또는 서열번호: 103인 뉴클레오티드 서열을 포함한다. 다양한 구현예에서, 마이크로디스트로핀을 인코딩하는 뉴클레오티드 서열은 서열번호: 20, 21, 83, 101, 102, 또는 103의 뉴클레오티드 서열 (표 5) 또는 그의 역보체에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 서열 동일성을 가질 수 있고 치료적으로 효과적인 마이크로디스트로핀을 인코딩할 수 있다.
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025
Figure pct00026
5.2.2.1 코돈 최적화 및 CpG 고갈
한 양태에서, 마이크로디스트로핀 카세트를 인코딩하는 뉴클레오티드 서열은 코돈 최적화 및 CpG 디뉴클레오티드 및 CpG 섬 고갈에 의해 변형된다. 마이크로디스트로핀 이식유전자에 대한 면역 반응은 최초의 뒤센(Duchenne) 근이영양증(DMD) 유전자 요법 임상 시험 및 갯과 모델의 여러 아데노 관련 바이알(AAV)-미니디스트로핀 유전자 요법에서 입증된 바와 같이 인간 임상 적용에 대한 우려사항이다[Mendell, J.R., 등, Dystrophin immunity in Duchenne's muscular dystrophy. N Engl J Med, 2010. 363(15): p. 1429-37; 및 Kornegay, J.N., 등, Widespread muscle expression of an AAV9 human mini-dystrophin vector after intravenous injection in neonatal dystrophin-deficient dogs. Mol Ther, 2010. 18(8): p. 1501-8].
AAV-지정 면역 반응은 AAV 게놈에서 CpG 디-뉴클레오티드의 수를 감소시킴으로써 억제될 수 있다[Faust, S.M., 등, CpG-depleted adeno-associated virus vectors evade immune detection. J Clin Invest, 2013. 123(7): p. 2994-3001]. CpG 모티프의 이식유전자 서열을 고갈시키면 이식유전자가 비자기인 것으로 인식될 때 선천성 면역의 활성화에서 TLR9의 역할을 감소시킬 수 있고, 따라서 안정적이고 연장된 이식유전자 발현을 제공할 수 있다. [또한 Wang, D., P.W.L. Tai, and G. Gao, Adeno-associated virus vector as a platform for gene therapy delivery. Nat Rev Drug Discov, 2019. 18(5): p. 358-378.; 및 Rabinowitz, J., Y.K. Chan, and R.J. Samulski, Adeno-associated Virus (AAV) versus Immune Response. Viruses, 2019. 11(2) 참조]. 구현예에서, 마이크로디스트로핀 카세트는 CpG 고갈로 최적화된 인간 코돈이다. 코돈 최적화 및 CpG 고갈 뉴클레오티드 서열은 예를 들어 GeneOptimizer (Waltham, MA USA))를 활용하는 Thermo Fisher Scientific GeneArt Gene Synthesis 도구를 포함하는 당업계에 공지된 임의의 방법에 의해 설계될 수 있다. 본원에 기재된 뉴클레오티드 서열 서열번호: 20, 21, 57-72, 80, 81, 및 101-103은 코돈 최적화 및 CpG 고갈 서열을 나타낸다.
감소된 수의 CpG 디뉴클레오티드 서열을 갖고 결과적으로 감소된 수의 CpG 섬을 갖는 마이크로디스트로핀 이식유전자가 제공된다. 특정 구현예에서, 마이크로디스트로핀 뉴클레오티드 서열은 2개 미만의 CpG 섬, 또는 1개의 CpG 섬 또는 0개 미만의 CpG 섬을 갖는다. 구현예에서, 2개 초과의 CpG 섬을 갖는 마이크로디스트로핀 이식유전자와 비교하여 항-약물 항체 역가에 의해 측정할 때 면역원성이 감소된 2개 미만, 또는 1개의 CpG 섬, 또는 0개의 CpG 섬을 갖는 마이크로디스트로핀 이식유전자가 제공된다. 특정 구현예에서, 서열번호: 20, 21, 81, 101, 102 또는 103으로 본질적으로 구성되는 마이크로디스트로핀 뉴클레오티드 서열은 0개의 CpG 섬을 갖는다. 다른 구현예에서, 프로모터에 작동가능하게 연결된 마이크로디스트로핀 유전자로 본질적으로 구성되는 마이크로디스트로핀 이식유전자 뉴클레오티드 서열(여기서 마이크로디스트로핀은 서열번호: 20, 21, 81, 101, 102 또는 103으로 구성됨)은 2개 미만의 CpG 섬을 갖는다. 또 다른 구현예에서, 프로모터에 작동가능하게 연결된 마이크로디스트로핀 유전자로 본질적으로 구성되는 마이크로디스트로핀 이식유전자 뉴클레오티드 서열(여기서 마이크로디스트로핀은 서열번호: 20, 21, 81, 101, 102 또는 103으로 구성됨)은 1개의 CpG 섬을 갖는다.
5.3. 유전자 카세트 및 조절 요소
본 발명의 또 다른 양태는 마이크로디스트로핀의 발현을 부여하거나 향상시키도록 설계된 조절 요소를 포함하는 핵산 발현 카세트에 관한 것이다. 본 발명은 이식유전자의 발현을 향상시키거나 촉진하기 위해 프로모터 요소, 및 선택적으로 인핸서 요소 및/또는 인트론을 포함하는 조절 요소를 조작하는 것을 추가로 포함한다. 일부 구현예에서, rAAV 벡터는 또한 대상체의 표적 세포 내에서 핵산(이식유전자)에 의해 인코딩된 RNA 및/또는 단백질 생성물의 발현에 영향을 미치기 위해 당업자에게 공지된 이러한 조절 제어 요소를 포함한다. 조절 제어 요소는 조직 특이적일 수 있고, 즉, 표적 세포/조직에서만 활성(또는 실질적으로 더 활성이거나 상당히 더 활성)일 수 있다.
5.3.1 프로모터
5.3.1.1 조직 특이적 프로모터
특정 구현예에서, AAV 벡터의 발현 카세트는 표적 조직에서의 발현을 허용하는 이식유전자에 작동가능하게 연결된 조절 서열, 예컨대 프로모터를 포함한다. 프로모터는 구성적 프로모터, 예를 들어 CB7 프로모터일 수 있다. 추가 프로모터는 다음을 포함한다: 사이토메갈로바이러스 (CMV) 프로모터, 라우스 육종 바이러스 (RSV) 프로모터, MMT 프로모터, EF-1 알파 프로모터 (서열번호: 118), UB6 프로모터, 닭 베타-액틴 프로모터, CAG 프로모터 (서열번호: 116), RPE65 프로모터, 옵신 프로모터, TBG (티록신 결합 글로불린) 프로모터, APOA2 프로모터, SERPINA1 (hAAT) 프로모터, 또는 MIR122 프로모터. 일부 구현예에서, 특히 이식유전자 발현을 끄는 것이 바람직할 수 있는 경우, 유도성 프로모터, 예를 들어 저산소증 유도성 또는 라파마이신 유도성 프로모터가 사용된다.
특정 구현예에서, 프로모터는 근육 특이적 프로모터이다. "근육 특이적", "근육 선택적" 또는 "근육 지향적"이라는 어구는 근육 세포의 세포내 환경과 이러한 요소의 상호작용으로 인해 근육 세포 또는 조직에서 이들의 활성을 적응시킨 핵산 요소를 지칭한다. 이러한 근육 세포는 근세포, 근관, 심근세포 등을 포함할 수 있다. 심장, 골격 및 평활근 세포와 같은 구별되는 특성을 가진 특화된 형태의 근세포가 포함된다. 다양한 치료제가 이식유전자의 근육 특이적 발현으로부터 이익을 얻을 수 있다. 특히, 근육 세포에 전달되고 높은 형질도입 효율을 가능하게 하는 다양한 형태의 근이영양증을 치료하는 유전자 요법은 이식유전자가 가장 필요한 세포에서 이식유전자의 발현을 지시한다는 추가 이점이 있다. 심장 조직은 또한 이식유전자의 근육 유도 발현의 이점을 얻을 것이다. 근육 특이적 프로모터는 본 발명의 이식유전자에 작동가능하게 연결될 수 있다. 일부 구현예에서, 근육 특이적 프로모터는 SPc5-12 프로모터, 근육 크레아틴 키나제 미오신 경쇄 (MLC) 프로모터, 미오신 중쇄 (MHC) 프로모터, 데스민 프로모터 (서열번호: 119), MHCK7 프로모터 (서열번호: 120), CK6 프로모터, CK8 프로모터 (서열번호: 115), MCK 프로모터 (또는 이의 말단절단 형태) (서열번호: 121), 알파 액틴 프로모터, 베타 액틴 프로모터, 감마 액틴 프로모터, E-syn 프로모터, 심장 트로포닌 C 프로모터, 트로포닌 I 프로모터, myoD 유전자 계열 프로모터, 또는 Pitx3의 안구 형태의 인트론 1 내에 존재하는 근육 선택적 프로모터로부터 선택된다.
SPc5-12 프로모터로 알려진 합성 프로모터 c5-12 (Li, X. 등 Nature Biotechnology Vol. 17, pp. 241-245, MARCH 1999)는 세포 유형이 제한된 발현, 특히 근육-세포 특이적 발현을 갖는 것으로 밝혀졌다. 350 bp 미만의 길이에서 SPc5-12 프로모터는 대부분의 내인성 프로모터보다 길이가 작으며, 이는 치료 단백질을 인코딩하는 핵산의 길이가 비교적 긴 경우 유리할 수 있다. 구현예에서, SPc5-12 프로모터(서열번호: 39)가 있는 유전자 치료 카세트가 제공된다.
벡터의 길이를 추가로 감소시키기 위해, 조절 요소는 본원에 기재된 프로모터 중 어느 하나의 감소되거나 단축된 버전(본원에서 "최소 프로모터"로 지칭됨)일 수 있다. 최소 프로모터는 전장 버전의 적어도 전사적 활성 도메인을 포함하므로 여전히 발현을 유도할 수 있다. 예를 들어, 일부 구현예에서, AAV 벡터는 치료 단백질 이식유전자에 작동가능하게 연결된 근육 특이적 프로모터, 예를 들어 최소 SPc5-12 프로모터(예를 들어, 서열번호: 40)의 전사적 활성 도메인을 포함할 수 있다. 구현예에서, 치료 단백질은 본원에 기재된 바와 같은 마이크로디스트로핀이다. 본 개시내용의 최소 프로모터는 조직 특이적 방식으로 발현을 조절하는 데 기여하는 프로모터 서열의 부분을 함유하거나 함유하지 않을 수 있다.
따라서, 구현예에서, SPc5-12 프로모터(서열번호: 39)가 있는 유전자 치료 카세트가 제공된다. 구현예에서, 근육 세포에서 마이크로디스트로핀의 발현을 지시하는 최소 프로모터를 갖는 유전자 요법 카세트가 제공된다. 그러한 프로모터 중 하나는 서열번호: 40의 최소 SPc5-12 프로모터이다. 이들 프로모터의 서열은 표 6에 제공된다.
Figure pct00027
Figure pct00028
특정 구현예에서, 프로모터는 구성적 프로모터이다. 예를 들어, 발현 카세트는 뉴런 특이적 에놀라제(NSE)의 유전자로부터 분리된 프로모터, 임의의 뉴런 프로모터 예컨대 도파민-1 수용체 또는 도파민-2 수용체의 프로모터, 시냅신 프로모터, CB7 프로모터 (닭 β-액틴 프로모터 및 CMV 인핸서), RSV 프로모터, GFAP 프로모터 (신경교 원섬유성 산성 단백질), MBP 프로모터 (수초 염기 단백질), MMT 프로모터, EF-1α, U86 프로모터, RPE65 프로모터 또는 옵신 프로모터, 유도성 프로모터, 예를 들어, 저산소증 유도성 프로모터, 및 약물 유도성 프로모터, 예컨대 라파마이신 및 관련 제제에 의해 유도된 프로모터로부터 선택된 프로모터를 포함할 수 있다.
또 다른 구현예에서, 발현 카세트는 마이크로디스트로핀 이식유전자를 포함하는 발현 카세트에 나란히 배치될 수 있는 다중 프로모터를 포함할 수 있다. 이와 같이, 다중 조직 유형에 대한 발현 및/또는 직접적인 발현을 향상시키기 위해 탠덤 또는 하이브리드 프로모터를 사용할 수 있다(예를 들어 문헌 [PCT 국제공개 번호 WO2019154939A1, 2019년 8월 15일 공개, 이는 본원에 참조로 포함됨) 및, 특히, 참조로 본원에 포함된 2020년 7월 24일에 출원된 PCT 국제출원 번호 PCT/US2020/043578에 개시된 LMTP6, LMTP13, LMTP14, LMTP15, LMTP18, LMTP19, 또는 LMTP20] 참조).
5.3.2 인트론
본 개시내용의 또 다른 양태는 조절 카세트 내에 인트론을 포함하는 AAV 벡터에 관한 것이다. 실시예 2는 마이크로디스트로핀 코딩 서열의 VH4 인트론 5'가 적절한 스플라이싱 및 이에 따라 마이크로디스트로핀 발현을 향상시킨다는 것을 입증한다. 따라서, 일부 구현예에서, 인트론은 마이크로디스트로핀 단백질, 예를 들어, ABD-H1-R1-R2-R3-H3-R24-H4-CR, ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT, ABD-H1-R1-R2-R16-R17-R24-H4-CR, 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT를 인코딩하는 서열의 5' 말단에 커플링된다. 특히, 인트론은 액틴 결합 도메인에 연결될 수 있다. 다른 구현예에서, 인트론은 길이가 100개 미만의 뉴클레오티드이다.
구현예에서, 인트론은 VH4 인트론이다. VH4 인트론 핵산은 하기 표 7에 나타낸 바와 같이 서열번호: 41을 포함할 수 있다.
Figure pct00029
다른 구현예에서, 인트론은 인간 β-글로빈 및 Ig 중쇄로부터 유래된 키메라 인트론(β-글로빈 스플라이스 공여체/면역글로불린 중쇄 스플라이스 수용체 인트론, 또는 β-글로빈/IgG 키메라 인트론으로도 알려짐)이다(표 7, 서열번호: 75). 당업자에게 잘 알려진 다른 인트론, 예를 들어 예컨대 닭 β-액틴 인트론, 마우스 (MVM) 인트론, 인간 인자 IX 인트론(예를 들어, FIX 말단절단된 인트론 1), β-글로빈 스플라이스 공여체/면역글로불린 중쇄 스플라이스 수용체 인트론, 아데노바이러스 스플라이스 공여체 /면역글로불린 스플라이스 수용체 인트론, SV40 후기 스플라이스 공여체 /스플라이스 수용체 (19S/16S) 인트론(표 7, 서열번호: 76)의 미세 바이러스가 이용될 수 있다.
5.3.3 기타 조절 요소
5.3.3.1 폴리A
본 개시내용의 또 다른 양태는 마이크로디스트로핀 이식유전자의 코딩 영역의 하류에 폴리아데닐화(폴리A) 부위를 포함하는 발현 카세트에 관한 것이다. 전사의 종결을 신호하고 폴리A 꼬리의 합성을 지시하는 임의의 폴리A 부위는 본 개시내용의 AAV 벡터에서 사용하기에 적합하다. 예시적인 폴리A 신호는 하기로부터 유래되지만 이에 제한되지 않는다: SV40 후기 유전자, 토끼 β-글로빈 유전자, 소 성장 호르몬 (BPH) 유전자, 인간 성장 호르몬 (hGH) 유전자, 및 합성 폴리A (SPA) 부위. 한 구현예에서, 폴리A 신호는 표 8에 제시된 바와 같은 서열번호: 42를 포함한다.
Figure pct00030
5.3.4 바이러스 벡터
본 개시내용에 따른 마이크로디스트로핀 이식유전자는 인간 대상체에 대한 유전자 요법 투여를 위한 AAV 벡터에 포함될 수 있다. 일부 구현예에서, 재조합 AAV(rAAV) 벡터는 AAV 바이러스 캡시드 및 AAV 역위 말단 반복부(ITR)가 플랭킹된 발현 카세트를 포함하는 바이러스 또는 인공 게놈을 포함할 수 있으며, 상기 발현 마이크로디스트로핀을 발현하고 전달하기 위해 인간 근육 또는 CNS 세포에서 이식유전자의 발현을 제어하는 하나 이상의 조절 서열에 작동가능하게 연결된 마이크로디스트로핀 이식유전자를 포함한다. 제공된 방법은 본원에 기재된 마이크로디스트로핀의 전달을 위한 임의의 단리된 재조합 AAV 입자의 생산, 마이크로디스트로핀을 인코딩하는 임의의 단리된 재조합 AAV 입자를 포함하는 조성물의 생산, 또는 본원에 기재된 마이크로디스트로핀을 인코딩하는 임의의 단리된 재조합 AAV 입자의 투여를 포함하는, 이를 필요로 하는 대상체에서 마이크로디스트로핀으로 치료할 수 있는 질환 또는 장애를 치료하는 방법에 사용하기에 적합하다. 이와 같이, rAAV는 당업계에 공지된 그의 임의의 혈청형, 변이체, 변형, 하이브리드 또는 유도체, 또는 이들의 임의의 조합(집합적으로 "혈청형"으로 지칭됨)일 수 있다. 특정 구현예에서, AAV 혈청형은 근육 조직에 대한 친화성을 갖는다. 다른 구현예에서, AAV 혈청형은 CNS에 대한 친화성을 갖는다. 다른 구현예에서, AAV 혈청형은 근육 조직 및 CNS 둘 모두에 대해 친화성을 갖는다. 그리고, 다른 구현예에서, AAV 혈청형은 간에 대해 친화성을 가지며, 이 경우 AAV로 형질도입된 간 세포는 마이크로디스트로핀을 순환계로 분비하는 마이크로디스트로핀 분비 세포의 저장소를 형성한다.
일부 구현예에서,rAAV 입자는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15, AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV.PHP.B, AAV.PHP.eB, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 또는 AAV.HSC16 또는 이들의 유도체, 변형, 또는 유사형으로부터 선택된 AAV 혈청형으로부터의 캡시드 단백질을 갖는다. 일부 구현예에서,rAAV 입자는 예를 들어, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, rAAV.Anc80L65, AAV.7m8, AAV.PHP.B, AAV.PHP.eB, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 또는 AAV.HSC16, 또는 이들의 유도체, 변형, 또는 유사형으로부터 선택된 AAV 캡시드 혈청형의 VP1, VP2 및/또는 VP3 서열과 적어도 80% 이상 동일한, 예를 들어, 85%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 등, 즉 최대 100% 동일한 캡시드 단백질을 포함한다.
예를 들어, rAAV 입자의 집단은 예를 들어 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV.PHP.B, AAV.PHP.eB, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 또는 AAV.HSC16 또는 다른 rAAV 입자, 또는 그의 둘 이상의 조합) 중 둘 이상을 포함하는 2개 이상의 혈청형을 포함할 수 있다.
일부 구현예에서, rAAV 입자는 그 전체가 참고로 포함되는 문헌[Zinn 등, 2015, Cell Rep. 12(6): 1056-1068]에 기재된 바와 같이 Anc80 또는 Anc80L65의 캡시드를 포함한다. 특정 구현예에서, rAAV 입자는 하기 아미노산 삽입 중 하나를 갖는 캡시드를 포함한다: 미국 특허 번호 9,193,956; 9458517; 및 9,587,282 및 미국 특허 출원 공개 번호 2016/0376323에 기재된 바와 같은 LGETTRP 또는 LALGETTRP, 상기 특허 각각은 그 전체가 참고로 본원에 포함된다. 일부 구현예에서, rAAV 입자는 미국 특허 번호 9,193,956; 9,458,517; 및 9,587,282 및 미국 특허 출원 공개 번호 2016/0376323에 기재된 바와 같은 AAV.7m8의 캡시드를 포함하고, 상기 특허 각각은 그 전체가 참고로 본원에 포함된다. 일부 구현예에서, rAAV 입자는 AAVPHP.B와 같은 미국 특허 번호 9,585,971에 개시된 임의의 AAV 캡시드를 포함한다. 일부 구현예에서, rAAV 입자는 AAV.Rh74 및 RHM4-1과 같은 미국 특허 번호 9,840,719 및 WO 2015/013313에 개시된 임의의 AAV 캡시드를 포함하며, 이들 특허는 각각 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, rAAV 입자는 WO 2014/172669에 개시된 임의의 AAV 캡시드, 예컨대 AAV rh.74를 포함하며, 이는 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, rAAV 입자는 각각이 전체적으로 참고로 포함되는 문헌[Georgiadis 등, 2016, Gene Therapy 23:857-862 및 Georgiadis 등, 2018, Gene Therapy 25: 450]에 기재된 바와 같이 AAV2/5의 캡시드를 포함한다. 일부 구현예에서, rAAV 입자는 WO 2017/070491에 개시된 임의의 AAV 캡시드, 예컨대 AAV2tYF를 포함하며, 이는 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, rAAV 입자는 전체적으로 참조로 포함된 문헌[Puzzo 등, 2017, Sci. Transl. Med. 29(9): 418]에 기재된 바와 같이 AAVLK03 또는 AAV3B의 캡시드를 포함한다. 일부 구현예에서, rAAV 입자는 미국 특허 번호 8,628,966; US 8,927,514; US 9,923,120 및 WO 2016/049230에 개시된 임의의 AAV 캡시드, 예컨대 HSC1, HSC2, HSC3, HSC4, HSC5, HSC6, HSC7, HSC8, HSC9, HSC10, HSC11, HSC12, HSC13, HSC14, HSC15, 또는 HSC16을 포함하고, 상기 특허 각각은 전체적으로 참조로 포함된다.
일부 구현예에서, rAAV 입자는 하기 특허 및 특허 출원 중 임의의 것에 개시된 AAV 캡시드를 포함하며, 이들 특허는 각각 그 전체가 본원에 참조로 포함된다: 미국 특허 번호 7,282,199; 7,906,111; 8,524,446; 8,999,678; 8,628,966; 8,927,514; 8,734,809; US 9,284,357; 9,409,953; 9,169,299; 9,193,956; 9458517; 및 9,587,282; 미국 특허 출원 공개 번호 2015/0374803; 2015/0126588; 2017/0067908; 2013/0224836; 2016/0215024; 2017/0051257; 및 국제 특허 출원 번호 PCT/US2015/034799; PCT/EP2015/053335. 일부 구현예에서, rAAV 입자는 하기 특허 및 특허 출원 중 임의의 것에 개시된 AAV 캡시드의 VP1, VP2 및/또는 VP3 서열과 적어도 80% 이상 동일한, 예를 들어, 85%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 등, 즉 최대 100% 동일한 캡시드 단백질을 가지며, 이들 특허는 각각 그 전체가 본원에 참조로 포함된다: 미국 특허 번호 7,282,199; 7,906,111; 8,524,446; 8,999,678; 8,628,966; 8,927,514; 8,734,809; US 9,284,357; 9,409,953; 9,169,299; 9,193,956; 9458517; 및 9,587,282; 미국 특허 출원 공개 번호 2015/0374803; 2015/0126588; 2017/0067908; 2013/0224836; 2016/0215024; 2017/0051257; 및 국제 특허 출원 번호 PCT/US2015/034799; PCT/EP2015/053335.
일부 구현예에서, rAAV 입자는 국제 출원 공개 번호 WO 2003/052051 (참고, 예를 들어,'051의 서열번호: 2), WO 2005/033321 (참고, 예를 들어,'321의 서열번호: 123 및 88), WO 03/042397 (참고, 예를 들어,'397의 서열번호: 2, 81, 85, 및 97), WO 2006/068888 (참고, 예를 들어, '888의 서열번호: 1 및 3-6), WO 2006/110689, (참고, 예를 들어,'689의 서열번호: 5-38) WO2009/104964 (참고, 예를 들어,'964의 서열번호: 1-5, 7, 9, 20, 22, 24 및 31), WO 2010/127097 (참고, 예를 들어, '097의 서열번호: 5-38), 및 WO 2015/191508 (참고, 예를 들어, '508의 서열번호: 80-294), 및 미국 출원 공개 번호 20150023924 (참고, 예를 들어,'924의 서열번호: 1, 5-10)에 개시된 캡시드 단백질을 가지며, 이들 특허 각각의 내용은 전체적으로 참조로 본원에 포함되어 있다. 일부 구현예에서, rAAV 입자는 캡시드 단백질은 국제 출원 공개 번호 WO 2003/052051 (참고, 예를 들어, '051의 서열번호: 2), WO 2005/033321 (참고, 예를 들어, '321의 서열번호: 123 및 88), WO 03/042397 (참고, 예를 들어, '397의 서열번호: 2, 81, 85, 및 97), WO 2006/068888 (참고, 예를 들어, '888의 서열번호: 1 및 3-6), WO 2006/110689 (참고, 예를 들어, '689의 서열번호: 5-38) WO2009/104964 (참고, 예를 들어, 964의 서열번호: 1-5, 7, 9, 20, 22, 24 및 31), W0 2010/127097 (참고, 예를 들어, '097의 서열번호: 5-38), 및 WO 2015/191508 (참고, 예를 들어, '508의 서열번호: 80-294), 및 미국 출원 공개 번호 20150023924 (참고, 예를 들어, '924의 서열번호: 1, 5-10)에 개시된 AAV 캡시드의 VP1, VP2 및/또는 VP3 서열과 적어도 80% 이상 동일한, 예를 들어, 85%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 등, 즉 최대 100% 동일한 캡시드 단백질을 갖는다.
AAV 기반 바이러스 벡터의 핵산 서열 및 재조합 AAV 및 AAV 캡시드의 제조 방법은 예를 들어 미국 특허 번호 7,282,199; 7,906,111; 8,524,446; 8,999,678; 8,628,966; 8,927,514; 8,734,809; US 9,284,357; 9,409,953; 9,169,299; 9,193,956; 9458517; 및 9,587,282; 미국 특허 출원 공개 번호 2015/0374803; 2015/0126588; 2017/0067908; 2013/0224836; 2016/0215024; 2017/0051257; 국제 특허 출원 번호 PCT/US2015/034799; PCT/EP2015/053335; WO 2003/052051, WO 2005/033321, WO 03/042397, WO 2006/068888, WO 2006/110689, WO2009/104964, W0 2010/127097, 및 WO 2015/191508, 및 미국 출원 공개 번호 20150023924에 교시되어 있다.
추가 구현예에서, rAAV 입자는 유사형 AAV 캡시드를 포함한다. 일부 구현예에서, 유사형 AAV 캡시드는 rAAV2/8 또는 rAAV2/9 유사형 AAV 캡시드이다. 유사형 rAAV 입자의 생성 및 사용 방법은 당업계에 공지되어 있다(예를 들어, 문헌[Duan 등, J. Virol., 75:7662-7671 (2001); Halbert 등, J. Virol., 74:1524-1532 (2000); Zolotukhin 등, Methods 28:158-167 (2002); 및 Auricchio 등, Hum. Molec. Genet. 10:3075-3081, (2001)] 참조).
특정 구현예에서, 단일 가닥 AAV(ssAAV)가 사용될 수 있다. 특정 구현예에서, 자가-상보적 벡터, 예를 들어 scAAV가 사용될 수 있다(예를 들어, 문헌[Wu, 2007, Human Gene Therapy, 18(2):171-82, McCarty 등, 2001, Gene Therapy, Vol 8, Number 16, 페이지 1248-1254; 및 미국 특허 번호 6,596,535; 7,125,717; 및 7,456,683]를 참조하고, 이들 각각은 그 전체가 본 명세서에 참조로 포함됨).
일부 구현예에서, rAAV 입자는 AAV8 또는 AAV9로부터 선택된 AAV 캡시드 혈청형으로부터의 캡시드 단백질을 포함한다. 일부 구현예에서, rAAV 입자는 AAV7, AAV8, AAV9, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu31, AAV.hu32, AAV.hu37, AAV.PHP.B, AAV.PHP.eB, 및 AAV.7m8로 구성되는 군으로부터 선택된 AAV 캡시드 혈청형으로부터의 캡시드 단백질을 포함한다. 일부 구현예에서, rAAV 입자는 AAV8 또는 AAV9 예컨대, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu31, AAV.hu32, 및 AAV.hu37에 대해 높은 서열 상동성을 갖는 캡시드 단백질을 포함한다. 일부 구현예에서, rAAV 입자는 AAV1의 AAV 캡시드 혈청형 또는 그의 유도체, 변형 또는 유사형을 갖는다. 일부 구현예에서, rAAV 입자는 AAV4의 AAV 캡시드 혈청형 또는 그의 유도체, 변형 또는 유사형을 갖는다. 일부 구현예에서, rAAV 입자는 AAV5의 AAV 캡시드 혈청형 또는 그의 유도체, 변형 또는 유사형을 갖는다. 일부 구현예에서, rAAV 입자는 AAV8의 AAV 캡시드 혈청형 또는 그의 유도체, 변형 또는 유사형을 갖는다. 일부 구현예에서, rAAV 입자는 AAV9의 AAV 캡시드 혈청형 또는 그의 유도체, 변형 또는 유사형을 갖는다.
일부 구현예에서, rAAV 입자는 AAV8 또는 AAV9 캡시드 단백질의 유도체, 변형 또는 유사형인 캡시드 단백질을 포함한다. 일부 구현예에서, rAAV 입자는 AAV8 캡시드 단백질의 VP1, VP2 및/또는 VP3 서열에 대해 적어도 80% 이상 동일한, 예를 들어, 85%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 등, 즉 최대 100% 동일한 AAV8 캡시드 단백질을 갖는 캡시드 단백질을 포함한다. 일부 구현예에서, rAAV 입자는 AAV9 캡시드 단백질의 유도체, 변형 또는 유사형인 캡시드 단백질을 포함한다. 일부 구현예에서, rAAV 입자는 AAV8 캡시드 단백질의 VP1, VP2 및/또는 VP3 서열에 대해 적어도 80% 이상 동일한, 예를 들어, 85%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 등, 즉 최대 100% 동일한 AAV9 캡시드 단백질을 갖는 캡시드 단백질을 포함한다.
일부 구현예에서, rAAV 입자는 AAV7, AAV8, AAV9, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu31, AAV.hu32, AAV.hu37, AAV.PHP.B, AAV.PHP.eB, 또는 AAV.7m8 캡시드 단백질의 VP1, VP2 및/또는 VP3 서열 에 대해 적어도 80% 이상 동일성, 예를 들어, 85%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 등, 즉 최대 100% 동일성을 갖는 캡시드 단백질을 포함한다. 일부 구현예에서, rAAV 입자는 rAAV 입자는 AAV8 또는 AAV9 예컨대, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu31, AAV.hu32, 및 AAV.hu37 에 대해 높은 서열 상동성을 갖는 AAV 캡시드 단백질의 VP1, VP2 및/또는 VP3 서열과 적어도 80% 이상 동일성, 예를 들어, 85%, 85%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 등, 즉 최대 100% 동일성을 갖는 캡시드 단백질을 포함한다.
추가 구현예에서, rAAV 입자는 모자이크 캡시드를 포함한다. 모자이크 AAV 입자는 상이한 AAV 혈청형으로부터의 바이러스 캡시드 단백질 혼합물로 구성된다. 일부 구현예에서, rAAV 입자는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV.PHP.B, AAV.PHP.eB, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 및 AAV.HSC16으로부터 선택된 혈청형의 캡시드 단백질을 함유하는 모자이크 캡시드를 포함한다.
일부 구현예에서, rAAV 입자는 AAV1, AAV2, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAVrh.8, 및 AAVrh.10으로부터 선택된 혈청형의 캡시드 단백질을 함유하는 모자이크 캡시드를 포함한다.
추가 구현예에서, rAAV 입자는 유사형 rAAV 입자를 포함한다. 일부 구현예에서, 유사형 rAAV 입자는 (a) AAV ITR을 포함하는 핵산 벡터 및 (b) AAVx로부터 유래된 캡시드 단백질로 구성된 캡시드 (예를 들어, AAV1, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16)을 포함한다. 추가 구현예에서, rAAV 입자는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu31, AAV.hu32, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV.PHP.B, AAV.PHP.eB, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 및 AAV.HSC16으로부터 선택된 AAV 혈청형의 캡시드 단백질로 구성된 유사형 rAAV 입자를 포함한다. 추가 구현예에서, rAAV 입자는 AAV8 캡시드 단백질을 함유하는 유사형 rAAV 입자를 포함한다. 추가 구현예에서, rAAV 입자는 AAV9 캡시드 단백질로 구성된 유사형 rAAV 입자를 포함한다. 일부 구현예에서, 유사형 rAAV8 또는 rAAV9 입자는 rAAV2/8 또는 rAAV2/9 유사형 입자이다. 유사형 rAAV 입자의 생성 및 사용 방법은 당업계에 공지되어 있다(예를 들어, 문헌[Duan 등, J. Virol., 75:7662-7671 (2001); Halbert 등, J. Virol., 74:1524-1532 (2000); Zolotukhin 등, Methods 28:158-167 (2002); 및 Auricchio 등, Hum. Molec. Genet. 10:3075-3081, (2001)] 참조).
추가 구현예에서, rAAV 입자는 2개 이상의 AAV 캡시드 혈청형의 캡시드 단백질 키메라를 함유하는 캡시드를 포함한다. 추가 구현예에서, 캡시드 단백질은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV.PHP.B, AAV.PHP.eB, AAV2.5, AAV2tYF, AAV3B, rAAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 및 AAV.HSC16으로부터 선택된 AAV 혈청형으로부터의 2개 이상의 AAV 캡시드 단백질의 키메라이다. 추가 구현예에서, 캡시드 단백질은 AAV1, AAV2, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAVrh.8, 및 AAVrh.10으로부터 선택된 AAV 혈청형으로부터의 2개 이상의 AAV 캡시드 단백질의 키메라이다.
일부 구현예에서, rAAV 입자는 AAV8 캡시드 단백질 및 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV.PHP.B, AAV.PHP.eB, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 및 AAV.HSC16으로부터 선택된 AAV 혈청형으로부터의 하나 이상의 AAV 캡시드 단백질의 AAV 캡시드 단백질 키메라를 포함한다. 일부 구현예에서, rAAV 입자는 AAV8 캡시드 단백질 및 AAV1, AAV2, AAV5, AAV6, AAV7, AAV9, AAV10, AAVrh.8, 및 AAVrh.10로부터 선택된 AAV 혈청형으로부터의 하나 이상의 AAV 캡시드 단백질의 AAV 캡시드 단백질 키메라를 포함한다.
일부 구현예에서, rAAV 입자는 AAV9 캡시드 단백질 및 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV.PHP.B, AAV.PHP.eB, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 및 AAV.HSC16으로부터 선택된 하나 이상의 AAV 캡시드 혈청형의 캡시드 단백질의 AAV 캡시드 단백질 키메라를 포함한다.
일부 구현예에서, rAAV 입자는 AAV9 캡시드 단백질 및 AAV1, AAV2, AAV3, AAV4, AAV5, AA6, AAV7, AAV8, AAV9, AAVrh.8, 및 AAVrh.10로부터 선택된 하나 이상의 AAV 캡시드 혈청형의 캡시드 단백질의 AAV 캡시드 단백질 키메라를 포함한다.
일부 구현예에서, rAAV 입자는 분기군 A, B, E, 또는 F AAV 캡시드 단백질을 포함한다. 일부 구현예에서, rAAV 입자는 분기군 F AAV 캡시드 단백질을 포함한다. 일부 구현예에서 rAAV 입자는 분기군 E AAV 캡시드 단백질을 포함한다.
하기 표 9는 AAV8, AAV9, AAV.rh74, AAV.hu31, AAV.hu32, 및 AAV.hu37 캡시드 단백질에 대한 아미노산 서열 및 AAV2 5'- 및 3' ITR의 핵산 서열의 예를 제공한다.
Figure pct00031
Figure pct00032
Figure pct00033
Figure pct00034
제공된 방법은 이식유전자를 인코딩하는 재조합 AAV의 생산에 사용하기에 적합하다. 특정 구현예에서, 이식유전자는 본원에 기재된 바와 같은 마이크로디스트로핀이다. 일부 구현예에서, rAAV 게놈은 하기 구성요소를 포함하는 벡터를 포함한다: (1) 발현 카세트에 플랭킹하는 AAV 역위 말단 반복부; (2) 조절 제어 요소, 예를 들어 a) 프로모터/인핸서, b) 폴리 A 신호, 및 c) 선택적으로 인트론; 및 (3) 기재된 이식유전자를 인코딩하는 핵산 서열. 특정 구현예에서, 본원에 기재된 작제물은 하기 구성요소를 포함한다: (1) 발현 카세트에 플랭킹하는 AAV2 또는 AAV8 역위 말단 반복부(ITR); (2) 근육 특이적 SPc5.12 프로모터 및 작은 폴리 A 신호를 포함하는 제어 요소; 및 (3) 본원에 기재된 바와 같은 마이크로디스트로핀을 인코딩하는 핵산을 제공하는 (예를 들어, 인코딩하는) 이식유전자. 특정 구현예에서, 본원에 기재된 작제물은 하기 구성요소를 포함한다: (1) 발현 카세트에 플랭킹하는 AAV2 또는 AAV8 ITR; (2) a) 근육 특이적 SPc5.12 프로모터, b) 작은 폴리 A 신호를 포함하는 제어 요소; 및 (3) N-말단에서 C-말단까지를 포함하는 마이크로디스트로핀 카세트, ABD1-H1-R1-R2-R3-H3-R24-H4-CR, ABD1-H1-R1-R2-R3-H3-R24-H4-CR-CT, ABD-H1-R1-R2-R16-R17-R24-H4-CR, 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT. 특정 구현예에서, 본원에 기재된 작제물은 하기 구성요소를 포함한다: (1) 발현 카세트의 양태에 있는 AAV2 또는 AAV8 ITR; (2) a) CNS 프로모터, b) 작은 폴리 A 신호를 포함하는 제어 요소; 및 (3) N-말단에서 C-말단까지를 포함하는 마이크로디스트로핀 카세트, ABD1-H1-R1-R2-R3-H3-R24-H4-CR, ABD1-H1-R1-R2-R3-H3- R24-H4-CR-CT, ABD-H1-R1-R2-R16-R17-R24-H4-CR 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT. 특정 구현예에서, 본원에 기재된 작제물은 하기 구성요소를 포함한다: (1) 발현 카세트에 플랭킹하는 AAV2 또는 AAV8 ITR; (2) a) 근육 특이적 SPc5.12 프로모터, b) 인트론(예를 들어, VH4) 및 c) 작은 폴리 A 신호를 포함하는 제어 요소; 및 (3) N-말단에서 C-말단까지를 포함하는 마이크로디스트로핀 카세트, ABD1-H1-R1-R2-R3-H3-R24-H4-CR, ABD1-H1-R1-R2-R3-H3-R24-H4-CR-CT, ABD-H1-R1-R2-R16-R17-R24-H4-CR, 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT, ABD1은 VH4에 직접 커플링됨. 특정 구현예에서, 본원에 기재된 작제물은 하기 구성요소를 포함한다: (1) 발현 카세트에 플랭킹하는 AAV2 또는 AAV8 ITR; (2) a) CNS 프로모터, b) 인트론(예를 들어, VH4) 및 c) 작은 폴리 A 신호를 포함하는 제어 요소; 및 (3) N-말단에서 C-말단까지를 포함하는 마이크로디스트로핀 카세트, ABD1-H1-R1-R2-R3-H3-R24-H4-CR, ABD1-H1-R1-R2-R3-H3-R24-H4-CR-CT, ABD-H1-R1-R2-R16-R17-R24-H4-CR, 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT, ABD1은 VH4에 직접 커플링됨. 특정 구현예에서, 본원에 기재된 작제물은 하기 구성요소를 포함한다: (1) 발현 카세트에 플랭킹하는 AAV2 또는 AAV8 ITR; (2) a) 근육 특이적 이식유전자 발현을 위한 최소 SPc 프로모터, b) 선택적으로, 인간 면역글로불린 중쇄 가변 영역 인트론(예를 들어, VH4) 및 c) 작은 poly A 신호를 포함하는 제어 요소; 및 (3) N-말단에서 C-말단까지를 포함하는 마이크로디스트로핀 카세트, ABD1-H1-R1-R2-R3-H3-R24-H4-CR, ABD1-H1-R1-R2-R3-H3-R24-H4-CR-CT, ABD-H1-R1-R2-R16-R17-R24-H4-CR, 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT. 특정 구현예에서, 본원에 기재된 작제물은 하기 구성요소를 포함한다: (1) 발현 카세트에 플랭킹하는 AAV2 또는 AAV8 ITR; (2) a) 근육 특이적 SPc5.12 프로모터 또는 CNS 프로모터, b) 인트론(예를 들어, VH4) 및 c) 작은 poly A 신호를 포함하는 제어 요소; 및 (3) N-말단에서 C-말단까지를 포함하는 마이크로디스트로핀 카세트, ABD1-H1-R1-R2-R3-H2-R24-H4-CR, ABD1-H1-R1-R2-R3-H2-R24-H4-CR-CT, ABD-H1-R1-R2-R16-R17-R24-H4-CR, 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT, ABD1은 VH4에 직접 커플링됨. 일부 구현예에서, N-말단으로부터 C-말단까지 ABD1-H1-R1-R2-R3-H2-R24-H4-CR, ABD1-H1-R1-R2-R3-H2-R24-H4-CR-CT, ABD-H1-R1-R2-R16-R17-R24-H4-CR, 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT를 포함하는 마이크로디스트로핀 발현 카세트에 플랭킹하는 AAV ITR를 포함하는 본원의 작제물은 그 길이가 4000 nt 내지 5000 nt일 수 있다. 일부 구현예에서, 이러한 작제물은 그 길이가 4900 nt, 4800 nt, 4700 nt, 4600 nt, 4500 nt, 4400 nt 또는 4300 nt 미만이다.
본 개시내용의 일부 핵산 구현예는 하기 표 10에 제공된 서열번호: 53, 54, 55, 56, 또는 82의 뉴클레오티드 서열을 포함하거나 이로 구성된 마이크로디스트로핀을 인코딩하는 rAAV 벡터를 포함한다. 다양한 구현예에서, 서열번호: 53, 54, 55, 56, 82의 뉴클레오티드 서열 또는 그의 역보체에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 rAAV 벡터는 근육 세포에서 치료적으로 유효한 마이크로디스트로핀의 발현에 적합한 rAAV 벡터를 인코딩한다.
Figure pct00035
Figure pct00036
Figure pct00037
Figure pct00038
Figure pct00039
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
Figure pct00045
Figure pct00046
Figure pct00047
Figure pct00048
Figure pct00049
Figure pct00050
Figure pct00051
5.3.5 rAAV 입자의 제조 방법
본 발명의 또 다른 양태는 본원에 개시된 분자를 제조하는 것을 포함한다. 일부 구현예에서, 본 발명에 따른 분자는 본원의 임의의 캡시드 단백질 분자를 인코딩하는 핵산 서열을 포함하는 뉴클레오티드를 제공하고; 그리고 패키징 세포 시스템을 사용하여 캡시드 단백질로 구성된 캡시드 코트를 갖는 상응하는 rAAV 입자를 제조함으로써 만들어진다. 이러한 캡시드 단백질은 위의 섹션 5.3.4에 설명되어 있다. 일부 구현예에서, 핵산 서열은 본원에 기재된 캡시드 단백질 분자의 서열에 대해 적어도 60%, 70%, 80%, 85%, 90%, 또는 95%, 바람직하게는 96%, 97%, 98%, 99% 또는 99.9%, 동일성을 갖는 서열을 인코딩하고 이종성 단백질 또는 이의 도메인으로부터 캡시드 단백질 및 삽입된 펩티드의 생물학적 기능을 유지한다(또는 실질적으로 유지한다). 일부 구현예에서, 핵산은 AAV8 캡시드 단백질 및 삽입된 펩티드의 생물학적 기능을 유지하면서 (또는 실질적으로 유지하면서) AAV8 캡시드 단백질의 서열에 대해 적어도 60%, 70%, 80%, 85%, 90%, 또는 95%, 바람직하게는 96%, 97%, 98%, 99% 또는 99.9%, 동일성을 갖는 서열을 인코딩한다.
캡시드 단백질, 코트 및 rAAV 입자는 당업계에 공지된 기술에 의해 생성될 수 있다. 일부 구현예에서, 바이러스 게놈은 벡터 내로 패키징을 허용하기 위해 적어도 하나의 역위 말단 반복부를 포함한다. 일부 구현예에서, 바이러스 게놈은 cap 유전자의 발현 및 스플라이싱을 위한 cap 유전자 및/또는 rep 유전자를 추가로 포함한다. 구현에서 cap 및 rep 유전자는 패키징 세포에 의해 제공되며 바이러스 게놈에는 존재하지 않는다.
일부 구현예에서, 조작된 캡시드 단백질을 인코딩하는 핵산은 기존 캡시드 유전자 대신에 AAV Rep-Cap 플라스미드 내로 클로닝된다. 숙주 세포에 함께 도입되면, 이 플라스미드는 rAAV 게놈을 캡시드 코트로서 조작된 캡시드 단백질에 패키징하는 데 도움이 된다. 패키징 세포는 AAV 게놈 복제, 캡시드 조립 및 패키징을 촉진하는 데 필요한 유전자를 보유하는 임의의 세포 유형일 수 있다.
rAAV 입자의 생산을 위한 다수의 세포 배양 기반 시스템이 당업계에 알려져 있으며, 이들 중 임의의 것이 본원에 개시된 방법을 실행하는 데 사용될 수 있다. 세포 배양 기반 시스템은 형질감염, 안정한 세포주 생산, 및 아데노바이러스-AAV 하이브리드, 헤르페스바이러스-AAV 하이브리드 및 배큘로바이러스-AAV 하이브리드를 포함하지만 이에 제한되지 않는 감염성 하이브리드 바이러스 생산 시스템을 포함한다. rAAV 바이러스 입자의 생산을 위한 rAAV 생산 배양물은 다음을 필요로 한다: (1) 예를 들어, 인간 유래 세포주, 포유동물 세포주, 또는 곤충 유래 세포주를 포함하는 적합한 숙주 세포; (2) 야생형 또는 돌연변이체 아데노바이러스 (예컨대 온도-민감한 아데노바이러스), 헤르페스 바이러스, 배큘로바이러스, 또는 헬퍼 기능을 제공하는 플라스미드 작제물에 의해 제공된 적합한 헬퍼 바이러스 기능; (3) AAV rep 및 cap 유전자 및 유전자 산물; (4) AAV ITR 서열 및 선택적으로 제어 요소에 의해 플랭킹된 이식유전자 (예컨대 치료적 이식유전자); 및 (5) 세포 성장/생존 및 rAAV 생산을 지원하기 위한 적합한 배지 및 배지 구성요소 (영양소).
숙주 세포의 비제한적인 예는 다음을 포함한다: A549, WEHI, 10T1/2, BHK, MDCK, COS1, COS7, BSC 1, BSC 40, BMT 10, VERO, W138, HeLa, HEK293 및 그것의 유도체 (HEK293T 세포, HEK293F 세포), Saos, C2C12, L, HT1080, HepG2, 일차 섬유아세포, 간세포, 근아세포, CHO 세포 또는 CHO 유래 세포, 또는 곤충 유래 세포주 예컨대 SF-9 (예를 들어, 배큘로바이러스 생산 시스템의 경우). 검토를 위해, 제조 기술에 대한 전체 내용이 본 명세서에 참고로 포함된 문헌[Aponte-Ubillus 등, 2018, Appl. Microbiol. Biotechnol. 102:1045-1054]을 참조한다.
한 양태에서, 하기를 포함하는 rAAV 입자를 생산하는 방법이 본원에 제공된다: (a) 곤충 세포를 포함하는 세포 배양물을 제공하는 단계; (b) 다음 중 적어도 하나를 인코딩하는 하나 이상의 배큘로바이러스 벡터를 세포 내로 도입하는 단계: i. 패키징될 rAAV 게놈, ii. 패키징에 충분한 AAV rep 단백질, 및 iii. 패키징에 충분한 AAV cap 단백질; (c) 충분한 영양소를 세포 배양물에 첨가하고 rAAV 입자의 생산을 허용하는 조건 하에 세포 배양물을 유지하는 단계. 일부 구현예에서, 방법은 rep 및 cap 유전자를 인코딩하는 제1 배큘로바이러스 벡터 및 rAAV 게놈을 인코딩하는 제2 배큘로바이러스 벡터를 사용하는 것을 포함한다. 일부 구현예에서, 방법은 rAAV 게놈을 인코딩하는 배큘로바이러스 및 rep 및 cap 유전자를 발현하는 곤충 세포를 사용하는 것을 포함한다. 일부 구현예에서, 방법은 rep 및 cap 유전자 및 rAAV 게놈을 인코딩하는 배큘로바이러스 벡터를 사용하는 것을 포함한다. 일부 구현예에서, 곤충 세포는 Sf-9 세포이다. 일부 구현예에서, 곤충 세포는 rep 및 cap 유전자를 인코딩하는 하나 이상의 안정적으로 통합된 이종성 폴리뉴클레오티드를 포함하는 Sf-9 세포이다.
일부 구현예에서, 본원에 개시된 방법은 배큘로바이러스 생산 시스템을 사용한다. 일부 구현예에서 배큘로바이러스 생산 시스템은 rep 및 cap 유전자를 인코딩하는 제1 배큘로바이러스 및 rAAV 게놈을 인코딩하는 제2 배큘로바이러스를 사용한다. 일부 구현예에서, 배큘로바이러스 생산 시스템은 rAAV 게놈을 인코딩하는 배큘로바이러스 및 rep 및 cap 유전자를 발현하는 숙주 세포를 사용한다. 일부 구현예에서, 배큘로바이러스 생산 시스템은 rep 및 cap 유전자 및 rAAV 게놈을 인코딩하는 배큘로바이러스를 사용한다. 일부 구현예에서, 배큘로바이러스 생산 시스템은 Sf-9 세포와 같은 곤충 세포를 사용한다.
당업자는 AAV rep 및 cap 유전자, AAV 헬퍼 유전자(예를 들어, 아데노바이러스 E1a 유전자, E1b 유전자, E4 유전자, E2a 유전자 및 VA 유전자), 및 rAAV 게놈(역위 말단 반복부 (ITR)가 플랭킹된 하나 이상의 관심 유전자를 포함함)가 세포 내로 도입되어 rAAV를 생성하거나 패키징할 수 있는 다수의 방법을 알고 있다. "아데노바이러스 헬퍼 기능"이라는 문구는 AAV가 세포에서 효율적으로 성장하도록 세포(RNA 또는 단백질로서)에서 발현되는 다수의 바이러스 헬퍼 유전자를 지칭한다. 당업자는 아데노바이러스 및 단순 포진 바이러스(HSV)를 포함하는 헬퍼 바이러스가 AAV 복제를 촉진하고 필수 기능을 제공하는 특정 유전자가 확인되었고, 필수 기능을 제공하는 특정 유전자가 확인되었으며, 예를 들어 헬퍼는 이러한 AAV 유전자 발현 및 복제를 촉진하는 세포 환경에 대한 변화를 유도할 수 있음을 이해한다. 본원에 개시된 방법의 일부 구현예에서, AAV rep 및 cap 유전자, 헬퍼 유전자, 및 rAAV 게놈은 AAV rep 및 cap 유전자, 헬퍼 유전자, 및 rAAV 게놈을 인코딩하는 하나 이상의 플라스미드 벡터의 형질감염에 의해 세포 내로 도입된다. 본원에 개시된 방법의 일부 구현예에서, AAV rep 및 cap 유전자, 헬퍼 유전자, 및 rAAV 게놈은 바이러스 벡터, 예를 들어 AAV rep 및 cap 유전자, 헬퍼 유전자, 및 rAAV 게놈을 인코딩하는 rHSV 벡터를 사용한 형질도입에 의해 세포 내로 도입될 수 있다. 본원에 개시된 방법의 일부 구현예에서, AAV rep 및 cap 유전자, 헬퍼 유전자, 및 rAAV 게놈 중 하나 이상이 rHSV 벡터를 사용한 형질도입에 의해 세포 내로 도입된다. 일부 구현예에서, rHSV 벡터는 AAV rep 및 cap 유전자를 인코딩한다. 일부 구현예에서, rHSV 벡터는 헬퍼 유전자를 인코딩한다. 일부 구현예에서, rHSV 벡터는 rAAV 게놈을 인코딩한다. 일부 구현예에서, rHSV 벡터는 AAV rep 및 cap 유전자를 인코딩한다. 일부 구현예에서, rHSV 벡터는 헬퍼 유전자 및 rAAV 게놈을 인코딩한다. 일부 구현예에서, rHSV 벡터는 헬퍼 유전자 및 AAV rep 및 cap 유전자를 인코딩한다.
한 양태에서, 하기를 포함하는 rAAV 입자를 생산하는 방법이 본원에 제공된다: (a) 숙주 세포를 포함하는 세포 배양물을 제공하는 단계; (b) 다음 중 적어도 하나를 인코딩하는 하나 이상의 rHSV 벡터를 세포 내로 도입하는 단계: i. 패키징될 rAAV 게놈, ii. rAAV 입자를 패키징하는 데 필요한 헬퍼 기능, iii. 패키징에 충분한 AAV rep 단백질, 및 iv. 패키징에 충분한 AAV cap 단백질; (c) 충분한 영양소를 세포 배양물에 첨가하고 rAAV 입자의 생산을 허용하는 조건 하에 세포 배양물을 유지하는 단계. 일부 구현예에서, rHSV 벡터는 AAV rep 및 cap 유전자를 인코딩한다. 일부 구현예에서, rHSV 벡터는 헬퍼 기능을 인코딩한다. 일부 구현예에서, rHSV 벡터는 헬퍼 기능을 인코딩하는 하나 이상의 내인성 유전자를 포함한다. 일부 구현예에서, rHSV 벡터는 헬퍼 기능을 인코딩하는 하나 이상의 이종성 유전자를 포함한다. 일부 구현예에서, rHSV 벡터는 rAAV 게놈을 인코딩한다. 일부 구현예에서, rHSV 벡터는 AAV rep 및 cap 유전자를 인코딩한다. 일부 구현예에서, rHSV 벡터는 헬퍼 기능 및 rAAV 게놈을 인코딩한다. 일부 구현예에서, rHSV 벡터는 헬퍼 기능 및 AAV rep 및 cap 유전자를 인코딩한다. 일부 구현예에서, 세포는 rep 및 cap 유전자를 인코딩하는 하나 이상의 안정적으로 통합된 이종 폴리뉴클레오티드를 포함한다.
한 양태에서, 하기를 포함하는 rAAV 입자를 생산하는 방법이 본원에 제공된다: (a) 포유동물 세포를 포함하는 세포 배양물을 제공하는 단계; (b) 다음 중 적어도 하나를 인코딩하는 하나 이상의 폴리뉴클레오티드를 세포 내로 도입하는 단계: i. 패키징될 rAAV 게놈, ii. rAAV 입자를 패키징하는 데 필요한 헬퍼 기능, iii. 패키징에 충분한 AAV rep 단백질, 및 iv. 패키징에 충분한 AAV cap 단백질; (c) 충분한 영양소를 세포 배양물에 첨가하고 rAAV 입자의 생산을 허용하는 조건 하에 세포 배양물을 유지하는 단계. 일부 구현예에서, 헬퍼 기능은 아데노바이러스 유전자에 의해 인코딩된다. 일부 구현예에서, 표유동물 세포는 rep 및 cap 유전자를 인코딩하는 하나 이상의 안정적으로 통합된 이종 폴리뉴클레오티드를 포함한다.
AAV rep 및 cap 유전자, 헬퍼 유전자, 및/또는 rAAV 게놈을 인코딩하는 플라스미드 또는 바이러스 벡터를 개발하기 위한 분자 생물학 기술은 당업계에 일반적으로 알려져 있다. 일부 구현예에서, AAV rep 및 cap 유전자는 하나의 플라스미드 벡터에 의해 인코딩된다. 일부 구현예에서, AAV 헬퍼 유전자(예를 들어, 아데노바이러스 E1a 유전자, E1b 유전자, E4 유전자, E2a 유전자, 및 VA 유전자)는 하나의 플라스미드 벡터에 의해 인코딩된다. 일부 구현예에서, E1a 유전자 또는 E1b 유전자는 숙주 세포에 의해 안정적으로 발현되고, 나머지 AAV 헬퍼 유전자는 하나의 바이러스 벡터에 의한 형질감염에 의해 세포 내로 도입된다. 일부 구현예에서, E1a 유전자 및 E1b 유전자는 숙주 세포에 의해 안정적으로 발현되고, E4 유전자, E2a 유전자 및 VA 유전자는 하나의 플라스미드 벡터에 의한 형질감염에 의해 세포 내로 도입된다. 일부 구현예에서, 하나 이상의 헬퍼 유전자는 숙주 세포에 의해 안정적으로 발현되고, 하나 이상의 헬퍼 유전자는 하나의 플라스미드 벡터에 의한 형질감염에 의해 세포 내로 도입된다. 일부 구현예에서, 헬퍼 유전자는 숙주 세포에 의해 안정적으로 발현된다. 일부 구현예에서, AAV rep 및 cap 유전자는 하나의 바이러스 벡터에 의해 인코딩된다. 일부 구현예에서, AAV 헬퍼 유전자(예를 들어, 아데노바이러스 E1a 유전자, E1b 유전자, E4 유전자, E2a 유전자, 및 VA 유전자)는 하나의 바이러스 벡터에 의해 인코딩된다. 일부 구현예에서, E1a 유전자 또는 E1b 유전자는 숙주 세포에 의해 안정적으로 발현되고, 나머지 AAV 헬퍼 유전자는 하나의 바이러스 벡터에 의한 형질감염에 의해 세포 내로 도입된다. 일부 구현예에서, E1a 유전자 및 E1b 유전자는 숙주 세포에 의해 안정적으로 발현되고, E4 유전자, E2a 유전자 및 VA 유전자는 하나의 바이러스 벡터에 의한 형질감염에 의해 세포 내로 도입된다. 일부 구현예에서, 하나 이상의 헬퍼 유전자는 숙주 세포에 의해 안정적으로 발현되고, 하나 이상의 헬퍼 유전자는 하나의 바이러스 벡터에 의한 형질감염에 의해 세포 내로 도입된다. 일부 구현예에서, AAV rep 및 cap 유전자, 패키징에 필요한 아데노바이러스 헬퍼 기능, 및 패키징될 rAAV 게놈은 하나 이상의 폴리뉴클레오타이드, 예를 들어, 벡터로의 형질감염에 의해 세포에 도입된다. 일부 구현예에서, 본원에 개시된 방법은 3개의 폴리뉴클레오티드의 혼합물로 세포를 형질감염시키는 것을 포함한다: cap 및 rep 유전자를 인코딩하는 것, 하나는 패키징에 필요한 아데노바이러스 헬퍼 기능을 인코딩하는 것 (예를 들어, 아데노바이러스 E1a 유전자, E1b 유전자, E4 유전자, E2a 유전자 및 VA 유전자), 및 패키징될 rAAV 게놈을 인코딩하는 것. 일부 구현예에서, AAV cap 유전자는 AAV8 또는 AAV9 cap 유전자이다. 일부 구현예에서, AAV cap 유전자는 AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.PHB, 또는 AAV.7m8 cap 유전자이다. 일부 구현예에서, AAV cap 유전자는 AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, 및 AAV.hu37과 같은 AAV8 또는 AAV9에 대해 높은 서열 상동성을 갖는 캡시드 단백질을 인코딩한다. 일부 구현예에서, 패키징될 rAAV 게놈을 인코딩하는 벡터는 AAV ITR이 플랭킹된 관심 유전자를 포함한다. 일부 구현예에서, AAV ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15, AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 또는 AAV.HSC16 또는 다른 AAV 혈청형으로부터의 것이다.
벡터의 임의의 조합을 사용하여 AAV rep 및 cap 유전자, AAV 헬퍼 유전자, 및 rAAV 게놈을 rAAV 입자가 생성되거나 패키징될 세포에 도입할 수 있다. 본원에 개시된 방법의 일부 구현예에서, AAV 역위 말단 반복부(ITR)가 플랭킹된 관심 유전자를 포함하는 rAAV 게놈을 인코딩하는 제1 플라스미드 벡터, AAV rep 및 cap 유전자를 인코딩하는 제2 벡터, 및 헬퍼 유전자를 인코딩하는 제3 벡터가 사용될 수 있다. 일부 구현예에서, 3개의 벡터의 혼합물은 세포 내로 공동-형질감염된다. 일부 구현예에서, 형질감염 및 감염의 조합은 플라스미드 벡터 및 바이러스 벡터 둘 다를 사용함으로써 사용된다.
일부 구현예에서, repcap 유전자, 및 AAV 헬퍼 유전자 중 하나 이상은 세포에 의해 구성적으로 발현되고 세포 내로 형질감염되거나 형질도입될 필요가 없다. 일부 구현예에서, 세포는 rep 및/또는 cap 유전자를 구성적으로 발현한다. 일부 구현예에서, 세포는 하나 이상의 AAV 헬퍼 유전자를 구성적으로 발현한다. 일부 구현예에서, 세포는 E1a를 구성적으로 발현한다. 일부 구현예에서, 세포는 rAAV 게놈을 인코딩하는 안정한 이식유전자를 포함한다.
일부 구현예에서, AAV rep, cap 및 헬퍼 유전자(예를 들어, Ela 유전자, E1b 유전자, E4 유전자, E2a 유전자, 또는 VA 유전자)는 임의의 AAV 혈청형일 수 있다. 유사하게, AAV ITR은 또한 임의의 AAV 혈청형일 수 있다. 예를 들어, 일부 구현예에서, AAV ITR은 AAV ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 또는 AAV.HSC16 또는 다른 AAV 혈청형 (예를 들어, 하나 초과의 혈청형으로부터의 서열을 보유하는 하이브리드 혈청형)으로부터의 것이다. 일부 구현예에서, AAV cap 유전자는 AAV8 또는 AAV9 cap 유전자로부터의 것이다. 일부 구현예에서, AAV cap 유전자는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV.PHP.B, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, AAV.HSC16, AAV.rh74, AAV.hu31, AAV.hu32, 또는 AAV.hu37 또는 다른 AAV 혈청형 (예를 들어, 하나 초과의 혈청형으로부터의 서열을 보유하는 하이브리드 혈청형)으로부터의 것이다. 일부 구현예에서, rAAV 입자의 생산을 위한 AAV repcap 유전자는 상이한 혈청형으로부터의 것이다. 예를 들어 rep 유전자는 AAV2에서 유래한 반면 cap 유전자는 AAV8으로부터의 것이다. 또 다른 예에서, rep 유전자는 AAV2에서 유래한 반면 cap 유전자는 AAV9로부터의 것이다.
일부 구현예에서, rep 유전자는 AAV ITR은 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, AAV14, AAV15 및 AAV16, AAV.rh8, AAV.rh10, AAV.rh20, AAV.rh39, AAV.Rh74, AAV.RHM4-1, AAV.hu37, AAV.Anc80, AAV.Anc80L65, AAV.7m8, AAV2.5, AAV2tYF, AAV3B, AAV.LK03, AAV.HSC1, AAV.HSC2, AAV.HSC3, AAV.HSC4, AAV.HSC5, AAV.HSC6, AAV.HSC7, AAV.HSC8, AAV.HSC9, AAV.HSC10, AAV.HSC11, AAV.HSC12, AAV.HSC13, AAV.HSC14, AAV.HSC15, 또는 AAV.HSC16 또는 다른 AAV 혈청형 (예를 들어, 하나 초과의 혈청형으로부터의 서열을 보유하는 하이브리드 혈청형)으로부터의 것이다. 다른 구현예에서, repcap 유전자는 동일한 혈청형으로부터의 것이다. 또 다른 구현예에서, repcap 유전자는 동일한 혈청형으로부터의 것이고, rep 유전자는 적어도 하나의 변형된 단백질 도메인 또는 변형된 프로모터 도메인을 포함한다. 특정 구현예에서, 적어도 하나의 변형된 도메인은 캡시드 혈청형과 상이한 혈청형의 뉴클레오티드 서열을 포함한다. rep 유전자 내의 변형된 도메인은 상이한 혈청형 단편으로 구성된 하이브리드 뉴클레오티드 서열일 수 있다.
하이브리드 rep 유전자는 4 kb 초과, 4.1 kb 초과, 4.2 kB 초과, 4.3 kb 초과, 4.4 kB 초과, 4.5 kb 초과, 또는 4.6 kb 초과의 마이크로디스트로핀 이식유전자를 포함하는 바이러스 게놈의 패키징을 포함하는 rAAV 입자의 개선된 패키징 효율을 제공한다. AAV rep 유전자는 바이러스의 복제 및 생산에 필요한 비구조적 단백질을 인코딩하는 핵산 서열로 구성된다. rep 유전자의 전사는 p5 또는 p19 프로모터에서 시작하여 각각 2개의 큰(Rep78 및 Rep68) 및 2개의 작은(Rep52 및 Rep40) 비구조적 Rep 단백질을 생성한다. 또한 Rep78/68 도메인은 ITR 내의 특정 ITR 서열을 인식하는 DNA 결합 도메인을 함유한다. 4가지 Rep 단백질 모두에는 게놈 복제 및/또는 캡시드화에서 기능하는 공통 헬리카제 및 ATPase 도메인이 있다(Maurer AC, 2020, DOI: 10.1089/hum.2020.069). cap 유전자의 전사는 p40 프로모터에서 시작되며, 이 서열은 rep 유전자의 C-말단 내에 있으며, rep 유전자의 다른 요소는 p40 프로모터 활성을 유도할 수 있음을 시사하였다. p40 프로모터 도메인은 전사 인자 결합 요소 EF1A, MLTF, 및 ATF, Fos/Jun 결합 요소 (AP-1), Sp1-유사 요소 (Sp1 및 GGT), 및 TATA 요소를 포함한다(Pereira and Muzyczka, Journal of Virology, June 1997, 71(6):4300-4309). 일부 구현예에서, rep 유전자는 변형된 p40 프로모터를 포함한다. 일부 구현예에서, p40 프로모터는 EF1A 결합 요소, MLTF 결합 요소, ATF 결합 요소, Fos/Jun 결합 요소 (AP-1), Sp1-유사 요소 (Sp1 또는 GGT), 또는 TATA 요소 중 하나 이상에서 변형된다. 다른 구현예에서, rep 유전자는 혈청형 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, rh8, rh10, rh20, rh39, rh.74, RHM4-1, 또는 hu37의 것이고, p40 프로모터 도메인의 부분 또는 요소는 혈청형 2로 변형된다. 또 다른 구현예에서, rep 유전자는 혈청형 8 또는 9의 것이고, p40 프로모터 도메인의 부분 또는 요소는 혈청형 2로 변형된다.
ITR은 A 및 A' 상보적 서열, B 및 B' 상보적 서열, 및 C 및 C' 상보적 서열을 포함하고; D 서열은 ssDNA 게놈과 인접한다. ITR의 상보적 서열은 자체 어닐링에 의해 헤어핀 구조를 형성한다(Berns KI. The Unusual Properties of the AAV Inverted Terminal Repeat. Hum Gene Ther 2020). D 서열은 함께 AAV 복제 기점을 구성하는 Rep 결합 요소 (RBE) 및 말단 분할 부위 (TRS)를 함유한다. ITR은 복제 후 게놈 캡시드화를 위한 패키징 신호로도 필요하다. 일부 구현예에서, ITR 서열 및 cap 유전자는 동일한 혈청형으로부터의 것이고, 단, A 및 A' 상보적 서열, B 및 B' 상보적 서열, C 및 C' 상보적 서열, 또는 D 서열 중 하나 이상은 캡시드와 다른 혈청형의 서열을 함유하도록 변형될 수 있다. 일부 구현예에서, 변형된 ITR 서열은 rep 유전자와 동일한 혈청형으로부터의 것이다. 다른 구현예에서, ITR 서열 및 cap 유전자는 상이한 혈청형으로부터의 것이고, 단, A 및 A' 상보적 서열, B 및 B' 상보적 서열, C 및 C' 상보적 서열, 또는 D 서열로부터 선택된 ITR 서열 중 하나 이상은 캡시드(cap 유전자)와 동일한 혈청형으로부터의 것이고, ITR 서열 중 하나 이상은 rep 유전자와 동일한 혈청형으로부터의 것이다.
일부 구현예에서, rep 및 cap 유전자는 동일한 혈청형으로부터의 것이고, rep 유전자는 변형된 Rep78 도메인, DNA 결합 도메인, 엔도뉴클레아제 도메인, ATPase 도메인, 헬리카제 도메인, p5 프로모터 도메인, Rep68 도메인, p5 프로모터 도메인, Rep52 도메인, p19 프로모터 도메인, Rep40 도메인 또는 p40 프로모터 도메인을 포함한다. 다른 구현예에서, rep 및 cap 유전자는 동일한 혈청형으로부터의 것이고, rep 유전자는 상이한 혈청형으로부터의 적어도 하나의 단백질 도메인 또는 프로모터 도메인을 포함한다. 한 구현예에서, rAAV는 AAV2 ITR 서열, AAV8 cap, 및 하이브리드 AAV2/8 rep가 플랭킹된 이식유전자를 포함한다. 또 다른 구현예에서, AAV2/8 rep는 p40 프로모터 도메인 또는 이의 일부가 혈청형 2 rep로부터의 것을 제외하고 혈청형 8 rep를 포함한다. 다른 구현예에서, AAV2/8 rep는 p40 프로모터 도메인 또는 이의 일부가 혈청형 8 rep로부터의 것을 제외하고 혈청형 2 rep를 포함한다. 일부 구현예에서, 2개 초과의 혈청형을 이용하여 하이브리드 rep/cap 플라스미드를 작제할 수 있다.
세포를 형질감염시키기 위해 당업계에 공지된 임의의 적합한 방법이 사용될 수 있고, 본원에 개시된 방법에 따른 rAAV 입자의 생성이 사용될 수 있다. 일부 구현예에서, 본원에 개시된 방법은 화학물질-기반 형질감염 방법을 사용하여 세포를 형질감염시키는 것을 포함한다. 일부 구현예에서, 화학물질-기반 형질감염 방법은 인산칼슘, 고분지형 유기 화합물 (덴드리머), 양이온성 폴리머 (예를 들어, DEAE 덱스트란 또는 폴리에틸렌이민 (PEI)), 리포펙션을 사용한다. 일부 구현예에서, 화학물질-기반 형질감염 방법은 양이온성 폴리머 (예를 들어, DEAE 덱스트란 또는 폴리에틸렌이민 (PEI))를 사용한다. 일부 구현예에서, 화학물질-기반 형질감염 방법은 폴리에틸렌이민(PEI)을 사용한다. 일부 구현예에서, 화학물질-기반 형질감염 방법은 DEAE 덱스트란을 사용한다. 일부 구현예에서, 화학물질-기반 형질감염 방법은 인산칼슘을 사용한다.
표준 기술은 재조합 DNA, 올리고뉴클레오티드 합성, 및 조직 배양 및 형질전환 (예를 들어, 전기천공, 리포펙션)에 사용될 수 있다. 효소 반응 및 정제 기술은 제조자의 사양에 따라 또는 당업계에서 일반적으로 달성되는 바와 같이 또는 본원에 기재된 바와 같이 수행될 수 있다. 전술한 기술 및 절차는 일반적으로 당업계에 잘 알려진 통상적인 방법에 따라 그리고 본 명세서 전체에 걸쳐 인용되고 논의되는 다양한 일반적이고 보다 구체적인 참고문헌에 기재된 바와 같이 수행될 수 있다. 예를 들어, [Sambrook 등, Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989))]을 참조하고, 이는 임의의 목적을 위해 본원에 참조로 포함된다. 달리 표시되지 않는 한, 본원에 기재된 분석 화학, 합성 유기 화학, 및 의약 및 약제학적 화학과 관련하여 사용되는 명명법은 당업계에 널리 공지되고 일반적으로 사용되는 명명법이다. 표준 기술은 화학적 합성, 화학적 분석, 약제학적 제제, 제형, 및 전달, 및 환자 치료에 사용할 수 있다.
AAV 기반 바이러스 벡터의 핵산 서열 및 재조합 AAV 및 AAV 캡시드의 제조 방법은 예를 들어, 각각이 본 명세서에 참조로 전체적으로 포함되어 있는 미국 7,282,199; 미국 7,790,449; 미국 8,318,480; 미국 8,962,332; 및 PCT/EP2014/076466에 교시되어 있다.
바람직한 구현예에서, rAAV는 하기에 보다 상세히 논의되는 바와 같이 치료 및 예방 적용에 사용될 수 있는 이식유전자 전달 벡터를 제공한다.
5.4. 치료적 유용성
치료적 효능에 대해 본원에 개시된 바와 같은 마이크로디스트로핀을 인코딩하는 재조합 유전자 요법 벡터를 포함하는 작제물을 검정하는 방법이 제공된다. 방법은 본원에 기재된 동물 모델에서의 시험관내 및 생체내 시험 또는 마이크로디스트로핀의 활성 및 효능을 시험하기 위해 당업계에 공지된 임의의 다른 방법을 사용하는 것을 포함한다.
5.4.1 시험관내 검정
5.4.1.1 근육 세포에 대한 시험관내 감염 시스템
본원에 개시된 재조합 벡터, 예를 들어 rAAV 입자의 감염성을 시험하는 방법이 제공된다. 예를 들어, 근육 세포에서 재조합 유전자 요법 벡터의 감염성은 본원의 실시예 2에 기재된 바와 같이 C2C12 근아세포에서 시험될 수 있다. 몇 개의 근육 또는 심장 세포주는 T0034 (인간), L6 (랫트), MM14 (마우스), P19 (마우스), G-7 (마우스), G-8 (마우스), QM7 (메추라기), H9c2(2-1) (랫트), Hs 74.Ht (인간), 및 Hs 171.Ht (인간) 세포주를 이용할 수 있지만, 이들을 포함하지만 이에 제한되지 않는다. 벡터 카피 수는 중합효소 연쇄 반응 기술을 사용하여 평가할 수 있고 마이크로디스트로핀 발현 수준은 세포에서 마이크로디스트로핀 mRNA의 수준을 측정하여 테스트할 수 있다.
5.4.2 동물 모델
본원에 기재된 바와 같은 마이크로디스트로핀을 인코딩하는 이식유전자를 함유하는 바이러스 벡터의 효능은 돌연변이된 디스트로핀을 대체하기 위해 동물 모델에 투여함으로써, 예를 들어 mdx 마우스 및/또는 골든 리트리버 근이영양증(GRMD) 모델을 사용함으로써 테스트되어 이식유전자 발현의 생체분포, 발현 및 치료 효과를 평가할 수 있다. 치료 효과는 예를 들어 마이크로디스트로핀 이식유전자를 투여받은 동물에서 근육 강도의 변화를 평가함으로써 평가될 수 있다. 더 큰 포유동물 뿐만 아니라 비포유류 척추동물 및 무척추동물을 사용하는 동물 모델은 또한 본원에 기재된 벡터의 전임상 치료적 효능을 평가하는데 사용될 수 있다. 따라서, 본원에 개시된 치료적 효능을 평가하는 방법에 따라 효과적인 것으로 입증된 양으로 본원에 개시된 마이크로디스트로핀 인코딩 벡터의 용량을 포함하는 치료적 투여를 위한 조성물 및 방법이 제공된다.
5.4.2.1 뮤린(murine) 모델
유전자 치료 벡터의 효능은 DMD의 뮤린 모델에서 평가될 수 있다. mdx 마우스 모델(Yucel, N., 등, Humanizing the mdx mouse model of DMD: the long and the short of it, Regenerative Medicine volume 3, Article number: 4 (2018))은 엑손 23에서 넌센스 돌연변이를 보유하여, 조기 종결 코돈 및 말단절단된 단백질 (mdx)을 생성한다. Mdx 마우스는 한배 새끼 대조군과 비교하여 피루베이트 키나제 활성의 혈액 수준이 3배 더 높다. 인간 DMD 질환과 마찬가지로, mdx 골격근은 활성 근섬유 괴사, 세포 침윤, 광범위한 근섬유 크기 및 다수의 중심 유핵 재생 근섬유를 나타낸다. 이 표현형은 횡격막에서 강화되어 진행성 퇴행과 근섬유 손실을 일으켜 근육 등축(isometric) 강도가 약 5배 감소한다. 뒷다리 근육의 괴사와 재생은 생후 3-4주령에 최고조에 달하지만 그 이후에는 정체된다. 다른 마우스 배경(예를 들어, DBA/2J)과 교차된 mdx 마우스 및 mdx 마우스에서, 심장 박출률의 경미하지만 상당한 감소가 관찰된다(Van Westering, Molecules 2015, 20, 8823-8855). 심장 기능적 결함이 있는 이러한 DMD 모델 마우스는 심장 보호 효과 또는 심장 기능의 개선 또는 유지 또는 본원에 기재된 유전자 치료 벡터의 심장 기능 장애의 약화를 평가하는 데 사용될 수 있다. 본원의 실시예 3은 마이크로디스트로핀을 인코딩하는 유전자 요법 벡터를 평가하기 위한 mdx 마우스 모델의 사용을 상세히 설명한다.
추가 mdx 마우스 모델: mdx2cv, mdx3cv, mdx4cv, 및 mdx5cv 계통(C57BL/6 유전적 배경)을 포함하여 상이한 유전적 배경의 다수의 대안적인 버전이 생성되었다. 이 모델은 마우스를 화학적 돌연변이원인 N-에틸-N-니트로소우레아로 처리하여 생성되었다. 각 균주는 상이한 점 돌연변이를 보유한다. 전체적으로 mdx 마우스와 비교하여 mdxcv 모델에서 질환 표현형의 제시에는 약간의 차이가 있다. mdx 라인을 다양한 녹아웃 마우스 모델(예를 들어, Myod1 -/- , α-인테그린7 -/- , α- 디스트로브레빈 -/- 우트로핀 -/- )과 교차하여 추가 마우스 모델이 생성되었다. 현재 DMD 연구에 사용되는 모든 마우스 모델은 문헌[Yucel, N., 등, Humanizing the mdx mouse model of DMD: the long and the short of it, npj Regenerative Medicine volume 3, Article number: 4 (2018)]에 상세히 기재되었고, 이 문헌은 참고로 본원에 포함된다.
5.4.2.2 갯과 (canine)
대부분의 갯과 연구는 골든 리트리버 근이영양증(GRMD) 모델에서 수행된다(문헌[Korneygay, J.N., 등, The golden retriever model of Duchenne muscular dystrophy. Skelet Muscle. 2017; 7: 9], 이는 그 전체가 참고로 본원에 포함된다. GRMD가 있는 개는 골격 및 심장근 표현형과 선택적 근육 관여-DMD의 표현형을 보다 가깝게 반영하는 중증 표현형-를 갖는 진행성 치명적인 질환에 걸리게 된다. GRMD 개는 엑손 스키핑 및 아웃-오프-프레임 DMD 전사체로 이어지는 단일 뉴클레오티드 변화를 가지고 있다. 개의 표현형 특징에는 혈청 CK의 상승, EMG에 대한 CRD, 그룹화된 근육 섬유 괴사 및 재생의 조직병리학적 증거가 포함된다. 표현형 가변성은 인간과 마찬가지로 GRMD에서 자주 관찰된다. GRMD 개는 보행 시 경직, 감소된 관절 운동 범위 및 입벌림장애가 공통적인 특징인 영향을 받은 개의 표현형에서 역할을 하는 것으로 보이는 역설적 근육 비대가 발생한다. 질환 진행을 평가하기 위한 객관적인 바이오마커에는 파상풍 굴곡, 경골근골 관절 각도, 편심 수축 감소율(%), 최대 고관절 굴곡 각도, 골반 각도, 두개골 봉공근 둘레 및 대퇴사두근 무게가 포함된다.
5.5. 치료 방법
기능성 디스트로핀을 제공함으로써 치료될 수 있는 임의의 근이영양증 질환에 대한 인간 대상체를 치료하는 방법이 제공된다. DMD는 이러한 질환 중 가장 흔하지만, 본원에 제공된 마이크로디스트로핀을 발현하는 유전자 요법 벡터는 베커(Becker) 근이영양증(BMD), 근긴장성 근이영양증(슈타이너트병), 안면견갑상완병(FSHD), 사지 이음 근이영양증, X 관련 확장성 심근병증, 또는 안구인두 근이영양증을 치료하기 위해 투여될 수 있다. 본 개시내용의 마이크로디스트로핀은ABD-H1-R1-R2-R3-H3-R24-H4-CR, ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT, ABD-H1-R1-R2-R16-R17-R24-H4-CR, 또는 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT을 포함하는, N-말단에서 C-말단 순서로 도메인을 갖는 본원에 기재된 임의의 마이크로디스트로핀일 수 있고, ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R3은 디스트로핀의 스펙트린 3 영역이고, H3은 디스트로핀의 힌지 3 영역이고, R16은 디스트로핀의 스펙트린 16 영역이고, R17은 디스트로핀의 스펙트린 16 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, CR은 디스트로핀의 시스테인-풍부 영역 및 CT는 α1-신트로핀 결합 부위 및/또는 α-디스트로브레빈 결합 부위을 포함하는 디스트로핀의 C-말단 영역의 적어도 일부이다. 구현예에서, 마이크로디스트로핀은 서열번호: 1, 2, 79, 91, 92, 또는 93의 아미노산 서열을 갖는다. 마이크로디스트로핀을 인코딩하는 벡터는 서열번호: 20, 21, 81, 101, 102 또는 103의 핵산 서열 갖는 것을 포함하고, 특정 구현예에서 구성적, 근육 특이적(골격, 평활근 및 심장근 특이적) 발현, 또는 CNS 특이적 발현, 및 폴리 A 부위와 같은 기타 조절 요소에 작동가능하게 연결된다. 이러한 핵산은 예를 들어, ITR 서열, 특히 AAV2 ITR 서열에 의해 플랭킹된 rAAV 게놈의 맥락에 있을 수 있다. 특정 구현예에서, 방법 및 조성물은 서열번호: 53, 54, 55, 56, 82, 104, 105, 또는 106의 핵산 서열을 갖는 작제물을 포함하는 rAAV를 필요로 하는 대상체에게 투여하는 단계를 포함한다. 구현예에서, 환자는 DMD로 진단되고/되거나 DMD와 관련된 증상(들)을 갖는다. 마이크로디스트로핀을 인코딩하는 이식유전자를 전달하는 데 사용되는 재조합 벡터는 섹션 5.3.4.1에 설명되어 있다. 이러한 벡터는 인간 근육 세포(골격근, 평활근 및/또는 심장근 포함)에 대한 친화성을 가져야 하며, 특히 AAV8 캡시드를 보유하는 비-복제 rAAV를 포함할 수 있다. 도 1a도 22에 도시된 것과 같은 재조합 벡터는 재조합 벡터가 근육 조직 또는 CNS에 들어가도록 하는 임의의 방식으로, 바람직하게는 재조합 벡터를 혈류로 도입함으로써 투여될 수 있다.
이러한 유전자 요법이 투여되는 대상체는 근육에 대한 마이크로디스트로핀의 유전자 요법 매개 전달에 반응하는 대상체일 수 있다. 특정 구현예에서, 방법은 DMD 또는 다른 근이영양증 질환, 예컨대, 베커 근이영양증 (BMD), 근긴장성 근이영양증 (스타이너트병), 얼굴어깨팔 질환 (FSHD), 사지 이음 근이영양증, X 관련 확장성 심근병증, 또는 안구인두 근이영양증으로 진단되거나, 또는 이와 관련된 하나 이상의 증상이 있고, 마이크로디스트로핀 치료에 반응하는 것으로 확인되거나, 마이크로디스트로핀의 유전자 매개 전달을 통한 치료의 좋은 후보로 간주되는 환자를 치료하는 것을 포괄한다. 특정 구현예에서, 환자는 이전에 합성 버전의 디스트로핀으로 치료받았고 하나 이상의 합성 버전의 디스트로핀에 반응성인 것으로 밝혀졌다. 반응성을 결정하기 위해, 합성 버전의 디스트로핀(예를 들어, 인간 세포 배양물, 생물반응기 등에서 생성됨)을 대상체에게 직접 투여할 수 있다.
임의의 그러한 재조합 벡터의 치료 유효량은 재조합 벡터가 근육(예를 들어, 골격근 또는 심장근)에 들어가도록 하는 임의의 방식으로, 바람직하게는 재조합 벡터를 혈류로 도입함으로써 투여되어야 한다. 특정 구현예에서, 벡터는 피하, 근육내 또는 정맥내 투여된다. 근육내, 피하 또는 정맥내 투여는 근육(골격근, 심장근 및/또는 평활근 포함) 및/또는 CNS의 세포에서 가용성 이식유전자 생성물의 발현을 초래해야 한다. 이식유전자 산물의 발현은 근육 및/또는 CNS에서 이식유전자 산물의 전달 및 유지를 초래한다. 대안적으로, 전달은 유전자 치료 전달 및 간에서 마이크로디스트로핀의 발현을 초래할 수 있으며, 가용성 마이크로디스트로핀 생성물은 혈류를 통해 근육으로 전달되어 치료 효과를 부여할 수 있다. 다른 구현예에서, 재조합 벡터는 CNS로, 예를 들어 척추강내, 뇌실내, 비강내 또는 맥락막위(이에 제한되지 않음)로 전달되도록 투여될 수 있다.
특정 대상체에게 투여되는 실제 용량 양은, 비제한적으로, 체중, 병태의 중증도, 질환의 유형, 이전 또는 동시 치료적 개입, 대상체의 특발증, 및/또는 투여 경로와 같은 파라미터를 고려하여 임상의에 의해 결정될 수 있다.
투여량은 kg당 1×108 벡터 게놈(vg/kg) 내지 1×1015 vg/kg의 범위일 수 있다. 치료 유효량은 치료 레지멘의 과정(즉, 수일, 수주, 수개월 등) 동안 단일 또는 다중 용량을 투여함으로써 달성될 수 있다.
정맥내, 근육내, 피하 또는 간 투여에 적합한 약제학적 조성물은 생리학적으로 양립가능한 수성 완충제를 포함하는 제형 완충액 중에 마이크로디스트로핀을 인코딩하는 이식유전자를 포함하는 재조합 벡터의 현탁액을 포함한다. 제형 완충액은 다당류, 계면활성제, 폴리머, 또는 오일 중 하나 이상을 포함할 수 있다.
본원에서 제공되는 유전자 요법 벡터는 코르티코스테로이드, 베타 차단제 및 ACE 억제제를 포함하는 근이영양증에 대한 다른 치료와 조합하여 투여될 수 있다.
5.5.1 근육 퇴행/재생
디스트로핀이 결실되면 기계적 불안정성이 나타나 근섬유가 약해지고 수축 중에 결국 끊어진다. DMD 환자는 초기 소아기에 골격근 쇠약을 처음으로 나타내어 근육량 감소, 척추후만증으로 알려진 척추 만곡, 마비 및 궁극적으로 30세 이전의 심폐 부전으로 사망한다. DMD 환자의 골격근은 또한 특히 종아리의 근육 비대, 국소 괴저성 근섬유의 증거, 근섬유 직경의 비정상적 변화, 지방 침착 및 섬유증 증가, 면역조직학적 섹션의 디스트로핀 염색 결핍을 발생시킨다.
본원에서 제공되는 유전자 요법 치료의 목표는 DMD 또는 기타 근이영양증 질환의 진행을 늦추거나 저지하거나 DMD 또는 기타 근이영양증 질환과 관련된 하나 이상의 증상의 중증도를 감소시키는 것이다. 특히, 본원에 제공된 유전자 요법의 목적은 근육 퇴행을 감소시키고, 근육 재생을 유도/개선하고/하거나 근육 재생을 방해하고 운동의 손실을 야기하는 염증 및 섬유증, 정형외과적 합병증, 및 궁극적으로, 호흡기 및 심부전을 포함하는 하류 병리상태를 예방/감소시키는 것이다.
North Star Ambulatory Assessment, NSAA (규모는 완전-독립 기능을 나타내는 최대 점수로서 34를 갖는 서수임) 또는 연령 적합한 변형된 평가를 사용하여 총 운동 기능에서의 기준선으로부터의 변화를 측정함으로써, 보행 기능에서의 변화 (예를 들어, 6-분 (거리 보행 < 300m, 300 내지 400m, 또는 > 400m))를 평가함으로써, 누운 자세 (1 내지 8초 (양호함), 8 내지 20초 (중간), 및 20 내지 35초 (불량))로부터 세워지도록 취해진 시간에 기준선으로부터 변화를 측정하기 위한 적시 기능 테스트를 수행함으로써, 등산까지의 시간 (4 단계) 및 실행/워크 평가까지의 시간 (10 미터)을 수행함으로써, 뿐만 아니라 상부 및 하부 사지의 강도에서 기준선으로부터의 변동을 평가하기 위한 근계측법 [Mazzone 등, North Star Ambulatory Assessment, 6-minute walk test and timed items in ambulant boys with Duchenne muscular dystrophy, Neuromuscular Disorders 20 (2010) 712-716]을 수행함으로써 효능을 모니터링할 수 있다.
효능은 또한 근육이 손상될 때 비정상적으로 높은 수준에서 발견되는 효소인 혈청 크레아틴 키나제 (CK) 수준 (정상: 35-175 U/L, DMD: 500-20,000 U/L), 혈청 또는 뇨 크레아티닌 수준 (DMD: 10-25 μmol/L, 경미한 BMD: 20-30 μmol/L, 정상 > 53 μmol/L, DMD) 및 근육 생검에서 마이크로디스트로핀 단백질 수준의 기준선으로부터의 변화 (감소)를 측정함으로써 모니터링될 수 있다. 자기 공명 영상(MRI)은 또한 골격근(지방 분획)의 지방 조직 침윤을 평가하기 위해 수행될 수 있다(Burakiewicz, J. 등 "Quantifying fat replacement of muscle by quantitative MRI in muscular dystrophy." Journal of Neurology vol. 264,10 (2017): 2053-2067. doi:10.1007/s00415-017-8547-3).
따라서, 예를 들어, 치료되지 않은 대조군 또는 핵산 조성물로의 치료 전 대상체에 비해 보행 기능을 평가하기 위해 North Start Ambulatory Assessment를 사용하여 측정된 바와 같이 총 운동 기능을 개선하거나 총 운동 기능의 손실을 지연시키는 핵산 조성물 및 상기 조성물을 투여하는 방법이 제공된다. 대안적으로, 본 명세서에 기재된 핵산 조성물 및 핵산 조성물의 투여 방법은 누운 자세, 근육측정, 또는 혈청 크레아티닌 키나제(CK) 수준의 감소 또는 지방 조직 침윤의 감소를 견디는 데 걸리는 시간을 측정하기 위한 적시 기능 테스트에 의해 평가된 바와 같이 총 운동 기능의 개선 또는 총 운동 기능 상실의 감소를 초래한다. 혈청 크레아티닌 키나제 수준은 동종효소 분획인 MM-CPK(골격근), BB-CPK(뇌) 및 MB-CPK(심장)로 더 분리될 수 있다.
또한, 예를 들어, 치료되지 않은 대조군 또는 핵산 조성물로의 치료 전에 대상체에 비해 보행 기능을 평가하기 위해 North Start Ambulatory Assessment를 사용하여 측정된 바와 같이; 또는 누운 자세로부터 방치되는 시간을 측정하기 위한 적시 기능 테스트에 의해 평가된 바와 같이, 또는 혈청 크레아티닌 키나제 수준의 감소에 의한 개선을 입증하기 위해, 전체 운동 기능을 개선하거나 전체 운동 기능의 손실을 늦추는데 효과적인, 본원에 기재된 마이크로디스트로핀을 인코딩하는 핵산 서열을 포함하는, 특히 벡터, 바이러스 벡터 및 AAV 벡터를 함유하는 유전자 카세트를 포함하는 핵산 조성물의 양을 포함하는 조성물이 제공된다.
5.5.2 심박출량
골격근 증상이 DMD의 정의적인 특징으로 간주되지만, 환자는 가장 일반적으로 호흡 또는 심부전으로 사망한다. DMD 환자는 수축 기능에 필요한 심근세포에 디스트로핀이 없기 때문에 확장성 심근병증(DCM)이 발생한다. 이것은 세포외 칼슘의 유입으로 이어져 프로테아제 활성화, 심근세포 사멸, 조직 괴사 및 염증을 유발하여 궁극적으로 지방과 섬유증의 축적으로 이어진다. 이 과정은 먼저 좌심실(LV)에 영향을 미치며, 좌심실은 혈액을 신체 대부분으로 펌핑하는 역할을 하며 더 두꺼우므로 더 많은 작업 부하를 경험한다. 위축성 심근세포는 줄무늬 소실, 공포화, 분열 및 핵 퇴행을 나타낸다. 기능적으로, 위축과 흉터는 LV의 구조적 불안정성과 운동저하를 유발하여 궁극적으로 일반 DCM으로 진행한다. DMD는 동성 빈맥, 일주기 지수 감소, 심박수 변동성 감소, 짧은 PR 간격, 우심실 비대, S-T 분절 우울증 및 QTc 연장과 같은 다양한 ECG 변화와 관련될 수 있다.
본원에서 제공되는 유전자 요법 치료는 특히 심장 기능 장애의 진행을 감소 또는 약화시키고/시키거나 심장 기능을 유지 또는 개선하기 위해 DMD 및 다른 디스트로핀병증의 진행을 늦추거나 저지할 수 있다. 효능은 연속 심전도, 및 연속 비침습성 영상화 연구 (예를 들어, 심장초음파검사 또는 심장 자기 공명 영상 (CMR))를 사용하여 시험 인구의 연령 및 질환 단계에 적절한 심장 침범 또는 심부전의 징후 및 증상을 주기적으로 평가하여 모니터링할 수 있다. CMR은 기준선으로부터 강제 폐활량 (FVC), 강제 호기량 (FEV1), 최대 들숨압 (MIP), 최대 날숨압 (MEP), 최대 호기 유속 (PEF), 최대 기침 유속, 좌심실 박출률 (LVEF), 좌심실 분획 단축률 (LVFS), 염증, 및 섬유증의 변화를 모니터링하기 위해 사용될 수 있다. ECG는 전도 비정상 및 부정맥을 모니터링하는 데 사용할 수 있다. 특히, ECG는 PR 간격의 정상화, V1에서의 R파, V6에서의 Q파, 심실 재분극, 열등 및/또는 상부 측면 벽에서의 QS파, 우측 다발 분지에서의 전도 장애, QT C, 및 QRS를 평가하기 위해 사용될 수 있다.
따라서, 본원에 개시된 마이크로디스트로핀 단백질을 인코딩하는 핵산을 포함하는, 유전자 발현 카세트 및 바이러스 벡터를 포함하는 조성물을 포함하는 핵산 조성물, 및 예를 들어, 연속 심전도, 및 연속 비침습성 영상화 연구 (예를 들어, 심장초음파검사 또는 심장 자기 공명 영상 (CMR))에 의해 측정된 바와 같이, 45% 미만의 LVEF 감소 및/또는 기능의 정상화 (LVFS ≥ 28%)를 방지함으로써, 심장 기능을 개선 또는 유지하거나 심장 기능의 손실을 지연시키는 이들 조성물을 투여하는 방법이 제공된다. 측정값은 치료되지 않은 대조군 또는 핵산 조성물로 치료하기 전의 대상체와 비교할 수 있다. 대안적으로, 본원에 기재된 핵산 조성물 및 핵산 조성물의 투여 방법은 강제 폐활량 (FVC), 강제 호기량 (FEV1), 최대 들숨압 (MIP), 최대 날숨압 (MEP), 최대 호기 유속 (PEF), 최대 기침 유속, 좌심실 박출률 (LVEF), 좌심실 분획 단축률 (LVFS), 염증, 및 섬유증의 변화의 기준선으로부터의 변화를 모니터링함으로써 평가된 바와 같이 심장 기능의 개선 또는 심장 기능의 손실 감소를 초래한다. ECG는 전도 비정상 및 부정맥을 모니터링하는 데 사용할 수 있다. 특히, ECG는 PR 간격의 정상화, V1에서의 R파, V6에서의 Q파, 심실 재분극, 열등 및/또는 상부 측면 벽에서의 QS파, 우측 다발 분지에서의 전도 장애, QT C, 및 QRS를 평가하기 위해 사용될 수 있다.
5.5.3 중추 신경계
DMD 환자의 일부는 또한 간질, 학습 및 인지 장애, 난독증, 신경발달 장애 예컨대 주의력 결핍 과활성 장애 (ADHD), 자폐증, 및/또는 정신과 장애, 예컨대 강박 장애, 불안 또는 수면 장애를 가질 수 있다.
본원에 개시된 유전자 요법 치료의 목표는 인지 기능을 개선하거나 간질 및/또는 정신 장애의 증상을 완화시키는 것일 수 있다. 효능은 시험 인구의 연령 및 질환 단계에 적합한 행동 및 인지 기능의 주기적인 평가 및/또는 발작 사건의 정량화 및 적격성 평가에 의해 평가될 수 있다.
따라서, 인지 기능을 개선하고, 발작의 발생 또는 중증도를 감소시키고, ADHD, 강박 장애, 불안 및/또는 수면 장애의 증상을 완화시키는, 핵산 조성물 및 마이크로디스트로핀 유전자 요법 조성물을 투여하는 방법이 제공된다.
5.5.4 환자의 일차 평가변수
조성물의 복용량을 포함하는 조성물의 효능 및 본원에 기재된 방법은 치료되는 대상체의 임상 평가에서 평가될 수 있다. 환자 일차 평가변수는 강제 폐활량 (FVC), 강제 호기량 (FEV1), 최대 들숨압 (MIP), 최대 날숨압 (MEP), 최대 호기 유속 (PEF), 최대 기침 유속, 좌심실 박출률 (LVEF), 좌심실 분획 단축률 (LVFS)에서의 기준선으로부터의 변화, NSAA에서의 기준선으로부터 변화, 상부 림프의 성능 (PUL) 점수에서의 기준선로부터의 변화, 및 브룩(Brooke) 상부 사지 척도 점수 (Brooke 점수)에서의 기준선로부터의 변화, 그립 강도, 핀치 강도에서의 기준선로부터의 변화, MRI에 의한 심장 섬유증 점수의 변화, MRI에 의해 평가된 상완 (bicep) 근육 지방 및 섬유증에서의 변화, MRI에 의해 평가된 상완 근육 지방 및 섬유증의 변화, 동력계를 사용한 다리 강도의 측정, 보행 시험 6분, 보행 검사 10분, 걷기 분석 - 보행의 3D 기록, 면역염색된 생검 절편의 정량화가능한 영상화를 통한 유트로핀 막 염색의 변화 및 섬유 크기 및 신생아 미오신 양성의 조합을 (근육 생검을 통해) 측정함으로써 재생 섬유의 변화를 모니터링하는 것을 포함할 수 있다. 예를 들어 문헌[Mazzone E 등, North Star Ambulatory Assessment, 6-minute walk test and timed items in ambulant boys with Duchenne muscular dystrophy. Neuromuscular Disorders 20 (2010) 712-716.; Abdelrahim Abdrabou Sadek, 등, Evaluation of cardiac functions in children with Duchenne Muscular Dystrophy: A prospective case-control study. Electron Physician (2017) Nov; 9(11): 5732-5739; Magrath, P. 등, Cardiac MRI biomarkers for Duchenne muscular dystrophy. BIOMARKERS IN MEDICINE (2018) VOL. 12, NO. 11.; Pane, M. 등, Upper limb function in Duchenne muscular dystrophy: 24 month longitudinal data. PLoS One. 2018 Jun 20;13(6):e0199223을 참조한다.
6. 실시예
6.1 실시예 1 - 시스 플라스미드의 삽입을 위한 마이크로디스트로핀(DMD) 유전자 발현 카세트의 작제
유사한 골격 5'-ABD-H1-R1-R2-R3-H3-R24-H4-CR-3'(도 1)을 가진 DMD 작제물. 상기 4개의 작제물은 프로모터 길이에 뚜렷한 차이가 있는데, 하나는 C-말단(RGX-DYS3)이 없고, 하나는 인트론(RGX-DYS1)이 없고, 및 하나는 말단 절단된 근육-특이적 프로모터(RGX-DYS4)를 갖는다. 이들 모두를 ITR가 플랭킹된 시스 플라스미드로 클로닝하였다. DMD 유전자를 인코딩하는 모든 DNA 서열은 코돈 최적화하였고, CpG를 고갈시켰다.
6.1.1. RGX-DYS1 및 RGX-DYS2 이식유전자의 재조합 조작
간단히 말해서, N-말단-ABD1-H1-R1-R2-R3-H3-R24-H4-CR-CT-C-말단을 인코딩하는 도 1a 에 나타낸 바와 같은 RGX-DYS1 및 RGX-DYS2에서 마이크로디스트로핀 작제물의 상기 인간 코돈 최적화된 및 CpG 고갈된 뉴클레오티드 서열을 GeneArt 유전자 합성(Invitrogen, Thermo Fisher, Waltham, MA)을 이용하여 합성하였다. 원하는 C-말단은 하기 2개의 프라이머 5': TGA CTC GAG AGG CCT AAT AAA GAG C(서열번호: 43), 3': CCT TGG AGA CTG TGG AGA GGT G(서열번호: 44)를 사용하여 부위 지정된 돌연변이 유발에 의해 제조하였다. VH4 인트론 서열(하기 섹션 6.1.4 참고)을 가진 RGX-DYS2를 생성하기 위해, 마이크로디스트로핀을 인코딩하는 뉴클레오티드 서열을 함유한 단편을 AAV ITRs, 복제 기점, 및 항생제 내성을 함유한 골격 플라스미드에 응집성으로 결찰(ligate)시켜 RGX-DYS2 플라스미드 구성을 형성하였다. 서열 분석 결과, 인트론의 5' 스플라이싱 부위에서 여분의 사이토신(C)이 드러났고, 따라서, 여분의 C 뉴클레오티드를 부위 지정 돌연변이 유발 방법으로 제거하였고, 수득된 작제물 RGX-DYS2는 VH4 인트론을 함유한다. 이와 유사하게, 부위 지정 돌연변이 유발을 이용하여 VH4 인트론을 제거하였고, 이로써 RGX-DYS1을 수득하였다.
6.1.2. RGX-DYS3 및 RGX-DYS4 이식유전자의 재조합 조작
CT 도메인이 없는 RGX-DYS1 및 RGX-DYS2 작제물의 마이크로디스트로핀을 인코딩하는 작제물 RGX-DYS3(도 1a을 조작하였다. 이와 같은 작제물은 작제물의 5' 말단에 VH4 인트론을 포함한다.
RGX-DYS4(도 1a는 전장 SPc5-12 프로모터가 아닌 최소 SPc5-12 프로모터(서열번호: 40; 섹션 6.1.3)에 연결된 RGX-DYS2에서와 마찬가지로 마이크로디스트로핀 및 VH4 인트론을 인코딩하는 카세트를 함유한다.
6.1.3. RGX-DYS5의 재조합 조작
140개의 아미노산 길이(서열번호: 83의 아미노산 서열을 가진 말단절단된 C-말단 도메인)를 갖는 C-말단 도메인을 갖고 디스트로브레빈 결합 부위가 아닌 α1-신트로핀 결합 부위를 함유하며, DYS5(서열번호: 79의 아미노산 서열)로 명명된 마이크로디스트로핀을 인코딩하는 작제물 RGX-DYS5(도 1a를 조작였다. 상기 플라스미드는 마이크로디스트로핀 DYS5 이식유전자의 인간 코돈 최적화 및 CpG 고갈된 버전, 합성 근육 프로모터(예를 들어, spc5-12), 및 작은 폴리(A) 신호 서열을 인코딩하고, ITRs(서열번호 82의 뉴클레오티드 서열)에 플랭킹된다.
플라스미드 RGX-DYS1 중 DYS1의 길이가 긴 C-말단을 중간 길이의 C-말단 꼬리로 대체함으로써 플라스미드 RGX-DYS5를 생성하였다. 간단히 말해서, 통합된 DNA 기술로 EcoRV 및 NheI 부위가 플랭킹된 중간 길이의 C-말단 및 RGX-DYS1 플라스미드의 중첩 서열 17 bp를 함유한 gBlock-DMD-1.5 꼬리를 합성하였다. 공급원 플라스미드 RGX-DYS1을 제한 효소 NheI 및 EcoRV(New England Biolabs)로 소화시킨 후, gBlock-DMD1.5 꼬리와 융합(in-fusion) 결찰하였다. 상기 최종 플라스미드 RGX-DYS5를 효소 소화 및 후속 시퀀싱에 의해 확인하였다.
단백질의 길이 및 발현을 웨스턴 블롯으로 확인하였다. 이를 위해, 상이한 플라스미드를 근아세포주 C2C12 세포로 형질감염시켰다. 분화 후 4일 차에, 용해 완충액 중의 세포를 수확하였다. 각 플라스미드 샘플에서 세포 용해물 20㎍를 SDS-PAGE 겔 상에 로딩하였다. 디스트로핀(MANEX1011B, Developmental Studies Hybridoma Bank)에 대한 항체(1c7)를 사용하여 마이크로디스트로핀 단백질 띠를 검출하였다. 플라스미드 RGX-DYS5 (DYS5를 발현)에서 생성된 마이크로디스트로핀 단백질 띠는 RGX-DYS1 (DYS1을 발현)보다 상당히 더 짧았고, DYS3보다 더 길었다(도 1b 및 c). 편재성 CB 프로모터로 DYS3 이식유전자를 구동한 반면, DYS1 및 DYS5 이식유전자 발현은 도 1b를 만든 실험에서 근육-특이적 프로모터로 구동하였다. 일관된 전체 단백질 회수의 척도로 α-액틴 단백질 대조군을 사용하였다(도 1c).
RGX-DYS5의 패키징 효율을 조사하기 위해, HEK293 세포를 사용하여 RGX-DYS5를 AAV8 벡터에 패키징하였고, 진탕 플라스크 배양 및 친화성 정제 후, 벡터 RGX-DYS5의 역가를 판단하였다. 평균 역가는 AAV8에 패키징된 RGX-DYS1보다 높았고, 이들 벤치톱 생산 운영에서 AAV8에 패키징된 RGX-DYS3과 필적하였다. (데이터가 도시되지 않음).
6.1.4. VH4 인트론 및 minPc5-12 프로모터
RGX-DYS2, RGX-DYS3 및 RGX-DYS4 중 VH4 인트론는 인간 면역글로불린 중쇄 가변 영역(서열번호: 41; 유전자 은행 수탁 번호 AB019438.1)에서 수득된다. VH4 인트론의 스플라이싱 효율 및 정확도를 C2C12 세포에서 시험관 내로 테스트하였다. 우선, 역-전사 PCR 생성물의 시퀀싱을 수행하여 올바른 스플라이싱 사건이 발생했는지 여부를 테스트하였다. RGX-DYS2 플라스미드를 C2C12 근아세포에 형질감염시키고, 3일 동안 분화 배지에서 세포를 배양하였다. 이어서, 세포에 RNA 추출, cDNA 합성 및 PCR를 시행하였다. PCR를 위해 사용된 프라이머는 프라이머 1: GGC CCA CGA GCT ACC CGG AG (서열번호: 45), 프라이머 2: CTT CCA GCA GAT CCA GCA GCC (서열번호: 46)이었다. 예상된 PCR 생성물은 정제된 겔이었고, 생어(sanger) 시퀀싱을 시행하였다. 시퀀싱 결과, 정확한 스플라이싱 사건이 일어났음이 밝혀졌다. 이어서, VH4 인트론의 기능을 마이크로디스트로핀 코딩 서열을 GFP 리포터 단백질에 대한 코딩 서열로 교체한 작제물에서 테스트하였다. 또한 분화된 C2C12 세포에 다양한 용량의 VH4 인트론의 존재 여부와 관계 없이 SPc5-12 프로모터에 의해 구동된 GFP 유전자를 함유한 AAV8 벡터를 테스트하였다. 이미지를 촬영하였고, Cytation 5 세포 영상화 다중방식 판독기를 사용하여 정량화를 수행하였다. 정량화 및 이미지 데이터 모두 VH4 인트론이 GFP 발현을 거의 5배 증가시켰음을 시사하였다(도 2a-f 도 3).
6.2 실시예 2 - 분화된 C2C12 세포를 사용한 마이크로디스트로핀 벡터의 시험관 내 효능 검정
HEK293 세포에서 AAV8-CAG-GFP 벡터의 감염성을 분석하여, 마이크로디스트로핀 벡터의 효능을 테스트하기 위한 시험관 내 검정을 개발하였다. 감염 3일 후(1 x 10E5 vg/세포), GFP-양성 HEK293 세포가 관찰되지 않았고(데이터가 도시되지 않음), 이것은 AAV8 벡터로의 HEK293 세포의 감염성이 낮음을 시사한다. C2C12 근아세포에 형질도입하는 AAV8-CAG-GFP 벡터의 능력을 동일한 방식으로 테스트하였다. 미분화된 C2C12 근아세포를 AAV8-CAG-GFP 벡터(1x 10e6 vg/세포)로 감염시킨 후, 이어서 3일 동안 분화시켰다. HEK293 세포와 유사하게, GFP-양성 세포가 거의 관찰되지 않았고, 이는 미분화된 C2C12 근아세포가 rAAV8에 의한 낮은 감염성을 보임을 입증하였다(데이터가 도시되지 않음). 분화 배지(DMEM+2% 말 혈청)에서 3일 동안 C2C12 세포를 배양함으로써 분화된 C2C12 세포에서 감염성을 테스트하였고, 이어서 이들 세포를 AAV8-CAG-GFP로 감염시켰다. 감염 후 3일 차에, 그리고 분화 후 3일 차에 영상을 촬영하였다. 많은 GFP 양성 세포가 눈에 보였고, 이는 분화된 근육대롱세포가 AAV8 벡터에 의한 형질도입에 취약함을 시사한다(도 4a-c).
근육 세포에 대한 시험관 내 감염 시스템의 성공적인 확립 후, 마이크로디스트로핀 벡터의 효능을 분석하였다. 예를 들어, 동일한 생산 공정을 사용하여 몇 개월 간격으로 생성된 2 배치의 벡터(RGX-DYS1-RS 및 RGX-DYS1-03)의 효능을 분화된 C2C12 세포에서 테스트하였다. 사용된 일차 항체는 인간 디스트로핀(DSHB 카탈로그 번호 MANHINGE1A(6F11))에 대한 단클론성 항체였다. JMP 소프트웨어를 사용하여 데이터를 분석하였다. 테스트된 벡터(RGX-DYS1-03)의 상대적 효능은 기준 대조군(RGX-DYS1-RS, 100%)의 81.47%였고, 이것은 두 벡터의 감염성이 매우 유사했음을 시사한다(도 5a-h).
재조합 AAV 패키징 DYS1, DYS2, DYS3 또는 DYS4 벡터의 배치를 생산하였고, 벡터 효능의 척도로서, 그들의 상대적 감염성을 분화된 근육 세포주 C2C12 세포에서 비교하였다(도 6). 간략하게, 마우스 근육 세포주 C2C12 세포를 둘베코 변형 이글 배지(DMEM) 중 10% 우태 혈청(FBS)으로 배양된 6-웰 플레이트에 2x 10E5 세포/웰로 씨딩하였다. 이어서, 둘째 날에, 세포를 분화 배지(인슐린(1 ug/ml)이 보충된 2% 말 혈청을 가진 DMEM)로 옮겼다. 분화 3일 후, 세포를 2.5E4 vg/세포의 용량의 상이한 DMD 벡터로 감염시켰다. 감염 후 3일차에, 감염된 세포를 수확하였고, DNA 추출과 이어서 Q-PCR를 시행하였다. DNeasy 혈액 및 조직 키트(카탈로그 번호: 69504, Qiagen)를 사용하여 DNA를 추출하였다. 내인성 대조군(글루카곤 유전자) 및 AAV 벡터에 대해 타크만 검정을 사용하였다. 내인성 대조군으로서 마우스 글루카곤 유전자는 벡터 카피 수의 정규화를 허용하였다. 마우스 글루카곤 프라이머 및 프로브의 서열은 아래와 같았다: 글루카곤-리얼-F(마우스): AAGGGACCTTTACCAGTGATGTG (서열번호: 47); 글루카곤-리얼-R(마우스): ACTTACTCTCGCCTTCCTCGG (서열번호: 48); 타크만 마우스 글루카곤 프로브: FAM-CAGCAAAGGAATTCA-MGB (서열번호: 49). 표적 AAV 벡터의 경우, 마이크로-dys 서열을 인식하도록 프라이머 및 프로브를 설계하였고, 이들은 아래와 같았다: Dys-C-F: TGG GCC TGC TCC TGC ATG (서열번호: 50); Dys-C-R: ATC TCA GGC TTG GCA AAC (서열번호: 51); Dys-C-프로브: FAM-CAA TAT TGA GCC ATC AGT C-MGB (서열번호: 52). 이배체 세포당 카피 수를 하기와 같이 계산하였다:
Figure pct00052
DYS1-RS 배치를 기준 대조군(1.0으로 설정)으로 간주하였고, 다른 모든 벡터를 이것과 비교하였다(벡터 카피 수/기준 대조군 (배수-변화)). 도 6에서 나타낸 바와 같이, 모든 AAV8 벡터의 감염성은 유사하였고(50 내지 150% 감염성 범위는 허용 가능함), 이것은 양호한 품질 벡터를 입증한다.
2개의 상이한 용량(1e5 vg/세포 및 5e4 vg/세포)의 다양한 AAV8 벡터로 분화된 C2C12 세포를 감염시킨 후, 마이크로디스트로핀 유전자의 RNA 발현 수준을 판단하였다. RGX-DYS3 벡터로 형질감염된 세포의 마이크로디스트로핀의 mRNA 수준은 RGX-DYS1 벡터로 형질감염된 세포에서의 마이크로디스트로핀 mRNA 수준과 비교하여 2-3배 더 높았다(도 7). 이와 같은 차이는 RGX-DYS3 안정화 mRNA에 VH4 인트론의 존재 때문일 가능성이 높다.
6.3 실시예 3 - mdx 마우스 모델에 유전자 요법 투여
6.3.1. 연구 방법
HEK293 세포를 사용하여 RGX-DYS1을 AAV8 벡터에 패키징하였고, 벡터 RGX-DYS1의 역가는 4.6E13 vg/ml였다. 간략하게, RGX-DYS1 AAV8 벡터를 2E14 vg/kg 복용량으로 꼬리 정맥 주사로 5 주령 수컷 mdx 마우스에 전신으로 전달하였다(n = 13). 주기적으로, 마우스를 칭량하였다. 처리 후 5주 차에, 근육 그립 강도를 측정하였고, 주사 후 6주 차에, 시험관 내 근육 수축성 기능 검정을 수행하였다. 결과는 표 11에 나타내었다.
Figure pct00053
6.3.2. 체중 및 조직 중량
골격근의 퇴행 및 재생의 병인 때문에, mdx 마우스는 통상적으로 야생형 마우스보다 더 무겁다. 도 8에서 드러난 바와 같이, RGX-DYS1 벡터로의 처리가 체중을 상당히 감소시켰다. 사실상, 처리된 마우스의 체중은 처리 후 2주 차에 야생형 대응물과 유사하였다.
주사 후 6주 차에 모든 마우스를 안락사시켰고, 다양한 기관 및 근육을 칭량하였다. RGX-DYS1-처리된 마우스는 비장근, 사두근, 및 삼두근 근육 및 전경골근(TA)을 비롯한 기관 및 근육 중량의 상당한 감소를 나타내었다(도 9a 9b).
6.3.3. 그립 강도
그립 강도를 측정하기 위해, 절차를 시작하기 전 대략 10분 동안 마우스를 시험실에 순응시켰다. 실험자는 처리에 대해 모르고 있었고, 측정 대상 마우스를 다른 사람이 실험자에게 인수하였다. 마우스가 앞발로만 수평 바 중에 하나를 파지하도록 앞다리 와이어 그리드의 최상부에 마우스를 살며시 내려놓았다. 앞발 두 개로 동일한 바를 잡고, 몸통이 지면과 수평이며, 바와 평행한 것이 확인된 후, 마우스가 앞발을 놓을 때까지, 그리드의 완전한 길이까지 균일한 힘으로 계속 마우스를 잡아당겼다. 순응 및 테스트를 위해 5일 연속 각 마우스를 5회 잡아당겼다. 개별 마우스의 최대 강도의 분석을 위해, 단일 최상으로 기록된 값(최대 힘)을 계산하였다. 체중에 기초하여, 정규화된 강도(KGF/kg)를 계산하였다.
처리 후 5주 차에 실시한 그립 강도 측정은, 치료가 병든 비히클 대조군(p≤0.001)과 비교하여, RGX-DYS1-처리된 마우스의 근육 힘을 상당히 증가시켰음을 보여주었다(도 10).
6.3.4. 시험관 내 힘
케타민 및 크실라진을 사용하여 마우스를 마취시켰다. 개별 마우스에서 우측 뒷다리의 EDL 근육을 제거하여, 25℃의 링거액(pH 7.4)을 함유한 산소화된 배쓰(95% O2, 5% CO2)에 침지하였다. 피로도를 일으키지 않는 경련(non-fatiguing twitches)을 사용하여, 힘 생성을 위해 상기 근육을 최적의 길이로 조정하였다. 근육을 전극으로 자극하여 2분간 휴식 간격을 두고 강직경련성 수축을 유도하였다. 후속 테타누스독소증으로, 근육 힘이 통상적으로 약 250Hz에서 발생하는 안정기에 도달할 때까지, 20, 30 또는 50Hz의 단계로 자극 빈도를 증가시켰다. 근육량, 섬유 길이, 및 조직 밀도에 기초하여, 근육의 단면적을 측정하였다. 최종적으로, 근육의 단면적을 기초하여, 근육 특이적인 힘(kN/m2)을 계산하였다.
비히클 mdx 마우스(n=13)는 건강한 BL10 마우스(이력 데이터, n=14)와 비교하여, 최대 및 특이적인 힘의 상당한 감소를 보였다. mdx 마우스의 RGX-DYS1 처리는 비히클 대조군과 비교하여, 6주 차에 최대 및 특이적인 힘 모두에서 상당한 개선을 초래하였다(도 11).
6.3.5. 심장 기능
혈압(BP)을 측정하기 위해, 1.5% 이소플루레인을 사용하여 마우스를 진정시키고, 마취의 면(plane)을 지속적으로 모니터링하고 체온을 36.5-37.58℃로 유지시켰다. 심박수는 450-550 박동/분으로 유지되었다. 혈압 커프를 꼬리 둘레에 두르고, 이어서 꼬리를 마취하는 동안 비침습성 BP 모니터링을 위해 센서 조립체에 배치하였다. 10회 연속, BP를 측정하였다. 분석적 소프트웨어를 사용하여, 수축기 압력, 확장기 압력 및 평균 압력을 비록한 꼬리 BP의 정성적 및 정량적 측정을 오프라인화하였다. 예를 들어, 문헌[Wehling-Henricks 등, Human Molecular Genetics, 2005, Vol. 14, No. 14; Uaesoontrachoon 등, Human Molecular Genetics, 2014, Vol. 23, No. 12]을 참고한다.
깨어서 자유롭게 움직이는 마우스의 ECG 파 높이 및 간격 기간을 모니터링하기 위해, 전파 원격 측정 장치를 사용하였다. 송신기 장치를 마취된 마우스의 복강에 이식하고, 전극 2개를 전극 II 배향에서 심장의 정점 및 우측 견봉 근처에 고정시켰다. 데이터 기록을 위한 컴퓨터 시스템에 연결된 안테나 리시버 위의 우리에 마우스를 단독으로 수용하였다. 35일 간 1시간 당 10초 동안, 여과되지 않은 ECG 데이터를 수집하였다. 외과적 절차에서 회복할 시간을 주고 임의의 마취 효과가 사라졌음이 보장되도록 첫 7일간의 데이터를 폐기하였다. DSI 분석 패키지(ART 3.01 및 Physiostat 4.01)로 데이터 파형 및 파라미터를 분석하였고, 심박수, ECG 파 높이 및 간격 기간을 결정하기 위해 측정치를 컴파일하여 평균을 내었다. 부정맥에 대한 원본 ECG 파형을 2명의 독립적 관찰자가 스캐닝하였다.
피크로-시리우스 레드 염색(Picro-Sirius red staining)을 수행하여 실험 마우스의 심장에서 섬유증의 정도를 측정하였다. 간단히 말해서, 실험 마지막에, 안락사 후 바로, 심장근을 제거하여, 추후 공정을 위해 10% 포르말린에 고정시켰다. 심장을 절편화하고, 파라핀 섹션을 자일렌에서 파라핀 제거를 시행하고, 이어서 8분 동안 바이게르트 헤마톡실린으로 핵 염색을 하였다. 이후, 이들을 세척하고 추가로 30분 동안 피크로-시리우스 레드 레드(시리우스 레드 F3B 0.5 g, 피크르산의 포화 수용액)로 염색하였다. 섹션을 자일렌을 3회 교환하여 섹션을 정제하고, Permount에 실장하였다. Eclipse E800(Nikon, Japan) 현미경을 사용하여 랜덤 디지털 이미지를 5회 촬영하고, 이미지 J(NIH)를 사용하여 맹검 분석을 시행하였다.
동물을 안락사하면 심장 천자를 통해 혈액 샘플을 채취하였고, 근육 CK 수준의 측정을 위해 수집된 혈청을 사용하였다.
6.4 실시예 4 벡터 생체분포
처리 후 6주차에, 비히클- 및 RGX-DYS1-처리 mdx 마우스를 희생시키고, Stilla Technologies의 Naica 결정 디지털 PCR 시스템을 사용하여, 골격근, 심장근, 및 간 세포를 비롯한 다양한 조직에 대한 벡터 카피 수를 평가하였다.
꼬리 정맥 주사를 통해, RGX-DYS1 벡터를 4주령 수컷 근육 퇴행성 mdx 마우스에 투여하였다. 주사 후 6주 차에, 마우스를 희생시키고, 조직에 전체 DNA 추출 및 벡터 카피 수에 대한 ddPCR 검정을 시행하였다.
DNeasy 혈액 & 조직 키트로 수집된 조직의 전체 DNA를 추출하고, Nanodrop 분광광도계를 사용하여 DNA 농도를 측정하였다. 조직에서의 벡터 카피 수를 결정하기 위해, Naica 결정 디지털 PCR 시스템(Stilla technologies)으로 디지털 PCR를 수행하였다. 디스트로핀 이식유전자 및 내인성 대조군 유전자를 동시에 측정하기 위해, 여기에 2개의 색상 멀티플렉싱 시스템을 적용시켰다. 간단히 말해서, 디스트로핀 프로브를 FAM(6-카복시플루오레세인) 염료로 표지한 반면, 내인성 대조군 글루카곤 프로브는 VIC 형광 염료로 표지하였다. 마우스 글루카곤 프라이머 및 프로브에 대한 서열은 아래와 같았다: 글루카곤-리얼(real)-F (마우스): AAG GGA CCT TTA CCA GTG ATG TG (서열번호: X); 글루카곤-리얼-R (마우스): ACT TAC TCT CGC CTT CCT CGG; 타크만 마우스 글루카곤 프로브: VIC-CAG CAA AGG AAT TCA-MGB. AAV 벡터의 경우, 하기의 디스트로핀 유전자의 C-말단을 인식하기 위해 프라이머 및 프로브를 설계하였다: Dys-dd-F2: ACA GAT ACC TGT TCA AGC AAG TGG C (서열번호: 122); Dys-dd-R2: TCA ATC TCA GGC TTG GC (서열번호: 123); Dys-C-프로브: FAM-CAA TAT TGA GCC ATC AGT C-MGB (서열번호: 124). 이배체 세포 당 특이적 조직에서 전달된 벡터의 카피 수는 하기로 계산하였다:
Figure pct00054
RGX-DYS1 투여는 간 조직에서 최고 벡터 카피 수(437±78 카피/세포, n=13)를 초래하였다. 심장근(23±9, n=13) 및 골격근(전경골근 (TA) 28± 10 카피/세포, 장지신근(Extensor digitorum longus)(EDL) 근육 23±11 카피/세포, 횡격막 근육 28±29 카피/세포, 삼두근 근육 49±22 카피/세포) 및 모두는 벡터 분포의 유의성을 보여주었다(도 12).
6.5 실시예 5 - nNOS를 비롯한 DAPC의 회복
디스트로핀과 함께 디스트로핀-관련 단백질은 디스트로핀 관련 단백질 복합체(DAPC)로 알려지고, 브릿지로 기능하여, 세포외 기질을 통해 세포내 세포골격 액틴을 기저 얇은 판에 연결하는 복합체를 형성한다. Sadoulet-Puccio, H.M., 등, Dystrobrevin and dystrophin: an interaction through coiled-coil motifs. (1997) Proc Natl Acad Sci USA 94:12413-8. DAPC는 몇 개의 하위 복합체: 디스트로글리칸, 사크로글리칸, 및 신트로핀/디스트로브레빈으로 구성되는데, 이들은 집합적으로 수축 및 이완의 반복된 사이클 동안 및 세포 신호전달에서 섬유 무결성을 유지하는 원인이 된다. Id. (도 13). 야생형 디스트로핀에서, β-디스트로글리칸 결합 부위는 힌지 4 및 시스테인-풍부(CR) 도메인에 위치한다. 디스트로핀의 WW 도메인은 베타-디스트로글리칸과 상호작용하기 위해 EF-손 영역을 필요로 한다(Rentschler, S., 등 1999, Biol Chem 380:431-42). RGX-DYS1은 C-말단(서열번호: 16)의 일부를 포함하는데, 여기에는 디스트로브레빈 및 신트로핀 결합 도메인이 함유된다(표 1 참고). 신트로핀의 중요한 기능 중 하나는 신호전달 단백질 예컨대 뉴런 산화질소 합성효소(nNOS)를 횡문근형질에 고정시키는 것이다. Adams, M.E., 등, 2000. α1-신트로핀의 부재는 우트로핀에 결핍된 구조적으로 비정상적인 신경근육 시냅스를 초래한다. J Cell Biol 150:1385-98. 따라서, mdx 마우스 근육의 RGX-DYS1에서 마이크로디스트로핀의 발현은 근육막에 디스트로브레빈, 신트로핀, 및 nNOS를 복구할 것으로 예상되었다.
실험처리 및 대조군 장딴지 근육의 한냉-박편(cry-thin-section)에 디스트로핀, nNOS, α1-신트로핀, α-디스트로브레빈에 대한 면역형광 염색을 수행하였다. 실험적 절차를 위해 사용된 시약 및 항체들은 표 12 및 13에 열거하였다.
Figure pct00055
새롭게 단리된 마우스 조직을 이소펜탄/액체 질소 이중 배쓰에 즉시 침지함으로써 스냅 동결하였고, 나중에 -80도로 보관하였다. OCT(최적의 절삭 온도) 화합물을 몇 방울 적가함으로써 조직을 절삭 블록에 부착하였고, 이어서 조직을 원하는 절삭 배향의 블록 위에 놓았다. OCT 및 조직을 저온유지장치(hold until OCT가 고체가 될 때까지 조직을 원하는 배향으로 유지)에 위치시켜 냉동시키고, 조직을 10μm(8-10μm 허용 가능)로 절편화하였다. 4-6개의 섹션을 개별 슬라이드에 배열하고, -80도에 보관하였다.
근육 동결-섹션 슬라이드를 -80도 저장 공간에서 꺼내, 실온에서(RT) 10분 동안 공기를 건조시켰다. 이어서, PAP 펜으로 조직 절편 영역 주변에 표시를 했다. 만약 일차 항체가 마우스 단클론성 항체에서 유래된 것이라면, 2개의 차단 단계가 필요하다. 우선 피펫으로 PAP 펜에 의해 선을 두르고, 실온에서 1.5 시간 동안 배양된 전체 영역을 덮기 위해 적절한 부피의 1x M.O.M을 첨가함으로써 샘플을 차단하였다. M.O.M.은 흡인에 의해 제거하였고, 후속적으로 실온에서 1시간 동안 10% 말 혈청(PBS 중)으로 차단하였다. 만약 일차 항체가 마우스에서 기원한 것이 아니라면, 샘플은 PAP 펜에 의해 선을 두르고 후속적으로 실온에서 1시간 동안 배양한 전체 영역을 덮기 위해 피펫을 사용하여 적절한 부피의 PBS를 첨가함으로써 10% 말 혈청(PBS 중)으로 직접적으로 차단하였다.
일차 항체들은 2% 말 혈청(PBS 중)으로 희석하고, 샘플은 실온에서 1-2 시간 동안 배양하였다. 이어서, PAP 펜에 의해 선을 두르고 그 다음 실온에서 3분 동안 배양하고 흡인한 전체 영역을 덮기 위해 적절한 부피의 PBS를 첨가함으로써 슬라이드를 1X PBS로 세척하였다. 슬라이드를 총 3-4회 세척하였다. 이차 항체(CY3, 예컨대 Alexa Fluor 594, 또는 488 접합된 항체의 등가물)를 PBS 중 2% 말 혈청으로 희석하였고, 슬라이드를 실온에서 1시간 동안 배양하였다. 슬라이드를 실온에서 3분 동안 1X PBS로 3-4회 세척하였다.
실온에서 5-8분 동안 PBS에 희석된 1x DAPI로 상기 슬라이드를 배양함으로써, DAPI에 대조염색을 수행하였다. DAPI 염색 후, 실온에서 3분 동안 슬라이드를 1x PBS로 세척하였고, 그 다음 실온에서 색 희석 방지 실장 배지(anti-fade mount medium)를 1-2 방울/슬라이드로 실장하였다. 실장 후 슬라이드를 실온에서 공기 건조하였고, 빛으로부터 보호하였다. 형광 현미경을 사용하여 형광을 분석하였고, 이미지를 촬영하였다.
Figure pct00056
도 14에서 나타낸 바와 같이, 소수의 복귀 돌연변이체 섬유를 제외하고, RGX-DYS1로 처리하지 않은 mdx 마우스 근육에서는 디스트로핀 단백질 및 검사된 DAPC 단백질이 모두 부재하였다. RGX-DYS1의 전신 전달이 디스트로핀 발현을 효율적으로 회복시켰을 뿐만 아니라 α1-신트로핀, α-디스트로브레빈, β-디스트로글리칸 및 nNOS를 횡문근형질에 고정시켰다(표 14). 유의할 점은 nNOS 염색을 위해 2개의 상업적 항체들을 사용했다는 점이다. 두 경우 모두, 미처리 대조군과 비교하여, 근육막에 nNOS 발현이 상당히 회복되었다. 결론적으로, RGX-DYS1 마이크로디스트로핀은 생체 내에서 nNOS를 비롯한 디스트로핀-관련된 단백질 복합체를 횡문근형질에 회복시킬 수 있었다.
Figure pct00057
6.6 실시예 6 - mdx 마우스 모델에 유전자 요법 투여
AAV8-RGX-DYS3 및 AAV8-RGX-DYS5 벡터의 생체 내 테스트를 수컷 C57BL/10ScSn-Dmdmdx/J (mdx) 마우스 13마리에서 수행하였다. 모든 벡터는 2E14 vg/kg 복용량으로 꼬리 정맥 주사에 의해 5주령 수컷 mdx 마우스에 전신으로 전달하였다(그룹 1의 경우 n=5, AAV8-RGX-DYS3; 그룹 2의 경우 n=5, AAV8-RGX-DYS5; n=3, mdx 음성 (투약 없음) 대조군). 투약 당일에, 동물의 중량 범위는 15.9 g 내지 22.0 g이었다. 벡터 투여 후 6주 차에, 혈청을 위해 혈액을 수집하였고, 동물을 안락사하고, 조직의 수집을 위해 검시를 시행하였다. 비복근(Gas), 전경골근 (TA), 횡격막, 삼두근, 사두근, 심장, 간을 비롯한 주요 골격근 및 주요 기관을 수집하여 이소펜탄 /액체 질소 이중 배쓰에서 스냅 동결하고, 예비 냉각된 동결튜브에 배치하였다.
매주 2회 각 동물의 체중을 기록하였고, 각 그룹의 평균적인 중량 변화를 계산하였다. 예상대로, 동물 #12 (R13-135-012)를 제외한 모든 동물이 7 주 기간에 걸쳐 중량을 획득하였다.
Figure pct00058
mdx 마우스의 골격근의 퇴행 및 재생의 병인은 전형적으로 야생형 마우스보다 더 무거운 중량을 초래한다. 표 15에서 나타낸 바와 같이, RGX-DYS3 또는 RGX-DYS5 벡터로 처리한 mdx 마우스는, 미처리 mdx 마우스와 비교하여, 체중 변화가 유의미하게 감소하였다.
6.7 실시예 7 - 처리된 mdx 마우스에서 마이크로디스트로핀 (μ-Dys) 단백질 발현의 평가
6.7. 1 웨스턴 블롯에 의한 μ- Dys 발현 비교, mRNA 발현 및 DNA 벡터 카피 수
RGX-DYS1 실험과 관련된 본 실시예에 기재된 데이터 및 샘플은 섹션 6.3에 설명된 바와 같은 처리 이후 수집하였다(n=13 AAV8-RGX-DYS1가 투여된 마우스). AAV8-RGX-DYS3 및 AAV8-RGX-DYS5가 투여된 동물에 대한 실험과 관련하여 하기에 기재된 데이터 및 샘플은 위의 섹션 6.6에서 설명된 바와 같은 처리 후 수집하였다(각각의 처리된 mdx 마우스 그룹, n=5). 상이한 시설에서 실험을 수행하였다.
처리된 mdx 마우스에서 수집된 바와 같이, 장딴지 근육에서 유래된 마이크로디스트로핀 단백질 발현을 웨스턴 블롯으로 검사하였다. 간략하게, 조직 20 내지 30mg을 단백질 용해 완충액(15%SDS, 75mM Tri-HCl pH6.8, 프로테이나제 억제제, 20% 글리세롤, 5% 베타-머캅토에탄올) (비드 밀 균질기 비드 Ruptor 12, SKU:19050A, OMNI International)에 균질화하였다. 균질화 후, 샘플을 실온에서 최상부 속도로 5 분 동안 스핀다운하였고, 상청액에 단백질 정량화를 시행하였다. Qubit 단백질 검정 키트(카탈로그 # Q33211, ThermoFisher Scientific)를 사용하여, 단백질 스톡 상청액을 정량화하였다. 스톡 당 전체 단백질 농도를 계산하였고, 이어서 단백질 스톡 상청액 20 ug를 SDS-PAGE 겔에 로딩하였다. 1:1000으로 희석된 일차 항-디스트로핀 항체(MANEX1011B(1C7), Developmental Studies Hybridoma Bank)를 사용하여 웨스턴 블롯을 수행하였고, 적용된 이차 항체는 서양고추냉이 과산화효소(HRP)(Thermo Fisher Scientific, 카탈로그 번호 62-6520)에 대한 염소 항-마우스 IgG2a 접합체였다. α1-액틴은 겔의 각 선에서 로딩 대조군 역할을 한다. 항-α1-액틴 블롯의 경우, 1:10,000의 희석 계수로 토끼 다클론성 항-α1-액틴 항체(PA5-78715, Thermo Fisher)를 사용하였고, 이차 염소 항-토끼 항체 (Thermo Fisher Scientific, 카탈로그 번호 31460)를 1:20,000로 사용하였다. ECL Prime 웨스턴 블롯팅 검출 시약(제조자의 지침에 따라; AMERSHAM, RPN2232)을 사용하여 단백질 신호를 검출하였고, Image Lab 소프트웨어(Bio-Rad)에 의해 유도된 밀도측정으로 정량화하였다.
웨스턴 블롯 결과(도 15), 몇 개의 관찰이 드러났다: 첫째, 각각의 μ-디스트로핀 단백질의 추정 크기는 겔에서 관찰된 그것의 이동과 잘 상응하는데, 예를 들어 RGX-DYS1 μ-디스트로핀 단백질은 148 kDa이었던 반면, RGX-DYS5 및 RGX-DYS3 단백질의 크기는 각각 142 kDa 및 132 kDa였다. 둘째, 띠의 강도는 장딴지 근육 조직에 존재하는 단백질마다 상이하였다. μ-디스트로핀의 길이가 더 긴 버전인 RGX-DYS1 벡터가 가장 강한 이식유전자 발현을 나타내었고, 중간 길이 버전 RGX-DYS5 및 더 짧은 버전 RGX-DYS3이 그 뒤를 이었다(도 15도 16A). 이들 3가지 작제물 중 μ-디스트로핀 발현 수준의 차이는 상이한 길이의 μ-디스트로핀 작제물의 AAV 벡터 게놈 수준 또는 단백질 안정성의 변이 때문일 수 있다.
세포 당 게놈 복제를 설명하기 위해, ddPCR를 수행하여 섹션 6.4(실시예 4)에 기재된 방법을 사용해, 이들 조직에서 AAV-μ-dys 벡터 게놈 카피 수를 조사하였다. 도 16b에 표시된 바와 같이, RGX-DYS1 벡터-전달 조직은 벡터 게놈 카피 수(50±14 gc/세포)가 RGX-DYS5(17± 4 gc/세포) 및 RGX-DYS3(16 ± 5 gc/세포) 벡터-전달 조직보다 더 많았다(값들은 글루카곤 게놈 복제물에 대해 정규화하였다). 이어서, 상대적 μ-디스트로핀 발현을 벡터 카피 수와 비교하였다. 도 16c에서 나타낸 바와 같이, RGX-DYS1-처리 근육 및 RGX-DYS5-처리 근육에서의 상대적 μ-디스트로핀의 발현(각각, 1.33 ± 0.39, 1.774 ± 0.40)은 모두 RGX-DYS3-처리 근육(0.77 ± 0.22, p< 0.05, n = 3 내지 5)보다 상당히 더 높았다. 이와 같은 데이터는 RGX-DYS1 및 RGX-DYS3 벡터에 의해 생성된 길이가 더 긴 버전의 μ-디스트로핀(C-말단 보유)이 생체 내 근육 세포에서 μ-디스트로핀 단백질의 더 나은 안정성을 이루어 냄을 보여준다.
추가로, 처리된 마우스와 비교하여, 미처리 야생형 B6 및 mdx 마우스의 골격근에서의 μ- 및 야생형 (WT)-디스트로핀의 mRNA 발현은 ddPCR로 측정하였다. RNeasy 섬유상 조직 미니 키트(REF 74704, Qiagen)를 사용하여, 근육 조직에서 전체 RNA를 추출하였다. RNAse 억제제(Ref 4374966, Applied Biosystems by Thermo Fisher Scientific)를 함유한 고-수용력 cDNA 역전사 키트를 사용하여 cDNA를 합성하였다. Nanodrop 분광광도계를 사용하여 RNA 농도를 측정하였다. 디지털 PCR (Naica Crystal Digital PCR system, Stilla technologies)를 사용하여, μ-디스트로핀, WT-디스트로핀, 및 내인성 대조군 글리세르알데하이드 3-포스페이트 탈수소효소(GAPDH) mRNA의 카피 수를 측정하였다. 마우스 WT-디스트로핀(mm01216951_m1, Thermo Fisher Scientific)(또한 섹션 6.4(실시예 4)의 생체분포 연구에 기재된) 및 마우스 GAPDH(mm99999915_g1, Thermo Fisher Scientific)에 대한 프라이머 및 프로브는 상업적으로 입수가 가능하였다. 도 17a에서 나타낸 바와 같이, 미처리 B6 마우스에서의 상대적 WT-디스트로핀 전사체는 1±0.64였고, mdx 마우스에서의 WT-디스트로핀 mRNA 발현은 1.55 ± 0.77(p = 0.15, n =4)이었다. 처리된 동물에서의 상대적 μ-디스트로핀 mRNA는 아래와 같았다: RGX-DYS1-처리 근육, 22.66 ± 11.6 (p < 0.01, n =5); RGX-DYS5-처리, 16.83 ± 11.07 (p = 0.06, n = 3) 및 RGX-DYS3 처리 근육, 11.87 ± 7.90 (p< 0.05, n = 4). 이와 같은 데이터는 RGX-DYS1, RGX-DYS5, 및 RGX-DYS3 그룹에서 μ-디스트로핀 벡터의 전달이 모두 야생형 수준보다 훨씬 높은 μ-디스트로핀 전사체를 생성하였음을 나타낸다. 또한, μ-디스트로핀 mRNA 카피 수는 세포 당 AAV 벡터 게놈 카피 수에 정규화하였고, WT-디스트로핀 mRNA는, GAPDH 정규화 뿐만 아니라, 세포 당 게놈 카피 수에 정규화하였다(2 복제물/ 세포). 도 17b에서 나타낸 바와 같이, 모든 그룹은 게놈 기준으로 본질적으로 유사한 수준의 mRNA 발현을 나타내었다(n= 3 내지 5, p>0.05). 이는 AAV-μ-디스트로핀 이식유전자의 발현을 구동하는 근육-특이적 Spc5-12 프로모터가 마우스 골격근 세포에서의 본연의 디스트로핀 프로모터만큼 강력했음을 시사하였다.
6.7. 2 면역형광(IF) 염색에 의한 μ- 디스트로핀 발현 및 디스트로핀 -관련 단백질 복합체( DAPC ) 관련성
다음으로, 면역형광(IF) 염색을 수행하여 상이한 그룹의 장딴지 근육 상의 디스트로핀 및, 디스트로브레빈, β-디스트로글리칸, 신트로핀, 및 nNos를 비롯한 디스트로핀 관련된 단백질 복합체의 발현을 조사하였다. 적용된 IF 염색 프로토콜 및 항체들은 위 섹션 6.5(실시예 5)에서 앞서 설명된 바와 같았다. 도 18에서 나타낸 바와 같이, 디스트로핀 단백질 및 검사된 DAPC 단백질이 모두 미처리 mdx 근육에 부재했던 반면, 이들은 야생형 B6 근육막 상에 상당히 많이 존재하였다. 처리된 세 그룹 모두, μ-디스트로핀 단백질이 거의 100% 근육 섬유 상에서 발현되었고, 이들은 상이한 처리 군에서 구별할 수 없었다. 3가지 처리 군은 근육막에 매우 유사한 패턴으로 디스트로브레빈 발현이 회복되었음을 보여주었다. β-디스트로글리칸 염색의 경우, RGX-DYS1-처리 그룹의 근육이 좀 더 균일하고 좀 더 강렬한 β-디스트로글리칸 염색(발현)을 나타내었다.
신트로핀 염색에서, 이들 처리 군의 좀 더 극적인 차이가 관찰되었다. 근육막 상의 신트로핀의 발현은 더 긴 길이의 μ-디스트로핀을 함유한 RGX-DYS1 그룹에서 상당히 향상되었고, 이어서 RGX-DYS5 및 RGX-DYS3 그룹 순으로 향상되었다(도 18도 19a). 웨스턴 블롯 분석으로 근육 용해물 상에서의 동일한 경향을 추가로 입증하였다(도 19b). 골격근 조직 용해물(3가지 mdx 처리 및 미처리 그룹에서 각각 유래된 장딴지 근육 조직 및 비복근 1개 및 삼두근 2개는 B6 마우스 그룹에서 유래되었다)에서, 신트로핀에 대한 웨스턴 블롯을 수행하였다. 1:10,000의 다클론성 항-신트로핀 항체(Abcam, ab11187)를 사용하였고, 실온에서 1시간 동안 배양하였다. α-악티닌에 대한 토끼 단클론성(ab68167, Abcam)을 1:5000 희석으로 적용하였다. 이차 염소 항-토끼 항체(Thermo Fisher Scientific, 카탈로그 번호 A-10685)를 적용하였다. WT 근육에서 신트로핀 발현 대 내인성 대조군 악티닌 발현의 비율은 4.56± 0.76(n=3, 일원분산분석에 의한 p <0.001)였고, mdx 그룹(0.84±0.22)과 비교되었다. RGX-DYS1 및 RGX-DYS5 그룹에서의 비율은 각각 2.72 ± 0.97(n=3, mdx 그룹과 비교하여, p < 0.05) 및 1.35 ± 0.03이었다(도 19c). 전체 근육막 추출물 상에서 웨스턴 블롯에 의해 골격근 중 신트로핀 발현의 수준을 추가로 검사하였다. Mem-Per 플러스 막 단백질 추출 키트(카탈로그 # 89842, Thermo Fisher)를 사용하여, 전체 골격근 단백질을 추출하였다(mdx 처리 및 미처리 그룹 각각에서 유래된 장딴지 근육 조직 및 B6 마우스 그룹에서 유래된 사두근). 전체 막 단백질 20 ug을 각 선에 로딩하였다(도 19d). 1:10,000의 다클론성 항-신트로핀 항체(Abcam, ab11187)를 사용하여, 4℃에서 밤새 배양하였다. 1:10,000 희석의 로딩 대조군 다클론성 항-액틴(PA5-78715, Thermo Fisher)을 적용하여, 4℃에서 밤새 배양하였다. WT 근육이 최고 신트로핀 발현 수준을 나타내는 전체의 용해물 웨스턴 실험과는 약간 다르게, 상기 전체 막 단백질 웨스턴 블롯은, 도 19e에서 나타낸 바와 같이, RGX-DYS1 그룹에서 최고 상대적 신트로핀 발현(0.81±0.26, n=3)을 나타내었고, 이어서 B6_WT 그룹 (0.6623±0.05, n=3), RGX-DYS3 그룹 (0.59±0.08), 및 mdx 그룹 (0.32 ± 0.07, n=3) 순이었다. 이들 결과는 μ-디스트로핀 벡터에 의해 생성된 μ-디스트로핀이 근육막 신트로핀 발현을 회복시킬 수 있음을, 그리고 길이가 더 긴 버전의 RGX-DYS1이 신트로핀을 근육막에 고정시키는 능력이 더 짧은 버전인 RGX-DYS3보다 우수했음을 분명이 보여주었다.
근육 막(장딴지 근육 조직/mdx, 및 사두근/B6 그룹)을 사용하여 유사하게 nNOS 웨스턴 블롯을 준비하였다. Mem-Per 플러스 막 단백질 추출 키트(카탈로그 # 89842, Thermo Fisher)를 사용하여, 전체 근육 막 단백질을 추출하였다.전체 막 단백질 20 ug를 SDS-PAGE 겔의 각 선에 로딩하였다. nNOS에 대한 일차 항체(SC-5302, Santa Cruz Biotechnology)를 1:500로 사용하였고, 다클론성 항-액틴(PA5-78715, Thermo Fisher)을 1:10,000 희석으로 적용하였다. 이차 염소 항-마우스 IgG 항체, HRP (62-6520, ThermoFisher)을 적용하였다. nNOS 발현과 관련하여, 우리는 IF 염색 후 RGX-DYS1 및 RGX-DYS3 그룹 이미지 사이의 현저한 차이를 관찰하였다(도 20a). 그러나, 웨스턴 블롯 결과는 RGX-DYS1, RGX-DYS3, 및 미처리 mdx 그룹 사이의 임의의 유의차를 보여주지 않았고(도 20b-c), 이는 RGX-DYS1 벡터에 의한 nNOS의 회복이 낮음을 시사한다.
전반적으로, mdx 마우스에서 RGX-DYS1, RGX-DYS3, 및 RGX-DYS5 벡터의 전달은 모두 강건한 μ-디스트로핀 발현 및 디스트로핀 관련 단백질 복합체(DAPC)의 회복을 초래하였다. 길이가 더 긴 버전의 RGX-DYS1 벡터는 DAPC 특히, 신트로핀 및 β-디스트로글리칸의 회복을 향상시켰다. RGX-DYS1 벡터에 의한 막 DAPC에 대한 nNOS의 회복 능력은 낮았으나, IF 염색 시 관찰되었다.
6.8 실시예 8- 위성 세포의 형질도입 및 RGX-DYS1 벡터에 의한 근퇴행성 근육의 재생의 개선
골격근 줄기 세포, 즉 위성 세포(SC)는 정상적으로 휴지기에 속하며, 근섬유의 기저 얇은 판 및 횡문근형질 사이에 위치한다. 성장 중에, 그리고 근육 손상 후에, SC의 근원성 프로그램이 활성화되고, SC는 자가재생으로 그것의 풀(pool)을 유지하고 및/또는 분화하여 근아세포 및 결국 근섬유를 형성한다. 분화된 근섬유의 형질도입과 관련하여, 아데노-관련 바이러스(AAV) 벡터가 잘 알려져 있어서, 우리는 위성 세포에 AAV 벡터가 형질도입될 수 있는지 여부를 조사하였다. 위성 세포는 작고 세포질이 매우 적어서, 이들 세포에서 이식유전자 발현을 연구하는 것은 기술적인 어려움이 있다. 우리는 여기서 RNAscope를 적용하여 AAV가 위성 세포에 형질도입될 수 있는지 여부를 조사하였다. RNAscope은 동시 신호 증폭 및 배경 소음 억제를 가능하게 하는 최신 제자리 혼성화(ISH) 기술로, 단일 세포 해상도로 온전한 조직에서 직접적인 단일 분자 유전자 발현의 시각화를 허용한다. 형광단, Opal 570 (적색)로 표지된 AAV μ-디스트로핀 프로브와 및 형광단, Opal 520 (녹색)으로 표지된 근육 위성 세포 마커, pax7로 RNAscope 다중 형광 분석을 수행하였다. Advanced Cell Diagnostics Inc(Newark, CA)에서 AAV 이식유전자 및 Pax7 mRNA 발현의 RNAscope 다중 형광 분석을 수행하였다. RNeasy® 섬유상 조직 미니 키트(Qiagen 카탈로그 번호 74704)를 사용하여 골격근에서 전체 RNA를 추출하였고,RNase 억제제(Applied Biosystems 카탈로그 번호 4374966)를 함유한 고-수용력 cDNA 역전사 키트로 cDNA를 합성하였다. 디지털 PCR(Naica 결정 디지털 PCR 시스템, Stilla technologies)를 사용하여, μ-디스트로핀 mRNA 및 내인성 대조군 GAPDH mRNA의 절대적인 카피 수를 측정하였다. μ-디스트로핀에 대한 프라이머 및 프로브는 앞서 설명된 바와 동일하였다. 마우스 pax7 프라이머 및 프로브 세트(TaqMan TM MGB 프로브, Applied Biosystems 카탈로그 번호 4316034)를 상업적으로 구입하였다.
도 21a-b에 나타낸 바와 같이, 적색(왼쪽 패널, 도 21a)은 표시된 μ-디스트로핀 신호(mRNA 발현 또는 AAV 게놈의 존재)를 나타내고, 녹색색은 pax7+ 위성 세포(도 21a-b에서 화살표로 표시됨)를 명시한다. DAPI 염색에서 청색(좌우 패널, 도 21a-b)은 핵 염색을 나타낸다. 녹색, 적색 및 청색(흰색 화살표)의 공통 위치는 근육 위성 세포의 AAV-DMD 벡터 형질도입을 나타내었고, 한편 녹색 및 청색 유일 세포(흑색선이 있는 흰색 화살표)는 AAV 형질도입이 없는 위성 세포를 나타내었다. 상기 μ-디스트로핀 형질도입된 위성 세포를 계수하였고, 상기 위성 세포 형질도입률을 계산하였다. AAV-μ-dys 형질도입된 골격근에서, 위성 세포의 형질도입률은 23±1.5%였다(도 21c). 이것은 AAV 벡터가, 성숙한 근섬유보다 훨씬 더 낮은 형질도입률로 도입되지만, 근육 위성 세포에 형질 도입될 수 있음을 시사하였다.
이어서, RNAscope 이미지에서 전체 pax7+ 위성 세포 수를 계수하여 위성 세포의 수가 상이한 처리 군들에서 유사한지 여부를 조사하였다. 도 21d에서 나타낸 바와 같이, 미처리 mdx에서 이미지당 pax7 양성 세포 수는 39.12±15.14였고, 야생형 B6 마우스 및 DMD 벡터 처리 마우스에서 양성 세포 계수는 각각 11.87± 3.23(8개 이미지를 계수함, 일원 변량분석에 의해 p< 0.0001) 및 14.66 ± 5.91 (12개 이미지를 계수함, 일원 변량분석에 의해 p< 0.0001)이었다. 미처리 mdx 근육에서 위성 세포 수의 증가는 근퇴행성 근육의 재생 속성을 시사하였다. RGX-DYS1 벡터와 μ-디스트로핀의 전달이 이와 같은 병리를 뒤바꾸었고, 근육 재생을 완화하였다.
RNAscope 기술 분석과 더불어, 우리는 전체 근육 RNA를 추출하여 cDNA 합성을 수행하였다. RNeasy® 섬유상 조직 미니 키트(Qiagen 카탈로그 번호 74704)를 사용하여 골격근에서 전체 RNA를 추출하였고, RNase 억제제가 함유된 고-수용력 cDNA 역전사 키트(Applied Biosystems 카탈로그 번호 4374966)로 cDNA를 합성하였다. 마우스 pax7 특이적 프라이머 및 프로브 세트(상업적으로 입수가능함: 각각, mm01354484_m1 Pax7, Thermo Fisher Scientific; 및 TaqManTM MGB 프로브, Applied Biosystems 카탈로그 번호 4316034)를 사용하여, 샘플에 ddPCR 분석을 수행하였다. 마우스 GAPDH 프라이머 및 프로브 세트를 사용하여 RNA 및 cDNA 입력을 정규화하였다. 디지털 PCR(Naica 결정 디지털 PCR 시스템, Stilla technologies)를 사용하여, μ-디스트로핀 mRNA 및 내인성 대조군 GAPDH mRNA의 절대적인 카피 수를 측정하였다. pax7 mRNA 카피 수 대 GAPDH mRNA 카피 수의 비율을 그룹 간에 비교하였다(도 21e). 예상대로, mdx 마우스에서의 pax7 발현의 상대적 발현은 7.56 ± 3.14이었고, 이것은 WT-B6 마우스(1 ± 0.68, n=5, 일원분산분석에 의한 p<0.001)보다 훨씬 높았다. 3가지 상이한 μ-디스트로핀 벡터-처리 그룹에서 상대적 pax7 발현이 상당히 감소되었다(RGX-DYS5(n=3, p=0.06)의 경우 4.40 ± 1.50, RGX-DYS3 그룹(n = 5, p < 0.01)의 경우 3.12 ± 0.74, RGX-DYS1(n = 5, p< 0.01)의 경우 2.98 ± 0.68). ddPCR 방법에 의한 pax7 mRNA 발현의 감소는 RNAscope 기술 연구내용과 일치하였고, 이것은 추가로 근퇴행성 근육에서 본 μ-디스트로핀 벡터에 의해 매개된 치료 메커니즘 중 하나는 근육 재생의 개선을 통해 이루어짐을 입증하였다.
6.9 실시예 9- 추가 마이크로디스트로핀 ( DMD ) 유전자 발현 카세트의 작제
잠재적으로 μ-디스트로핀의 기능을 개선하고 전반적인 이식유전자 크기(kB)를 감소시키기 위해, 몇 개의 추가적인 μ-디스트로핀 작제물을 재조합으로 조작하였다(도 22). RGX-DYS6(서열번호: 91)의 경우, 효율적인 패키징을 위해 시스테인-풍부 (CR 짧은, 서열번호: 90) 도메인 중 약 50개 아미노산을 제거하여, AAV 게놈 크기를 축소하였다. RGX-DYS7(서열번호: 92)의 경우, 재조합 조작을 위해, 이전의 작제물을 스캐폴드로 사용하여, nNOS-고착 스펙트린 반복 도메인 R16 및 R17(서열번호: 86 및 87)을 R2 및 R24 영역 사이에 삽입하였다. RGX-DYS8(서열번호: 93)은 nNOS-고착 도메인 R16 및 R17이 삽입되었으나, C-말단 도메인(CT)이 제거되어 AAV 벡터의 크기가 축소되었다는 점에서, RGX-DYS7과 유사하다.
모든 μ-디스트로핀 시스 플라스미드를 AAV8 벡터에 패키징하였고, 섹션 6.2(실시예 2)에 설명된 바와 같이, 분화된 C2C12 근육대롱세포 상에서 상기 벡터(2x 105 gc/세포)를 감염시켰다. 감염 후 5일 차에, 세포를 수확하고, 본원에 기재된 바와 같이 항-디스트로핀 일차 항체(MANEX1011B(1C7)를 사용하여 웨스턴 블롯 분석을 시행함으로써, μ-디스트로핀 단백질을 검출하였다. 사용된 모든 방법이 섹션 6.7(실시예 7)에 기재된 바와 유사하다. 도 23a에서 나타낸 바와 같이, 상이한 버전의 μ-디스트로핀을 운반하는 AAV 벡터는 상이한 길이의 μ-디스트로핀 단백질을 생성하였고, 그것의 크기는 예상된 대로 이동되었다. 2가지 주목할만한 관찰내용은 하기와 같다: 1) 일반적으로, 길이가 더 긴 버전의 μ-디스트로핀 단백질은 더 센 띠를 가졌다(도 23a-b). ddPCR로 검사한 μ-디스트로핀 mRNA 발현 수준 (도 23C)은 단백질 발현 수준과 상관관계가 없었는데, 이것은 길이가 더 긴 버전의 μ-디스트로핀에 의해 생성된 더 센 띠가 증가된 mRNA 발현 때문이 아니라, 오히려 단백질의 증가된 안정성 때문일 가능성이 있다. 2) μ-디스트로핀 RGX-DYS6은 특히다른 것과 비교할 때, 안정적이지 않음을 시사한다. 우리는 CR 도메인에서 50개 아미노산이 결실이 μ-디스트로핀의 안정성에 영향을 미쳤을지도 모른다고 판단하였다.
비록 본 발명이 본원의 특정 구현예와 관련하여 상세하게 기재되었으나, 기능적으로 동등한 변형이 본 발명의 범위에 속함이 이해될 것이다. 실제로, 본원에 보여지고 기재된 것뿐만 아니라 본 발명의 다양한 변형들이 전술한 설명 및 첨부 도면에 의해 당업자에게 분명히 이해될 것이다. 이와 같은 변형은 첨부된 청구항의 범위 내에 속하는 것이다. 당업자는 일상적인 실험을 사용하여, 본원에 설명된 발명의 특정 구현예의 수많은 등가물을 인식할 것이고, 확인할 수 있을 것이다. 이와 같은 등가물은 다음의 청구항에 의해 포괄되는 것이다.
본 명세서에 언급된 모든 공보, 특허 및 특허 출원은, 마치 각각의 개별 공보, 특허 또는 특허 출원이 구체적이며 개별적으로 그 전체 내용이 본원에 참조로 편입되었다고 표시된 것과 동일한 수준으로, 본원에서 참조로 본 명세서에 편입되었다.
본원의 논의는 당해기술과 정면으로 부딪치는 문제점의 본질을 보다 잘 이해할 수 있게 해 주는데, 어떤 식으로든 선행 기술과 관련하여 승인으로 해석되어서는 안 되며, 본원의 임의의 참조문헌의 인용이 그와 같은 참조문헌이 본원의 "선행 기술"을 구성함의 인정으로 해석되어서도 안 된다.
본원에 인용된 특허 출원 및 공보를 비롯한 모든 참조문헌은, 마치 각각의 개별 공보 또는 특허 또는 특허 출원이 구체적이며 개별적으로 그 전체 내용이 모든 목적을 위해 참조로 편입되었다고 표시된 것과 동일한 수준으로, 그 내용 전체가 모든 목적을 위해 참조로 본원에 편입되었다. 본 발명의 많은 변형 및 수정이, 당업자에 명백하듯이, 본 발명의 취지 및 범위를 벗어나지 않으며 이루어질 수 있다. 본원에 설명된 특이적 구현예는 예로서만 제공되며, 본 발명은 첨부된 청구항에 권리가 있는 전체 범위의 등가물과 함께, 첨부된 청구항의 용어들에 의해서만 제한될 것이다.
<110> REGENXBIO Inc. <120> MICRODYSTROPHIN GENE THERAPY CONSTRUCTS AND USES THEREOF <130> 38013.0009P1 <150> 63/024,933 <151> 2020-05-14 <150> 62/941,719 <151> 2019-11-28 <160> 127 <170> PatentIn version 3.5 <210> 1 <211> 1337 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; micro dystrophin protein <400> 1 Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val 1 5 10 15 Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe 20 25 30 Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg 35 40 45 Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys 50 55 60 Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala 65 70 75 80 Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser 85 90 95 Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp 100 105 110 Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met 115 120 125 Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val 130 135 140 Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr 145 150 155 160 Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His 165 170 175 Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala 180 185 190 Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly 195 200 205 Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp 210 215 220 Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro 225 230 235 240 Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg 245 250 255 Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met 260 265 270 His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg 275 280 285 Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala 290 295 300 Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln 305 310 315 320 His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu 325 330 335 Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu 340 345 350 Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile 355 360 365 Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly 370 375 380 Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu 385 390 395 400 Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu 405 410 415 Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu 420 425 430 Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val 435 440 445 Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu 450 455 460 Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly 465 470 475 480 Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu 485 490 495 Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His 500 505 510 Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala 515 520 525 Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys 530 535 540 Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys 545 550 555 560 Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser 565 570 575 Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp 580 585 590 Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala 595 600 605 Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys 610 615 620 Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr 625 630 635 640 Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln 645 650 655 Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Gln Pro Asp Leu Ala 660 665 670 Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu 675 680 685 Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu 690 695 700 Met Pro Ser Ser Leu Met Leu Glu Val Pro Thr Leu Glu Arg Leu Gln 705 710 715 720 Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala 725 730 735 Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp 740 745 750 Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile 755 760 765 Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln 770 775 780 Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu 785 790 795 800 Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp 805 810 815 Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser 820 825 830 Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile 835 840 845 Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr 850 855 860 Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp 865 870 875 880 Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg 885 890 895 Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala 900 905 910 Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met 915 920 925 Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu 930 935 940 Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met 945 950 955 960 Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg 965 970 975 Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala 980 985 990 His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser 995 1000 1005 Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser 1010 1015 1020 Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser 1025 1030 1035 1040 Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys 1045 1050 1055 Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro 1060 1065 1070 Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu 1075 1080 1085 Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile 1090 1095 1100 Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys 1105 1110 1115 1120 Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His 1125 1130 1135 Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val 1140 1145 1150 Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr 1155 1160 1165 Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu 1170 1175 1180 Glu Gly Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro 1185 1190 1195 1200 Val Asp Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr 1205 1210 1215 His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn 1220 1225 1230 Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile 1235 1240 1245 Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln 1250 1255 1260 Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser 1265 1270 1275 1280 Leu Glu Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu 1285 1290 1295 Glu Glu Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln 1300 1305 1310 Gln His Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met 1315 1320 1325 Met Pro Thr Ser Pro Gln Ser Pro Arg 1330 1335 <210> 2 <211> 1191 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; micro dystrophin protein <400> 2 Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val 1 5 10 15 Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe 20 25 30 Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg 35 40 45 Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys 50 55 60 Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala 65 70 75 80 Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser 85 90 95 Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp 100 105 110 Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met 115 120 125 Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val 130 135 140 Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr 145 150 155 160 Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His 165 170 175 Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala 180 185 190 Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly 195 200 205 Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp 210 215 220 Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro 225 230 235 240 Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg 245 250 255 Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met 260 265 270 His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg 275 280 285 Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala 290 295 300 Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln 305 310 315 320 His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu 325 330 335 Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu 340 345 350 Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile 355 360 365 Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly 370 375 380 Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu 385 390 395 400 Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu 405 410 415 Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu 420 425 430 Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val 435 440 445 Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu 450 455 460 Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly 465 470 475 480 Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu 485 490 495 Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His 500 505 510 Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala 515 520 525 Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys 530 535 540 Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys 545 550 555 560 Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser 565 570 575 Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp 580 585 590 Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala 595 600 605 Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys 610 615 620 Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr 625 630 635 640 Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln 645 650 655 Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Gln Pro Asp Leu Ala 660 665 670 Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu 675 680 685 Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu 690 695 700 Met Pro Ser Ser Leu Met Leu Glu Val Pro Thr Leu Glu Arg Leu Gln 705 710 715 720 Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala 725 730 735 Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp 740 745 750 Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile 755 760 765 Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln 770 775 780 Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu 785 790 795 800 Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp 805 810 815 Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser 820 825 830 Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile 835 840 845 Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr 850 855 860 Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp 865 870 875 880 Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg 885 890 895 Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala 900 905 910 Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met 915 920 925 Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu 930 935 940 Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met 945 950 955 960 Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg 965 970 975 Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala 980 985 990 His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser 995 1000 1005 Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser 1010 1015 1020 Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser 1025 1030 1035 1040 Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys 1045 1050 1055 Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro 1060 1065 1070 Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu 1075 1080 1085 Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile 1090 1095 1100 Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys 1105 1110 1115 1120 Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His 1125 1130 1135 Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val 1140 1145 1150 Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr 1155 1160 1165 Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu 1170 1175 1180 Glu Gly Asp Asn Met Glu Thr 1185 1190 <210> 3 <211> 240 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 3 Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val 1 5 10 15 Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe 20 25 30 Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg 35 40 45 Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys 50 55 60 Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala 65 70 75 80 Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser 85 90 95 Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp 100 105 110 Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met 115 120 125 Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val 130 135 140 Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr 145 150 155 160 Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His 165 170 175 Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala 180 185 190 Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly 195 200 205 Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp 210 215 220 Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro 225 230 235 240 <210> 4 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 4 Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu 1 5 10 <210> 5 <211> 75 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 5 Met Leu Pro Arg Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu 1 5 10 15 His His Gln Met His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln 20 25 30 Gly Tyr Glu Arg Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala 35 40 45 Tyr Thr Gln Ala Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro 50 55 60 Phe Pro Ser Gln His Leu Glu Ala Pro Glu Asp 65 70 75 <210> 6 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 6 Lys Ser Phe Gly Ser Ser Leu Met Glu 1 5 <210> 7 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 7 Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu 1 5 10 15 Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile 20 25 30 Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly 35 40 45 Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu 50 55 60 Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu 65 70 75 80 Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu 85 90 95 Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg 100 105 110 <210> 8 <211> 109 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 8 Val Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp 1 5 10 15 Leu Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu 20 25 30 Gly Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val 35 40 45 Leu Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr 50 55 60 His Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala 65 70 75 80 Ala Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile 85 90 95 Cys Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp 100 105 <210> 9 <211> 2 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 9 Ile Leu 1 <210> 10 <211> 109 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 10 Leu Lys Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp 1 5 10 15 Leu Ser Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe 20 25 30 Lys Asp Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu 35 40 45 Lys Ala Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser 50 55 60 Leu Lys Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln 65 70 75 80 Lys Thr Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu 85 90 95 Val Gln Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln 100 105 <210> 11 <211> 47 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 11 Gln Pro Asp Leu Ala Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr 1 5 10 15 Gln Thr Val Thr Leu Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala 20 25 30 Ile Ser Lys Leu Glu Met Pro Ser Ser Leu Met Leu Glu Val Pro 35 40 45 <210> 12 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 12 Thr Leu Glu 1 <210> 13 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 13 Arg Leu Gln Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu 1 5 10 15 Arg Gln Ala Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu 20 25 30 Leu Ile Asp Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg 35 40 45 Gly Glu Ile Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu 50 55 60 Ala Arg Gln Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu 65 70 75 80 Ser Thr Leu Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala 85 90 95 Val Glu Asp Arg Val Arg Gln Leu His Glu 100 105 <210> 14 <211> 72 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 14 Ala His Arg Asp Phe Gly Pro Ala Ser Gln His Phe Leu Ser Thr Ser 1 5 10 15 Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro Asn Lys Val Pro Tyr 20 25 30 Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp Asp His Pro Lys Met 35 40 45 Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn Asn Val Arg Phe Ser 50 55 60 Ala Tyr Arg Thr Ala Met Lys Leu 65 70 <210> 15 <211> 248 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 15 Arg Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala 1 5 10 15 Ala Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro 20 25 30 Met Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg 35 40 45 Leu Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp 50 55 60 Met Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly 65 70 75 80 Arg Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys 85 90 95 Ala His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser 100 105 110 Ser Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp 115 120 125 Ser Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly 130 135 140 Ser Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn 145 150 155 160 Lys Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu 165 170 175 Pro Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala 180 185 190 Glu Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro 195 200 205 Ile Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile 210 215 220 Cys Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met 225 230 235 240 His Tyr Pro Met Val Glu Tyr Cys 245 <210> 16 <211> 194 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 16 Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu 1 5 10 15 Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met 20 25 30 Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr 35 40 45 Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala Ser 50 55 60 Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu His Tyr 65 70 75 80 Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser Tyr Leu Asn 85 90 95 Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu His Leu Leu Ile 100 105 110 Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser Pro Leu Ser Gln Pro 115 120 125 Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser Glu Glu Arg Gly 130 135 140 Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu Glu Asn Arg Asn Leu 145 150 155 160 Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His Glu His Lys Gly Leu 165 170 175 Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro Thr Ser Pro Gln Ser 180 185 190 Pro Arg <210> 17 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 17 Glu Thr Leu Glu 1 <210> 18 <211> 2 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 18 Leu Glu 1 <210> 19 <211> 44 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 19 Pro Ser Leu Thr Gln Thr Thr Val Met Glu Thr Val Thr Thr Val Thr 1 5 10 15 Thr Arg Glu Gln Ile Leu Val Lys His Ala Gln Glu Glu Leu Pro Pro 20 25 30 Pro Pro Pro Gln Lys Lys Arg Gln Ile Thr Val Asp 35 40 <210> 20 <211> 4017 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 20 atgctttggt gggaagaggt ggaagattgc tatgagaggg aagatgtgca gaagaaaacc 60 ttcaccaaat gggtcaatgc ccagttcagc aagtttggca agcagcacat tgagaacctg 120 ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc tggaaggcct gacaggccag 180 aagctgccta aagagaaggg cagcacaaga gtgcatgccc tgaacaatgt gaacaaggcc 240 ctgagagtgc tgcagaacaa caatgtggac ctggtcaata ttggcagcac agacattgtg 300 gatggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaagtg 360 aagaatgtga tgaagaacat catggctggc ctgcagcaga ccaactctga gaagatcctg 420 ctgagctggg tcagacagag caccagaaac taccctcaag tgaatgtgat caacttcacc 480 acctcttgga gtgatggact ggccctgaat gccctgatcc acagccacag acctgacctg 540 tttgactgga actctgttgt gtgccagcag tctgccacac agagactgga acatgccttc 600 aacattgcca gataccagct gggaattgag aaactgctgg accctgagga tgtggacacc 660 acctatcctg acaagaaatc catcctcatg tacatcacca gcctgttcca ggtgctgccc 720 cagcaagtgt ccattgaggc cattcaagag gttgagatgc tgcccagacc tcctaaagtg 780 accaaagagg aacacttcca gctgcaccac cagatgcact actctcagca gatcacagtg 840 tctctggccc agggatatga gagaacaagc agccccaagc ctaggttcaa gagctatgcc 900 tacacacagg ctgcctatgt gaccacatct gaccccacaa gaagcccatt tccaagccag 960 catctggaag cccctgagga caagagcttt ggcagcagcc tgatggaatc tgaagtgaac 1020 ctggatagat accagacagc cctggaagaa gtgctgtcct ggctgctgtc tgctgaggat 1080 acactgcagg ctcagggtga aatcagcaat gatgtggaag tggtcaagga ccagtttcac 1140 acccatgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg aaatatcctg 1200 cagctgggct ccaagctgat tggcacaggc aagctgtctg aggatgaaga gacagaggtg 1260 caagagcaga tgaacctgct gaacagcaga tgggagtgtc tgagagtggc cagcatggaa 1320 aagcagagca acctgcacag agtgctcatg gacctgcaga atcagaaact gaaagaactg 1380 aatgactggc tgaccaagac agaagaaagg actaggaaga tggaagagga acctctggga 1440 ccagacctgg aagatctgaa aagacaggtg cagcagcata aggtgctgca agaggacctt 1500 gagcaagagc aagtcagagt gaacagcctg acacacatgg tggtggttgt ggatgagtcc 1560 tctggggatc atgccacagc tgctctggaa gaacagctga aggtgctggg agacagatgg 1620 gccaacatct gtaggtggac agaggataga tgggtgctgc tccaggacat tctgctgaag 1680 tggcagagac tgacagagga acagtgcctg ttttctgcct ggctctctga gaaagaggat 1740 gctgtcaaca agatccatac cacaggcttc aaggatcaga atgagatgct cagctccctg 1800 cagaaactgg ctgtgctgaa ggctgacctg gaaaagaaaa agcagtccat gggcaagctc 1860 tacagcctga agcaggacct gctgtctacc ctgaagaaca agtctgtgac ccagaaaact 1920 gaggcctggc tggacaactt tgctagatgc tgggacaacc tggtgcagaa gctggaaaag 1980 tctacagccc agatcagcca gcaacctgat cttgcccctg gcctgaccac aattggagcc 2040 tctccaacac agactgtgac cctggttacc cagccagtgg tcaccaaaga gacagccatc 2100 agcaaactgg aaatgcccag ctctctgatg ctggaagtcc ccacactgga aaggctgcaa 2160 gaacttcaag aggccacaga tgagctggac ctgaagctga gacaggctga agtgatcaaa 2220 ggcagctggc agccagttgg ggacctgctc attgatagcc tgcaggacca tctggaaaaa 2280 gtgaaagccc tgaggggaga gattgcccct ctgaaagaaa atgtgtccca tgtgaatgac 2340 ctggccagac agctgaccac actgggaatc cagctgagcc cctacaacct gagcaccctt 2400 gaggacctga acaccaggtg gaagctcctc caggtggcag tggaagatag agtcaggcag 2460 ctgcatgagg cccacagaga ttttggacca gccagccagc actttctgtc tacctctgtg 2520 caaggcccct gggagagagc tatctctcct aacaaggtgc cctactacat caaccatgag 2580 acacagacca cctgttggga tcaccccaag atgacagagc tgtaccagag tctggcagac 2640 ctcaacaatg tcagattcag tgcctacagg actgccatga agctcagaag gctccagaaa 2700 gctctgtgcc tggacctgct ttccctgagt gcagcttgtg atgccctgga ccagcacaat 2760 ctgaagcaga atgaccagcc tatggacatc ctccagatca tcaactgcct caccaccatc 2820 tatgataggc tggaacaaga gcacaacaat ctggtcaatg tgcccctgtg tgtggacatg 2880 tgcctgaatt ggctgctgaa tgtgtatgac acaggcagaa caggcaggat cagagtcctg 2940 tccttcaaga caggcatcat ctccctgtgc aaagcccact tggaggacaa gtacagatac 3000 ctgttcaagc aagtggcctc cagcacaggc ttttgtgacc agagaaggct gggcctgctc 3060 ctgcatgaca gcattcagat ccctagacag ctgggagaag tggcttcctt tggaggcagc 3120 aatattgagc catcagtcag gtcctgtttt cagtttgcca acaacaagcc tgagattgag 3180 gctgccctgt tcctggactg gatgagactt gagcctcaga gcatggtctg gctgcctgtg 3240 cttcatagag tggctgctgc tgagactgcc aagcaccagg ccaagtgcaa catctgcaaa 3300 gagtgcccca tcattggctt cagatacaga tccctgaagc acttcaacta tgatatctgc 3360 cagagctgct tctttagtgg cagggttgcc aagggccaca aaatgcacta ccccatggtg 3420 gaatactgca ccccaacaac ctctggggaa gatgttagag actttgccaa ggtgctgaaa 3480 aacaagttca ggaccaagag atactttgct aagcacccca gaatgggcta cctgcctgtc 3540 cagacagtgc ttgagggtga caacatggaa acccctgtga cactgatcaa tttctggcca 3600 gtggactctg cccctgcctc aagtccacag ctgtcccatg atgacaccca cagcagaatt 3660 gagcactatg cctccagact ggcagagatg gaaaacagca atggcagcta cctgaatgat 3720 agcatcagcc ccaatgagag cattgatgat gagcatctgc tgatccagca ctactgtcag 3780 tccctgaacc aggactctcc actgagccag cctagaagcc ctgctcagat cctgatcagc 3840 cttgagtctg aggaaagggg agagctggaa agaatcctgg cagatcttga ggaagagaac 3900 agaaacctgc aggcagagta tgacaggctc aaacagcagc atgagcacaa gggactgagc 3960 cctctgcctt ctcctcctga aatgatgccc acctctccac agtctccaag gtgatga 4017 <210> 21 <211> 3573 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 21 atgctttggt gggaagaggt ggaagattgc tatgagaggg aagatgtgca gaagaaaacc 60 ttcaccaaat gggtcaatgc ccagttcagc aagtttggca agcagcacat tgagaacctg 120 ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc tggaaggcct gacaggccag 180 aagctgccta aagagaaggg cagcacaaga gtgcatgccc tgaacaatgt gaacaaggcc 240 ctgagagtgc tgcagaacaa caatgtggac ctggtcaata ttggcagcac agacattgtg 300 gatggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaagtg 360 aagaatgtga tgaagaacat catggctggc ctgcagcaga ccaactctga gaagatcctg 420 ctgagctggg tcagacagag caccagaaac taccctcaag tgaatgtgat caacttcacc 480 acctcttgga gtgatggact ggccctgaat gccctgatcc acagccacag acctgacctg 540 tttgactgga actctgttgt gtgccagcag tctgccacac agagactgga acatgccttc 600 aacattgcca gataccagct gggaattgag aaactgctgg accctgagga tgtggacacc 660 acctatcctg acaagaaatc catcctcatg tacatcacca gcctgttcca ggtgctgccc 720 cagcaagtgt ccattgaggc cattcaagag gttgagatgc tgcccagacc tcctaaagtg 780 accaaagagg aacacttcca gctgcaccac cagatgcact actctcagca gatcacagtg 840 tctctggccc agggatatga gagaacaagc agccccaagc ctaggttcaa gagctatgcc 900 tacacacagg ctgcctatgt gaccacatct gaccccacaa gaagcccatt tccaagccag 960 catctggaag cccctgagga caagagcttt ggcagcagcc tgatggaatc tgaagtgaac 1020 ctggatagat accagacagc cctggaagaa gtgctgtcct ggctgctgtc tgctgaggat 1080 acactgcagg ctcagggtga aatcagcaat gatgtggaag tggtcaagga ccagtttcac 1140 acccatgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg aaatatcctg 1200 cagctgggct ccaagctgat tggcacaggc aagctgtctg aggatgaaga gacagaggtg 1260 caagagcaga tgaacctgct gaacagcaga tgggagtgtc tgagagtggc cagcatggaa 1320 aagcagagca acctgcacag agtgctcatg gacctgcaga atcagaaact gaaagaactg 1380 aatgactggc tgaccaagac agaagaaagg actaggaaga tggaagagga acctctggga 1440 ccagacctgg aagatctgaa aagacaggtg cagcagcata aggtgctgca agaggacctt 1500 gagcaagagc aagtcagagt gaacagcctg acacacatgg tggtggttgt ggatgagtcc 1560 tctggggatc atgccacagc tgctctggaa gaacagctga aggtgctggg agacagatgg 1620 gccaacatct gtaggtggac agaggataga tgggtgctgc tccaggacat tctgctgaag 1680 tggcagagac tgacagagga acagtgcctg ttttctgcct ggctctctga gaaagaggat 1740 gctgtcaaca agatccatac cacaggcttc aaggatcaga atgagatgct cagctccctg 1800 cagaaactgg ctgtgctgaa ggctgacctg gaaaagaaaa agcagtccat gggcaagctc 1860 tacagcctga agcaggacct gctgtctacc ctgaagaaca agtctgtgac ccagaaaact 1920 gaggcctggc tggacaactt tgctagatgc tgggacaacc tggtgcagaa gctggaaaag 1980 tctacagccc agatcagcca gcaacctgat cttgcccctg gcctgaccac aattggagcc 2040 tctccaacac agactgtgac cctggttacc cagccagtgg tcaccaaaga gacagccatc 2100 agcaaactgg aaatgcccag ctctctgatg ctggaagtcc ccacactgga aaggctgcaa 2160 gaacttcaag aggccacaga tgagctggac ctgaagctga gacaggctga agtgatcaaa 2220 ggcagctggc agccagttgg ggacctgctc attgatagcc tgcaggacca tctggaaaaa 2280 gtgaaagccc tgaggggaga gattgcccct ctgaaagaaa atgtgtccca tgtgaatgac 2340 ctggccagac agctgaccac actgggaatc cagctgagcc cctacaacct gagcaccctt 2400 gaggacctga acaccaggtg gaagctcctc caggtggcag tggaagatag agtcaggcag 2460 ctgcatgagg cccacagaga ttttggacca gccagccagc actttctgtc tacctctgtg 2520 caaggcccct gggagagagc tatctctcct aacaaggtgc cctactacat caaccatgag 2580 acacagacca cctgttggga tcaccccaag atgacagagc tgtaccagag tctggcagac 2640 ctcaacaatg tcagattcag tgcctacagg actgccatga agctcagaag gctccagaaa 2700 gctctgtgcc tggacctgct ttccctgagt gcagcttgtg atgccctgga ccagcacaat 2760 ctgaagcaga atgaccagcc tatggacatc ctccagatca tcaactgcct caccaccatc 2820 tatgataggc tggaacaaga gcacaacaat ctggtcaatg tgcccctgtg tgtggacatg 2880 tgcctgaatt ggctgctgaa tgtgtatgac acaggcagaa caggcaggat cagagtcctg 2940 tccttcaaga caggcatcat ctccctgtgc aaagcccact tggaggacaa gtacagatac 3000 ctgttcaagc aagtggcctc cagcacaggc ttttgtgacc agagaaggct gggcctgctc 3060 ctgcatgaca gcattcagat ccctagacag ctgggagaag tggcttcctt tggaggcagc 3120 aatattgagc catcagtcag gtcctgtttt cagtttgcca acaacaagcc tgagattgag 3180 gctgccctgt tcctggactg gatgagactt gagcctcaga gcatggtctg gctgcctgtg 3240 cttcatagag tggctgctgc tgagactgcc aagcaccagg ccaagtgcaa catctgcaaa 3300 gagtgcccca tcattggctt cagatacaga tccctgaagc acttcaacta tgatatctgc 3360 cagagctgct tctttagtgg cagggttgcc aagggccaca aaatgcacta ccccatggtg 3420 gaatactgca ccccaacaac ctctggggaa gatgttagag actttgccaa ggtgctgaaa 3480 aacaagttca ggaccaagag atactttgct aagcacccca gaatgggcta cctgcctgtc 3540 cagacagtgc ttgagggtga caacatggaa acc 3573 <210> 22 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 22 atgctttggt gggaagaagt agaggactgt tatgaaagag aagatgttca aaagaaaaca 60 ttcacaaaat gggtaaatgc acaattttct aagtttggga agcagcatat tgagaacctc 120 ttcagtgacc tacaggatgg gaggcgcctc ctagacctcc tcgaaggcct gacagggcaa 180 aaactgccaa aagaaaaagg atccacaaga gttcatgccc tgaacaatgt caacaaggca 240 ctgcgggttt tgcagaacaa taatgttgat ttagtgaata ttggaagtac tgacatcgta 300 gatggaaatc ataaactgac tcttggtttg atttggaata taatcctcca ctggcaggtc 360 aaaaatgtaa tgaaaaatat catggctgga ttgcaacaaa ccaacagtga aaagattctc 420 ctgagctggg tccgacaatc aactcgtaat tatccacagg ttaatgtaat caacttcacc 480 accagctggt ctgatggcct ggctttgaat gctctcatcc atagtcatag gccagaccta 540 tttgactgga atagtgtggt ttgccagcag tcagccacac aacgactgga acatgcattc 600 aacatcgcca gatatcaatt aggcatagag aaactactcg atcctgaaga tgttgatacc 660 acctatccag ataagaagtc catcttaatg tacatcacat cactcttcca agttttgcct 720 720 <210> 23 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 23 caacaagtga gcattgaagc catccaggaa gtggaa 36 <210> 24 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 24 atgttgccaa ggccacctaa agtgactaaa gaagaacatt ttcagttaca tcatcaaatg 60 cactattctc aacagatcac ggtcagtcta gcacagggat atgagagaac ttcttcccct 120 aagcctcgat tcaagagcta tgcctacaca caggctgctt atgtcaccac ctctgaccct 180 acacggagcc catttccttc acagcatttg gaagctcctg aagac 225 <210> 25 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 25 aagtcatttg gcagttcatt gatggag 27 <210> 26 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 26 agtgaagtaa acctggaccg ttatcaaaca gctttagaag aagtattatc gtggcttctt 60 tctgctgagg acacattgca agcacaagga gagatttcta atgatgtgga agtggtgaaa 120 gaccagtttc atactcatga ggggtacatg atggatttga cagcccatca gggccgggtt 180 ggtaatattc tacaattggg aagtaagctg attggaacag gaaaattatc agaagatgaa 240 gaaactgaag tacaagagca gatgaatctc ctaaattcaa gatgggaatg cctcagggta 300 gctagcatgg aaaaacaaag caatttacat aga 333 <210> 27 <211> 327 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 27 gttttaatgg atctccagaa tcagaaactg aaagagttga atgactggct aacaaaaaca 60 gaagaaagaa caaggaaaat ggaggaagag cctcttggac ctgatcttga agacctaaaa 120 cgccaagtac aacaacataa ggtgcttcaa gaagatctag aacaagaaca agtcagggtc 180 aattctctca ctcacatggt ggtggtagtt gatgaatcta gtggagatca cgcaactgct 240 gctttggaag aacaacttaa ggtattggga gatcgatggg caaacatctg tagatggaca 300 gaagaccgct gggttctttt acaagac 327 <210> 28 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 28 atcctt 6 <210> 29 <211> 327 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 29 ctcaaatggc aacgtcttac tgaagaacag tgccttttta gtgcatggct ttcagaaaaa 60 gaagatgcag tgaacaagat tcacacaact ggctttaaag atcaaaatga aatgttatca 120 agtcttcaaa aactggccgt tttaaaagcg gatctagaaa agaaaaagca atccatgggc 180 aaactgtatt cactcaaaca agatcttctt tcaacactga agaataagtc agtgacccag 240 aagacggaag catggctgga taactttgcc cggtgttggg ataatttagt ccaaaaactt 300 gaaaagagta cagcacagat ttcacag 327 <210> 30 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 30 cagcctgacc tagctcctgg actgaccact attggagcct ctcctactca gactgttact 60 ctggtgacac aacctgtggt tactaaggaa actgccatct ccaaactaga aatgccatct 120 tccttgatgt tggaggtacc t 141 <210> 31 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 31 acccttgaa 9 <210> 32 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 32 agactccaac ttcaagaggc cacggatgag ctggacctca agctgcgcca agctgaggtg 60 atcaagggat cctggcagcc cgtgggcgat ctcctcattg actctctcca agatcacctc 120 gagaaagtca aggcacttcg aggagaaatt gcgcctctga aagagaacgt gagccacgtc 180 aatgaccttg ctcgccagct taccactttg ggcattcagc tctcaccgta taacctcagc 240 actctggaag acctgaacac cagatggaag cttctgcagg tggccgtcga ggaccgagtc 300 aggcagctgc atgaa 315 <210> 33 <211> 216 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 33 gcccacaggg actttggtcc agcatctcag cactttcttt ccacgtctgt ccagggtccc 60 tgggagagag ccatctcgcc aaacaaagtg ccctactata tcaaccacga gactcaaaca 120 acttgctggg accatcccaa aatgacagag ctctaccagt ctttagctga cctgaataat 180 gtcagattct cagcttatag gactgccatg aaactc 216 <210> 34 <211> 744 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 34 cgaagactgc agaaggccct ttgcttggat ctcttgagcc tgtcagctgc atgtgatgcc 60 ttggaccagc acaacctcaa gcaaaatgac cagcccatgg atatcctgca gattattaat 120 tgtttgacca ctatttatga ccgcctggag caagagcaca acaatttggt caacgtccct 180 ctctgcgtgg atatgtgtct gaactggctg ctgaatgttt atgatacggg acgaacaggg 240 aggatccgtg tcctgtcttt taaaactggc atcatttccc tgtgtaaagc acatttggaa 300 gacaagtaca gatacctttt caagcaagtg gcaagttcaa caggattttg tgaccagcgc 360 aggctgggcc tccttctgca tgattctatc caaattccaa gacagttggg tgaagttgca 420 tcctttgggg gcagtaacat tgagccaagt gtccggagct gcttccaatt tgctaataat 480 aagccagaga tcgaagcggc cctcttccta gactggatga gactggaacc ccagtccatg 540 gtgtggctgc ccgtcctgca cagagtggct gctgcagaaa ctgccaagca tcaggccaaa 600 tgtaacatct gcaaagagtg tccaatcatt ggattcaggt acaggagtct aaagcacttt 660 aattatgaca tctgccaaag ctgctttttt tctggtcgag ttgcaaaagg ccataaaatg 720 cactatccca tggtggaata ttgc 744 <210> 35 <211> 582 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 35 actccgacta catcaggaga agatgttcga gactttgcca aggtactaaa aaacaaattt 60 cgaaccaaaa ggtattttgc gaagcatccc cgaatgggct acctgccagt gcagactgtc 120 ttagaggggg acaacatgga aactcccgtt actctgatca acttctggcc agtagattct 180 gcgcctgcct cgtcccctca gctttcacac gatgatactc attcacgcat tgaacattat 240 gctagcaggc tagcagaaat ggaaaacagc aatggatctt atctaaatga tagcatctct 300 cctaatgaga gcatagatga tgaacatttg ttaatccagc attactgcca aagtttgaac 360 caggactccc ccctgagcca gcctcgtagt cctgcccaga tcttgatttc cttagagagt 420 gaggaaagag gggagctaga gagaatccta gcagatcttg aggaagaaaa caggaatctg 480 caagcagaat atgaccgtct aaagcagcag cacgaacata aaggcctgtc cccactgccg 540 tcccctcctg aaatgatgcc cacctctccc cagagtcccc gg 582 <210> 36 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 36 gagacccttg aa 12 <210> 37 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 37 cttgaa 6 <210> 38 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 38 ccatcactaa cacagacaac tgtaatggaa acagtaacta cggtgaccac aagggaacag 60 atcctggtaa agcatgctca agaggaactt ccaccaccac ctccccaaaa gaagaggcag 120 attactgtgg at 132 <210> 39 <211> 328 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; promoter <400> 39 ggccgtccgc cctcggcacc atcctcacga cacccaaata tggcgacggg tgaggaatgg 60 tggggagtta tttttagagc ggtgaggaag gtgggcaggc agcaggtgtt ggcgctctaa 120 aaataactcc cgggagttat ttttagagcg gaggaatggt ggacacccaa atatggcgac 180 ggttcctcac ccgtcgccat atttgggtgt ccgccctcgg ccggggccgc attcctgggg 240 gccgggcggt gctcccgccc gcctcgataa aaggctccgg ggccggcggc ggcccacgag 300 ctacccggag gagcgggagg cgccaagc 328 <210> 40 <211> 173 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; promoter <400> 40 aatggtggac acccaaatat ggcgacggtt cctcacccgt cgccatattt gggtgtccgc 60 cctcggccgg ggccgcattc ctgggggccg ggcggtgctc ccgcccgcct cgataaaagg 120 ctccggggcc ggcggcggcc cacgagctac ccggaggagc gggaggcgcc aag 173 <210> 41 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; intron <400> 41 gtgagtatct cagggatcca gacatgggga tatgggaggt gcctctgatc 50 <210> 42 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; poly A <400> 42 aggcctaata aagagctcag atgcatcgat cagagtgtgt tggttttttg 50 <210> 43 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 43 tgactcgaga ggcctaataa agagc 25 <210> 44 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 44 gtggagaggt gtcagaggtt cc 22 <210> 45 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 45 ggcccacgag ctacccggag 20 <210> 46 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 46 cttccagcag atccagcagc c 21 <210> 47 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 47 aagggacctt taccagtgat gtg 23 <210> 48 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 48 acttactctc gccttcctcg g 21 <210> 49 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; probe <400> 49 cagcaaagga attca 15 <210> 50 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 50 tgggcctgct cctgcatg 18 <210> 51 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 51 atctcaggct tggcaaac 18 <210> 52 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; proble <400> 52 caatattgag ccatcagtc 19 <210> 53 <211> 4734 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin cassette <400> 53 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct catatgcagg gtaatgggga tcctctagag gccgtccgcc ctcggcacca 180 tcctcacgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 240 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 300 tttagagcgg aggaatggtg gacacccaaa tatggcgacg gttcctcacc cgtcgccata 360 tttgggtgtc cgccctcggc cggggccgca ttcctggggg ccgggcggtg ctcccgcccg 420 cctcgataaa aggctccggg gccggcggcg gcccacgagc tacccggagg agcgggaggc 480 gccaagcgga attcgccacc atgctttggt gggaagaggt ggaagattgc tatgagaggg 540 aagatgtgca gaagaaaacc ttcaccaaat gggtcaatgc ccagttcagc aagtttggca 600 agcagcacat tgagaacctg ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc 660 tggaaggcct gacaggccag aagctgccta aagagaaggg cagcacaaga gtgcatgccc 720 tgaacaatgt gaacaaggcc ctgagagtgc tgcagaacaa caatgtggac ctggtcaata 780 ttggcagcac agacattgtg gatggcaacc acaagctgac cctgggcctg atctggaaca 840 tcatcctgca ctggcaagtg aagaatgtga tgaagaacat catggctggc ctgcagcaga 900 ccaactctga gaagatcctg ctgagctggg tcagacagag caccagaaac taccctcaag 960 tgaatgtgat caacttcacc acctcttgga gtgatggact ggccctgaat gccctgatcc 1020 acagccacag acctgacctg tttgactgga actctgttgt gtgccagcag tctgccacac 1080 agagactgga acatgccttc aacattgcca gataccagct gggaattgag aaactgctgg 1140 accctgagga tgtggacacc acctatcctg acaagaaatc catcctcatg tacatcacca 1200 gcctgttcca ggtgctgccc cagcaagtgt ccattgaggc cattcaagag gttgagatgc 1260 tgcccagacc tcctaaagtg accaaagagg aacacttcca gctgcaccac cagatgcact 1320 actctcagca gatcacagtg tctctggccc agggatatga gagaacaagc agccccaagc 1380 ctaggttcaa gagctatgcc tacacacagg ctgcctatgt gaccacatct gaccccacaa 1440 gaagcccatt tccaagccag catctggaag cccctgagga caagagcttt ggcagcagcc 1500 tgatggaatc tgaagtgaac ctggatagat accagacagc cctggaagaa gtgctgtcct 1560 ggctgctgtc tgctgaggat acactgcagg ctcagggtga aatcagcaat gatgtggaag 1620 tggtcaagga ccagtttcac acccatgagg gctacatgat ggacctgaca gcccaccagg 1680 gcagagtggg aaatatcctg cagctgggct ccaagctgat tggcacaggc aagctgtctg 1740 aggatgaaga gacagaggtg caagagcaga tgaacctgct gaacagcaga tgggagtgtc 1800 tgagagtggc cagcatggaa aagcagagca acctgcacag agtgctcatg gacctgcaga 1860 atcagaaact gaaagaactg aatgactggc tgaccaagac agaagaaagg actaggaaga 1920 tggaagagga acctctggga ccagacctgg aagatctgaa aagacaggtg cagcagcata 1980 aggtgctgca agaggacctt gagcaagagc aagtcagagt gaacagcctg acacacatgg 2040 tggtggttgt ggatgagtcc tctggggatc atgccacagc tgctctggaa gaacagctga 2100 aggtgctggg agacagatgg gccaacatct gtaggtggac agaggataga tgggtgctgc 2160 tccaggacat tctgctgaag tggcagagac tgacagagga acagtgcctg ttttctgcct 2220 ggctctctga gaaagaggat gctgtcaaca agatccatac cacaggcttc aaggatcaga 2280 atgagatgct cagctccctg cagaaactgg ctgtgctgaa ggctgacctg gaaaagaaaa 2340 agcagtccat gggcaagctc tacagcctga agcaggacct gctgtctacc ctgaagaaca 2400 agtctgtgac ccagaaaact gaggcctggc tggacaactt tgctagatgc tgggacaacc 2460 tggtgcagaa gctggaaaag tctacagccc agatcagcca gcaacctgat cttgcccctg 2520 gcctgaccac aattggagcc tctccaacac agactgtgac cctggttacc cagccagtgg 2580 tcaccaaaga gacagccatc agcaaactgg aaatgcccag ctctctgatg ctggaagtcc 2640 ccacactgga aaggctgcaa gaacttcaag aggccacaga tgagctggac ctgaagctga 2700 gacaggctga agtgatcaaa ggcagctggc agccagttgg ggacctgctc attgatagcc 2760 tgcaggacca tctggaaaaa gtgaaagccc tgaggggaga gattgcccct ctgaaagaaa 2820 atgtgtccca tgtgaatgac ctggccagac agctgaccac actgggaatc cagctgagcc 2880 cctacaacct gagcaccctt gaggacctga acaccaggtg gaagctcctc caggtggcag 2940 tggaagatag agtcaggcag ctgcatgagg cccacagaga ttttggacca gccagccagc 3000 actttctgtc tacctctgtg caaggcccct gggagagagc tatctctcct aacaaggtgc 3060 cctactacat caaccatgag acacagacca cctgttggga tcaccccaag atgacagagc 3120 tgtaccagag tctggcagac ctcaacaatg tcagattcag tgcctacagg actgccatga 3180 agctcagaag gctccagaaa gctctgtgcc tggacctgct ttccctgagt gcagcttgtg 3240 atgccctgga ccagcacaat ctgaagcaga atgaccagcc tatggacatc ctccagatca 3300 tcaactgcct caccaccatc tatgataggc tggaacaaga gcacaacaat ctggtcaatg 3360 tgcccctgtg tgtggacatg tgcctgaatt ggctgctgaa tgtgtatgac acaggcagaa 3420 caggcaggat cagagtcctg tccttcaaga caggcatcat ctccctgtgc aaagcccact 3480 tggaggacaa gtacagatac ctgttcaagc aagtggcctc cagcacaggc ttttgtgacc 3540 agagaaggct gggcctgctc ctgcatgaca gcattcagat ccctagacag ctgggagaag 3600 tggcttcctt tggaggcagc aatattgagc catcagtcag gtcctgtttt cagtttgcca 3660 acaacaagcc tgagattgag gctgccctgt tcctggactg gatgagactt gagcctcaga 3720 gcatggtctg gctgcctgtg cttcatagag tggctgctgc tgagactgcc aagcaccagg 3780 ccaagtgcaa catctgcaaa gagtgcccca tcattggctt cagatacaga tccctgaagc 3840 acttcaacta tgatatctgc cagagctgct tctttagtgg cagggttgcc aagggccaca 3900 aaatgcacta ccccatggtg gaatactgca ccccaacaac ctctggggaa gatgttagag 3960 actttgccaa ggtgctgaaa aacaagttca ggaccaagag atactttgct aagcacccca 4020 gaatgggcta cctgcctgtc cagacagtgc ttgagggtga caacatggaa acccctgtga 4080 cactgatcaa tttctggcca gtggactctg cccctgcctc aagtccacag ctgtcccatg 4140 atgacaccca cagcagaatt gagcactatg cctccagact ggcagagatg gaaaacagca 4200 atggcagcta cctgaatgat agcatcagcc ccaatgagag cattgatgat gagcatctgc 4260 tgatccagca ctactgtcag tccctgaacc aggactctcc actgagccag cctagaagcc 4320 ctgctcagat cctgatcagc cttgagtctg aggaaagggg agagctggaa agaatcctgg 4380 cagatcttga ggaagagaac agaaacctgc aggcagagta tgacaggctc aaacagcagc 4440 atgagcacaa gggactgagc cctctgcctt ctcctcctga aatgatgccc acctctccac 4500 agtctccaag gtgatgactc gagaggccta ataaagagct cagatgcatc gatcagagtg 4560 tgttggtttt ttgtgtgcca gggtaatggg ctagctgcgg ccgcaggaac ccctagtgat 4620 ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt 4680 cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcag 4734 <210> 54 <211> 4814 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin cassette <400> 54 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct catatgcagg gtaatgggga tcctctagag gccgtccgcc ctcggcacca 180 tcctcacgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 240 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 300 tttagagcgg aggaatggtg gacacccaaa tatggcgacg gttcctcacc cgtcgccata 360 tttgggtgtc cgccctcggc cggggccgca ttcctggggg ccgggcggtg ctcccgcccg 420 cctcgataaa aggctccggg gccggcggcg gcccacgagc tacccggagg agcgggaggc 480 gccaaggtga gtatctcagg gatccagaca tggggatatg ggaggtgcct ctgatcccag 540 ggctcactgt gggtctctct gttcacagga attcgccacc atgctttggt gggaagaggt 600 ggaagattgc tatgagaggg aagatgtgca gaagaaaacc ttcaccaaat gggtcaatgc 660 ccagttcagc aagtttggca agcagcacat tgagaacctg ttcagtgacc tgcaggatgg 720 cagaaggctg ctggatctgc tggaaggcct gacaggccag aagctgccta aagagaaggg 780 cagcacaaga gtgcatgccc tgaacaatgt gaacaaggcc ctgagagtgc tgcagaacaa 840 caatgtggac ctggtcaata ttggcagcac agacattgtg gatggcaacc acaagctgac 900 cctgggcctg atctggaaca tcatcctgca ctggcaagtg aagaatgtga tgaagaacat 960 catggctggc ctgcagcaga ccaactctga gaagatcctg ctgagctggg tcagacagag 1020 caccagaaac taccctcaag tgaatgtgat caacttcacc acctcttgga gtgatggact 1080 ggccctgaat gccctgatcc acagccacag acctgacctg tttgactgga actctgttgt 1140 gtgccagcag tctgccacac agagactgga acatgccttc aacattgcca gataccagct 1200 gggaattgag aaactgctgg accctgagga tgtggacacc acctatcctg acaagaaatc 1260 catcctcatg tacatcacca gcctgttcca ggtgctgccc cagcaagtgt ccattgaggc 1320 cattcaagag gttgagatgc tgcccagacc tcctaaagtg accaaagagg aacacttcca 1380 gctgcaccac cagatgcact actctcagca gatcacagtg tctctggccc agggatatga 1440 gagaacaagc agccccaagc ctaggttcaa gagctatgcc tacacacagg ctgcctatgt 1500 gaccacatct gaccccacaa gaagcccatt tccaagccag catctggaag cccctgagga 1560 caagagcttt ggcagcagcc tgatggaatc tgaagtgaac ctggatagat accagacagc 1620 cctggaagaa gtgctgtcct ggctgctgtc tgctgaggat acactgcagg ctcagggtga 1680 aatcagcaat gatgtggaag tggtcaagga ccagtttcac acccatgagg gctacatgat 1740 ggacctgaca gcccaccagg gcagagtggg aaatatcctg cagctgggct ccaagctgat 1800 tggcacaggc aagctgtctg aggatgaaga gacagaggtg caagagcaga tgaacctgct 1860 gaacagcaga tgggagtgtc tgagagtggc cagcatggaa aagcagagca acctgcacag 1920 agtgctcatg gacctgcaga atcagaaact gaaagaactg aatgactggc tgaccaagac 1980 agaagaaagg actaggaaga tggaagagga acctctggga ccagacctgg aagatctgaa 2040 aagacaggtg cagcagcata aggtgctgca agaggacctt gagcaagagc aagtcagagt 2100 gaacagcctg acacacatgg tggtggttgt ggatgagtcc tctggggatc atgccacagc 2160 tgctctggaa gaacagctga aggtgctggg agacagatgg gccaacatct gtaggtggac 2220 agaggataga tgggtgctgc tccaggacat tctgctgaag tggcagagac tgacagagga 2280 acagtgcctg ttttctgcct ggctctctga gaaagaggat gctgtcaaca agatccatac 2340 cacaggcttc aaggatcaga atgagatgct cagctccctg cagaaactgg ctgtgctgaa 2400 ggctgacctg gaaaagaaaa agcagtccat gggcaagctc tacagcctga agcaggacct 2460 gctgtctacc ctgaagaaca agtctgtgac ccagaaaact gaggcctggc tggacaactt 2520 tgctagatgc tgggacaacc tggtgcagaa gctggaaaag tctacagccc agatcagcca 2580 gcaacctgat cttgcccctg gcctgaccac aattggagcc tctccaacac agactgtgac 2640 cctggttacc cagccagtgg tcaccaaaga gacagccatc agcaaactgg aaatgcccag 2700 ctctctgatg ctggaagtcc ccacactgga aaggctgcaa gaacttcaag aggccacaga 2760 tgagctggac ctgaagctga gacaggctga agtgatcaaa ggcagctggc agccagttgg 2820 ggacctgctc attgatagcc tgcaggacca tctggaaaaa gtgaaagccc tgaggggaga 2880 gattgcccct ctgaaagaaa atgtgtccca tgtgaatgac ctggccagac agctgaccac 2940 actgggaatc cagctgagcc cctacaacct gagcaccctt gaggacctga acaccaggtg 3000 gaagctcctc caggtggcag tggaagatag agtcaggcag ctgcatgagg cccacagaga 3060 ttttggacca gccagccagc actttctgtc tacctctgtg caaggcccct gggagagagc 3120 tatctctcct aacaaggtgc cctactacat caaccatgag acacagacca cctgttggga 3180 tcaccccaag atgacagagc tgtaccagag tctggcagac ctcaacaatg tcagattcag 3240 tgcctacagg actgccatga agctcagaag gctccagaaa gctctgtgcc tggacctgct 3300 ttccctgagt gcagcttgtg atgccctgga ccagcacaat ctgaagcaga atgaccagcc 3360 tatggacatc ctccagatca tcaactgcct caccaccatc tatgataggc tggaacaaga 3420 gcacaacaat ctggtcaatg tgcccctgtg tgtggacatg tgcctgaatt ggctgctgaa 3480 tgtgtatgac acaggcagaa caggcaggat cagagtcctg tccttcaaga caggcatcat 3540 ctccctgtgc aaagcccact tggaggacaa gtacagatac ctgttcaagc aagtggcctc 3600 cagcacaggc ttttgtgacc agagaaggct gggcctgctc ctgcatgaca gcattcagat 3660 ccctagacag ctgggagaag tggcttcctt tggaggcagc aatattgagc catcagtcag 3720 gtcctgtttt cagtttgcca acaacaagcc tgagattgag gctgccctgt tcctggactg 3780 gatgagactt gagcctcaga gcatggtctg gctgcctgtg cttcatagag tggctgctgc 3840 tgagactgcc aagcaccagg ccaagtgcaa catctgcaaa gagtgcccca tcattggctt 3900 cagatacaga tccctgaagc acttcaacta tgatatctgc cagagctgct tctttagtgg 3960 cagggttgcc aagggccaca aaatgcacta ccccatggtg gaatactgca ccccaacaac 4020 ctctggggaa gatgttagag actttgccaa ggtgctgaaa aacaagttca ggaccaagag 4080 atactttgct aagcacccca gaatgggcta cctgcctgtc cagacagtgc ttgagggtga 4140 caacatggaa acccctgtga cactgatcaa tttctggcca gtggactctg cccctgcctc 4200 aagtccacag ctgtcccatg atgacaccca cagcagaatt gagcactatg cctccagact 4260 ggcagagatg gaaaacagca atggcagcta cctgaatgat agcatcagcc ccaatgagag 4320 cattgatgat gagcatctgc tgatccagca ctactgtcag tccctgaacc aggactctcc 4380 actgagccag cctagaagcc ctgctcagat cctgatcagc cttgagtctg aggaaagggg 4440 agagctggaa agaatcctgg cagatcttga ggaagagaac agaaacctgc aggcagagta 4500 tgacaggctc aaacagcagc atgagcacaa gggactgagc cctctgcctt ctcctcctga 4560 aatgatgccc acctctccac agtctccaag gtgatgactc gagaggccta ataaagagct 4620 cagatgcatc gatcagagtg tgttggtttt ttgtgtgcca gggtaatggg ctagctgcgg 4680 ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 4740 gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 4800 gagcgagcgc gcag 4814 <210> 55 <211> 4364 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin cassette <400> 55 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct catatgcagg gtaatgggga tcctctagag gccgtccgcc ctcggcacca 180 tcctcacgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 240 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 300 tttagagcgg aggaatggtg gacacccaaa tatggcgacg gttcctcacc cgtcgccata 360 tttgggtgtc cgccctcggc cggggccgca ttcctggggg ccgggcggtg ctcccgcccg 420 cctcgataaa aggctccggg gccggcggcg gcccacgagc tacccggagg agcgggaggc 480 gccaaggtga gtatctcagg gatccagaca tggggatatg ggaggtgcct ctgatcccag 540 ggctcactgt gggtctctct gttcacagga attcgccacc atgctttggt gggaagaggt 600 ggaagattgc tatgagaggg aagatgtgca gaagaaaacc ttcaccaaat gggtcaatgc 660 ccagttcagc aagtttggca agcagcacat tgagaacctg ttcagtgacc tgcaggatgg 720 cagaaggctg ctggatctgc tggaaggcct gacaggccag aagctgccta aagagaaggg 780 cagcacaaga gtgcatgccc tgaacaatgt gaacaaggcc ctgagagtgc tgcagaacaa 840 caatgtggac ctggtcaata ttggcagcac agacattgtg gatggcaacc acaagctgac 900 cctgggcctg atctggaaca tcatcctgca ctggcaagtg aagaatgtga tgaagaacat 960 catggctggc ctgcagcaga ccaactctga gaagatcctg ctgagctggg tcagacagag 1020 caccagaaac taccctcaag tgaatgtgat caacttcacc acctcttgga gtgatggact 1080 ggccctgaat gccctgatcc acagccacag acctgacctg tttgactgga actctgttgt 1140 gtgccagcag tctgccacac agagactgga acatgccttc aacattgcca gataccagct 1200 gggaattgag aaactgctgg accctgagga tgtggacacc acctatcctg acaagaaatc 1260 catcctcatg tacatcacca gcctgttcca ggtgctgccc cagcaagtgt ccattgaggc 1320 cattcaagag gttgagatgc tgcccagacc tcctaaagtg accaaagagg aacacttcca 1380 gctgcaccac cagatgcact actctcagca gatcacagtg tctctggccc agggatatga 1440 gagaacaagc agccccaagc ctaggttcaa gagctatgcc tacacacagg ctgcctatgt 1500 gaccacatct gaccccacaa gaagcccatt tccaagccag catctggaag cccctgagga 1560 caagagcttt ggcagcagcc tgatggaatc tgaagtgaac ctggatagat accagacagc 1620 cctggaagaa gtgctgtcct ggctgctgtc tgctgaggat acactgcagg ctcagggtga 1680 aatcagcaat gatgtggaag tggtcaagga ccagtttcac acccatgagg gctacatgat 1740 ggacctgaca gcccaccagg gcagagtggg aaatatcctg cagctgggct ccaagctgat 1800 tggcacaggc aagctgtctg aggatgaaga gacagaggtg caagagcaga tgaacctgct 1860 gaacagcaga tgggagtgtc tgagagtggc cagcatggaa aagcagagca acctgcacag 1920 agtgctcatg gacctgcaga atcagaaact gaaagaactg aatgactggc tgaccaagac 1980 agaagaaagg actaggaaga tggaagagga acctctggga ccagacctgg aagatctgaa 2040 aagacaggtg cagcagcata aggtgctgca agaggacctt gagcaagagc aagtcagagt 2100 gaacagcctg acacacatgg tggtggttgt ggatgagtcc tctggggatc atgccacagc 2160 tgctctggaa gaacagctga aggtgctggg agacagatgg gccaacatct gtaggtggac 2220 agaggataga tgggtgctgc tccaggacat tctgctgaag tggcagagac tgacagagga 2280 acagtgcctg ttttctgcct ggctctctga gaaagaggat gctgtcaaca agatccatac 2340 cacaggcttc aaggatcaga atgagatgct cagctccctg cagaaactgg ctgtgctgaa 2400 ggctgacctg gaaaagaaaa agcagtccat gggcaagctc tacagcctga agcaggacct 2460 gctgtctacc ctgaagaaca agtctgtgac ccagaaaact gaggcctggc tggacaactt 2520 tgctagatgc tgggacaacc tggtgcagaa gctggaaaag tctacagccc agatcagcca 2580 gcaacctgat cttgcccctg gcctgaccac aattggagcc tctccaacac agactgtgac 2640 cctggttacc cagccagtgg tcaccaaaga gacagccatc agcaaactgg aaatgcccag 2700 ctctctgatg ctggaagtcc ccacactgga aaggctgcaa gaacttcaag aggccacaga 2760 tgagctggac ctgaagctga gacaggctga agtgatcaaa ggcagctggc agccagttgg 2820 ggacctgctc attgatagcc tgcaggacca tctggaaaaa gtgaaagccc tgaggggaga 2880 gattgcccct ctgaaagaaa atgtgtccca tgtgaatgac ctggccagac agctgaccac 2940 actgggaatc cagctgagcc cctacaacct gagcaccctt gaggacctga acaccaggtg 3000 gaagctcctc caggtggcag tggaagatag agtcaggcag ctgcatgagg cccacagaga 3060 ttttggacca gccagccagc actttctgtc tacctctgtg caaggcccct gggagagagc 3120 tatctctcct aacaaggtgc cctactacat caaccatgag acacagacca cctgttggga 3180 tcaccccaag atgacagagc tgtaccagag tctggcagac ctcaacaatg tcagattcag 3240 tgcctacagg actgccatga agctcagaag gctccagaaa gctctgtgcc tggacctgct 3300 ttccctgagt gcagcttgtg atgccctgga ccagcacaat ctgaagcaga atgaccagcc 3360 tatggacatc ctccagatca tcaactgcct caccaccatc tatgataggc tggaacaaga 3420 gcacaacaat ctggtcaatg tgcccctgtg tgtggacatg tgcctgaatt ggctgctgaa 3480 tgtgtatgac acaggcagaa caggcaggat cagagtcctg tccttcaaga caggcatcat 3540 ctccctgtgc aaagcccact tggaggacaa gtacagatac ctgttcaagc aagtggcctc 3600 cagcacaggc ttttgtgacc agagaaggct gggcctgctc ctgcatgaca gcattcagat 3660 ccctagacag ctgggagaag tggcttcctt tggaggcagc aatattgagc catcagtcag 3720 gtcctgtttt cagtttgcca acaacaagcc tgagattgag gctgccctgt tcctggactg 3780 gatgagactt gagcctcaga gcatggtctg gctgcctgtg cttcatagag tggctgctgc 3840 tgagactgcc aagcaccagg ccaagtgcaa catctgcaaa gagtgcccca tcattggctt 3900 cagatacaga tccctgaagc acttcaacta tgatatctgc cagagctgct tctttagtgg 3960 cagggttgcc aagggccaca aaatgcacta ccccatggtg gaatactgca ccccaacaac 4020 ctctggggaa gatgttagag actttgccaa ggtgctgaaa aacaagttca ggaccaagag 4080 atactttgct aagcacccca gaatgggcta cctgcctgtc cagacagtgc ttgagggtga 4140 caacatggaa acctgatgag tcgacaggcc taataaagag ctcagatgca tcgatcagag 4200 tgtgttggtt ttttgtgtgg ctagctgcgg ccgcaggaac ccctagtgat ggagttggcc 4260 actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 4320 ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcag 4364 <210> 56 <211> 4661 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin cassette <400> 56 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct catatgcagg gtaatgggga tcctctagag aatggtggac acccaaatat 180 ggcgacggtt cctcacccgt cgccatattt gggtgtccgc cctcggccgg ggccgcattc 240 ctgggggccg ggcggtgctc ccgcccgcct cgataaaagg ctccggggcc ggcggcggcc 300 cacgagctac ccggaggagc gggaggcgcc aaggtgagta tctcagggat ccagacatgg 360 ggatatggga ggtgcctctg atcccagggc tcactgtggg tctctctgtt cacaggaatt 420 cgccaccatg ctttggtggg aagaggtgga agattgctat gagagggaag atgtgcagaa 480 gaaaaccttc accaaatggg tcaatgccca gttcagcaag tttggcaagc agcacattga 540 gaacctgttc agtgacctgc aggatggcag aaggctgctg gatctgctgg aaggcctgac 600 aggccagaag ctgcctaaag agaagggcag cacaagagtg catgccctga acaatgtgaa 660 caaggccctg agagtgctgc agaacaacaa tgtggacctg gtcaatattg gcagcacaga 720 cattgtggat ggcaaccaca agctgaccct gggcctgatc tggaacatca tcctgcactg 780 gcaagtgaag aatgtgatga agaacatcat ggctggcctg cagcagacca actctgagaa 840 gatcctgctg agctgggtca gacagagcac cagaaactac cctcaagtga atgtgatcaa 900 cttcaccacc tcttggagtg atggactggc cctgaatgcc ctgatccaca gccacagacc 960 tgacctgttt gactggaact ctgttgtgtg ccagcagtct gccacacaga gactggaaca 1020 tgccttcaac attgccagat accagctggg aattgagaaa ctgctggacc ctgaggatgt 1080 ggacaccacc tatcctgaca agaaatccat cctcatgtac atcaccagcc tgttccaggt 1140 gctgccccag caagtgtcca ttgaggccat tcaagaggtt gagatgctgc ccagacctcc 1200 taaagtgacc aaagaggaac acttccagct gcaccaccag atgcactact ctcagcagat 1260 cacagtgtct ctggcccagg gatatgagag aacaagcagc cccaagccta ggttcaagag 1320 ctatgcctac acacaggctg cctatgtgac cacatctgac cccacaagaa gcccatttcc 1380 aagccagcat ctggaagccc ctgaggacaa gagctttggc agcagcctga tggaatctga 1440 agtgaacctg gatagatacc agacagccct ggaagaagtg ctgtcctggc tgctgtctgc 1500 tgaggataca ctgcaggctc agggtgaaat cagcaatgat gtggaagtgg tcaaggacca 1560 gtttcacacc catgagggct acatgatgga cctgacagcc caccagggca gagtgggaaa 1620 tatcctgcag ctgggctcca agctgattgg cacaggcaag ctgtctgagg atgaagagac 1680 agaggtgcaa gagcagatga acctgctgaa cagcagatgg gagtgtctga gagtggccag 1740 catggaaaag cagagcaacc tgcacagagt gctcatggac ctgcagaatc agaaactgaa 1800 agaactgaat gactggctga ccaagacaga agaaaggact aggaagatgg aagaggaacc 1860 tctgggacca gacctggaag atctgaaaag acaggtgcag cagcataagg tgctgcaaga 1920 ggaccttgag caagagcaag tcagagtgaa cagcctgaca cacatggtgg tggttgtgga 1980 tgagtcctct ggggatcatg ccacagctgc tctggaagaa cagctgaagg tgctgggaga 2040 cagatgggcc aacatctgta ggtggacaga ggatagatgg gtgctgctcc aggacattct 2100 gctgaagtgg cagagactga cagaggaaca gtgcctgttt tctgcctggc tctctgagaa 2160 agaggatgct gtcaacaaga tccataccac aggcttcaag gatcagaatg agatgctcag 2220 ctccctgcag aaactggctg tgctgaaggc tgacctggaa aagaaaaagc agtccatggg 2280 caagctctac agcctgaagc aggacctgct gtctaccctg aagaacaagt ctgtgaccca 2340 gaaaactgag gcctggctgg acaactttgc tagatgctgg gacaacctgg tgcagaagct 2400 ggaaaagtct acagcccaga tcagccagca acctgatctt gcccctggcc tgaccacaat 2460 tggagcctct ccaacacaga ctgtgaccct ggttacccag ccagtggtca ccaaagagac 2520 agccatcagc aaactggaaa tgcccagctc tctgatgctg gaagtcccca cactggaaag 2580 gctgcaagaa cttcaagagg ccacagatga gctggacctg aagctgagac aggctgaagt 2640 gatcaaaggc agctggcagc cagttgggga cctgctcatt gatagcctgc aggaccatct 2700 ggaaaaagtg aaagccctga ggggagagat tgcccctctg aaagaaaatg tgtcccatgt 2760 gaatgacctg gccagacagc tgaccacact gggaatccag ctgagcccct acaacctgag 2820 cacccttgag gacctgaaca ccaggtggaa gctcctccag gtggcagtgg aagatagagt 2880 caggcagctg catgaggccc acagagattt tggaccagcc agccagcact ttctgtctac 2940 ctctgtgcaa ggcccctggg agagagctat ctctcctaac aaggtgccct actacatcaa 3000 ccatgagaca cagaccacct gttgggatca ccccaagatg acagagctgt accagagtct 3060 ggcagacctc aacaatgtca gattcagtgc ctacaggact gccatgaagc tcagaaggct 3120 ccagaaagct ctgtgcctgg acctgctttc cctgagtgca gcttgtgatg ccctggacca 3180 gcacaatctg aagcagaatg accagcctat ggacatcctc cagatcatca actgcctcac 3240 caccatctat gataggctgg aacaagagca caacaatctg gtcaatgtgc ccctgtgtgt 3300 ggacatgtgc ctgaattggc tgctgaatgt gtatgacaca ggcagaacag gcaggatcag 3360 agtcctgtcc ttcaagacag gcatcatctc cctgtgcaaa gcccacttgg aggacaagta 3420 cagatacctg ttcaagcaag tggcctccag cacaggcttt tgtgaccaga gaaggctggg 3480 cctgctcctg catgacagca ttcagatccc tagacagctg ggagaagtgg cttcctttgg 3540 aggcagcaat attgagccat cagtcaggtc ctgttttcag tttgccaaca acaagcctga 3600 gattgaggct gccctgttcc tggactggat gagacttgag cctcagagca tggtctggct 3660 gcctgtgctt catagagtgg ctgctgctga gactgccaag caccaggcca agtgcaacat 3720 ctgcaaagag tgccccatca ttggcttcag atacagatcc ctgaagcact tcaactatga 3780 tatctgccag agctgcttct ttagtggcag ggttgccaag ggccacaaaa tgcactaccc 3840 catggtggaa tactgcaccc caacaacctc tggggaagat gttagagact ttgccaaggt 3900 gctgaaaaac aagttcagga ccaagagata ctttgctaag caccccagaa tgggctacct 3960 gcctgtccag acagtgcttg agggtgacaa catggaaacc cctgtgacac tgatcaattt 4020 ctggccagtg gactctgccc ctgcctcaag tccacagctg tcccatgatg acacccacag 4080 cagaattgag cactatgcct ccagactggc agagatggaa aacagcaatg gcagctacct 4140 gaatgatagc atcagcccca atgagagcat tgatgatgag catctgctga tccagcacta 4200 ctgtcagtcc ctgaaccagg actctccact gagccagcct agaagccctg ctcagatcct 4260 gatcagcctt gagtctgagg aaaggggaga gctggaaaga atcctggcag atcttgagga 4320 agagaacaga aacctgcagg cagagtatga caggctcaaa cagcagcatg agcacaaggg 4380 actgagccct ctgccttctc ctcctgaaat gatgcccacc tctccacagt ctccaaggtg 4440 atgactcgag aggcctaata aagagctcag atgcatcgat cagagtgtgt tggttttttg 4500 tgtgccaggg taatgggcta gctgcggccg caggaacccc tagtgatgga gttggccact 4560 ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 4620 ggctttgccc gggcggcctc agtgagcgag cgagcgcgca g 4661 <210> 57 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 57 atgctttggt gggaagaggt ggaagattgc tatgagaggg aagatgtgca gaagaaaacc 60 ttcaccaaat gggtcaatgc ccagttcagc aagtttggca agcagcacat tgagaacctg 120 ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc tggaaggcct gacaggccag 180 aagctgccta aagagaaggg cagcacaaga gtgcatgccc tgaacaatgt gaacaaggcc 240 ctgagagtgc tgcagaacaa caatgtggac ctggtcaata ttggcagcac agacattgtg 300 gatggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaagtg 360 aagaatgtga tgaagaacat catggctggc ctgcagcaga ccaactctga gaagatcctg 420 ctgagctggg tcagacagag caccagaaac taccctcaag tgaatgtgat caacttcacc 480 acctcttgga gtgatggact ggccctgaat gccctgatcc acagccacag acctgacctg 540 tttgactgga actctgttgt gtgccagcag tctgccacac agagactgga acatgccttc 600 aacattgcca gataccagct gggaattgag aaactgctgg accctgagga tgtggacacc 660 acctatcctg acaagaaatc catcctcatg tacatcacca gcctgttcca ggtgctgccc 720 720 <210> 58 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 58 cagcaagtgt ccattgaggc cattcaagag gttgag 36 <210> 59 <211> 225 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 59 atgctgccca gacctcctaa agtgaccaaa gaggaacact tccagctgca ccaccagatg 60 cactactctc agcagatcac agtgtctctg gcccagggat atgagagaac aagcagcccc 120 aagcctaggt tcaagagcta tgcctacaca caggctgcct atgtgaccac atctgacccc 180 acaagaagcc catttccaag ccagcatctg gaagcccctg aggac 225 <210> 60 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 60 aagagctttg gcagcagcct gatggaa 27 <210> 61 <211> 333 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 61 tctgaagtga acctggatag ataccagaca gccctggaag aagtgctgtc ctggctgctg 60 tctgctgagg atacactgca ggctcagggt gaaatcagca atgatgtgga agtggtcaag 120 gaccagtttc acacccatga gggctacatg atggacctga cagcccacca gggcagagtg 180 ggaaatatcc tgcagctggg ctccaagctg attggcacag gcaagctgtc tgaggatgaa 240 gagacagagg tgcaagagca gatgaacctg ctgaacagca gatgggagtg tctgagagtg 300 gccagcatgg aaaagcagag caacctgcac aga 333 <210> 62 <211> 327 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 62 gtgctcatgg acctgcagaa tcagaaactg aaagaactga atgactggct gaccaagaca 60 gaagaaagga ctaggaagat ggaagaggaa cctctgggac cagacctgga agatctgaaa 120 agacaggtgc agcagcataa ggtgctgcaa gaggaccttg agcaagagca agtcagagtg 180 aacagcctga cacacatggt ggtggttgtg gatgagtcct ctggggatca tgccacagct 240 gctctggaag aacagctgaa ggtgctggga gacagatggg ccaacatctg taggtggaca 300 gaggatagat gggtgctgct ccaggac 327 <210> 63 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 63 attctg 6 <210> 64 <211> 327 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 64 ctgaagtggc agagactgac agaggaacag tgcctgtttt ctgcctggct ctctgagaaa 60 gaggatgctg tcaacaagat ccataccaca ggcttcaagg atcagaatga gatgctcagc 120 tccctgcaga aactggctgt gctgaaggct gacctggaaa agaaaaagca gtccatgggc 180 aagctctaca gcctgaagca ggacctgctg tctaccctga agaacaagtc tgtgacccag 240 aaaactgagg cctggctgga caactttgct agatgctggg acaacctggt gcagaagctg 300 gaaaagtcta cagcccagat cagccag 327 <210> 65 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 65 caacctgatc ttgcccctgg cctgaccaca attggagcct ctccaacaca gactgtgacc 60 ctggttaccc agccagtggt caccaaagag acagccatca gcaaactgga aatgcccagc 120 tctctgatgc tggaagtccc c 141 <210> 66 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 66 acactggaa 9 <210> 67 <211> 318 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 67 aggctgcaag aacttcaaga ggccacagat gagctggacc tgaagctgag acaggctgaa 60 gtgatcaaag gcagctggca gccagttggg gacctgctca ttgatagcct gcaggaccat 120 ctggaaaaag tgaaagccct gaggggagag attgcccctc tgaaagaaaa tgtgtcccat 180 gtgaatgacc tggccagaca gctgaccaca ctgggaatcc agctgagccc ctacaacctg 240 agcacccttg aggacctgaa caccaggtgg aagctcctcc aggtggcagt ggaagataga 300 gtcaggcagc tgcatgag 318 <210> 68 <211> 216 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 68 gcccacagag attttggacc agccagccag cactttctgt ctacctctgt gcaaggcccc 60 tgggagagag ctatctctcc taacaaggtg ccctactaca tcaaccatga gacacagacc 120 acctgttggg atcaccccaa gatgacagag ctgtaccaga gtctggcaga cctcaacaat 180 gtcagattca gtgcctacag gactgccatg aagctc 216 <210> 69 <211> 744 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 69 agaaggctcc agaaagctct gtgcctggac ctgctttccc tgagtgcagc ttgtgatgcc 60 ctggaccagc acaatctgaa gcagaatgac cagcctatgg acatcctcca gatcatcaac 120 tgcctcacca ccatctatga taggctggaa caagagcaca acaatctggt caatgtgccc 180 ctgtgtgtgg acatgtgcct gaattggctg ctgaatgtgt atgacacagg cagaacaggc 240 aggatcagag tcctgtcctt caagacaggc atcatctccc tgtgcaaagc ccacttggag 300 gacaagtaca gatacctgtt caagcaagtg gcctccagca caggcttttg tgaccagaga 360 aggctgggcc tgctcctgca tgacagcatt cagatcccta gacagctggg agaagtggct 420 tcctttggag gcagcaatat tgagccatca gtcaggtcct gttttcagtt tgccaacaac 480 aagcctgaga ttgaggctgc cctgttcctg gactggatga gacttgagcc tcagagcatg 540 gtctggctgc ctgtgcttca tagagtggct gctgctgaga ctgccaagca ccaggccaag 600 tgcaacatct gcaaagagtg ccccatcatt ggcttcagat acagatccct gaagcacttc 660 aactatgata tctgccagag ctgcttcttt agtggcaggg ttgccaaggg ccacaaaatg 720 cactacccca tggtggaata ctgc 744 <210> 70 <211> 588 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 70 accccaacaa cctctgggga agatgttaga gactttgcca aggtgctgaa aaacaagttc 60 aggaccaaga gatactttgc taagcacccc agaatgggct acctgcctgt ccagacagtg 120 cttgagggtg acaacatgga aacccctgtg acactgatca atttctggcc agtggactct 180 gcccctgcct caagtccaca gctgtcccat gatgacaccc acagcagaat tgagcactat 240 gcctccagac tggcagagat ggaaaacagc aatggcagct acctgaatga tagcatcagc 300 cccaatgaga gcattgatga tgagcatctg ctgatccagc actactgtca gtccctgaac 360 caggactctc cactgagcca gcctagaagc cctgctcaga tcctgatcag ccttgagtct 420 gaggaaaggg gagagctgga aagaatcctg gcagatcttg aggaagagaa cagaaacctg 480 caggcagagt atgacaggct caaacagcag catgagcaca agggactgag ccctctgcct 540 tctcctcctg aaatgatgcc cacctctcca cagtctccaa ggtgatga 588 <210> 71 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 71 gaaacactgg aa 12 <210> 72 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 72 ctggaa 6 <210> 73 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; viral peptide <400> 73 cgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc cgggcgtcgg gcgacctttg 60 gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta 120 ggggttcct 129 <210> 74 <211> 130 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; viral peptide <400> 74 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag 130 <210> 75 <211> 133 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; chimeric intron <400> 75 gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60 cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120 tttctctcca cag 133 <210> 76 <211> 97 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; intron <400> 76 gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg tgcaaatcaa 60 agaactgctc ctcagtggat gttgccttta cttctag 97 <210> 77 <211> 738 <212> PRT <213> adeno-associated virus 8 <400> 77 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 78 <211> 736 <212> PRT <213> adeno-associated virus 9 <400> 78 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 79 <211> 1283 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; dystrophin protein <400> 79 Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val 1 5 10 15 Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe 20 25 30 Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg 35 40 45 Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys 50 55 60 Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala 65 70 75 80 Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser 85 90 95 Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp 100 105 110 Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met 115 120 125 Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val 130 135 140 Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr 145 150 155 160 Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His 165 170 175 Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala 180 185 190 Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly 195 200 205 Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp 210 215 220 Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro 225 230 235 240 Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg 245 250 255 Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met 260 265 270 His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg 275 280 285 Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala 290 295 300 Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln 305 310 315 320 His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu 325 330 335 Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu 340 345 350 Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile 355 360 365 Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly 370 375 380 Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu 385 390 395 400 Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu 405 410 415 Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu 420 425 430 Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val 435 440 445 Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu 450 455 460 Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly 465 470 475 480 Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu 485 490 495 Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His 500 505 510 Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala 515 520 525 Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys 530 535 540 Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys 545 550 555 560 Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser 565 570 575 Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp 580 585 590 Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala 595 600 605 Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys 610 615 620 Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr 625 630 635 640 Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln 645 650 655 Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Gln Pro Asp Leu Ala 660 665 670 Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu 675 680 685 Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu 690 695 700 Met Pro Ser Ser Leu Met Leu Glu Val Pro Thr Leu Glu Arg Leu Gln 705 710 715 720 Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala 725 730 735 Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp 740 745 750 Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile 755 760 765 Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln 770 775 780 Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu 785 790 795 800 Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp 805 810 815 Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser 820 825 830 Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile 835 840 845 Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr 850 855 860 Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp 865 870 875 880 Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg 885 890 895 Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala 900 905 910 Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met 915 920 925 Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu 930 935 940 Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met 945 950 955 960 Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg 965 970 975 Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala 980 985 990 His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser 995 1000 1005 Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser 1010 1015 1020 Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser 1025 1030 1035 1040 Asn Ile Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys 1045 1050 1055 Pro Glu Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro 1060 1065 1070 Gln Ser Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu 1075 1080 1085 Thr Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile 1090 1095 1100 Ile Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys 1105 1110 1115 1120 Gln Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His 1125 1130 1135 Tyr Pro Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val 1140 1145 1150 Arg Asp Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr 1155 1160 1165 Phe Ala Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu 1170 1175 1180 Glu Gly Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro 1185 1190 1195 1200 Val Asp Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr 1205 1210 1215 His Ser Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn 1220 1225 1230 Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile 1235 1240 1245 Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln 1250 1255 1260 Asp Ser Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser 1265 1270 1275 1280 Leu Glu Ser <210> 80 <211> 426 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 80 accccaacaa cctctgggga agatgttaga gactttgcca aggtgctgaa aaacaagttc 60 aggaccaaga gatactttgc taagcacccc agaatgggct acctgcctgt ccagacagtg 120 cttgagggtg acaacatgga aacccctgtg acactgatca atttctggcc agtggactct 180 gcccctgcct caagtccaca gctgtcccat gatgacaccc acagcagaat tgagcactat 240 gcctccagac tggcagagat ggaaaacagc aatggcagct acctgaatga tagcatcagc 300 cccaatgaga gcattgatga tgagcatctg ctgatccagc actactgtca gtccctgaac 360 caggactctc cactgagcca gcctagaagc cctgctcaga tcctgatcag ccttgagtct 420 tgatga 426 <210> 81 <211> 3855 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 81 atgctttggt gggaagaggt ggaagattgc tatgagaggg aagatgtgca gaagaaaacc 60 ttcaccaaat gggtcaatgc ccagttcagc aagtttggca agcagcacat tgagaacctg 120 ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc tggaaggcct gacaggccag 180 aagctgccta aagagaaggg cagcacaaga gtgcatgccc tgaacaatgt gaacaaggcc 240 ctgagagtgc tgcagaacaa caatgtggac ctggtcaata ttggcagcac agacattgtg 300 gatggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaagtg 360 aagaatgtga tgaagaacat catggctggc ctgcagcaga ccaactctga gaagatcctg 420 ctgagctggg tcagacagag caccagaaac taccctcaag tgaatgtgat caacttcacc 480 acctcttgga gtgatggact ggccctgaat gccctgatcc acagccacag acctgacctg 540 tttgactgga actctgttgt gtgccagcag tctgccacac agagactgga acatgccttc 600 aacattgcca gataccagct gggaattgag aaactgctgg accctgagga tgtggacacc 660 acctatcctg acaagaaatc catcctcatg tacatcacca gcctgttcca ggtgctgccc 720 cagcaagtgt ccattgaggc cattcaagag gttgagatgc tgcccagacc tcctaaagtg 780 accaaagagg aacacttcca gctgcaccac cagatgcact actctcagca gatcacagtg 840 tctctggccc agggatatga gagaacaagc agccccaagc ctaggttcaa gagctatgcc 900 tacacacagg ctgcctatgt gaccacatct gaccccacaa gaagcccatt tccaagccag 960 catctggaag cccctgagga caagagcttt ggcagcagcc tgatggaatc tgaagtgaac 1020 ctggatagat accagacagc cctggaagaa gtgctgtcct ggctgctgtc tgctgaggat 1080 acactgcagg ctcagggtga aatcagcaat gatgtggaag tggtcaagga ccagtttcac 1140 acccatgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg aaatatcctg 1200 cagctgggct ccaagctgat tggcacaggc aagctgtctg aggatgaaga gacagaggtg 1260 caagagcaga tgaacctgct gaacagcaga tgggagtgtc tgagagtggc cagcatggaa 1320 aagcagagca acctgcacag agtgctcatg gacctgcaga atcagaaact gaaagaactg 1380 aatgactggc tgaccaagac agaagaaagg actaggaaga tggaagagga acctctggga 1440 ccagacctgg aagatctgaa aagacaggtg cagcagcata aggtgctgca agaggacctt 1500 gagcaagagc aagtcagagt gaacagcctg acacacatgg tggtggttgt ggatgagtcc 1560 tctggggatc atgccacagc tgctctggaa gaacagctga aggtgctggg agacagatgg 1620 gccaacatct gtaggtggac agaggataga tgggtgctgc tccaggacat tctgctgaag 1680 tggcagagac tgacagagga acagtgcctg ttttctgcct ggctctctga gaaagaggat 1740 gctgtcaaca agatccatac cacaggcttc aaggatcaga atgagatgct cagctccctg 1800 cagaaactgg ctgtgctgaa ggctgacctg gaaaagaaaa agcagtccat gggcaagctc 1860 tacagcctga agcaggacct gctgtctacc ctgaagaaca agtctgtgac ccagaaaact 1920 gaggcctggc tggacaactt tgctagatgc tgggacaacc tggtgcagaa gctggaaaag 1980 tctacagccc agatcagcca gcaacctgat cttgcccctg gcctgaccac aattggagcc 2040 tctccaacac agactgtgac cctggttacc cagccagtgg tcaccaaaga gacagccatc 2100 agcaaactgg aaatgcccag ctctctgatg ctggaagtcc ccacactgga aaggctgcaa 2160 gaacttcaag aggccacaga tgagctggac ctgaagctga gacaggctga agtgatcaaa 2220 ggcagctggc agccagttgg ggacctgctc attgatagcc tgcaggacca tctggaaaaa 2280 gtgaaagccc tgaggggaga gattgcccct ctgaaagaaa atgtgtccca tgtgaatgac 2340 ctggccagac agctgaccac actgggaatc cagctgagcc cctacaacct gagcaccctt 2400 gaggacctga acaccaggtg gaagctcctc caggtggcag tggaagatag agtcaggcag 2460 ctgcatgagg cccacagaga ttttggacca gccagccagc actttctgtc tacctctgtg 2520 caaggcccct gggagagagc tatctctcct aacaaggtgc cctactacat caaccatgag 2580 acacagacca cctgttggga tcaccccaag atgacagagc tgtaccagag tctggcagac 2640 ctcaacaatg tcagattcag tgcctacagg actgccatga agctcagaag gctccagaaa 2700 gctctgtgcc tggacctgct ttccctgagt gcagcttgtg atgccctgga ccagcacaat 2760 ctgaagcaga atgaccagcc tatggacatc ctccagatca tcaactgcct caccaccatc 2820 tatgataggc tggaacaaga gcacaacaat ctggtcaatg tgcccctgtg tgtggacatg 2880 tgcctgaatt ggctgctgaa tgtgtatgac acaggcagaa caggcaggat cagagtcctg 2940 tccttcaaga caggcatcat ctccctgtgc aaagcccact tggaggacaa gtacagatac 3000 ctgttcaagc aagtggcctc cagcacaggc ttttgtgacc agagaaggct gggcctgctc 3060 ctgcatgaca gcattcagat ccctagacag ctgggagaag tggcttcctt tggaggcagc 3120 aatattgagc catcagtcag gtcctgtttt cagtttgcca acaacaagcc tgagattgag 3180 gctgccctgt tcctggactg gatgagactt gagcctcaga gcatggtctg gctgcctgtg 3240 cttcatagag tggctgctgc tgagactgcc aagcaccagg ccaagtgcaa catctgcaaa 3300 gagtgcccca tcattggctt cagatacaga tccctgaagc acttcaacta tgatatctgc 3360 cagagctgct tctttagtgg cagggttgcc aagggccaca aaatgcacta ccccatggtg 3420 gaatactgca ccccaacaac ctctggggaa gatgttagag actttgccaa ggtgctgaaa 3480 aacaagttca ggaccaagag atactttgct aagcacccca gaatgggcta cctgcctgtc 3540 cagacagtgc ttgagggtga caacatggaa acccctgtga cactgatcaa tttctggcca 3600 gtggactctg cccctgcctc aagtccacag ctgtcccatg atgacaccca cagcagaatt 3660 gagcactatg cctccagact ggcagagatg gaaaacagca atggcagcta cctgaatgat 3720 agcatcagcc ccaatgagag cattgatgat gagcatctgc tgatccagca ctactgtcag 3780 tccctgaacc aggactctcc actgagccag cctagaagcc ctgctcagat cctgatcagc 3840 cttgagtctt gatga 3855 <210> 82 <211> 4560 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin cassette <400> 82 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct catatgcagg gtaatgggga tcctctagag gccgtccgcc ctcggcacca 180 tcctcacgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 240 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 300 tttagagcgg aggaatggtg gacacccaaa tatggcgacg gttcctcacc cgtcgccata 360 tttgggtgtc cgccctcggc cggggccgca ttcctggggg ccgggcggtg ctcccgcccg 420 cctcgataaa aggctccggg gccggcggcg gcccacgagc tacccggagg agcgggaggc 480 gccaagcgga attcgccacc atgctttggt gggaagaggt ggaagattgc tatgagaggg 540 aagatgtgca gaagaaaacc ttcaccaaat gggtcaatgc ccagttcagc aagtttggca 600 agcagcacat tgagaacctg ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc 660 tggaaggcct gacaggccag aagctgccta aagagaaggg cagcacaaga gtgcatgccc 720 tgaacaatgt gaacaaggcc ctgagagtgc tgcagaacaa caatgtggac ctggtcaata 780 ttggcagcac agacattgtg gatggcaacc acaagctgac cctgggcctg atctggaaca 840 tcatcctgca ctggcaagtg aagaatgtga tgaagaacat catggctggc ctgcagcaga 900 ccaactctga gaagatcctg ctgagctggg tcagacagag caccagaaac taccctcaag 960 tgaatgtgat caacttcacc acctcttgga gtgatggact ggccctgaat gccctgatcc 1020 acagccacag acctgacctg tttgactgga actctgttgt gtgccagcag tctgccacac 1080 agagactgga acatgccttc aacattgcca gataccagct gggaattgag aaactgctgg 1140 accctgagga tgtggacacc acctatcctg acaagaaatc catcctcatg tacatcacca 1200 gcctgttcca ggtgctgccc cagcaagtgt ccattgaggc cattcaagag gttgagatgc 1260 tgcccagacc tcctaaagtg accaaagagg aacacttcca gctgcaccac cagatgcact 1320 actctcagca gatcacagtg tctctggccc agggatatga gagaacaagc agccccaagc 1380 ctaggttcaa gagctatgcc tacacacagg ctgcctatgt gaccacatct gaccccacaa 1440 gaagcccatt tccaagccag catctggaag cccctgagga caagagcttt ggcagcagcc 1500 tgatggaatc tgaagtgaac ctggatagat accagacagc cctggaagaa gtgctgtcct 1560 ggctgctgtc tgctgaggat acactgcagg ctcagggtga aatcagcaat gatgtggaag 1620 tggtcaagga ccagtttcac acccatgagg gctacatgat ggacctgaca gcccaccagg 1680 gcagagtggg aaatatcctg cagctgggct ccaagctgat tggcacaggc aagctgtctg 1740 aggatgaaga gacagaggtg caagagcaga tgaacctgct gaacagcaga tgggagtgtc 1800 tgagagtggc cagcatggaa aagcagagca acctgcacag agtgctcatg gacctgcaga 1860 atcagaaact gaaagaactg aatgactggc tgaccaagac agaagaaagg actaggaaga 1920 tggaagagga acctctggga ccagacctgg aagatctgaa aagacaggtg cagcagcata 1980 aggtgctgca agaggacctt gagcaagagc aagtcagagt gaacagcctg acacacatgg 2040 tggtggttgt ggatgagtcc tctggggatc atgccacagc tgctctggaa gaacagctga 2100 aggtgctggg agacagatgg gccaacatct gtaggtggac agaggataga tgggtgctgc 2160 tccaggacat tctgctgaag tggcagagac tgacagagga acagtgcctg ttttctgcct 2220 ggctctctga gaaagaggat gctgtcaaca agatccatac cacaggcttc aaggatcaga 2280 atgagatgct cagctccctg cagaaactgg ctgtgctgaa ggctgacctg gaaaagaaaa 2340 agcagtccat gggcaagctc tacagcctga agcaggacct gctgtctacc ctgaagaaca 2400 agtctgtgac ccagaaaact gaggcctggc tggacaactt tgctagatgc tgggacaacc 2460 tggtgcagaa gctggaaaag tctacagccc agatcagcca gcaacctgat cttgcccctg 2520 gcctgaccac aattggagcc tctccaacac agactgtgac cctggttacc cagccagtgg 2580 tcaccaaaga gacagccatc agcaaactgg aaatgcccag ctctctgatg ctggaagtcc 2640 ccacactgga aaggctgcaa gaacttcaag aggccacaga tgagctggac ctgaagctga 2700 gacaggctga agtgatcaaa ggcagctggc agccagttgg ggacctgctc attgatagcc 2760 tgcaggacca tctggaaaaa gtgaaagccc tgaggggaga gattgcccct ctgaaagaaa 2820 atgtgtccca tgtgaatgac ctggccagac agctgaccac actgggaatc cagctgagcc 2880 cctacaacct gagcaccctt gaggacctga acaccaggtg gaagctcctc caggtggcag 2940 tggaagatag agtcaggcag ctgcatgagg cccacagaga ttttggacca gccagccagc 3000 actttctgtc tacctctgtg caaggcccct gggagagagc tatctctcct aacaaggtgc 3060 cctactacat caaccatgag acacagacca cctgttggga tcaccccaag atgacagagc 3120 tgtaccagag tctggcagac ctcaacaatg tcagattcag tgcctacagg actgccatga 3180 agctcagaag gctccagaaa gctctgtgcc tggacctgct ttccctgagt gcagcttgtg 3240 atgccctgga ccagcacaat ctgaagcaga atgaccagcc tatggacatc ctccagatca 3300 tcaactgcct caccaccatc tatgataggc tggaacaaga gcacaacaat ctggtcaatg 3360 tgcccctgtg tgtggacatg tgcctgaatt ggctgctgaa tgtgtatgac acaggcagaa 3420 caggcaggat cagagtcctg tccttcaaga caggcatcat ctccctgtgc aaagcccact 3480 tggaggacaa gtacagatac ctgttcaagc aagtggcctc cagcacaggc ttttgtgacc 3540 agagaaggct gggcctgctc ctgcatgaca gcattcagat ccctagacag ctgggagaag 3600 tggcttcctt tggaggcagc aatattgagc catcagtcag gtcctgtttt cagtttgcca 3660 acaacaagcc tgagattgag gctgccctgt tcctggactg gatgagactt gagcctcaga 3720 gcatggtctg gctgcctgtg cttcatagag tggctgctgc tgagactgcc aagcaccagg 3780 ccaagtgcaa catctgcaaa gagtgcccca tcattggctt cagatacaga tccctgaagc 3840 acttcaacta tgatatctgc cagagctgct tctttagtgg cagggttgcc aagggccaca 3900 aaatgcacta ccccatggtg gaatactgca ccccaacaac ctctggggaa gatgttagag 3960 actttgccaa ggtgctgaaa aacaagttca ggaccaagag atactttgct aagcacccca 4020 gaatgggcta cctgcctgtc cagacagtgc ttgagggtga caacatggaa acccctgtga 4080 cactgatcaa tttctggcca gtggactctg cccctgcctc aagtccacag ctgtcccatg 4140 atgacaccca cagcagaatt gagcactatg cctccagact ggcagagatg gaaaacagca 4200 atggcagcta cctgaatgat agcatcagcc ccaatgagag cattgatgat gagcatctgc 4260 tgatccagca ctactgtcag tccctgaacc aggactctcc actgagccag cctagaagcc 4320 ctgctcagat cctgatcagc cttgagtctt gatgagtcga caggcctaat aaagagctca 4380 gatgcatcga tcagagtgtg ttggtttttt gtgtggctag ctgcggccgc aggaacccct 4440 agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc 4500 aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4560 4560 <210> 83 <211> 140 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 83 Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp Phe Ala Lys Val Leu 1 5 10 15 Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala Lys His Pro Arg Met 20 25 30 Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly Asp Asn Met Glu Thr 35 40 45 Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp Ser Ala Pro Ala Ser 50 55 60 Ser Pro Gln Leu Ser His Asp Asp Thr His Ser Arg Ile Glu His Tyr 65 70 75 80 Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn Gly Ser Tyr Leu Asn 85 90 95 Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp Glu His Leu Leu Ile 100 105 110 Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser Pro Leu Ser Gln Pro 115 120 125 Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu Ser 130 135 140 <210> 84 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; minimal alpha-syntrophin binding site <400> 84 Met Glu Asn Ser Asn Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn 1 5 10 15 Glu Ser Ile Asp Asp Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser 20 25 30 Leu Asn Gln 35 <210> 85 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; capsid sequence <400> 85 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Ser Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala 580 585 590 Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 86 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 86 Glu Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val 1 5 10 15 Ser Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu 20 25 30 Cys Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys 35 40 45 Asn Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile 50 55 60 His Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg 65 70 75 80 Val Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys 85 90 95 Val Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg 100 105 110 <210> 87 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 87 Glu Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp 1 5 10 15 Leu Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn 20 25 30 Trp Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly 35 40 45 Ile Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu 50 55 60 Glu Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu 65 70 75 80 Lys Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu 85 90 95 Ser Asp Arg Lys Lys Arg Leu Glu Glu 100 105 <210> 88 <211> 216 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; microdystrophin segment <400> 88 Ile Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser 1 5 10 15 Gln Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys 20 25 30 Ala Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn 35 40 45 Ile Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His 50 55 60 Ser Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val 65 70 75 80 Lys Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val 85 90 95 Asn Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val Glu 100 105 110 Lys Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp Leu 115 120 125 Thr Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp 130 135 140 Glu His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile 145 150 155 160 Gly Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu Glu 165 170 175 Ile Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys 180 185 190 Leu Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser 195 200 205 Asp Arg Lys Lys Arg Leu Glu Glu 210 215 <210> 89 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 89 Gln Thr Leu Glu 1 <210> 90 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 90 Ala Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile 1 5 10 15 Gly Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln 20 25 30 Ser Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr 35 40 45 Pro Met Val Glu Tyr Cys 50 <210> 91 <211> 1287 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 91 Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val 1 5 10 15 Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe 20 25 30 Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg 35 40 45 Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys 50 55 60 Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala 65 70 75 80 Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser 85 90 95 Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp 100 105 110 Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met 115 120 125 Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val 130 135 140 Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr 145 150 155 160 Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His 165 170 175 Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala 180 185 190 Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly 195 200 205 Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp 210 215 220 Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro 225 230 235 240 Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg 245 250 255 Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met 260 265 270 His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg 275 280 285 Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala 290 295 300 Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln 305 310 315 320 His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu 325 330 335 Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu 340 345 350 Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile 355 360 365 Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly 370 375 380 Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu 385 390 395 400 Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu 405 410 415 Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu 420 425 430 Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val 435 440 445 Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu 450 455 460 Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly 465 470 475 480 Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu 485 490 495 Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His 500 505 510 Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala 515 520 525 Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys 530 535 540 Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Leu Lys 545 550 555 560 Trp Gln Arg Leu Thr Glu Glu Gln Cys Leu Phe Ser Ala Trp Leu Ser 565 570 575 Glu Lys Glu Asp Ala Val Asn Lys Ile His Thr Thr Gly Phe Lys Asp 580 585 590 Gln Asn Glu Met Leu Ser Ser Leu Gln Lys Leu Ala Val Leu Lys Ala 595 600 605 Asp Leu Glu Lys Lys Lys Gln Ser Met Gly Lys Leu Tyr Ser Leu Lys 610 615 620 Gln Asp Leu Leu Ser Thr Leu Lys Asn Lys Ser Val Thr Gln Lys Thr 625 630 635 640 Glu Ala Trp Leu Asp Asn Phe Ala Arg Cys Trp Asp Asn Leu Val Gln 645 650 655 Lys Leu Glu Lys Ser Thr Ala Gln Ile Ser Gln Gln Pro Asp Leu Ala 660 665 670 Pro Gly Leu Thr Thr Ile Gly Ala Ser Pro Thr Gln Thr Val Thr Leu 675 680 685 Val Thr Gln Pro Val Val Thr Lys Glu Thr Ala Ile Ser Lys Leu Glu 690 695 700 Met Pro Ser Ser Leu Met Leu Glu Val Pro Thr Leu Glu Arg Leu Gln 705 710 715 720 Glu Leu Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala 725 730 735 Glu Val Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp 740 745 750 Ser Leu Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile 755 760 765 Ala Pro Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln 770 775 780 Leu Thr Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu 785 790 795 800 Glu Asp Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp 805 810 815 Arg Val Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser 820 825 830 Gln His Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile 835 840 845 Ser Pro Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr 850 855 860 Cys Trp Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp 865 870 875 880 Leu Asn Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg 885 890 895 Arg Leu Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala 900 905 910 Cys Asp Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met 915 920 925 Asp Ile Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu 930 935 940 Glu Gln Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met 945 950 955 960 Cys Leu Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg 965 970 975 Ile Arg Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala 980 985 990 His Leu Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser 995 1000 1005 Thr Gly Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser 1010 1015 1020 Ile Gln Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ala 1025 1030 1035 1040 Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly 1045 1050 1055 Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser 1060 1065 1070 Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro 1075 1080 1085 Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp 1090 1095 1100 Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala 1105 1110 1115 1120 Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly 1125 1130 1135 Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp 1140 1145 1150 Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser 1155 1160 1165 Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn 1170 1175 1180 Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp 1185 1190 1195 1200 Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser 1205 1210 1215 Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu 1220 1225 1230 Ser Glu Glu Arg Gly Glu Leu Glu Arg Ile Leu Ala Asp Leu Glu Glu 1235 1240 1245 Glu Asn Arg Asn Leu Gln Ala Glu Tyr Asp Arg Leu Lys Gln Gln His 1250 1255 1260 Glu His Lys Gly Leu Ser Pro Leu Pro Ser Pro Pro Glu Met Met Pro 1265 1270 1275 1280 Thr Ser Pro Gln Ser Pro Arg 1285 <210> 92 <211> 1345 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 92 Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val 1 5 10 15 Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe 20 25 30 Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg 35 40 45 Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys 50 55 60 Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala 65 70 75 80 Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser 85 90 95 Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp 100 105 110 Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met 115 120 125 Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val 130 135 140 Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr 145 150 155 160 Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His 165 170 175 Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala 180 185 190 Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly 195 200 205 Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp 210 215 220 Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro 225 230 235 240 Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg 245 250 255 Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met 260 265 270 His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg 275 280 285 Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala 290 295 300 Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln 305 310 315 320 His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu 325 330 335 Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu 340 345 350 Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile 355 360 365 Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly 370 375 380 Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu 385 390 395 400 Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu 405 410 415 Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu 420 425 430 Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val 435 440 445 Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu 450 455 460 Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly 465 470 475 480 Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu 485 490 495 Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His 500 505 510 Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala 515 520 525 Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys 530 535 540 Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Glu Ile 545 550 555 560 Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln 565 570 575 Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala 580 585 590 Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile 595 600 605 Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser 610 615 620 Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys 625 630 635 640 Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn 645 650 655 Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val Glu Lys 660 665 670 Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp Leu Thr 675 680 685 Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp Glu 690 695 700 His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile Gly 705 710 715 720 Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu Glu Ile 725 730 735 Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys Leu 740 745 750 Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser Asp 755 760 765 Arg Lys Lys Arg Leu Glu Glu Gln Thr Leu Glu Arg Leu Gln Glu Leu 770 775 780 Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val 785 790 795 800 Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu 805 810 815 Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro 820 825 830 Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr 835 840 845 Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp 850 855 860 Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val 865 870 875 880 Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His 885 890 895 Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro 900 905 910 Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp 915 920 925 Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn 930 935 940 Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu 945 950 955 960 Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp 965 970 975 Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile 980 985 990 Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln 995 1000 1005 Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu 1010 1015 1020 Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg 1025 1030 1035 1040 Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu 1045 1050 1055 Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly 1060 1065 1070 Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln 1075 1080 1085 Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile 1090 1095 1100 Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu 1105 1110 1115 1120 Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser 1125 1130 1135 Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala 1140 1145 1150 Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly 1155 1160 1165 Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser 1170 1175 1180 Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro 1185 1190 1195 1200 Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp 1205 1210 1215 Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala 1220 1225 1230 Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly 1235 1240 1245 Asp Asn Met Glu Thr Pro Val Thr Leu Ile Asn Phe Trp Pro Val Asp 1250 1255 1260 Ser Ala Pro Ala Ser Ser Pro Gln Leu Ser His Asp Asp Thr His Ser 1265 1270 1275 1280 Arg Ile Glu His Tyr Ala Ser Arg Leu Ala Glu Met Glu Asn Ser Asn 1285 1290 1295 Gly Ser Tyr Leu Asn Asp Ser Ile Ser Pro Asn Glu Ser Ile Asp Asp 1300 1305 1310 Glu His Leu Leu Ile Gln His Tyr Cys Gln Ser Leu Asn Gln Asp Ser 1315 1320 1325 Pro Leu Ser Gln Pro Arg Ser Pro Ala Gln Ile Leu Ile Ser Leu Glu 1330 1335 1340 Ser 134 <210> 93 <211> 1253 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 93 Met Leu Trp Trp Glu Glu Val Glu Asp Cys Tyr Glu Arg Glu Asp Val 1 5 10 15 Gln Lys Lys Thr Phe Thr Lys Trp Val Asn Ala Gln Phe Ser Lys Phe 20 25 30 Gly Lys Gln His Ile Glu Asn Leu Phe Ser Asp Leu Gln Asp Gly Arg 35 40 45 Arg Leu Leu Asp Leu Leu Glu Gly Leu Thr Gly Gln Lys Leu Pro Lys 50 55 60 Glu Lys Gly Ser Thr Arg Val His Ala Leu Asn Asn Val Asn Lys Ala 65 70 75 80 Leu Arg Val Leu Gln Asn Asn Asn Val Asp Leu Val Asn Ile Gly Ser 85 90 95 Thr Asp Ile Val Asp Gly Asn His Lys Leu Thr Leu Gly Leu Ile Trp 100 105 110 Asn Ile Ile Leu His Trp Gln Val Lys Asn Val Met Lys Asn Ile Met 115 120 125 Ala Gly Leu Gln Gln Thr Asn Ser Glu Lys Ile Leu Leu Ser Trp Val 130 135 140 Arg Gln Ser Thr Arg Asn Tyr Pro Gln Val Asn Val Ile Asn Phe Thr 145 150 155 160 Thr Ser Trp Ser Asp Gly Leu Ala Leu Asn Ala Leu Ile His Ser His 165 170 175 Arg Pro Asp Leu Phe Asp Trp Asn Ser Val Val Cys Gln Gln Ser Ala 180 185 190 Thr Gln Arg Leu Glu His Ala Phe Asn Ile Ala Arg Tyr Gln Leu Gly 195 200 205 Ile Glu Lys Leu Leu Asp Pro Glu Asp Val Asp Thr Thr Tyr Pro Asp 210 215 220 Lys Lys Ser Ile Leu Met Tyr Ile Thr Ser Leu Phe Gln Val Leu Pro 225 230 235 240 Gln Gln Val Ser Ile Glu Ala Ile Gln Glu Val Glu Met Leu Pro Arg 245 250 255 Pro Pro Lys Val Thr Lys Glu Glu His Phe Gln Leu His His Gln Met 260 265 270 His Tyr Ser Gln Gln Ile Thr Val Ser Leu Ala Gln Gly Tyr Glu Arg 275 280 285 Thr Ser Ser Pro Lys Pro Arg Phe Lys Ser Tyr Ala Tyr Thr Gln Ala 290 295 300 Ala Tyr Val Thr Thr Ser Asp Pro Thr Arg Ser Pro Phe Pro Ser Gln 305 310 315 320 His Leu Glu Ala Pro Glu Asp Lys Ser Phe Gly Ser Ser Leu Met Glu 325 330 335 Ser Glu Val Asn Leu Asp Arg Tyr Gln Thr Ala Leu Glu Glu Val Leu 340 345 350 Ser Trp Leu Leu Ser Ala Glu Asp Thr Leu Gln Ala Gln Gly Glu Ile 355 360 365 Ser Asn Asp Val Glu Val Val Lys Asp Gln Phe His Thr His Glu Gly 370 375 380 Tyr Met Met Asp Leu Thr Ala His Gln Gly Arg Val Gly Asn Ile Leu 385 390 395 400 Gln Leu Gly Ser Lys Leu Ile Gly Thr Gly Lys Leu Ser Glu Asp Glu 405 410 415 Glu Thr Glu Val Gln Glu Gln Met Asn Leu Leu Asn Ser Arg Trp Glu 420 425 430 Cys Leu Arg Val Ala Ser Met Glu Lys Gln Ser Asn Leu His Arg Val 435 440 445 Leu Met Asp Leu Gln Asn Gln Lys Leu Lys Glu Leu Asn Asp Trp Leu 450 455 460 Thr Lys Thr Glu Glu Arg Thr Arg Lys Met Glu Glu Glu Pro Leu Gly 465 470 475 480 Pro Asp Leu Glu Asp Leu Lys Arg Gln Val Gln Gln His Lys Val Leu 485 490 495 Gln Glu Asp Leu Glu Gln Glu Gln Val Arg Val Asn Ser Leu Thr His 500 505 510 Met Val Val Val Val Asp Glu Ser Ser Gly Asp His Ala Thr Ala Ala 515 520 525 Leu Glu Glu Gln Leu Lys Val Leu Gly Asp Arg Trp Ala Asn Ile Cys 530 535 540 Arg Trp Thr Glu Asp Arg Trp Val Leu Leu Gln Asp Ile Leu Glu Ile 545 550 555 560 Ser Tyr Val Pro Ser Thr Tyr Leu Thr Glu Ile Thr His Val Ser Gln 565 570 575 Ala Leu Leu Glu Val Glu Gln Leu Leu Asn Ala Pro Asp Leu Cys Ala 580 585 590 Lys Asp Phe Glu Asp Leu Phe Lys Gln Glu Glu Ser Leu Lys Asn Ile 595 600 605 Lys Asp Ser Leu Gln Gln Ser Ser Gly Arg Ile Asp Ile Ile His Ser 610 615 620 Lys Lys Thr Ala Ala Leu Gln Ser Ala Thr Pro Val Glu Arg Val Lys 625 630 635 640 Leu Gln Glu Ala Leu Ser Gln Leu Asp Phe Gln Trp Glu Lys Val Asn 645 650 655 Lys Met Tyr Lys Asp Arg Gln Gly Arg Phe Asp Arg Ser Val Glu Lys 660 665 670 Trp Arg Arg Phe His Tyr Asp Ile Lys Ile Phe Asn Gln Trp Leu Thr 675 680 685 Glu Ala Glu Gln Phe Leu Arg Lys Thr Gln Ile Pro Glu Asn Trp Glu 690 695 700 His Ala Lys Tyr Lys Trp Tyr Leu Lys Glu Leu Gln Asp Gly Ile Gly 705 710 715 720 Gln Arg Gln Thr Val Val Arg Thr Leu Asn Ala Thr Gly Glu Glu Ile 725 730 735 Ile Gln Gln Ser Ser Lys Thr Asp Ala Ser Ile Leu Gln Glu Lys Leu 740 745 750 Gly Ser Leu Asn Leu Arg Trp Gln Glu Val Cys Lys Gln Leu Ser Asp 755 760 765 Arg Lys Lys Arg Leu Glu Glu Gln Thr Leu Glu Arg Leu Gln Glu Leu 770 775 780 Gln Glu Ala Thr Asp Glu Leu Asp Leu Lys Leu Arg Gln Ala Glu Val 785 790 795 800 Ile Lys Gly Ser Trp Gln Pro Val Gly Asp Leu Leu Ile Asp Ser Leu 805 810 815 Gln Asp His Leu Glu Lys Val Lys Ala Leu Arg Gly Glu Ile Ala Pro 820 825 830 Leu Lys Glu Asn Val Ser His Val Asn Asp Leu Ala Arg Gln Leu Thr 835 840 845 Thr Leu Gly Ile Gln Leu Ser Pro Tyr Asn Leu Ser Thr Leu Glu Asp 850 855 860 Leu Asn Thr Arg Trp Lys Leu Leu Gln Val Ala Val Glu Asp Arg Val 865 870 875 880 Arg Gln Leu His Glu Ala His Arg Asp Phe Gly Pro Ala Ser Gln His 885 890 895 Phe Leu Ser Thr Ser Val Gln Gly Pro Trp Glu Arg Ala Ile Ser Pro 900 905 910 Asn Lys Val Pro Tyr Tyr Ile Asn His Glu Thr Gln Thr Thr Cys Trp 915 920 925 Asp His Pro Lys Met Thr Glu Leu Tyr Gln Ser Leu Ala Asp Leu Asn 930 935 940 Asn Val Arg Phe Ser Ala Tyr Arg Thr Ala Met Lys Leu Arg Arg Leu 945 950 955 960 Gln Lys Ala Leu Cys Leu Asp Leu Leu Ser Leu Ser Ala Ala Cys Asp 965 970 975 Ala Leu Asp Gln His Asn Leu Lys Gln Asn Asp Gln Pro Met Asp Ile 980 985 990 Leu Gln Ile Ile Asn Cys Leu Thr Thr Ile Tyr Asp Arg Leu Glu Gln 995 1000 1005 Glu His Asn Asn Leu Val Asn Val Pro Leu Cys Val Asp Met Cys Leu 1010 1015 1020 Asn Trp Leu Leu Asn Val Tyr Asp Thr Gly Arg Thr Gly Arg Ile Arg 1025 1030 1035 1040 Val Leu Ser Phe Lys Thr Gly Ile Ile Ser Leu Cys Lys Ala His Leu 1045 1050 1055 Glu Asp Lys Tyr Arg Tyr Leu Phe Lys Gln Val Ala Ser Ser Thr Gly 1060 1065 1070 Phe Cys Asp Gln Arg Arg Leu Gly Leu Leu Leu His Asp Ser Ile Gln 1075 1080 1085 Ile Pro Arg Gln Leu Gly Glu Val Ala Ser Phe Gly Gly Ser Asn Ile 1090 1095 1100 Glu Pro Ser Val Arg Ser Cys Phe Gln Phe Ala Asn Asn Lys Pro Glu 1105 1110 1115 1120 Ile Glu Ala Ala Leu Phe Leu Asp Trp Met Arg Leu Glu Pro Gln Ser 1125 1130 1135 Met Val Trp Leu Pro Val Leu His Arg Val Ala Ala Ala Glu Thr Ala 1140 1145 1150 Lys His Gln Ala Lys Cys Asn Ile Cys Lys Glu Cys Pro Ile Ile Gly 1155 1160 1165 Phe Arg Tyr Arg Ser Leu Lys His Phe Asn Tyr Asp Ile Cys Gln Ser 1170 1175 1180 Cys Phe Phe Ser Gly Arg Val Ala Lys Gly His Lys Met His Tyr Pro 1185 1190 1195 1200 Met Val Glu Tyr Cys Thr Pro Thr Thr Ser Gly Glu Asp Val Arg Asp 1205 1210 1215 Phe Ala Lys Val Leu Lys Asn Lys Phe Arg Thr Lys Arg Tyr Phe Ala 1220 1225 1230 Lys His Pro Arg Met Gly Tyr Leu Pro Val Gln Thr Val Leu Glu Gly 1235 1240 1245 Asp Asn Met Glu Thr 1250 <210> 94 <211> 330 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 94 gaaatttctt atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta 60 ttagaagtgg aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc 120 tttaagcaag aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg 180 attgacatta ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg 240 gtgaagctac aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg 300 tacaaggacc gacaagggcg atttgacaga 330 <210> 95 <211> 312 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 95 gagaaatggc ggcgttttca ttatgatata aagatattta atcagtggct aacagaagct 60 gaacagtttc tcagaaagac acaaattcct gagaattggg aacatgctaa atacaaatgg 120 tatcttaagg aactccagga tggcattggg cagcggcaaa ctgttgtcag aacattgaat 180 gcaactgggg aagaaataat tcagcaatcc tcaaaaacag atgccagtat tctacaggaa 240 aaattgggaa gcctgaatct gcggtggcag gaggtctgca aacagctgtc agacagaaaa 300 aagaggctag aa 312 <210> 96 <211> 648 <212> DNA <213> Artificial Sequence <220> <223> synthetic ocnstruct; dystrophin segment <400> 96 gaaatttctt atgtgccttc tacttatttg actgaaatca ctcatgtctc acaagcccta 60 ttagaagtgg aacaacttct caatgctcct gacctctgtg ctaaggactt tgaagatctc 120 tttaagcaag aggagtctct gaagaatata aaagatagtc tacaacaaag ctcaggtcgg 180 attgacatta ttcatagcaa gaagacagca gcattgcaaa gtgcaacgcc tgtggaaagg 240 gtgaagctac aggaagctct ctcccagctt gatttccaat gggaaaaagt taacaaaatg 300 tacaaggacc gacaagggcg atttgacaga tctgttgaga aatggcggcg ttttcattat 360 gatataaaga tatttaatca gtggctaaca gaagctgaac agtttctcag aaagacacaa 420 attcctgaga attgggaaca tgctaaatac aaatggtatc ttaaggaact ccaggatggc 480 attgggcagc ggcaaactgt tgtcagaaca ttgaatgcaa ctggggaaga aataattcag 540 caatcctcaa aaacagatgc cagtattcta caggaaaaat tgggaagcct gaatctgcgg 600 tggcaggagg tctgcaaaca gctgtcagac agaaaaaaga ggctagaa 648 <210> 97 <211> 330 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 97 gagatcagct atgtgcccag cacctacctg acagagatca cccatgtgtc tcaggccctg 60 ctggaagtgg aacagctgct gaatgcccct gacctgtgtg ccaaggactt tgaggacctg 120 ttcaagcaag aggaaagcct gaagaacatc aaggacagcc tgcagcagtc ctctggcaga 180 attgacatca tccacagcaa gaaaacagct gccctgcagt ctgccacacc tgtggaaaga 240 gtgaagctgc aagaggccct gagccagctg gacttccagt gggagaaagt gaacaagatg 300 tacaaggaca ggcagggcag atttgataga 330 <210> 98 <211> 315 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 98 gaaaagtgga gaaggttcca ctatgacatc aagatcttca accagtggct gacagaggct 60 gagcagttcc tgagaaagac acagatccct gagaactggg agcatgccaa gtacaagtgg 120 tatctgaaag aactgcagga tggcattggc cagagacaga cagttgtcag aaccctgaat 180 gccacagggg aagagatcat ccagcagagc agcaagacag atgccagcat cctgcaagag 240 aagctgggca gcctgaacct gagatggcaa gaagtgtgca agcagctgtc tgacagaaag 300 aagaggctgg aagaa 315 <210> 99 <211> 651 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 99 gagatcagct atgtgcccag cacctacctg acagagatca cccatgtgtc tcaggccctg 60 ctggaagtgg aacagctgct gaatgcccct gacctgtgtg ccaaggactt tgaggacctg 120 ttcaagcaag aggaaagcct gaagaacatc aaggacagcc tgcagcagtc ctctggcaga 180 attgacatca tccacagcaa gaaaacagct gccctgcagt ctgccacacc tgtggaaaga 240 gtgaagctgc aagaggccct gagccagctg gacttccagt gggagaaagt gaacaagatg 300 tacaaggaca ggcagggcag atttgataga agtgtggaaa agtggagaag gttccactat 360 gacatcaaga tcttcaacca gtggctgaca gaggctgagc agttcctgag aaagacacag 420 atccctgaga actgggagca tgccaagtac aagtggtatc tgaaagaact gcaggatggc 480 attggccaga gacagacagt tgtcagaacc ctgaatgcca caggggaaga gatcatccag 540 cagagcagca agacagatgc cagcatcctg caagagaagc tgggcagcct gaacctgaga 600 tggcaagaag tgtgcaagca gctgtctgac agaaagaaga ggctggaaga a 651 <210> 100 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 100 gccaagcacc aggccaagtg caacatctgc aaagagtgcc ccatcattgg cttcagatac 60 agatccctga agcacttcaa ctatgatatc tgccagagct gcttctttag tggcagggtt 120 gccaagggcc acaaaatgca ctaccccatg gtggaatact gc 162 <210> 101 <211> 3867 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 101 atgctttggt gggaagaggt ggaagattgc tatgagaggg aagatgtgca gaagaaaacc 60 ttcaccaaat gggtcaatgc ccagttcagc aagtttggca agcagcacat tgagaacctg 120 ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc tggaaggcct gacaggccag 180 aagctgccta aagagaaggg cagcacaaga gtgcatgccc tgaacaatgt gaacaaggcc 240 ctgagagtgc tgcagaacaa caatgtggac ctggtcaata ttggcagcac agacattgtg 300 gatggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaagtg 360 aagaatgtga tgaagaacat catggctggc ctgcagcaga ccaactctga gaagatcctg 420 ctgagctggg tcagacagag caccagaaac taccctcaag tgaatgtgat caacttcacc 480 acctcttgga gtgatggact ggccctgaat gccctgatcc acagccacag acctgacctg 540 tttgactgga actctgttgt gtgccagcag tctgccacac agagactgga acatgccttc 600 aacattgcca gataccagct gggaattgag aaactgctgg accctgagga tgtggacacc 660 acctatcctg acaagaaatc catcctcatg tacatcacca gcctgttcca ggtgctgccc 720 cagcaagtgt ccattgaggc cattcaagag gttgagatgc tgcccagacc tcctaaagtg 780 accaaagagg aacacttcca gctgcaccac cagatgcact actctcagca gatcacagtg 840 tctctggccc agggatatga gagaacaagc agccccaagc ctaggttcaa gagctatgcc 900 tacacacagg ctgcctatgt gaccacatct gaccccacaa gaagcccatt tccaagccag 960 catctggaag cccctgagga caagagcttt ggcagcagcc tgatggaatc tgaagtgaac 1020 ctggatagat accagacagc cctggaagaa gtgctgtcct ggctgctgtc tgctgaggat 1080 acactgcagg ctcagggtga aatcagcaat gatgtggaag tggtcaagga ccagtttcac 1140 acccatgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg aaatatcctg 1200 cagctgggct ccaagctgat tggcacaggc aagctgtctg aggatgaaga gacagaggtg 1260 caagagcaga tgaacctgct gaacagcaga tgggagtgtc tgagagtggc cagcatggaa 1320 aagcagagca acctgcacag agtgctcatg gacctgcaga atcagaaact gaaagaactg 1380 aatgactggc tgaccaagac agaagaaagg actaggaaga tggaagagga acctctggga 1440 ccagacctgg aagatctgaa aagacaggtg cagcagcata aggtgctgca agaggacctt 1500 gagcaagagc aagtcagagt gaacagcctg acacacatgg tggtggttgt ggatgagtcc 1560 tctggggatc atgccacagc tgctctggaa gaacagctga aggtgctggg agacagatgg 1620 gccaacatct gtaggtggac agaggataga tgggtgctgc tccaggacat tctgctgaag 1680 tggcagagac tgacagagga acagtgcctg ttttctgcct ggctctctga gaaagaggat 1740 gctgtcaaca agatccatac cacaggcttc aaggatcaga atgagatgct cagctccctg 1800 cagaaactgg ctgtgctgaa ggctgacctg gaaaagaaaa agcagtccat gggcaagctc 1860 tacagcctga agcaggacct gctgtctacc ctgaagaaca agtctgtgac ccagaaaact 1920 gaggcctggc tggacaactt tgctagatgc tgggacaacc tggtgcagaa gctggaaaag 1980 tctacagccc agatcagcca gcaacctgat cttgcccctg gcctgaccac aattggagcc 2040 tctccaacac agactgtgac cctggttacc cagccagtgg tcaccaaaga gacagccatc 2100 agcaaactgg aaatgcccag ctctctgatg ctggaagtcc ccacactgga aaggctgcaa 2160 gaacttcaag aggccacaga tgagctggac ctgaagctga gacaggctga agtgatcaaa 2220 ggcagctggc agccagttgg ggacctgctc attgatagcc tgcaggacca tctggaaaaa 2280 gtgaaagccc tgaggggaga gattgcccct ctgaaagaaa atgtgtccca tgtgaatgac 2340 ctggccagac agctgaccac actgggaatc cagctgagcc cctacaacct gagcaccctt 2400 gaggacctga acaccaggtg gaagctcctc caggtggcag tggaagatag agtcaggcag 2460 ctgcatgagg cccacagaga ttttggacca gccagccagc actttctgtc tacctctgtg 2520 caaggcccct gggagagagc tatctctcct aacaaggtgc cctactacat caaccatgag 2580 acacagacca cctgttggga tcaccccaag atgacagagc tgtaccagag tctggcagac 2640 ctcaacaatg tcagattcag tgcctacagg actgccatga agctcagaag gctccagaaa 2700 gctctgtgcc tggacctgct ttccctgagt gcagcttgtg atgccctgga ccagcacaat 2760 ctgaagcaga atgaccagcc tatggacatc ctccagatca tcaactgcct caccaccatc 2820 tatgataggc tggaacaaga gcacaacaat ctggtcaatg tgcccctgtg tgtggacatg 2880 tgcctgaatt ggctgctgaa tgtgtatgac acaggcagaa caggcaggat cagagtcctg 2940 tccttcaaga caggcatcat ctccctgtgc aaagcccact tggaggacaa gtacagatac 3000 ctgttcaagc aagtggcctc cagcacaggc ttttgtgacc agagaaggct gggcctgctc 3060 ctgcatgaca gcattcagat ccctagacag ctgggagaag tggcttcctt tggaggcgcc 3120 aagcaccagg ccaagtgcaa catctgcaaa gagtgcccca tcattggctt cagatacaga 3180 tccctgaagc acttcaacta tgatatctgc cagagctgct tctttagtgg cagggttgcc 3240 aagggccaca aaatgcacta ccccatggtg gaatactgca ccccaacaac ctctggggaa 3300 gatgttagag actttgccaa ggtgctgaaa aacaagttca ggaccaagag atactttgct 3360 aagcacccca gaatgggcta cctgcctgtc cagacagtgc ttgagggtga caacatggaa 3420 acccctgtga cactgatcaa tttctggcca gtggactctg cccctgcctc aagtccacag 3480 ctgtcccatg atgacaccca cagcagaatt gagcactatg cctccagact ggcagagatg 3540 gaaaacagca atggcagcta cctgaatgat agcatcagcc ccaatgagag cattgatgat 3600 gagcatctgc tgatccagca ctactgtcag tccctgaacc aggactctcc actgagccag 3660 cctagaagcc ctgctcagat cctgatcagc cttgagtctg aggaaagggg agagctggaa 3720 agaatcctgg cagatcttga ggaagagaac agaaacctgc aggcagagta tgacaggctc 3780 aaacagcagc atgagcacaa gggactgagc cctctgcctt ctcctcctga aatgatgccc 3840 acctctccac agtctccaag gtgatga 3867 <210> 102 <211> 4041 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 102 atgctttggt gggaagaggt ggaagattgc tatgagaggg aagatgtgca gaagaaaacc 60 ttcaccaaat gggtcaatgc ccagttcagc aagtttggca agcagcacat tgagaacctg 120 ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc tggaaggcct gacaggccag 180 aagctgccta aagagaaggg cagcacaaga gtgcatgccc tgaacaatgt gaacaaggcc 240 ctgagagtgc tgcagaacaa caatgtggac ctggtcaata ttggcagcac agacattgtg 300 gatggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaagtg 360 aagaatgtga tgaagaacat catggctggc ctgcagcaga ccaactctga gaagatcctg 420 ctgagctggg tcagacagag caccagaaac taccctcaag tgaatgtgat caacttcacc 480 acctcttgga gtgatggact ggccctgaat gccctgatcc acagccacag acctgacctg 540 tttgactgga actctgttgt gtgccagcag tctgccacac agagactgga acatgccttc 600 aacattgcca gataccagct gggaattgag aaactgctgg accctgagga tgtggacacc 660 acctatcctg acaagaaatc catcctcatg tacatcacca gcctgttcca ggtgctgccc 720 cagcaagtgt ccattgaggc cattcaagag gttgagatgc tgcccagacc tcctaaagtg 780 accaaagagg aacacttcca gctgcaccac cagatgcact actctcagca gatcacagtg 840 tctctggccc agggatatga gagaacaagc agccccaagc ctaggttcaa gagctatgcc 900 tacacacagg ctgcctatgt gaccacatct gaccccacaa gaagcccatt tccaagccag 960 catctggaag cccctgagga caagagcttt ggcagcagcc tgatggaatc tgaagtgaac 1020 ctggatagat accagacagc cctggaagaa gtgctgtcct ggctgctgtc tgctgaggat 1080 acactgcagg ctcagggtga aatcagcaat gatgtggaag tggtcaagga ccagtttcac 1140 acccatgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg aaatatcctg 1200 cagctgggct ccaagctgat tggcacaggc aagctgtctg aggatgaaga gacagaggtg 1260 caagagcaga tgaacctgct gaacagcaga tgggagtgtc tgagagtggc cagcatggaa 1320 aagcagagca acctgcacag agtgctcatg gacctgcaga atcagaaact gaaagaactg 1380 aatgactggc tgaccaagac agaagaaagg actaggaaga tggaagagga acctctggga 1440 ccagacctgg aagatctgaa aagacaggtg cagcagcata aggtgctgca agaggacctt 1500 gagcaagagc aagtcagagt gaacagcctg acacacatgg tggtggttgt ggatgagtcc 1560 tctggggatc atgccacagc tgctctggaa gaacagctga aggtgctggg agacagatgg 1620 gccaacatct gtaggtggac agaggataga tgggtgctgc tccaggacat tctggagatc 1680 agctatgtgc ccagcaccta cctgacagag atcacccatg tgtctcaggc cctgctggaa 1740 gtggaacagc tgctgaatgc ccctgacctg tgtgccaagg actttgagga cctgttcaag 1800 caagaggaaa gcctgaagaa catcaaggac agcctgcagc agtcctctgg cagaattgac 1860 atcatccaca gcaagaaaac agctgccctg cagtctgcca cacctgtgga aagagtgaag 1920 ctgcaagagg ccctgagcca gctggacttc cagtgggaga aagtgaacaa gatgtacaag 1980 gacaggcagg gcagatttga tagaagtgtg gaaaagtgga gaaggttcca ctatgacatc 2040 aagatcttca accagtggct gacagaggct gagcagttcc tgagaaagac acagatccct 2100 gagaactggg agcatgccaa gtacaagtgg tatctgaaag aactgcagga tggcattggc 2160 cagagacaga cagttgtcag aaccctgaat gccacagggg aagagatcat ccagcagagc 2220 agcaagacag atgccagcat cctgcaagag aagctgggca gcctgaacct gagatggcaa 2280 gaagtgtgca agcagctgtc tgacagaaag aagaggctgg aagaacagac actggaaagg 2340 ctgcaagaac ttcaagaggc cacagatgag ctggacctga agctgagaca ggctgaagtg 2400 atcaaaggca gctggcagcc agttggggac ctgctcattg atagcctgca ggaccatctg 2460 gaaaaagtga aagccctgag gggagagatt gcccctctga aagaaaatgt gtcccatgtg 2520 aatgacctgg ccagacagct gaccacactg ggaatccagc tgagccccta caacctgagc 2580 acccttgagg acctgaacac caggtggaag ctcctccagg tggcagtgga agatagagtc 2640 aggcagctgc atgaggccca cagagatttt ggaccagcca gccagcactt tctgtctacc 2700 tctgtgcaag gcccctggga gagagctatc tctcctaaca aggtgcccta ctacatcaac 2760 catgagacac agaccacctg ttgggatcac cccaagatga cagagctgta ccagagtctg 2820 gcagacctca acaatgtcag attcagtgcc tacaggactg ccatgaagct cagaaggctc 2880 cagaaagctc tgtgcctgga cctgctttcc ctgagtgcag cttgtgatgc cctggaccag 2940 cacaatctga agcagaatga ccagcctatg gacatcctcc agatcatcaa ctgcctcacc 3000 accatctatg ataggctgga acaagagcac aacaatctgg tcaatgtgcc cctgtgtgtg 3060 gacatgtgcc tgaattggct gctgaatgtg tatgacacag gcagaacagg caggatcaga 3120 gtcctgtcct tcaagacagg catcatctcc ctgtgcaaag cccacttgga ggacaagtac 3180 agatacctgt tcaagcaagt ggcctccagc acaggctttt gtgaccagag aaggctgggc 3240 ctgctcctgc atgacagcat tcagatccct agacagctgg gagaagtggc ttcctttgga 3300 ggcagcaata ttgagccatc agtcaggtcc tgttttcagt ttgccaacaa caagcctgag 3360 attgaggctg ccctgttcct ggactggatg agacttgagc ctcagagcat ggtctggctg 3420 cctgtgcttc atagagtggc tgctgctgag actgccaagc accaggccaa gtgcaacatc 3480 tgcaaagagt gccccatcat tggcttcaga tacagatccc tgaagcactt caactatgat 3540 atctgccaga gctgcttctt tagtggcagg gttgccaagg gccacaaaat gcactacccc 3600 atggtggaat actgcacccc aacaacctct ggggaagatg ttagagactt tgccaaggtg 3660 ctgaaaaaca agttcaggac caagagatac tttgctaagc accccagaat gggctacctg 3720 cctgtccaga cagtgcttga gggtgacaac atggaaaccc ctgtgacact gatcaatttc 3780 tggccagtgg actctgcccc tgcctcaagt ccacagctgt cccatgatga cacccacagc 3840 agaattgagc actatgcctc cagactggca gagatggaaa acagcaatgg cagctacctg 3900 aatgatagca tcagccccaa tgagagcatt gatgatgagc atctgctgat ccagcactac 3960 tgtcagtccc tgaaccagga ctctccactg agccagccta gaagccctgc tcagatcctg 4020 atcagccttg agtcttgatg a 4041 <210> 103 <211> 3765 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin <400> 103 atgctttggt gggaagaggt ggaagattgc tatgagaggg aagatgtgca gaagaaaacc 60 ttcaccaaat gggtcaatgc ccagttcagc aagtttggca agcagcacat tgagaacctg 120 ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc tggaaggcct gacaggccag 180 aagctgccta aagagaaggg cagcacaaga gtgcatgccc tgaacaatgt gaacaaggcc 240 ctgagagtgc tgcagaacaa caatgtggac ctggtcaata ttggcagcac agacattgtg 300 gatggcaacc acaagctgac cctgggcctg atctggaaca tcatcctgca ctggcaagtg 360 aagaatgtga tgaagaacat catggctggc ctgcagcaga ccaactctga gaagatcctg 420 ctgagctggg tcagacagag caccagaaac taccctcaag tgaatgtgat caacttcacc 480 acctcttgga gtgatggact ggccctgaat gccctgatcc acagccacag acctgacctg 540 tttgactgga actctgttgt gtgccagcag tctgccacac agagactgga acatgccttc 600 aacattgcca gataccagct gggaattgag aaactgctgg accctgagga tgtggacacc 660 acctatcctg acaagaaatc catcctcatg tacatcacca gcctgttcca ggtgctgccc 720 cagcaagtgt ccattgaggc cattcaagag gttgagatgc tgcccagacc tcctaaagtg 780 accaaagagg aacacttcca gctgcaccac cagatgcact actctcagca gatcacagtg 840 tctctggccc agggatatga gagaacaagc agccccaagc ctaggttcaa gagctatgcc 900 tacacacagg ctgcctatgt gaccacatct gaccccacaa gaagcccatt tccaagccag 960 catctggaag cccctgagga caagagcttt ggcagcagcc tgatggaatc tgaagtgaac 1020 ctggatagat accagacagc cctggaagaa gtgctgtcct ggctgctgtc tgctgaggat 1080 acactgcagg ctcagggtga aatcagcaat gatgtggaag tggtcaagga ccagtttcac 1140 acccatgagg gctacatgat ggacctgaca gcccaccagg gcagagtggg aaatatcctg 1200 cagctgggct ccaagctgat tggcacaggc aagctgtctg aggatgaaga gacagaggtg 1260 caagagcaga tgaacctgct gaacagcaga tgggagtgtc tgagagtggc cagcatggaa 1320 aagcagagca acctgcacag agtgctcatg gacctgcaga atcagaaact gaaagaactg 1380 aatgactggc tgaccaagac agaagaaagg actaggaaga tggaagagga acctctggga 1440 ccagacctgg aagatctgaa aagacaggtg cagcagcata aggtgctgca agaggacctt 1500 gagcaagagc aagtcagagt gaacagcctg acacacatgg tggtggttgt ggatgagtcc 1560 tctggggatc atgccacagc tgctctggaa gaacagctga aggtgctggg agacagatgg 1620 gccaacatct gtaggtggac agaggataga tgggtgctgc tccaggacat tctggagatc 1680 agctatgtgc ccagcaccta cctgacagag atcacccatg tgtctcaggc cctgctggaa 1740 gtggaacagc tgctgaatgc ccctgacctg tgtgccaagg actttgagga cctgttcaag 1800 caagaggaaa gcctgaagaa catcaaggac agcctgcagc agtcctctgg cagaattgac 1860 atcatccaca gcaagaaaac agctgccctg cagtctgcca cacctgtgga aagagtgaag 1920 ctgcaagagg ccctgagcca gctggacttc cagtgggaga aagtgaacaa gatgtacaag 1980 gacaggcagg gcagatttga tagaagtgtg gaaaagtgga gaaggttcca ctatgacatc 2040 aagatcttca accagtggct gacagaggct gagcagttcc tgagaaagac acagatccct 2100 gagaactggg agcatgccaa gtacaagtgg tatctgaaag aactgcagga tggcattggc 2160 cagagacaga cagttgtcag aaccctgaat gccacagggg aagagatcat ccagcagagc 2220 agcaagacag atgccagcat cctgcaagag aagctgggca gcctgaacct gagatggcaa 2280 gaagtgtgca agcagctgtc tgacagaaag aagaggctgg aagaacagac actggaaagg 2340 ctgcaagaac ttcaagaggc cacagatgag ctggacctga agctgagaca ggctgaagtg 2400 atcaaaggca gctggcagcc agttggggac ctgctcattg atagcctgca ggaccatctg 2460 gaaaaagtga aagccctgag gggagagatt gcccctctga aagaaaatgt gtcccatgtg 2520 aatgacctgg ccagacagct gaccacactg ggaatccagc tgagccccta caacctgagc 2580 acccttgagg acctgaacac caggtggaag ctcctccagg tggcagtgga agatagagtc 2640 aggcagctgc atgaggccca cagagatttt ggaccagcca gccagcactt tctgtctacc 2700 tctgtgcaag gcccctggga gagagctatc tctcctaaca aggtgcccta ctacatcaac 2760 catgagacac agaccacctg ttgggatcac cccaagatga cagagctgta ccagagtctg 2820 gcagacctca acaatgtcag attcagtgcc tacaggactg ccatgaagct cagaaggctc 2880 cagaaagctc tgtgcctgga cctgctttcc ctgagtgcag cttgtgatgc cctggaccag 2940 cacaatctga agcagaatga ccagcctatg gacatcctcc agatcatcaa ctgcctcacc 3000 accatctatg ataggctgga acaagagcac aacaatctgg tcaatgtgcc cctgtgtgtg 3060 gacatgtgcc tgaattggct gctgaatgtg tatgacacag gcagaacagg caggatcaga 3120 gtcctgtcct tcaagacagg catcatctcc ctgtgcaaag cccacttgga ggacaagtac 3180 agatacctgt tcaagcaagt ggcctccagc acaggctttt gtgaccagag aaggctgggc 3240 ctgctcctgc atgacagcat tcagatccct agacagctgg gagaagtggc ttcctttgga 3300 ggcagcaata ttgagccatc agtcaggtcc tgttttcagt ttgccaacaa caagcctgag 3360 attgaggctg ccctgttcct ggactggatg agacttgagc ctcagagcat ggtctggctg 3420 cctgtgcttc atagagtggc tgctgctgag actgccaagc accaggccaa gtgcaacatc 3480 tgcaaagagt gccccatcat tggcttcaga tacagatccc tgaagcactt caactatgat 3540 atctgccaga gctgcttctt tagtggcagg gttgccaagg gccacaaaat gcactacccc 3600 atggtggaat actgcacccc aacaacctct ggggaagatg ttagagactt tgccaaggtg 3660 ctgaaaaaca agttcaggac caagagatac tttgctaagc accccagaat gggctacctg 3720 cctgtccaga cagtgcttga gggtgacaac atggaaacct gatga 3765 <210> 104 <211> 4584 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin cassette <400> 104 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct catatgcagg gtaatgggga tcctctagag gccgtccgcc ctcggcacca 180 tcctcacgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 240 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 300 tttagagcgg aggaatggtg gacacccaaa tatggcgacg gttcctcacc cgtcgccata 360 tttgggtgtc cgccctcggc cggggccgca ttcctggggg ccgggcggtg ctcccgcccg 420 cctcgataaa aggctccggg gccggcggcg gcccacgagc tacccggagg agcgggaggc 480 gccaagcgga attcgccacc atgctttggt gggaagaggt ggaagattgc tatgagaggg 540 aagatgtgca gaagaaaacc ttcaccaaat gggtcaatgc ccagttcagc aagtttggca 600 agcagcacat tgagaacctg ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc 660 tggaaggcct gacaggccag aagctgccta aagagaaggg cagcacaaga gtgcatgccc 720 tgaacaatgt gaacaaggcc ctgagagtgc tgcagaacaa caatgtggac ctggtcaata 780 ttggcagcac agacattgtg gatggcaacc acaagctgac cctgggcctg atctggaaca 840 tcatcctgca ctggcaagtg aagaatgtga tgaagaacat catggctggc ctgcagcaga 900 ccaactctga gaagatcctg ctgagctggg tcagacagag caccagaaac taccctcaag 960 tgaatgtgat caacttcacc acctcttgga gtgatggact ggccctgaat gccctgatcc 1020 acagccacag acctgacctg tttgactgga actctgttgt gtgccagcag tctgccacac 1080 agagactgga acatgccttc aacattgcca gataccagct gggaattgag aaactgctgg 1140 accctgagga tgtggacacc acctatcctg acaagaaatc catcctcatg tacatcacca 1200 gcctgttcca ggtgctgccc cagcaagtgt ccattgaggc cattcaagag gttgagatgc 1260 tgcccagacc tcctaaagtg accaaagagg aacacttcca gctgcaccac cagatgcact 1320 actctcagca gatcacagtg tctctggccc agggatatga gagaacaagc agccccaagc 1380 ctaggttcaa gagctatgcc tacacacagg ctgcctatgt gaccacatct gaccccacaa 1440 gaagcccatt tccaagccag catctggaag cccctgagga caagagcttt ggcagcagcc 1500 tgatggaatc tgaagtgaac ctggatagat accagacagc cctggaagaa gtgctgtcct 1560 ggctgctgtc tgctgaggat acactgcagg ctcagggtga aatcagcaat gatgtggaag 1620 tggtcaagga ccagtttcac acccatgagg gctacatgat ggacctgaca gcccaccagg 1680 gcagagtggg aaatatcctg cagctgggct ccaagctgat tggcacaggc aagctgtctg 1740 aggatgaaga gacagaggtg caagagcaga tgaacctgct gaacagcaga tgggagtgtc 1800 tgagagtggc cagcatggaa aagcagagca acctgcacag agtgctcatg gacctgcaga 1860 atcagaaact gaaagaactg aatgactggc tgaccaagac agaagaaagg actaggaaga 1920 tggaagagga acctctggga ccagacctgg aagatctgaa aagacaggtg cagcagcata 1980 aggtgctgca agaggacctt gagcaagagc aagtcagagt gaacagcctg acacacatgg 2040 tggtggttgt ggatgagtcc tctggggatc atgccacagc tgctctggaa gaacagctga 2100 aggtgctggg agacagatgg gccaacatct gtaggtggac agaggataga tgggtgctgc 2160 tccaggacat tctgctgaag tggcagagac tgacagagga acagtgcctg ttttctgcct 2220 ggctctctga gaaagaggat gctgtcaaca agatccatac cacaggcttc aaggatcaga 2280 atgagatgct cagctccctg cagaaactgg ctgtgctgaa ggctgacctg gaaaagaaaa 2340 agcagtccat gggcaagctc tacagcctga agcaggacct gctgtctacc ctgaagaaca 2400 agtctgtgac ccagaaaact gaggcctggc tggacaactt tgctagatgc tgggacaacc 2460 tggtgcagaa gctggaaaag tctacagccc agatcagcca gcaacctgat cttgcccctg 2520 gcctgaccac aattggagcc tctccaacac agactgtgac cctggttacc cagccagtgg 2580 tcaccaaaga gacagccatc agcaaactgg aaatgcccag ctctctgatg ctggaagtcc 2640 ccacactgga aaggctgcaa gaacttcaag aggccacaga tgagctggac ctgaagctga 2700 gacaggctga agtgatcaaa ggcagctggc agccagttgg ggacctgctc attgatagcc 2760 tgcaggacca tctggaaaaa gtgaaagccc tgaggggaga gattgcccct ctgaaagaaa 2820 atgtgtccca tgtgaatgac ctggccagac agctgaccac actgggaatc cagctgagcc 2880 cctacaacct gagcaccctt gaggacctga acaccaggtg gaagctcctc caggtggcag 2940 tggaagatag agtcaggcag ctgcatgagg cccacagaga ttttggacca gccagccagc 3000 actttctgtc tacctctgtg caaggcccct gggagagagc tatctctcct aacaaggtgc 3060 cctactacat caaccatgag acacagacca cctgttggga tcaccccaag atgacagagc 3120 tgtaccagag tctggcagac ctcaacaatg tcagattcag tgcctacagg actgccatga 3180 agctcagaag gctccagaaa gctctgtgcc tggacctgct ttccctgagt gcagcttgtg 3240 atgccctgga ccagcacaat ctgaagcaga atgaccagcc tatggacatc ctccagatca 3300 tcaactgcct caccaccatc tatgataggc tggaacaaga gcacaacaat ctggtcaatg 3360 tgcccctgtg tgtggacatg tgcctgaatt ggctgctgaa tgtgtatgac acaggcagaa 3420 caggcaggat cagagtcctg tccttcaaga caggcatcat ctccctgtgc aaagcccact 3480 tggaggacaa gtacagatac ctgttcaagc aagtggcctc cagcacaggc ttttgtgacc 3540 agagaaggct gggcctgctc ctgcatgaca gcattcagat ccctagacag ctgggagaag 3600 tggcttcctt tggaggcgcc aagcaccagg ccaagtgcaa catctgcaaa gagtgcccca 3660 tcattggctt cagatacaga tccctgaagc acttcaacta tgatatctgc cagagctgct 3720 tctttagtgg cagggttgcc aagggccaca aaatgcacta ccccatggtg gaatactgca 3780 ccccaacaac ctctggggaa gatgttagag actttgccaa ggtgctgaaa aacaagttca 3840 ggaccaagag atactttgct aagcacccca gaatgggcta cctgcctgtc cagacagtgc 3900 ttgagggtga caacatggaa acccctgtga cactgatcaa tttctggcca gtggactctg 3960 cccctgcctc aagtccacag ctgtcccatg atgacaccca cagcagaatt gagcactatg 4020 cctccagact ggcagagatg gaaaacagca atggcagcta cctgaatgat agcatcagcc 4080 ccaatgagag cattgatgat gagcatctgc tgatccagca ctactgtcag tccctgaacc 4140 aggactctcc actgagccag cctagaagcc ctgctcagat cctgatcagc cttgagtctg 4200 aggaaagggg agagctggaa agaatcctgg cagatcttga ggaagagaac agaaacctgc 4260 aggcagagta tgacaggctc aaacagcagc atgagcacaa gggactgagc cctctgcctt 4320 ctcctcctga aatgatgccc acctctccac agtctccaag gtgatgactc gagaggccta 4380 ataaagagct cagatgcatc gatcagagtg tgttggtttt ttgtgtgcca gggtaatggg 4440 ctagctgcgg ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4500 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4560 ctcagtgagc gagcgagcgc gcag 4584 <210> 105 <211> 4746 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin cassette <400> 105 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct catatgcagg gtaatgggga tcctctagag gccgtccgcc ctcggcacca 180 tcctcacgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 240 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 300 tttagagcgg aggaatggtg gacacccaaa tatggcgacg gttcctcacc cgtcgccata 360 tttgggtgtc cgccctcggc cggggccgca ttcctggggg ccgggcggtg ctcccgcccg 420 cctcgataaa aggctccggg gccggcggcg gcccacgagc tacccggagg agcgggaggc 480 gccaagcgga attcgccacc atgctttggt gggaagaggt ggaagattgc tatgagaggg 540 aagatgtgca gaagaaaacc ttcaccaaat gggtcaatgc ccagttcagc aagtttggca 600 agcagcacat tgagaacctg ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc 660 tggaaggcct gacaggccag aagctgccta aagagaaggg cagcacaaga gtgcatgccc 720 tgaacaatgt gaacaaggcc ctgagagtgc tgcagaacaa caatgtggac ctggtcaata 780 ttggcagcac agacattgtg gatggcaacc acaagctgac cctgggcctg atctggaaca 840 tcatcctgca ctggcaagtg aagaatgtga tgaagaacat catggctggc ctgcagcaga 900 ccaactctga gaagatcctg ctgagctggg tcagacagag caccagaaac taccctcaag 960 tgaatgtgat caacttcacc acctcttgga gtgatggact ggccctgaat gccctgatcc 1020 acagccacag acctgacctg tttgactgga actctgttgt gtgccagcag tctgccacac 1080 agagactgga acatgccttc aacattgcca gataccagct gggaattgag aaactgctgg 1140 accctgagga tgtggacacc acctatcctg acaagaaatc catcctcatg tacatcacca 1200 gcctgttcca ggtgctgccc cagcaagtgt ccattgaggc cattcaagag gttgagatgc 1260 tgcccagacc tcctaaagtg accaaagagg aacacttcca gctgcaccac cagatgcact 1320 actctcagca gatcacagtg tctctggccc agggatatga gagaacaagc agccccaagc 1380 ctaggttcaa gagctatgcc tacacacagg ctgcctatgt gaccacatct gaccccacaa 1440 gaagcccatt tccaagccag catctggaag cccctgagga caagagcttt ggcagcagcc 1500 tgatggaatc tgaagtgaac ctggatagat accagacagc cctggaagaa gtgctgtcct 1560 ggctgctgtc tgctgaggat acactgcagg ctcagggtga aatcagcaat gatgtggaag 1620 tggtcaagga ccagtttcac acccatgagg gctacatgat ggacctgaca gcccaccagg 1680 gcagagtggg aaatatcctg cagctgggct ccaagctgat tggcacaggc aagctgtctg 1740 aggatgaaga gacagaggtg caagagcaga tgaacctgct gaacagcaga tgggagtgtc 1800 tgagagtggc cagcatggaa aagcagagca acctgcacag agtgctcatg gacctgcaga 1860 atcagaaact gaaagaactg aatgactggc tgaccaagac agaagaaagg actaggaaga 1920 tggaagagga acctctggga ccagacctgg aagatctgaa aagacaggtg cagcagcata 1980 aggtgctgca agaggacctt gagcaagagc aagtcagagt gaacagcctg acacacatgg 2040 tggtggttgt ggatgagtcc tctggggatc atgccacagc tgctctggaa gaacagctga 2100 aggtgctggg agacagatgg gccaacatct gtaggtggac agaggataga tgggtgctgc 2160 tccaggacat tctggagatc agctatgtgc ccagcaccta cctgacagag atcacccatg 2220 tgtctcaggc cctgctggaa gtggaacagc tgctgaatgc ccctgacctg tgtgccaagg 2280 actttgagga cctgttcaag caagaggaaa gcctgaagaa catcaaggac agcctgcagc 2340 agtcctctgg cagaattgac atcatccaca gcaagaaaac agctgccctg cagtctgcca 2400 cacctgtgga aagagtgaag ctgcaagagg ccctgagcca gctggacttc cagtgggaga 2460 aagtgaacaa gatgtacaag gacaggcagg gcagatttga tagaagtgtg gaaaagtgga 2520 gaaggttcca ctatgacatc aagatcttca accagtggct gacagaggct gagcagttcc 2580 tgagaaagac acagatccct gagaactggg agcatgccaa gtacaagtgg tatctgaaag 2640 aactgcagga tggcattggc cagagacaga cagttgtcag aaccctgaat gccacagggg 2700 aagagatcat ccagcagagc agcaagacag atgccagcat cctgcaagag aagctgggca 2760 gcctgaacct gagatggcaa gaagtgtgca agcagctgtc tgacagaaag aagaggctgg 2820 aagaacagac actggaaagg ctgcaagaac ttcaagaggc cacagatgag ctggacctga 2880 agctgagaca ggctgaagtg atcaaaggca gctggcagcc agttggggac ctgctcattg 2940 atagcctgca ggaccatctg gaaaaagtga aagccctgag gggagagatt gcccctctga 3000 aagaaaatgt gtcccatgtg aatgacctgg ccagacagct gaccacactg ggaatccagc 3060 tgagccccta caacctgagc acccttgagg acctgaacac caggtggaag ctcctccagg 3120 tggcagtgga agatagagtc aggcagctgc atgaggccca cagagatttt ggaccagcca 3180 gccagcactt tctgtctacc tctgtgcaag gcccctggga gagagctatc tctcctaaca 3240 aggtgcccta ctacatcaac catgagacac agaccacctg ttgggatcac cccaagatga 3300 cagagctgta ccagagtctg gcagacctca acaatgtcag attcagtgcc tacaggactg 3360 ccatgaagct cagaaggctc cagaaagctc tgtgcctgga cctgctttcc ctgagtgcag 3420 cttgtgatgc cctggaccag cacaatctga agcagaatga ccagcctatg gacatcctcc 3480 agatcatcaa ctgcctcacc accatctatg ataggctgga acaagagcac aacaatctgg 3540 tcaatgtgcc cctgtgtgtg gacatgtgcc tgaattggct gctgaatgtg tatgacacag 3600 gcagaacagg caggatcaga gtcctgtcct tcaagacagg catcatctcc ctgtgcaaag 3660 cccacttgga ggacaagtac agatacctgt tcaagcaagt ggcctccagc acaggctttt 3720 gtgaccagag aaggctgggc ctgctcctgc atgacagcat tcagatccct agacagctgg 3780 gagaagtggc ttcctttgga ggcagcaata ttgagccatc agtcaggtcc tgttttcagt 3840 ttgccaacaa caagcctgag attgaggctg ccctgttcct ggactggatg agacttgagc 3900 ctcagagcat ggtctggctg cctgtgcttc atagagtggc tgctgctgag actgccaagc 3960 accaggccaa gtgcaacatc tgcaaagagt gccccatcat tggcttcaga tacagatccc 4020 tgaagcactt caactatgat atctgccaga gctgcttctt tagtggcagg gttgccaagg 4080 gccacaaaat gcactacccc atggtggaat actgcacccc aacaacctct ggggaagatg 4140 ttagagactt tgccaaggtg ctgaaaaaca agttcaggac caagagatac tttgctaagc 4200 accccagaat gggctacctg cctgtccaga cagtgcttga gggtgacaac atggaaaccc 4260 ctgtgacact gatcaatttc tggccagtgg actctgcccc tgcctcaagt ccacagctgt 4320 cccatgatga cacccacagc agaattgagc actatgcctc cagactggca gagatggaaa 4380 acagcaatgg cagctacctg aatgatagca tcagccccaa tgagagcatt gatgatgagc 4440 atctgctgat ccagcactac tgtcagtccc tgaaccagga ctctccactg agccagccta 4500 gaagccctgc tcagatcctg atcagccttg agtcttgatg agtcgacagg cctaataaag 4560 agctcagatg catcgatcag agtgtgttgg ttttttgtgt ggctagctgc ggccgcagga 4620 acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg 4680 gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 4740 gcgcag 4746 <210> 106 <211> 4470 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystropin cassette <400> 106 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct catatgcagg gtaatgggga tcctctagag gccgtccgcc ctcggcacca 180 tcctcacgac acccaaatat ggcgacgggt gaggaatggt ggggagttat ttttagagcg 240 gtgaggaagg tgggcaggca gcaggtgttg gcgctctaaa aataactccc gggagttatt 300 tttagagcgg aggaatggtg gacacccaaa tatggcgacg gttcctcacc cgtcgccata 360 tttgggtgtc cgccctcggc cggggccgca ttcctggggg ccgggcggtg ctcccgcccg 420 cctcgataaa aggctccggg gccggcggcg gcccacgagc tacccggagg agcgggaggc 480 gccaagcgga attcgccacc atgctttggt gggaagaggt ggaagattgc tatgagaggg 540 aagatgtgca gaagaaaacc ttcaccaaat gggtcaatgc ccagttcagc aagtttggca 600 agcagcacat tgagaacctg ttcagtgacc tgcaggatgg cagaaggctg ctggatctgc 660 tggaaggcct gacaggccag aagctgccta aagagaaggg cagcacaaga gtgcatgccc 720 tgaacaatgt gaacaaggcc ctgagagtgc tgcagaacaa caatgtggac ctggtcaata 780 ttggcagcac agacattgtg gatggcaacc acaagctgac cctgggcctg atctggaaca 840 tcatcctgca ctggcaagtg aagaatgtga tgaagaacat catggctggc ctgcagcaga 900 ccaactctga gaagatcctg ctgagctggg tcagacagag caccagaaac taccctcaag 960 tgaatgtgat caacttcacc acctcttgga gtgatggact ggccctgaat gccctgatcc 1020 acagccacag acctgacctg tttgactgga actctgttgt gtgccagcag tctgccacac 1080 agagactgga acatgccttc aacattgcca gataccagct gggaattgag aaactgctgg 1140 accctgagga tgtggacacc acctatcctg acaagaaatc catcctcatg tacatcacca 1200 gcctgttcca ggtgctgccc cagcaagtgt ccattgaggc cattcaagag gttgagatgc 1260 tgcccagacc tcctaaagtg accaaagagg aacacttcca gctgcaccac cagatgcact 1320 actctcagca gatcacagtg tctctggccc agggatatga gagaacaagc agccccaagc 1380 ctaggttcaa gagctatgcc tacacacagg ctgcctatgt gaccacatct gaccccacaa 1440 gaagcccatt tccaagccag catctggaag cccctgagga caagagcttt ggcagcagcc 1500 tgatggaatc tgaagtgaac ctggatagat accagacagc cctggaagaa gtgctgtcct 1560 ggctgctgtc tgctgaggat acactgcagg ctcagggtga aatcagcaat gatgtggaag 1620 tggtcaagga ccagtttcac acccatgagg gctacatgat ggacctgaca gcccaccagg 1680 gcagagtggg aaatatcctg cagctgggct ccaagctgat tggcacaggc aagctgtctg 1740 aggatgaaga gacagaggtg caagagcaga tgaacctgct gaacagcaga tgggagtgtc 1800 tgagagtggc cagcatggaa aagcagagca acctgcacag agtgctcatg gacctgcaga 1860 atcagaaact gaaagaactg aatgactggc tgaccaagac agaagaaagg actaggaaga 1920 tggaagagga acctctggga ccagacctgg aagatctgaa aagacaggtg cagcagcata 1980 aggtgctgca agaggacctt gagcaagagc aagtcagagt gaacagcctg acacacatgg 2040 tggtggttgt ggatgagtcc tctggggatc atgccacagc tgctctggaa gaacagctga 2100 aggtgctggg agacagatgg gccaacatct gtaggtggac agaggataga tgggtgctgc 2160 tccaggacat tctggagatc agctatgtgc ccagcaccta cctgacagag atcacccatg 2220 tgtctcaggc cctgctggaa gtggaacagc tgctgaatgc ccctgacctg tgtgccaagg 2280 actttgagga cctgttcaag caagaggaaa gcctgaagaa catcaaggac agcctgcagc 2340 agtcctctgg cagaattgac atcatccaca gcaagaaaac agctgccctg cagtctgcca 2400 cacctgtgga aagagtgaag ctgcaagagg ccctgagcca gctggacttc cagtgggaga 2460 aagtgaacaa gatgtacaag gacaggcagg gcagatttga tagaagtgtg gaaaagtgga 2520 gaaggttcca ctatgacatc aagatcttca accagtggct gacagaggct gagcagttcc 2580 tgagaaagac acagatccct gagaactggg agcatgccaa gtacaagtgg tatctgaaag 2640 aactgcagga tggcattggc cagagacaga cagttgtcag aaccctgaat gccacagggg 2700 aagagatcat ccagcagagc agcaagacag atgccagcat cctgcaagag aagctgggca 2760 gcctgaacct gagatggcaa gaagtgtgca agcagctgtc tgacagaaag aagaggctgg 2820 aagaacagac actggaaagg ctgcaagaac ttcaagaggc cacagatgag ctggacctga 2880 agctgagaca ggctgaagtg atcaaaggca gctggcagcc agttggggac ctgctcattg 2940 atagcctgca ggaccatctg gaaaaagtga aagccctgag gggagagatt gcccctctga 3000 aagaaaatgt gtcccatgtg aatgacctgg ccagacagct gaccacactg ggaatccagc 3060 tgagccccta caacctgagc acccttgagg acctgaacac caggtggaag ctcctccagg 3120 tggcagtgga agatagagtc aggcagctgc atgaggccca cagagatttt ggaccagcca 3180 gccagcactt tctgtctacc tctgtgcaag gcccctggga gagagctatc tctcctaaca 3240 aggtgcccta ctacatcaac catgagacac agaccacctg ttgggatcac cccaagatga 3300 cagagctgta ccagagtctg gcagacctca acaatgtcag attcagtgcc tacaggactg 3360 ccatgaagct cagaaggctc cagaaagctc tgtgcctgga cctgctttcc ctgagtgcag 3420 cttgtgatgc cctggaccag cacaatctga agcagaatga ccagcctatg gacatcctcc 3480 agatcatcaa ctgcctcacc accatctatg ataggctgga acaagagcac aacaatctgg 3540 tcaatgtgcc cctgtgtgtg gacatgtgcc tgaattggct gctgaatgtg tatgacacag 3600 gcagaacagg caggatcaga gtcctgtcct tcaagacagg catcatctcc ctgtgcaaag 3660 cccacttgga ggacaagtac agatacctgt tcaagcaagt ggcctccagc acaggctttt 3720 gtgaccagag aaggctgggc ctgctcctgc atgacagcat tcagatccct agacagctgg 3780 gagaagtggc ttcctttgga ggcagcaata ttgagccatc agtcaggtcc tgttttcagt 3840 ttgccaacaa caagcctgag attgaggctg ccctgttcct ggactggatg agacttgagc 3900 ctcagagcat ggtctggctg cctgtgcttc atagagtggc tgctgctgag actgccaagc 3960 accaggccaa gtgcaacatc tgcaaagagt gccccatcat tggcttcaga tacagatccc 4020 tgaagcactt caactatgat atctgccaga gctgcttctt tagtggcagg gttgccaagg 4080 gccacaaaat gcactacccc atggtggaat actgcacccc aacaacctct ggggaagatg 4140 ttagagactt tgccaaggtg ctgaaaaaca agttcaggac caagagatac tttgctaagc 4200 accccagaat gggctacctg cctgtccaga cagtgcttga gggtgacaac atggaaacct 4260 gatgagtcga caggcctaat aaagagctca gatgcatcga tcagagtgtg ttggtttttt 4320 gtgtggctag ctgcggccgc aggaacccct agtgatggag ttggccactc cctctctgcg 4380 cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 4440 ggcggcctca gtgagcgagc gagcgcgcag 4470 <210> 107 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 107 tctgtt 6 <210> 108 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 108 gaaacccttg aa 12 <210> 109 <211> 162 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; dystrophin segment <400> 109 gccaagcatc aggccaaatg taacatctgc aaagagtgtc caatcattgg attcaggtac 60 aggagtctaa agcactttaa ttatgacatc tgccaaagct gctttttttc tggtcgagtt 120 gcaaaaggcc ataaaatgca ctatcccatg gtggaatatt gc 162 <210> 110 <211> 2 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 110 Ser Val 1 <210> 111 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 111 gagacactgg aa 12 <210> 112 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; capsid sequence <400> 112 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Gln Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Ala Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Arg Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Thr Asn Thr Gly 580 585 590 Pro Ile Val Gly Asn Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 113 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; capsid sequence <400> 113 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ser Gln Pro Ala Lys Lys Lys Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Gly Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Ser Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 114 <211> 740 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; capsid sequence <400> 114 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser 1 5 10 15 Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro 20 25 30 Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gly Ile Asn Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn 85 90 95 His Ala Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe 100 105 110 Gly Gly Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu 115 120 125 Glu Pro Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys 130 135 140 Lys Arg Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly 145 150 155 160 Ile Gly Lys Ser Gly Ser Gln Pro Ala Lys Lys Lys Leu Asn Phe Gly 165 170 175 Gln Thr Gly Asp Thr Glu Ser Val Pro Asp Pro Gly Ile Asn Pro Ile 180 185 190 Gly Glu Pro Pro Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala 195 200 205 Ser Gly Gly Gly Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly 210 215 220 Val Gly Ser Ser Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly 225 230 235 240 Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr 245 250 255 Asn Asn His Leu Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser 260 265 270 Ser Asn Asp Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe 275 280 285 Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg 290 295 300 Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys 305 310 315 320 Leu Phe Asn Ile Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys 325 330 335 Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser 340 345 350 Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu 355 360 365 Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu 370 375 380 Thr Leu Asn Asp Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys 385 390 395 400 Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln 405 410 415 Phe Ser Tyr Glu Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His 420 425 430 Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu 435 440 445 Tyr Tyr Leu Ser Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr 450 455 460 Leu Lys Phe Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg 465 470 475 480 Asn Tyr Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr 485 490 495 Val Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser 500 505 510 Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met 515 520 525 Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser 530 535 540 Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp 545 550 555 560 Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val 565 570 575 Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln 580 585 590 Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly 595 600 605 Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala 610 615 620 Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly 625 630 635 640 Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr 645 650 655 Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn 660 665 670 Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu 675 680 685 Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln 690 695 700 Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn 705 710 715 720 Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu 725 730 735 Thr Arg Asn Leu 740 <210> 115 <211> 865 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; promoter sequence <400> 115 ccactacggg tttaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct 60 ggttataatt aacccagaca tgtggctgcc cccccccccc ccaacacctg ctgcctctaa 120 aaataaccct gtccctggtg gatcccacta cgggtttagg ctgcccatgt aaggaggcaa 180 ggcctgggga cacccgagat gcctggttat aattaaccca gacatgtggc tgcccccccc 240 ccccccaaca cctgctgcct ctaaaaataa ccctgtccct ggtggatccc actacgggtt 300 taggctgccc atgtaaggag gcaaggcctg gggacacccg agatgcctgg ttataattaa 360 cccagacatg tggctgcccc cccccccccc aacacctgct gcctctaaaa ataaccctgt 420 ccctggtgga tcccctgcat gcgaagatct tcgaacaagg ctgtggggga ctgagggcag 480 gctgtaacag gcttgggggc cagggcttat acgtgcctgg gactcccaaa gtattactgt 540 tccatgttcc cggcgaaggg ccagctgtcc cccgccagct agactcagca cttagtttag 600 gaaccagtga gcaagtcagc ccttggggca gcccatacaa ggccatgggg ctgggcaagc 660 tgcacgcctg ggtccggggt gggcacggtg cccgggcaac gagctgaaag ctcatctgct 720 ctcaggggcc cctccctggg gacagcccct cctggctagt cacaccctgt aggctcctct 780 atataaccca ggggcacagg ggctgccctc attctaccac cacctccaca gcacagacag 840 acactcagga gccagccagc gtcga 865 <210> 116 <211> 1725 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; promoter sequence <400> 116 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct 420 cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga 480 tgggggcggg gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg 540 gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc 600 cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg 660 gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc 720 cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc 780 cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa 840 gccttgaggg gctccgggag ggccctttgt gcggggggag cggctcgggg ggtgcgtgcg 900 tgtgtgtgtg cgtggggagc gccgcgtgcg gctccgcgct gcccggcggc tgtgagcgct 960 gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg 1020 gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt 1080 gcgtgggggg gtgagcaggg ggtgtgggcg cgtcggtcgg gctgcaaccc cccctgcacc 1140 cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 1200 gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 1260 ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 1320 gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 1380 agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 1440 cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 1500 gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 1560 ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 1620 ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacagctcc 1680 tgggcaacgt gctggttatt gtgctgtctc atcattttgg caaag 1725 <210> 117 <211> 251 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; promoter sequence <400> 117 atggaggcgg tactatgtag atgagaattc aggagcaaac tgggaaaagc aactgcttcc 60 aaatatttgt gatttttaca gtgtagtttt ggaaaaactc ttagcctacc aattcttcta 120 agtgttttaa aatgtgggag ccagtacaca tgaagttata gagtgtttta atgaggctta 180 aatatttacc gtaactatga aatgctacgc atatcatgct gttcaggctc cgtggccacg 240 caactcatac t 251 <210> 118 <211> 212 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; promoter sequence <400> 118 gggcagagcg cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgaa 60 cgggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 120 gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 180 tttttcgcaa cgggtttgcc gccagaacac ag 212 <210> 119 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; desmin sequence <400> 119 ctgcagacat gcttgctgcc tgccctggcg tgccctggcg aggcttgccg tcacaggacc 60 cccgctggct gactcagggg cgcaggctct tgcgggggag ctggcctccc gcccccacgg 120 ccacgggccc tttcctggca ggacagcggg atcttgcagc tgtcagggga ggggatgacg 180 ggggactgat gtcaggaggg gatacaaata gtgccgaaca aggaccggat tagatctacc 240 240 <210> 120 <211> 792 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; MHCK7 sequence <400> 120 aagcttgcat gtctaagcta gacccttcag attaaaaata actgaggtaa gggcctgggt 60 aggggaggtg gtgtgagacg ctcctgtctc tcctctatct gcccatcggc cctttgggga 120 ggaggaatgt gcccaaggac taaaaaaagg ccatggagcc agaggggcga gggcaacaga 180 cctttcatgg gcaaaccttg gggccctgct gtctagcatg ccccactacg ggtctaggct 240 gcccatgtaa ggaggcaagg cctggggaca cccgagatgc ctggttataa ttaacccaga 300 catgtggctg cccccccccc cccaacacct gctgcctcta aaaataaccc tgtccctggt 360 ggatcccctg catgcgaaga tcttcgaaca aggctgtggg ggactgaggg caggctgtaa 420 caggcttggg ggccagggct tatacgtgcc tgggactccc aaagtattac tgttccatgt 480 tcccggcgaa gggccagctg tcccccgcca gctagactca gcacttagtt taggaaccag 540 tgagcaagtc agcccttggg gcagcccata caaggccatg gggctgggca agctgcacgc 600 ctgggtccgg ggtgggcacg gtgcccgggc aacgagctga aagctcatct gctctcaggg 660 gcccctccct ggggacagcc cctcctggct agtcacaccc tgtaggctcc tctatataac 720 ccaggggcac aggggctgcc ctcattctac caccacctcc acagcacaga cagacactca 780 ggagcagcca gc 792 <210> 121 <211> 714 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; truncated MCK <400> 121 ccactacggg tctaggctgc ccatgtaagg aggcaaggcc tggggacacc cgagatgcct 60 ggttataatt aaccccaaca cctgctgccc cccccccccc aacacctgct gcctgagcct 120 gagcggttac cccaccccgg tgcctgggtc ttaggctctg tacaccatgg aggagaagct 180 cgctctaaaa ataaccctgt ccctggtgga tccactacgg gtctatgctg cccatgtaag 240 gaggcaaggc ctggggacac ccgagatgcc tggttataat taaccccaac acctgctgcc 300 cccccccccc caacacctgc tgcctgagcc tgagcggtta ccccaccccg gtgcctgggt 360 cttaggctct gtacaccatg gaggagaagc tcgctctaaa aataaccctg tccctggtgg 420 accactacgg gtctaggctg cccatgtaag gaggcaaggc ctggggacac ccgagatgcc 480 tggttataat taaccccaac acctgctgcc cccccccccc aacacctgct gcctgagcct 540 gagcggttac cccaccccgg tgcctgggtc ttaggctctg tacaccatgg aggagaagct 600 cgctctaaaa ataaccctgt ccctggtcct ccctggggac agcccctcct ggctagtcac 660 accctgtagg ctcctctata taacccaggg gcacaggggc tgcccccggg tcac 714 <210> 122 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 122 acagatacct gttcaagcaa gtggc 25 <210> 123 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 123 tcaatctcag gcttggc 17 <210> 124 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; primer <400> 124 caatattgag ccatcagtc 19 <210> 125 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 125 agtgtg 6 <210> 126 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> synthetic construct; linker <400> 126 cagacactgg aa 12 <210> 127 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> synthetic construct; capsid sequence <400> 127 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Ser Pro Val Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro 180 185 190 Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr 405 410 415 Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu 450 455 460 Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met 530 535 540 Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala 580 585 590 Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu

Claims (35)

  1. 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열을 포함하는 핵산 조성물로서, 상기 마이크로디스트로핀 단백질은 아미노 말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인: ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT을 포함하거나 이로 구성되고, ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R3은 디스트로핀의 스펙트린 3 영역이고, H3은 디스트로핀의 힌지 3 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, H4는 디스트로핀의 힌지 4 영역이고, CR은 디스트로핀의 시스테인-풍부 영역 또는 이의 β-디스트로글리칸 결합 부분이고, 그리고 CT는 디스트로핀의 C-말단 영역 또는 α1-신트로핀 결합 부위 또는 디스트로브레빈 결합 부위를 포함하는 C-말단 영역의 일부인, 핵산 조성물.
  2. 제1항에 있어서, (1) 서열번호: 1, 79 또는 91의 아미노산 서열을 갖는 마이크로디스트로핀 단백질을 코딩하는 핵산 서열, 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 치료적으로 기능적인 마이크로디스트로핀 단백질을 인코딩하는 그의 역보체를 포함하거나, 또는 (2) 서열번호: 20, 81 또는 100의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 상기 핵산 서열은 치료적으로 기능적인 마이크로디스트로핀 단백질을 인코딩하는, 핵산 조성물.
  3. 제1항 또는 제2항에 있어서, (1) CT 도메인을 인코딩하는 핵산 서열은 서열번호: 35의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CT 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 α1-신트로핀 및/또는 디스트로브레빈에 대한 마이크로디스트로핀 단백질의 결합을 증가시키고; CT 도메인을 인코딩하는 상기 핵산 서열은 서열번호: 70의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CT 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 α1-신트로핀 및/또는 디스트로브레빈에 대한 마이크로디스트로핀 단백질의 결합을 증가시키거나; 또는 최소 CT 도메인을 인코딩하는 상기 핵산 서열은 서열번호: 80의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CT 도메인 서열이 결여된 기준 마이크로디스트로핀에 비해 α1-신트로핀에 대한 마이크로디스트로핀 단백질의 결합을 증가시키고; 또는 (2) CT 도메인을 인코딩하는 핵산은 서열번호: 16 또는 83의 아미노산 서열을 인코딩하거나 서열번호: 84의 아미노산 서열을 포함하는, 핵산 조성물.
  4. 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열의 5' 말단에 커플링된 인트론(I)을 포함하는 핵산 서열을 포함하는 핵산 조성물로서, 상기 마이크로디스트로핀 단백질은 아미노 말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인: ABD-H1-R1-R2-R3-H3-R24-H4-CR을 포함하거나 이로 구성되고, ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R3은 디스트로핀의 스펙트린 3 영역이고, H3은 디스트로핀의 힌지 3 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, H4는 디스트로핀의 힌지 4 영역이고, CR은 디스트로핀의 시스테인-풍부 영역인, 핵산 조성물.
  5. 제4항에 있어서, (1) 서열번호: 2의 아미노산 서열을 갖는 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나, 또는 (2) 서열번호: 21의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 상기 핵산은 치료적으로 기능적인 디스트로핀을 인코딩하는, 핵산 조성물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, (1) CR 도메인을 인코딩하는 핵산 서열은 서열번호: 34 또는 69의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CR 도메인 서열이 결여된 기준 마이크로디스트로핀 단백질에 비해 β-디스트로글리칸 에 결합하는 마이크로디스트로핀 단백질을 증가시키고; (2) CR 도메인을 인코딩하는 핵산 서열은 서열번호: 100 또는 109의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 그리고 CR 도메인 서열이 결여된 기준 마이크로디스트로핀 단백질에 비해 β-디스트로글리칸에 결합하는 마이크로디스트로핀을 증가시키고; 또는 (2) CR 도메인을 인코딩하는 핵산 서열은 서열번호: 15 또는 90의 아미노산 서열을 포함하거나 이로 구성된 CR 도메인을 인코딩하는, 핵산 조성물.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, ABD를 인코딩하는 상기 핵산 서열은 서열번호: 22 또는 57 또는 서열번호: 22 또는 57에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H1을 인코딩하는 핵산 서열은 서열번호: 24 또는 59 또는 서열번호: 24 또는 59에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R1을 인코딩하는 핵산 서열은 서열번호: 26 또는 61 또는 서열번호: 26 또는 61에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R2를 인코딩하는 핵산 서열은 서열번호: 27 또는 62 또는 서열번호: 27 또는 62에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R3을 인코딩하는 핵산 서열은 서열번호: 29 또는 64 또는 서열번호: 29 또는 64에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H2를 인코딩하는 핵산 서열은 서열번호: 38 또는 서열번호: 38에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H3을 인코딩하는 핵산 서열은 서열번호: 30 또는 65 또는 서열번호: 30 또는 65에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; R24를 인코딩하는 핵산 서열은 서열번호: 32 또는 67 또는 서열번호: 32 또는 67에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; H4를 인코딩하는 핵산 서열은 서열번호: 33 또는 68 또는 서열번호: 33 또는 68에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열로 구성되고; CR을 인코딩하는 핵산 서열은 서열번호: 34, 69, 100 또는 109 또는 서열번호: 34, 69, 100 또는 109에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; CT를 인코딩하는 핵산 서열은, 존재할 경우, 서열번호: 35, 70, 또는 80 또는 서열번호: 35, 70, 또는 80에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열로 구성되고; 그리고 선택적으로, I 핵산 서열은 서열번호: 41의 핵산 서열 또는 마이크로디스트로핀을 인코딩하는 핵산 서열의 5' 말단에서 커플링된 서열번호: 41에 대해 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99% 동일성을 갖는 서열인, 핵산 조성물.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, ABD를 인코딩하는 상기 핵산 서열은 서열번호: 22 또는 57로 구성되고; H1을 인코딩하는 핵산 서열은 서열번호: 24 또는 59로 구성되고; R1을 인코딩하는 핵산 서열은 서열번호: 26 또는 61로 구성되고; R2를 인코딩하는 핵산 서열은 서열번호: 27 또는 62로 구성되고; R3을 인코딩하는 핵산 서열은 서열번호: 29 또는 64로 구성되고; H2를 인코딩하는 핵산 서열은 서열번호: 38로 구성되고; H3을 인코딩하는 핵산 서열은 서열번호: 30 또는 65로 구성되고; H4를 인코딩하는 핵산 서열은 서열번호: 33 또는 68로 구성되고; R24를 인코딩하는 핵산 서열은 서열번호: 32 또는 67로 구성되고; CR을 인코딩하는 핵산 서열은 서열번호: 34, 69, 100, 또는 109로 구성되고; I는 서열번호: 41로 구성되고/되거나; CT를 인코딩하는 핵산 서열은 서열번호: 35, 70 또는 80으로 구성되는, 핵산 조성물.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 마이크로 디스트로핀 단백질은 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 서열: ABD-L1-H1-L2-R1-R2-L3-R3-H3-L4-R24-H4-CR-CT 또는 ABD-L1-H1-L2-R1-R2-L3-R3-H3-L4-R24-H4-CR을 포함하거나 이로 구성되고, 여기서 L1, L2, L3, 및 L4는 링커인, 핵산 조성물.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, L1을 인코딩하는 상기 핵산 서열은 서열번호: 23 또는 58을 포함하거나 이로 구성되고, L2를 인코딩하는 핵산 서열은 서열번호: 25 또는 60을 포함하거나 이로 구성되고, L3을 인코딩하는 핵산 서열은 서열번호: 28 또는 63을 포함하거나 이로 구성되고, 그리고 L4를 인코딩하는 핵산 서열은 서열번호: 31, 36, 37, 66, 71 또는 72를 포함하거나 이로 구성되는, 핵산 조성물.
  11. 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열을 포함하는 핵산 조성물로서, 상기 마이크로디스트로핀 단백질은 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인: ABD-H1-R1-R2-R16-R17-R24-H4-CR을 포함하거나 이로 구성되고, 여기서 ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R16은 디스트로핀의 스펙트린 16 영역이고, R17은 디스트로핀의 스펙트린 17 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, H4는 디스트로핀의 힌지 4 영역이고, 그리고 CR은 디스트로핀의 시스테인-풍부 영역인, 핵산 조성물.
  12. 제11항에 있어서, CR 도메인의 C-말단 말단에 α1-신트로핀 결합 부위 및/또는 디스트로브레빈 결합 부위를 포함하는 CT 도메인을 인코딩하는 뉴클레오티드 서열을 추가로 포함하는, 핵산 조성물.
  13. 제11항 또는 제12항에 있어서, (1) 서열번호: 92 또는 93의 아미노산 서열을 갖는 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나, 또는 (2) 서열번호: 102 또는 103의 핵산 서열 또는 그와 적어도 90%, 95% 또는 98% 동일한 핵산 서열 또는 그의 역보체를 포함하거나 이로 구성되고, 상기 핵산은 치료적으로 기능적인 디스트로핀을 인코딩하는, 핵산 조성물.
  14. 제1항 내지 제3항 또는 제6항 내지 제13항 중 어느 한 항에 있어서, 마이크로디스트로핀 단백질을 인코딩하는 핵산 서열의 5' 말단에 커플링된 인트론(I)을 추가로 포함하고, 선택적으로, I는 마이크로디스트로핀 인코딩 서열의 5'에 위치한 인간 면역글로불린 중쇄 가변 영역 (VH) 4 인트론 (VH4) 또는 SV40 인트론 또는 키메라 인트론인, 핵산 조성물.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 핵산은 마이크로디스트로핀 단백질을 코딩하는 핵산 서열에 작동가능하게 연결된 근육 및/또는 CNS 조직에서 발현을 촉진하는 전사 조절 요소를 포함하는 핵산 벡터인, 핵산 조성물.
  16. 제15항에 있어서, 상기 프로모터는 SPc5-12 또는 그의 전사적 활성 부분인, 핵산 조성물.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 핵산은 5'로부터 3'으로: (i) AAV ITR - 전사 조절 요소 - N-말단으로부터 C-말단까지 배열된 마이크로디스트로핀 도메인을 인코딩하는 핵산 서열 ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT- 폴리아데닐화 서열 - AAV ITR; (ii) AAV ITR-전사 조절 요소 - N-말단으로부터 C-말단까지 배열된 마이크로디스트로핀 도메인을 인코딩하는 핵산 서열 ABD-H1-R1-R2-R3-H3-R24-H4-CR - 폴리아데닐화 서열 - AAV ITR; (iii) AAV ITR - 전사 조절 요소 - N-말단으로부터 C-말단까지 배열된 마이크로디스트로핀 도메인을 인코딩하는 핵산 서열 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT- 폴리아데닐화 서열 - AAV ITR; 또는 (iv) AAV ITR-전사 조절 요소-N-말단으로부터 C-말단까지 배열된 마이크로디스트로핀 도메인을 인코딩하는 핵산 서열 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT - 폴리아데닐화 서열 - AAV ITR을 포함하는 AAV 벡터 뉴클레오티드 서열을 포함하고, 상기 AAV ITR은 선택적으로 AAV2 ITR인, 핵산 조성물.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 뉴클레오티드 서열은 CpG 서열에 대해 코돈 최적화되고/되거나 고갈되는, 핵산 조성물.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 서열번호: 53, 54, 55, 56, 82, 104, 105, 또는 106의 핵산 서열을 포함하는, 핵산 조성물.
  20. 제1항 내지 제19항 중 어느 한 항의 핵산 조성물을 포함하는 발현 카세트를 포함하는, rAAV 입자.
  21. 제20항에 있어서, 캡시드 단백질은 서열번호: 77 (AAV8 캡시드)과 적어도 95% 동일한 아미노산 서열을 갖거나, 서열번호: 77의 아미노산 서열을 갖거나, 서열번호: 78 (AAV9 캡시드)과 적어도 95% 동일한 아미노산 서열을 갖거나, 또는 서열번호: 78의 아미노산 서열을 갖는, rAAV 입자.
  22. 제20항 또는 제21항의 rAAV 입자의 치료 유효량 및 약제학적으로 허용 가능한 담체를 포함하는, 약제학적 조성물.
  23. 이식유전자를 세포에 전달하는 방법으로서, 방법은 세포를 제20항 또는 제21항의 rAAV 입자와 접촉시키는 단계를 포함하고, 상기 세포는 벡터와 접촉되는, 방법.
  24. 디스트로핀병증 치료를 필요로 하는 인간 대상체에서 디스트로핀병증을 치료하기 위한 약제학적 조성물로서, 제20항 또는 제21항의 rAAV 입자의 치료 유효량을 포함하고, 선택적으로 상기 rAAV 입자는 상기 대상체의 순환계, 근육 조직 또는 CNS에 투여하기 위해 제형화되는, 약제학적 조성물.
  25. 디스트로핀병증 치료를 필요로 하는 인간 대상체에서 디스트로핀병증을 치료하는 방법으로서,
    제20항 또는 제21항의 rAAV 입자의 치료 유효량을 포함하는 약제학적 조성물을 대상체에게 투여하는 단계를 포함하되, 상기 투여는 상기 대상체의 근육 또는 CNS로의 마이크로디스트로핀 단백질의 전달을 초래하는, 방법.
  26. 제24항 또는 제25항에 있어서, 상기 디스트로핀병증은 DMD, BMD, X-관련 확장성 심근병증이거나 대상체는 DMD 또는 BMD의 여성 보인자인, 약제학적 조성물 또는 방법.
  27. 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인 ABD-H1-R1-R2-R3-H3-R24-H4-CR-CT을 포함하거나 이로 구성되는 마이크로디스트로핀 단백질로서, ABD는 디스트로핀의 액틴 결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R3은 디스트로핀의 스펙트린 3 영역이고, H3은 디스트로핀의 힌지 3 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, CR은 디스트로핀의 시스테인-풍부 영역이고, 그리고 CT는 α1-신트로핀 결합 부위 또는 디스트로브레빈 결합 부위를 포함하는 디스트로핀의 C-말단 영역의 적어도 일부인, 마이크로디스트로핀 단백질.
  28. 제27항에 있어서, 서열번호: 1, 79, 또는 91의 아미노산 서열을 포함하거나 이로 구성되는, 마이크로디스트로핀 단백질.
  29. 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인 ABD-H1-R1-R2-R16-R17-R24-H4-CR을 포함하거나 이로 구성되는 마이크로디스트로핀 단백질로서, ABD는 디스트로핀의 액틴-결합 도메인이고, H1은 디스트로핀의 힌지 1 영역이고, R1은 디스트로핀의 스펙트린 1 영역이고, R2는 디스트로핀의 스펙트린 2 영역이고, R16은 디스트로핀의 스펙트린 16 영역이고, R17은 디스트로핀의 스펙트린 17 영역이고, R24는 디스트로핀의 스펙트린 24 영역이고, 그리고 CR은 디스트로핀의 시스테인-풍부 영역인, 마이크로디스트로핀 단백질.
  30. 제29항에 있어서, 아미노-말단으로부터 카복시 말단까지 배열된 디스트로핀 도메인 ABD-H1-R1-R2-R16-R17-R24-H4-CR-CT을 포함하거나 이로 구성되는 마이크로디스트로핀 단백질로서, CT는 α1-신트로핀 결합 부위 또는 디스트로브레빈 결합 부위를 포함하는 디스트로핀의 C-말단 영역의 적어도 일부인, 마이크로디스트로핀 단백질.
  31. 제29항 또는 제30항에 있어서, 서열번호: 92 또는 93의 아미노산 서열을 포함하거나 이로 구성되는, 마이크로디스트로핀 단백질.
  32. 디스트로핀병증의 치료를 필요로 하는 인간 대상체에서 디스트로핀병증을 치료하는 방법으로서, 제27항 내지 제31항 중 어느 한 항에 따른 마이크로디스트로핀 단백질의 치료 유효량을 상기 인간 대상체의 순환계, 근육 조직 및/또는 뇌척수액에 전달하는 단계를 포함하는, 방법.
  33. 인간 대상체에서 디스트로핀병증의 치료용 약제학적 조성물로서, 상기 인간 대상체의 순환계, 근육 조직 및/또는 뇌척수액으로의 전달을 위해 제형화된 제27항 내지 제31항 중 어느 한 항에 따른 마이크로디스트로핀 단백질의 치료 유효량을 포함하는, 약제학적 조성물.
  34. 재조합 AAV를 생성하는 방법으로서,
    (a) 다음을 함유하는 숙주 세포를 배양하는 단계:
    (i) 시스 발현 카세트를 포함하는 인공 게놈으로서, 상기 시스 발현 카세트는 제17항 내지 제19항 중 어느 한 항의 핵산 조성물을 포함하는, 인공 게놈;
    (ii) AAV ITR이 결여된 트랜스 발현 카세트로서, 상기 트랜스 발현 카세트는 배양 중인 숙주 세포에서 AAV rep 및 캡시드 단백질의 발현을 유도하고 rep 및 cap 단백질을 트랜스로 공급하는 발현 조절 요소에 작동가능하게 연결된 AAV rep 및 캡시드 단백질을 인코딩하는, 트랜스 발현 카세트;
    (iii) AAV 캡시드 단백질에 의한 인공 게놈의 복제 및 패키징을 허용하기 위한 충분한 아데노바이러스 헬퍼 기능; 및
    (b) 세포 배양물로부터 인공 게놈을 캡슐화하는 재조합 AAV를 회수하는 단계
    를 포함하는, 방법.
  35. 숙주 세포로서,
    a. 시스 발현 카세트를 포함하는 인공 게놈으로서, 상기 시스 발현 카세트는 제17항 내지 제19항 중 어느 한 항의 핵산 조성물을 포함하는, 인공 게놈;
    b. AAV ITR이 결여된 트랜스 발현 카세트로서, 배양 중인 숙주 세포에서 AAV rep 및 캡시드 단백질의 발현을 유도하고 rep 및 cap 단백질을 트랜스로 공급하는 발현 조절 요소에 작동가능하게 연결된 AAV rep 및 캡시드 단백질을 인코딩하는, 트랜스 발현 카세트; 및
    c. AAV 캡시드 단백질에 의한 인공 게놈의 복제 및 패키징을 허용하기 위한 충분한 아데노바이러스 헬퍼 기능
    을 포함하는, 숙주 세포.
KR1020227021099A 2019-11-28 2020-11-27 마이크로디스트로핀 유전자 치료 작제물 및 이의 용도 KR20220107222A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962941719P 2019-11-28 2019-11-28
US62/941,719 2019-11-28
US202063024933P 2020-05-14 2020-05-14
US63/024,933 2020-05-14
PCT/US2020/062484 WO2021108755A2 (en) 2019-11-28 2020-11-27 Microdystrophin gene therapy constructs and uses thereof

Publications (1)

Publication Number Publication Date
KR20220107222A true KR20220107222A (ko) 2022-08-02

Family

ID=74206146

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227021099A KR20220107222A (ko) 2019-11-28 2020-11-27 마이크로디스트로핀 유전자 치료 작제물 및 이의 용도

Country Status (11)

Country Link
US (1) US20230270886A1 (ko)
EP (1) EP4065596A2 (ko)
JP (1) JP2023503637A (ko)
KR (1) KR20220107222A (ko)
AU (1) AU2020392243A1 (ko)
BR (1) BR112022009895A2 (ko)
CA (1) CA3159516A1 (ko)
CL (1) CL2022001372A1 (ko)
MX (1) MX2022006427A (ko)
TW (1) TW202134260A (ko)
WO (1) WO2021108755A2 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR121954A1 (es) 2020-04-29 2022-07-27 Bristol Myers Squibb Co Distrofinas miniaturizadas con dominios de fusión de espectrina y usos de las mismas
WO2022076750A2 (en) 2020-10-07 2022-04-14 Regenxbio Inc. Recombinant adeno-associated viruses for cns or muscle delivery
WO2022232141A1 (en) * 2021-04-26 2022-11-03 Regenxbio Inc. Microdystrophin gene therapy administration for treatment of dystrophinopathies
WO2022261143A2 (en) * 2021-06-07 2022-12-15 University Of Florida Research Foundation, Incorporated Gene therapy for duchenne muscular dystrophy
KR20240023643A (ko) * 2021-06-23 2024-02-22 신프로믹스 엘티디 조절 핵산 서열
EP4373947A1 (en) * 2021-07-19 2024-05-29 New York University Auf1 combination therapies for treatment of muscle degenerative disease
AU2022328215A1 (en) * 2021-08-11 2024-03-07 Solid Biosciences Inc. Treatment of muscular dystrophy
WO2023019168A1 (en) * 2021-08-11 2023-02-16 Ultragenyx Pharmaceutical Inc. Compositions and methods for treating a muscular dystrophy
AU2022358523A1 (en) * 2021-09-30 2024-03-14 The Board Of Regents Of The Universityof Texas System Slc13a5 gene therapy vectors and uses thereof
WO2023060269A1 (en) 2021-10-07 2023-04-13 Regenxbio Inc. Recombinant adeno-associated viruses for targeted delivery
WO2023064947A1 (en) 2021-10-15 2023-04-20 Regenxbio Inc. Antibodies and methods of using thereof
TW202337476A (zh) * 2022-01-17 2023-10-01 瑞士商迪納柯公司 用於與肌肉萎縮蛋白有關之心肌病之基因療法組合物及治療
WO2023141582A1 (en) 2022-01-21 2023-07-27 Regenxbio Inc. Engineered promoters
EP4230196A1 (en) 2022-02-21 2023-08-23 Som Innovation Biotech, S.A. Compounds for use in the treatment of dystrophinopathies
WO2023183623A1 (en) 2022-03-25 2023-09-28 Regenxbio Inc. Dominant-negative tumor necrosis factor alpha adeno-associated virus gene therapy
WO2023248251A1 (en) * 2022-06-24 2023-12-28 Indian Institute Of Technology Kanpur An optimized aav vector for gene therapy of muscular dystrophy
WO2024044725A2 (en) 2022-08-24 2024-02-29 Regenxbio Inc. Recombinant adeno-associated viruses and uses thereof
WO2024081746A2 (en) 2022-10-11 2024-04-18 Regenxbio Inc. Engineered nucleic acid regulatory elements and methods and uses thereof
WO2024091495A1 (en) * 2022-10-24 2024-05-02 Biogen Ma Inc. Compositions and methods for treating retinitis pigmentosa
CN115838725B (zh) * 2022-12-30 2023-09-08 广州派真生物技术有限公司 在哺乳动物心脏中特异性启动基因的启动子序列及其应用

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE403715T1 (de) 1999-08-09 2008-08-15 Targeted Genetics Corp Erhöhung der expression einer einzelsträngigen, heterologen nukleotidsequenz von einem rekombinanten viralen vektor durch ausgestaltung der sequenz in einer art und weise, dass basenpaarungen innerhalb der sequenz entstehen
DK1310571T3 (da) 2001-11-13 2006-06-19 Univ Pennsylvania Fremgangsmåde til identifikation af ukendte adeno-associerede virussekvenser (AAV-sekvenser) og et kit til fremgangsmåden
EP1453547B1 (en) 2001-12-17 2016-09-21 The Trustees Of The University Of Pennsylvania Adeno-associated virus (aav) serotype 8 sequences, vectors containing same, and uses therefor
ES2411479T3 (es) 2003-09-30 2013-07-05 The Trustees Of The University Of Pennsylvania Clados de virus adeno-asociados (AAV), secuencias, vectores que los contienen, y usos de los mismos
US7183969B2 (en) 2004-12-22 2007-02-27 Raytheon Company System and technique for calibrating radar arrays
EP3085389A1 (en) 2005-04-07 2016-10-26 The Trustees Of The University Of Pennsylvania Method of increasing the function of an aav vector
EP1777906A1 (en) 2005-06-09 2007-04-25 Matsushita Electric Industrial Co., Ltd. Amplitude error compensating apparatus and orthogonality error compensating apparatus
CN101711164B (zh) * 2007-01-18 2014-06-04 密苏里-哥伦比亚大学 可修复肌纤维膜中的神经元型一氧化氮合酶的合成小/微-抗肌萎缩蛋白基因
US8642314B2 (en) 2008-02-19 2014-02-04 Amsterdam Molecular Therapeutics (Amt) B.V. Optimization of expression of parvoviral rep and cap proteins in insect cells
DK2425000T3 (da) 2009-04-30 2019-05-13 Univ Pennsylvania Sammensætninger rettet mod ledende luftvejsceller omfattende konstrukter af adeno-associeret virus
WO2010138263A2 (en) 2009-05-28 2010-12-02 University Of Massachusetts Novel aav 's and uses thereof
US8628966B2 (en) 2010-04-30 2014-01-14 City Of Hope CD34-derived recombinant adeno-associated vectors for stem cell transduction and systemic therapeutic gene transfer
US8927514B2 (en) 2010-04-30 2015-01-06 City Of Hope Recombinant adeno-associated vectors for targeted treatment
EP2634253B1 (en) 2010-10-27 2016-05-11 Jichi Medical University Adeno-associated virus virions for transferring genes into neural cells
US9409953B2 (en) 2011-02-10 2016-08-09 The University Of North Carolina At Chapel Hill Viral vectors with modified transduction profiles and methods of making and using the same
EP2699270B1 (en) 2011-04-22 2017-06-21 The Regents of The University of California Adeno-associated virus virions with variant capsid and methods of use thereof
EP3795581A3 (en) 2011-08-24 2021-06-09 The Board of Trustees of the Leland Stanford Junior University New avv capsid proteins for nucleic acid transfer
JP6385920B2 (ja) 2012-05-09 2018-09-05 オレゴン ヘルス アンド サイエンス ユニバーシティー アデノ随伴ウイルスプラスミド及びベクター
JP2016514152A (ja) 2013-03-13 2016-05-19 ザ・チルドレンズ・ホスピタル・オブ・フィラデルフィア アデノ随伴ウイルスベクターおよびその使用の方法
KR102268473B1 (ko) 2013-04-20 2021-06-25 더 리서치 인스티튜트 앳 네이션와이드 칠드런스 하스피탈 엑손 2-표적 U7snRNA 폴리뉴클레오티드 작제물의 재조합형 아데노 부속 바이러스 전달
IL297919A (en) 2013-07-22 2023-01-01 Childrens Hospital Philadelphia Modified Aav and preparations, methods and uses for gene transfer to cells, organs and tissues
EP3044318B1 (en) 2013-09-13 2019-05-01 California Institute of Technology Selective recovery
ES2857751T3 (es) 2013-10-11 2021-09-29 Massachusetts Eye & Ear Infirmary Métodos para predecir secuencias de virus ancestrales y usos de los mismos
US10746742B2 (en) 2014-04-25 2020-08-18 Oregon Health & Science University Methods of viral neutralizing antibody epitope mapping
WO2015191508A1 (en) 2014-06-09 2015-12-17 Voyager Therapeutics, Inc. Chimeric capsids
BR112017005892A2 (pt) 2014-09-24 2017-12-12 Hope City variantes de vetor de vírus adeno-associado para edição de genoma de alta eficácia e métodos da mesma
JP6832280B2 (ja) * 2015-01-16 2021-02-24 ユニバーシティ オブ ワシントンUniversity of Washington 新規のマイクロジストロフィンおよび使用の関連する方法
GB201507842D0 (en) * 2015-05-07 2015-06-17 New Royal Holloway & Bedford Production of large-sized microdystrophins in an AAV-based vector configuration
JP6665466B2 (ja) 2015-09-26 2020-03-13 日亜化学工業株式会社 半導体発光素子及びその製造方法
WO2017070491A1 (en) 2015-10-23 2017-04-27 Applied Genetic Technologies Corporation Ophthalmic formulations
US20200199621A1 (en) * 2017-03-17 2020-06-25 Research Institute At Nationwide Children's Hospital Adeno-associated virus vector delivery of muscle specific micro-dystrophin to treat muscular dystrophy
JP7467356B2 (ja) 2018-02-07 2024-04-15 ジェネトン ハイブリッド調節要素

Also Published As

Publication number Publication date
BR112022009895A2 (pt) 2022-08-09
JP2023503637A (ja) 2023-01-31
AU2020392243A1 (en) 2022-06-16
TW202134260A (zh) 2021-09-16
MX2022006427A (es) 2022-09-07
CL2022001372A1 (es) 2023-01-13
US20230270886A1 (en) 2023-08-31
WO2021108755A2 (en) 2021-06-03
WO2021108755A3 (en) 2021-07-08
CA3159516A1 (en) 2021-06-03
EP4065596A2 (en) 2022-10-05

Similar Documents

Publication Publication Date Title
KR20220107222A (ko) 마이크로디스트로핀 유전자 치료 작제물 및 이의 용도
KR102427379B1 (ko) 헌팅톤 질환을 치료하기 위한 조성물 및 방법
JP7452953B2 (ja) 1色覚および他の疾患の治療のためのプロモーター、発現カセット、ベクター、キット、ならびに方法
KR20220007056A (ko) 뇌에서 증진된 특이성을 갖는 바이러스 조성물
KR20220133854A (ko) 유전적 청력 상실 치료를 위한 아데노 관련 바이러스(aav) 시스템
KR20210068014A (ko) 레버 유전성 시신경병증의 치료를 위한 조성물 및 방법
KR20220140537A (ko) Cdkl5 결핍 장애를 치료하기 위한 유전자 요법
CN113613668A (zh) 小型化肌营养不良蛋白及其用途
CN111936172A (zh) 用于治疗视网膜病症的组合物和方法
CN116134134A (zh) 用于治疗c9orf72相关疾病的三功能腺伴随病毒(aav)载体
CN116685329A (zh) 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途
KR20240004564A (ko) 디스트로핀병증의 치료를 위한 마이크로디스트로핀 유전자 치료법 투여
KR20230003557A (ko) 스펙트린 융합 도메인을 갖는 소형화 디스트로핀 및 그의 용도
IL293334A (en) Gene therapy constructs with microdystrophin and their uses
US20220347317A1 (en) Aavrh74 vectors for gene therapy of muscular dystrophies
WO2023004331A1 (en) Auf1 combination therapies for treatment of muscle degenerative disease
WO2024020574A2 (en) Auf1 gene therapy for limb girdle muscular dystrophy
WO2023212643A1 (en) Method for expressing a muscle-specific gene and cassettes for same
EA046419B1 (ru) Миниатюризированные дистрофины и их применения
NZ713958B2 (en) Promoters, expression cassettes, vectors, kits, and methods for the treatment of achromatopsia and other diseases

Legal Events

Date Code Title Description
A201 Request for examination