KR20220035937A - 조절 가능한 발현 시스템 - Google Patents

조절 가능한 발현 시스템 Download PDF

Info

Publication number
KR20220035937A
KR20220035937A KR1020227005340A KR20227005340A KR20220035937A KR 20220035937 A KR20220035937 A KR 20220035937A KR 1020227005340 A KR1020227005340 A KR 1020227005340A KR 20227005340 A KR20227005340 A KR 20227005340A KR 20220035937 A KR20220035937 A KR 20220035937A
Authority
KR
South Korea
Prior art keywords
seq
nucleic acid
vector
aav
sequence
Prior art date
Application number
KR1020227005340A
Other languages
English (en)
Inventor
마틴 바이벨
캐롤라인 구프저 켈러
드미트리 루카세프
니콜 리노드
니키타 루딘스키
라지브 시바산카란
Original Assignee
노파르티스 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노파르티스 아게 filed Critical 노파르티스 아게
Publication of KR20220035937A publication Critical patent/KR20220035937A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0618Cells of the nervous system
    • C12N5/0619Neurons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0618Cells of the nervous system
    • C12N5/0622Glial cells, e.g. astrocytes, oligodendrocytes; Schwann cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/60Vectors containing traps for, e.g. exons, promoters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/002Vectors comprising a special translation-regulating system controllable or inducible

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Neurology (AREA)
  • Virology (AREA)
  • Neurosurgery (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

조절 가능한 유전자 발현을 위한 스플라이스 조절자 결합 서열을 포함하는 미니유전자를 포함하는 조성물, 및 이를 사용하는 시스템 및 방법이 본원에 제공된다.

Description

조절 가능한 발현 시스템
서열 목록
본 출원에는 ASCII 형식으로 전자 제출되었고 그 전체가 본원에 참조로 포함되는 서열 목록이 포함된다. 2020년 7월 22일에 생성된 상기 ASCII 사본의 파일명은 PAT058643-WO-PCT_SL.txt이고 크기는 108,491 바이트이다.
기술분야
조절 가능한 유전자 발현을 위한 미니유전자를 포함하는 조성물, 및 이를 사용하는 시스템 및 방법이 본원에 개시된다.
목적하는 유전자 산물의 발현을 증가시키기 위해 유전 물질(예: 이종 핵산)을 표적 세포에 전달하는 유전자 치료 방법은 본 치료 목적을 뒷받침할 수 있다. 바이러스는 감염된 숙주에 의한 면역감시를 피하면서 핵산을 특정 세포 유형에 전달하는 데 매우 효율적이 되도록 진화되어 왔다. 문헌[Robbins et al., (1998) Pharmacol. Ther., 80(1):35-47]. 이러한 특성으로 인해 바이러스는 유전자 요법을 위한 전달 비히클 또는 벡터로서 매력적이다. 레트로바이러스, 아데노바이러스, 아데노 관련 바이러스(AAV), 및 단순 헤르페스 바이러스를 비롯한 여러 유형의 바이러스가 유전자 요법 분야에 사용하기 위해 실험실에서 변형되어 왔다. 문헌[Lunstrom et al., (2018) Diseases, 6(2): 42]. 특히, 아데노 관련 바이러스(AAV)에서 유래된 벡터는 (i) 근섬유와 뉴런을 포함한 다양한 비분열 및 분열 세포 유형을 감염(형질도입)시킬 수 있다는 점; (ii) 바이러스 구조 유전자가 없어 바이러스 감염에 대한 자연적인 숙주 세포 반응(예: 인터페론 매개 반응)을 제거한다는 점; (iii) 야생형 바이러스는 인간의 어떤 병리와도 관련이 없었다는 점; (iv) 숙주 세포 게놈에 통합할 수 있는 야생형 AAV와 달리, 복제-결핍 AAV 벡터는 일반적으로 에피솜으로서 지속되어 삽입 돌연변이 유발 또는 종양유전자 활성화의 위험을 제한한다는 점; 및 (v) 다른 벡터 시스템과 달리, AAV 벡터는 상당한 면역 반응을 일으키지 않으므로(ii 참조), (유전자 산물이 거부되지 않는 한) 예를 들어 치료용 이종 핵산(들)의 장기간 발현을 가능하게 한다는 점 때문에 유전 물질을 효과적으로 전달할 수 있다. 문헌[Wold et al., (2013) Curr. Gene Ther., 13(6):421-33; Lee et al., (2017) Genes Dis., 4(2): 43-63].
AAV는 파르보바이러스과의 구성원이다. AAV 게놈은 선형 단일가닥 DNA 분자를 포함하고, 이는 일반적으로 약 4.7 킬로베이스(kb)를 함유하고 비구조적 Rep(복제) 및 구조적 Cap(캡시드) 단백질을 암호화하는 2개의 주요 오픈 리딩 프레임을 함유한다. AAV 암호화 영역의 양측에는 2개의 시스-작용 역위 말단 반복(ITR) 서열이 있고, 이들은 일반적으로 약 145개 뉴클레오티드 길이이고, DNA 복제 개시 중에 프라이머 역할을 하는 헤어핀 구조로 접힐 수 있는 불연속적 회문 서열을 갖는다. DNA 복제에서의 역할 외에도, ITR 서열은 바이러스 통합, 숙주 게놈으로부터의 구조, 및 바이러스 핵산의 성숙 비리온으로의 캡슐화에 기여하는 것으로 나타났다. 문헌[Muzyczka et al., (1992) Curr. Top. Micro. Immunol., 158:97-129].
질병을 예방하거나 치료하기 위한 중요한 과학적 연구 도구 또는 약물인 많은 단백질이 개발되어왔다. AAV와 같은 바이러스 벡터는 다양한 세포 유형을 형질도입할 수 있다는 점과 이러한 단백질을 암호화하는 이종 핵산을 다양한 표적 조직 유형에 전달할 수 있다는 점에서 바람직하지만, 단백질 발현시 예를 들어 약물 효능의 손실에서 심각한 독성에 이르기까지 다양한 부작용이 발생할 수 있다. 치료용 단백질의 발현 수준을 조절하여, 예를 들어 치료용 단백질의 발현 시기 또는 위치 및/또는 치료용 단백질의 수준을 조절하여 효능을 증가시키고/거나 부작용을 감소시키는 전략을 개발하는 것이 바람직하다.
따라서, 본 발명은 부분적으로, 관심 단백질의 발현을 턴오프 또는 턴온시키기 위해 소분자를 사용하여 단백질의 발현을 제어하는 데 유용한 미니유전자 뉴클레오티드 서열을 제공한다. 본 발명은 또한 이러한 미니유전자 서열을 포함하는 벡터, 재조합 바이러스, 및 제약 조성물을 제공하고, 유전자 발현을 조절하는 방법에 있어서 이들의 용도를 고려한다.
제1 양태에서, 관심 단백질을 암호화하는 이식유전자에 연결된 미니유전자를 포함하되, 미니유전자는 제1 엑손; 제1 인트론; 제2 엑손; 제2 인트론; 및 제3 엑손을 포함하고, 상기 제2 엑손은 스플라이스 조절자 결합 서열을 포함하고, 스플라이스 조절자의 존재하에 상기 제2 엑손은 핵산의 mRNA 산물에 포함되고, 상기 스플라이스 조절자의 부재하에 상기 제2 엑손은 핵산의 mRNA 산물에 포함되지 않는, 핵산 분자가 제공된다.
구현예에서, 제3 엑손은 스플라이스 조절자의 부재하에 생성된 핵산의 mRNA 산물에서 프레임 내에 있고 스플라이스 조절자의 존재하에 생성된 핵산의 mRNA 산물에서 프레임 내에 있지 않은 정지코돈을 포함한다.
구현예에서, 제2 엑손은 스플라이스 조절자의 존재하에 생성된 핵산의 mRNA 산물에서 프레임 내에 있는 정지코돈을 포함한다.
구현예에서, 제1 엑손 및 제3 엑손은 시작코돈을 포함하지 않는다. 일부 구현예에서, 제2 엑손은 시작코돈을 포함한다.
상기 양태 및 구현예 중 임의의 구현예에서, 핵산은 미니유전자와 이식유전자 사이에 배치된 프로테아제 절단 부위를 암호화하는 서열을 포함한다.
구현예에서, 상기 프로테아제 절단 부위는 포유류 프로테아제에 의해 절단된다.
구현예에서, 포유류 프로테아제는 푸린, PCSK1, PCSK5, PCSK6, PCSK7, 카텝신 B, 그랜자임 B, 인자 XA, 엔테로키나제, 제네나제, 소르타제, 프리시젼 프로테아제, 트롬빈, TEV 프로테아제, 또는 엘라스타제 1이다.
상기 양태 및 구현예 중 임의의 구현예에서, 프로테아제 절단 부위는 RX(K/R)R 공통 모티프, RXXX[KR]R 공통 모티프, RRX 공통 모티프, RNRR(서열번호 39), I-E-P-D-X 공통 모티프(서열번호 35), Glu/Asp-Gly-Arg, Asp-Asp-Asp-Asp-Lys(서열번호 36), Pro-Gly-Ala-Ala-His-Tyr(서열번호 37), LPXTG/A 공통 모티프, Leu-Glu-Val-Phe-Gln-Gly-Pro(서열번호 38), Leu-Val-Pro-Arg-Gly-Ser(서열번호 40), E-N-L-Y-F-Q-G(서열번호 41), 및 [AGSV]-x(서열번호 42)로 이루어진 군으로부터 선택되는 절단 모티프를 갖는 폴리펩티드를 포함한다. 구현예에서, 상기 절단 부위는 푸린에 의해 절단된다. 구현예에서, 푸린에 의해 절단되는 프로테아제 절단 부위는 RNRR(서열번호 39); RTKR(서열번호 43); GTGAEDPRPSRKRRSLGDVG(서열번호 45); GTGAEDPRPSRKRR(서열번호 47); LQWLEQQVAKRRTKR(서열번호 49); GTGAEDPRPSRKRRSLGG(서열번호 51); GTGAEDPRPSRKRRSLG(서열번호 53); SLNLTESHNSRKKR(서열번호 55); 또는 CKINGYPKRGRKRR(서열번호 57)이다. 구현예에서, 푸린에 의해 절단되는 프로테아제 절단 부위는 RNRR(서열번호 39)을 포함한다. 구현예에서, 프로테아제 절단 부위를 암호화하는 서열은 CGCAACCGCCGC(서열번호 19)를 포함한다(예를 들어 CGCAACCGCCGC(서열번호 19)로 이루어진다).
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 핵산은 미니유전자와 이식유전자 사이에 배치된 자가절단 펩티드를 암호화하는 서열을 포함하고, 임의적으로 자가절단 펩티드는 관심 단백질의 N-말단의 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 아미노산 내에서 절단한다. 구현예에서, 자가절단 펩티드는 T2A 펩티드, P2A 펩티드, E2A 펩티드, 및 F2A 펩티드로부터 임의적으로 선택되는 2A 펩티드이고, 예를 들어 T2A 펩티드를 포함하고, 예를 들어 자가절단 펩티드는 EGRGSLLTCGDVEENPGP(서열번호 61)를 포함하고, 임의적으로 자가절단 펩티드는 (GSG)EGRGSLLTCGDVEENPGP(서열번호 59)를 포함한다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 스플라이스 조절자 결합 서열은 제2 엑손의 3' 말단에 위치한다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 스플라이스 조절자 결합 서열은 AGA를 포함하고(예를 들어 AGA로 이루어지고), 스플라이스 조절자는 5-(1H-피라졸-4-일)-2-(6-((2,2,6,6-테트라메틸피페리딘-4-일)옥시)피리다진-3-일)페놀(LMI070)이다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 제2 엑손은
CCTTGCTATCCCTGTCTTCTGTAGCTATTCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 1);
GTAATTAGCTGAGAAGGAAGATCTGAAGGTTTAACGAGAGAGGGCGAGAGATACAAAATATCTGCTAGGAGA(서열번호 2);
GGATTGTTTGTATTCCTGCCAATGATTTGTGAGACAGTCTGTTCCCCACATCCTCGTCAACAGA(서열번호 3);
CTTTCTGACATCTTAACGAGGCAATACAGAGAGACGAATTTTCATCAGTTTGTTCAGGGAGACACATATAACAAAAGA(서열번호 4);
ATCCATACATACTTAATGCTGAAATGTGAAGGGCTGAGAAAAAAGAAAAGA(서열번호 5);
AATTGGAAACATCGAGGGAAAATGGGCTTTTTATTATTAAAACAAAACCTCAGTATTATCACTTAGAAACCTGAAATTGAACTCCAAAAGCCAAAGA(서열번호 6);
AAGAATGTTCCTTTTGTGAAGAATGACTTAAGGAAGATTCATGATGACTGAGTGTGCCCGTGTGGAACTTTAGGACATAGATGCACTCCTACAGA(서열번호 7);
TTGTCCTTCACTCCGTACTCCAGTTGGCCAAGCATAGGTCGCATGCCAGGGTCAAGGAGACTAAGGGAGA(서열번호 8);
GACATACAGACATGGCAGCCCCTAGCATGTGTATCCTAAGA(서열번호 9);
ACATACAGACATGGCAGCCCCTAGCATGTGTATCCTAAGA(서열번호 10);
AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGAATGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATGTCCTTGCTATCCCTGTCTTCTGTAGCTATTCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 80); 및
(a) 내지 (k) 중 어느 하나에 대한 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 갖는 단편 또는 돌연변이
로부터 선택되는 서열을 포함한다(예를 들어 이러한 서열로 이루어진다).
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 제2 엑손은 SNX7의 엑손에서 유래된 서열을 포함하고, 임의적으로 서열은 SNX7의 크립틱 엑손에서 유래된다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 제2 엑손은
AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGATTGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATTGTCCTTGCTATCCTGTCTTCTGTAGCTATCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 16);
서열번호 16의 단편; 또는
서열번호 16 또는 이의 단편에 대한 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 갖는 돌연변이 서열
을 포함한다(예를 들어 이러한 서열 또는 단편으로 이루어진다).
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 제2 엑손은
AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGATTGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATTGTCCTTGCTATCCTGTCTTCTGTAGCTATCTGAAACCATCAACAAAGGAGCACACCAT G GCATCAGCAAAAGA(서열번호 98);
서열번호 98의 단편; 또는
서열번호 98 또는 이의 단편에 대한 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 갖는 돌연변이 서열
을 포함한다(예를 들어 이러한 서열 또는 단편으로 이루어진다).
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 제2 엑손은 3n-1개의 뉴클레오티드로 이루어진다(n은 정수임).
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 제1 엑손은
1개 이상(예를 들어 3개)의 GAA 반복부(서열번호 69)(예를 들어 GAAGAAGAA(서열번호 69)를 포함함);
Kozak 서열(예를 들어 GCCACC(서열번호 70)를 포함하는 Kozak 서열); 또는
(a)와 (b) 둘 다
를 포함한다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 제1 엑손은
GAAGAAGAAGATATCAAGTTAGCATTTACAGATTTGGCTGAGGAGAAGAACAG(서열번호 96);
서열번호 96의 단편; 또는
서열번호 96 또는 이의 단편에 대한 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 갖는 돌연변이 서열
을 포함한다(예를 들어 이러한 서열 또는 단편으로 이루어진다).
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 제1 인트론은
GTAATTAGTGTTGTTTGATATTGCTTCATTTTAAAGTTATTTGCTCATTTAGCATTTGATATTGCTTTCTATTGATTGTCCTAACTACTCCTCTTTCCTCTCCCTTCTCCATTTTTGAAG(서열번호 97);
서열번호 97의 단편; 또는
서열번호 97 또는 이의 단편에 대한 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 갖는 돌연변이 서열
을 포함한다(예를 들어 이러한 서열 또는 단편으로 이루어진다).
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 미니유전자는
단일 시작코돈(예를 들어 ATG 시작코돈)을 제외한 모든 시작코돈을 제거하거나 돌연변이시키도록;
제1 엑손, 제2 엑손, 및 제3 엑손의 말단에 있는 것 이외의 모든 크립틱 스플라이스 공여체 및 스플라이스 수여체 서열을 제거하거나 돌연변이시키도록
변형되었다.
구현예에서, 미니유전자는 제1 엑손 내에 배치된 단일 시작코돈을 갖는다. 구현예에서, 미니유전자는 제2 엑손 내에 배치된 단일 시작코돈을 갖는다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 미니유전자는 2000개 미만, 1900개 미만, 1800개 미만, 1700개 미만, 1600개 미만, 1500개 미만, 1400개 미만, 1300개 미만, 1200개 미만, 1100개 미만, 또는 1000개 미만, 900개 미만, 800개 미만, 700개 미만, 600개 미만, 500개 미만의 뉴클레오티드를 포함한다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 미니유전자는 약 2500개 내지 약 500개의 뉴클레오티드, 예를 들어 약 2000개 내지 약 600개의 뉴클레오티드, 예를 들어 약 1500개 내지 약 700개의 뉴클레오티드, 예를 들어 약 1200개 내지 약 800개의 뉴클레오티드, 약 1100개 내지 약 900개의 뉴클레오티드, 약 800개 내지 약 500개의 뉴클레오티드, 약 800개 내지 약 600개의 뉴클레오티드를 포함한다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 미니유전자는 서열번호 71 또는 서열번호 94, 또는 이와 적어도 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99%의 동일성을 갖는 서열, 또는 이의 기능적 단편을 포함한다(예를 들어 이러한 서열 또는 단편으로 이루어진다).
일 양태에서, (a) 관심 단백질을 암호화하는 이식유전자, 및 (b) 서열번호 71 또는 서열번호 94, 또는 이와 적어도 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99%의 동일성을 갖는 서열, 또는 이의 기능적 단편을 포함하는(예를 들어 이러한 서열 또는 단편으로 이루어진) 미니유전자를 포함하는 핵산 분자가 본원에 개시된다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 핵산 분자는 푸린 절단 부위를 암호화하는 서열(서열번호 19를 포함함), 및 자가절단 펩티드를 암호화하는 서열(서열번호 20을 포함함)을 추가로 포함하고, 임의적으로 미니유전자는 푸린 절단 부위를 암호화하는 서열의 5'(예를 들어 푸린 절단 부위를 암호화하는 서열의 5' 바로 옆)에 배치되고, 푸린 절단 부위를 암호화하는 서열은 자가절단 펩티드를 암호화하는 서열의 5'(예를 들어 자가절단 펩티드를 암호화하는 서열의 5' 바로 옆)에 배치되고, 자가절단 펩티드를 암호화하는 서열은 이식유전자의 5'(예를 들어 이식유전자의 5' 바로 옆)에 배치된다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 핵산 분자는 미니유전자 및 이식유전자에 작동 가능하게 연결된 프로모터를 추가로 포함하고, 임의적으로 상기 프로모터는 미니유전자의 5'에 배치된다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 프로모터는 JeT 프로모터, CBA 프로모터, PGK 프로모터, 또는 시냅신 프로모터, 또는 인트론을 포함하지 않는 임의의 프로모터이다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 핵산 분자는 전사후 조절 요소를 추가로 포함한다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 전사후 조절 요소(PRE)는 B형 간염(HPRE), 박쥐(BPRE), 들다람쥐(GSPRE), 북극다람쥐(ASPRE), 오리(DPRE), 침팬지(CPRE) 및 양털원숭이(WMPRE), 또는 우드척(WPRE)에서 유래된 PRE를 포함하고, 임의적으로 상기 전사후 조절 요소는 이식유전자의 3'에 배치된다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 전사후 조절 요소는 서열번호 72, 서열번호 73 88을 포함한다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 핵산 분자는 폴리아데닐화 신호(polyA)를 추가로 포함하고, 임의적으로 상기 polyA는 이식유전자의 3'에 배치된다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, polyA 신호는 SV40 polyA, 인간 성장 호르몬(HGH) polyA, 소 성장 호르몬(BGH) polyA, 베타-글로빈 polyA, 알파-글로빈 polyA, 오브알부민 polyA, 카파-경쇄 polyA, 및 합성 polyA이다.
상기 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, polyA는 서열번호 22를 포함한다(예를 들어 서열번호 22로 이루어진다).
다른 양태에서, 이전 양태 및 구현예 중 어느 하나에 따른 핵산을 포함하는 벡터가 본원에 개시된다. 구현예에서, 벡터는 DNA 벡터, 임의적으로 원형 벡터, 임의적으로 플라스미드이다. 구현예에서, 벡터는 이중가닥 또는 단일가닥이고, 예를 들어 이중가닥이다.
구현예에서, 벡터는 바이러스 벡터이다. 구현예에서, 바이러스 벡터는 아데노 관련 바이러스(AAV) 벡터, 키메라 AAV 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, DNA 바이러스 벡터, 단순 헤르페스 바이러스 벡터, 배큘로바이러스 벡터, 또는 이들의 임의의 돌연변이 또는 유도체이다. 구현예에서, 바이러스 벡터는 재조합 AAV 벡터, 임의적으로 자기상보성 AAV(scAAV) 벡터이다. 구현예에서, 바이러스 벡터는 재조합 AAV 벡터, 임의적으로 단일가닥 AAV(ssAAV) 벡터이다. 구현예에서, 재조합 AAV 벡터는 하나 이상의 역위 말단 반복부(ITR)를 포함하고, 임의적으로 ITR은 AAV2 ITR이고, 임의적으로 AAV 벡터는 2개의 ITR을 포함하고, 임의적으로 2개의 ITR은 서열번호 12 및 서열번호 23을 포함한다.
이전 양태 및 구현예 중 임의의 것을 포함하는 구현예에서, 벡터는 예를 들어 5'에서 3' 방향으로,
ITR(임의적으로 AAV2 ITR이고, 임의적으로 ITR은 말단 분해 부위의 결실을 포함하도록 변형되었으며, 임의적으로 서열번호 12를 포함함);
프로모터(임의적으로, 서열번호 13을 포함하거나 서열번호 13으로 이루어진 JeT 프로모터임);
양태 1 내지 28 중 어느 하나의 핵산 분자;
polyA 신호(임의적으로, 서열번호 22를 포함하거나 서열번호 22로 이루어짐); 및
ITR(임의적으로 AAV2 ITR이고, 임의적으로 서열번호 23을 포함하거나 서열번호 23으로 이루어짐)
을 포함한다.
일 양태에서, 이전 양태 및 구현예 중 어느 하나의 핵산 또는 벡터를 포함하는 재조합 바이러스가 본원에 제공된다. 구현예에서, 재조합 바이러스는 아데노 관련 바이러스(AAV), 키메라 AAV, 아데노바이러스, 레트로바이러스, 렌티바이러스, DNA 바이러스, 단순 헤르페스 바이러스, 배큘로바이러스, 또는 이들의 임의의 돌연변이 또는 유도체이다. 구현예에서, 바이러스는 AAV이다. 구현예에서, AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV 8, AAV9, AAV10, and AAV11, AAV12, AAVrh8, AAVrh10, AAVrh36, AAVrh37, AAV-DJ, AAV-DJ/8, AAV.Anc80, AAV.Anc80L65, AAV-PHP.B, AAV-PHP.B2, AAV-PHP.B3, AAV-PHP.A, AAV-PHP.eB, 및 AAV-PHP.S 캡시드 혈청형, 또는 이들의 변이체, 예를 들어 둘 이상의 AAV 혈청형으로부터의 캡시드의 조합 중 하나 이상을 포함한다. 구현예에서, AAV는 AAV9 캡시드 혈청형 또는 이의 임의의 돌연변이 또는 유도체를 포함한다. 구현예에서, 바이러스는 AAV9 캡시드 단백질 VP1, VP2, 및 VP3(예를 들어 서열번호 74, 서열번호 75, 및 서열번호 76에 의해 각각 암호화되거나, 서열번호 77, 서열번호 78, 및 서열번호 79의 아미노산 서열을 각각 포함하는 것)을 포함한다. 구현예에서, AAV는 자기상보성 AAV(scAAV) 벡터를 포함한다. 구현예에서, AAV는 단일가닥 AAV(ssAAV) 벡터를 포함한다.
다른 양태에서, 이전 양태 및 구현예 중 어느 하나의 핵산 분자, 벡터, 또는 재조합 바이러스를 포함하는 세포가 본원에 제공된다. 구현예에서, 세포는 인간 세포이다. 구현예에서, 세포는 뉴런세포 또는 성상세포이다.
일 양태에서, 임의의 이전 세포 양태 및 구현예의 세포를 포함하는 세포로서, 세포가 스플라이스 조절자(예를 들어 LMI070)를 포함하는 경우 관심 단백질의 발현 수준은 세포가 상기 스플라이스 조절자를 포함하지 않은 경우의 관심 단백질 발현 수준보다 더 크고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고), 임의적으로 세포가 상기 스플라이스 조절자를 포함하지 않은 경우의 발현 수준은 검출 가능하지 않은, 세포가 본원에 제공된다.
일 양태에서, 임의의 이전 세포 양태 및 구현예의 세포를 포함하는 세포로서, 세포가 스플라이스 조절자(예를 들어 LMI070)를 포함하지 않은 경우 관심 단백질의 발현 수준은 세포가 상기 스플라이스 조절자를 포함하는 경우의 관심 단백질 발현 수준보다 더 크고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고), 임의적으로 세포가 상기 스플라이스 조절자를 포함하는 경우의 발현 수준은 검출 가능하지 않은, 세포가 본원에 제공된다.
일 양태에서, 관심 단백질을 조건부로 발현시키는 방법으로서, 임의의 이전 양태 및 구현예의 핵산 분자, 벡터, 또는 재조합 바이러스를 포함하는 발현 시스템(예: 세포, 예를 들어 이전 양태 및 구현예 중 어느 하나의 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고,
상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고);
상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소되는(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적은), 방법이 본원에 제공된다.
일 양태에서, 관심 단백질을 조건부로 발현시키는 방법으로서, 임의의 이전 양태 및 구현예의 핵산 분자, 벡터, 또는 재조합 바이러스를 포함하는 발현 시스템(예: 세포, 예를 들어 이전 양태 및 구현예 중 어느 하나의 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고,
상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고);
상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소되는(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적은), 방법이 본원에 제공된다.
일 양태에서, 이전 양태 및 구현예 중 어느 하나의 핵산 분자, 벡터, 재조합 바이러스, 또는 세포를 포함하는 제약 조성물이 본원에 제공된다.
일 양태에서, 유전자 요법을 필요로 하는 대상체의 치료 방법으로서, 이전 양태 및 구현예 중 어느 하나의 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물을 상기 대상체에게 투여하는 단계를 포함하는 방법이 본원에 제공된다. 구현예에서, 상기 방법은 관심 단백질의 발현을 스플라이스 조절자의 부재하의 관심 단백질 발현 수준에 비해 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 증가 또는 감소시키는 데 효과적인 양의 스플라이스 조절자(예를 들어 LMI070)를 대상체에게 투여하는 단계를 추가로 포함한다.
일 양태에서, 이전 양태 및 구현예 중 어느 하나의 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물; 및 스플라이스 조절자를 포함하는 키트가 본원에 제공된다.
일 양태에서, 관심 단백질을 조건부로 발현시키는 방법에 사용하기 위한, 이전 양태 및 구현예 중 어느 하나의 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물이 본원에 제공되며, 상기 방법은 양태 1, 2, 및 4 내지 36 중 어느 하나의 핵산 분자, 양태 37 내지 45 중 어느 하나의 벡터, 또는 양태 46 내지 52 중 어느 하나의 재조합 바이러스를 포함하는 발현 시스템(예: 세포, 예를 들어 양태 53 내지 57 중 어느 하나의 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고,
상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고);
상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소된다(예를 들어 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적다).
일 양태에서, 관심 단백질을 조건부로 발현시키는 방법에 사용하기 위한, 이전 양태 및 구현예 중 어느 하나의 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물이 본원에 제공되며, 상기 방법은 양태 1 또는 3 내지 36 중 어느 하나의 핵산 분자, 양태 37 내지 45 중 어느 하나의 벡터, 또는 양태 46 내지 52 중 어느 하나의 재조합 바이러스를 포함하는 발현 시스템(예: 세포, 예를 들어 양태 53 내지 57 중 어느 하나의 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고,
상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고);
상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소된다(예를 들어 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적다).
일 양태에서, 유전자 요법을 필요로 하는 대상체의 치료 방법에 사용하기 위한, 이전 양태 및 구현예 중 어느 하나의 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물이 본원에 제공된다.
일 양태에서, 이전 양태 및 구현예 중 어느 하나의 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물, 또는 양태 64 내지 66 중 어느 하나에 따른 사용을 위한 핵산, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물에 있어서, 이식유전자는 게놈 편집 시스템의 단백질(예를 들어 Cas9 단백질, 징크 핑거 뉴클레아제, 또는 TALEN과 같은 RNA-가이드 뉴클레아제), 항체 또는 항체 단편, 또는 치료용 단백질(예를 들어, 프로그래뉼린, SMN, MeCP2, CLN2, CLN3, CLN4, CLN5, CLN6, CLN7, CLN8로부터 선택되는 단백질)을 암호화하는, 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물이 본원에 제공된다.
도 1a는 스플라이스 조절자 매개 "온-스위치"의 개념을 설명한다. 온-스위치 시스템에서, 엑손 C는 엑손 B가 제외될 때 엑손 A에 위치한 시작코돈에 의해 개시된 암호화 서열과 함께 프레임 내에 있는 조기 종결(정지)코돈을 포함한다. LMI070과 같은 스플라이스 조절자가 포함되면, 전사체는 이제 프레임-이동 엑손 B를 포함하여, 이식유전자 발현을 유도하는 중단되지 않은 오픈 리딩 프레임을 복원한다.
도 1b는 스플라이스 조절자 매개 "오프-스위치"의 개념을 설명한다. 오프-스위치 시스템에서, 엑손 A는 엑손 C에 스플라이싱되어 이식유전자 발현을 유도한다. LMI070과 같은 스플라이스 조절자가 존재하는 경우, 조기 종결(정지)코돈을 포함하는 엑손 B가 포함되어 번역이 종결된다.
도 2a. SNX7 미니유전자 기반 스위치가 있는 AAV 벡터의 설계. 도 2a는 염색체:GRCh37:1:99204216:99204359:1의 스플라이스 조절자(LMI070) 엑손 표적 결합 부위(AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGAATGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATGTCCTTGCTATCCCTGTCTTCTGTAGCTATTCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 80)), 뿐만 아니라 염색체:GRCh37:1:99203793:99203946:1의 엑손 8의 인트론 서열 다운스트림(CTTCCAGAGGAGATTGGAAAACTTGAAGATAAAGTGGAATGTGCTAATAATGCCCTGAAAGCAGATTGGGAGAGATGGAAACAAAATATGCAAAATGATATCAAGTTAGCATTTACAGATATGGCTGAGGAGAATATCCATTATTATGAACAG(서열번호 99)), 및 염색체:GRCh37:1:99225610:99225687:1의 엑손 9의 21,251개 뉴클레오티드의 업스트림(TGCCTTGCTACGTGGGAGTCATTCCTTACATCACAGACCAACCTTCACTTGGAAGAAGCCTCTGAAGATAAACCTTAA(서열번호 100))을 포함하는 SNX7 유전자좌의 개략도를 나타낸다.
도 2b. SNX7 미니유전자 기반 스위치가 있는 AAV 벡터의 설계. 도 2b는 엑손 8(엑손 A라고 함), 270 뉴클레오티드 인트론(AB), 3' 말단에 스플라이스 조절자(예: LMI070) 결합 부위를 포함하는 엑손(엑손 B라고 함), 407 뉴클레오티드 인트론 단편(21,251 nt로부터 단축; BC), 및 엑손 9(엑손 C라고 함)를 이용한 비자연발생적 SNX7 미니유전자의 구성을 나타낸다. 성능을 향상시키기 위해 다음과 같이 미니유전자를 추가로 수정하였다: 1) Kozak 공통서열 및 ATG 코돈(GCCACCATG)을 엑손 A의 65번 위치에 삽입하였다; 2) 미니유전자의 다른 모든 ATG 서열을 TTG로 대체하였다; 3) 엑손 A의 20번 위치에 있는 TA를 AG로 대체하여 GAAGAAGAA 서열(서열번호 69)을 생성하였다; 4) 엑손 B에서 1 nt를 제거하여 ORF에 프레임 이동(뉴클레오티드의 수 = 3n-1)을 생성하였다; 5) 엑손 C의 4번 위치에 T를 삽입하여 ORF에 프레임 이동을 생성함으로써 다수의 정지코돈을 생성하였다; 6) 엑손 C의 9번 위치에 있는 TAC를 TAA로 변경하여 조기 종결코돈을 생성하였다; 7) 엑손 C의 34번 위치에 있는 CAG를 ACC로 변경하여 잠재적 크립틱 스플라이스 부위를 돌연변이시켰다; 8) 엑손 C의 60번 위치에 있는 CTCT를 TAGC로 변경하여 Nhe I 제한 부위를 생성하였다; 9) 엑손 C 말단의 TAA를 제거하여 연속 ORF를 생성하였다.
도 2c는 SNX7 미니유전자 온-스위치를 포함하는 scAAV 벡터의 구성을 나타낸다. trs의 결실이 있는 AAV2 ITR, JeT 프로모터, SNX7 미니유전자(도 2b 참조), 엑손 C의 말단에 추가된 푸린 절단 부위(RNRR(서열번호S 39))에 대한 암호화 서열, T2A 펩티드에 대한 암호화 서열, 이식유전자 서열(여기서는, 첫 번째 ATG가 없는 EGFP에 대한 암호화 서열), SV40 후기 폴리아데닐화 신호, AAV2 ITR을 순서대로 조합하여 scAAV를 생성하였다.
도 3은 SNX7 미니유전자 기반 온-스위치(도 3a) 및 오프-스위치(도 3b)를 이용한 GFP 발현의 조절, 및 스플라이스 조절자 부재("LMI070 부재") 및 스플라이스 존재("플러스 LMI070") 하에서의 mRNA 발현 산물을 나타낸다. 도면은 나타나는 순서대로 각각 서열번호 108 내지 111을 개시한다.
도 4. HEK293 세포에서의 SNX7 스위치에 의한 GFP 발현의 조절. 도 4a는 스플라이스 조절자(LMI070)의 다양한 농도에서 pSNX7-GFP(온-스위치를 포함하는 벡터)로 형질감염된 HEK293 세포에서의 GFP 발현을 나타낸다. 도 4b는 평균 형광 강도에 의해 측정된 GFP 발현을 LMI070 농도에 따라 도식화한 것이다. 도 4c는 스플라이스 조절자의 다양한 농도에서 엑손 B를 포함하거나 직접적인 엑손 A-엑손 C 스플라이싱을 갖는 mRNA 전사체의 양을 도식화한 것이다.
도 5. 박쥐 피질뉴런에서의 SNX7 스위치에 의한 GFP 발현의 조절. 도 5a는 스플라이스 조절자(LMI070)의 다양한 농도에서 pSNX7-GFP(온-스위치를 포함하는 벡터)로 형질감염된 1차 박쥐 뉴런에서의 GFP 발현 수준을 나타낸다. 도 5b는 박쥐 피질뉴런에서의 스플라이스 조절자의 다양한 농도에서 엑손 B를 포함하거나 직접적인 엑손 A-엑손 C 스플라이싱을 갖는 mRNA 전사체의 양을 도식화한 것이다.
도 6. SNX7 온-스위치 제어하의 인간 프로그래뉼린(PRGN) 이식유전자를 포함하는 AAV 벡터. 도 6a는 1) 뉴런-특이적 프로모터(인간 시냅신 프로모터)를 포함하고 SNX7 온-스위치 미니유전자를 포함하는 ssAAV 벡터 개략도를 나타낸다. 도 6b는 SNX7 기반 스위치("Syn")를 포함하지 않는 벡터로부터의 hPRGN 발현 수준과 비교하여, 스플라이스 조절자의 존재 또는 부재 하에서의 도 6a에 설명된 벡터(Syn_SNX)로 형질감염된 1차 박쥐 뉴런에서의 hPRGN 발현을 나타낸다. 도 6c는 스플라이스 조절자의 존재 및 부재 하에서의, 엑손 B를 포함하는 mRNA 및 직접적인 엑손 A-엑손 C 스플라이싱을 갖는 mRNA에 대한 mRNA 발현 수준을 나타낸다.
도 7a는 SNX7 스위치(버전 1)를 포함하는 AAV 벡터의 생체내 시간경과 시험의 연구 계획을 나타낸다. SNX7 스위치가 있는 시냅신 프로모터의 제어하에 hPGRN 발현 카세트를 포함하는 단일가닥 AAV9를 P0 신생 마우스에 ICV 주사하였다. 4주 후, 마우스는 30 mg/kg의 LMI070을 경구 투여 받았고, 마우스는 투여 후 24시간부터 다양한 시점에 제거되었다. 도 7b는 LMI070의 경구 투여가 도 7a에 설명된 AAV 벡터를 이전에 투여받은 마우스에서 시간 의존적 방식으로 마우스 뇌에서의 이식유전자 발현을 활성화시킴을 보여준다. 그래프는 LMI070 전달 후의 표시된 시간 후 뇌에서의 hPGRN 발현의 TR-FRET 측정을 보여준다.
도 8a는 SNX7 스위치(버전 1)를 포함하는 AAV 벡터의 생체내 용량-반응 시험의 연구 계획을 나타낸다. SNX7 스위치가 있는 시냅신 프로모터의 제어하에 hPGRN 발현 카세트를 포함하는 단일가닥 AAV9를 P0 신생 마우스에 ICV 주사하였다. 4주 후, 마우스는 다양한 용량의 LMI070을 경구 투여 받았고, 마우스는 투여 후 12시간부터 다양한 시점에 제거되었다. 도 8b는 LMI070의 경구 투여가 도 8a에 설명된 AAV 벡터를 이전에 투여받은 마우스에서 용량 의존적 방식으로 마우스 뇌에서의 이식유전자 발현을 활성화시킴을 보여준다. 그래프는 LMI070 전달 후의 표시된 시간 후 뇌에서의 LMI070의 표시된 용량에 따른 hPGRN 발현의 TR-FRET 측정을 보여준다.
도 9는 SNX7 미니유전자의 제1 버전과 LMI070의 부재하에 감소된 크기 및 감소된 펩티드 발현을 갖는 변형된 SNX7 미니유전자(버전 2)의 비교를 나타낸다. 도면은 나타나는 순서대로 각각 서열번호 108 및 112~113을 개시한다.
도 10은 LMI070에 대한 반응에 있어서 변형된 SNX7 미니유전자(버전 2)가 이전 버전의 SNX7 미니유전자보다 더 민감함을 보여준다.
개시된 조성물 및 방법은 본 명세서의 일부를 형성하는 첨부 도면과 관련하여 기재된 하기 상세한 설명을 참조함으로써 보다 쉽게 이해될 수 있다.
본 명세서 전반에 걸쳐, 설명은 조성물 및 해당 조성물을 사용하는 방법을 나타낸다. 본 명세서가 조성물과 관련된 특징 또는 구현예를 개시하거나 청구하는 경우, 이러한 특징 또는 구현예는 해당 조성물의 사용 방법 또는 용도에 동일하게 적용될 수 있다. 마찬가지로, 본 명세서가 조성물의 사용 방법과 관련된 특징 또는 구현예를 개시하거나 청구하는 경우, 이러한 특징 또는 구현예는 해당 조성물에 동일하게 적용될 수 있다. 값의 범위를 표현하는 경우, 그 범위 내의 임의의 특정 값을 사용하는 구현예가 포함된다. 또한, 범위에 명시된 값에 대한 참조에는 해당 범위 내의 모든 값이 포함된다. 모든 범위는 양 끝점을 포함하며 조합 가능하다. "약"이라는 관형사를 사용하여 값을 근사치로 표현하는 경우, 특정 값이 또 다른 구현예를 형성함은 이해될 것이다. 특정 수치에 대한 언급은 문맥에서 달리 명시하지 않는 한, 적어도 그 특정 값을 포함한다. "또는"의 사용은 특정 사용 문맥에서 달리 나타내지 않는 한, "및/또는"을 의미한다. 본원에 인용된 모든 참고문헌은 임의의 목적을 위해 참고로 포함된다. 참고문헌과 본 명세서가 상충하는 경우, 본 명세서가 우선한다. 명확성을 위해 개별 구현예의 맥락에서 본원에 개시된 조성물 및 방법의 특정 특징이 단일 구현예로 조합되어 제공될 수도 있음을 이해해야 한다. 반대로, 간결함을 위해 단일 구현예의 맥락에서 개시된 조성물 및 방법의 다양한 특징이 개별적으로 또는 임의의 하위조합으로 제공될 수도 있다.
정의
본원에서 사용되는 단수 형태는 문맥에서 달리 명시하지 않는 한, 복수 형태를 포함한다. 수치 및 범위와 관련하여 사용되는 용어 "약" 또는 "대략"은 본원에 포함된 교시로부터 당업자에게 명백한 바와 같이, 구현예가 의도된 바와 같이 수행될 수 있도록 인용 값 또는 범위에 근접하거나 가까운 값 또는 범위를 나타낸다. 일부 구현예에서, "약"은 수치량의 ±10%를 의미한다.
용어 "폴리뉴클레오티드"와 "핵산"은 본원에서 상호교환적으로 사용되며, 임의의 길이의 뉴클레오티드의 고분자 형태를 나타낸다. 이러한 용어는 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 중 하나 이상을 포함할 수 있다. 따라서, 이 용어는 단일가닥, 이중가닥, 또는 다중가닥의 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 또는 퓨린 및 피리미딘 염기 또는 기타 천연, 화학적, 또는 생화학적으로 변형된, 비천연의, 또는 유도체화된 뉴클레오티드 염기, 예를 들어 잠금 핵산(LNA), 펩티드 핵산(PNA)을 포함하는 중합체를 포함하나, 이에 한정되지 않는다.
용어 "펩티드", "폴리펩티드", 및 "단백질"은 상호교환적으로 사용되며, 펩티드 결합에 의해 공유 연결된 아미노산 잔기로 구성된 화합물을 지칭한다. 단백질 또는 펩티드는 일반적으로 적어도 2개의 아미노산 또는 아미노산 변이체를 함유하고, 단백질 또는 펩티드의 서열을 포함할 수 있는 아미노산의 최대 수에는 제한이 없다. 폴리펩티드는 펩티드 결합에 의해 서로 연결된 2개 이상의 아미노산 또는 변이체를 포함하는 임의의 펩티드 또는 단백질을 포함한다. 이 용어는 특히, 예를 들어 생물학적 활성 단편, 실질적으로 상동성인 폴리펩티드, 올리고펩티드, 동종이량체, 이종이량체, 폴리펩티드의 변이체, 변형된 폴리펩티드, 유도체, 유사체, 융합 단백질 등을 포함한다. 폴리펩티드는 천연 펩티드, 재조합 펩티드, 또는 이들의 조합을 포함한다.
용어 "서열 동일성" 및 "서열 상동성"은 본원에서 상호교환적으로 사용되며, 폴리뉴클레오티드 또는 폴리펩티드와 관련하여 사용되는 바와 같이, 폴리펩티드의 2개의 폴리뉴클레오티드 서열을 비교하거나 정렬할 때, 동일하고 상대 위치가 같은 염기 또는 아미노산의 백분율을 나타낸다. 서열 동일성은 다양한 방식으로 결정될 수 있다. 예를 들어, 서열은 다양한 방법 및 컴퓨터 프로그램(예: BLAST, T-COFFEE, MUSCLE, MAFFT 등)을 사용하여 정렬될 수 있다. 예를 들어, 문헌[Altschul et al., (1990) J. Mol. Bioi., 215:403-10] 참조.
본원에 논의된 핵산 또는 단백질과 관련하여 "단리된"이라는 용어는 자연 환경에서 일반적으로 핵산 또는 단백질과 결합된 상태로 발견되는 하나 이상의 구성요소로부터 분리된 핵산 또는 단백질을 나타낸다. 분리는 더 큰 핵산(예를 들어, 유전자 또는 염색체)으로부터의 제거, 또는 일반적으로 핵산 또는 단백질과 접촉된 다른 단백질 또는 분자로부터의 제거를 포함할 수 있다. 이 용어는 완전한 단리를 포함하지만 이를 필요로 하지는 않는다.
본원에서 사용되는 바와 같이, "이종 핵산 서열"을 포함하는 단리된 핵산은 자연 상황에서 단리된 핵산의 하나 이상의 다른 구성요소에 작동 가능하게 연결된 상태로는 보통 발견되지 않는 부분(즉, 이종 핵산 부분)을 포함하는 단리된 핵산을 지칭한다. 예를 들어, 이종 핵산은 단리된 핵산의 다른 구성요소(예: 프로모터)의 자연적 유래원인 세포, 박테리아 세포, 바이러스, 또는 유기체에서 원래 발견되지 않는 핵산 서열, 또는 단리된 핵산의 다른 구성요소(예: 프로모터)가 이러한 세포, 박테리아 세포, 바이러스, 또는 유기체에서 이종 핵산과 작동 가능하게 연결된 상태로는 자연적으로 발견되지 않는 핵산 서열을 포함할 수 있다. 일부 구현예에서, 이종 핵산은 이식유전자를 포함한다. 본원에서 사용되는 바와 같이, "이식유전자"는 핵산 분자의 하나 이상의 구성요소와 원래 관련되지 않은 관심 분자(예를 들어, 치료용 단백질, 리포터 단백질, 또는 치료용 RNA 분자)를 암호화하는 핵산 서열이다. 일부 구현예에서, 이종 핵산 서열은 인간 단백질을 암호화한다. 일부 구현예에서, 이종 핵산 서열은 RNA 서열, 예를 들어 shRNA를 암호화한다.
특정 RNA를 "암호화"하는 DNA 서열 또는 DNA 폴리뉴클레오티드 서열은 RNA로 전사될 수 있는 DNA의 서열이다. DNA 폴리뉴클레오티드는 단백질로 번역되는 RNA(mRNA)를 암호화할 수 있거나, DNA 폴리뉴클레오티드는 단백질로 번역되지 않는 RNA(예를 들어, tRNA, rRNA, 또는 가이드 RNA; "비암호화" RNA 또는 "ncRNA"라고도 함)를 암호화할 수 있다. DNA 서열 또는 DNA 폴리뉴클레오티드 서열은 또한 특정 폴리펩티드 또는 단백질 서열을 "암호화"할 수 있으며, 이때 예를 들어 DNA는 폴리펩티드 또는 단백질 서열로 번역될 수 있는 mRNA를 직접 암호화한다. "단백질 암호화 서열" 또는 특정 단백질 또는 폴리펩티드를 암호화하는 서열은 적절한 조절 서열의 제어하에 있을 때 시험관내에서 또는 생체내에서 (DNA의 경우) mRNA로 전사되고 (mRNA의 경우) 폴리펩티드로 번역될 수 있는 핵산 서열이다. 암호화 서열의 경계는 5' 말단(N-말단)의 시작코돈 및 3' 말단(C-말단)의 번역 정지 넌센스 코돈에 의해 결정될 수 있다. 암호화 서열은 원핵생물 또는 진핵생물 mRNA의 cDNA, 원핵생물 또는 진핵생물 DNA의 게놈 DNA 서열, 및 합성 핵산을 포함할 수 있으나, 이에 한정되지 않는다. 전사 종결 서열은 일반적으로 암호화 서열의 3'에 위치할 것이다.
본원에서 사용되는 용어 "프로모터" 또는 "프로모터 서열"은 예를 들어 결합 RNA 중합효소를 통해, 예를 들어 암호화 또는 비암호화 서열 다운스트림(3' 방향)의 작동 가능하게 연결된 암호화 또는 비암호화 서열의 전사를 촉진할 수 있는(예를 들어, 검출 가능한 수준의 전사를 유발하고/하거나 프로모터의 부재하에 제공된 수준보다 높게 검출 가능한 전사 수준을 증가시킬 수 있는) DNA 조절 서열이다. 일부 구현예에서, 프로모터 서열은 전사 개시 부위에 의해 3' 말단에서 결합되고, 업스트림(5' 방향)으로 연장되어 백그라운드보다 높은 검출 가능한 수준으로 전사를 개시하기 위한 염기 또는 요소의 최소 수를 포함한다. 일부 구현예에서, 프로모터 서열은 전사 개시 부위, 뿐만 아니라 RNA 중합효소의 결합을 담당하는 단백질 결합 도메인을 포함할 수 있다. 전사를 개시하기에 충분한 서열 외에도, 프로모터는 또한 전사 조절에 관여하는 다른 조절 요소의 서열을 포함할 수 있다(예: 인핸서, Kozak 서열, 및 인트론). 본원에 개시된 벡터를 구동하기 위해 유도성 프로모터 및 항시성 프로모터를 비롯한 다양한 프로모터를 사용할 수 있다. 일부 구현예에서, 예를 들어 본원에 개시된 바이러스 벡터에서 사용될 수 있는 당업계에 알려진 프로모터의 예는 CMV 프로모터, CBA 프로모터, smCBA 프로모터, 및 면역글로불린 유전자, SV40, 또는 기타 조직-특이적 유전자(예: RLBP1, RPE, VMD2)에서 유래된 프로모터를 포함한다. 또한, 공지된 조절 요소를 혼합하고 매칭시켜 기능적 프로모터를 생성하기 위한 표준 기술은 당업계에 알려져 있다. 프로모터의 단편, 예를 들어 백그라운드보다 높은 검출 가능한 수준으로 전사를 개시하기 위한 염기 또는 요소의 적어도 최소 수를 보유하는 단편이 또한 사용될 수 있다.
일부 구현예에서, 프로모터는 항시적으로 활성인 프로모터(즉, 임의의 세포 유형 및/또는 임의의 조건에서 발현을 항시적으로 유도하는 프로모터)일 수 있다. 다른 구현예에서, 프로모터는 특정 조직 상황, 예를 들어 뉴런, 심근세포 등에서 항시적으로 활성인 프로모터일 수 있다. 다른 구현예에서, 프로모터는 유도성 프로모터(즉, 외부 자극 예를 들어 특정 온도, 화합물, 또는 단백질의 존재에 의해 활성이 제어되는 프로모터)일 수 있다. 일부 구현예에서, 프로모터는 프로모터가 발견되는 물리적 상황에 따라 활성을 유도할 수 있거나 그렇지 않을 수 있는 공간적으로 제한된 프로모터일 수 있다. 공간적으로 제한된 프로모터의 비제한적 예는 조직-특이적 프로모터, 세포 유형-특이적 프로모터 등을 포함한다. 일부 구현예에서, 프로모터는 프로모터가 발견되는 시간적 상황에 따라 발현을 유도하는 시간적으로 제한된 프로모터일 수 있다. 예를 들어, 시간적으로 제한된 프로모터는 배아 발달의 특정 단계 또는 생물학적 과정의 특정 단계에서만 발현을 유도할 수 있다. 시간적으로 제한된 프로모터의 비제한적 예는 마우스의 모낭 주기 프로모터를 포함한다.
일부 구현예에서, 프로모터는 조직-특이적이어서, 다세포 유기체에서 프로모터는 특정 세포의 하위집합에서만 발현을 유도한다. 예를 들어, 조직-특이적 프로모터는 뉴런-특이적 프로모터, 지방세포-특이적 프로모터, 심근세포-특이적 프로모터, 평활근-특이적 프로모터, 광수용체-특이적 프로모터 등을 포함하나, 이에 한정되지 않는다. 뉴런-특이적 프로모터는 예를 들어 말초적으로, 중추신경계(CNS) 내로 직접 투여되거나 시험관내, 생체외, 또는 생체내를 비롯해 뉴런세포에 전달될 때, 작동 가능하게 연결된 이종 핵산의 발현을 우선적으로 유도하거나 조절하는 프로모터, 예를 들어 비뉴런 세포에서의 발현과 비교하여 뉴런에서 관심 단백질 또는 펩티드 또는 shRNA를 암호화하는 것을 지칭한다.
본원에서 상호교환적으로 사용되는 용어 "DNA 조절 서열", "제어 요소", 및 "조절 요소"는 비암호화 서열(예: 짧은 헤어핀 RNA) 또는 암호화 서열(예: PGRN)의 전사를 제공 및/또는 조절하고/하거나 암호화된 폴리펩티드의 번역을 조절하는, 프로모터, 인핸서, 사일런서, 폴리아데닐화 신호, 터미네이터, 단백질 분해 신호 등과 같은 전사 및 번역 제어 서열을 지칭한다.
용어 "폴리아데닐화(polyA) 신호 서열" 및 "폴리아데닐화 서열"은 RNA 전사체의 3' 말단에 아데노신 동종중합체 사슬의 추가 및 전사 종결에 대한 신호를 제공하는 조절 요소를 지칭한다. 폴리아데닐화 신호는 종결 신호(예를 들어, AAUAAA 서열 또는 다른 비표준 서열) 및 임의적 플랭킹 보조 요소(예를 들어, GU-풍부 요소) 및/또는 효율적인 절단 및 폴리아데닐화와 관련된 다른 요소를 포함할 수 있다. 폴리아데닐화 서열은 폴리아데닐화에 의해 mRNA의 3' 말단에 부착된 일련의 아데노신을 포함할 수 있다. 특정 polyA 신호 서열은 서열번호 22 또는 서열번호 89의 poly(A) 신호를 포함할 수 있다. 일부 구현예에서, DNA 조절 서열 또는 제어 요소는 조직-특이적 조절 서열이다.
용어 "전사후 조절 요소"("PRE")는 mRNA로 전사될 때 mRNA 전사체의 수준에서 유전자 발현을 조절하는 하나 이상의 조절 요소를 지칭한다. 이러한 전사후 조절 요소의 예는 마이크로-RNA 결합 부위, RNA 결합 단백질 결합 부위 등을 암호화하는 서열을 포함할 수 있다. 본원에 개시된 핵산 분자 및 벡터와 함께 사용될 수 있는 전사후 조절 요소의 예는 우드척 간염 전사후 조절 요소(WPRE), 간염 전사후 조절 요소(HPRE)를 포함한다. 예시적인 PRE는 서열번호 88로 개시된 PRE를 또한 포함할 수 있다. PRE의 예는 서열번호 72로 개시된 PRE 또는 서열번호 73으로 개시된 PRE를 또한 포함할 수 있다.
용어 "인트론"은 핵산으로부터 발현된 폴리펩티드 전사체(예를 들어, 관심 단백질)의 하나 이상의 아미노산을 비암호화하는 핵산 서열(들), 예를 들어 오픈 리딩 프레임 내에 있는 것을 지칭한다. 인트론 서열은 DNA에서 RNA로 전사될 수 있지만(즉, pre-mRNA에 존재할 수 있음), 예를 들어 스플라이싱을 통해 성숙 mRNA로부터 단백질이 발현되기 전에 제거될 수 있다.
용어 "엑손"은 핵산으로부터 발현된 전사체(예를 들어, 관심 단백질)의 하나 이상의 아미노산을 암호화하는 핵산 서열(들), 예를 들어 오픈 리딩 프레임 내에 있는 것을 지칭한다. 엑손 서열은 DNA에서 RNA로 전사될 수 있고(즉, pre-mRNA에 존재할 수 있음), 또한 폴리펩티도로 번역되는 성숙한 mRNA(즉, (예를 들어, 스플라이싱 후) RNA의 처리된 형태)에 존재할 수 있다
본원에서 사용되는 바와 같이, "시험관내"에서 수행되는 과정은 인공 배양 배지의 시험관, 플라스크, 페트리 접시에서 수행되는 연구와 같이 정상적인 생물학적 환경 외부에서 수행되는 과정을 의미한다. "생체내"에서 수행되는 과정은 세포 배양물 또는 마우스에서 수행되는 연구와 같이 살아있는 유기체 또는 세포 내에서 수행되는 과정을 의미한다. "세포외"에서 수행되는 연구는 예를 들어 생체내 실험에서 가능할 수 있는 것보다 더 제어된 조건하에 유기체의 세포 또는 조직을 조작할 수 있는, 예를 들어 자연 조건의 최소한의 변경을 가진 외부 환경에서 유기체로부터의 조직 내에서 또는 조직에 대해 수행되는 연구를 의미한다.
예를 들어 핵산, 폴리펩티드, 세포, 또는 유기체에 적용될 때 본원에서 사용되는 용어 "자연발생적" 또는 "비변형"은 자연에서 발견되는 것이다. 예를 들어, 유기체(예컨대 바이러스)에 존재하는 폴리펩티드 또는 폴리뉴클레오티드 서열은 해당 유기체에 존재하는지 또는 해당 유기체의 하나 이상의 구성요소로부터 단리되었는지 여부에 관계없이 자연발생적이다.
일부 구현예에서, "벡터"는 숙주 세포에서 발현될 수 있는 관심 핵산(예: 이식유전자), 예를 들어 플라스미드, 파지, 트랜스포존, 코스미드, 염색체, 바이러스, 비리온 등과 같은, 세포, 조직, 및/또는 유기체에 전달하는 데 적합한 더 큰 핵산 서열 또는 구조 내의 관심 핵산을 포함하는 임의의 유전 요소(예: DNA, RNA, 또는 이들의 혼합물)이다. 예를 들어, 벡터는 삽입물(예를 들어, 발현될 유전자 또는 해당 유전자의 오픈 리딩 프레임을 암호화하는 이식유전자를 포함하는 이종 핵산) 및 하나 이상의 추가 요소, 예를 들어 본원에 기재된 바와 같은 미니유전자 및/또는 삽입물의 발현을 전달하거나 제어하는 데 적합한 요소를 포함할 수 있다. 벡터는 예를 들어 적절한 제어 요소와 관련될 때 복제 및/또는 발현이 가능할 수 있으며, 세포 간에 유전 정보를 전달할 수 있다. 일부 구현예에서, 벡터는 숙주 세포에서의 발현에 적합한 벡터, 예를 들어 AAV 벡터일 수 있다. 일부 구현예에서, 벡터는 예를 들어 세포 또는 생물반응기에서의, 발현 및/또는 복제에 적합한 플라스미드일 수 있다. 일부 구현예에서, 표적 세포에서 관심 단백질, shRNA 등을 암호화하는 이식유전자와 같은 이종 핵산 서열의 발현을 위해 특이적으로 설계된 벡터는 발현 벡터로 지칭될 수 있으며, 일반적으로 이식유전자의 발현을 유도하는 프로모터 서열을 갖는다. 다른 구현예에서, 벡터, 예를 들어 전사 벡터는 전사될 수 있지만 번역되지 않을 수 있다(즉, 표적 세포에서 복제될 수 있지만 발현되지 않을 수 있음). 전사 벡터는 이들의 삽입물을 증폭하는 데 사용될 수 있다.
용어 "발현 벡터"는 발현될 뉴클레오티드 서열에 작동 가능하게 연결되는 발현 제어 서열을 포함하는 폴리뉴클레오티드를 포함하는 벡터를 지칭한다. 발현 벡터는 단독으로 또는 숙주 세포에 의해 또는 시험관내 발현 시스템에서 공급되는 다른 발현용 요소와 조합하여 발현하기에 충분한 시스-작용 요소를 포함할 수 있다. 예를 들어 발현 벡터는 재조합 폴리뉴클레오티드를 포함하는 코스미드, 플라스미드(예: 네이키드이거나 리포솜에 함유됨), 및 바이러스(예: 렌티바이러스, 레트로바이러스, 아데노바이러스, 및 아데노 관련 바이러스)를 포함한다.
용어 "플라스미드"는 플라스미드가 숙주 세포에서 복제되도록 온전한 "레플리콘"을 포함하는 비염색체(및 일반적으로 이중가닥) DNA 서열을 지칭한다. 플라스미드는 원형 핵산일 수 있다. 플라스미드가 단세포 유기체 내에 배치될 경우, 플라스미드 DNA의 결과로서 해당 유기체의 특성이 변경되거나 변형된다. 예를 들어, 테트라사이클린 내성(TcR) 유전자를 갖고 있는 플라스미드는 이전에 테트라사이클린에 민감했던 세포를 테트라사이클린에 내성이 있는 세포로 변형시킨다. 본원에 개시된 바이러스 벡터를 대한 일부 구현예에 유용한 예시적인 플라스미드는 서열번호 92를 포함한다.
본원에 사용되는 용어 "재조합 바이러스"는 이식유전자 또는 기타 이종 핵산을 포함하는 비야생형 및/또는 인공적으로 생성된 재조합 바이러스(예를 들어, 파보바이러스, 아데노바이러스, 렌티바이러스, 또는 아데노 관련 바이러스 등)를 지칭하는 것으로 의도된다. 재조합 바이러스는 바이러스(예를 들어 AAV) 캡시드 내에 패키징된 재조합 바이러스 게놈(예를 들어, 본원에 기재된 바와 같은 미니유전자 및 이식유전자를 포함함)을 포함할 수 있다. 특정 유형의 재조합 바이러스는 "재조합 아데노 관련 바이러스" 또는 "rAAV"일 수 있다. 바이러스 캡시드에 패키징된 재조합 바이러스 게놈은 바이러스 벡터일 수 있다. 일부 구현예에서, 본원에 개시된 재조합 바이러스는 바이러스 벡터(예를 들어, 본원에 기재된 바와 같은 관심 미니유전자 및 이식유전자를 포함함)를 포함한다. 바이러스 벡터의 예는 아데노 관련 바이러스(AAV) 벡터, 키메라 AAV 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, DNA 바이러스 벡터, 단순 헤르페스 바이러스 벡터, 배큘로바이러스 벡터, 또는 이들의 임의의 돌연변이 또는 유도체를 포함하나, 이에 한정되지 않는다.
다른 구현예에서, 용어 "형질감염"은 외인성 DNA가 세포막 내부에 도입되면 세포가 "형질감염"된 것과 같이 세포에 의한 외래 DNA의 흡수를 나타내는 데 사용된다. 예를 들어, 문헌[Graham et al., (1973) Virology, 52:456; Sambrook et al., (1989) Molecular Cloning, a laboratory manual, Cold Spring Harbor Laboratories, New York; Davis et al., (1986) Basic Methods in Molecular Biology, Elsevier; Chu et al., (1981) Gene, 13:197] 참조. 이러한 기술을 이용하여 하나 이상의 외인성 DNA 모이어티를 적합한 숙주 세포에 도입할 수 있다. 일부 구현예에서, 용어 "형질도입"은 외래 DNA가 바이러스 또는 바이러스 벡터에 의해 제공되는, 세포에 의한 외래 DNA의 흡수를 나타내는 데 사용된다. 따라서, 외인성 DNA가 세포막 내부에 도입되었을 때 세포는 "형질도입"된 것이다. 일부 구현예에서, 용어 "형질전환"은 박테리아 세포에 의한 외래 DNA의 흡수를 나타내기 위해 사용된다.
본원에서 사용되는 용어 "세포주"는 시험관내에서 연속적 또는 연장된 성장 및 분열이 가능한 세포 집단을 지칭한다. 특정 상황에서, 이러한 클론 집단의 저장 또는 이동 중에 핵형에서 자발적 또는 유도된 변화가 발생할 수 있다. 따라서, 언급된 세포주에서 유래된 세포가 조상 세포 또는 배양물과 정확히 동일하지는 않을 수 있으며, 언급된 세포주는 이러한 변이체를 포함한다.
"작동 가능하게 연결된"이란 용어는 2개 이상의 폴리뉴클레오티드(예: DNA) 분절 간의 기능적 관계를 나타낸다. 일반적으로, 이 용어는 전사 조절 서열과 전사될 서열의 기능적 관계를 나타낸다. 예를 들어, 프로모터 또는 인핸서 서열은 예를 들어 적절한 숙주 세포 또는 다른 발현 시스템에서 암호화 서열의 전사를 자극하거나 조절하는 경우 암호화 서열에 작동 가능하게 연결된다. 일반적으로, 서열에 작동 가능하게 연결되는 프로모터 전사 조절 서열은 해당 서열에 인접해 있거나, 짧은 스페이서 서열에 의해 분리되어 있다(즉, 시스-작용성임). 그러나, 인핸서와 같은 일부 전사 조절 서열은 전사를 강화하는 암호화 서열에 물리적으로 인접해 있거나 매우 근접한 위치에 있을 필요가 없다.
본원에서 사용되는 용어 "AAV 벡터"는 아데노 관련 바이러스 혈청형에서 유래된 하나 이상의 핵산 서열에서 유래되거나 이를 포함하는 벡터를 지칭한다(AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8 or AAV-9 바이러스 벡터를 포함하나, 이에 한정되지 않음). AAV 벡터는 예를 들어 기능적 플랭킹 역위 말단 반복부("ITR") 서열을 유지하면서 전체 또는 부분, 예를 들어 rep 및/또는 cap 유전자가 결실된 AAV 야생형 유전자 중 하나 이상을 가질 수 있다. 일부 구현예에서, AAV 벡터는 벡터 핵산을 표적 세포의 핵에 전달하기 위한 비히클을 제공할 수 있는, 예를 들어 하나 이상의 AAV 캡시드 단백질을 포함하는 단백질 쉘 또는 캡시드에 패키징될 수 있다. 일부 구현예에서, AAV 벡터는 하나 이상의 AAV ITR 서열(예: AAV2 ITR 서열)을 포함한다. 일부 구현예에서, AAV 벡터는 하나 이상의 AAV ITR 서열(예: AAV2 ITR 서열)을 포함하지만, 어떠한 추가적인 바이러스 핵산 서열도 포함하지 않는다. 일부 구현예에서, AAV 벡터 구성요소(예: ITR)는 rAAV 캡시드와는 다른 혈청형 바이러스에서 유래된다(예를 들어, AAV 벡터는 AAV2에서 유래된 ITR을 포함할 수 있고 AAV 벡터는 AAV9 캡시드로 패키징될 수 있다). 이러한 벡터 구성체의 구현예는 예를 들어 WO/2019/094253(PCT/US2018/058744)에 제공되어 있고, 이는 전체가 본원에 참조로 포함된다.
일부 구현예에서, "scAAV"는 자기상보성 아데노 관련 바이러스(scAAV)이다. scAAV는 scAAV의 벡터의 적어도 일부(예를 들어, 암호화 영역의 적어도 일부)가 분자내 이중가닥 DNA를 형성하기 때문에 "자기상보성"이라고 한다. 일부 구현예에서, rAAV는 scAAV이다. 일부 구현예에서, 바이러스 벡터는 자연발생적 아데노 관련 바이러스(AAV)로부터 조작되어 유전자 요법에 사용하기 위한 scAAV를 제공한다. 이러한 벡터 구성체 및 이들의 제조 및 정제 방법의 구현예는 예를 들어 WO/2019/094253(PCT/US2018/058744)에 제공되어 있고, 이는 전체가 본원에 참조로 포함된다.
일부 구현예에서, "scAAV"는 단일가닥 아데노 관련 바이러스(ssAAV)이다. ssAAV는 ssAAV의 벡터의 적어도 일부(예를 들어, 암호화 영역의 적어도 일부)가 단일가닥 DNA이기 때문에 "단일가닥"이라고 한다. 일부 구현예에서, rAAV는 ssAAV이다. 일부 구현예에서, 바이러스 벡터는 자연발생적 아데노 관련 바이러스(AAV)로부터 조작되어 유전자 요법에 사용하기 위한 ssAAV를 제공한다.
본원에서 사용되는 바와 같이, "바이러스" 또는 "비리온"은 예를 들어, 단독으로 또는 하나 이상의 바이러스 캡시드와 같은 하나 이상의 추가 구성요소와 조합하여 바이러스 벡터를 포함하는 바이러스 입자를 나타낸다. 예를 들어, AAV 바이러스는 예를 들어 AAV 캡시드 단백질 외피와 관련된 선형, 단일가닥 AAV 핵산 게놈을 포함할 수 있다.
일부 구현예에서, "바이러스", "비리온", "AAV 바이러스", "재조합 AAV 비리온", "rAAV 비리온", "AAV 벡터 입자", "전체 캡시드", "전체 입자" 등과 같은 용어는 예를 들어 AAV ITR에 의해 한쪽 또는 양쪽이 플랭킹된 바이러스 벡터에서 관심 이종 뉴클레오티드 서열을 캡슐화하는 AAV 단백질 쉘을 포함하는 것과 같은 감염성 복제-결함 바이러스를 나타낸다. rAAV 비리온은 단독으로 또는 예를 들어 동일하거나 추가적인 플라스미드 상에서 (cap 유전자와 같은) AAV 헬퍼 기능 및 보조 기능을 암호화하는 핵산과 조합하여, AAV 벡터를 특정하는 서열(예를 들어, 하나 이상의 플라스미드)을 포함하는 적합한 숙주 세포에서 생성될 수 있다. 일부 구현예에서, 숙주 세포는 (관심 재조합 뉴클레오티드 서열을 포함하는) AAV 벡터를 후속 유전자 전달을 위한 감염성 재조합 비리온 입자로 패키징하는 AAV 폴리펩티드를 암호화할 수 있게 된다.
용어 "역위 말단 반복부" 또는 "ITR"은 예를 들어 아데노 관련 바이러스(AAV) 및/또는 재조합 아데노 관련 바이러스 벡터(rAAV)에서 T형 회문 구조를 형성할 수 있는 뉴클레오티드 서열의 스트레치를 의미한다. 문헌[Muzyczka et al., (2001) Fields Virology, Chapter 29, Lippincott Williams & Wilkins]. 재조합 AAV 벡터에서, 이러한 서열은 게놈 패키징 및 2차 가닥 합성에서 기능적 역할을 할 수 있다.
용어 "숙주 세포"는 관심 외인성 핵산을 포함하는 세포, 예를 들어 하나 이상의 미생물, 효모 세포, 곤충 세포, 또는 포유동물 세포를 나타낸다. 예를 들어, 숙주 세포는 AAV 헬퍼 구성체, AAV 벡터 플라스미드, 보조 기능 벡터, 및/또는 기타 전달 DNA를 포함할 수 있다. 이 용어는 형질감염된 원래 세포의 자손을 포함한다. 단일 모세포의 자손은 자연적, 우발적, 또는 의도적 돌연변이로 인해 형태나 게놈 또는 전체 DNA 보체가 원래 모세포와 반드시 완전히 동일하지 않을 수 있다.
용어 "AAV 헬퍼 기능"은 생산적인 AAV 복제를 위해 트랜스로 기능하는 것과 같은 AAV 유전자 산물을 제공하도록 발현될 수 있는 AAV-유래 암호화 서열을 나타낸다. 예를 들어, AAV 헬퍼 기능에는 주요 AAV 오픈 리딩 프레임(ORF), rep, 및 cap이 포함될 수 있다. Rep 발현 산물은 특히 DNA 복제의 AAV 기원의 인식, 결합, 및 닉킹; DNA 헬리카제 활성; 및 AAV(또는 다른 이종) 프로모터로부터의 전사 조절을 포함한 많은 기능을 보유하는 것으로 나타났다. Cap 발현 산물은 필요한 패키징 기능을 제공한다. AAV 헬퍼 기능은 AAV 벡터에서 누락된 트랜스의 AAV 기능을 보완하기 위해 본원에서 사용될 수 있다.
용어 "AAV 헬퍼 구성체"는 일반적으로 AAV 벡터, 예를 들어 관심 뉴클레오티드 서열을 표적 세포 또는 조직에 전달하기 위한 벡터에서 결실된 AAV 기능을 제공하는 단백질 또는 핵산을 제공하거나 암호화하는 뉴클레오티드 서열을 포함하는 핵산 분자를 지칭한다. 일반적으로 AAV 헬퍼 구성체는 AAV 복제를 위한 누락된 AAV 기능을 보완하기 위해 AAV rep 및/또는 cap 유전자의 일시적인 발현을 제공하는 데 사용된다. 일반적으로, 헬퍼 구성체는 AAV ITR이 결여되어 있으며, 그 자체로 복제나 패키징할 수 없다. AAV 헬퍼 구성체는 플라스미드, 파지, 트랜스포존, 코스미드, 바이러스, 또는 비리온의 형태일 수 있다. Rep 및 Cap 발현 산물 둘 다를 암호화하는 일반적으로 사용되는 플라스미드 pAAV/Ad 및 plM29+45와 같은 다수의 AAV 헬퍼 구성체가 개시되어 있다. 예를 들어, 문헌[Samulski et al., (1989) J. Virol., 63:3822-3828; McCarty et al., (1991) J. Virol., 65:2936-2945] 참조. Rep 및/또는 Cap 발현 산물을 암호화하는 다수의 다른 벡터가 개시되어 있다. 예를 들어, 미국 특허 5,139,941호 및 6,376,237호 참조. 이러한 벡터 구성체 및 이들의 제조 및 정제 방법의 구현예는 예를 들어 WO/2019/094253(PCT/US2018/058744)에 제공되어 있고, 이는 전체가 본원에 참조로 포함된다.
본원에서 사용되는 용어 "미니유전자"는 복수의 인트론과 엑손 및 적어도 하나의 스플라이스 조절자 결합 부위를 포함하는 핵산 서열을 지칭한다. 구현예에서, 이종 핵산 서열로부터의 발현 중 스플라이스 조절자의 존재 또는 부재는 성숙한 mRNA에 존재하는 엑손의 수를 조절한다. 미니유전자는 본원에서 보다 완전하게 설명된다.
"스플라이스 조절자"는 스플라이스 조절자 결합 부위에 결합하고 pre-mRNA 분자, 예를 들어 본원에 기재된 핵산 분자로부터 생성된 pre-mRNA 분자의 스플라이싱을 조절하는 분자이다. 구현예에서, 스플라이스 조절자는 성숙한 mRNA 분자 내 엑손의 포함을 증가시킨다. 다른 구현예에서, 스플라이스 조절자는 성숙한 mRNA 분자 내 엑손의 포함을 감소시킨다.
"스플라이스 조절자 결합 서열"은 스플라이스 조절자에 의해 인식되는 핵산의 서열이다. 이 용어는 pre-mRNA에서 발견되는 서열뿐만 아니라 pre-mRNA를 생성한 DNA에서 발견되는 서열을 모두 포함하는 것으로 이해되어야 한다. 예시적인 구현예에서, 스플라이스 조절자는 본원에 기재된 화합물(예를 들어 LMI070)이고, 스플라이스 조절자 결합 부위는 서열 AGA를 포함한다. 구현예에서, 스플라이스 조절자 결합 부위는 본원에 기재된 미니유전자의 엑손의 3' 말단 또는 그 근처에, 예를 들어 3' 말단에 배치된다.
"pre-mRNA"는 예를 들어 스플라이싱과 같은 추가 처리를 아직 거치지 않은 DNA(예를 들어, 본원에 기재된 핵산 분자)의 전사를 통해 생성된 RNA의 제1 형태이다. 따라서, pre-mRNA는 인트론과 엑손을 둘 다 포함할 수 있다. Pre-mRNA 분자는 예를 들어 스플라이싱을 통해 추가 처리되어 "성숙 RNA" 또는 "mRNA"를 형성한다.
본원에 개시된 핵산 서열, 미니유전자, 벡터, 및 방법은 미니유전자 및 상기 미니유전자를 포함하는 조절 가능한 발현 시스템, 이러한 미니유전자와 이식유전자 발현을 제어하는 발현 시스템과 조합된 스플라이스 조절자의 용도, 이에 대한 다른 용도, 및 이들의 조합, 예를 들어 (1) 스플라이스 조절자의 존재하에 이식유전자 서열의 발현을 유도하고 스플라이스 조절자의 부재하에 이식유전자 서열의 발현을 감소시키는 것(온-스위치) 및 (2) 스플라이스 조절자의 부재하에 이식유전자 서열의 발현을 유도하고 스플라이스 조절자의 존재하에 이식유전자 서열의 발현을 감소시키는 것(오프-스위치)에 관한 것이다. 예를 들어, 본원에 개시된 핵산 서열, 벡터, 및 방법은 스플라이스-조절자-의존적 방식으로 인간 PGRN 또는 기타 치료용 단백질 서열의 발현을 유도할 수 있다.
핵산 분자
관심 분자(예: 관심 단백질)를 암호화하는 이식유전자를 포함하는 핵산 분자가 본원에 개시되며, 이식유전자는 예를 들어 본원에 기재된 바와 같은 미니유전자에 작동 가능하게 연결된다.
미니유전자
본원에 개시된 핵산 분자 및 기타 양태는 미니유전자를 포함한다. 본 발명의 예시적인 미니유전자는 도 1a(온-스위치) 및 도 1b(오프-스위치)에 도시되어 있다. 복수의 인트론과 엑손 및 적어도 하나의 스플라이스 조절자 결합 부위를 포함하는 핵산 서열인 미니유전자가 본원에 개시된다. 구현예에서, 미니유전자는 이식유전자에 작동 가능하게 연결된다. 본원에 기재된 바와 같은 미니유전자는 미니유전자와 관련된 이식유전자로부터 관심 분자의 발현을 제어(예를 들어, 턴온 또는 턴오프)하기 위해 하나 이상의 스플라이스 조절자와 함께 사용된다.
양태에서, 미니유전자는 제1 엑손; 제1 인트론; 제2 엑손; 제2 인트론; 및 제3 엑손을 포함하고, 상기 제2 엑손은 스플라이스 조절자 결합 서열을 포함하고, 스플라이스 조절자의 존재하에 상기 제2 엑손은 핵산의 mRNA 산물에 포함되고, 상기 스플라이스 조절자의 부재하에 상기 제2 엑손은 핵산의 mRNA 산물에 포함되지 않는다.
양태에서, 미니유전자의 제3 엑손은 스플라이스 조절자의 부재하에 생성된 핵산의 mRNA 산물에서 프레임 내에 있고 스플라이스 조절자의 존재하에 생성된 핵산의 mRNA 산물에서 프레임 내에 있지 않은 정지코돈을 포함한다. 따라서, 스플라이스 조절자의 부재하에, 미니유전자의 다운스트림에 배치된 관심 분자(예: 관심 단백질)를 암호화하는 서열의 번역은, 예를 들어 프레임내 정지코돈을 포함하는 엑손의 포함에 의한 번역의 조기 종결로 인해 감소되는 반면, 스플라이스 조절자의 존재하에, 정지코돈은 프레임에서 벗어나 관심 분자의 번역이 증가된다. 따라서 이러한 양태는 스플라이스 조절자의 존재가 관심 분자의 발현을 턴"온"(예를 들어, 증가)시키기 때문에, 본원에서 "온-스위치" 미니유전자로 지칭된다.
다른 구현예에서, 제2 엑손은 스플라이스 조절자의 존재하에 생성된 핵산의 mRNA 산물에서 프레임 내에 있는 정지코돈을 포함한다. 따라서, 스플라이스 조절자의 존재하에, 정지코돈을 포함하는 엑손이 전사에 포함되고, 미니유전자의 다운스트림에 배치된 관심 분자(예: 관심 단백질)를 암호화하는 서열의 번역이 감소되는 반면, 스플라이스 조절자의 부재하에, 정지코돈을 포함하는 엑손은 mRNA에 존재하지 않고 관심 분자의 발현이 증가된다. 따라서 이러한 양태는 스플라이스 조절자의 존재가 관심 분자의 발현을 턴"오프"(예를 들어, 감소)시키기 때문에, 본원에서 "오프-스위치" 미니유전자로 지칭된다.
이론에 구애됨이 없이, 본원에서 벡터는 제한된 암호화 용량을 가질 수 있는 것으로 인식된다(즉, 기능을 하기 위해 크기가 제한될 수 있음). 따라서, 2000개 미만, 1900개 미만, 1800개 미만, 1700개 미만, 1600개 미만, 1500개 미만, 1400개 미만, 1300개 미만, 1200개 미만, 1100개 미만, 1000개 미만, 900개 미만, 800개 미만, 700개 미만, 600개 미만, 또는 500개 미만의 뉴클레오티드를 포함하는 미니유전자가 본원에서 고려된다. 또한, 약 2500개 내지 약 500개의 뉴클레오티드, 예를 들어, 약 2000개 내지 약 600개의 뉴클레오티드, 예를 들어, 약 1500개 내지 약 700개의 뉴클레오티드, 예를 들어, 약 1200개 내지 약 800개의 뉴클레오티드, 예를 들어 약 1100개 내지 약 900개의 뉴클레오티드를 포함하는 미니유전자가 본원에 고려된다. 이론에 구애됨이 없이, 이러한 길이를 갖는 미니유전자가 이식유전자를 포함하는 벡터에 포함될 수 있고, 생성된 벡터는 예를 들어 숙주 세포에서 기능하기에 적절한 크기이다. 구현예에서, 미니유전자의 서열은 인간 기원의 서열이거나 인간 기원의 서열에서 유래된다. 스플라이스 조절자 결합 서열을 포함하는 것으로 확인된 인간 기원의 참조 서열이 본원에서 고려되는 길이보다 더 긴 경우, 이러한 서열은 예를 들어 인트론 또는 엑손 서열을 결실시킴으로써 짧아될 수 있다.
구현예에서, 본원에 기재된 미니유전자는 추가로 변형될 수 있다. 이러한 변형은 미니유전자의 하나 이상의 특성을 개선하도록 설계된다. 예를 들어, 미니유전자에 포함될 수 있는 인간 게놈 서열에서 유래된 서열은 하나 이상의 시작코돈(예를 들어 ATG 서열)을 돌연변이시키거나 제거하거나; 원치 않는 모든 잠재적 스플라이스 수여체 또는 스플라이스 공여체 서열을 제거하거나 돌연변이시키거나; 1개 이상, 예를 들어 2, 3, 4, 5, 또는 6개의 GAA 반복부(서열번호 101)를 포함(예를 들어 GAAGAAGAA(서열번호 69)를 포함)시키거나; Kozak 서열(예를 들어 GCCACC(서열번호 70)의 Kozak 서열)을 포함시키거나; 이러한 변형들의 임의의 조합을 위해 추가로 변형될 수 있다.
스플라이스 조절자 결합 서열
본 발명의 양태는 스플라이스 조절자 결합 서열을 포함하는 적어도 하나의 엑손을 포함하는 미니유전자를 포함한다. 양태에서, 스플라이스 조절자 결합 서열은 미니유전자의 엑손의 '3 말단 또는 그 근처에 배치된다. 양태에서, 스플라이스 조절자 결합 서열은 미니유전자의 엑손의 '3 말단에 배치된다. 양태에서, 스플라이스 조절자 결합 부위는 인간 게놈의 서열에서 유래된다. 스플라이스 조절자에 의해 인식되는 스플라이스 조절자 결합 부위를 식별하기 위해 본원에, 예를 들어 실시예에 기재된 방법이 사용된다. 하기 표 1은 엑손의 '3 말단에 스플라이스 조절자 결합 부위(예를 들어, 서열 AGA)를 포함하는 예시적인 엑손 서열의 목록이다. 이러한 스플라이스 조절자 결합 서열은 LMI070과 같은 본원에 기재된 스플라이스 조절자에 의해 인식된다. 도 2는 SNX7에서 유래된 미니유전자의 설계를 나타낸다.
[표 1]
서열번호 80은 서열번호 1을 포함하는 snx7 유전자좌의 엑손 8과 9 사이에 위치한, 스플라이스 조절자 결합 부위를 포함하는 크립틱 엑손의 전장 게놈 서열(144 nt)이다.
AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGAATGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATGTCCTTGCTATCCCTGTCTTCTGTAGCTATTCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 80).
서열번호 16은 서열번호 80에서 유래된 것으로, ORF에 프레임이동을 생성하도록 변형되었고 발현이 약해지는 것을 방지하기 위해 시작코돈이 제거되었다.
AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGATTGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATTGTCCTTGCTATCCTGTCTTCTGTAGCTATCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 16).
구현예에서, 미니유전자는 서열번호 1 내지 서열번호 10 또는 서열번호 80 중 어느 하나에서 유래된 엑손 서열, 예를 들어 제2 엑손 서열을 포함한다. 구현예에서, 미니유전자의 엑손, 예를 들어 제2 엑손은 서열번호 1 내지 서열번호 10 또는 서열번호 80 중 어느 하나를 포함하거나 어느 하나로 이루어진다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 1, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 1의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 2, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 2의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 3, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 3의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 4, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 4의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 5, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 5의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 6, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 6의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 7, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 7의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 8, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 8의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 9, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 9의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 10, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 10의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 80, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 80의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 일부 구현예에서, 본원에 기재된 미니유전자는 서열번호 16, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 해당 서열의 뉴클레오티드의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 95%, 97%, 98%, 또는 99%를 포함하는 서열번호 16의 단편을 포함하거나 이러한 서열 또는 단편으로 이루어진 엑손(예를 들어 제2 엑손)을 포함한다. 구현예에서, 제2 엑손은 서열번호 16으로 이루어진다.
일부 구현예에서, 제2 엑손은 3n-1개의 뉴클레오티드로 이루어지도록 변형되어(n은 임의의 정수임), mRNA에 제2 엑손을 포함하면 제2 엑손을 포함하지 않는 mRNA에 비해 프레임 이동이 일어난다.
스플라이스 조절자
본원에서 사용되는 용어 "스플라이스 조절자"는 대체 스플라이싱을 매개할 수 있는 화합물을 지칭한다. 예시적인 구현예에서, 스플라이스 조절자는 mRNA 산물 내 엑손의 포함을 조절한다(예를 들어 증가시킨다). 예시적인 구현예에서, 스플라이스 조절자는 스플라이스 조절자 결합 서열(예: 서열 AGA, 예를 들어 조절되는 엑손의 3' 말단의 서열 AGA)에 결합하여 mRNA 산물 내 엑손의 포함을 조절한다(예를 들어 증가시킨다).
본 발명의 양태에서, 스플라이스 조절자는 본원에 기재된 화합물이다. 제1 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 I에 따른 화합물:
[화학식 I]
또는 이의 제약상 허용되는 염이며, 상기 식에서 A'는 C1-C4알킬로부터 독립적으로 선택되는 0, 1, 2, 또는 3개의 치환기로 치환된 페닐이고(2개의 C1-C4알킬기는 이들에 결합되는 원자와 함께 5 내지 6원 고리를 형성함), 옥소, 옥심, 하이드록시, 할로C1-C4알킬, 디할로C1-C4알킬, 트리할로C1-C4알킬, C1-C4알콕시, C1-C4알콕시- C3-C7시클로알킬, 할로C1-C4알콕시, 디할로C1-C4알콕시, 트리할로C1-C4알콕시, 하이드록시, 시아노, 할로겐, 아미노, 모노- 및 디-C1-C4알킬아미노, 헤테로아릴, 하이드록시 치환 C1-C4알킬, 아릴 치환 C1-C4알콕시, 아미노, -C(O)NH C1-C4알킬 - 헤테로아릴, -NHC(O)- C1-C4알킬- 헤테로아릴, C1-C4알킬 C(O)NH- 헤테로아릴, C1-C4알킬 NHC(O)- 헤테로아릴, 3 내지 7원 시클로알킬, 5 내지 7원 시클로알케닐, 또는 1 또는 2개의 헤테로원자(S, O, 및 N으로부터 독립적으로 선택됨)를 함유하는 5, 6, 또는 9원 헤테로환으로부터 선택되는 0 또는 1개의 치환기로 치환되고, 헤테로아릴은 5, 6, 또는 9개의 고리 원자, 1, 2, 또는 3개의 고리 헤테로원자(N, O, 및 S로부터 선택됨)를 갖고 옥소, 하이드록시, 니트로, 할로겐, C1-C4알킬, C1-C4알케닐, C1-C4알콕시, C3-C7시클로알킬, C1-C4알킬-OH, 트리할로C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, -C(O)NH2, -NH2, -NO2, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 4 내지 7원 헤테로환C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되거나; A'는 1 내지 3개의 고리 질소 원자를 갖는 6원 헤테로아릴(6원 헤테로아릴은 페닐로 치환됨)이거나, 5 또는 6개의 고리 원자, 1 또는 2개의 고리 헤테로원자(N, O, 및 S로부터 독립적으로 선택됨)를 갖는 헤테로아릴이고 C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되거나; A'는 9 내지 10개의 고리 원자 및 1, 2, 또는 3개의 고리 헤테로원자(N, O, 또는 S로부터 독립적으로 선택됨)를 갖는 이환 헤테로아릴이고, 이환 헤테로아릴은 옥소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시 및 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노-및 디-C1-C4알킬아미노로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되고; B는 하기 화학식의 기이고:
상기 식에서 m, n, 및 p는 0 또는 1로부터 독립적으로 선택되고; R, R1, R2, R3, 및 R4는 수소, C1-C4알킬(알킬은 임의적으로 하이드록시로 치환됨), 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 이루어진 군으로부터 독립적으로 선택되고; R5 및 R6은 수소 및 불소로부터 독립적으로 선택되거나; R 및 R3은 함께 0 또는 1개의 추가 고리 헤테로원자(N, O, 또는 S로부터 선택됨)를 갖는 융합 5 또는 6원 헤테로환 고리를 형성하고; R1 및 R3은 함께 C1-C3알킬렌기를 형성하고; R1 및 R5는 함께 C1-C3알킬렌기를 형성하고; R3 및 R4는 이들에 부착되는 탄소 원자와 함께 스피로환C3-C6시클로알킬을 형성하고; X는 CRA'RB', NR7, 또는 결합이고; R7은 수소 또는 C1-C4알킬이고; RA' 및 RB'는 수소 및 C1-C4알킬로부터 독립적으로 선택되거나, RA' 및 RB'는 함께 2가 C2-C5알킬렌기를 형성하고; Z는 CR8 또는 N이고; Z가 N인 경우, X는 결합이고; R8은 수소이거나 R6과 함께 이중결합을 형성하거나; B는 하기 화학식의 기이고:
상기 식에서 Y는 C 또는 O이고, Y가 O인 경우 R11 및 R12는 둘 다 존재하지 않고; p 및 q는 0, 1, 및 2로 이루어진 군으로부터 독립적으로 선택되고; R9 및 R13은 수소 및 C1-C4알킬로부터 독립적으로 선택되고; R10 및 R14는 수소, 아미노, 모노- 및 디-C1-C4알킬아미노, 및 C1-C4알킬로부터 독립적으로 선택되고(알킬은 임의적으로 하이드록시, 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 치환됨); R11은 수소, C1-C4알킬, 아미노, 또는 모노- 및 디-C1-C4알킬아미노이고; R12는 수소 또는 C1-C4알킬이거나; R9 및 R11은 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환되거나; R11 및 R12는 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환된다.
제2 스플라이스 조절자 양태에서, 스플라이스 조절자는 A'가 하기로부터 선택되는, 제1 스플라이스 조절자 양태에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제3 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 II에 따른 화합물:
[화학식 II]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Y는 N 또는 C-Ra이고; Ra는 수소 또는 C1-C4알킬이고; Rb는 수소, C1-C4알킬, C1-C4알콕시, 하이드록시, 시아노, 할로겐, 트리할로 C1-C4알킬 또는 트리할로 C1-C4알콕시이고; Rc 및 Rd는 각각 독립적으로, 수소, C1-C4알킬, C1-C4알콕시, 하이드록시, 트리할로 C1-C4알킬, 트리할로 C1-C4알콕시, 또는 헤테로아릴이고; A는 1 내지 3개의 고리 질소 원자를 갖는 6원 헤테로아릴(6원 헤테로아릴은 옥소, C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환됨)이거나; A는 N, O, 및 S로부터 독립적으로 선택되는 1 내지 3개의 고리 헤테로원자를 갖는 5원 헤테로아릴이고 C1-C4알킬, 하이드록실, 모노- 및 디-C1-C4알킬아미노, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되거나; A 및 Rc는 이들에 결합되는 원자와 함께, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시 및 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기를 갖는 6원 아릴을 형성하고; B는 하기 화학식의 기이고:
상기 식에서 m, n, 및 p는 0 또는 1로부터 독립적으로 선택되고; R, R1, R2, R3, 및 R4는 수소, C1-C4알킬(알킬은 임의적으로 하이드록시로 치환됨), 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 이루어진 군으로부터 독립적으로 선택되고; R5 및 R6은 수소 및 불소로부터 독립적으로 선택되거나; R 및 R3은 함께 0 또는 1개의 추가 고리 헤테로원자(N, O, 또는 S로부터 선택됨)를 갖는 융합 5 또는 6원 헤테로환 고리를 형성하고; R1 및 R3은 함께 C1-C3알킬렌기를 형성하고; R1 및 R5는 함께 C1-C3알킬렌기를 형성하고; R3 및 R4는 이들에 부착되는 탄소 원자와 함께 스피로환C3-C6시클로알킬을 형성하고; X는 CRA'RB', NR7, 또는 결합이고; R7은 수소 또는 C1-C4알킬이고; RA' 및 RB'는 수소 및 C1-C4알킬로부터 독립적으로 선택되거나, RA' 및 RB'는 함께 2가 C2-C5알킬렌기를 형성하고; Z는 CR8 또는 N이고; Z가 N인 경우, X는 결합이고; R8은 수소이거나 R6과 함께 이중결합을 형성하거나; B는 하기 화학식의 기이고:
상기 식에서 p 및 q는 0, 1, 및 2로 이루어진 군으로부터 독립적으로 선택되고; R9 및 R13은 수소 및 C1-C4알킬로부터 독립적으로 선택되고; R10 및 R14는 수소, 아미노, 모노- 및 디-C1-C4알킬아미노, 및 C1-C4알킬로부터 독립적으로 선택되고(알킬은 임의적으로 하이드록시, 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 치환됨); R11은 수소, C1-C4알킬, 아미노, 또는 모노- 및 디-C1-C4알킬아미노이고; R12는 수소 또는 C1-C4알킬이거나; R9 및 R11은 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환되거나; R11 및 R12는 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환된다.
제4 스플라이스 조절자 양태에서, 스플라이스 조절자는, A가 1 내지 3개의 고리 질소 원자를 갖는 6원 헤테로아릴이고, 6원 헤테로아릴은 옥소, C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환된, 제3 스플라이스 조절자 양태에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제5 스플라이스 조절자 양태에서, 스플라이스 조절자는 A가 하기로부터 선택되는, 제3 또는 제4 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제6 스플라이스 조절자 양태에서, 스플라이스 조절자는, A가 N, O, 및 S로부터 독립적으로 선택되는 1 내지 3개의 고리 헤테로원자를 갖는 5원 헤테로아릴이고 C1-C4알킬, 하이드록실, 모노- 및 디-C1-C4알킬아미노, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환된, 제3 스플라이스 조절자 양태에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제7 스플라이스 조절자 양태에서, 스플라이스 조절자는 A가 하기로부터 선택되는, 제3 또는 제6 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제8 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기 화학식의 기인, 제1 내지 제7 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이며,
상기 식에서 m, n, 및 p는 0 또는 1로부터 독립적으로 선택되고; R, R1, R2, R3, 및 R4는 수소, C1-C4알킬(알킬은 임의적으로 하이드록시로 치환됨), 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 이루어진 군으로부터 독립적으로 선택되고; R5 및 R6은 수소이거나; R 및 R3은 함께 0 또는 1개의 추가 고리 헤테로원자(N, O, 또는 S로부터 선택됨)를 갖는 융합 5 또는 6원 헤테로환 고리를 형성하고; R1 및 R3은 함께 C1-C3알킬렌기를 형성하고; R1 및 R5는 함께 C1-C3알킬렌기를 형성하고; R3 및 R4는 이들에 부착되는 탄소 원자와 함께 스피로환C3-C6시클로알킬을 형성하고; X는 CRA'RB', O, NR7, 또는 결합이고; RA' 및 RB'는 수소 및 C1-C4알킬로부터 독립적으로 선택되거나, RA' 및 RB'는 함께 2가 C2-C5알킬렌기를 형성하고; Z는 CR8 또는 N이고; Z가 N인 경우, X는 결합이고; R8은 수소이거나 R6과 함께 이중결합을 형성한다.
제9 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기 화학식의 기인, 제1 내지 제7 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이며,
상기 식에서 p 및 q는 0, 1, 및 2로 이루어진 군으로부터 독립적으로 선택되고; R9 및 R13은 수소 및 C1-C4알킬로부터 독립적으로 선택되고; R10 및 R14는 수소, 아미노, 모노- 및 디-C1-C4알킬아미노, 및 C1-C4알킬로부터 독립적으로 선택되고(알킬은 임의적으로 하이드록시, 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 치환됨); R11은 수소, C1-C4알킬, 아미노, 또는 모노- 및 디-C1-C4알킬아미노이고; R12는 수소 또는 C1-C4알킬이거나; R9 및 R11은 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환되거나; R11 및 R12는 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환된다.
제10 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 III에 따른 화합물:
[화학식 III]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rb는 수소 또는 하이드록시이고; Rc는 수소 또는 할로겐이고; Rd는 할로겐이다.
제11 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 IV에 따른 화합물:
[화학식 IV]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rb는 하이드록실, 메톡시, 트리플루오로메틸, 또는 트리플루오로메톡시이다.
제12 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 V에 따른 화합물:
[화학식 V]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rb는 하이드록실, 메톡시, 트리플루오로메틸, 또는 트리플루오로메톡시이고; Re는 수소, 하이드록시, 또는 메톡시이다.
제13 스플라이스 조절자 양태에서, 스플라이스 조절자는 Y가 N인, 제3 내지 제9 또는 제11 내지 제12 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제14 스플라이스 조절자 양태에서, 스플라이스 조절자는 Y가 CH인, 제3 내지 제9 또는 제11 내지 제12 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제15 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기로부터 선택되는, 제1 내지 제8 또는 제10 내지 제14 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이며,
,, 또는 ,
상기 식에서 Z는 NH 또는 N(Me)이다.
제16 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 인, 제1 내지 제8 또는 제10 내지 제15 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제17 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 ,,,,,, 및 로부터 선택되는, 제1 내지 제7 또는 제9 내지 제14 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제18 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 인, 제1 내지 제7, 제9 내지 제14, 또는 제17 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제19 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 VI에 따른 화합물:
[화학식 VI]
또는 이의 제약상 허용되는 염이며, 상기 식에서 A는 9 또는 10개의 고리 원자 및 1 또는 2개의 고리 N 원자 및 0 또는 1개의 O 원자를 갖는 이환 헤테로아릴 또는 헤테로환이고, 이환 헤테로아릴 또는 헤테로환은 -C(O)NH2,-C(O)O-C1-C4알킬, 아릴, 옥소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 독립적으로 선택되는 0, 1, 2, 3, 4, 또는 5개의 치환기로 치환되고; B는 하기 화학식의 기이고:
상기 식에서 m, n, 및 p는 0 또는 1로부터 독립적으로 선택되고; R, R1, R2, R3, 및 R4는 수소, C1-C4알킬(알킬은 임의적으로 하이드록시로 치환됨), 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 이루어진 군으로부터 독립적으로 선택되고; R5 및 R6은 수소 및 불소로부터 독립적으로 선택되거나; R 및 R3은 함께 0 또는 1개의 추가 고리 헤테로원자(N, O, 또는 S로부터 선택됨)를 갖는 융합 5 또는 6원 헤테로환 고리를 형성하고; R1 및 R3은 함께 C1-C3알킬렌기를 형성하고; R1 및 R5는 함께 C1-C3알킬렌기를 형성하고; R3 및 R4는 이들에 부착되는 탄소 원자와 함께 스피로환C3-C6시클로알킬을 형성하고; X는 CRARB, O, NR7, 또는 결합이고; R7은 수소 또는 C1-C4알킬이고; RA 및 RB는 수소 및 C1-C4알킬로부터 독립적으로 선택되거나, RA 및 RB는 함께 2가 C2-C5알킬렌기를 형성하고; Z는 CR8 또는 N이고; Z가 N인 경우, X는 결합이고; R8은 수소이거나 R6과 함께 이중결합을 형성하거나; B는 하기 화학식의 기이고:
상기 식에서 p 및 q는 0, 1, 및 2로 이루어진 군으로부터 독립적으로 선택되고; R9 및 R13은 수소 및 C1-C4알킬로부터 독립적으로 선택되고; R10 및 R14는 수소, 아미노, 모노- 및 디-C1-C4알킬아미노, 및 C1-C4알킬로부터 독립적으로 선택되고(알킬은 임의적으로 하이드록시, 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 치환됨); R11은 수소, C1-C4알킬, 아미노, 또는 모노- 및 디-C1-C4알킬아미노이고; R12는 수소 또는 C1-C4알킬이거나; R9 및 R11은 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환되거나; R11 및 R12는 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환된다.
제20 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 VII에 따른 화합물:
[화학식 VII]
또는 이의 제약상 허용되는 염이며, 상기 식에서 A는 10개의 고리 원자 및 1 또는 2개의 고리 N 원자를 갖는 이환 헤테로아릴이고, 이환 헤테로아릴은 옥소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되고; B는 하기 화학식의 기이고:
상기 식에서 m, n, 및 p는 0 또는 1로부터 독립적으로 선택되고; R, R1, R2, R3, 및 R4는 수소, C1-C4알킬(알킬은 임의적으로 하이드록시로 치환됨), 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 이루어진 군으로부터 독립적으로 선택되고; R5 및 R6은 수소 및 불소로부터 독립적으로 선택되거나; R 및 R3은 함께 0 또는 1개의 추가 고리 헤테로원자(N, O, 또는 S로부터 선택됨)를 갖는 융합 5 또는 6원 헤테로환 고리를 형성하고; R1 및 R3은 함께 C1-C3알킬렌기를 형성하고; R1 및 R5는 함께 C1-C3알킬렌기를 형성하고; R3 및 R4는 이들에 부착되는 탄소 원자와 함께 스피로환C3-C6시클로알킬을 형성하고; X는 CRARB, O, NR7, 또는 결합이고; R7은 수소 또는 C1-C4알킬이고; RA 및 RB는 수소 및 C1-C4알킬로부터 독립적으로 선택되거나, RA 및 RB는 함께 2가 C2-C5알킬렌기를 형성하고; Z는 CR8 또는 N이고; Z가 N인 경우, X는 결합이고; R8은 수소이거나 R6과 함께 이중결합을 형성하거나; B는 하기 화학식의 기이고:
상기 식에서 p 및 q는 0, 1, 및 2로 이루어진 군으로부터 독립적으로 선택되고; R9 및 R13은 수소 및 C1-C4알킬로부터 독립적으로 선택되고; R10 및 R14는 수소, 아미노, 모노- 및 디-C1-C4알킬아미노, 및 C1-C4알킬로부터 독립적으로 선택되고(알킬은 임의적으로 하이드록시, 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 치환됨); R11은 수소, C1-C4알킬, 아미노, 또는 모노- 및 디-C1-C4알킬아미노이고; R12는 수소 또는 C1-C4알킬이거나; R9 및 R11은 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환되거나; R11 및 R12는 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환된다.
제21 스플라이스 조절자 양태에서, 스플라이스 조절자는 A가 하기로부터 선택되는, 제19 또는 제20 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이며,
상기 식에서 u 및 v는 각각 독립적으로 0, 1, 2, 또는 3이고; 각각의 Ra 및 Rb는 독립적으로, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 선택된다.
제22 스플라이스 조절자 양태에서, 스플라이스 조절자는 A가 하기로부터 선택되는, 제19 내지 제21 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이며,
상기 식에서 u 및 v는 각각 독립적으로 0, 1, 2, 또는 3이고; 각각의 Ra 및 Rb는 독립적으로, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 선택된다.
다른 스플라이스 조절자 양태에서, A가 오쏘 위치에서 하이드록실기로 치환된, 제19 내지 제22 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이 제공된다.
제23 스플라이스 조절자 양태에서, 스플라이스 조절자는 A가 하기로부터 선택되는, 제19 내지 제22 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제24 스플라이스 조절자 양태에서, 스플라이스 조절자는 A가 단일 N 원자를 갖는, 제19 내지 제23 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제25 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 VIII에 따른 화합물:
[화학식 VIII]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rc 및 Rd는 각각 독립적으로, 수소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 선택된다.
제26 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 IX에 따른 화합물:
[화학식 IX]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rc 및 Rd는 각각 독립적으로, 수소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 선택된다.
제27 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 X에 따른 화합물:
[화학식 X]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rc 및 Rd는 각각 독립적으로, 수소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 선택된다.
제28 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 XI에 따른 화합물:
[화학식 XI]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rc 및 Rd는 각각 독립적으로, 수소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 선택된다.
제29 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 XII에 따른 화합물:
[화학식 XII]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rc 및 Rd는 각각 독립적으로, 수소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 선택된다.
제30 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 VIII에 따른 화합물:
[화학식 XIII]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rc 및 Rd는 각각 독립적으로, 수소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 선택된다.
제31 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 XIV에 따른 화합물:
[화학식 XIV]
또는 이의 제약상 허용되는 염이며, 상기 식에서 Rc 및 Rd는 각각 독립적으로, 수소, 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, C3-C7시클로알킬, 헤테로시클릴, 헤테로아릴, 헤테로시클릴 C1-C4알킬, C1-C4알킬 아릴, C1-C4알킬 헤테로시클릴, C1-C4알킬 헤테로아릴, C1-C4알콕시 아릴, C1-C4알콕시 헤테로시클릴, C1-C4알콕시 헤테로아릴, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 선택된다.
제32 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기 화학식의 기인, 제19 내지 제31 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이며,
상기 식에서 m, n, 및 p는 0 또는 1로부터 독립적으로 선택되고; R, R1, R2, R3, 및 R4는 수소, C1-C4알킬(알킬은 임의적으로 하이드록시로 치환됨), 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 이루어진 군으로부터 독립적으로 선택되고; R5 및 R6은 수소이거나; R 및 R3은 함께 0 또는 1개의 추가 고리 헤테로원자(N, O, 또는 S로부터 선택됨)를 갖는 융합 5 또는 6원 헤테로환 고리를 형성하고; R1 및 R3은 함께 C1-C3알킬렌기를 형성하고; R1 및 R5는 함께 C1-C3알킬렌기를 형성하고; R3 및 R4는 이들에 부착되는 탄소 원자와 함께 스피로환C3-C6시클로알킬을 형성하고; X는 CRARB, O, NR7, 또는 결합이고; RA 및 RB는 수소 및 C1-C4알킬로부터 독립적으로 선택되거나, RA 및 RB는 함께 2가 C2-C5알킬렌기를 형성하고; Z는 CR8 또는 N이고; Z가 N인 경우, X는 결합이고; R8은 수소이거나 R6과 함께 이중결합을 형성한다.
제33 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기 화학식의 기인, 제19 내지 제32 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이며,
상기 식에서 p 및 q는 0, 1, 및 2로 이루어진 군으로부터 독립적으로 선택되고; R9 및 R13은 수소 및 C1-C4알킬로부터 독립적으로 선택되고; R10 및 R14는 수소, 아미노, 모노- 및 디-C1-C4알킬아미노, 및 C1-C4알킬로부터 독립적으로 선택되고(알킬은 임의적으로 하이드록시, 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 치환됨); R11은 수소, C1-C4알킬, 아미노, 또는 모노- 및 디-C1-C4알킬아미노이고; R12는 수소 또는 C1-C4알킬이거나; R9 및 R11은 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환되거나; R11 및 R12는 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환된다.
제34 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기로 이루어진 군으로부터 선택되는, 제19 내지 제33 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이며,
상기 식에서 X는 O 또는 N(Me) 또는 NH이고; R17은 수소 또는 메틸이다.
제35 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기 화학식의 기인, 제19 내지 제34 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제36 스플라이스 조절자 양태에서, 스플라이스 조절자는 X가 -O-인, 제19 내지 제35 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제37 스플라이스 조절자 양태에서, 스플라이스 조절자는 X가 N(Me)인, 제19 내지 제36 스플라이스 조절자 양태 중 어느 하나에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제38 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 XV에 따른 화합물:
[화학식 XV]
또는 이의 제약상 허용되는 염이며, 상기 식에서 A는 C1-C4알킬로부터 독립적으로 선택되는 0, 1, 2, 또는 3개의 치환기로 치환된 2-하이드록시-페닐이고(2개의 C1-C4알킬기는 이들에 결합되는 원자와 함께 5 내지 6원 고리를 형성함), 옥소, 옥심, 하이드록시, 할로C1-C4알킬, 디할로C1-C4알킬, 트리할로C1-C4알킬, C1-C4알콕시, C1-C4알콕시- C3-C7시클로알킬, 할로C1-C4알콕시, 디할로C1-C4알콕시, 트리할로C1-C4알콕시, 하이드록시, 시아노, 할로겐, 아미노, 모노- 및 디-C1-C4알킬아미노, 헤테로아릴, 하이드록시 치환 C1-C4알킬, 아릴 치환 C1-C4알콕시, 아미노, -C(O)NH C1-C4알킬 - 헤테로아릴, -NHC(O)- C1-C4알킬- 헤테로아릴, C1-C4알킬 C(O)NH- 헤테로아릴, C1-C4알킬 NHC(O)- 헤테로아릴, 3 내지 7원 시클로알킬, 5 내지 7원 시클로알케닐, 또는 1 또는 2개의 헤테로원자(S, O, 및 N으로부터 독립적으로 선택됨)를 함유하는 5, 6, 또는 9원 헤테로환으로부터 선택되는 0 또는 1개의 치환기로 치환되고, 헤테로아릴은 5, 6, 또는 9개의 고리 원자, 1, 2, 또는 3개의 고리 헤테로원자(N, O, 및 S로부터 선택됨)를 갖고 옥소, 하이드록시, 니트로, 할로겐, C1-C4알킬, C1-C4알케닐, C1-C4알콕시, C3-C7시클로알킬, C1-C4알킬-OH, 트리할로C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, -C(O)NH2, -NH2, -NO2, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 4 내지 7원 헤테로환C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되거나; A는 3번 위치에서 하이드록시로 임의적으로 치환되고 하이드록시, 시아노, 할로겐, C1-C4알킬, C2-C4알케닐, C1-C5알콕시로부터 선택되는 0, 1, 또는 2개의 치환기로 추가적으로 치환된 2-나프틸(알콕시는 비치환이거나 하이드록시, C1-C4알콕시, 아미노, N(H)C(O)C1-C4알킬, N(H)C(O)2 C1-C4알킬, 알킬렌 4 내지 7원 헤테로환, 4 내지 7원 헤테로환, 및 모노- 및 디-C1-C4알킬아미노로 치환됨)이거나; A는 1 내지 3개의 고리 질소 원자를 갖는 6원 헤테로아릴(6원 헤테로아릴은 페닐로 치환됨)이거나, 5 또는 6개의 고리 원자, 1 또는 2개의 고리 헤테로원자(N, O, 및 S로부터 독립적으로 선택됨)를 갖는 헤테로아릴이고 C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되거나; A는 9 내지 10개의 고리 원자 및 1, 2, 또는 3개의 고리 헤테로원자(N, O, 또는 S로부터 독립적으로 선택됨)를 갖는 이환 헤테로아릴이고, 이환 헤테로아릴은 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시 및 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노-및 디-C1-C4알킬아미노로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되거나; A는 12 또는 13개의 고리 원자 및 1, 2, 또는 3개의 고리 헤테로원자(N, O, 또는 S로부터 독립적으로 선택됨)를 갖는 삼환 헤테로아릴이고, 삼환 헤테로아릴은 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시, 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 모노- 및 디-C1-C4알킬아미노, 및 헤테로아릴로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되고, 상기 헤테로아릴은 5, 6, 또는 9개의 고리 원자, 1, 2, 또는 3개의 고리 헤테로원자(N, O, 및 S로부터 선택됨)를 갖고 옥소, 하이드록시, 니트로, 할로겐, C1-C4알킬, C1-C4알케닐, C1-C4알콕시, C3-C7시클로알킬, C1-C4알킬-OH, 트리할로C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, -C(O)NH2, -NH2, -NO2, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 4 내지 7원 헤테로환C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되고; B는 하기 화학식의 기이고:
상기 식에서 m, n, 및 p는 0 또는 1로부터 독립적으로 선택되고; R, R1, R2, R3, 및 R4는 수소, C1-C4알킬(알킬은 임의적으로 하이드록시로 치환됨), 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 이루어진 군으로부터 독립적으로 선택되고; R5 및 R6은 수소 및 불소로부터 독립적으로 선택되거나; R 및 R3은 함께 0 또는 1개의 추가 고리 헤테로원자(N, O, 또는 S로부터 선택됨)를 갖는 융합 5 또는 6원 헤테로환 고리를 형성하고; R1 및 R3은 함께 C1-C3알킬렌기를 형성하고; R1 및 R5는 함께 C1-C3알킬렌기를 형성하고; R3 및 R4는 이들에 부착되는 탄소 원자와 함께 스피로환C3-C6시클로알킬을 형성하고; X는 CRARB, O, NR7, 또는 결합이고; R7은 수소 또는 C1-C4알킬이고; RA 및 RB는 수소 및 C1-C4알킬로부터 독립적으로 선택되거나, RA 및 RB는 함께 2가 C2-C5알킬렌기를 형성하고; Z는 CR8 또는 N이고; Z가 N인 경우, X는 결합이고; R8은 수소이거나 R6과 함께 이중결합을 형성하거나; B는 하기 화학식의 기이고:
상기 식에서 p 및 q는 0, 1, 및 2로 이루어진 군으로부터 독립적으로 선택되고; R9 및 R13은 수소 및 C1-C4알킬로부터 독립적으로 선택되고; R10 및 R14는 수소, 아미노, 모노- 및 디-C1-C4알킬아미노, 및 C1-C4알킬로부터 독립적으로 선택되고(알킬은 임의적으로 하이드록시, 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 치환됨); R11은 수소, C1-C4알킬, 아미노, 또는 모노- 및 디-C1-C4알킬아미노이고; R12는 수소 또는 C1-C4알킬이거나; R9 및 R11은 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환되거나; R11 및 R12는 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환된다.
제39 스플라이스 조절자 양태에서, 스플라이스 조절자는, A가 1 내지 3개의 고리 질소 원자를 갖는 6원 헤테로아릴(6원 헤테로아릴은 페닐로 치환됨)이거나, 5 또는 6개의 고리 원자, 1 또는 2개의 고리 헤테로원자(N, O, 및 S로부터 독립적으로 선택됨)를 갖는 헤테로아릴이고 C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환되거나; A가 9 내지 10개의 고리 원자 및 1, 2, 또는 3개의 고리 헤테로원자(N, O, 또는 S로부터 독립적으로 선택됨)를 갖는 이환 헤테로아릴이고, 헤테로아릴은 시아노, 할로겐, 하이드록시, C1-C4알킬, C2-C4알케닐, C2-C4알키닐, C1-C4알콕시 및 하이드록시 치환 C1-C4알콕시, C1-C4알콕시, 아미노, 및 모노- 및 디-C1-C4알킬아미노로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환된, 제38 스플라이스 조절자 양태에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제40 스플라이스 조절자 양태에서, 스플라이스 조절자는, A가 C1-C4알킬, 할로C1-C4알킬 C1-C4알콕시, 하이드록시, 시아노, 할로겐, 아미노, 모노- 및 디-C1-C4알킬아미노, 헤테로아릴, 및 하이드록시 또는 아미노 치환 C1-C4알킬로부터 독립적으로 선택되는 0, 1, 2, 또는 3개의 치환기로 치환된 2-하이드록시-페닐이고, 헤테로아릴은 5 또는 6개의 고리 원자, 1 또는 2개의 고리 헤테로원자(N, O, 및 S로부터 선택됨)를 갖고 C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 4 내지 7원 헤테로환C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 독립적으로 선택되는 0, 1, 또는 2개의 치환기로 치환된, 제38 스플라이스 조절자 양태에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제41 스플라이스 조절자 양태에서, 스플라이스 조절자는, A가 3번 위치에서 하이드록시로 임의적으로 치환되고 하이드록시, 시아노, 할로겐, C1-C4알킬, C2-C4알케닐, C1-C4알콕시로부터 선택되는 0, 1, 또는 2개의 치환기로 추가적으로 치환된 2-나프틸이고, 알콕시는 비치환이거나 하이드록시, C1-C4알콕시, 아미노, N(H)C(O)C1-C4알킬, N(H)C(O)2 C1-C4알킬, 4 내지 7원 헤테로환, 및 모노- 및 디-C1-C4알킬아미노로 치환된, 제38 스플라이스 조절자 양태에 따른 화합물 또는 이의 제약상 허용되는 염이다.
제42 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기 화학식의 기인, 제38 내지 제41 스플라이스 조절자 양태에 따른 화합물 또는 이의 제약상 허용되는 염이며,
상기 식에서 m, n, 및 p는 0 또는 1로부터 독립적으로 선택되고; R, R1, R2, R3, 및 R4는 수소, C1-C4알킬(알킬은 임의적으로 하이드록시로 치환됨), 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 이루어진 군으로부터 독립적으로 선택되고; R5 및 R6은 수소이거나; R 및 R3은 함께 0 또는 1개의 추가 고리 헤테로원자(N, O, 또는 S로부터 선택됨)를 갖는 융합 5 또는 6원 헤테로환 고리를 형성하고; R1 및 R3은 함께 C1-C3알킬렌기를 형성하고; R1 및 R5는 함께 C1-C3알킬렌기를 형성하고; R3 및 R4는 이들에 부착되는 탄소 원자와 함께 스피로환C3-C6시클로알킬을 형성하고; X는 CRARB, O, NR7, 또는 결합이고; RA 및 RB는 수소 및 C1-C4알킬로부터 독립적으로 선택되거나, RA 및 RB는 함께 2가 C2-C5알킬렌기를 형성하고; Z는 CR8 또는 N이고; Z가 N인 경우, X는 결합이고; R8은 수소이거나 R6과 함께 이중결합을 형성한다.
제43 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기 화학식의 기인, 제38 내지 제41 스플라이스 조절자 양태에 따른 화합물 또는 이의 제약상 허용되는 염이며,
상기 식에서 p 및 q는 0, 1, 및 2로 이루어진 군으로부터 독립적으로 선택되고; R9 및 R13은 수소 및 C1-C4알킬로부터 독립적으로 선택되고; R10 및 R14는 수소, 아미노, 모노- 및 디-C1-C4알킬아미노, 및 C1-C4알킬로부터 독립적으로 선택되고(알킬은 임의적으로 하이드록시, 아미노, 또는 모노- 및 디-C1-C4알킬아미노로 치환됨); R11은 수소, C1-C4알킬, 아미노, 또는 모노- 및 디-C1-C4알킬아미노이고; R12는 수소 또는 C1-C4알킬이거나; R9 및 R11은 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환되거나; R11 및 R12는 함께 4 내지 7개의 고리 원자를 갖는 포화 아자환을 형성하고 이는 임의적으로 1 내지 3개의 C1-C4알킬기로 치환된다.
제44 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 XVI에 따른 화합물:
[화학식 XVI]
또는 이의 제약상 허용되는 염이며, 상기 식에서 R15는 수소, 하이드록실, C1-C4알콕시이고, 알콕시는 임의적으로 하이드록시, 메톡시, 아미노, 모노- 및 디-메틸아미노, 또는 모르폴린으로 치환된다.
제45 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 XVII에 따른 화합물:
[화학식 XVII]
또는 이의 제약상 허용되는 염이며, R16은 1개의 고리 질소 원자 및 0 또는 1개의 추가 고리 헤테로원자(N, O, 또는 S로부터 선택됨)를 갖는 5원 헤테로아릴이고, 헤테로아릴은 임의적으로 C1-C4알킬로 치환된다.
제46 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기로 이루어진 군으로부터 선택되는, 제38 내지 제41, 제44, 및 제45 스플라이스 조절자 양태에 따른 화합물이며,
상기 식에서 X는 O 또는 N(Me)이고; R17은 수소 또는 메틸이다.
제47 스플라이스 조절자 양태에서, 스플라이스 조절자는 X가 -O-인, 제38 내지 제42 및 제44 내지 제45 스플라이스 조절자 양태에 따른 화합물이다.
제48 스플라이스 조절자 양태에서, 스플라이스 조절자는 B가 하기 화학식의 기인, 제38 내지 제42 및 제44 내지 제45 스플라이스 조절자 양태에 따른 화합물이다.
제49 스플라이스 조절자 양태에서, 스플라이스 조절자는 R16이 하기 화학식의 기인, 제45 내지 제48 스플라이스 조절자 양태에 따른 화합물이다.
제50 스플라이스 조절자 양태에서, 스플라이스 조절자는 화학식 XVIII에 따른 화합물:
[화학식 XVIII]
또는 이의 제약상 허용되는 염이며, 상기 식에서 X는 -O- 또는
이고; R'은 옥소, 하이드록시, 니트로, 할로겐, C1-C4알킬, C1-C4알케닐, C1-C4알콕시, C3-C7시클로알킬, C1-C4알킬-OH, 트리할로C1-C4알킬, 모노- 및 디-C1-C4알킬아미노, -C(O)NH2, -NH2, -NO2, 하이드록시C1-C4알킬아미노, 하이드록시C1-C4알킬, 4 내지 7원 헤테로환C1-C4알킬, 아미노C1-C4알킬, 및 모노- 및 디-C1-C4알킬아미노C1-C4알킬로부터 선택되는 0, 1, 또는 2개의 기로 임의적으로 치환된 5원 헤테로아릴이다.
특정 구현예에서, 스플라이스 조절자는 하기 구조를 갖는 5-(1H-피라졸-4-일)-2-(6-((2,2,6,6-테트라메틸피페리딘-4-일)옥시)피리다진-3-일)페놀(LMI070; 브라나플람),
또는 이의 제약상 허용되는 염이다.
특정 구현예에서, 스플라이스 조절자는 화합물이 하기 구조를 갖는 7-(6-(메틸(2,2,6,6-테트라메틸피페리딘-4-일)아미노)피리다진-3-일)이소퀴놀린-6-올인, 스플라이스 조절자 2,
또는 이의 제약상 허용되는 염이다.
추가의 스플라이스 조절자 및 이러한 조절자에 결합된 스플라이스 조절자 결합 서열은 예를 들어 특허 출원 공보 US2012/0083495, WO2014/028459, WO2015/017589, WO2014/116845, WO2017/100726, WO2018/098446, WO2018/226622, WO2019/005993, WO2019/005980, 및 WO2019028440에 기재되어 있고, 그 내용은 전체가 본원에 참조로 포함되고, 이들 문헌에 기재된 스플라이스 조절자 및 스플라이스 조절자 결합 서열은 본원에 기재된 방법, 미니유전자, 및 기타 양태와 구현예에서의 사용을 위해 고려된다.
절단 부위
양태에서, 본 발명의 핵산 분자는 이식유전자에 의해 암호화된 서열(예를 들어 관심 단백질)로부터 미니유전자에 의해 암호화된 서열(예를 들어 모든 서열 또는 실질적으로 모든 서열)을 절단하는 기능을 하는, 절단 부위를 암호화하는 하나 이상의 서열을 포함한다. 양태에서, 절단 부위는 자가절단 부위, 프로테아제 절단 부위, 또는 이들의 임의의 조합일 수 있다. 절단 부위는 관심 단백질로부터 미니유전자의 하나 이상의 엑손에 의해 암호화되는 서열을 절단하기에 적절한 수준으로, (재조합 발현 또는 내인성 발현을 통해) 관심 세포에서 발현되는 임의의 부위-특이적 프로테아제에 의해 절단되도록 설계될 수 있다. 본 발명의 중요한 양태에서, 프로테아제 절단 부위는 관심 단백질의 발현과 관련된 세포 구획에 천연적으로(또는 세포 조작에 의해) 존재하는 프로테아제에 상응하도록 선택된다. 즉, 프로테아제의 세포내 이동은 관심 단백질의 세포내 이동과 겹치거나 부분적으로 겹쳐야 한다. 예를 들어, 관심 단백질이 세포 표면에 위치하는 경우, 이를 절단하는 효소는 세포에 외인성으로 추가될 수 있다.
관심 단백질이 엔도솜/리소좀 시스템에 존재하거나 이를 통과하는 경우, 해당 구획에 상주하는 효소에 대한 프로테아제 절단 부위가 사용될 수 있다. 이러한 프로테아제/공통 모티프는 예를 들어 다음을 포함한다.
푸린: RX(K/R)R 공통 모티프 1
푸린: RNRR(서열번호 39)
PCSK1: RX(K/R)R 공통 모티프
PCSK5: RX(K/R)R 공통 모티프
PCSK6: RX(K/R)R 공통 모티프
PCSK7: RXXX[KR]R 공통 모티프
카텝신 B: RRX
그랜자임 B: I-E-P-D-X(서열번호 35)
인자 XA: Ile - Glu/Asp-Gly-Arg
엔테로키나제: Asp-Asp-Asp-Asp-Lys(서열번호 36)
제네나제: Pro-Gly-Ala-Ala-His-Tyr(서열번호 37)
소르타제: LPXTG/A
프리시젼 프로테아제: Leu-Glu-Val-Phe-Gln-Gly-Pro(서열번호 38)
트롬빈: Leu-Val-Pro-Arg-Gly-Ser(서열번호 40)
TEV 프로테아제: E-N-L-Y-F-Q-G(서열번호 41)
엘라스타제 1 [AGSV]-x(서열번호 42)
일부 구현예에서, 본원에 기재된 핵산은 푸린 절단 부위를 암호화하는 서열을 포함한다. 일부 구현예에서, 본원에 기재된 핵산은 표 20에 열거된 푸린 절단 부위 중 어느 하나를 암호화하는 서열을 포함한다. 일부 구현예에서, 푸린 절단 부위는 서열번호 39이다. 일부 구현예에서, 본원에 기재된 핵산은 서열번호 39를 포함하거나 이로 이루어진 푸린 절단 부위를 암호화하는 서열을 포함한다(예를 들어, 절단 부위를 암호화하는 서열은 서열번호 19를 포함하거나 이로 이루어진다).
일부 구현예에서, 본원에 기재된 핵산은 RNRR(서열번호 39) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; RTKR(서열번호 43) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; GTGAEDPRPSRKRRSLGDVG(서열번호 45) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; GTGAEDPRPSRKRR(서열번호 47) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; LQWLEQQVAKRRTKR(서열번호 49) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; GTGAEDPRPSRKRRSLGG(서열번호 51) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; GTGAEDPRPSRKRRSLG(서열번호 53) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; SLNLTESHNSRKKR(서열번호 55) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열; 또는 CKINGYPKRGRKRR(서열번호 57) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열로부터 선택되는 푸린 절단 부위를 암호화하는 서열을 포함한다.
일부 구현예에서, 본원에 기재된 핵산은 RNRR(서열번호 39); RTKR(서열번호 43); GTGAEDPRPSRKRRSLGDVG(서열번호 45); GTGAEDPRPSRKRR(서열번호 47); LQWLEQQVAKRRTKR(서열번호 49); GTGAEDPRPSRKRRSLGG(서열번호 51); GTGAEDPRPSRKRRSLG(서열번호 53); SLNLTESHNSRKKR(서열번호 55); 및 CKINGYPKRGRKRR(서열번호 57)로부터 선택되는 푸린 절단 부위를 암호화하는 서열을 포함한다.
일부 구현예에서, 본원에 기재된 핵산은 RNRR(서열번호 39) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열로부터 선택되는 푸린 절단 부위를 암호화하는 서열을 포함한다. 일부 구현예에서, 본원에 기재된 핵산은 서열번호 19, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 본원에 기재된 핵산은 서열번호 19를 포함한다.
일부 구현예에서, 본원에 기재된 핵산은 GTGAEDPRPSRKRRSLGDVG(서열번호 45) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열, 또는 GTGAEDPRPSRKRR(서열번호 47) 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열로부터 선택되는 푸린 절단 부위를 암호화하는 서열을 포함한다. 일부 구현예에서, 본원에 기재된 핵산은 서열번호 46 또는 서열번호 48, 또는 이와 적어도 90%, 95%, 97%, 98%, 또는 99%의 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 본원에 기재된 핵산은 GTGAEDPRPSRKRRSLGDVG(서열번호 45) 또는 GTGAEDPRPSRKRR(서열번호 47)로부터 선택되는 푸린 절단 부위를 암호화하는 서열을 포함한다. 일부 구현예에서, 본원에 기재된 핵산은 서열번호 46 또는 서열번호 48을 포함한다.
일부 구현예에서, 본원에 기재된 핵산은 GTGAEDPRPSRKRRSLGDVG(서열번호 45)의 푸린 절단 부위를 암호화하는 서열을 포함한다.
[표 20]
일부 구현예에서, 본원에 기재된 바와 같은 미니유전자 및 이식유전자를 포함하는 핵산 서열은 펩티드 절단 부위(예를 들어, 자가절단 펩티드 또는 세포내 프로테아제 기질)를 암호화하는 하나 이상의 서열을 포함할 수 있다. 구현예에서, 펩티드 절단 부위를 암호화하는 서열은 미니유전자와 이식유전자 사이에 배치된다. 자가절단 펩티드 절단 부위 서열의 예는 다음을 포함하고, 괄호 안의 GSG 잔기는 임의적이다.
[표 21]
일부 구현예에서, 핵산 분자는 푸린 절단 부위와 같은 프로테아제 절단 부위를 암호화하는 서열, 및 자가절단 펩티드, 예를 들어 2A 펩티드, 예를 들어 T2A 펩티드를 암호화하는 서열을 포함한다. 구현예에서, 핵산은 2A 암호화 서열을 암호화하는 서열 5'의 푸린 절단 부위를 암호화하는 서열을 포함한다. 구현예에서, 푸린 절단 부위는 서열번호 39를 포함하거나 이로 이루어지고, T2A 서열은 서열번호 59 또는 서열번호 61을 포함하거나 이로 이루어진다. 구현예에서, 푸린 절단 부위를 암호화하는 서열은 서열번호 19이거나 이를 포함하고, 펩티드 절단 부위를 암호화하는 서열은 서열번호 20 또는 서열번호 62이거나 이를 포함한다. 구현예에서, 2A 서열을 암호화하는 서열은 이식유전자(예를 들어, 관심 단백질을 암호화하는 서열)의 5' 바로 옆에 배치되어, 절단시 미니유전자, 푸린 절단 부위, 및/또는 2A 펩티드의 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 미만의 아미노산이 관심 단백질에 남도록 한다.
프로모터
동물이나 인체의 모든 세포는 동일한 DNA를 가지고 있지만, 다른 조직의 다른 세포는 한편으로는 공통 유전자 세트를, 다른 한편으로는 조직 유형 및 발달 단계에 따라 다른 유전자 세트를 발현한다. 이론에 구애됨이 없이, 인트론을 포함하지 않는 임의의 프로모터를 본원에 기재된 다양한 양태 및 구현예(예를 들어, 핵산 분자)에 사용할 수 있다. 본원에 기재된 다양한 양태 및 구현예와 사용될 수 있는 예시적인 프로모터는 거대세포바이러스(CMV) 프로모터, CAG 프로모터, SV40 프로모터, JeT 프로모터, PGK 프로모터, 및 닭 베타-액틴 프로모터(CBA) 프로모터를 포함하나, 이에 한정되지 않는다. 구현예에서, 프로모터는 둘 이상의 세포 유형에서 활성이다. 다른 구현예에서, 프로모터는 하나의 세포 유형에서 활성(예를 들어, 세포-특이적)이거나, 예를 들어 중추 신경 조직(예: 뇌 조직)과 같은 하나의 조직의 세포 유형에서 활성(예를 들어, 조직-특이적)이다. 구현예에서, 프로모터는 뉴런 특이적이다. 본원에 기재된 다양한 양태 및 구현예에 사용될 수 있는 뉴런-특이적 프로모터의 예는 작동 가능하게 연결된 미니유전자 및 이식유전자의 발현을 유도하기 위해 벡터 및 다른 핵산에 사용되는 단리된 또는 합성의 뉴런-특이적 프로모터 및 이의 기능적 단편, 예를 들어 뉴런-특이적 에놀라제(NSE)에서 유래된 프로모터(예를 들어, EMBL HSENO2, X51956 참조); 방향족 아미노산 탈탄산효소(AADC) 프로모터; 신경필라멘트 프로모터(예를 들어, GenBank HUMNFL, L04147 참조); 시냅신 프로모터(예를 들어, GenBank HUMSYNIB, M55301 참조); thy-1 프로모터(예를 들어, 문헌[Chen et al., (1987) Cell, 51:7-19; Llewellyn et al. (2010) Nat. Med., 16(10):1161-1166] 참조); 세로토닌 수용체 프로모터(예를 들어, GenBank S62283 참조); 티로신 하이드록실라제 프로모터(TH)(예를 들어, 문헌[Oh et al., (2009) Gene Ther., 16:437; Sasaoka et al., (1992) Mol. Brain Res., 16:274; Boundy et al., (1998) J. Neurosci., 18:9989; 및 Kaneda et al., (1991) Neuron, 6:583-594] 참조); GnRH 프로모터(예를 들어, 문헌[Radovick et al., (1991) Proc. Natl. Acad. Sci. USA, 88:3402-3406] 참조); L7 프로모터(예를 들어, 문헌[Oberdick et al., (1990) Science, 248:223-226] 참조); DNMT 프로모터(예를 들어, 문헌[Bartge et al., (1988) Proc. Natl. Acad. Sci. USA, 85:3648-3652] 참조); 엔케팔린 프로모터(예를 들어, 문헌[Comb et al., (1988) EMBO J., 17:3793-3805] 참조); 미엘린 염기성 단백질(MBP) 프로모터; Ca2+-칼모듈린-의존성 단백질 키나제 II-알파(CamKIM) 프로모터(예를 들어, 문헌[Mayford et al., (1996) Proc. Natl. Acad. Sci. USA, 93:13250; 및 Casanova et al., (2001) Genesis, 31:37] 참조); CMV 인핸서/혈소판-유래 성장 인자-p 프로모터(예를 들어, 문헌[Liu et al., (2004) Gene Ther., 11:52-60] 참조); 등을 포함하나, 이에 한정되지 않는다. 일부 구현예에서, 최소 인간 시냅신 1 프로모터(SYN)의 일부 또는 전부가 사용된다. Kugler et al., (2003) Gene Ther., 10(4): 337-47; Thiel et al, (1991) Proc. Natl. Acad. Sci. USA, 88(8) 3431-5; Castle et al., (2016) Methods Mol. Biol., 1382: 133-49; McLean et al., (2014) Neurosci. Lett., 576: 73-78; Kugler et al., (2003) Virology, 311(1): 89-95.
일부 구현예에서, 조직- 또는 세포-특이적 프로모터는 비뉴런 세포에서의 것과 비교하여 뉴런 세포 또는 조직에서 작동 가능하게 연결된 미니유전자 및/또는 이식유전자의 더 높은 발현을 제공하도록 구성된다 일부 구현예에서, 뉴런-특이적 프로모터는 비뉴런 세포에서의 것과 비교하여 뉴런에서 작동 가능하게 연결된 미니유전자 및/또는 이식유전자의 더 높은 발현을 제공하도록 구성된다 뉴런 세포 또는 조직의 예는 뉴런을 포함하는 것들, 뿐만 아니라 슈반 세포, 신경교세포, 성상세포 등을 포함한다. 비뉴런 세포의 예는 간세포, 심근세포, 적혈구, 상피세포 등을 포함하나, 이에 한정되지 않는다. 작동 가능하게 연결된 미니유전자 및/또는 이식유전자의 더 높은 수준의 발현은 미니유전자 및/또는 이식유전자의 전사로부터 생성된 RNA 전사체 수의 증가를 포함할 수 있다. 일부 구현예에서, 생성된 RNA 전사체의 수는 PCR에 의해 측정될 수 있다. 일부 다른 구현예에서, 생성된 RNA 전사체의 수는 RT-PCR, 예를 들어 qPCR에 의해 측정될 수 있다. 일부 구현예에서, 생성된 RNA 전사체의 수는 시퀀싱에 의해 측정될 수 있다. 일부 구현예에서, 생성된 RNA 전사체의 수는 단일분자 형광 인시튜 혼성화(FISH)에 의해 측정될 수 있다. 일부 구현예에서, 생성된 RNA 전사체의 수는 노던 블롯 분석에 의해 측정될 수 있다. 작동 가능하게 연결된 미니유전자 및/또는 이식유전자의 더 높은 수준의 발현은 대안적으로 또는 추가로, 미니유전자 및/또는 이식유전자가 관심 단백질을 암호화할 때 생성된 단백질 양의 증가를 포함할 수 있다. 일부 구현예에서, 생성된 단백질의 양은 효소-연결 면역흡착 분석(ELISA)에 의해 측정될 수 있다. 일부 구현예에서, 생성된 단백질의 양은 웨스턴 블롯 분석에 의해 측정될 수 있다. 일부 구현예에서, 생성된 단백질의 양은 면역염색에 의해 측정될 수 있다. 일부 구현예에서, 생성된 단백질의 양은 시간-분해 Forster 공명 에너지 전이(TR-FRET)에 의해 측정될 수 있다. 일부 구현예에서, 생성된 단백질의 양은 면역조직화학(IHC)에 의해 측정될 수 있다. 일부 구현예에서, 발현 수준은 이러한 방법 또는 다른 방법 중 둘 이상에 의해 측정된다.
양태 및 구현예에서, 프로모터는 서열번호 13을 포함하는 JeT 프로모터이다. 양태 및 구현예에서, 프로모터는 서열번호 86을 포함하는 인간 시냅신 프로모터이다.
PolyA 신호 서열
다양한 구현예에서, 본원에 개시된 핵산, 벡터, 및 기타 조성물은 하나 이상의 폴리아데닐화(PolyA) 신호 서열을 포함할 수 있다. 폴리아데닐화 신호 서열은 보조 서열 요소에 의해 플랭킹된 중심 서열(예를 들어 AAUAAA)을 포함할 수 있다. 이론에 구애됨이 없이, 이 서열은 전사체의 말단에 신호를 보낼 수 있고, 폴리아데닐레이트 중합효소에 의해 3' 말단에 동종중합체 A 서열이 추가되는 부위로 작용할 수 있다.
SV40 polyA, 인간 성장 호르몬(HGH) polyA, 소 성장 호르몬(BGH) polyA, 베타-글로빈 polyA, 알파-글로빈 polyA, 오브알부민 polyA, 카파-경쇄 polyA, 및 합성 polyA를 포함하나 이에 한정되지 않는, 당업계에 알려진 폴리아데닐화 신호 서열이 고려된다. PolyA 신호 서열은 본원에 개시된 핵산 및 기타 조성물에 사용될 수 있다. 일부 구현예에서, 이식유전자 또는 핵산 서열의 polyA 서열은 서열번호 22 또는 이의 기능적 단편으로 이루어진다. 일부 구현예에서, 이식유전자 또는 핵산 서열은 서열번호 22 또는 이의 기능적 단편과 적어도 약 80, 85, 90, 95, 98, 또는 99%의 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 이식유전자 또는 핵산의 polyA 서열은 서열번호 22 또는 이의 기능적 단편과 적어도 약 80, 85, 90, 95, 98, 또는 99%의 동일성을 갖는 서열로 이루어진다. 일부 구현예에서, 이식유전자 또는 핵산 서열의 polyA 서열은 서열번호 89 또는 이의 기능적 단편으로 이루어진다. 일부 구현예에서, 이식유전자 또는 핵산 서열은 서열번호 89 또는 이의 기능적 단편과 적어도 약 80, 85, 90, 95, 98, 또는 99%의 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 이식유전자 또는 핵산의 polyA 서열은 서열번호 89 또는 이의 기능적 단편과 적어도 약 80, 85, 90, 95, 98, 또는 99%의 동일성을 갖는 서열로 이루어진다.
전사후 조절 요소
다양한 구현예에서, 본원에 개시된 핵산, 이식유전자, 및 기타 조성물은 하나 이상의 전사후 조절 요소(PRE), 예를 들어 이식유전자의 발현을 향상시키거나 개선할 수 있는 것들을 포함할 수 있다. 이론에 구애됨이 없이, PRE는 mRNA의 안정화와 3' 말단 형성을 가능하게 하여 발현을 향상시킬 수 있고/있거나, 스플라이싱되지 않은 mRNA의 핵세포질 방출을 촉진시킬 수 있다. PRE는 또한 RNA-결합 단백질(RBP) 또는 마이크로RNA에 대한 결합 부위를 포함할 수 있다.
예시적인 PRE는 B형 간염 바이러스(HPRE), 박쥐 바이러스(BPRE), 들다람쥐 바이러스(GSPRE), 북극다람쥐 바이러스(ASPRE), 오리 바이러스(DPRE), 침팬지 바이러스(CPRE), 양털원숭이 바이러스(WMPRE), 또는 우드척 바이러스(WPRE)에서 유래된 PRE를 포함하나, 이에 한정되지 않는다. 일부 구현예에서, 핵산 또는 이식유전자는 PRE를 포함한다. 특정 구현예에서, PRE는 HPRE를 포함한다.
일부 구현예에서, 합성 PRE가 사용된다. 합성 PRE의 예시적인 서열은 HPRE-NOX 서열번호 88의 서열 또는 이의 단편을 포함한다. 일부 구현예에서, PRE는 프로모터 요소의 다운스트림(또는 3')에 배치될 수 있다.
예시적인 PRE는 또한 서열번호 72 또는 이의 단편을 포함하는(예를 들어 이로 이루어진) PRE를 포함하나, 이에 한정되지 않는다. 예시적인 PRE는 또한 서열번호 73 또는 이의 단편을 포함하는(예를 들어 이로 이루어진) PRE를 포함하나, 이에 한정되지 않는다.
ACAGGCCTATTGATTGGAAAGTATGTCAACGAATTGTGGGTCTTTTGGGGTTTGCTGCCCCTTTTACGCAATGTGGATATCCTGCTTTAATGCCTTTATATGCATGTATACAAGCAAAACAGGCTTTTACTTTCTCGCCAACTTACAAGGCCTTTCTAAGTAAACAGTATCTGACCCTTTACCCCGTTGCTCGGCAACGGCCTGGTCTGTGCCAAGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCTTGGCCATAGGCCATCAGCGCATGCGTGGAACCTTTGTGTCTCCTCTGCCGATCCATACTGCGGAACTCCTAGCCGCTTGTTTTGCTCGCAGCAGGTCTGGAGCGAAACTCATCGGGACTGACAATTCTGTCGTGCTCTCCCGCAAGTATACATCGTTTCCAGGGCTGCTAGGCTGTGCTGCCAACTGGATCCTGCGCGGGACGTCCTTTGTTTACGTCCCGTCGGCGCTGAATCCCGCGGACGACCCCTCCCGGGGCCGCTTGGGGCTCTACCGCCCGCTTCTCCGTCTGCCGTACCGACCGACCACGGGGCGCACCTCTCTTTACGCGGACTCCCCGTCTGTGCCTTCTCATCTGCCGGACCGTGTGCACTTCGCTTCACCTCTGCACGTCGCATGGAGACCACCGTGAACGCCCACCGGAACCTGCCCAAGGTCTTGCATAAGAGGACTCTTGGACTTTCAGCAATGTC(서열번호 72)
AACAGGCCTATTGATTGGAAAGTATGTCAACGAATTGTGGGTCTTTTGGGGTTTGCTGCCCCTTTTACGCAATGTGGATATCCTGCTTTAATGCCTTTATATGCATGTATACAAGCAAAACAGGCTTTTACTTTCTCGCCAACTTACAAGGCCTTTCTAAGTAAACAGTATCTGACCCTTTACCCCGTTGCTCGGCAACGGCCTGGTCTGTGCCAAGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCTTGGCCATAGGCCATCAGCGCATGCGTGGAACCTTTGTGTCTCCTCTGCCGATCCATACTGCGGAACTCCTAGCCGCTTGTTTTGCTCGCAGCAGGTCTGGAGCGAAACTCATCGGGACTGACAATTCTGTCGTGCTCTCCCGCAAGTATACATCGTTTCCAGGGCTGCTAGGCTGTGCTGCCAACTGGATCCTGCGCGGGACGTCCTTTGTTTACGTCCCGTCGGCGCTGAATCCCGCGGACGACCCCTCCCGGGGCCGCTTGGGGCTCTACCGCCCGCTTCTCCGTCTGCCGTACCGACCGACCACGGGGCGCACCTCTCTTTACGCGGACTCCCCGTCTGTGCCTTCTCATCTGCCGGACCGTGTGCACTTCGCTTCACCTCTGCACGTCGCATGGAGACCACCGTGAACGCCCACCGGAACCTGCCCAAGGTCTTGCATAAGAGGACTCTTGGACTTTCAGCAATGTC(서열번호 73)
예시적인 PRE는 또한 본원에 기재된 PRE, 예를 들어 서열번호 88, 서열번호 72, 또는 서열번호 73과 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 서열 동일성을 갖는 서열을 포함하거나 이로 이루어진 PRE를 포함한다.
일부 구현예에서, PRE는 이식유전자 서열 또는 단백질 암호화 서열의 다운스트림(또는 3')에 배치될 수 있다. 일부 구현예에서, PRE는 polyA 서열의 업스트림(또는 5')에 배치될 수 있다. 일부 구현예에서, PRE는 이식유전자 서열 또는 단백질 암호화 서열의 업스트림(또는 5')에 배치될 수 있다.
이식유전자
다양한 구현예에서, 본원에 개시된 미니유전자 및 기타 조절 요소는 작동 가능하게 연결된 이식유전자의 발현을 조절하는 데 사용될 수 있다. 일부 구현예에서, 이식유전자는 항체 또는 기능적 결합 단편, 수용체, 효소 등과 같은 단백질을 암호화한다. 일부 구현예에서, 이식유전자는 CRISPR 등에 사용하기 위한 shRNA, siRNA, gRNA와 같은 치료용 핵산을 암호화한다. 일부 구현예에서, 둘 이상의 이식유전자가 사용될 수 있다(예를 들어, 핵산 또는 벡터는 치료적 이점을 제공하는 둘 이상의 단백질 또는 RNA를 암호화할 수 있다). 이러한 기능적 폴리펩티드 또는 핵산의 세포 내 수준을 증가시키는 방법의 예는, 예를 들어 본원에 개시된 핵산 또는 벡터, 예를 들어 AAV 바이러스 벡터 내 관심 폴리펩티드를 암호화하는 핵산 서열의 형질감염 또는 형질도입을 포함한다.
i. 단백질
다양한 구현예에서, 본원에 개시된 미니유전자 및 다른 조절 요소를 사용하여 폴리펩티드의 발현을 조절(예를 들어, 스플라이스 조절자의 존재 또는 부재 하에 턴온 또는 턴오프)할 수 있다. 이론에 구애됨이 없이, 폴리펩티드 수준의 증가는 대상 환자의 조직에서 발현이 감소되거나 누락된 폴리펩티드를 제공함으로써 치료 효과를 제공할 수 있다. 이론에 구애됨이 없이, 예를 들어 스플라이스 조절자의 적용 또는 중지에 의해 발현의 시기 또는 위치를 제어하는 것은 원할 때만 발현을 보장함으로써 이러한 치료용 단백질의 유효성 및/또는 안전성을 개선할 수 있다. 본원에 기재된 미니유전자에 의해 조절될 수 있는 예시적인 폴리펩티드는 수퍼옥사이드 디스뮤타제, 방향족 산 탈탄산효소(AADC), 운동뉴런의 생존(SMN) 단백질, 프로그래뉼린(PRGN), Cas9 단백질, 아연 핑거 뉴클레아제 또는 TALEN, 또는 예를 들어 MeCP2, CLN2, CLN3, CLN4, CLN5, CLN6, CLN7, 및 CLN8로부터 선택되는 단백질, 또는 척추소뇌실조증(SCA)과 관련된 단백질(임의적으로, SCA1-SCA29 중 하나)과 같은 치료용 단백질을 포함하나, 이에 한정되지 않는다.
다양한 구현예에서, 본원에 개시된 미니유전자 및 기타 조절 요소는 프로그래뉼린(PGRN)의 발현을 조절하는 데 사용될 수 있다. 이론에 구애됨이 없이, 뉴런 내 기능적 PRGN 폴리펩티드 수준의 증가는, 예를 들어 FTD의 치료에서 치료 효과를 제공할 수 있다. 이론에 구애됨이 없이, PGRN은 일반적으로 어디에서나 발현되는 88 kDa 분비 당단백질로서 인간에서 관찰된다. 이는 인간 그래뉼린 유전자(GRN)에 의해 암호화된다. 프로그래뉼린 단백질을 암호화하는 예시적인 핵산은 RefSeqGene에 의해 정의되는 NG_007886.1과 NM_002087.3, 및 NCBI 참조 서열에 의해 정의되는 NC_000017.11과 NC_000017.10을 포함한다. 예시적인 프로그래뉼린 폴리펩티드 서열은 NP_002078.1을 포함한다. 일부 구현예에서, 프로그래뉼린 폴리펩티드는 링커 서열에 의해 연결된 희귀 12개 시스테닐 모티프(서열번호 102)의 고도로 보존된 직렬 반복부로 이루어진 7개의 그래뉼린 유사 도메인을 포함한다.
일부 구현예에서, PGRN의 펩티드 단편 및 이를 암호화하는 핵산은 PGRN의 하나 이상의 기능을 보유하는 한도까지 용어 PGRN에 포함된다. 그래뉼린(GRN) 또는 에피텔린을 형성하기 위한 PGRN의 절단은 상이한 기능을 갖는 단백질을 생성할 수 있고, 본원에 사용된 바와 같은 PGRN 단편의 의미를 벗어난다. 일부 구현예에서, 본원에 개시된 핵산, 벡터, 또는 기타 조성물은 인간 단백질을 암호화하는 이식유전자 서열을 포함한다. 일부 구현예에서, 이식유전자 서열은 PGRN을 암호화한다. 일부 구현예에서, 이식유전자 서열은 인간 프로그래뉼린(hPGRN) 단백질을 암호화한다. 일부 구현예에서, 이식유전자 서열은 hPGRN 단백질의 코돈-최적화 버전을 암호화한다. 일부 구현예에서, 이식유전자 서열은 서열번호 87의 서열 또는 이의 기능적 단편, 예를 들어 온전한 PGRN이 제공하는 기능 중 하나 이상의 감지 가능한 변화를 제공할 수 있는 단편을 포함한다. 일부 구현예에서, 이식유전자 서열은 서열번호 87과 적어도 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 85%, 80%, 75%, 또는 70%(또는 그 사이의 임의의 백분율)의 서열 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 이식유전자에 의해 암호화된 hPGRN은 서열번호 87의 아미노산 서열을 포함한다. 일부 구현예에서, 적어도 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 85%, 80%, 75%, 또는 70%의 서열 동일성을 갖는 서열을 포함하는 이종 핵산 서열에 의해 암호화된 hPGRN은 서열번호 81의 아미노산 서열을 포함한다.
ii. RNA
다양한 구현예에서, 본원에 개시된 단리된 핵산, 벡터, 및 기타 조성물은 단백질 번역의 필요 없이 뉴런조직-특이적 치료 효과를 제공하는 서열을 암호화하는 이식유전자 서열을 포함할 수 있다. 일부 구현예에서, 본원에 개시된 프로모터, 사일런서, 조절 요소, 및 기타 핵산 요소는 RNA의 뉴런조직 또는 뉴런-특이적 발현을 조절하는 데 사용될 수 있다. 일부 구현예에서, 이식유전자 서열은 특정 치료 기능을 제공하는 리보핵산을 암호화한다. 일부 구현예에서, 이식유전자 서열은 siRNA를 암호화한다. 일부 구현예에서, 이식유전자 서열은 shRNA를 암호화한다. 일부 구현예에서, 이식유전자 서열은 miRNA를 암호화한다. 일부 구현예에서, 이식유전자 서열은 tRNA를 암호화한다.
iii. 항체
다양한 구현예에서, 본원에 개시된 프로모터, 사일런서, 및 기타 조절 요소는 항체 또는 이의 단편의 뉴런조직 또는 뉴런-특이적 발현을 조절하는 데 사용될 수 있다. 예를 들어, 일부 구현예에서, 이식유전자 서열은 항체를 암호화한다. 일부 구현예에서, 이식유전자 서열은 항체의 단편, 예를 들어 항원-결합 능력을 보유하는 단편을 암호화한다 일부 구현예에서, 이식유전자 서열은 항체의 경쇄를 암호화한다. 일부 구현예에서, 이식유전자 서열은 항체의 중쇄를 암호화한다. 일부 구현예에서, 이식유전자 서열은 VH를 암호화한다. 일부 구현예에서, 이식유전자 서열은 VL을 암호화한다. 일부 구현예에서, 이식유전자 서열은 VH를 암호화한다. 일부 구현예에서, 이식유전자 서열은 Fab를 암호화한다. 일부 구현예에서, 이식유전자 서열은 scFv를 암호화한다. 일부 구현예에서, 이식유전자 서열은 뉴런-특이적 기능을 갖는 효소를 암호화한다.
iii. 둘 이상의 구성요소
다양한 구현예에서, 본원에 개시된 프로모터, 사일런서, 및 기타 조절 요소는 둘 이상의 이식유전자의 뉴런조직 또는 뉴런-특이적 발현을 조절하는 데 사용될 수 있다. 일부 구현예에서, 이식유전자 서열은 RNA와 폴리펩티드를 둘 다 암호화한다. 일부 구현예에서, 이식유전자 서열은 CRISPR/Cas 시스템의 구성요소를 암호화한다. 일부 구현예에서, 이식유전자 서열은 Cas9 단백질을 암호화한다. 일부 구현예에서, 이식유전자 서열은 Cpf1 단백질을 암호화한다. 일부 구현예에서, 이식유전자 서열은 CRISPR RNA(crRNA)를 암호화한다. 일부 구현예에서, 이식유전자는 전사촉진 crRNA(tracRNA)를 암호화한다.
일부 구현예에서, 본원에 개시된 핵산, 벡터, 또는 기타 조성물은 예를 들어 5'에서 3'의 순서로 존재하는 (예를 들어, 본원에 기재된 바와 같은) 미니유전자, hPGRN을 암호화하는 이식유전자 서열, PRE, 및 polyA 신호 서열을 포함한다. 일부 구현예에서, 핵산, 벡터, 또는 기타 조성물은 5'에서 3' 방향으로, 프로모터, 미니유전자, 프로테아제 절단 부위(예: 푸린 절단 부위)를 암호화하는 서열, 자가절단 펩티드(예: T2A 펩티드)를 암호화하는 서열, hPGRN을 암호화하는 이식유전자 서열, PRE, 및 polyA 신호 서열을 포함한다. 일부 구현예에서, 핵산, 벡터, 또는 기타 조성물은 5'에서 3' 방향으로, 프로모터, 서열번호 16을 포함하는 미니유전자(예: 서열번호 71 또는 서열번호 94를 포함하거나 이로 이루어진 미니유전자), 서열번호 19를 포함하거나 이로 이루어진 푸린 절단 부위를 암호화하는 서열, 서열번호 20을 포함하거나 이로 이루어진 자가절단 T2A 펩티드를 암호화하는 서열, PRGN(예: 서열번호 87)을 암호화하는 이식유전자, 서열번호 88을 포함하는 PRE 서열, 및 polyA 서열(예: 서열번호 89를 포함하거나 이로 이루어진 polyA)을 포함한다.
상기 임의의 양태 및 구현예에서, 고려되는 핵산 서열은 DNA, RNA, 또는 이의 변형된 버전일 수 있다. 변형된 핵산은 폴리뉴클레오티드 사슬의 백본에 대한 변형, 예를 들어 폴리펩티드 핵산(PNA), 모르폴리노, 잠금 핵산(LNA), 글리콜 핵산(GNA), 및 트레오스 핵산(TNA)에 의해 자연발생적 핵산과 구별될 수 있다. 변형된 핵산은 또한 4개의 핵염기에 대한 변형을 갖는 유사체를 포함할 수 있다. 일부 구현예에서, 핵산은 PNA이다. 일부 구현예에서, 핵산은 LNA이다. 일부 구현예에서, 핵산은 모르폴리노이다. 일부 구현예에서, 핵산은 단일가닥 형태이다. 일부 구현예에서, 핵산은 이중가닥 형태이다. 일부 구현예에서, 핵산은 선형이다. 일부 구현예에서, 핵산은 원형이다. 일부 구현예에서, 핵산은 플라스미드이다.
바이러스 벡터
또한, 본원에 논의된 핵산(예를 들어, 미니유전자, 이식유전자, 기타 프로모터, PRE, 및 polyA와 같은 핵산 구성요소, 및 이들의 조합)을 포함하는 벡터가 본원에 개시된다. 일부 구현예에서, 벡터는 이식유전자를 표적 세포에 전달하고/하거나 표적 세포에서 해당 이식유전자의 발현을 증가시키는 역할을 할 수 있다. 다양한 구현예에서, 벡터는 스플라이스 조절자와 조합하여 사용함으로써 단백질, 항체 또는 기능적 결합 단편, 효소 등, 및/또는 핵산, 예를 들어 CRISPR에 사용하기 위한 shRNA, siRNA, gRNA 등의 발현을 조절하는 데 사용될 수 있다.
예를 들어, 벡터는 치료용 단백질 및/또는 RNA를 암호화하는 이식유전자에 연결된 "온-스위치" 미니유전자를 포함할 수 있고, 스플라이스 조절자의 추가시 해당 이식유전자의 발현을 증가시킬 수 있다. 다른 구현예에서, 벡터는 치료용 단백질 및/또는 RNA를 암호화하는 이식유전자에 연결된 "오프-스위치" 미니유전자를 포함할 수 있고, 스플라이스 조절자의 추가시 해당 이식유전자의 발현을 감소시킬 수 있다. 일부 구현예에서, 벡터는 삽입물(예: 이식유전자 서열의 적어도 하나의 오픈 리딩 프레임) 및 하나 이상의 추가 요소를 포함하는 DNA 또는 RNA(또는 이들의 혼합물) 서열을 포함할 수 있다. 벡터는 유전 정보를 다른 세포에 전달하는 역할을 할 수 있다. 벡터는 예를 들어 클로닝 벡터 또는 플라스미드로서 클로닝에 사용될 수 있다. 벡터는 또한 발현, 예를 들어 치료용 단백질 및/또는 RNA 발현을 유도하기 위해 예를 들어 인간 뉴런세포에서의 세포 감염과 같은 다른 목적을 위해 특별히 설계될 수 있다. 일부 구현예에서, 본원에 개시된 핵산을 포함하는 벡터가 고려된다. 벡터는 DNA 벡터, 원형 벡터, 또는 플라스미드일 수 있다. 일부 구현예에서, 벡터는 이중가닥이다. 다른 구현예에서, 벡터는 단일가닥이다.
일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 벡터는 뉴런 세포 또는 조직에 이식유전자 서열(들)을 전달하는 데 사용되는 바이러스 벡터이다. 벡터에 사용되는 바이러스의 예는 레트로바이러스, 아데노바이러스, 렌티바이러스, 아데노 관련 바이러스, 및 기타 하이브리드 바이러스를 포함하나, 이에 한정되지 않는다. 일부 구현예에서, 바이러스 벡터는 아데노 관련 바이러스(AAV) 벡터, 키메라 AAV 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, DNA 바이러스 벡터, 단순 헤르페스 바이러스 벡터, 배큘로바이러스 벡터, 또는 이들의 임의의 돌연변이 또는 유도체이다.
이론에 구애됨이 없이, 본원에 개시된 바이러스 벡터는 이들이 감염시키는 숙주 세포에 게놈을 삽입하여 핵산 서열을 숙주에 전달할 수 있다. 삽입된 바이러스 게놈은 에피솜성일 수 있거나, 무작위 또는 표적화될 수 있는 부위에서 숙주 세포의 염색체 내로 통합될 수 있다. 일 구현예에서, 벡터는 세포에 이식유전자 서열을 전달하는 데 사용되는 바이러스 벡터이다. 벡터에 사용되는 바이러스의 예는 레트로바이러스, 아데노바이러스, 렌티바이러스, 아데노 관련 바이러스, 및 기타 하이브리드 바이러스를 포함하나, 이에 한정되지 않는다. 문헌[Warnock et al., (2011) Methods Mol. Biol., 737:1-25]. 렌티바이러스는 상당한 양의 바이러스 DNA를 숙주 세포에 통합할 수 있는 레트로바이러스의 한 종류로 유전자 전달의 효율적인 방법이다. 반면, 아데노바이러스는 숙주 세포의 염색체에 통합되지 않는 유전 물질을 도입하여 숙주 세포를 교란시킬 위험을 줄인다. 일부 구현예에서, 바이러스 벡터는 아데노 관련 바이러스(AAV) 벡터, 키메라 AAV 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, DNA 바이러스 벡터, 단순 헤르페스 바이러스 벡터, 배큘로바이러스 벡터, 또는 이들의 임의의 돌연변이 또는 유도체이다.
일부 구현예에서, 이식유전자를 포함하는 벡터는 아데노 관련 바이러스(AAV)이거나 이로부터 유래된다. 일부 구현예에서, 벡터는 재조합 아데노 관련 바이러스 벡터(rAAV)이다. rAAV 게놈은 폴리펩티드(hPGRN 폴리펩티드를 포함하나, 이에 한정되지 않음)를 암호화하거나, 돌연변이 단백질 또는 이들의 유전자의 제어 서열에 대한 siRNA, shRNA, 안티센스, 및/또는 miRNA를 암호화하는 이식유전자 서열 및 미니유전자를 플랭킹하는 하나 이상의 AAV ITR을 포함할 수 있다. 미니유전자 및 이식유전자 서열은 작동 가능하게 연결되며, 하나 이상의 프로테아제 절단 부위를 암호화하는 서열 또는 하나 이상의 자가절단 펩티드를 암호화하는 서열, 또는 이들의 조합에 의해 연결될 수 있다. 구현예에서, 벡터는 본원에 개시된 것과 같은 다른 전사 제어 요소, 예를 들어 표적 세포에서 이식유전자 서열의 발현을 유도하는 기능을 하는 프로모터, 인핸서, PRE, 및/또는 polyA 서열을 추가로 포함한다. 이식유전자 서열은 또한 포유동물 세포에서 발현될 때 RNA 전사체의 프로세싱을 용이하게 하기 위해 인트론 서열을 포함할 수 있다.
다양한 구현예에서, AAV 벡터, 예를 들어 rAAV 벡터는 자기상보성 AAV 벡터(scAAV)이다. 본원에서 사용되는 바와 같이, "자기상보성"은 예를 들어 하나 이상의 역위 말단 반복부(ITR)에서 분자내 이중가닥 주형을 형성하도록 설계된 암호화 영역을 의미한다. 이론에 구애됨이 없이, 일반적인 AAV 게놈은 단일가닥 DNA 주형이기 때문에 AAV 게놈에 대한 율속 단계는 대개 제2 가닥 합성을 포함한다. 문헌[Ferrari et al, (1996) J. Virology, 70(5): 3227-34; Fisher et al, (1996) J. Virology, 70(1): 520-32]. 그러나, scAAV 게놈의 경우, 감염시 제2 가닥의 세포 매개 합성을 기다리기보다 복제 및 전사 준비가 된 scAAV의 두 상보적 절반이 결합하여 하나의 이중가닥 DNA(dsDNA) 단위를 형성할 수 있다. 일부 구현예에서, 본원에 개시된 rAAV 벡터는 scAAV 벡터이며, 더 빠른/빠르거나 증가된 발현을 제공한다.
일부 구현예에서, 본원에 개시된 rAAV 벡터는 하나 이상의(예를 들어, 모든) AAV rep 및/또는 cap 유전자가 결여되어 있다. AAV 벡터는 임의의 적합한 AAV 혈청형으로부터의 핵산 서열(예: DNA)을 (예를 들어, ITR에) 포함할 수 있다. 적합한 AAV 혈청형은 AAV 혈청형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, AAV-11, AAV-12, AAVrh8, AAVrh10, AAV.Anc80, AAV.Anc80L65, AAV-DJ, AAV-DJ/8, AAVrh37, AAV-DJ, AAV-DJ/8, AAV-PHP.B, AAV-PHP.B2, AAV-PHP.B3, AAV-PHP.A, AAV-PHP.eB, 및 AAV-PHP.S를 포함하나, 이에 한정되지 않는다. 예를 들어, AAV 벡터(예: scAAV 벡터)는 AAV2로부터의 핵산 서열, 예를 들어 AAV2로부터의 ITR 서열을 포함할 수 있다. AAV 벡터(예: scAAV 벡터)는 또한 둘 이상의 혈청형으로부터의 핵산을 포함할 수 있다. AAV 혈청형의 게놈의 뉴클레오티드 서열은 당업계에 알려져 있다. 예를 들어, AAV1의 완전한 게놈은 GenBank 수탁번호 NC_002077에 제공되어 있고; AAV2의 완전한 게놈은 GenBank 수탁번호 NC 001401 및 문헌[Srivastava et al., Virol., 45: 555-564 (1983)]에 제공되어 있고: AAV3의 완전한 게놈은 GenBank 수탁번호 NC_1829에 제공되어 있고; AAV4의 완전한 게놈은 GenBank 수탁번호 NC_001829에 제공되어 있고; AAV5 게놈은 GenBank 수탁번호 AF085716에 제공되어 있고; AAV-6의 완전한 게놈은 GenBank 수탁번호 NC_00 1862에 제공되어 있고; AAV7 및 AAV8 게놈의 적어도 일부는 GenBank 수탁번호 AX753246 및 AX753249에 각각 제공되어 있고; AAV9 게놈은 문헌[Gao et al., J. Virol., 78: 6381-6388 (2004)]에 제공되어 있고; AAV10 게놈은 문헌[Williams, (2006) Mol. Ther., 13(1): 67-76]에 제공되어 있고; AAV11 게놈은 문헌[Mori et al., (2004) Virology, 330(2): 375-383]에 제공되어 있다.
일부 구현예에서, 기능적 역위 말단 반복부(ITR) 서열을 사용하여, 예를 들어 AAV 비리온의 구조, 복제, 및 패키징을 지원할 수 있다. 따라서, 본원에 개시된 AAV 벡터는 바이러스의 복제 및 패키징(예를 들어, 기능적 ITR)을 시스로 제공하는 서열을 포함할 수 있다. ITR은 야생형 뉴클레오티드 서열일 수 있지만 그럴 필요는 없으며, 서열이 기능적 구조, 복제, 및 패키징을 제공하는 한, 예를 들어 뉴클레오티드의 삽입, 결실, 또는 치환에 의해 변경될 수 있다. ITR은 재조합 바이러스가 유래될 수 있는 임의의 AAV 혈청형(AAV 혈청형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, 및 AAV-11을 포함하나, 이에 한정되지 않음)에서 유래될 수 있다. AAV 혈청형의 게놈의 뉴클레오티드 서열은 당업계에 알려져 있다. 예를 들어, AAV-1의 완전한 게놈은 GenBank 수탁번호 NC_002077에 제공되어 있고; AAV-2의 완전한 게놈은 GenBank 수탁번호 NC 001401 및 문헌[Srivastava et al., Virol., 45: 555-564 (1983)]에 제공되어 있고: AAV-3의 완전한 게놈은 GenBank 수탁번호 NC_1829에 제공되어 있고; AAV-4의 완전한 게놈은 GenBank 수탁번호 NC_001829에 제공되어 있고; AAV-5 게놈은 GenBank 수탁번호 AF085716에 제공되어 있고; AAV-6의 완전한 게놈은 GenBank 수탁번호 NC_00 1862에 제공되어 있고; AAV-7 및 AAV-8 게놈의 적어도 일부는 GenBank 수탁번호 AX753246 및 AX753249에 각각 제공되어 있고; AAV-9 게놈은 문헌[Gao et al., (2004) J. Virol., 78: 6381-6388]에 제공되어 있고; AAV-10 게놈은 문헌[Williams, (2006) Mol. Ther., 13(1): 67-76]에 제공되어 있고; AAV-11 게놈은 문헌[Mori et al., (2004) Virology, 330(2): 375-383]에 제공되어 있다. 일 구현예에서, 벡터는 AAV-2에서 유래된 ITR이 있는 AAV-9 벡터이다.
일부 구현예에서, 본원에 개시된 rAAV 벡터는 하나 이상의 ITR, 예를 들어 2개의 ITR(하나는 (예를 들어, hPGRN을 암호화하는) 이식유전자의 업스트림에 있고, 다른 하나 다운스트림에 있음) 및/또는 상기 논의된 다른 핵산 요소를 포함한다. 일부 구현예에서, 본원에(예를 들어 scAAV 벡터에) 개시된 핵산은 프로모터의 5'에 배치된 제1 ITR 및 3'에 배치된 제2 ITR, 미니유전자, 이식유전자, 전사후 조절 요소, 및/또는 polyA를 포함하고, 예를 들어 ITR은 독립적으로 다른 요소의 5' 및/또는 3'의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 50, 100, 150, 200, 250개의 뉴클레오티드이다. ITR 서열은 야생형일 수 있거나, 예를 들어 야생형 ITR의 하나 이상의 기능을 보유하는 한, 하나 이상의 돌연변이를 포함할 수 있다. 일부 구현예에서, 야생형 ITR은 말단 분해 부위의 결실을 포함하도록 변형될 수 있다. 일부 구현예에서, 본원에 개시된 바와 같은 scAAV는 2개의 ITR 서열을 포함할 수 있고, 둘 다 야생형, 변이체, 또는 변형된 AAV ITR 서열이다. 일부 구현예에서, 적어도 하나의 ITR 서열은 야생형, 변이체, 또는 변형된 AAV ITR 서열이다. 일부 구현예에서, 2개의 ITR 서열은 둘 다 야생형, 변이체, 또는 변형된 AAV ITR 서열이다. 일부 구현예에서, "좌측" 또는 5'-ITR은 자기상보성 게놈의 생성을 가능하게 하는 변형된 AAV ITR 서열이고, "우측" 또는 3'-ITR은 야생형 AAV ITR 서열이다. 일부 구현예에서, "우측" 또는 3'-ITR은 자기상보성 게놈의 생성을 가능하게 하는 변형된 AAV ITR 서열이고, "좌측" 또는 5'-ITR은 야생형 AAV ITR 서열이다. 일부 구현예에서, ITR 서열은 야생형, 변이체, 또는 변형된 AAV2 ITR 서열이다. 일부 구현예에서, 적어도 하나의 ITR 서열은 야생형, 변이체, 또는 변형된 AAV2 ITR 서열이다. 일부 구현예에서, 2개의 ITR 서열은 둘 다 야생형, 변이체, 또는 변형된 AAV2 ITR 서열이다. 일부 구현예에서, "좌측" 또는 5'-ITR은 자기상보성 게놈의 생성을 가능하게 하는 변형된 AAV2 ITR 서열이고, "우측" 또는 3'-ITR은 야생형 AAV2 ITR 서열이다. 일부 구현예에서, "우측" 또는 3'-ITR은 자기상보성 게놈의 생성을 가능하게 하는 변형된 AAV2 ITR 서열이고, "좌측" 또는 5'-ITR은 야생형 AAV2 ITR 서열이다. ITR의 하나 이상에 대해 사용될 수 있는 예시적인 서열은 본원에 기재되어 있다. 일부 구현예에서, AAV 벡터는 서열번호 12 및 서열번호 23을 포함한다. 일부 구현예에서, AAV 벡터는 서열번호 85 및 서열번호 90을 포함한다. 전체가 본원에 참조로 포함되는 WO/2019/094253(PCT/US2018/058744)에 제공된 AAV ITR의 구현예도 본원에 개시된 임의의 AAV ITR에 대해 사용될 수 있다.
다양한 구현예에서, 본원에 개시된 벡터는 본원에 개시된 hPGRN을 암호화하는 핵산 서열 및 미니유전자를 포함할 수 있다. 일부 구현예에서, 스플라이스 조절자의 추가는 표적 세포에서 기능적 PRGN 폴리펩티드의 발현을 증가시킨다. 다른 구현예에서, 스플라이스 조절자의 추가는 표적 세포에서 기능적 PRGN 폴리펩티드의 발현을 감소시킨다. 일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, hPGRN을 암호화하는 이식유전자를 포함하는 벡터는 AAV이거나 이로부터 유래된다. 일부 구현예에서, 벡터는 rAAV이다. 다양한 구현예에서, 본원에 개시된 hPGRN을 암호화하는 이식유전자를 포함하는 AAV 벡터, 예를 들어 rAAV 벡터는 scAAV이다. rAAV 게놈은 hPGRN을 암호화하는 이식유전자 서열을 플랭킹하는 하나 이상의 AAV ITR을 포함할 수 있다. 이식유전자 서열은 본원에 개시된 것과 같은 전사 제어 요소, 예를 들어 표적 세포에서 이식유전자 서열의 발현을 유도하는 기능을 하는 프로모터, 인핸서, PRE, 및/또는 polyA 서열에 작동 가능하게 연결될 수 있다.
일부 구현예에서, rAAV 벡터는 하나 이상의(예를 들어, 모든) AAV rep 및/또는 cap 유전자가 결여되어 있다. AAV 벡터는 임의의 적합한 AAV 혈청형으로부터의 핵산 서열(예: DNA)을 (예를 들어, ITR에) 포함할 수 있다. 적합한 AAV 혈청형은 AAV 혈청형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, 및 AAV-11을 포함하나, 이에 한정되지 않는다. 예를 들어, AAV 벡터(예: scAAV 벡터)는 AAV-2로부터의 핵산 서열, 예를 들어 AAV-2로부터의 ITR 서열을 포함할 수 있다. AAV 벡터(예: scAAV 벡터)는 또한 둘 이상의 혈청형으로부터의 핵산을 포함할 수 있다. GenBank 수탁번호 NC 001401 및 Srivastava et al., Virol., 45: 555-564 (1983); GenBank 수탁번호 NC_1829; GenBank 수탁번호 NC_001829; GenBank 수탁번호 AF085716; GenBank 수탁번호 NC_00 1862; GenBank 수탁번호 AX753246 및 AX753249; Gao et al., J. Virol., 78: 6381-6388 (2004); Williams, (2006) Mol. Ther., 13(1): 67-76; 및 Mori et al., (2004) Virology, 330(2): 375-383.
일부 구현예에서, 본원에 개시된 hPGRN을 암호화하는 이식유전자를 포함하는 바이러스 벡터에서 기능적 역위 말단 반복부(ITR) 서열을 사용하여, 예를 들어 AAV 비리온의 구조, 복제, 및 패키징을 지원할 수 있다. 따라서, 본원에 개시된 AAV 벡터는 바이러스의 복제 및 패키징(예를 들어, 기능적 ITR)을 시스로 제공하는 서열을 포함할 수 있다. ITR은 야생형 뉴클레오티드 서열일 필요는 아니며, 서열이 기능적 구조, 복제, 및 패키징을 제공하는 한, 예를 들어 뉴클레오티드의 삽입, 결실, 또는 치환에 의해 변경될 수 있다. ITR은 재조합 바이러스가 유래될 수 있는 임의의 AAV 혈청형(AAV 혈청형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, 및 AAV-11을 포함하나, 이에 한정되지 않음)에서 유래될 수 있다. GenBank 수탁번호 NC_002077; GenBank 수탁번호 NC 001401 및 Srivastava et al., Virol., 45: 555-564 (1983); GenBank 수탁번호 NC_1829; GenBank 수탁번호 NC_001829; GenBank 수탁번호 AF085716; GenBank 수탁번호 NC_00 1862; GenBank 수탁번호 AX753246 및 AX753249 각각; Gao et al., (2004) J. Virol., 78: 6381-6388; Williams, (2006) Mol. Ther., 13(1): 67-76; 및 Mori et al., (2004) Virology, 330(2): 375-383. 일 구현예에서, 벡터는 AAV-2에서 유래된 ITR이 있는 AAV-9 벡터이다.
일부 구현예에서, AAV 바이러스 벡터는 서열번호 91의 서열을 포함한다. 일부 구현예에서, AAV 바이러스 벡터는 서열번호 11의 서열을 포함한다. 이들 각각의 구현예에서, 이식유전자 서열은 예를 들어 본원에 기재된 바와 같이 대체 관심 분자를 암호화하는 서열로 대체될 수 있다.
일부 구현예에서, 본원에 개시된 벡터 또는 핵산 서열은 클로닝 벡터 또는 발현 벡터를 형성한다. 이러한 구현예에서, 벡터는 벡터의 복제 또는 유지를 용이하게 하는 다른 구성요소를 포함할 수 있다. 일부 구현예에서, 벡터는 클론 선별을 위한 선별 마커를 추가로 포함한다. 일부 구현예에서, 벡터 내 선별 마커는 원핵생물 또는 진핵생물 항생제 내성 유전자를 포함한다. 일부 구현예에서, 벡터 내 선별 마커는 카나마이신 내성 유전자를 포함한다. 일부 구현예에서, 벡터 내 선별 마커는 암피실린 내성 유전자를 포함한다. 일부 구현예에서, 벡터는 퓨로마이신 내성 유전자를 추가로 포함한다. 일부 구현예에서, 벡터 내 선별 마커는 하이그로마이신 내성 유전자를 포함한다. 일부 구현예에서, 벡터(예: 플라스미드)는 서열번호 92의 핵산 서열을 포함한다.
미니유전자 및 EGFP를 암호화하는 이식유전자를 포함하는 예시적인 AAV 벡터 서열:
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGAATTCGGGCGGAGTTAGGGCGGAGCCAATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTGGGCGGAGAATGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCGGTTCTTGTTTGTGGATCCCTGTGATCGTCACTTGACACCGGTCTTCCAGAGGAGATTGGAAAACTTGAAGAAGAAGTGGATTGTGCTAATATTGCCCTGAAAGCAGCCACCATGGATTGGGAGAGTTGGAAACAAAATTTGCAAATTGATATCAAGTTAGCATTTACAGATTTGGCTGAGGAGAATATCCATTATTTTGAACAGGTAATTAGTGTTGTTTGATATTGCTTCATTTTAAAGTTATTTGCTCATTTACTTTTGGTCCGTCCATTGTTGAAAGAGTGTATTAAAGAACAAGTGTCACATTCTATTGCCTCTCTGGTAGCTTGGTTTTGTTGAAGTTGTCAGTTACCATTTGGTTTTGTTTATCCTCAGTTTGTTGTTTTGGATTTGGATTCTTCAAAAGCATTTGATATTGCTTTCTATTGATTGTCCTAACTACTCCTCTTTCCTCTCCCTTCTCCATTTTTGAAGAGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGATTGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATTGTCCTTGCTATCCTGTCTTCTGTAGCTATCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGAGTAACAACATCTTTTTTTAAGTTCATTTTGTTTTTCAGTTGATTGTATTTCAATTTTTTTACAGCTGACTTTTCTCAGAGAAGTTTTTTTTTTATTGTAAACATACTTTTTCTAGAAAGTATATTTTAAAATAACATCTTTAACCTTATCTCTGGCTGAATTATTGAATATTTGAAATTATTACATTAACAAAATTTTGTCTTACAGCAGTGGTCCCCAACCTTCTTAGCAGTAGCATCCCTCATTAAGAATTAAAATTTGTAGAAATTGACAAGGATTCTGACAAGCTGTTGGGAGAGAAGAATAGAGCAGATTGCAGTAGGAACAGTTGTGTTAGAATTTATTAATCCTTTAACACTGAAAGTAAACTATTGTTGATTGCCTCTTGGTGTGTTTCCATTATTCAGTGCTCTTGCTAAGTGGGAGTCATTCCTTACATCAACCACCAACCTTCACTTGGAAGAAGCTAGCGAAGATAAACCTCGCAACCGCCGCGGCAGCGGCGAAGGCCGCGGCAGCCTGCTGACCTGCGGCGATGTGGAAGAAAACCCGGGCCCGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAATCGATCTGAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGG(서열번호 11)
표 2 및 표 3은 핵산, 벡터, 및 미니유전자의 예시적인 서열을 나타낸다.
[표 2]
[표 3]
다양한 구현예에서, 본원에 개시된 미니유전자 또는 벡터는 스플라이스 조절자의 존재 또는 부재에 대한 반응으로, 기능적 폴리펩티드의 수준, 예를 들어 hPGRN의 수준을 증가시키기 위해 사용될 수 있다. 일부 구현예에서, 본원에 개시된 벡터는 스플라이스 조절자의 부재하의 동일한 벡터의 발현과 비교하여 스플라이스 조절자의 존재하에 이식유전자 서열의 더 높은 발현을 나타낸다. 일부 구현예에서, 스플라이스 조절자의 존재하에 관심 분자의 발현 수준은 스플라이스 조절자의 부재하의 관심 분자의 발현 수준보다 더 크다(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100배 더 크다). 일부 구현예에서, 스플라이스 조절자의 부재하에 관심 분자의 발현 수준은 스플라이스 조절자의 존재하의 관심 분자의 발현 수준보다 더 크다(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100배 더 크다). 일부 구현예에서, 이식유전자 서열의 발현 증가는 이식유전자 서열의 RNA 전사체 수의 증가에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 PCR에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 RT-PCR에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 qPCR에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 qRT-PCR에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 시퀀싱에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 노던 블롯 분석에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 단일분자 형광 인시튜 혼성화(FISH)에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 생성된 이식유전자에 의해 암호화된 단백질의 양의 증가에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 효소-연결 면역흡착 분석(ELISA)에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 웨스턴 블롯 분석에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 면역염색에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 위에 나열된 방법 중 하나 이상으로 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 제2 엑손을 포함하는 mRNA의 양에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 직접적인 제1 엑손-제3 엑손 스플라이싱을 포함하는 mRNA의 양에 의해 측정된다. 온-스위치 미니유전자 또는 오프-스위치 미니유전자를 포함하는 벡터로부터 스플라이스 조절자의 존재 또는 부재 하에 생성된 예시적인 폴리펩티드가 도 3에 도시되어 있다(각각의 경우, 프로테아제 절단 부위 및/또는 자가절단 펩티드 서열의 절단 전).
재조합 바이러스
다양한 구현예에서, 본원에 논의된 핵산 및 벡터는 재조합 바이러스 입자와 같은 하나 이상의 바이러스 입자에 존재할 수 있다. 재조합 바이러스는 재조합 수단에 의해 생성된 바이러스이다. 다양한 다른 바이러스 유형, 예를 들어 레트로바이러스, 아데노바이러스, 렌티바이러스, AAV, 뮤린 백혈병 바이러스 등이 사용될 수 있다. 이론에 구애됨이 없이, 렌티바이러스와 같은 레트로바이러스로부터 전달된 벡터는 딸세포에서 이식유전자의 장기적이고 안정적인 통합 및 증식을 가능하게 하고 또한 낮은 면역원성을 제공할 수 있기 때문에 장기간 유전자 전달을 제공할 수 있다. 다른 적합한 레트로바이러스는 감마레트로바이러스를 포함한다 예시적인 감마레트로바이러스 벡터는 뮤린 백혈병 바이러스(MLV), 비장-병소 형성 바이러스(SFFV), 및 골수증식성 육종 바이러스(MPSV), 및 이들로부터 유래된 벡터를 포함한다. 다른 감마레트로바이러스 벡터는 예를 들어 문헌[Tobias Maetzig et al., "Gammaretroviral Vectors: Biology, Technology and Application" Viruses. 2011 Jun; 3(6): 677-713]에 기재되어 있다. 일부 구현예에서, 바이러스는 본원에 개시된 핵산 또는 벡터를 포함하는 재조합 아데노바이러스이다. 일부 구현예에서, 바이러스는 본원에 개시된 핵산 또는 벡터를 포함하는 재조합 AAV이다.
일부 구현예에서, 본원에 개시된 핵산 또는 벡터는 재조합 바이러스의 제조에 사용하기 위한 것이다. 일부 구현예에서, 본원에 개시된 핵산 또는 벡터는 rAAV의 제조에 사용하기 위한 것이다. 따라서, 다양한 구현예에서 바이러스 조성물(비리온이라고도 함), 예를 들어, 상기 개시된 바이러스 벡터 또는 핵산을 포함하는 rAAV 바이러스 조성물이 또한 본원에 개시된다. 일부 구현예에서, 재조합 바이러스는 아데노 관련 바이러스(AAV) 또는 이의 임의의 돌연변이 또는 유도체이다. 일부 구현예에서, 재조합 바이러스는 키메라 AAV 또는 이의 임의의 돌연변이 또는 유도체이다. 일부 구현예에서, 재조합 바이러스는 아데노바이러스 또는 이의 임의의 돌연변이 또는 유도체이다. 일부 구현예에서, 재조합 바이러스는 레트로바이러스 또는 이의 임의의 돌연변이 또는 유도체이다. 일부 구현예에서, 재조합 바이러스는 렌티바이러스 또는 이의 임의의 돌연변이 또는 유도체이다. 일부 구현예에서, 재조합 바이러스는 DNA 바이러스 또는 이의 임의의 돌연변이 또는 유도체이다. 일부 구현예에서, 재조합 바이러스는 단순 헤르페스 바이러스 또는 이의 임의의 돌연변이 또는 유도체이다. 일부 구현예에서, 재조합 바이러스는 배큘로바이러스 또는 이의 임의의 돌연변이 또는 유도체이다.
일부 구현예에서, 본원에 개시된 AAV는 하나 이상의 AAV 캡시드 단백질을 포함할 수 있다. AAV 캡시드 단백질은 재조합 바이러스가 유래될 수 있는 임의의 AAV 혈청형(AAV 혈청형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, AAV-11, AAV-12, AAVrh8, AAVfh10, AAV-DJ, AAV-DJ/8, AAV-PHP.B, AAV-PHP.B2, AAV-PHP.B3, AAV-PHP.A, AAV-PHP.eB, 및 AAV-PHP.S를 포함하나, 이에 한정되지 않음)에서 유래될 수 있다. 일부 구현예에서, AAV에 있는 하나 이상의 캡시드 단백질은 AAV-9에서 유래된다. 이론에 구애됨이 없이, 일반적으로 AAV에서, 3개의 캡시드 단백질 VP1, VP2, 및 VP3은 다량체화되어 캡시드를 형성한다. 캡시드 단백질의 폴리펩티드 서열은 당업계에 알려져 있으며, 또한 AAV의 게놈에서 유래될 수 있다. 이들은 본원에 개시된 AAV 바이러스 조성물에서 예시적인 캡시드로서 사용될 수 있다. 예를 들어, AAV-1의 완전한 게놈은 GenBank 수탁번호 NC_002077에 제공되어 있고; AAV-2의 완전한 게놈은 GenBank 수탁번호 NC 001401 및 문헌[Srivastava et al., Virol., 45: 555-564 (1983)]에 제공되어 있고: AAV-3의 완전한 게놈은 GenBank 수탁번호 NC_1829에 제공되어 있고; AAV-4의 완전한 게놈은 GenBank 수탁번호 NC_001829에 제공되어 있고; AAV-5 게놈은 GenBank 수탁번호 AF085716에 제공되어 있고; AAV-6의 완전한 게놈은 GenBank 수탁번호 NC_00 1862에 제공되어 있고; AAV-7 및 AAV-8 게놈의 적어도 일부는 GenBank 수탁번호 AX753246 및 AX753249에 각각 제공되어 있고; AAV-9 게놈은 문헌[Gao et al., J. Virol., 78: 6381-6388 (2004)]에 제공되어 있고; AAV-10 게놈은 문헌[Williams, (2006) Mol. Ther., 13(1): 67-76]에 제공되어 있고; AAV-11 게놈은 문헌[Mori et al., (2004) Virology, 330(2): 375-383]에 제공되어 있다. 캡시드 단백질 AAV-PHP.B, AAV-PHP.B2, AAV-PHP.B3, AAV-PHP.A, AAV-PHP.eB, 또는 AAV-PHP.S는 문헌[Deverman et al., (2016) Nat. Biotech., 34: 204-209 및 Chan et al., (2017) Nat. Neurosci., 20: 1172-1179]에 제공되어 있다. 일부 구현예에서, 재조합 바이러스는 하나 이상의 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV 8, AAV9, AAV10, AAV11, AAV12, AAVrh8, AAVrh10, AAV-DJ, AAV-DJ/8, AAV-PHP.B, AAV-PHP.B2, AAV-PHP.B3, AAV-PHP.A, AAV-PHP.eB, 또는 AAV-PHP.S 캡시드 혈청형, 또는 이들의 기능적 변이체를 포함하는 AAV이다. 일부 구현예에서, 재조합 바이러스는 둘 이상의 AAV 혈청형으로부터의 캡시드의 조합을 포함하는 AAV이다.
일부 구현예에서, 본원에 개시된 AAV 조성물은 ITR 내에 포함된, 바이러스 DNA 복제(rep), 캡슐화/패키징, 및 숙주 세포 염색체 통합을 지시하는 하나 이상의 시스 작용 서열을 포함한다. 일부 구현예에서, 이들 서열 중 하나 이상은, 예를 들어 숙주 세포에서 바이러스 제조 과정 중에 별개의 플라스미드에 시스가 아닌 트랜스로 존재할 수도 있다 일반적으로, 3개의 AAV 프로모터(상대 맵 위치에 대해 p5, p19, 및 p40으로 명명됨)는 야생형 바이러스에서 rep 및 cap 유전자를 암호화하는 2개의 AAV 내부 오픈 리딩 프레임의 발현을 유도한다. 일부 구현예에서, 이들 프로모터 및/또는 오픈 리딩 프레임 중 하나 이상은 본원에 개시된 AAV 벡터 및/또는 AAV 비리온에서 시스로 존재하거나, AAV 바이러스 제조 과정 중에, 예를 들어 바이러스를 생성하는 숙주 세포에서 별개의 플라스미드에 존재한다. 단일 AAV 인트론(뉴클레오티드 2107 및 2227)의 차별적 스플라이싱으로 결합된 2개의 rep 프로모터(p5 및 p19)는 rep 유전자로부터 4개의 rep 단백질(rep 78, rep 68, rep 52, 및 rep 40)을 생성할 수 있다. Rep 단백질은 궁극적으로 바이러스 게놈 복제를 담당하는 여러 효소적 특성을 가지고 있다. Cap 유전자는 일반적으로 p40 프로모터로부터 발현되며, 3가지 캡시드 단백질 VP1, VP2, 및 VP3을 암호화한다. 대체 스플라이싱 및 비공통 번역 시작 부위는 3가지 관련 캡시드 단백질의 생성을 담당한다. 단일 공통 폴리아데닐화 부위는 AAV 게놈의 맵 위치 95에 위치한다. AAV의 수명 주기와 유전학은 문헌[Muzyczka, (1992) Curr. Topics Microbiol. Imm., 158: 97-129]에 검토되어 있다.
일부 구현예에서, 본원에 개시된 AAV에 사용된 AAV 캡시드 단백질 VP1, VP2, VP3은 하기 서열에 의해 암호화되거나 이를 포함한다.
VP1 핵산(서열번호 74):
atggctgccgatggttatcttccagattggctcgaggacaaccttagtgaaggaattcgcgagtggtgggctttgaaacctggagcccctcaacccaaggcaaatcaacaacatcaagacaacgctcgaggtcttgtgcttccgggttacaaataccttggacccggcaacggactcgacaagggggagccggtcaacgcagcagacgcggcggccctcgagcacgacaaggcctacgaccagcagctcaaggccggagacaacccgtacctcaagtacaaccacgccgacgccgagttccaggagcggctcaaagaagatacgtcttttgggggcaacctcgggcgagcagtcttccaggccaaaaagaggcttcttgaacctcttggtctggttgaggaagcggctaagacggctcctggaaagaagaggcctgtagagcagtctcctcaggaaccggactcctccgcgggtattggcaaatcgggtgcacagcccgctaaaaagagactcaatttcggtcagactggcgacacagagtcagtcccagaccctcaaccaatcggagaacctcccgcagccccctcaggtgtgggatctcttacaatggcttcaggtggtggcgcaccagtggcagacaataacgaaggtgccgatggagtgggtagttcctcgggaaattggcattgcgattcccaatggctgggggacagagtcatcaccaccagcacccgaacctgggccctgcccacctacaacaatcacctctacaagcaaatctccaacagcacatctggaggatcttcaaatgacaacgcctacttcggctacagcaccccctgggggtattttgacttcaacagattccactgccacttctcaccacgtgactggcagcgactcatcaacaacaactggggattccggcctaagcgactcaacttcaagctcttcaacattcaggtcaaagaggttacggacaacaatggagtcaagaccatcgccaataaccttaccagcacggtccaggtcttcacggactcagactatcagctcccgtacgtgctcgggtcggctcacgagggctgcctcccgccgttcccagcggacgttttcatgattcctcagtacgggtatctgacgcttaatgatggaagccaggccgtgggtcgttcgtccttttactgcctggaatatttcccgtcgcaaatgctaagaacgggtaacaacttccagttcagctacgagtttgagaacgtacctttccatagcagctacgctcacagccaaagcctggaccgactaatgaatccactcatcgaccaatacttgtactatctctcaaagactattaacggttctggacagaatcaacaaacgctaaaattcagtgtggccggacccagcaacatggctgtccagggaagaaactacatacctggacccagctaccgacaacaacgtgtctcaaccactgtgactcaaaacaacaacagcgaatttgcttggcctggagcttcttcttgggctctcaatggacgtaatagcttgatgaatcctggacctgctatggccagccacaaagaaggagaggaccgtttctttcctttgtctggatctttaatttttggcaaacaaggaactggaagagacaacgtggatgcggacaaagtcatgataaccaacgaagaagaaattaaaactactaacccggtagcaacggagtcctatggacaagtggccacaaaccaccagagtgcccaagcacaggcgcagaccggctgggttcaaaaccaaggaatacttccgggtatggtttggcaggacagagatgtgtacctgcaaggacccatttgggccaaaattcctcacacggacggcaactttcacccttctccgctgatgggagggtttggaatgaagcacccgcctcctcagatcctcatcaaaaacacacctgtacctgcggatcctccaacggccttcaacaaggacaagctgaactctttcatcacccagtattctactggccaagtcagcgtggagatcgagtgggagctgcagaaggaaaacagcaagcgctggaacccggagatccagtacacttccaactattacaagtctaataatgttgaatttgctgttaatactgaaggtgtatatagtgaaccccgccccattggcaccagatacctgactcgtaatctgtaa
VP2 핵산(서열번호 75):
acggctcctggaaagaagaggcctgtagagcagtctcctcaggaaccggactcctccgcgggtattggcaaatcgggtgcacagcccgctaaaaagagactcaatttcggtcagactggcgacacagagtcagtcccagaccctcaaccaatcggagaacctcccgcagccccctcaggtgtgggatctcttacaatggcttcaggtggtggcgcaccagtggcagacaataacgaaggtgccgatggagtgggtagttcctcgggaaattggcattgcgattcccaatggctgggggacagagtcatcaccaccagcacccgaacctgggccctgcccacctacaacaatcacctctacaagcaaatctccaacagcacatctggaggatcttcaaatgacaacgcctacttcggctacagcaccccctgggggtattttgacttcaacagattccactgccacttctcaccacgtgactggcagcgactcatcaacaacaactggggattccggcctaagcgactcaacttcaagctcttcaacattcaggtcaaagaggttacggacaacaatggagtcaagaccatcgccaataaccttaccagcacggtccaggtcttcacggactcagactatcagctcccgtacgtgctcgggtcggctcacgagggctgcctcccgccgttcccagcggacgttttcatgattcctcagtacgggtatctgacgcttaatgatggaagccaggccgtgggtcgttcgtccttttactgcctggaatatttcccgtcgcaaatgctaagaacgggtaacaacttccagttcagctacgagtttgagaacgtacctttccatagcagctacgctcacagccaaagcctggaccgactaatgaatccactcatcgaccaatacttgtactatctctcaaagactattaacggttctggacagaatcaacaaacgctaaaattcagtgtggccggacccagcaacatggctgtccagggaagaaactacatacctggacccagctaccgacaacaacgtgtctcaaccactgtgactcaaaacaacaacagcgaatttgcttggcctggagcttcttcttgggctctcaatggacgtaatagcttgatgaatcctggacctgctatggccagccacaaagaaggagaggaccgtttctttcctttgtctggatctttaatttttggcaaacaaggaactggaagagacaacgtggatgcggacaaagtcatgataaccaacgaagaagaaattaaaactactaacccggtagcaacggagtcctatggacaagtggccacaaaccaccagagtgcccaagcacaggcgcagaccggctgggttcaaaaccaaggaatacttccgggtatggtttggcaggacagagatgtgtacctgcaaggacccatttgggccaaaattcctcacacggacggcaactttcacccttctccgctgatgggagggtttggaatgaagcacccgcctcctcagatcctcatcaaaaacacacctgtacctgcggatcctccaacggccttcaacaaggacaagctgaactctttcatcacccagtattctactggccaagtcagcgtggagatcgagtgggagctgcagaaggaaaacagcaagcgctggaacccggagatccagtacacttccaactattacaagtctaataatgttgaatttgctgttaatactgaaggtgtatatagtgaaccccgccccattggcaccagatacctgactcgtaatctgtaa
VP3 핵산(서열번호 76):
atggcttcaggtggtggcgcaccagtggcagacaataacgaaggtgccgatggagtgggtagttcctcgggaaattggcattgcgattcccaatggctgggggacagagtcatcaccaccagcacccgaacctgggccctgcccacctacaacaatcacctctacaagcaaatctccaacagcacatctggaggatcttcaaatgacaacgcctacttcggctacagcaccccctgggggtattttgacttcaacagattccactgccacttctcaccacgtgactggcagcgactcatcaacaacaactggggattccggcctaagcgactcaacttcaagctcttcaacattcaggtcaaagaggttacggacaacaatggagtcaagaccatcgccaataaccttaccagcacggtccaggtcttcacggactcagactatcagctcccgtacgtgctcgggtcggctcacgagggctgcctcccgccgttcccagcggacgttttcatgattcctcagtacgggtatctgacgcttaatgatggaagccaggccgtgggtcgttcgtccttttactgcctggaatatttcccgtcgcaaatgctaagaacgggtaacaacttccagttcagctacgagtttgagaacgtacctttccatagcagctacgctcacagccaaagcctggaccgactaatgaatccactcatcgaccaatacttgtactatctctcaaagactattaacggttctggacagaatcaacaaacgctaaaattcagtgtggccggacccagcaacatggctgtccagggaagaaactacatacctggacccagctaccgacaacaacgtgtctcaaccactgtgactcaaaacaacaacagcgaatttgcttggcctggagcttcttcttgggctctcaatggacgtaatagcttgatgaatcctggacctgctatggccagccacaaagaaggagaggaccgtttctttcctttgtctggatctttaatttttggcaaacaaggaactggaagagacaacgtggatgcggacaaagtcatgataaccaacgaagaagaaattaaaactactaacccggtagcaacggagtcctatggacaagtggccacaaaccaccagagtgcccaagcacaggcgcagaccggctgggttcaaaaccaaggaatacttccgggtatggtttggcaggacagagatgtgtacctgcaaggacccatttgggccaaaattcctcacacggacggcaactttcacccttctccgctgatgggagggtttggaatgaagcacccgcctcctcagatcctcatcaaaaacacacctgtacctgcggatcctccaacggccttcaacaaggacaagctgaactctttcatcacccagtattctactggccaagtcagcgtggagatcgagtgggagctgcagaaggaaaacagcaagcgctggaacccggagatccagtacacttccaactattacaagtctaataatgttgaatttgctgttaatactgaaggtgtatatagtgaaccccgccccattggcaccagatacctgactcgtaatctgtaa
VP1 단백질(서열번호 77):
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL
VP2 단백질(서열번호 78):
TAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL
VP3 단백질(서열번호 79):
MASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL
일 구현예에서, 재조합 바이러스는 AAV9 캡시드 혈청형 또는 이의 임의의 돌연변이 또는 유도체를 포함하는 AAV이다. 일부 구현예에서, 재조합 바이러스는 AAV9 캡시드 단백질 VP1, VP2, 및 VP3을 포함한다. 일부 구현예에서, 재조합 바이러스는 scAAV이다.
일부 구현예에서, 재조합 바이러스는 특정 세포 유형에서 기능적 폴리펩티드의 수준을 증가시키기 위해 사용될 수 있다. 일부 구현예에서, 본원에 개시된 바이러스는 상이한 조직 유형에서의 동일한 바이러스의 발현과 비교하여 특정 조직 유형에서 이식유전자 서열의 더 높은 발현을 나타낸다. 일부 구현예에서, 바이러스는 비뉴런 조직, 체액, 또는 세포에서의 동일한 바이러스의 발현과 비교하여 뉴런 조직, 체액, 또는 세포에서 이식유전자 서열의 더 높은 발현을 나타낸다. 일부 구현예에서, 본원에 개시된 벡터는 스플라이스 조절자의 부재하의 동일한 벡터의 발현과 비교하여 스플라이스 조절자의 존재하에 이식유전자 서열의 더 높은 발현을 나타낸다. 일부 구현예에서, 스플라이스 조절자의 존재하에 재조합 바이러스로부터의 관심 분자의 발현 수준은 스플라이스 조절자의 부재하의 재조합 바이러스로부터의 관심 분자의 발현 수준보다 더 크다(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100배 더 크다). 일부 구현예에서, 스플라이스 조절자의 부재하에 재조합 바이러스로부터의 관심 분자의 발현 수준은 스플라이스 조절자의 존재하의 재조합 바이러스로부터의 관심 분자의 발현 수준보다 더 크다(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100배 더 크다). 일부 구현예에서, 이식유전자 서열의 발현 증가는 이식유전자 서열의 RNA 전사체 수의 증가에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 PCR에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 RT-PCR에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 qPCR에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 qRT-PCR에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 시퀀싱에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 노던 블롯 분석에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 단일분자 형광 인시튜 혼성화(FISH)에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 생성된 이식유전자에 의해 암호화된 단백질의 양의 증가에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 효소-연결 면역흡착 분석(ELISA)에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 웨스턴 블롯 분석에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 면역염색에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 위에 나열된 방법 중 하나 이상으로 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 제2 엑손을 포함하는 mRNA의 양에 의해 측정된다. 일부 구현예에서, 이식유전자 서열의 발현 증가는 직접적인 제1 엑손-제3 엑손 스플라이싱을 포함하는 mRNA의 양에 의해 측정된다. 온-스위치 미니유전자 또는 오프-스위치 미니유전자를 포함하는 벡터로부터 스플라이스 조절자의 존재 또는 부재 하에 생성된 예시적인 폴리펩티드가 도 3에 도시되어 있다(각각의 경우, 프로테아제 절단 부위 및/또는 자가절단 펩티드 서열의 절단 전). 폴리펩티드가 프로테아제 절단 부위 및/또는 자가절단 펩티드 서열을 포함하면 미니유전자 또는 절단 서열에서 유래된 이종 서열 없이(또는 이종 서열의 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 미만의 아미노산을 사용해) 관심 단백질이 생성되도록 서열(들)이 절단되는 것으로 생각된다.
다양한 구현예에서, 본 발명의 표적 세포는 임의의 포유동물 세포 유형일 수 있다. 본 발명의 일부 양태에서, 핵산 및 벡터는 뉴런 조직 또는 체액 또는 세포에서의 발현을 조절한다. 일부 구현예에서, 뉴런조직은 뇌이다. 일부 구현예에서, 뉴런조직은 뇌의 전두엽이다. 일부 구현예에서, 뉴런조직은 뇌의 측두엽이다. 일부 구현예에서, 뉴런조직은 중추신경계이다. 일부 구현예에서, 뉴런조직은 척수이다. 일부 구현예에서, 뉴런세포는 인간 뉴런세포이다. 일부 구현예에서, 뉴런세포는 뉴런이다. 일부 구현예에서, 뉴런세포는 인간 성상세포이다. 일부 구현예에서, 뉴런액은 뇌척수액이다. 일부 구현예에서, 비뉴런조직은 간이다. 일부 구현예에서, 비뉴런액은 혈장이다. 일부 구현예에서, 비뉴런세포는 간세포이다. 일부 구현예에서, 비뉴런세포는 성상 지방섭취세포이다. 일부 구현예에서, 비뉴런세포는 쿠퍼 세포이다. 일부 구현예에서, 비뉴런세포는 간내피세포이다. 일부 구현예에서, 비뉴런액은 혈장이다. 일부 구현예에서, 비뉴런액은 혈청이다. 일부 구현예에서, 비뉴런액은 혈액이다.
재조합 바이러스의 제조 방법
다양한 구현예에서, 뉴런-특이적 프로모터를 포함하는 재조합 바이러스의 제조 방법이 또한 본원에 개시된다. 일부 구현예에서, AAV 또는 다른 바이러스 게놈을 암호화하는 핵산 서열, 예를 들어 플라스미드를 사용하여 재조합 바이러스를 제조한다. 일부 구현예에서, AAV rep 유전자 및/또는 AAV cap 유전자를 포함하는 핵산 서열, 예를 들어 플라스미드가 또한 AAV 또는 다른 바이러스를 제조하는 데 사용된다. 아데노바이러스 헬퍼 기능 유전자를 포함하는 핵산 서열, 예를 들어 플라스미드가 또한 본원에 개시된다. 일부 구현예에서, AAV rep, AAV cap, 및/또는 아데노바이러스 헬퍼 유전자를 암호화하는 핵산은 동일한 구조에 존재할 수 있거나(예: 단일 플라스미드), 개별 구조에 존재할 수 있다. 일부 구현예에서, AAV 벡터를 암호화하는 핵산으로 적격 세포 내로 하나 이상의 플라스미드를 공동형질감염시키고, 세포를 배양하여 재조합 바이러스를 제조한다. 일부 경우에, AAV 바이러스 게놈 및 AAV rep 및/또는 cap 유전자를 암호화하는 플라스미드는 AAV의 헬퍼 바이러스(예: 아데노바이러스, E1-결실 아데노바이러스 또는 헤르페스바이러스)로 감염될 수 있는 세포에 전달된다. 일부 구현예에서, rAAV 게놈은 형질감염 후 세포에서 AAV 캡시드 단백질과 함께 감염성 바이러스 입자로 조립된다. 패키징될 AAV 게놈, rep 및 cap 유전자, 및 헬퍼 바이러스 기능이 세포에 제공되는 rAAV 입자를 제조하는 기술은 당업계에 알려져 있으며, 예를 들어 전기천공을 포함할 수 있다. 일부 구현예에서, rAAV의 제조는 단일 세포(본원에서 패키징 세포로 표시됨) 내에 존재하는 하기 구성요소를 포함한다: rAAV 벡터, rAAV 벡터와 분리된(즉, rAAV 벡터에 없는) AAV rep 및 cap 유전자, 및 헬퍼 바이러스 기능. 유사형 rAAV의 제조는 예를 들어 WO 01/83692에 개시되어 있고, 이는 전체가 본원에 참조로 포함된다. 다양한 구현예에서, AAV 캡시드 단백질은 재조합 벡터의 전달을 향상시키기 위해 변형될 수 있다. 캡시드 단백질에 대한 변형은 일반적으로 당업계에 알려져 있다. 예를 들어, 개시내용 전체가 본원에 참조로 포함되는 US 2005/0053922 및 US 2009/0202490 참조.
다양한 구현예에서, 바이러스 벡터 제조의 일반 원리는 본원에 개시된 벡터 및 바이러스, 예를 들어 rAAV를 제조하는 데 사용될 수 있다. 문헌[Carter, (1992) Curr. Opinions Biotech., 1533-539; Muzyczka, (1992) Curr. Topics Microbial. Immunol., 158:97-129]. 다양한 접근법은 문헌[Ratschin et al., (1984) Mol. Cell. Biol., 4: 2072; Hennonat et al., (1984) Proc. Natl. Acad. Sci. USA, 81: 6466; Tratschin et al., (1985) Mol. Cell. Biol., 5: 3251; McLaughlin et al., (1988) J. Virol., 62: 1963; Lebkowski et al., (1988) Mol. Cell. Biol., 7:349; Samulski et al. (1989) J. Virol., 63:3822-3828; 미국 특허 5,173,414호; WO 95/13365 및 상응하는 미국 특허 5,658,776호; WO 95/13392; WO 96/17947; PCT/US98/18600; WO 97/09441 (PCT/US96/14423); WO 97/08298 (PCT/US96/13872); WO 97/21825 (PCT/US96/20777); WO 97/06243 (PCT/FR96/01064); WO 99/11764; Perrin et al., (1995) Vaccine, 13: 1244-1250; Paul et al., (1993) Hum. Gene Ther., 4: 609-615; Clark et al. (1996) Gene Therapy, 3: 1124-1132; 미국 특허 5,786,211호; 미국 특허 5,871,982호; 및 미국 특허 6,258,595호]에 개시되어 있다. 상기 문헌은 rAAV 제조에 관한 문헌의 해당 섹션을 특히 중점적으로 그 전체가 본원에 참조로 포함된다.
패키징 세포를 생성하는 예시적인 방법은 AAV 입자 제조에 필요한 모든 구성요소를 안정적으로 발현하는 세포주를 생성하는 것이다. 예를 들어, AAV rep 및 cap 유전자가 결여된 rAAV 벡터를 암호화하는 플라스미드(또는 다중 플라스미드), rAAV 벡터와 별개인 AAV rep 및 cap 유전자, 및 네오마이신 내성 유전자와 같은 선별 마커가 세포의 게놈에 통합된다. AAV 게놈은 GC 테일링(Samulski et al., (1982) Proc. Natl. Acad. Sci. USA, 79: 2077-2081), 제한 엔도뉴클레아제 절단 부위를 포함하는 합성 링커의 추가(Laughlin et al., (1983) Gene, 23:65-73), 또는 직접적인 평활 말단 결찰(Senapathy et al., (1984) J. Biol. Chem., 259: 4661-4666)과 같은 절차에 의해 박테리아 플라스미드에 도입되었다. 그런 다음 패키징 세포주는 아데노바이러스와 같은 헬퍼 바이러스 및/또는 헬퍼 바이러스를 암호화하는 플라스미드로 감염된다. 이 방법의 장점은 세포가 선별 가능하고 rAAV의 대규모 제조에 적합하다는 것이다. 적합한 방법의 다른 예는 플라스미드가 아닌 아데노바이러스 또는 배큘로바이러스를 사용하여 rAAV 벡터 및/또는 rep 및 cap 유전자를 패키징 세포에 도입한다.
일부 구현예에서, 재조합 바이러스의 제조 방법은 패키징될 핵산을 제공하는 단계를 포함한다. 일부 구현예에서, 핵산은 플라스미드이다. 다른 구현예에서, 핵산은 제1 AAV 말단 반복부와 제2 AAV 말단 반복부 사이에 삽입된 이식유전자 서열을 포함한다. 일부 구현예에서, 이식유전자는 인간 프로그래뉼린(hPGRN)을 암호화한다. 일부 구현예에서, 재조합 바이러스의 제조 방법은 하나 이상의 추가 핵산을 제공하는 단계를 포함한다. 일부 구현예에서, 하나 이상의 추가 핵산은 AAV rep 유전자 및/또는 AAV cap 유전자를 포함한다. 일부 구현예에서, 하나 이상의 추가 핵산은 AAV 혈청형 1, AAV 혈청형 2, AAV 혈청형 3, AAV 혈청형 4, AAV 혈청형 5, AAV 혈청형 6, AAV 혈청형 7, AAV 혈청형 8, 또는 AAV 혈청형 9에서 유래된 AAV rep 유전자를 포함한다. 일부 구현예에서, 하나 이상의 추가 핵산은 AAV 혈청형 1, AAV 혈청형 2, AAV 혈청형 3, AAV 혈청형 4, AAV 혈청형 5, AAV 혈청형 6, AAV 혈청형 7, AAV 혈청형 8, 또는 AAV 혈청형 9에서 유래된 AAV cap 유전자를 포함한다. 일부 구현예에서, 하나 이상의 추가 핵산은 하나 이상의 아데노바이러스 헬퍼 기능 유전자를 포함한다.
일부 구현예에서, 핵산을 적격 세포 또는 패키징 세포에 공동형질감염시킨다. 공동형질감염의 방법은 당업계에 알려져 있고, 리포펙타민, 전기천공, 및 폴리에틸렌이민에 의한 형질감염을 포함하나, 이에 한정되지 않는다. 적격 세포 또는 패키징 세포는 현탁액에서 배양된 비부착 세포이거나 부착 세포일 수 있다. 일 구현예에서, HeLa 세포, HEK 293 세포, 및 PerC.6 세포(동족 293 세포주)와 같은 임의의 적합한 패키징 세포주가 사용될 수 있다. 일 구현예에서, 패키징 세포는 인간 세포이다. 일 구현예에서, 패키징 세포는 HEK 293 세포이다. 일 구현예에서, 패키징 세포는 곤충 세포이다. 일 구현예에서, 패키징 세포는 Sf9 세포이다. 일부 구현예에서, 상기 방법은 형질감염된 세포를 배양하여 재조합 바이러스를 생성하는 단계를 포함한다. 일부 구현예에서, 상기 방법은 재조합 바이러스를 회수하는 단계를 포함한다. 재조합 바이러스를 회수하는 방법은 예를 들어 미국 특허 6,143,548호 및 미국 특허 9,408,904호에 개시되어 있는 것들을 포함한다. 일부 구현예에서, 재조합 바이러스는 세포 배양 배지로 분비되고 배지로부터 정제된다. 일부 구현예에서, 패키징 세포를 용해하고, 내용물을 정제하여 재조합 바이러스를 회수한다. 일부 구현예에서, 바이러스는 여과 또는 원심분리에 의해 패키징 세포로부터 회수된다. 일부 구현예에서, 바이러스는 크로마토그래피에 의해 패키징 세포로부터 회수된다.
다양한 구현예에서, 본원에 개시된 핵산을 포함하는 세포, 본원에 개시된 벡터를 포함하는 세포, 또는 본원에 개시된 바이러스를 포함하는 세포가 본원에 개시된다. 본원에 개시된 핵산을 포함하는 세포, 본원에 개시된 벡터를 포함하는 세포, 또는 본원에 개시된 바이러스를 포함하는 세포는 인간 세포일 수 있다. 본원에 개시된 핵산을 포함하는 세포, 본원에 개시된 벡터를 포함하는 세포, 또는 본원에 개시된 바이러스를 포함하는 세포는 또한 곤충 세포일 수 있다. 일부 구현예에서, 본원에 개시된 핵산을 포함하는 세포, 본원에 개시된 벡터를 포함하는 세포, 또는 본원에 개시된 바이러스를 포함하는 세포는 HEK293 세포이다. 일부 다른 구현예에서, 본원에 개시된 핵산을 포함하는 세포, 본원에 개시된 벡터를 포함하는 세포, 또는 본원에 개시된 바이러스를 포함하는 세포는 Sf9 세포이다.
일부 구현예에서, 재조합 바이러스의 제조 방법은 곤충 세포를 형질감염시키는 단계를 포함한다. 일부 구현예에서, 상기 방법은 본원에 개시된 바와 같은 핵산을 포함하는 배큘로바이러스로 곤충 세포를 형질감염시키는 단계를 포함한다. 일부 구현예에서, 상기 방법은 제1 AAV 말단 반복부와 제2 AAV 말단 반복부 사이에 삽입된 이식유전자 서열을 포함하는 핵산을 포함하는 배큘로바이러스로 곤충 세포를 형질감염시키는 단계를 포함한다. 일부 구현예에서, 상기 방법은 하나 이상의 추가 핵산을 포함하는 배큘로바이러스로 곤충 세포를 형질감염시키는 단계를 포함한다. 일부 구현예에서, 하나 이상의 추가 핵산은 AAV rep 유전자 및/또는 AAV cap 유전자를 포함한다. 일부 구현예에서, 하나 이상의 추가 핵산은 AAV 혈청형 1, AAV 혈청형 2, AAV 혈청형 3, AAV 혈청형 4, AAV 혈청형 5, AAV 혈청형 6, AAV 혈청형 7, AAV 혈청형 8, 또는 AAV 혈청형 9에서 유래된 AAV rep 유전자를 포함한다. 일부 구현예에서, 하나 이상의 추가 핵산은 AAV 혈청형 1, AAV 혈청형 2, AAV 혈청형 3, AAV 혈청형 4, AAV 혈청형 5, AAV 혈청형 6, AAV 혈청형 7, AAV 혈청형 8, 또는 AAV 혈청형 9.c에서 유래된 AAV cap 유전자를 포함한다. 일부 구현예에서, 하나 이상의 추가 핵산은 하나 이상의 아데노바이러스 헬퍼 기능 유전자를 포함한다. 일부 구현예에서, 곤충 세포는 재조합 바이러스를 제조하기에 적합한 조건에서 배양된다. 일부 구현예에서, 바이러스는 곤충 세포로부터 회수된다. 일부 구현예에서, 바이러스는 여과 또는 원심분리에 의해 곤충 세포로부터 회수된다. 일부 구현예에서, 바이러스는 크로마토그래피에 의해 곤충 세포로부터 회수된다.
제약 조성물
다양한 구현예에서, 제약 조성물이 개시된다. 일부 구현예에서, 제약 조성물은 본원에 개시된 하나 이상의 핵산, 벡터, 및/또는 바이러스를 포함한다. 일부 구현예에서, 제약 조성물은 제약상 허용되는 담체를 포함한다.
본 발명에 따른 핵산, 벡터, 및/또는 재조합 바이러스(예: 바이러스 입자)는 제약상 유용상 조성물을 제조하기 위해 제형화될 수 있다. 예시적인 제형화는 예를 들어 미국 특허 9,051,542호 및 미국 특허 6,703,237호에 개시된 것을 포함하고, 그 전체 내용은 참조로 포함된다. 본 발명의 조성물은 포유동물 대상체, 예를 들어 인간에게 투여하기 위해 제형화될 수 있다. 일부 구현예에서, 전달 시스템은 근육내, 피내, 점막, 피하, 정맥내, 척추강내, 주사 가능한 데포 유형 장치, 또는 국소 투여용으로 제형화될 수 있다.
일부 구현예에서, 전달 시스템이 용액 또는 현탁액으로 제형화되는 경우, 전달 시스템은 허용되는 담체, 예를 들어 수성 담체 내에 있다. 다양한 수성 담체, 예를 들어 물, 완충수, 0.8% 식염수, 0.3% 글리신, 히알루론산 등이 사용될 수 있다. 이러한 조성물은 멸균 및/또는 멸균 여과될 수 있다. 생성된 수용액은 그대로 사용하기 위해 패키징되거나, 동결건조될 수 있다. 일부 구현예에서, 동결건조된 제제는 투여 전에 멸균 용액과 조합된다.
일부 구현예에서, 조성물, 예를 들어 제약 조성물은 pH 조절제 및 완충제, 등장성 조절제, 습윤제 등과 같이 생리학적 조건에 근접하도록 하는 제약상 허용되는 보조 물질, 예를 들어 아세트산나트륨, 락트산나트륨, 염화나트륨, 염화칼륨, 염화칼슘, 소르비탄 모노라우레이트, 트리에탄올아민 올레에이트 등을 함유할 수 있다. 일부 구현예에서, 제약 조성물은 보존제를 포함한다. 일부 다른 구현예에서, 제약 조성물은 보존제를 포함하지 않는다.
사용 및 치료 방법
이론에 구애됨이 없이, 본원에 기재된 핵산 및 다른 구현예는 관심 분자(예: 단백질)를 조건부로 발현시키는 방법에 사용되며, 상기 방법은 본원에 기재된 핵산 분자, 본원에 기재된 벡터, 또는 본원에 기재된 재조합 바이러스를 포함하는 발현 시스템(예를 들어 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고, a) 상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고); b) 상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소된다(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적다).
구현예에서, 본원에 기재된 핵산 및 다른 구현예는 관심 단백질을 조건부로 발현시키는 방법에 사용되며, 상기 방법은 본원에 기재된 핵산 분자, 본원에 기재된 벡터, 또는 본원에 기재된 재조합 바이러스를 포함하는 발현 시스템(예를 들어 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고, a) 상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고); b) 상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소된다(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적다).
구현예에서, 유전자 요법을 필요로 하는 대상체의 치료 방법이 제공되며, 상기 방법은 본원에 기재된 핵산 분자, 본원에 기재된 벡터, 본원에 기재된 재조합 바이러스, 또는 본원에 기재된 제약 조성물을 상기 대상체에게 투여하는 단계를 포함한다. 구현예에서, 상기 방법은 대상체에게 스플라이스 조절자를 투여하는 단계를 추가로 포함한다. 구현예에서, 스플라이스 조절자는 주기적으로(예를 들어, 일정 시간 동안, 투여가 없는 시간으로 구분하여) 투여된다. 구현예에서, 상기 방법은 관심 단백질의 발현을 스플라이스 조절자의 부재하의 관심 단백질 발현 수준에 비해 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 증가 또는 감소시키는 데 효과적인 양의 스플라이스 조절자(예를 들어 LMI070)를 대상체에게 투여하는 단계를 추가로 포함한다.
이론에 구애됨이 없이, 프로그래뉼린과 같은 뉴런-특이적 단백질을 암호화하는 유전자의 돌연변이는 신경퇴행성 질환과 관련이 있을 수 있다. 일부 구현예에서, 본원에 개시된 핵산, 벡터, 및 바이러스는 신경퇴행성 질환과 관련된 손실을 가진 야생형 유전자의 뉴런-특이적 발현을 증가시키기 위해 투여될 수 있다. 예를 들어, 투여는 기능적 프로그래뉼린 폴리펩티드의 수준을 증가시키기 위해 사용될 수 있다. 스플라이스 조절자를 이용한 공동치료로 발현 수준이 제어(조절)될 수 있다. 일부 구현예에서, 본원에 개시된 핵산, 벡터, 및/또는 바이러스를 투여하는 것은 예를 들어 전두측두엽 치매와 같은 질환을 치료, 예방, 지연, 둔화시키는 역할을 할 수 있다. 일부 구현예에서, 본원에 개시된 핵산, 벡터, 및 바이러스는 이식유전자의 발현을 조절하기 위해 스플라이스 조절자와 함께 사용된다.
본원에서 사용되는 바와 같이, "전두측두엽 치매"(FTD)는 일반적으로 성격, 행동, 및 언어와 관련된 영역인 뇌의 전두엽 및 측두엽에 주로 영향을 미치는 다양한 장애 그룹에 대한 포괄적인 용어이다. FTD는 일반적으로 뇌의 전두측두엽 영역의 악화에 의해 유발된다. 전두측두엽 치매에서는, 이러한 엽의 일부가 축소된다(위축). 징후와 증상은 영향을 받는 뇌의 부분에 따라 다를 수 있다. 전두측두엽 치매의 가장 흔한 징후와 증상은 행동과 성격의 극단적인 변화를 수반한다. 이러한 변화에는 점점 부적절해지는 행동, 공감능력 및 기타 대인관계 기술의 상실, 판단력과 억제력 부족, 냉담, 반복적인 강박 행동, 개인위생의 저하, 식습관의 변화, 잦은 과식, 먹을 수 없는 물건에 대한 구강 탐색 및 소비, 및 사고 또는 행동 변화에 대한 인식 부족이 포함된다. FTD의 더 드문 하위 유형은 파킨슨병 또는 근위축성 측삭 경화증과 관련된 것과 유사한 운동 문제를 특징으로 한다. 여러 유전자 돌연변이가 FTD와 근위축성 측삭 경화증(ALS)을 둘 다 유발할 수 있다는 발견 이후, FTD와 ALS가 신경퇴행성 경로를 공유하고 공통 스펙트럼의 일부일 수 있다는 것으로 점점 더 인식되고 있다. 최근 프로그래뉼린 유전자(GRN)의 돌연변이는 돌연변이의 대부분이 기능적 hPGRN 폴리펩티드의 손실을 초래하며 FTD의 주요 원인인 것으로 확인되었다. 문헌[Babykumari et al., (2017) Brain, 140(12): 3081-3104; Baker et al., (2006) Nature, 442: 916-19; Cruts et al., (2006) Nature, 442: 920-4 ; Gaweda-Walerych et al, (2018) Neurobiol. Aging, 72:186.e9-186.e12; Galimerti et al., (2018) Expert Opin. Ther. Targets, 22(7):579-585; Wauters et al., (2018) Neurobiol. Aging, 67:84-94; 및 Mendez, (2018) Neuropsychiatr. Dis. Treat., 26:14:657-662]. PGRN에서 돌연변이를 검출하는 방법은 예를 들어 WO2008/019187에 개시된 방법을 포함한다.
다양한 구현예에서, 본원에 개시된 핵산, 벡터, 및/또는 바이러스는 프로그래뉼린을 암호화하는 유전자의 하나 이상의 돌연변이에 의해 유발된 장애를 치료하는 방법에 사용될 수 있다. 일 구현예에서, 용어 "치료"는 본원에 개시된 바와 같은 핵산, 벡터, 재조합 바이러스, 또는 제약 조성물을 포함하는 조성물의 유효 용량 또는 유효 다회 용량을 이를 필요로 하는 동물(인간을 포함)에게 투여하는 단계를 포함한다. 장애/질환이 발병하기 전에 용량을 투여하는 경우, 투여는 예방적이다. 장애/질환이 발병한 후에 용량을 투여하는 경우, 투여는 치료적이다. 구현예에서, 유효 용량은 치료되는 장애/질환 상태와 관련된 적어도 하나의 증상을 검출 가능하게 완화(제거 또는 감소)시키고/시키거나, 장애/질환 상태로의 진행을 늦추거나 예방하고/하거나, 장애/질환 상태의 진행을 늦추거나 예방하고/하거나, 질환의 정도를 감소시키고/시키거나, 질환의 (부분적 또는 전체적) 관해를 유발하고/하거나, 생존을 연장시키는 용량이다. 이 용어는 완전한 치료(즉, 치유) 및/또는 예방을 포함하지만 이를 필요로 하지는 않는다. 일부 구현예에서, 유효 용량은 밀리리터 당 1x1010 내지 1x1015개의 벡터 게놈(vg/ml)의 본원에 개시된 바이러스를 포함한다. 일부 구현예에서, 유효 용량은 밀리리터 당 1x106 내지 1x1010개의 플라크 형성 단위(pfu/ml)의 본원에 개시된 바이러스를 포함한다. 일부 구현예에서, 유효 용량은 밀리리터 당 1x106 내지 1x109개의 형질도입 단위(TU/ml)의 본원에 개시된 바이러스를 포함한다. 치료를 위해 고려되는 질환 상태의 예가 본원에 기재되어 있다.
일부 구현예에서, 프로그래뉼린을 암호화하는 유전자의 돌연변이는 결실 돌연변이이다. 일부 구현예에서, 프로그래뉼린을 암호화하는 유전자의 돌연변이는 영(null) 돌연변이이다. 일부 구현예에서, 프로그래뉼린을 암호화하는 유전자의 돌연변이는 삽입-결실(indel)이다. 일부 구현예에서, 프로그래뉼린을 암호화하는 유전자의 돌연변이는 기능소실 돌연변이이다. 일부 구현예에서, 프로그래뉼린을 암호화하는 유전자의 돌연변이는 녹아웃 돌연변이이다. 일부 구현예에서, 프로그래뉼린을 암호화하는 유전자의 돌연변이는 프로그래뉼린 단백질의 발현 및/또는 기능의 상실을 초래한다. 일부 구현예에서, 본원에 개시된 핵산, 벡터, 및/또는 바이러스를 사용한 치료가 필요한 환자는 투여 전에 프로그래뉼린 돌연변이를 스크리닝하여 확인된다. 일부 구현예에서, 스크리닝은 대상체로부터 세포 또는 조직의 샘플을 얻고 샘플에서 하나 이상의 유전자좌를 시퀀싱하거나 유전자형을 지정하여 프로그래뉼린 돌연변이의 존재를 확인하는 것을 포함한다. 일부 구현예에서, 스크리닝은 타액, 혈액, 및/또는 피부 세포(이에 한정되지 않음)와 같은 샘플의 유전 물질에 대해 수행된다.
일부 구현예에서, 치료 방법은 본원에 개시된 핵산의 치료 유효량을 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다. 일부 구현예에서, 치료 방법은 본원에 개시된 벡터의 치료 유효량을 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다. 일부 구현예에서, 치료 방법은 본원에 개시된 재조합 바이러스의 치료 유효량을 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다. 일부 구현예에서, 치료 방법은 본원에 개시된 제약 조성물의 치료 유효량을 이를 필요로 하는 대상체에게 전달하는 단계를 포함한다. 일부 구현예에서, 장애는 신경퇴행성 장애이다. 일부 구현예에서, 장애는 전두측두엽 치매이다. 일부 구현예에서, 장애는 알츠하이머병이다. 일부 구현예에서, 장애는 파키슨병이다. 일부 구현예에서, 장애는 근위축성 측삭 경화증(ALS)이다.
일부 구현예에서, 본원에 개시된 핵산, 벡터, 재조합 바이러스, 또는 제약 조성물은 프로그래뉼린을 암호화하는 유전자의 하나 이상의 돌연변이, 예를 들어 프로그래뉼린 단백질의 발현 및/또는 기능의 손실을 초래하는 돌연변이에 의해 유발된 장애를 치료하는 데 사용된다. 일부 구현예에서, 장애는 신경퇴행성 장애이다. 일부 구현예에서, 장애는 전두측두엽 치매이다. 일부 구현예에서, 장애는 알츠하이머병이다. 일부 구현예에서, 장애는 파키슨병이다. 일부 구현예에서, 장애는 근위축성 측삭 경화증(ALS)이다.
일부 구현예에서, 본원에 개시된 핵산, 벡터, 재조합 바이러스, 또는 제약 조성물은 이를 필요로 하는 대상체를 치료하기 위한 의약의 제조에 사용된다. 구현예에서, 대상체는 프로그래뉼린을 암호화하는 유전자의 하나 이상의 돌연변이, 예를 들어 프로그래뉼린 단백질의 발현 및/또는 기능의 손실을 초래하는 돌연변이에 의해 유발된 장애를 앓고 있다.
다양한 구현예에서, 본원에 개시된 핵산, 벡터, 재조합 바이러스, 또는 제약 조성물은 이를 필요로 하는 대상체에게 정맥내 투여, 직접적인 뇌 투여(예를 들어, 척수강내, 뇌내, 및/또는 뇌실내 투여), 비강내 투여, 귀내 투여, 또는 안내 경로 투여, 또는 이들의 임의의 조합에 의해 전달될 수 있다. 일부 구현예에서, 핵산, 벡터, 재조합 바이러스, 또는 제약 조성물은 척수강내 투여에 의해 전달된다. 일부 구현예에서, 핵산, 벡터, 재조합 바이러스, 또는 제약 조성물은 뇌내 또는 뇌실내 투여 경로에 의해 전달된다. 일부 구현예에서, 투여된 핵산, 벡터, 재조합 바이러스, 또는 제약 조성물은 궁극적으로, 직접 또는 별개의 조직 또는 체액(예: 혈액)에의 투여 후 전달에 의해 뇌, 척수, 말초 신경계, 및/또는 CNS에 전달된다.
이론에 구애됨이 없이, 일부 구현예에서 본원에 개시된 방법은 비기능적 폴리펩티드를 생성하는 프로그래뉼린과 같은 폴리펩티드를 암호화하는 유전자에 돌연변이를 수반하는 세포를 구제할 수 있다. 일부 구현예에서, 분자, 예를 들어 단백질 또는 리보핵산(예: siRNA)을 발현하는 방법은 본원에 개시된 핵산, 바이러스 벡터, 바이러스, 또는 제약 조성물을 세포에 전달하는 단계를 포함한다. 일부 구현예에서, 세포는 뉴런세포이다. 일부 구현예에서, 세포는 포유동물 세포이다. 일부 구현예에서, 세포는 인간 세포이다. 일부 구현예에서, 뉴런세포는 뉴런이다. 일부 구현예에서, 전달은 시험관내에서 수행된다. 일부 구현예에서, 전달은 생체외에서 수행된다. 일부 구현예에서, 전달은 전신 투여에 의한 것이다. 일부 구현예에서, 전달은 국부적이다. 일부 구현예에서, 전달은 표적 조직에 직접 적용하여 이루어진다. 일부 구현예에서, 표적 조직은 뇌이다. 일부 구현예에서, 전달은 뇌에 주입하여 이루어진다. 일부 구현예에서, 전달은 척수강내 투여에 의한 것이다. 이론에 구애됨이 없이, 본원에 개시된 방법은 PGRN 단백질에 돌연변이가 있는 인간 또는 마우스의 뇌에서 리포푸신 침착, 성상세포와 미세아교세포 활성화, 및/또는 염증을 감소시켜 이를 필요로 하는 대상체에게 잠재적인 이점을 제공할 수 있다.
다양한 구현예에서, 본원에 개시된 핵산, 벡터, 바이러스, 및 제약 조성물은 FTD와 같은 장애를 치료하는 데 사용될 수 있다. 일부 구현예에서, 본원에 개시된 핵산, 벡터, 바이러스, 및/또는 제약 조성물은 FTD와 같은 장애를 치료하기 위한 의약의 제조에 사용될 수 있다. 일부 구현예에서, 장애는 프로그래뉼린을 암호화하는 유전자의 하나 이상의 돌연변이에 의해 유발된다. 일부 구현예에서, 프로그래뉼린 유전자의 돌연변이는 프로그래뉼린 단백질 발현의 상실을 초래한다. 일부 구현예에서, 프로그래뉼린 유전자의 돌연변이는 프로그래뉼린 단백질 기능의 상실을 초래한다. 일부 구현예에서, 용도는 예를 들어 본원에 개시된 벡터, 바이러스, 및/또는 제약 조성물에 있어서 hPGRN을 암호화하는 핵산의 치료 유효량을 이를 필요로 하는 대상체에게 전달하는 것을 포함한다.
본원에 기재된 핵산 분자, 본원에 기재된 벡터, 본원에 기재된 재조합 바이러스, 본원에 기재된 세포, 또는 본원에 기재된 제약 조성물; 및 스플라이스 조절자를 포함하는 키트가 또한 본원에 제공된다.
본 발명은 하기 실시예에 의해 추가로 예시되며 이는 제한적인 것으로 해석되어서는 안 된다. 본 출원 전반에 걸쳐 인용된 모든 참고문헌, 특허, 공개된 특허 출원의 내용, 및 도면은 모든 목적을 위해 그 전체가 본원에 참조로 포함된다.
실시예
하기 실시예는 예시적인 것으로 간주되어야 하며, 상기 개시된 발명의 범위를 제한하지 않는다.
실시예 1. 인간 게놈에서 스플라이스 조절자 결합 부위의 식별
정상 인간 섬유아세포주(HD1994)를 활성(LMI070 및 스플라이스 조절자 2) 및 비활성 유사체(스플라이스 조절자 3) 또는 DMSO로 24시간 동안 처치하였다. NSC34 및 HD1994 세포주 1 둘 다에서 하기 화합물 용량을 사용하였다.
- LMI070은 (100 nM)의 농도와 (5 uM)의 고용량에서 테스트되었다.
- 스플라이스 조절자 2는 750 nM에서 테스트되었다.
- 스플라이스 조절자 3은 5 uM에서 테스트되었다.
DMSO 처치 대조군은 두 세포주 모두에 포함되었다. 그룹당 3개의 생물학적 복제가 있었다.
Qiagen RNeasy Mini 분리 키트를 사용하여 전체 RNA를 단리하였다. Illumina TruSeq RNA 샘플 준비 키트 v2를 사용하여 RNA-Seq 라이브러리를 준비하고 Illumina HiSeq2500 플랫폼을 사용하여 시퀀싱하였다.
각 샘플을 동일한 플로우 셀에 속하는 4개의 다른 레인에서 2x76 염기쌍(bp) 길이로 시퀀싱하였다. 생성된 판독의 품질은 시퀀싱 랩에서 제공한 FASTQ 파일(DM00012.txt에 대한 데이터 릴리스 파일)에서 FastQC(버전 0.10.1)를 실행하여 평가되었다. Phred 점수에서 염기당 평균 품질은 각 샘플에 대해 계산되었다. 판독 품질은 매우 우수하다(평균 Phred 점수는 모든 베이스 위치에 대해 28보다 높음). Illumina chemistry에서 예상한 대로 5' 및 3' 말단으로 감소하는 유사한 품질 경향이 관찰되었다.
TopHat(2.0.3)을 사용하여 총 8억4,700만개의 76-염기쌍(bp) 쌍을 이루는 말단 판독을 호모 사피엔스 게놈(hg19), 인간 RefSeq(Pruitt et al., 2007) 전사체(릴리스 59, 2013년 5월 3일)에 매핑하였다.
인간 게놈(hg19)에 대한 TopHat(2.0.3) 정렬을 15개의 복제 각각에 대해 개별적으로 계산하였다. 엑손 검출 능력을 증가시키기 위해, Cufflinks(2.1.1)에 의한 전사체 조립 전에 5가지 조건(DMSO, LMI070: 5 uM, LMI070: 100 nM, 스플라이스 조절자 2: 750 nM, 및 스플라이스 조절자 3: 5 uM) 각각에 대해 3개의 정렬 파일(bam 파일)을 풀링하였다. 전사체 조립 후, 전사체 gtf 파일에서 엑손 좌표를 추출하였다. 대체 염색체 및 염색체 M의 엑손은 제외되었고 가닥 정보는 무시되었다. 273866개의 추정 엑손이 생성되었다. RefSeq 엑손(릴리스 59, 2013년 5월 3일)과 교차하지 않는 엑손은 이벤트에서 주석이 없는 스플라이스의 후보로 간주된다. 그 결과 19474개의 후보가 생성된다. 추가 확신을 얻기 위해, 겹치는 엑손을 모든 RefSeq 엑손과 초기 19474개 후보를 합한 전체 세트에서 병합하여 229665개의 겹치지 않는 엑손을 생성하였다. 이 엑손 세트의 경우 각 RefSeq 유전자 내의 모든 가능한 엑손-엑손 접합을 고려하였다. R(2.15.2) 스크립트와 bedtools(2.15.0)를 사용하여 접합 데이터베이스를 생성하였다. 이어서 각 쌍의 말단 판독의 첫 번째 메이트를 데이터베이스에 대해 매핑하였다. 적어도 하나의 접합 정렬에 의해 지지되는 주석이 없는 엑손만 유지되었다. 여기에는 RefSeq 유전자에 부착되지 않은 특정 후보가 제외된다. 그 결과 10898개의 최종 후보가 남는다. bedtools를 사용하여 hg19에서 이들 후보에 대한 서열을 추출하였다. 변동성을 평가하기 위해, 각 복제에 대해 별개의 Cufflinks 어셈블리를 계산하고, 이러한 어셈블리에서 각 후보가 보이는지 확인하였다. 또한 접합 데이터베이스에 대한 정렬을 사용하여 새로운 엑손을 건너뛰는 접합의 수를 결정하였다. 이 정보는 스플라이스-인 비율을 추정하는 데 사용되었다. 추가로 TopHat 정렬(bam 파일)에 대한 bedtools를 사용하여 각 복제에 대해 10898개의 후보에 대한 판독 커버리지를 결정한 후, 5가지 조건 각각 내에서 집계하였다. 원본 fastq 파일을 STAR(020201)로 재처리하고 인간 게놈(hg38)에 대해 정렬하였다. UCSC 게놈 브라우저 도구를 사용하여 10898개의 후보 엑손을 hg38로 들어 올렸다(7개의 후보는 올릴 수 없었다). STAR에 의해 검출된 접합을 나머지 10891개의 후보에 매핑하고 접합 수의 대체 소스를 제공하였다. 검증을 위한 최종 10개 후보(표 1에 설명됨)를 다음과 같이 인간 SMA RNA Seq 데이터세트에서 발견된 주석이 없는 추정 엑손 10898개에서 선택하였다. 1) 스플라이스 조절자 3 및 DMSO에 대한 모든 샘플에 대해 STAR 집계 접합 수 및 TopHat 엑손 커버리지 = 0(누설 없음); 2) LMI070 및 스플라이스 조절자 2 STAR 집계 접합 수 및 TopHat 엑손 커버리지 >60(동적 범위); 3) 엑손 길이 <100 bp(실행가능성); 및 3' 말단 AGA/GTAAG(스플라이스 조절자 결합 부위의 존재를 확인하기 위해)
실시예 2. 미니유전자 스위치의 구성
설계 개념을 염두에 두고(도 1a 및 1b), 실시예 1에서 식별된 SNX7 유전자 서열을 사용하여 특정 미니유전자 온-스위치를 설계하였다. 도 2a는 염색체:GRCh37:1:99204216:99204359:1의 스플라이스 조절자(LMI070) 엑손 표적 결합 부위(AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGAATGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATGTCCTTGCTATCCCTGTCTTCTGTAGCTATTCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 80)), 뿐만 아니라 염색체:GRCh37:1:99203793:99203946:1의 엑손 8의 인트론 서열 다운스트림(CTTCCAGAGGAGATTGGAAAACTTGAAGATAAAGTGGAATGTGCTAATAATGCCCTGAAAGCAGATTGGGAGAGATGGAAACAAAATATGCAAAATGATATCAAGTTAGCATTTACAGATATGGCTGAGGAGAATATCCATTATTATGAACAG(서열번호 99)), 및 염색체:GRCh37:1:99225610:99225687:1의 엑손 9의 21,251개 뉴클레오티드의 업스트림(TGCCTTGCTACGTGGGAGTCATTCCTTACATCACAGACCAACCTTCACTTGGAAGAAGCCTCTGAAGATAAACCTTAA(서열번호 100))을 포함하는, 실시예 1에서 식별된 SNX7 유전자좌의 개략도를 나타낸다. 이들 서열을 사용하여, 엑손 8(엑손 A라고 함), 스플라이스 조절자 결합 부위를 포함하는 식별된 크립틱 엑손과 엑손 8 사이에 위치한 270 뉴클레오티드 인트론(AB), 3' 말단에 스플라이스 조절자(예: LMI070) 결합 부위를 포함하는 엑손(엑손 B라고 함), 크립틱 엑손과 엑손 9 사이의 407 뉴클레오티드 인트론 단편(21,251 nt로부터 단축; BC), 및 엑손 9(엑손 C라고 함)를 이용한 비자연발생적 SNX7 미니유전자를 구성하였다(버전 1)(도 2). 성능을 향상시키기 위해 다음과 같이 미니유전자를 추가로 수정하였다: 1) Kozak 공통서열 및 ATG 코돈(GCCACCATG)을 엑손 A의 65번 위치에 삽입하였다; 2) 미니유전자의 다른 모든 ATG 서열을 TTG로 대체하였다; 3) 엑손 A의 20번 위치에 있는 TA를 AG로 대체하여 GAAGAAGAA 서열(서열번호 69)을 생성하였다; 4) 엑손 B에서 1 nt를 제거하여 ORF에 프레임 이동(뉴클레오티드의 수 = 3n-1)을 생성하였다; 5) 엑손 C의 4번 위치에 T를 삽입하여 ORF에 프레임 이동을 생성함으로써 다수의 정지코돈을 생성하였다; 6) 엑손 C의 9번 위치에 있는 TAC를 TAA로 변경하여 조기 종결코돈을 생성하였다; 7) 엑손 C의 34번 위치에 있는 CAG를 ACC로 변경하여 잠재적 크립틱 스플라이스 부위를 돌연변이시켰다; 8) 엑손 C의 60번 위치에 있는 CTCT를 TAGC로 변경하여 Nhe I 제한 부위를 생성하였다; 9) 엑손 C 말단의 TAA를 제거하여 연속 ORF를 생성하였다. 이어서, 이 서열을 분자 클로닝 기술을 사용하여 scAAV 벡터에 삽입하였다. trs의 결실이 있는 AAV2 ITR, JeT 프로모터, SNX7 미니유전자(도 2b 참조), 엑손 C의 말단에 추가된 푸린 절단 부위(RNRR(서열번호S 39))에 대한 암호화 서열, T2A 펩티드에 대한 암호화 서열, 이식유전자 서열(여기서는, 첫 번째 ATG가 없는 EGFP에 대한 암호화 서열), SV40 후기 폴리아데닐화 신호, AAV2 ITR을 순서대로 조합하여 scAAV를 생성하였다(도 2c 참조). 도 3은 스플라이스 조절자의 존재 또는 부재 하의 scAAV의 예측된 mRNA 산물을 나타낸다.
실시예 3. HEK293 세포에서 온-스위치의 시험관내 성능
HEK293 세포를 완전한 DMEM 배지에서 유지하고, 형질감염 전 웰 밀도당 100,000개 세포로 24웰 플레이트에 시딩하였다. 제조사의 프로토콜에 따라 Lipofectamine2000(Invitrogen)을 사용하여 2 ug의 pJSNX-GFP 플라스미드 DNA로 각 웰을 형질감염시켰다. 형질감염 배지를 4시간 후 완전한 DMEM으로 교체하였다. DMSO 중 LMI070의 초기 1 mM 스톡을 DMEM에서 1/1,000 내지 1/500,000으로 희석하여, 24시간 후 세포에 첨가했을 때 2 nm 내지 1 uM의 농도를 달성했다. 대조군 세포는 0.1% DMSO를 받았다. 형광 현미경을 사용하여 형질감염 48시간 후에 GFP 발현을 평가하였다. 대조군 DMSO-처치 세포에서는 GFP 발현이 관찰되지 않았다(도 4a). GFP 발현의 정량 분석을 위해, 세포를 트립신 처리하고 SONY SH-800 유세포 분석기를 사용하여 FACS로 분석하였다. GFP 발현의 상대적 측정을 위해 평균 형광 강도를 사용하였다. 대조군 DMSO-처치 세포는 검출 가능한 GFP 발현을 나타내지 않은 반면, LMI070-처치 샘플에서 GFP 발현의 용량 의존적 증가가 관찰되었다(도 4b). RNA 스플라이싱 분석을 위해, 제조사의 프로토콜에 따라 Trizol(Invitrogen)을 사용하여 세포에서 전체 RNA를 추출하였다. qRT-PCR(Invitrogen)용 Superscript III 1st strand supermix를 사용하여 cDNA를 합성하였다. 엑손 C에 특이적인 프라이머, GCGGTTGCGAGGTTTATCT(서열번호 104) 및 CTCTTGCTAAGTGGGAGTCATT(서열번호 105)에 의해 증폭된 전체 이식유전자 mRNA와 비교하여 CAACAAAGGAGCACACCATTC(서열번호 103) 및 GCGGTTGCGAGGTTTATCT(서열번호 104) 프라이머 쌍에 의해 증폭된 엑손B-엑손C의 양을 측정함으로써 qPCR을 사용하여 엑손 B의 포함을 평가하였다. 125 nM의 LMI070으로 처치된 세포에서 엑손 B의 포함은 DMSO-처치 세포와 비교하여 75배 상향조절된 것으로 확인되었다(도 4c). 항시적으로 스플라이싱된 RNA(즉, 엑손A-엑손C)의 양을 GTGCTAATAATGCCCTGAAAGC(서열번호 106) 및 CCACTTAGCAAGAGCACTGT(서열번호 107) 프라이머 쌍을 사용하여 측정하였다. 1 uM의 LMI070으로 처치된 세포는 대조군 DMSO-처치 세포와 비교하여 60배 더 낮은 엑손A-엑손C 스플라이싱을 나타냈다.
실시예 4. 박쥐 피질뉴런에서의 SNX7 스위치에 의한 GFP 발현의 조절
파파인으로 분해된 래트 배아 피질을 해부하여 1차 래트 뉴런을 제조하고, 7일 동안 150,000개 세포/웰의 밀도로 24웰 폴리-D-라이신 플레이트(Corning)의 완전한 Neurobasal 배지에서 배양하였다. 배지의 절반을 형질감염 하루 전에 새로운 배지로 교체하였다. DNA-리포솜 칵테일을 추가하기 전에 세포를 optiMEM으로 3회 세척한 것을 제외하고, 제조사의 프로토콜에 따라 Lipofectamine2000(Invitrogen)을 사용하여 2 ug의 pJSNX-GFP 플라스미드 DNA로 각 웰을 형질감염시켰다. 4시간 후 형질감염 배지를 50%의 신선한 완전한 Neurobasal 배지를 함유하는 컨디셔닝된 배지로 교체하였다. 다음 날, DMSO 중 LMI070의 1 mM 스톡을 DMEM에서 1/1,000 내지 1/500,000으로 희석하여, 세포에 첨가했을 때 2 nm 내지 1 uM의 농도를 달성했다. 대조군 세포는 0.1% DMSO를 받았다. 형광 현미경을 사용하여 형질감염 6일 후에 GFP 발현을 평가하였다. 대조군 DMSO-처치 세포에서는 GFP 발현이 관찰되지 않았다(도 4a). RNA 스플라이싱 분석을 위해, 제조사의 프로토콜에 따라 Trizol(Invitrogen)을 사용하여 세포에서 전체 RNA를 추출하였다. qRT-PCR(Invitrogen)용 Superscript III 1st strand supermix를 사용하여 cDNA를 합성하였다. 엑손 C에 특이적인 프라이머, GCGGTTGCGAGGTTTATCT(서열번호 104) 및 CTCTTGCTAAGTGGGAGTCATT(서열번호 105)에 의해 증폭된 전체 이식유전자 mRNA와 비교하여 CAACAAAGGAGCACACCATTC(서열번호 103) 및 GCGGTTGCGAGGTTTATCT(서열번호 104) 프라이머 쌍에 의해 증폭된 엑손B-엑손C의 양을 측정함으로써 qPCR을 사용하여 엑손 B의 포함을 평가하였다. 31 nM의 LMI070으로 처치된 세포에서 엑손 B의 포함은 DMSO-처치 세포와 비교하여 100배 넘게 상향조절된 것으로 확인되었다(도 4b). 항시적으로 스플라이싱된 RNA(즉, 엑손A-엑손C)의 양을 GTGCTAATAATGCCCTGAAAGC(서열번호 106) 및 CCACTTAGCAAGAGCACTGT(서열번호 107) 프라이머 쌍을 사용하여 측정하였다. 500 nM의 LMI070으로 처치된 세포는 대조군 DMSO-처치 세포와 비교하여 30배 더 낮은 엑손A-엑손C 스플라이싱을 나타냈다.
실시예 5. SNX7 스위치에 의한 래트의 피질뉴런에서 인간 프로그래뉼린의 조절 가능한 발현
파파인으로 분해된 래트 배아 피질을 해부하여 1차 래트 뉴런을 제조하고, 7일 동안 150,000개 세포/웰의 밀도로 24웰 폴리-D-라이신 플레이트(Corning)의 완전한 Neurobasal 배지에서 배양하였다. 배지의 절반을 형질감염 하루 전에 새로운 배지로 교체하였다. DNA-리포솜 칵테일을 추가하기 전에 세포를 optiMEM으로 3회 세척한 것을 제외하고, 제조사의 프로토콜에 따라 Lipofectamine2000(Invitrogen)을 사용하여, 2 ug의 pSyn-snx7-PGRN(도 6a) 또는 snx7 미니유전자를 포함하지 않는 대조군 pSyn-PGRN 플라스미드로 각 웰을 형질감염시켰다. 4시간 후 형질감염 배지를 50%의 신선한 완전한 Neurobasal 배지를 함유하는 컨디셔닝된 배지로 교체하였다. 다음 날, DMSO 중 LMI070의 1 mM 스톡을 DMEM에서 1/10,000으로 희석하여, 세포에 첨가했을 때 100 nm의 농도를 달성했다. 대조군 세포는 0.1% DMSO를 받았다. TR-FRET 분석을 사용하여 형질감염 6일 후에 hPGRN 발현을 측정하였다. pSyn-snx7-PGRN 형질감염된 세포에서, hPGRN의 발현은 DMSO-처치 대조군과 비교하여 LMI070에 의해 30배 넘게 유도되었다(도 6b). RNA 스플라이싱 분석을 위해, 제조사의 프로토콜에 따라 Trizol(Invitrogen)을 사용하여 세포에서 전체 RNA를 추출하였다. qRT-PCR(Invitrogen)용 Superscript III 1st strand supermix를 사용하여 cDNA를 합성하였다. 엑손 C에 특이적인 프라이머, GCGGTTGCGAGGTTTATCT(서열번호 104) 및 CTCTTGCTAAGTGGGAGTCATT(서열번호 105)에 의해 증폭된 전체 이식유전자 mRNA와 비교하여 CAACAAAGGAGCACACCATTC(서열번호 103) 및 GCGGTTGCGAGGTTTATCT(서열번호 104) 프라이머 쌍에 의해 증폭된 엑손B-엑손C 접합의 양을 측정함으로써 qPCR을 사용하여 엑손 B의 포함을 평가하였다. LMI070-처치 세포에서 엑손 B의 포함은 pSyn-snx7-PGRN 형질감염된 세포의 경우 DMSO-처치 세포와 비교하여 150배 넘게 상향조절된 것으로 확인되었다(도 6c). 항시적으로 스플라이싱된 RNA(즉, 엑손A-엑손C)의 양을 GTGCTAATAATGCCCTGAAAGC(서열번호 106) 및 CCACTTAGCAAGAGCACTGT(서열번호 107) 프라이머 쌍을 사용하여 측정하였다. LMI070-처치 세포는 DMSO-처치 세포와 비교하여 pSyn-snx7-PGRN 형질감염된 세포에서 10배 더 낮은 엑손A-엑손C 스플라이싱을 나타냈다.
실시예 6. LMI070의 부재하에 크기를 줄이고 펩티드 발현을 제거하기 위한 미니유전자의 변형
LMI070의 부재하에 전체 크기를 줄이고 펩티드 발현을 제거하도록 SNX7 미니유전자를 추가로 변형하였다. 특히, 엑손 A는 109 nt에서 53 nt로 짧아진 반면, 3' 스플라이스 부위에 인접한 영역은 유지되었고, 생성된 엑손 A는 서열번호 96의 서열을 갖는다. 제1 인트론은 150 nt에서 120 nt로 짧아진 반면 스플라이스 부위와 분기점은 보존되었다. 생성된 제1 인트론은 서열번호 97의 서열을 갖는다. 제1 버전의 SNX7 미니유전자의 엑손 A에서 시작코돈을 포함하는 영역을 삭제하고, 새로운 버전의 SNX7 미니유전자의 엑손 B에서 TC를 GG로 변경하여 시작코돈을 구성하였다. 생성된 엑손 B는 서열번호 98의 서열을 갖는다. 시작코돈을 엑손 B로 전환함으로써, 단백질 발현은 LMI070의 존재하에서만 일어난다. 제2 인트론은 이 서열에 필수 cis 요소가 포함되어 있는 것으로 확인되었기 때문에 동일하게 유지하였다. 변형된 SNX 미니유전자(버전 2)의 서열은 서열번호 94에 제시되어 있다. 도 9는 이전 버전의 SNX7 미니유전자(버전 1)와 비교하여 새로운 버전(버전 2)의 미니유전자의 개략도를 나타낸다.
변형된 SNX7 미니유전자(버전 2)를 분자 클로닝 기술을 사용하여 scAAV 벡터에 삽입하였다. 변형된 SNX7 미니유전자(버전 2)를 포함하는 벡터의 서열은 서열번호 95에 제시되어 있다. HEK293 세포를 완전한 DMEM 배지에서 유지하고, 형질감염 전 웰 밀도당 100,000개 세포로 24웰 플레이트에 시딩하였다. 제조사의 프로토콜에 따라 Lipofectamine2000(Invitrogen)을 사용하여 SNX7 스위치 버전 1을 포함하는 플라스미드 DNA DL180 또는 SNX7 버전 2를 포함하는 플라스미드 DL182 2 ug로 각 웰을 형질감염시켰다. 형질감염 배지를 4시간 후 완전한 DMEM으로 교체하였다. DMSO 중 LMI070의 초기 1 mM 스톡을 DMEM에서 1/1,000 내지 1/500,000으로 희석하여, 24시간 후 세포에 첨가했을 때 100 nm 내지 1 uM의 농도를 달성했다. 대조군 세포는 0.1% DMSO를 받았다. 형광 현미경을 사용하여 형질감염 48시간 후에 GFP 발현을 평가하였다. 도 10은 변형된 SNX7 미니유전자(버전 2)가 이전 버전보다 더 민감함을 보여준다.
실시예 7. LMI070의 경구 투여는 시간 의존적 방식으로 마우스 뇌에서 이식유전자 발현을 활성화한다
SNX7 스위치(버전 1)가 있는 시냅신 프로모터의 제어하에 hPGRN을 암호화하는 ssAAV9 바이러스 벡터를 HEK293 세포에서 생성하고 요오딕사놀로 정제하였다. 2 uL 중 2e10 vg의 AAV 벡터를 P0에서 C57Bl/6 신생 마우스에 ICV 주사하였다. 4주령에, 30 mg/kg의 LMI070 또는 비히클 대조군을 위관영양법을 통해 경구 투여하였다. 그룹당 4~6마리의 마우스를 지정된 시점에서 제거하였다(도 7a). PBS로 경심관류한 후 좌반구의 후방 절반을 Precellys 튜브에서 균질화하였다. AAV 벡터로부터 발현된 인간 PGRN의 측정을 위해 TR-FRET 분석을 사용하였다. 결과는 LMI070 투여 24시간 후 뇌에서 hPGRN 발현의 빠르고 일시적인 유도를 나타낸다. 이식유전자 단백질 발현은 LMI070 투여 4일 후에 처치되지 않은 수준으로 되돌아갔다(도 7b).
실시예 8. LMI070은 용량 의존적 방식으로 생체내 이식유전자 발현을 활성화한다
SNX7 스위치(버전 1)가 있는 시냅신 프로모터의 제어하에 hPGRN을 암호화하는 ssAAV9 바이러스 벡터를 HEK293 세포에서 생성하고 요오딕사놀로 정제하였다. 2 uL 중 2e10 vg의 AAV 벡터를 P0에서 FVB 신생 마우스에 ICV 주사하였다. 4주령에, 3, 10, 또는 30 mg/kg의 LMI070 또는 비히클 대조군을 위관영양법을 통해 경구 투여하였다. 그룹당 6~7마리의 마우스를 지정된 시점에서 제거하였다(도 8a). PBS로 경심관류한 후 좌반구의 후방 절반을 Precellys 튜브에서 균질화하였다. AAV 벡터로부터 발현된 인간 PGRN의 측정을 위해 TR-FRET 분석을 사용하였다. 인간 피질의 샘플을 생리학적 PGRN 수준(약 200 pg/mg)에 대한 대조군으로 사용하였다. 결과는 뇌에서 이식유전자 hPGRN의 빠른(LMI070 투여 12시간 후) 축적을 나타내며, 이는 24시간 시점에 감소하기 시작한다. 이식유전자 발현은 LMI070 투여에 대한 용량 반응을 나타냈다.
SEQUENCE LISTING <110> NOVARTIS AG <120> REGULATABLE EXPRESSION SYSTEMS <130> PAT058643-WO-PCT <140> <141> <150> 63/013,283 <151> 2020-04-21 <150> 62/878,514 <151> 2019-07-25 <160> 113 <170> PatentIn version 3.5 <210> 1 <211> 73 <212> DNA <213> Homo sapiens <400> 1 ccttgctatc cctgtcttct gtagctattc tgaaaccatc aacaaaggag cacaccattc 60 catcagcaaa aga 73 <210> 2 <211> 72 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Exonic target sequence of LMI070" <400> 2 gtaattagct gagaaggaag atctgaaggt ttaacgagag agggcgagag atacaaaata 60 tctgctagga ga 72 <210> 3 <211> 64 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Exonic target sequence of LMI070" <400> 3 ggattgtttg tattcctgcc aatgatttgt gagacagtct gttccccaca tcctcgtcaa 60 caga 64 <210> 4 <211> 78 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Exonic target sequence of LMI070" <400> 4 ctttctgaca tcttaacgag gcaatacaga gagacgaatt ttcatcagtt tgttcaggga 60 gacacatata acaaaaga 78 <210> 5 <211> 51 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Exonic target sequence of LMI070" <400> 5 atccatacat acttaatgct gaaatgtgaa gggctgagaa aaaagaaaag a 51 <210> 6 <211> 97 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Exonic target sequence of LMI070" <400> 6 aattggaaac atcgagggaa aatgggcttt ttattattaa aacaaaacct cagtattatc 60 acttagaaac ctgaaattga actccaaaag ccaaaga 97 <210> 7 <211> 95 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Exonic target sequence of LMI070" <400> 7 aagaatgttc cttttgtgaa gaatgactta aggaagattc atgatgactg agtgtgcccg 60 tgtggaactt taggacatag atgcactcct acaga 95 <210> 8 <211> 70 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Exonic target sequence of LMI070" <400> 8 ttgtccttca ctccgtactc cagttggcca agcataggtc gcatgccagg gtcaaggaga 60 ctaagggaga 70 <210> 9 <211> 41 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Exonic target sequence of LMI070" <400> 9 gacatacaga catggcagcc cctagcatgt gtatcctaag a 41 <210> 10 <211> 40 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Exonic target sequence of LMI070" <400> 10 acatacagac atggcagccc ctagcatgtg tatcctaaga 40 <210> 11 <211> 2438 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 11 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cgggcggagt 120 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 180 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 240 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttgaca 300 ccggtcttcc agaggagatt ggaaaacttg aagaagaagt ggattgtgct aatattgccc 360 tgaaagcagc caccatggat tgggagagtt ggaaacaaaa tttgcaaatt gatatcaagt 420 tagcatttac agatttggct gaggagaata tccattattt tgaacaggta attagtgttg 480 tttgatattg cttcatttta aagttatttg ctcatttact tttggtccgt ccattgttga 540 aagagtgtat taaagaacaa gtgtcacatt ctattgcctc tctggtagct tggttttgtt 600 gaagttgtca gttaccattt ggttttgttt atcctcagtt tgttgttttg gatttggatt 660 cttcaaaagc atttgatatt gctttctatt gattgtccta actactcctc tttcctctcc 720 cttctccatt tttgaagagt ttgcaaagga aggaaaggag cagagacttg attgagcaga 780 aaatcatttc agggcctgtt ctctattgtc cttgctatcc tgtcttctgt agctatctga 840 aaccatcaac aaaggagcac accattccat cagcaaaaga gtaacaacat ctttttttaa 900 gttcattttg tttttcagtt gattgtattt caattttttt acagctgact tttctcagag 960 aagttttttt tttattgtaa acatactttt tctagaaagt atattttaaa ataacatctt 1020 taaccttatc tctggctgaa ttattgaata tttgaaatta ttacattaac aaaattttgt 1080 cttacagcag tggtccccaa ccttcttagc agtagcatcc ctcattaaga attaaaattt 1140 gtagaaattg acaaggattc tgacaagctg ttgggagaga agaatagagc agattgcagt 1200 aggaacagtt gtgttagaat ttattaatcc tttaacactg aaagtaaact attgttgatt 1260 gcctcttggt gtgtttccat tattcagtgc tcttgctaag tgggagtcat tccttacatc 1320 aaccaccaac cttcacttgg aagaagctag cgaagataaa cctcgcaacc gccgcggcag 1380 cggcgaaggc cgcggcagcc tgctgacctg cggcgatgtg gaagaaaacc cgggcccggt 1440 gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 1500 cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 1560 gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 1620 gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 1680 cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 1740 ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 1800 ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 1860 ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 1920 caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 1980 ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2040 gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2100 ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaatgctt 2160 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2220 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2280 tttttaaaat cgatctgagg aacccctagt gatggagttg gccactccct ctctgcgcgc 2340 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 2400 ggcctcagtg agcgagcgag cgcgcagaga gggagtgg 2438 <210> 12 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 12 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtgg 106 <210> 13 <211> 194 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 13 aattcgggcg gagttagggc ggagccaatc agcgtgcgcc gttccgaaag ttgcctttta 60 tggctgggcg gagaatgggc ggtgaacgcc gatgattata taaggacgcg ccgggtgtgg 120 cacagctagt tccgtcgcag ccgggatttg ggtcgcggtt cttgtttgtg gatccctgtg 180 atcgtcactt gaca 194 <210> 14 <211> 162 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 14 cttccagagg agattggaaa acttgaagaa gaagtggatt gtgctaatat tgccctgaaa 60 gcagccacca tggattggga gagttggaaa caaaatttgc aaattgatat caagttagca 120 tttacagatt tggctgagga gaatatccat tattttgaac ag 162 <210> 15 <211> 270 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 15 gtaattagtg ttgtttgata ttgcttcatt ttaaagttat ttgctcattt acttttggtc 60 cgtccattgt tgaaagagtg tattaaagaa caagtgtcac attctattgc ctctctggta 120 gcttggtttt gttgaagttg tcagttacca tttggttttg tttatcctca gtttgttgtt 180 ttggatttgg attcttcaaa agcatttgat attgctttct attgattgtc ctaactactc 240 ctctttcctc tcccttctcc atttttgaag 270 <210> 16 <211> 143 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 16 agtttgcaaa ggaaggaaag gagcagagac ttgattgagc agaaaatcat ttcagggcct 60 gttctctatt gtccttgcta tcctgtcttc tgtagctatc tgaaaccatc aacaaaggag 120 cacaccattc catcagcaaa aga 143 <210> 17 <211> 407 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 17 gtaacaacat ctttttttaa gttcattttg tttttcagtt gattgtattt caattttttt 60 acagctgact tttctcagag aagttttttt tttattgtaa acatactttt tctagaaagt 120 atattttaaa ataacatctt taaccttatc tctggctgaa ttattgaata tttgaaatta 180 ttacattaac aaaattttgt cttacagcag tggtccccaa ccttcttagc agtagcatcc 240 ctcattaaga attaaaattt gtagaaattg acaaggattc tgacaagctg ttgggagaga 300 agaatagagc agattgcagt aggaacagtt gtgttagaat ttattaatcc tttaacactg 360 aaagtaaact attgttgatt gcctcttggt gtgtttccat tattcag 407 <210> 18 <211> 76 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 18 tgctcttgct aagtgggagt cattccttac atcaaccacc aaccttcact tggaagaagc 60 tagcgaagat aaacct 76 <210> 19 <211> 12 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 19 cgcaaccgcc gc 12 <210> 20 <211> 63 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 20 ggcagcggcg aaggccgcgg cagcctgctg acctgcggcg atgtggaaga aaacccgggc 60 ccg 63 <210> 21 <211> 717 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 21 gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcctggtcga gctggacggc 60 gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc 120 aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc 180 gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct accccgacca catgaagcag 240 cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 300 aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 360 aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 420 ctggagtaca actacaacag ccacaacgtc tatatcatgg ccgacaagca gaagaacggc 480 atcaaggtga acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 540 cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 600 ctgagcaccc agtccgccct gagcaaagac cccaacgaga agcgcgatca catggtcctg 660 ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaa 717 <210> 22 <211> 132 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 22 tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 60 aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 120 gaggtttttt aa 132 <210> 23 <211> 141 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 23 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag agagggagtg g 141 <210> 24 <400> 24 000 <210> 25 <400> 25 000 <210> 26 <400> 26 000 <210> 27 <400> 27 000 <210> 28 <400> 28 000 <210> 29 <400> 29 000 <210> 30 <400> 30 000 <210> 31 <400> 31 000 <210> 32 <400> 32 000 <210> 33 <400> 33 000 <210> 34 <400> 34 000 <210> 35 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <400> 35 Ile Glu Pro Asp Xaa 1 5 <210> 36 <211> 5 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 36 Asp Asp Asp Asp Lys 1 5 <210> 37 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 37 Pro Gly Ala Ala His Tyr 1 5 <210> 38 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 38 Leu Glu Val Phe Gln Gly Pro 1 5 <210> 39 <211> 4 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 39 Arg Asn Arg Arg 1 <210> 40 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 40 Leu Val Pro Arg Gly Ser 1 5 <210> 41 <211> 7 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 41 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 42 <211> 2 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (1)..(1) <223> /replace="Gly" or "Ser" or "Val" <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> SITE <222> (1)..(2) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 42 Ala Xaa 1 <210> 43 <211> 4 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 43 Arg Thr Lys Arg 1 <210> 44 <211> 12 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 44 cgtactaaaa ga 12 <210> 45 <211> 20 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 45 Gly Thr Gly Ala Glu Asp Pro Arg Pro Ser Arg Lys Arg Arg Ser Leu 1 5 10 15 Gly Asp Val Gly 20 <210> 46 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 46 ggaaccggcg cggaagaccc ccggccctcc aggaagcgaa ggtccctcgg agacgtgggt 60 <210> 47 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 47 Gly Thr Gly Ala Glu Asp Pro Arg Pro Ser Arg Lys Arg Arg 1 5 10 <210> 48 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 48 ggaaccggcg cggaagaccc ccggccctcc aggaagcgaa gg 42 <210> 49 <211> 15 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 49 Leu Gln Trp Leu Glu Gln Gln Val Ala Lys Arg Arg Thr Lys Arg 1 5 10 15 <210> 50 <211> 45 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 50 ctgcaatggc tggagcagca ggtggcgaag cggagaacta agcgg 45 <210> 51 <211> 18 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 51 Gly Thr Gly Ala Glu Asp Pro Arg Pro Ser Arg Lys Arg Arg Ser Leu 1 5 10 15 Gly Gly <210> 52 <211> 54 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 52 ggcacaggtg ccgaggaccc tcggccaagc cgcaaaagga ggtcacttgg cggc 54 <210> 53 <211> 17 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 53 Gly Thr Gly Ala Glu Asp Pro Arg Pro Ser Arg Lys Arg Arg Ser Leu 1 5 10 15 Gly <210> 54 <211> 51 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 54 ggaaccggag cagaagatcc cagaccaagc cggaaaaggc ggtccctggg t 51 <210> 55 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 55 Ser Leu Asn Leu Thr Glu Ser His Asn Ser Arg Lys Lys Arg 1 5 10 <210> 56 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 56 agtctcaatt tgactgagtc acacaattcc aggaagaaaa gg 42 <210> 57 <211> 14 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 57 Cys Lys Ile Asn Gly Tyr Pro Lys Arg Gly Arg Lys Arg Arg 1 5 10 <210> 58 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 58 tgcaagatca acggctaccc taagaggggc agaaagcggc gg 42 <210> 59 <211> 21 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (1)..(3) <223> /replace=" " <220> <221> SITE <222> (1)..(21) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 59 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 1 5 10 15 Glu Asn Pro Gly Pro 20 <210> 60 <400> 60 000 <210> 61 <211> 18 <212> PRT <213> Thosea asigna virus 2A <400> 61 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 Gly Pro <210> 62 <211> 53 <212> DNA <213> Thosea asigna virus 2A <400> 62 gaaggccgcg gcagcctgct gacctgcggc gatgtggaag aaaacccggg ccc 53 <210> 63 <211> 22 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (1)..(3) <223> /replace=" " <220> <221> SITE <222> (1)..(22) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 63 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 64 <211> 66 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> variation <222> (1)..(9) <223> /replace=" " <220> <221> misc_feature <222> (1)..(66) <223> /note="Variant nucleotides given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 64 ggcagcggcg ccaccaactt cagcctgctg aagcaggccg gcgacgtgga ggagaacccc 60 ggcccc 66 <210> 65 <211> 23 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (1)..(3) <223> /replace=" " <220> <221> SITE <222> (1)..(23) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 65 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 1 5 10 15 Val Glu Ser Asn Pro Gly Pro 20 <210> 66 <211> 69 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> variation <222> (1)..(9) <223> /replace=" " <220> <221> misc_feature <222> (1)..(69) <223> /note="Variant nucleotides given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 66 ggcagcggcc agtgcaccaa ctacgccctg ctgaagctgg ccggcgacgt ggagagcaac 60 cccggcccc 69 <210> 67 <211> 25 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <220> <221> VARIANT <222> (1)..(3) <223> /replace=" " <220> <221> SITE <222> (1)..(25) <223> /note="Variant residues given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 67 Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala 1 5 10 15 Gly Asp Val Glu Ser Asn Pro Gly Pro 20 25 <210> 68 <211> 75 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> variation <222> (1)..(9) <223> /replace=" " <220> <221> misc_feature <222> (1)..(75) <223> /note="Variant nucleotides given in the sequence have no preference with respect to those in the annotations for variant positions" <400> 68 ggcagcggcg tgaagcagac cctgaacttc gacctgctga agctggccgg cgacgtggag 60 agcaaccccg gcccc 75 <210> 69 <211> 9 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 69 gaagaagaa 9 <210> 70 <211> 6 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 70 gccacc 6 <210> 71 <211> 1058 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 71 cttccagagg agattggaaa acttgaagaa gaagtggatt gtgctaatat tgccctgaaa 60 gcagccacca tggattggga gagttggaaa caaaatttgc aaattgatat caagttagca 120 tttacagatt tggctgagga gaatatccat tattttgaac aggtaattag tgttgtttga 180 tattgcttca ttttaaagtt atttgctcat ttacttttgg tccgtccatt gttgaaagag 240 tgtattaaag aacaagtgtc acattctatt gcctctctgg tagcttggtt ttgttgaagt 300 tgtcagttac catttggttt tgtttatcct cagtttgttg ttttggattt ggattcttca 360 aaagcatttg atattgcttt ctattgattg tcctaactac tcctctttcc tctcccttct 420 ccatttttga agagtttgca aaggaaggaa aggagcagag acttgattga gcagaaaatc 480 atttcagggc ctgttctcta ttgtccttgc tatcctgtct tctgtagcta tctgaaacca 540 tcaacaaagg agcacaccat tccatcagca aaagagtaac aacatctttt tttaagttca 600 ttttgttttt cagttgattg tatttcaatt tttttacagc tgacttttct cagagaagtt 660 ttttttttat tgtaaacata ctttttctag aaagtatatt ttaaaataac atctttaacc 720 ttatctctgg ctgaattatt gaatatttga aattattaca ttaacaaaat tttgtcttac 780 agcagtggtc cccaaccttc ttagcagtag catccctcat taagaattaa aatttgtaga 840 aattgacaag gattctgaca agctgttggg agagaagaat agagcagatt gcagtaggaa 900 cagttgtgtt agaatttatt aatcctttaa cactgaaagt aaactattgt tgattgcctc 960 ttggtgtgtt tccattattc agtgctcttg ctaagtggga gtcattcctt acatcaacca 1020 ccaaccttca cttggaagaa gctagcgaag ataaacct 1058 <210> 72 <211> 720 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: PRE sequence" <400> 72 acaggcctat tgattggaaa gtatgtcaac gaattgtggg tcttttgggg tttgctgccc 60 cttttacgca atgtggatat cctgctttaa tgcctttata tgcatgtata caagcaaaac 120 aggcttttac tttctcgcca acttacaagg cctttctaag taaacagtat ctgacccttt 180 accccgttgc tcggcaacgg cctggtctgt gccaagtgtt tgctgacgca acccccactg 240 gttggggctt ggccataggc catcagcgca tgcgtggaac ctttgtgtct cctctgccga 300 tccatactgc ggaactccta gccgcttgtt ttgctcgcag caggtctgga gcgaaactca 360 tcgggactga caattctgtc gtgctctccc gcaagtatac atcgtttcca gggctgctag 420 gctgtgctgc caactggatc ctgcgcggga cgtcctttgt ttacgtcccg tcggcgctga 480 atcccgcgga cgacccctcc cggggccgct tggggctcta ccgcccgctt ctccgtctgc 540 cgtaccgacc gaccacgggg cgcacctctc tttacgcgga ctccccgtct gtgccttctc 600 atctgccgga ccgtgtgcac ttcgcttcac ctctgcacgt cgcatggaga ccaccgtgaa 660 cgcccaccgg aacctgccca aggtcttgca taagaggact cttggacttt cagcaatgtc 720 <210> 73 <211> 721 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: PRE sequence" <400> 73 aacaggccta ttgattggaa agtatgtcaa cgaattgtgg gtcttttggg gtttgctgcc 60 ccttttacgc aatgtggata tcctgcttta atgcctttat atgcatgtat acaagcaaaa 120 caggctttta ctttctcgcc aacttacaag gcctttctaa gtaaacagta tctgaccctt 180 taccccgttg ctcggcaacg gcctggtctg tgccaagtgt ttgctgacgc aacccccact 240 ggttggggct tggccatagg ccatcagcgc atgcgtggaa cctttgtgtc tcctctgccg 300 atccatactg cggaactcct agccgcttgt tttgctcgca gcaggtctgg agcgaaactc 360 atcgggactg acaattctgt cgtgctctcc cgcaagtata catcgtttcc agggctgcta 420 ggctgtgctg ccaactggat cctgcgcggg acgtcctttg tttacgtccc gtcggcgctg 480 aatcccgcgg acgacccctc ccggggccgc ttggggctct accgcccgct tctccgtctg 540 ccgtaccgac cgaccacggg gcgcacctct ctttacgcgg actccccgtc tgtgccttct 600 catctgccgg accgtgtgca cttcgcttca cctctgcacg tcgcatggag accaccgtga 660 acgcccaccg gaacctgccc aaggtcttgc ataagaggac tcttggactt tcagcaatgt 720 c 721 <210> 74 <211> 2211 <212> DNA <213> Adeno-associated virus <400> 74 atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60 gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120 aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180 aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300 caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420 ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480 aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540 tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600 cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660 gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720 accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780 tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840 tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900 ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960 caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020 acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080 gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140 acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200 ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260 cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320 gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380 ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440 ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500 tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560 ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620 ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680 accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740 gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800 atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860 aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920 aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980 gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040 gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100 tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160 tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211 <210> 75 <211> 1800 <212> DNA <213> Adeno-associated virus <400> 75 acggctcctg gaaagaagag gcctgtagag cagtctcctc aggaaccgga ctcctccgcg 60 ggtattggca aatcgggtgc acagcccgct aaaaagagac tcaatttcgg tcagactggc 120 gacacagagt cagtcccaga ccctcaacca atcggagaac ctcccgcagc cccctcaggt 180 gtgggatctc ttacaatggc ttcaggtggt ggcgcaccag tggcagacaa taacgaaggt 240 gccgatggag tgggtagttc ctcgggaaat tggcattgcg attcccaatg gctgggggac 300 agagtcatca ccaccagcac ccgaacctgg gccctgccca cctacaacaa tcacctctac 360 aagcaaatct ccaacagcac atctggagga tcttcaaatg acaacgccta cttcggctac 420 agcaccccct gggggtattt tgacttcaac agattccact gccacttctc accacgtgac 480 tggcagcgac tcatcaacaa caactgggga ttccggccta agcgactcaa cttcaagctc 540 ttcaacattc aggtcaaaga ggttacggac aacaatggag tcaagaccat cgccaataac 600 cttaccagca cggtccaggt cttcacggac tcagactatc agctcccgta cgtgctcggg 660 tcggctcacg agggctgcct cccgccgttc ccagcggacg ttttcatgat tcctcagtac 720 gggtatctga cgcttaatga tggaagccag gccgtgggtc gttcgtcctt ttactgcctg 780 gaatatttcc cgtcgcaaat gctaagaacg ggtaacaact tccagttcag ctacgagttt 840 gagaacgtac ctttccatag cagctacgct cacagccaaa gcctggaccg actaatgaat 900 ccactcatcg accaatactt gtactatctc tcaaagacta ttaacggttc tggacagaat 960 caacaaacgc taaaattcag tgtggccgga cccagcaaca tggctgtcca gggaagaaac 1020 tacatacctg gacccagcta ccgacaacaa cgtgtctcaa ccactgtgac tcaaaacaac 1080 aacagcgaat ttgcttggcc tggagcttct tcttgggctc tcaatggacg taatagcttg 1140 atgaatcctg gacctgctat ggccagccac aaagaaggag aggaccgttt ctttcctttg 1200 tctggatctt taatttttgg caaacaagga actggaagag acaacgtgga tgcggacaaa 1260 gtcatgataa ccaacgaaga agaaattaaa actactaacc cggtagcaac ggagtcctat 1320 ggacaagtgg ccacaaacca ccagagtgcc caagcacagg cgcagaccgg ctgggttcaa 1380 aaccaaggaa tacttccggg tatggtttgg caggacagag atgtgtacct gcaaggaccc 1440 atttgggcca aaattcctca cacggacggc aactttcacc cttctccgct gatgggaggg 1500 tttggaatga agcacccgcc tcctcagatc ctcatcaaaa acacacctgt acctgcggat 1560 cctccaacgg ccttcaacaa ggacaagctg aactctttca tcacccagta ttctactggc 1620 caagtcagcg tggagatcga gtgggagctg cagaaggaaa acagcaagcg ctggaacccg 1680 gagatccagt acacttccaa ctattacaag tctaataatg ttgaatttgc tgttaatact 1740 gaaggtgtat atagtgaacc ccgccccatt ggcaccagat acctgactcg taatctgtaa 1800 <210> 76 <211> 1605 <212> DNA <213> Adeno-associated virus <400> 76 atggcttcag gtggtggcgc accagtggca gacaataacg aaggtgccga tggagtgggt 60 agttcctcgg gaaattggca ttgcgattcc caatggctgg gggacagagt catcaccacc 120 agcacccgaa cctgggccct gcccacctac aacaatcacc tctacaagca aatctccaac 180 agcacatctg gaggatcttc aaatgacaac gcctacttcg gctacagcac cccctggggg 240 tattttgact tcaacagatt ccactgccac ttctcaccac gtgactggca gcgactcatc 300 aacaacaact ggggattccg gcctaagcga ctcaacttca agctcttcaa cattcaggtc 360 aaagaggtta cggacaacaa tggagtcaag accatcgcca ataaccttac cagcacggtc 420 caggtcttca cggactcaga ctatcagctc ccgtacgtgc tcgggtcggc tcacgagggc 480 tgcctcccgc cgttcccagc ggacgttttc atgattcctc agtacgggta tctgacgctt 540 aatgatggaa gccaggccgt gggtcgttcg tccttttact gcctggaata tttcccgtcg 600 caaatgctaa gaacgggtaa caacttccag ttcagctacg agtttgagaa cgtacctttc 660 catagcagct acgctcacag ccaaagcctg gaccgactaa tgaatccact catcgaccaa 720 tacttgtact atctctcaaa gactattaac ggttctggac agaatcaaca aacgctaaaa 780 ttcagtgtgg ccggacccag caacatggct gtccagggaa gaaactacat acctggaccc 840 agctaccgac aacaacgtgt ctcaaccact gtgactcaaa acaacaacag cgaatttgct 900 tggcctggag cttcttcttg ggctctcaat ggacgtaata gcttgatgaa tcctggacct 960 gctatggcca gccacaaaga aggagaggac cgtttctttc ctttgtctgg atctttaatt 1020 tttggcaaac aaggaactgg aagagacaac gtggatgcgg acaaagtcat gataaccaac 1080 gaagaagaaa ttaaaactac taacccggta gcaacggagt cctatggaca agtggccaca 1140 aaccaccaga gtgcccaagc acaggcgcag accggctggg ttcaaaacca aggaatactt 1200 ccgggtatgg tttggcagga cagagatgtg tacctgcaag gacccatttg ggccaaaatt 1260 cctcacacgg acggcaactt tcacccttct ccgctgatgg gagggtttgg aatgaagcac 1320 ccgcctcctc agatcctcat caaaaacaca cctgtacctg cggatcctcc aacggccttc 1380 aacaaggaca agctgaactc tttcatcacc cagtattcta ctggccaagt cagcgtggag 1440 atcgagtggg agctgcagaa ggaaaacagc aagcgctgga acccggagat ccagtacact 1500 tccaactatt acaagtctaa taatgttgaa tttgctgtta atactgaagg tgtatatagt 1560 gaaccccgcc ccattggcac cagatacctg actcgtaatc tgtaa 1605 <210> 77 <211> 736 <212> PRT <213> Adeno-associated virus <400> 77 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro 20 25 30 Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly 145 150 155 160 Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro 180 185 190 Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn 260 265 270 Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg 275 280 285 Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn 290 295 300 Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile 305 310 315 320 Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn 325 330 335 Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu 340 345 350 Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro 355 360 365 Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp 370 375 380 Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe 385 390 395 400 Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu 405 410 415 Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu 420 425 430 Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser 435 440 445 Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser 450 455 460 Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro 465 470 475 480 Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn 485 490 495 Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn 500 505 510 Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys 515 520 525 Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly 530 535 540 Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile 545 550 555 560 Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser 565 570 575 Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln 580 585 590 Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met 625 630 635 640 Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn 690 695 700 Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val 705 710 715 720 Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu 725 730 735 <210> 78 <211> 599 <212> PRT <213> Adeno-associated virus <400> 78 Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln Ser Pro Gln Glu Pro 1 5 10 15 Asp Ser Ser Ala Gly Ile Gly Lys Ser Gly Ala Gln Pro Ala Lys Lys 20 25 30 Arg Leu Asn Phe Gly Gln Thr Gly Asp Thr Glu Ser Val Pro Asp Pro 35 40 45 Gln Pro Ile Gly Glu Pro Pro Ala Ala Pro Ser Gly Val Gly Ser Leu 50 55 60 Thr Met Ala Ser Gly Gly Gly Ala Pro Val Ala Asp Asn Asn Glu Gly 65 70 75 80 Ala Asp Gly Val Gly Ser Ser Ser Gly Asn Trp His Cys Asp Ser Gln 85 90 95 Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu 100 105 110 Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Asn Ser Thr Ser 115 120 125 Gly Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp 130 135 140 Gly Tyr Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp 145 150 155 160 Trp Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu 165 170 175 Asn Phe Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Asp Asn Asn 180 185 190 Gly Val Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe 195 200 205 Thr Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Glu 210 215 220 Gly Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr 225 230 235 240 Gly Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala Val Gly Arg Ser Ser 245 250 255 Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn 260 265 270 Asn Phe Gln Phe Ser Tyr Glu Phe Glu Asn Val Pro Phe His Ser Ser 275 280 285 Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp 290 295 300 Gln Tyr Leu Tyr Tyr Leu Ser Lys Thr Ile Asn Gly Ser Gly Gln Asn 305 310 315 320 Gln Gln Thr Leu Lys Phe Ser Val Ala Gly Pro Ser Asn Met Ala Val 325 330 335 Gln Gly Arg Asn Tyr Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val 340 345 350 Ser Thr Thr Val Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly 355 360 365 Ala Ser Ser Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly 370 375 380 Pro Ala Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu 385 390 395 400 Ser Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val 405 410 415 Asp Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr Thr 420 425 430 Asn Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn His Gln 435 440 445 Ser Ala Gln Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile 450 455 460 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 465 470 475 480 Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro 485 490 495 Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile 500 505 510 Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp 515 520 525 Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val 530 535 540 Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro 545 550 555 560 Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe 565 570 575 Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr 580 585 590 Arg Tyr Leu Thr Arg Asn Leu 595 <210> 79 <211> 534 <212> PRT <213> Adeno-associated virus <400> 79 Met Ala Ser Gly Gly Gly Ala Pro Val Ala Asp Asn Asn Glu Gly Ala 1 5 10 15 Asp Gly Val Gly Ser Ser Ser Gly Asn Trp His Cys Asp Ser Gln Trp 20 25 30 Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro 35 40 45 Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly 50 55 60 Gly Ser Ser Asn Asp Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly 65 70 75 80 Tyr Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp 85 90 95 Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn 100 105 110 Phe Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Asp Asn Asn Gly 115 120 125 Val Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr 130 135 140 Asp Ser Asp Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Glu Gly 145 150 155 160 Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly 165 170 175 Tyr Leu Thr Leu Asn Asp Gly Ser Gln Ala Val Gly Arg Ser Ser Phe 180 185 190 Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn 195 200 205 Phe Gln Phe Ser Tyr Glu Phe Glu Asn Val Pro Phe His Ser Ser Tyr 210 215 220 Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln 225 230 235 240 Tyr Leu Tyr Tyr Leu Ser Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln 245 250 255 Gln Thr Leu Lys Phe Ser Val Ala Gly Pro Ser Asn Met Ala Val Gln 260 265 270 Gly Arg Asn Tyr Ile Pro Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser 275 280 285 Thr Thr Val Thr Gln Asn Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala 290 295 300 Ser Ser Trp Ala Leu Asn Gly Arg Asn Ser Leu Met Asn Pro Gly Pro 305 310 315 320 Ala Met Ala Ser His Lys Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser 325 330 335 Gly Ser Leu Ile Phe Gly Lys Gln Gly Thr Gly Arg Asp Asn Val Asp 340 345 350 Ala Asp Lys Val Met Ile Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn 355 360 365 Pro Val Ala Thr Glu Ser Tyr Gly Gln Val Ala Thr Asn His Gln Ser 370 375 380 Ala Gln Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile Leu 385 390 395 400 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 405 410 415 Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu 420 425 430 Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile Lys 435 440 445 Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys 450 455 460 Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 465 470 475 480 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 485 490 495 Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala 500 505 510 Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg 515 520 525 Tyr Leu Thr Arg Asn Leu 530 <210> 80 <211> 144 <212> DNA <213> Homo sapiens <400> 80 agtttgcaaa ggaaggaaag gagcagagac ttgaatgagc agaaaatcat ttcagggcct 60 gttctctatg tccttgctat ccctgtcttc tgtagctatt ctgaaaccat caacaaagga 120 gcacaccatt ccatcagcaa aaga 144 <210> 81 <211> 593 <212> PRT <213> Homo sapiens <400> 81 Met Trp Thr Leu Val Ser Trp Val Ala Leu Thr Ala Gly Leu Val Ala 1 5 10 15 Gly Thr Arg Cys Pro Asp Gly Gln Phe Cys Pro Val Ala Cys Cys Leu 20 25 30 Asp Pro Gly Gly Ala Ser Tyr Ser Cys Cys Arg Pro Leu Leu Asp Lys 35 40 45 Trp Pro Thr Thr Leu Ser Arg His Leu Gly Gly Pro Cys Gln Val Asp 50 55 60 Ala His Cys Ser Ala Gly His Ser Cys Ile Phe Thr Val Ser Gly Thr 65 70 75 80 Ser Ser Cys Cys Pro Phe Pro Glu Ala Val Ala Cys Gly Asp Gly His 85 90 95 His Cys Cys Pro Arg Gly Phe His Cys Ser Ala Asp Gly Arg Ser Cys 100 105 110 Phe Gln Arg Ser Gly Asn Asn Ser Val Gly Ala Ile Gln Cys Pro Asp 115 120 125 Ser Gln Phe Glu Cys Pro Asp Phe Ser Thr Cys Cys Val Met Val Asp 130 135 140 Gly Ser Trp Gly Cys Cys Pro Met Pro Gln Ala Ser Cys Cys Glu Asp 145 150 155 160 Arg Val His Cys Cys Pro His Gly Ala Phe Cys Asp Leu Val His Thr 165 170 175 Arg Cys Ile Thr Pro Thr Gly Thr His Pro Leu Ala Lys Lys Leu Pro 180 185 190 Ala Gln Arg Thr Asn Arg Ala Val Ala Leu Ser Ser Ser Val Met Cys 195 200 205 Pro Asp Ala Arg Ser Arg Cys Pro Asp Gly Ser Thr Cys Cys Glu Leu 210 215 220 Pro Ser Gly Lys Tyr Gly Cys Cys Pro Met Pro Asn Ala Thr Cys Cys 225 230 235 240 Ser Asp His Leu His Cys Cys Pro Gln Asp Thr Val Cys Asp Leu Ile 245 250 255 Gln Ser Lys Cys Leu Ser Lys Glu Asn Ala Thr Thr Asp Leu Leu Thr 260 265 270 Lys Leu Pro Ala His Thr Val Gly Asp Val Lys Cys Asp Met Glu Val 275 280 285 Ser Cys Pro Asp Gly Tyr Thr Cys Cys Arg Leu Gln Ser Gly Ala Trp 290 295 300 Gly Cys Cys Pro Phe Thr Gln Ala Val Cys Cys Glu Asp His Ile His 305 310 315 320 Cys Cys Pro Ala Gly Phe Thr Cys Asp Thr Gln Lys Gly Thr Cys Glu 325 330 335 Gln Gly Pro His Gln Val Pro Trp Met Glu Lys Ala Pro Ala His Leu 340 345 350 Ser Leu Pro Asp Pro Gln Ala Leu Lys Arg Asp Val Pro Cys Asp Asn 355 360 365 Val Ser Ser Cys Pro Ser Ser Asp Thr Cys Cys Gln Leu Thr Ser Gly 370 375 380 Glu Trp Gly Cys Cys Pro Ile Pro Glu Ala Val Cys Cys Ser Asp His 385 390 395 400 Gln His Cys Cys Pro Gln Gly Tyr Thr Cys Val Ala Glu Gly Gln Cys 405 410 415 Gln Arg Gly Ser Glu Ile Val Ala Gly Leu Glu Lys Met Pro Ala Arg 420 425 430 Arg Ala Ser Leu Ser His Pro Arg Asp Ile Gly Cys Asp Gln His Thr 435 440 445 Ser Cys Pro Val Gly Gln Thr Cys Cys Pro Ser Leu Gly Gly Ser Trp 450 455 460 Ala Cys Cys Gln Leu Pro His Ala Val Cys Cys Glu Asp Arg Gln His 465 470 475 480 Cys Cys Pro Ala Gly Tyr Thr Cys Asn Val Lys Ala Arg Ser Cys Glu 485 490 495 Lys Glu Val Val Ser Ala Gln Pro Ala Thr Phe Leu Ala Arg Ser Pro 500 505 510 His Val Gly Val Lys Asp Val Glu Cys Gly Glu Gly His Phe Cys His 515 520 525 Asp Asn Gln Thr Cys Cys Arg Asp Asn Arg Gln Gly Trp Ala Cys Cys 530 535 540 Pro Tyr Arg Gln Gly Val Cys Cys Ala Asp Arg Arg His Cys Cys Pro 545 550 555 560 Ala Gly Phe Arg Cys Ala Ala Arg Gly Thr Lys Cys Leu Arg Arg Glu 565 570 575 Ala Pro Arg Trp Asp Ala Pro Leu Arg Asp Pro Ala Leu Arg Gln Leu 580 585 590 Leu <210> 82 <400> 82 000 <210> 83 <400> 83 000 <210> 84 <400> 84 000 <210> 85 <211> 141 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 85 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc t 141 <210> 86 <211> 483 <212> DNA <213> Homo sapiens <400> 86 aaccgagtat ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga 60 ggcggggtgg gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc 120 ccattcccca aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag 180 gcgcgtgcgc actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg 240 cgcgccaccg ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa 300 ctccccttcc cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc 360 acgcgaggcg cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact 420 cagcgctgcc tcagtctgcg gtgggcagcg gaggagtcgt gtcgtgcctg agagcgcagc 480 tgt 483 <210> 87 <211> 1779 <212> DNA <213> Homo sapiens <400> 87 tggaccctgg tgagctgggt ggccttaaca gcagggctgg tggctggaac gcggtgccca 60 gatggtcagt tctgccctgt ggcctgctgc ctggaccccg gaggagccag ctacagctgc 120 tgccgtcccc ttctggacaa atggcccaca acactgagca ggcatctggg tggcccctgc 180 caggttgatg cccactgctc tgccggccac tcctgcatct ttaccgtctc agggacttcc 240 agttgctgcc ccttcccaga ggccgtggca tgcggggatg gccatcactg ctgcccacgg 300 ggcttccact gcagtgcaga cgggcgatcc tgcttccaaa gatcaggtaa caactccgtg 360 ggtgccatcc agtgccctga tagtcagttc gaatgcccgg acttctccac gtgctgtgtt 420 atggtcgatg gctcctgggg gtgctgcccc atgccccagg cttcctgctg tgaagacagg 480 gtgcactgct gtccgcacgg tgccttctgc gacctggttc acacccgctg catcacaccc 540 acgggcaccc accccctggc aaagaagctc cctgcccaga ggactaacag ggcagtggcc 600 ttgtccagct cggtcatgtg tccggacgca cggtcccggt gccctgatgg ttctacctgc 660 tgtgagctgc ccagtgggaa gtatggctgc tgcccaatgc ccaacgccac ctgctgctcc 720 gatcacctgc actgctgccc ccaagacact gtgtgtgacc tgatccagag taagtgcctc 780 tccaaggaga acgctaccac ggacctcctc actaagctgc ctgcgcacac agtgggggat 840 gtgaaatgtg acatggaggt gagctgccca gatggctata cctgctgccg tctacagtcg 900 ggggcctggg gctgctgccc ttttacccag gctgtgtgct gtgaggacca catacactgc 960 tgtcccgcgg ggtttacgtg tgacacgcag aagggtacct gtgaacaggg gccccaccag 1020 gtgccctgga tggagaaggc cccagctcac ctcagcctgc cagacccaca agccttgaag 1080 agagatgtcc cctgtgataa tgtcagcagc tgtccctcct ccgatacctg ctgccaactc 1140 acgtctgggg agtggggctg ctgtccaatc ccagaggctg tctgctgctc ggaccaccag 1200 cactgctgcc cccagggcta cacgtgtgta gctgaggggc agtgtcagcg aggaagcgag 1260 atcgtggctg gactggagaa gatgcctgcc cgccgggctt ccttatccca ccccagagac 1320 atcggctgtg accagcacac cagctgcccg gtggggcaga cctgctgccc gagcctgggt 1380 gggagctggg cctgctgcca gttgccccat gctgtgtgct gcgaggatcg ccagcactgc 1440 tgcccggctg gctacacctg caacgtgaag gctcgatcct gcgagaagga agtggtctct 1500 gcccagcctg ccaccttcct ggcccgtagc cctcacgtgg gtgtgaagga cgtggagtgt 1560 ggggaaggac acttctgcca tgataaccag acctgctgcc gagacaaccg acagggctgg 1620 gcctgctgtc cctaccgcca gggcgtctgt tgtgctgatc ggcgccactg ctgtcctgct 1680 ggcttccgct gcgcagccag gggtaccaag tgtttgcgca gggaggcccc gcgctgggac 1740 gcccctttga gggacccagc cttgagacag ctgctgtag 1779 <210> 88 <211> 721 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 88 aacaggccta ttgattggaa agtatgtcaa cgaattgtgg gtcttttggg gtttgctgcc 60 ccttttacgc aatgtggata tcctgcttta atgcctttat atgcatgtat acaagcaaaa 120 caggctttta ctttctcgcc aacttacaag gcctttctaa gtaaacagta tctgaccctt 180 taccccgttg ctcggcaacg gcctggtctg tgccaagtgt ttgctgacgc aacccccact 240 ggttggggct tggccatagg ccatcagcgc atgcgtggaa cctttgtgtc tcctctgccg 300 atccatactg cggaactcct agccgcttgt tttgctcgca gcaggtctgg agcgaaactc 360 atcgggactg acaattctgt cgtgctctcc cgcaagtata catcgtttcc agggctgcta 420 ggctgtgctg ccaactggat cctgcgcggg acgtcctttg tttacgtccc gtcggcgctg 480 aatcccgcgg acgacccctc ccggggccgc ttggggctct accgcccgct tctccgtctg 540 ccgtaccgac cgaccacggg gcgcacctct ctttacgcgg actccccgtc tgtgccttct 600 catctgccgg accgtgtgca cttcgcttca cctctgcacg tcgcatggag accaccgtga 660 acgcccaccg gaacctgccc aaggtcttgc ataagaggac tcttggactt tcagcaatgt 720 c 721 <210> 89 <211> 479 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 89 acgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa gttgccactc 60 cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt 120 ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaaga 180 caacctgtag ggcctgcggg gtctattggg aaccaagctg gagtgcagtg gcacaatctt 240 ggctcactgc aatctccgcc tcctgggttc aagcgattct cctgcctcag cctcccgagt 300 tgttgggatt ccaggcatgc atgaccaggc tcagctaatt tttgtttttt tggtagagac 360 ggggtttcac catattggcc aggctggtct ccaactccta atctcaggtg atctacccac 420 cttggcctcc caaattgctg ggattacagg cgtgaaccac tgctcccttc cctgtcctt 479 <210> 90 <211> 141 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 90 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag ctgcctgcag g 141 <210> 91 <211> 4958 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 91 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaaccg agtatctgca gagggccctg 180 cgtatgagtg caagtgggtt ttaggaccag gatgaggcgg ggtgggggtg cctacctgac 240 gaccgacccc gacccactgg acaagcaccc aacccccatt ccccaaattg cgcatcccct 300 atcagagagg gggaggggaa acaggatgcg gcgaggcgcg tgcgcactgc cagcttcagc 360 accgcggaca gtgccttcgc ccccgcctgg cggcgcgcgc caccgccgcc tcagcactga 420 aggcgcgctg acgtcactcg ccggtccccc gcaaactccc cttcccggcc accttggtcg 480 cgtccgcgcc gccgccggcc cagccggacc gcaccacgcg aggcgcgaga taggggggca 540 cgggcgcgac catctgcgct gcggcgccgg cgactcagcg ctgcctcagt ctgcggtggg 600 cagcggagga gtcgtgtcgt gcctgagagc gcagctgtga attccttcca gaggagattg 660 gaaaacttga agaagaagtg gattgtgcta atattgccct gaaagcagcc accatggatt 720 gggagagttg gaaacaaaat ttgcaaattg atatcaagtt agcatttaca gatttggctg 780 aggagaatat ccattatttt gaacaggtaa ttagtgttgt ttgatattgc ttcattttaa 840 agttatttgc tcatttactt ttggtccgtc cattgttgaa agagtgtatt aaagaacaag 900 tgtcacattc tattgcctct ctggtagctt ggttttgttg aagttgtcag ttaccatttg 960 gttttgttta tcctcagttt gttgttttgg atttggattc ttcaaaagca tttgatattg 1020 ctttctattg attgtcctaa ctactcctct ttcctctccc ttctccattt ttgaagagtt 1080 tgcaaaggaa ggaaaggagc agagacttga ttgagcagaa aatcatttca gggcctgttc 1140 tctattgtcc ttgctatcct gtcttctgta gctatctgaa accatcaaca aaggagcaca 1200 ccattccatc agcaaaagag taacaacatc tttttttaag ttcattttgt ttttcagttg 1260 attgtatttc aattttttta cagctgactt ttctcagaga agtttttttt ttattgtaaa 1320 catacttttt ctagaaagta tattttaaaa taacatcttt aaccttatct ctggctgaat 1380 tattgaatat ttgaaattat tacattaaca aaattttgtc ttacagcagt ggtccccaac 1440 cttcttagca gtagcatccc tcattaagaa ttaaaatttg tagaaattga caaggattct 1500 gacaagctgt tgggagagaa gaatagagca gattgcagta ggaacagttg tgttagaatt 1560 tattaatcct ttaacactga aagtaaacta ttgttgattg cctcttggtg tgtttccatt 1620 attcagtgct cttgctaagt gggagtcatt ccttacatca accaccaacc ttcacttgga 1680 agaagctagc gaagataaac ctcgcaaccg ccgcggcagc ggcgaaggcc gcggcagcct 1740 gctgacctgc ggcgatgtgg aagaaaaccc gggcccgtgg accctggtga gctgggtggc 1800 cttaacagca gggctggtgg ctggaacgcg gtgcccagat ggtcagttct gccctgtggc 1860 ctgctgcctg gaccccggag gagccagcta cagctgctgc cgtccccttc tggacaaatg 1920 gcccacaaca ctgagcaggc atctgggtgg cccctgccag gttgatgccc actgctctgc 1980 cggccactcc tgcatcttta ccgtctcagg gacttccagt tgctgcccct tcccagaggc 2040 cgtggcatgc ggggatggcc atcactgctg cccacggggc ttccactgca gtgcagacgg 2100 gcgatcctgc ttccaaagat caggtaacaa ctccgtgggt gccatccagt gccctgatag 2160 tcagttcgaa tgcccggact tctccacgtg ctgtgttatg gtcgatggct cctgggggtg 2220 ctgccccatg ccccaggctt cctgctgtga agacagggtg cactgctgtc cgcacggtgc 2280 cttctgcgac ctggttcaca cccgctgcat cacacccacg ggcacccacc ccctggcaaa 2340 gaagctccct gcccagagga ctaacagggc agtggccttg tccagctcgg tcatgtgtcc 2400 ggacgcacgg tcccggtgcc ctgatggttc tacctgctgt gagctgccca gtgggaagta 2460 tggctgctgc ccaatgccca acgccacctg ctgctccgat cacctgcact gctgccccca 2520 agacactgtg tgtgacctga tccagagtaa gtgcctctcc aaggagaacg ctaccacgga 2580 cctcctcact aagctgcctg cgcacacagt gggggatgtg aaatgtgaca tggaggtgag 2640 ctgcccagat ggctatacct gctgccgtct acagtcgggg gcctggggct gctgcccttt 2700 tacccaggct gtgtgctgtg aggaccacat acactgctgt cccgcggggt ttacgtgtga 2760 cacgcagaag ggtacctgtg aacaggggcc ccaccaggtg ccctggatgg agaaggcccc 2820 agctcacctc agcctgccag acccacaagc cttgaagaga gatgtcccct gtgataatgt 2880 cagcagctgt ccctcctccg atacctgctg ccaactcacg tctggggagt ggggctgctg 2940 tccaatccca gaggctgtct gctgctcgga ccaccagcac tgctgccccc agggctacac 3000 gtgtgtagct gaggggcagt gtcagcgagg aagcgagatc gtggctggac tggagaagat 3060 gcctgcccgc cgggcttcct tatcccaccc cagagacatc ggctgtgacc agcacaccag 3120 ctgcccggtg gggcagacct gctgcccgag cctgggtggg agctgggcct gctgccagtt 3180 gccccatgct gtgtgctgcg aggatcgcca gcactgctgc ccggctggct acacctgcaa 3240 cgtgaaggct cgatcctgcg agaaggaagt ggtctctgcc cagcctgcca ccttcctggc 3300 ccgtagccct cacgtgggtg tgaaggacgt ggagtgtggg gaaggacact tctgccatga 3360 taaccagacc tgctgccgag acaaccgaca gggctgggcc tgctgtccct accgccaggg 3420 cgtctgttgt gctgatcggc gccactgctg tcctgctggc ttccgctgcg cagccagggg 3480 taccaagtgt ttgcgcaggg aggccccgcg ctgggacgcc cctttgaggg acccagcctt 3540 gagacagctg ctgtaggtcg actaaacagg cctattgatt ggaaagtatg tcaacgaatt 3600 gtgggtcttt tggggtttgc tgcccctttt acgcaatgtg gatatcctgc tttaatgcct 3660 ttatatgcat gtatacaagc aaaacaggct tttactttct cgccaactta caaggccttt 3720 ctaagtaaac agtatctgac cctttacccc gttgctcggc aacggcctgg tctgtgccaa 3780 gtgtttgctg acgcaacccc cactggttgg ggcttggcca taggccatca gcgcatgcgt 3840 ggaacctttg tgtctcctct gccgatccat actgcggaac tcctagccgc ttgttttgct 3900 cgcagcaggt ctggagcgaa actcatcggg actgacaatt ctgtcgtgct ctcccgcaag 3960 tatacatcgt ttccagggct gctaggctgt gctgccaact ggatcctgcg cgggacgtcc 4020 tttgtttacg tcccgtcggc gctgaatccc gcggacgacc cctcccgggg ccgcttgggg 4080 ctctaccgcc cgcttctccg tctgccgtac cgaccgacca cggggcgcac ctctctttac 4140 gcggactccc cgtctgtgcc ttctcatctg ccggaccgtg tgcacttcgc ttcacctctg 4200 cacgtcgcat ggagaccacc gtgaacgccc accggaacct gcccaaggtc ttgcataaga 4260 ggactcttgg actttcagca atgtcaactc gagagatcta cgggtggcat ccctgtgacc 4320 cctccccagt gcctctcctg gccctggaag ttgccactcc agtgcccacc agccttgtcc 4380 taataaaatt aagttgcatc attttgtctg actaggtgtc cttctataat attatggggt 4440 ggaggggggt ggtatggagc aaggggcaag ttgggaagac aacctgtagg gcctgcgggg 4500 tctattggga accaagctgg agtgcagtgg cacaatcttg gctcactgca atctccgcct 4560 cctgggttca agcgattctc ctgcctcagc ctcccgagtt gttgggattc caggcatgca 4620 tgaccaggct cagctaattt ttgttttttt ggtagagacg gggtttcacc atattggcca 4680 ggctggtctc caactcctaa tctcaggtga tctacccacc ttggcctccc aaattgctgg 4740 gattacaggc gtgaaccact gctcccttcc ctgtccttct gattttgtag gtaaccacgt 4800 gcggaccgag cggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 4860 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 4920 ggcctcagtg agcgagcgag cgcgcagctg cctgcagg 4958 <210> 92 <211> 9220 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 92 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtaaccg agtatctgca gagggccctg 180 cgtatgagtg caagtgggtt ttaggaccag gatgaggcgg ggtgggggtg cctacctgac 240 gaccgacccc gacccactgg acaagcaccc aacccccatt ccccaaattg cgcatcccct 300 atcagagagg gggaggggaa acaggatgcg gcgaggcgcg tgcgcactgc cagcttcagc 360 accgcggaca gtgccttcgc ccccgcctgg cggcgcgcgc caccgccgcc tcagcactga 420 aggcgcgctg acgtcactcg ccggtccccc gcaaactccc cttcccggcc accttggtcg 480 cgtccgcgcc gccgccggcc cagccggacc gcaccacgcg aggcgcgaga taggggggca 540 cgggcgcgac catctgcgct gcggcgccgg cgactcagcg ctgcctcagt ctgcggtggg 600 cagcggagga gtcgtgtcgt gcctgagagc gcagctgtga attccttcca gaggagattg 660 gaaaacttga agaagaagtg gattgtgcta atattgccct gaaagcagcc accatggatt 720 gggagagttg gaaacaaaat ttgcaaattg atatcaagtt agcatttaca gatttggctg 780 aggagaatat ccattatttt gaacaggtaa ttagtgttgt ttgatattgc ttcattttaa 840 agttatttgc tcatttactt ttggtccgtc cattgttgaa agagtgtatt aaagaacaag 900 tgtcacattc tattgcctct ctggtagctt ggttttgttg aagttgtcag ttaccatttg 960 gttttgttta tcctcagttt gttgttttgg atttggattc ttcaaaagca tttgatattg 1020 ctttctattg attgtcctaa ctactcctct ttcctctccc ttctccattt ttgaagagtt 1080 tgcaaaggaa ggaaaggagc agagacttga ttgagcagaa aatcatttca gggcctgttc 1140 tctattgtcc ttgctatcct gtcttctgta gctatctgaa accatcaaca aaggagcaca 1200 ccattccatc agcaaaagag taacaacatc tttttttaag ttcattttgt ttttcagttg 1260 attgtatttc aattttttta cagctgactt ttctcagaga agtttttttt ttattgtaaa 1320 catacttttt ctagaaagta tattttaaaa taacatcttt aaccttatct ctggctgaat 1380 tattgaatat ttgaaattat tacattaaca aaattttgtc ttacagcagt ggtccccaac 1440 cttcttagca gtagcatccc tcattaagaa ttaaaatttg tagaaattga caaggattct 1500 gacaagctgt tgggagagaa gaatagagca gattgcagta ggaacagttg tgttagaatt 1560 tattaatcct ttaacactga aagtaaacta ttgttgattg cctcttggtg tgtttccatt 1620 attcagtgct cttgctaagt gggagtcatt ccttacatca accaccaacc ttcacttgga 1680 agaagctagc gaagataaac ctcgcaaccg ccgcggcagc ggcgaaggcc gcggcagcct 1740 gctgacctgc ggcgatgtgg aagaaaaccc gggcccgtgg accctggtga gctgggtggc 1800 cttaacagca gggctggtgg ctggaacgcg gtgcccagat ggtcagttct gccctgtggc 1860 ctgctgcctg gaccccggag gagccagcta cagctgctgc cgtccccttc tggacaaatg 1920 gcccacaaca ctgagcaggc atctgggtgg cccctgccag gttgatgccc actgctctgc 1980 cggccactcc tgcatcttta ccgtctcagg gacttccagt tgctgcccct tcccagaggc 2040 cgtggcatgc ggggatggcc atcactgctg cccacggggc ttccactgca gtgcagacgg 2100 gcgatcctgc ttccaaagat caggtaacaa ctccgtgggt gccatccagt gccctgatag 2160 tcagttcgaa tgcccggact tctccacgtg ctgtgttatg gtcgatggct cctgggggtg 2220 ctgccccatg ccccaggctt cctgctgtga agacagggtg cactgctgtc cgcacggtgc 2280 cttctgcgac ctggttcaca cccgctgcat cacacccacg ggcacccacc ccctggcaaa 2340 gaagctccct gcccagagga ctaacagggc agtggccttg tccagctcgg tcatgtgtcc 2400 ggacgcacgg tcccggtgcc ctgatggttc tacctgctgt gagctgccca gtgggaagta 2460 tggctgctgc ccaatgccca acgccacctg ctgctccgat cacctgcact gctgccccca 2520 agacactgtg tgtgacctga tccagagtaa gtgcctctcc aaggagaacg ctaccacgga 2580 cctcctcact aagctgcctg cgcacacagt gggggatgtg aaatgtgaca tggaggtgag 2640 ctgcccagat ggctatacct gctgccgtct acagtcgggg gcctggggct gctgcccttt 2700 tacccaggct gtgtgctgtg aggaccacat acactgctgt cccgcggggt ttacgtgtga 2760 cacgcagaag ggtacctgtg aacaggggcc ccaccaggtg ccctggatgg agaaggcccc 2820 agctcacctc agcctgccag acccacaagc cttgaagaga gatgtcccct gtgataatgt 2880 cagcagctgt ccctcctccg atacctgctg ccaactcacg tctggggagt ggggctgctg 2940 tccaatccca gaggctgtct gctgctcgga ccaccagcac tgctgccccc agggctacac 3000 gtgtgtagct gaggggcagt gtcagcgagg aagcgagatc gtggctggac tggagaagat 3060 gcctgcccgc cgggcttcct tatcccaccc cagagacatc ggctgtgacc agcacaccag 3120 ctgcccggtg gggcagacct gctgcccgag cctgggtggg agctgggcct gctgccagtt 3180 gccccatgct gtgtgctgcg aggatcgcca gcactgctgc ccggctggct acacctgcaa 3240 cgtgaaggct cgatcctgcg agaaggaagt ggtctctgcc cagcctgcca ccttcctggc 3300 ccgtagccct cacgtgggtg tgaaggacgt ggagtgtggg gaaggacact tctgccatga 3360 taaccagacc tgctgccgag acaaccgaca gggctgggcc tgctgtccct accgccaggg 3420 cgtctgttgt gctgatcggc gccactgctg tcctgctggc ttccgctgcg cagccagggg 3480 taccaagtgt ttgcgcaggg aggccccgcg ctgggacgcc cctttgaggg acccagcctt 3540 gagacagctg ctgtaggtcg actaaacagg cctattgatt ggaaagtatg tcaacgaatt 3600 gtgggtcttt tggggtttgc tgcccctttt acgcaatgtg gatatcctgc tttaatgcct 3660 ttatatgcat gtatacaagc aaaacaggct tttactttct cgccaactta caaggccttt 3720 ctaagtaaac agtatctgac cctttacccc gttgctcggc aacggcctgg tctgtgccaa 3780 gtgtttgctg acgcaacccc cactggttgg ggcttggcca taggccatca gcgcatgcgt 3840 ggaacctttg tgtctcctct gccgatccat actgcggaac tcctagccgc ttgttttgct 3900 cgcagcaggt ctggagcgaa actcatcggg actgacaatt ctgtcgtgct ctcccgcaag 3960 tatacatcgt ttccagggct gctaggctgt gctgccaact ggatcctgcg cgggacgtcc 4020 tttgtttacg tcccgtcggc gctgaatccc gcggacgacc cctcccgggg ccgcttgggg 4080 ctctaccgcc cgcttctccg tctgccgtac cgaccgacca cggggcgcac ctctctttac 4140 gcggactccc cgtctgtgcc ttctcatctg ccggaccgtg tgcacttcgc ttcacctctg 4200 cacgtcgcat ggagaccacc gtgaacgccc accggaacct gcccaaggtc ttgcataaga 4260 ggactcttgg actttcagca atgtcaactc gagagatcta cgggtggcat ccctgtgacc 4320 cctccccagt gcctctcctg gccctggaag ttgccactcc agtgcccacc agccttgtcc 4380 taataaaatt aagttgcatc attttgtctg actaggtgtc cttctataat attatggggt 4440 ggaggggggt ggtatggagc aaggggcaag ttgggaagac aacctgtagg gcctgcgggg 4500 tctattggga accaagctgg agtgcagtgg cacaatcttg gctcactgca atctccgcct 4560 cctgggttca agcgattctc ctgcctcagc ctcccgagtt gttgggattc caggcatgca 4620 tgaccaggct cagctaattt ttgttttttt ggtagagacg gggtttcacc atattggcca 4680 ggctggtctc caactcctaa tctcaggtga tctacccacc ttggcctccc aaattgctgg 4740 gattacaggc gtgaaccact gctcccttcc ctgtccttct gattttgtag gtaaccacgt 4800 gcggaccgag cggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 4860 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 4920 ggcctcagtg agcgagcgag cgcgcagctg cctgcaggaa gctgtaagct ctaggagatc 4980 cgaaccagat aagtgaaatc tagttccaaa ctattttgtc atttttaatt ttcgtattag 5040 cttacgacgc tacacccagt tcccatctat tttgtcactc ttccctaaat aatccttaaa 5100 aactccattt ccacccctcc cagttcccaa ctattttgtc cgcccacagc ggggcatttt 5160 tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc atgtgacaaa ccgtcatctt 5220 cggctacttt ttctctgtca cagaatgaaa atttttctgt catctcttcg ttattaatgt 5280 ttgtaattga ctgaatatca acgcttattt gcagcctgaa tggcgaatgg acgcgccctg 5340 tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc 5400 cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg 5460 ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg 5520 gcacctcgac cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg 5580 atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt 5640 ccaaactgga acaacactca accctatctc ggtctattct tttgatttat aagggatttt 5700 gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt 5760 taacaaaata ttaacgttta caatttcagg tggcactttt cggggaaatg tgcgcggaac 5820 ccctatttgt ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc 5880 ctgataaatg cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt 5940 cgcccttatt cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct 6000 ggtgaaagta aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga 6060 tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa gaacgttttc caatgatgag 6120 cacttttaaa gttctgctat gtggcgcggt attatcccgt attgacgccg ggcaagagca 6180 actcggtcgc cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga 6240 aaagcatctt acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag 6300 tgataacact gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc 6360 ttttttgcac aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa 6420 tgaagccata ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt 6480 gcgcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 6540 gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 6600 tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 6660 gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 6720 ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 6780 gtcagaccaa gtttactcat atatacttta gattgattta aaacttcatt tttaatttaa 6840 aaggatctag gtgaagatcc tttttgataa tctcatgacc aaaatccctt aacgtgagtt 6900 ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt gagatccttt 6960 ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg 7020 tttgccggat caagagctac caactctttt tccgaaggta actggcttca gcagagcgca 7080 gataccaaat actgtccttc tagtgtagcc gtagttaggc caccacttca agaactctgt 7140 agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg ccagtggcga 7200 taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg cgcagcggtc 7260 gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct acaccgaact 7320 gagataccta cagcgtgagc attgagaaag cgccacgctt cccgaaggga gaaaggcgga 7380 caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc ttccaggggg 7440 aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt 7500 tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg cggccttttt 7560 acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt tatcccctga 7620 ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc gcagccgaac 7680 gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcctgatgc ggtattttct 7740 ccttacgcat ctgtgcggta tttcacaccg cagaccagcc gcgtaacctg gcaaaatcgg 7800 ttacggttga gtaataaatg gatgccctgc gtaagcgggt gtgggcggac aataaagtct 7860 taaactgaac aaaatagatc taaactatga caataaagtc ttaaactaga cagaatagtt 7920 gtaaactgaa atcagtccag ttatgctgtg aaaaagcata ctggactttt gttatggcta 7980 aagcaaactc ttcattttct gaagtgcaaa ttgcccgtcg tattaaagag gggcgtggcc 8040 aagggcatgg taaagactat attcgcggcg ttgtgacaat ttaccgaaca actccgcggc 8100 cgggaagccg atctcggctt gaacgaattg ttaggtggcg gtacttgggt cgatatcaaa 8160 gtgcatcact tcttcccgta tgcccaactt tgtatagaga gccactgcgg gatcgtcacc 8220 gtaatctgct tgcacgtaga tcacataagc accaagcgcg ttggcctcat gcttgaggag 8280 attgatgagc gcggtggcaa tgccctgcct ccggtgctcg ccggagactg cgagatcata 8340 gatatagatc tcactacgcg gctgctcaaa cctgggcaga acgtaagccg cgagagcgcc 8400 aacaaccgct tcttggtcga aggcagcaag cgcgatgaat gtcttactac ggagcaagtt 8460 cccgaggtaa tcggagtccg gctgatgttg ggagtaggtg gctacgtctc cgaactcacg 8520 accgaaaaga tcaagagcag cccgcatgga tttgacttgg tcagggccga gcctacatgt 8580 gcgaatgatg cccatacttg agccacctaa ctttgtttta gggcgactgc cctgctgcgt 8640 aacatcgttg ctgctgcgta acatcgttgc tgctccataa catcaaacat cgacccacgg 8700 cgtaacgcgc ttgctgcttg gatgcccgag gcatagactg tacaaaaaaa cagtcataac 8760 aagccatgaa aaccgccact gcgccgttac caccgctgcg ttcggtcaag gttctggacc 8820 agttgcgtga gcgcatacgc tacttgcatt acagtttacg aaccgaacag gcttatgtca 8880 actgggttcg tgccttcatc cgtttccacg gtgtgcgtca cccggcaacc ttgggcagca 8940 gcgaagtcga ggcatttctg tcctggctgg cgaacgagcg caaggtttcg gtctccacgc 9000 atcgtcaggc attggcggcc ttgctgttct tctacggcaa ggtgctgtgc acggatctgc 9060 cctggcttca ggagatcgga agacctcggc cgtcgcggcg cttgccggtg gtgctgaccc 9120 cggatgaagt ggttcgcatc ctcggttttc tggaaggcga gcatcgtttg ttcgcccagg 9180 actctagcta tagttctagt ggttggctac agcttgcatg 9220 <210> 93 <211> 5954 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 93 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggaatt cgggcggagt 120 tagggcggag ccaatcagcg tgcgccgttc cgaaagttgc cttttatggc tgggcggaga 180 atgggcggtg aacgccgatg attatataag gacgcgccgg gtgtggcaca gctagttccg 240 tcgcagccgg gatttgggtc gcggttcttg tttgtggatc cctgtgatcg tcacttgaca 300 ccggtcttcc agaggagatt ggaaaacttg aagaagaagt ggattgtgct aatattgccc 360 tgaaagcagc caccatggat tgggagagtt ggaaacaaaa tttgcaaatt gatatcaagt 420 tagcatttac agatttggct gaggagaata tccattattt tgaacaggta attagtgttg 480 tttgatattg cttcatttta aagttatttg ctcatttact tttggtccgt ccattgttga 540 aagagtgtat taaagaacaa gtgtcacatt ctattgcctc tctggtagct tggttttgtt 600 gaagttgtca gttaccattt ggttttgttt atcctcagtt tgttgttttg gatttggatt 660 cttcaaaagc atttgatatt gctttctatt gattgtccta actactcctc tttcctctcc 720 cttctccatt tttgaagagt ttgcaaagga aggaaaggag cagagacttg attgagcaga 780 aaatcatttc agggcctgtt ctctattgtc cttgctatcc tgtcttctgt agctatctga 840 aaccatcaac aaaggagcac accattccat cagcaaaaga gtaacaacat ctttttttaa 900 gttcattttg tttttcagtt gattgtattt caattttttt acagctgact tttctcagag 960 aagttttttt tttattgtaa acatactttt tctagaaagt atattttaaa ataacatctt 1020 taaccttatc tctggctgaa ttattgaata tttgaaatta ttacattaac aaaattttgt 1080 cttacagcag tggtccccaa ccttcttagc agtagcatcc ctcattaaga attaaaattt 1140 gtagaaattg acaaggattc tgacaagctg ttgggagaga agaatagagc agattgcagt 1200 aggaacagtt gtgttagaat ttattaatcc tttaacactg aaagtaaact attgttgatt 1260 gcctcttggt gtgtttccat tattcagtgc tcttgctaag tgggagtcat tccttacatc 1320 aaccaccaac cttcacttgg aagaagctag cgaagataaa cctcgcaacc gccgcggcag 1380 cggcgaaggc cgcggcagcc tgctgacctg cggcgatgtg gaagaaaacc cgggcccggt 1440 gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 1500 cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 1560 gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 1620 gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 1680 cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 1740 ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 1800 ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 1860 ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 1920 caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 1980 ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2040 gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2100 ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaatgctt 2160 tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 2220 agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 2280 tttttaaaat cgatctgagg aacccctagt gatggagttg gccactcccc cccccccccg 2340 gcgattctct tgtttgctcc agactctcag gcaatgacct gatagccttt gtagagacct 2400 ctcaaaaata gctaccctct ccggcatgaa tttatcagct agaacggttg aatatcatat 2460 tgatggtgat ttgactgtct ccggcctttc tcacccgttt gaatctttac ctacacatta 2520 ctcaggcatt gcatttaaaa tatatgaggg ttctaaaaat ttttatcctt gcgttgaaat 2580 aaaggcttct cccgcaaaag tattacaggg tcataatgtt tttggtacaa ccgatttagc 2640 tttatgctct gaggctttat tgcttaattt tgctaattct ttgccttgcc tgtatgattt 2700 attggatgtt ggaatcgcct gatgcggtat tttctcctta cgcatctgtg cggtatttca 2760 caccgcatat ggtgcactct cagtacaatc tgctctgatg ccgcatagtt aagccagccc 2820 cgacacccgc caacactatg gtgcactctc agtacaatct gctctgatgc cgcatagtta 2880 agccagcccc gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg 2940 gcatccgctt acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca 3000 ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt 3060 aatgtcatga taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc 3120 ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 3180 taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagcca tattcaacgg 3240 gaaacgtcga ggccgcgatt aaattccaac atggatgctg atttatatgg gtataaatgg 3300 gctcgcgata atgtcgggca atcaggtgcg acaatctatc gcttgtatgg gaagcccgat 3360 gcgccagagt tgtttctgaa acatggcaaa ggtagcgttg ccaatgatgt tacagatgag 3420 atggtcagac taaactggct gacggaattt atgccacttc cgaccatcaa gcattttatc 3480 cgtactcctg atgatgcatg gttactcacc actgcgatcc ccggaaaaac agcgttccag 3540 gtattagaag aatatcctga ttcaggtgaa aatattgttg atgcgctggc agtgttcctg 3600 cgccggttgc actcgattcc tgtttgtaat tgtcctttta acagcgatcg cgtatttcgc 3660 ctcgctcagg cgcaatcacg aatgaataac ggtttggttg atgcgagtga ttttgatgac 3720 gagcgtaatg gctggcctgt tgaacaagtc tggaaagaaa tgcataaact tttgccattc 3780 tcaccggatt cagtcgtcac tcatggtgat ttctcacttg ataaccttat ttttgacgag 3840 gggaaattaa taggttgtat tgatgttgga cgagtcggaa tcgcagaccg ataccaggat 3900 cttgccatcc tatggaactg cctcggtgag ttttctcctt cattacagaa acggcttttt 3960 caaaaatatg gtattgataa tcctgatatg aataaattgc agtttcattt gatgctcgat 4020 gagtttttct aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt 4080 catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc 4140 ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 4200 tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 4260 ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 4320 ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt aggccaccac 4380 ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct 4440 gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat 4500 aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg 4560 acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa 4620 gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 4680 gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 4740 cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 4800 aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 4860 gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 4920 cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccca 4980 atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg gcgtaatagc 5040 gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcga 5100 ttccgttgca atggctggcg gtaatattgt tctggatatt accagcaagg ccgatagttt 5160 gagttcttct actcaggcaa gtgatgttat tactaatcaa agaagtattg cgacaacggt 5220 taatttgcgt gatggacaga ctcttttact cggtggcctc actgattata aaaacacttc 5280 tcaggattct ggcgtaccgt tcctgtctaa aatcccttta atcggcctcc tgtttagctc 5340 ccgctctgat tctaacgagg aaagcacgtt atacgtgctc gtcaaagcaa ccatagtacg 5400 cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta 5460 cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt 5520 tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg 5580 ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat 5640 cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac 5700 tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag 5760 ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg 5820 cgaattttaa caaaatatta acgcttacaa tttaaatatt tgcttataca atcttcctgt 5880 ttttggggct tttctgatta tcaaccgggg tacatatgat tgacatgcta gttttacgat 5940 taccgttcat cgcc 5954 <210> 94 <211> 799 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 94 gaagaagaag atatcaagtt agcatttaca gatttggctg aggagaagaa caggtaatta 60 gtgttgtttg atattgcttc attttaaagt tatttgctca tttagcattt gatattgctt 120 tctattgatt gtcctaacta ctcctctttc ctctcccttc tccatttttg aagagtttgc 180 aaaggaagga aaggagcaga gacttgattg agcagaaaat catttcaggg cctgttctct 240 attgtccttg ctatcctgtc ttctgtagct atctgaaacc atcaacaaag gagcacacca 300 tggcatcagc aaaagagtaa caacatcttt ttttaagttc attttgtttt tcagttgatt 360 gtatttcaat ttttttacag ctgacttttc tcagagaagt ttttttttta ttgtaaacat 420 actttttcta gaaagtatat tttaaaataa catctttaac cttatctctg gctgaattat 480 tgaatatttg aaattattac attaacaaaa ttttgtctta cagcagtggt ccccaacctt 540 cttagcagta gcatccctca ttaagaatta aaatttgtag aaattgacaa ggattctgac 600 aagctgttgg gagagaagaa tagagcagat tgcagtagga acagttgtgt tagaatttat 660 taatccttta acactgaaag taaactattg ttgattgcct cttggtgtgt ttccattatt 720 cagtgctctt gctaagtggg agtcattcct tacatcaacc accaaccttc acttggaaga 780 agctagcgaa gataaacct 799 <210> 95 <211> 5446 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 95 gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctgattct 60 aacgaggaaa gcacgttata cgtgctcgtc aaagcaacca tagtacgcgc cctgtagcgg 120 cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc 180 cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc 240 ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct 300 cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac 360 ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac 420 tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat 480 ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa 540 aatattaacg cttacaattt aaatatttgc ttatacaatc ttcctgtttt tggggctttt 600 ctgattatca accggggtac atatgattga catgctagtt ttacgattac cgttcatcgc 660 cctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt 720 tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggaat tcaattcggg 780 cggagttagg gcggagccaa tcagcgtgcg ccgttccgaa agttgccttt tatggctggg 840 cggagaatgg gcggtgaacg ccgatgatta tataaggacg cgccgggtgt ggcacagcta 900 gttccgtcgc agccgggatt tgggtcgcgg ttcttgtttg tggatccctg tgatcgtcac 960 ttgacaccgg tgaagaagaa gatatcaagt tagcatttac agatttggct gaggagaaga 1020 acaggtaatt agtgttgttt gatattgctt cattttaaag ttatttgctc atttagcatt 1080 tgatattgct ttctattgat tgtcctaact actcctcttt cctctccctt ctccattttt 1140 gaagagtttg caaaggaagg aaaggagcag agacttgatt gagcagaaaa tcatttcagg 1200 gcctgttctc tattgtcctt gctatcctgt cttctgtagc tatctgaaac catcaacaaa 1260 ggagcacacc atggcatcag caaaagagta acaacatctt tttttaagtt cattttgttt 1320 ttcagttgat tgtatttcaa tttttttaca gctgactttt ctcagagaag tttttttttt 1380 attgtaaaca tactttttct agaaagtata ttttaaaata acatctttaa ccttatctct 1440 ggctgaatta ttgaatattt gaaattatta cattaacaaa attttgtctt acagcagtgg 1500 tccccaacct tcttagcagt agcatccctc attaagaatt aaaatttgta gaaattgaca 1560 aggattctga caagctgttg ggagagaaga atagagcaga ttgcagtagg aacagttgtg 1620 ttagaattta ttaatccttt aacactgaaa gtaaactatt gttgattgcc tcttggtgtg 1680 tttccattat tcagtgctct tgctaagtgg gagtcattcc ttacatcaac caccaacctt 1740 cacttggaag aagctagcga agataaacct cgcaaccgcc gcggcagcgg cgaaggccgc 1800 ggcagcctgc tgacctgcgg cgatgtggaa gaaaacccgg gcccggtctt cacactcgaa 1860 gatttcgttg gggactggcg acagacagcc ggctacaacc tggaccaagt ccttgaacag 1920 ggaggtgtgt ccagtttgtt tcagaatctc ggggtgtccg taactccgat ccaaaggatt 1980 gtcctgagcg gtgaaaatgg gctgaagatc gacatccatg tcatcatccc gtatgaaggt 2040 ctgagcggcg accaaatggg ccagatcgaa aaaattttta aggtggtgta ccctgtggat 2100 gatcatcact ttaaggtgat cctgcactat ggcacactgg taatcgacgg ggttacgccg 2160 aacatgatcg actatttcgg acggccgtat gaaggcatcg ccgtgttcga cggcaaaaag 2220 atcactgtaa cagggaccct gtggaacggc aacaaaatta tcgacgagcg cctgatcaac 2280 cccgacggct ccctgctgtt ccgagtaacc atcaacggag tgaccggctg gcggctgtgc 2340 gaacgcattc tggcgtaacc tgcccgctgg gcctcccaac gggccctcct cccctccttg 2400 caccaagctt atcgataccg tcgactagag ctcgctgatc agcctcgact gtgccttcta 2460 gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca 2520 ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc 2580 attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata 2640 gcaggcatgc tggggagaga tcgatctgag gaacccctag tgatggagtt ggccactccc 2700 tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc 2760 tttgcccggg cggcctcagt gagcgagcga gcgcgcagag agggagtggc cccccccccc 2820 ccccccccgg cgattctctt gtttgctcca gactctcagg caatgacctg atagcctttg 2880 tagagacctc tcaaaaatag ctaccctctc cggcatgaat ttatcagcta gaacggttga 2940 atatcatatt gatggtgatt tgactgtctc cggcctttct cacccgtttg aatctttacc 3000 tacacattac tcaggcattg catttaaaat atatgagggt tctaaaaatt tttatccttg 3060 cgttgaaata aaggcttctc ccgcaaaagt attacagggt cataatgttt ttggtacaac 3120 cgatttagct ttatgctctg aggctttatt gcttaatttt gctaattctt tgccttgcct 3180 gtatgattta ttggatgttg gaatcgcctg atgcggtatt ttctccttac gcatctgtgc 3240 ggtatttcac accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta 3300 agccagcccc gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg 3360 gcatccgctt acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca 3420 ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt 3480 aatgtcatga taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc 3540 ggaaccccta tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa 3600 taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc 3660 cgtgtcgccc ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa 3720 acgctggtga aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa 3780 ctggatctca acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg 3840 atgagcactt ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa 3900 gagcaactcg gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc 3960 acagaaaagc atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc 4020 atgagtgata acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta 4080 accgcttttt tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag 4140 ctgaatgaag ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca 4200 acgttgcgca aactattaac tggcgaacta cttactctag cttcccggca acaattaata 4260 gactggatgg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc 4320 tggtttattg ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca 4380 ctggggccag atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca 4440 actatggatg aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg 4500 taactgtcag accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa 4560 tttaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 4620 gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 4680 cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 4740 gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 4800 gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 4860 tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 4920 ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 4980 cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 5040 gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 5100 gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 5160 gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 5220 cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 5280 tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 5340 cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 5400 cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagc 5446 <210> 96 <211> 53 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 96 gaagaagaag atatcaagtt agcatttaca gatttggctg aggagaagaa cag 53 <210> 97 <211> 120 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 97 gtaattagtg ttgtttgata ttgcttcatt ttaaagttat ttgctcattt agcatttgat 60 attgctttct attgattgtc ctaactactc ctctttcctc tcccttctcc atttttgaag 120 <210> 98 <211> 143 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 98 agtttgcaaa ggaaggaaag gagcagagac ttgattgagc agaaaatcat ttcagggcct 60 gttctctatt gtccttgcta tcctgtcttc tgtagctatc tgaaaccatc aacaaaggag 120 cacaccatgg catcagcaaa aga 143 <210> 99 <211> 153 <212> DNA <213> Homo sapiens <400> 99 cttccagagg agattggaaa acttgaagat aaagtggaat gtgctaataa tgccctgaaa 60 gcagattggg agagatggaa acaaaatatg caaaatgata tcaagttagc atttacagat 120 atggctgagg agaatatcca ttattatgaa cag 153 <210> 100 <211> 78 <212> DNA <213> Homo sapiens <400> 100 tgccttgcta cgtgggagtc attccttaca tcacagacca accttcactt ggaagaagcc 60 tctgaagata aaccttaa 78 <210> 101 <211> 18 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> misc_feature <222> (1)..(18) <223> /note="This sequence may encompass 1-6 'gaa' repeating units" <400> 101 gaagaagaag aagaagaa 18 <210> 102 <211> 12 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 102 Cys Cys Cys Cys Cys Cys Cys Cys Cys Cys Cys Cys 1 5 10 <210> 103 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 103 caacaaagga gcacaccatt c 21 <210> 104 <211> 19 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 104 gcggttgcga ggtttatct 19 <210> 105 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 105 ctcttgctaa gtgggagtca tt 22 <210> 106 <211> 22 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 106 gtgctaataa tgccctgaaa gc 22 <210> 107 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 107 ccacttagca agagcactgt 20 <210> 108 <211> 34 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 108 Met Asp Trp Glu Ser Trp Lys Gln Asn Leu Gln Ile Asp Ile Lys Leu 1 5 10 15 Ala Phe Thr Asp Leu Ala Glu Glu Asn Ile His Tyr Phe Glu Gln Cys 20 25 30 Ser Cys <210> 109 <211> 149 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 109 Met Asp Trp Glu Ser Trp Lys Gln Asn Leu Gln Ile Asp Ile Lys Ser 1 5 10 15 Asp His Leu Gln Ile Trp Leu Arg Arg Ile Ser Ile Ile Leu Asn Ser 20 25 30 Ala Leu Ala Lys Trp Glu Ser Phe Leu Thr Ser Thr Thr Asn Leu His 35 40 45 Leu Glu Glu Ala Ser Glu Asp Lys Pro Arg Asn Arg Arg Gly Ser Gly 50 55 60 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 65 70 75 80 Gly Pro Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile 85 90 95 Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser 100 105 110 Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe 115 120 125 Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr 130 135 140 Thr Leu Thr Tyr Gly 145 <210> 110 <211> 175 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 110 Met Asp Trp Glu Ser Trp Lys Gln Asn Leu Gln Ile Asp Ile Lys Leu 1 5 10 15 Ala Phe Thr Asp Leu Ala Glu Glu Asn Ile His Tyr Phe Glu Gln Ser 20 25 30 Leu Gln Arg Lys Glu Arg Ser Arg Asp Leu Ile Glu Gln Lys Ile Ile 35 40 45 Ser Gly Pro Val Leu Tyr Cys Pro Cys Tyr Pro Val Phe Cys Ser Tyr 50 55 60 Leu Lys Pro Ser Thr Lys Glu His Thr Ile Pro Ser Ala Lys Asp Ala 65 70 75 80 Leu Ala Lys Trp Glu Ser Phe Leu Thr Ser Thr Thr Asn Leu His Leu 85 90 95 Glu Glu Ala Ser Glu Asp Lys Pro Arg Asn Arg Arg Gly Ser Gly Glu 100 105 110 Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly 115 120 125 Pro Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 130 135 140 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 145 150 155 160 Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe 165 170 175 <210> 111 <211> 42 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 111 Met Asp Trp Glu Ser Trp Lys Gln Asn Leu Gln Ile Asp Ile Lys Ser 1 5 10 15 Asp His Leu Gln Ile Trp Leu Arg Arg Ile Ser Ile Ile Leu Asn Arg 20 25 30 Val Cys Lys Gly Arg Lys Gly Ala Glu Thr 35 40 <210> 112 <211> 142 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 112 Met Asp Trp Glu Ser Trp Lys Gln Asn Leu Gln Ile Asp Ile Lys Leu 1 5 10 15 Ala Phe Thr Asp Leu Ala Glu Glu Asn Ile His Tyr Phe Glu Gln Ser 20 25 30 Leu Gln Arg Lys Glu Arg Ser Arg Asp Leu Ile Glu Gln Lys Ile Ile 35 40 45 Ser Gly Pro Val Leu Tyr Cys Pro Cys Tyr Pro Val Phe Cys Ser Tyr 50 55 60 Leu Lys Pro Ser Thr Lys Glu His Thr Ile Pro Ser Ala Lys Asp Ala 65 70 75 80 Leu Ala Lys Trp Glu Ser Phe Leu Thr Ser Thr Thr Asn Leu His Leu 85 90 95 Glu Glu Ala Ser Glu Asp Lys Pro Arg Asn Arg Arg Gly Ser Gly Glu 100 105 110 Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly 115 120 125 Pro Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro 130 135 140 <210> 113 <211> 69 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 113 Met Ala Ser Ala Lys Asp Ala Leu Ala Lys Trp Glu Ser Phe Leu Thr 1 5 10 15 Ser Thr Thr Asn Leu His Leu Glu Glu Ala Ser Glu Asp Lys Pro Arg 20 25 30 Asn Arg Arg Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly 35 40 45 Asp Val Glu Glu Asn Pro Gly Pro Val Ser Lys Gly Glu Glu Leu Phe 50 55 60 Thr Gly Val Val Pro 65

Claims (71)

  1. 관심 단백질을 암호화하는 이식유전자에 연결된 미니유전자를 포함하되, 미니유전자는
    a. 제1 엑손;
    b. 제1 인트론;
    c. 제2 엑손;
    d. 제2 인트론; 및
    e. 제3 엑손
    을 포함하고,
    상기 제2 엑손은 스플라이스 조절자 결합 서열을 포함하고, 스플라이스 조절자의 존재하에 상기 제2 엑손은 핵산의 mRNA 산물에 포함되고, 상기 스플라이스 조절자의 부재하에 상기 제2 엑손은 핵산의 mRNA 산물에 포함되지 않는, 핵산 분자.
  2. 제1항에 있어서, 제3 엑손은 스플라이스 조절자의 부재하에 생성된 핵산의 mRNA 산물에서 프레임 내에 있고 스플라이스 조절자의 존재하에 생성된 핵산의 mRNA 산물에서 프레임 내에 있지 않은 정지코돈을 포함하는, 핵산 분자.
  3. 제1항에 있어서, 제2 엑손은 스플라이스 조절자의 존재하에 생성된 핵산의 mRNA 산물에서 프레임 내에 있는 정지코돈을 포함하는, 핵산 분자.
  4. 제1항에 있어서, 제1 및 제3 엑손은 시작코돈을 포함하지 않고, 제2 엑손은 시작코돈을 포함하는, 핵산 분자.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 미니유전자와 이식유전자 사이에 배치된 프로테아제 절단 부위를 암호화하는 서열을 포함하는 핵산 분자.
  6. 제5항에 있어서, 상기 프로테아제 절단 부위는 포유류 프로테아제에 의해 절단되는, 핵산 분자.
  7. 제6항에 있어서, 포유류 프로테아제는 푸린, PCSK1, PCSK5, PCSK6, PCSK7, 카텝신 B, 그랜자임 B, 인자 XA, 엔테로키나제, 제네나제, 소르타제, 프리시젼 프로테아제, 트롬빈, TEV 프로테아제, 또는 엘라스타제 1인, 핵산 분자.
  8. 제4항 내지 제7항 중 어느 한 항에 있어서, 프로테아제 절단 부위는 RX(K/R)R 공통 모티프, RXXX[KR]R 공통 모티프, RRX 공통 모티프, RNRR(서열번호 39), I-E-P-D-X 공통 모티프(서열번호 35), Glu/Asp-Gly-Arg, Asp-Asp-Asp-Asp-Lys(서열번호 36), Pro-Gly-Ala-Ala-His-Tyr(서열번호 37), LPXTG/A 공통 모티프, Leu-Glu-Val-Phe-Gln-Gly-Pro(서열번호 38), Leu-Val-Pro-Arg-Gly-Ser(서열번호 40), E-N-L-Y-F-Q-G(서열번호 41), 및 [AGSV]-x(서열번호 42)로 이루어진 군으로부터 선택되는 절단 모티프를 갖는 폴리펩티드를 포함하는, 핵산 분자.
  9. 제4항 내지 제8항 중 어느 한 항에 있어서, 상기 절단 부위는 푸린에 의해 절단되는, 핵산 분자.
  10. 제9항에 있어서, 푸린에 의해 절단되는 프로테아제 절단 부위는 RNRR(서열번호 39); RTKR(서열번호 43); GTGAEDPRPSRKRRSLGDVG(서열번호 45); GTGAEDPRPSRKRR(서열번호 47); LQWLEQQVAKRRTKR(서열번호 49); GTGAEDPRPSRKRRSLGG(서열번호 51); GTGAEDPRPSRKRRSLG(서열번호 53); SLNLTESHNSRKKR(서열번호 55); 또는 CKINGYPKRGRKRR(서열번호 57)인, 핵산 분자.
  11. 제10항에 있어서, 푸린에 의해 절단되는 프로테아제 절단 부위는 RNRR(서열번호 39)을 포함하는, 핵산 분자.
  12. 제11항에 있어서, 프로테아제 절단 부위를 암호화하는 서열은 CGCAACCGCCGC(서열번호 19)를 포함하는(예를 들어 CGCAACCGCCGC(서열번호 19)로 이루어진), 핵산 분자.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 미니유전자와 이식유전자 사이에 배치된 자가절단 펩티드를 암호화하는 서열을 포함하되, 임의적으로 자가절단 펩티드는 관심 단백질의 N-말단의 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 아미노산 내에서 절단하는, 핵산 분자.
  14. 제13항에 있어서, 자가절단 펩티드는 T2A 펩티드, P2A 펩티드, E2A 펩티드, 및 F2A 펩티드로부터 임의적으로 선택되는 2A 펩티드인, 핵산 분자.
  15. 제13항 또는 제14항에 있어서, 자가절단 펩티드는 T2A 펩티드를 포함하는, 핵산 분자.
  16. 제13항 내지 제15항 중 어느 한 항에 있어서, 자가절단 펩티드는 EGRGSLLTCGDVEENPGP(서열번호 61)를 포함하고, 임의적으로 자가절단 펩티드는 (GSG)EGRGSLLTCGDVEENPGP(서열번호 59)를 포함하는, 핵산 분자.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 스플라이스 조절자 결합 서열은 제2 엑손의 3' 말단에 위치하는, 핵산 분자.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 스플라이스 조절자 결합 서열은 AGA를 포함하고(예를 들어 AGA로 이루어지고), 스플라이스 조절자는 5-(1H-피라졸-4-일)-2-(6-((2,2,6,6-테트라메틸피페리딘-4-일)옥시)피리다진-3-일)페놀(LMI070)인, 핵산 분자.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 제2 엑손은
    a. CCTTGCTATCCCTGTCTTCTGTAGCTATTCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 1);
    b. GTAATTAGCTGAGAAGGAAGATCTGAAGGTTTAACGAGAGAGGGCGAGAGATACAAAATATCTGCTAGGAGA(서열번호 2);
    c. GGATTGTTTGTATTCCTGCCAATGATTTGTGAGACAGTCTGTTCCCCACATCCTCGTCAACAGA(서열번호 3);
    d. CTTTCTGACATCTTAACGAGGCAATACAGAGAGACGAATTTTCATCAGTTTGTTCAGGGAGACACATATAACAAAAGA(서열번호 4);
    e. ATCCATACATACTTAATGCTGAAATGTGAAGGGCTGAGAAAAAAGAAAAGA(서열번호 5);
    f. AATTGGAAACATCGAGGGAAAATGGGCTTTTTATTATTAAAACAAAACCTCAGTATTATCACTTAGAAACCTGAAATTGAACTCCAAAAGCCAAAGA(서열번호 6);
    g. AAGAATGTTCCTTTTGTGAAGAATGACTTAAGGAAGATTCATGATGACTGAGTGTGCCCGTGTGGAACTTTAGGACATAGATGCACTCCTACAGA(서열번호 7);
    h. TTGTCCTTCACTCCGTACTCCAGTTGGCCAAGCATAGGTCGCATGCCAGGGTCAAGGAGACTAAGGGAGA(서열번호 8);
    i. GACATACAGACATGGCAGCCCCTAGCATGTGTATCCTAAGA(서열번호 9);
    j. ACATACAGACATGGCAGCCCCTAGCATGTGTATCCTAAGA(서열번호 10);
    k. AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGAATGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATGTCCTTGCTATCCCTGTCTTCTGTAGCTATTCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 80); 및
    l. (a) 내지 (k) 중 어느 하나에 대한 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 갖는 단편 또는 돌연변이
    로부터 선택되는 서열을 포함하는(예를 들어 이러한 서열로 이루어진), 핵산 분자.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 제2 엑손은 SNX7의 엑손에서 유래된 서열을 포함하고, 임의적으로 서열은 SNX7의 크립틱 엑손에서 유래되는, 핵산 분자.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 제2 엑손은
    a. AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGATTGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATTGTCCTTGCTATCCTGTCTTCTGTAGCTATCTGAAACCATCAACAAAGGAGCACACCATTCCATCAGCAAAAGA(서열번호 16);
    b. 서열번호 16의 단편; 또는
    c. 서열번호 16 또는 이의 단편에 대한 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 갖는 돌연변이 서열
    을 포함하는(예를 들어 이러한 서열 또는 단편으로 이루어진), 핵산 분자.
  22. 제1항 내지 제20항 중 어느 한 항에 있어서, 제2 엑손은
    a. AGTTTGCAAAGGAAGGAAAGGAGCAGAGACTTGATTGAGCAGAAAATCATTTCAGGGCCTGTTCTCTATTGTCCTTGCTATCCTGTCTTCTGTAGCTATCTGAAACCATCAACAAAGGAGCACACCATGGCATCAGCAAAAGA(서열번호 98);
    b. 서열번호 98의 단편; 또는
    c. 서열번호 98 또는 이의 단편에 대한 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99%의 동일성을 갖는 돌연변이 서열
    을 포함하는(예를 들어 이러한 서열 또는 단편으로 이루어진), 핵산 분자.
  23. 제1항, 제2항, 및 제4항 내지 제22항 중 어느 한 항에 있어서, 제2 엑손은 3n-1개의 뉴클레오티드로 이루어진(n은 정수임), 핵산 분자.
  24. 제1항 내지 제21항 중 어느 한 항에 있어서, 제1 엑손은
    a. 1개 이상(예를 들어 3개)의 GAA 반복부(서열번호 69)(예를 들어 GAAGAAGAA(서열번호 69)를 포함함);
    b. Kozak 서열(예를 들어 GCCACC(서열번호 70)를 포함하는 Kozak 서열); 또는
    c. (a)와 (b) 둘 다
    를 포함하는, 핵산 분자.
  25. 제1항 내지 제23항 중 어느 한 항에 있어서, 미니유전자는
    a. 단일 시작코돈(예를 들어 ATG 시작코돈)을 제외한 모든 시작코돈을 제거하거나 돌연변이시키도록;
    b. 제1 엑손, 제2 엑손, 및 제3 엑손의 말단에 있는 것 이외의 모든 크립틱 스플라이스 공여체 및 스플라이스 수여체 서열을 제거하거나 돌연변이시키도록
    변형된, 핵산 분자.
  26. 제25항에 있어서, 단일 시작코돈은 제1 엑손 내에 배치되는, 핵산 분자.
  27. 제25항에 있어서, 단일 시작코돈은 제2 엑손 내에 배치되는, 핵산 분자.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 미니유전자는 2000개 미만, 1900개 미만, 1800개 미만, 1700개 미만, 1600개 미만, 1500개 미만, 1400개 미만, 1300개 미만, 1200개 미만, 1100개 미만, 1000개 미만, 900개 미만, 800개 미만, 700개 미만, 600개 미만, 또는 500개 미만의 뉴클레오티드를 포함하는, 핵산 분자.
  29. 제1항 내지 제27항 중 어느 한 항에 있어서, 미니유전자는 약 2500개 내지 약 500개의 뉴클레오티드, 예를 들어 약 2000개 내지 약 500개의 뉴클레오티드, 예를 들어 약 1500개 내지 약 600개의 뉴클레오티드, 예를 들어 약 1200개 내지 약 700개의 뉴클레오티드, 예를 들어 약 1100개 내지 약 800개의 뉴클레오티드, 예를 들어 약 800개 내지 약 500개의 뉴클레오티드, 예를 들어 800개 내지 약 600개의 뉴클레오티드, 예를 들어 약 800개 내지 약 700개의 뉴클레오티드를 포함하는, 핵산 분자.
  30. 제1항, 제2항, 및 제4항 내지 제29항 중 어느 한 항에 있어서, 미니유전자는 서열번호 71 또는 서열번호 94, 또는 이와 적어도 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99%의 동일성을 갖는 서열, 또는 이의 기능적 단편을 포함하는(예를 들어 이러한 서열 또는 단편으로 이루어진), 핵산 분자.
  31. (a) 관심 단백질을 암호화하는 이식유전자, 및 (b) 서열번호 71 또는 서열번호 94, 또는 이와 적어도 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99%의 동일성을 갖는 서열, 또는 이의 기능적 단편을 포함하는(예를 들어 이러한 서열 또는 단편으로 이루어진) 미니유전자를 포함하는 핵산 분자.
  32. 제31항에 있어서, 푸린 절단 부위를 암호화하는 서열(서열번호 19를 포함함), 및 자가절단 펩티드를 암호화하는 서열(서열번호 20을 포함함)을 추가로 포함하되, 임의적으로 미니유전자는 푸린 절단 부위를 암호화하는 서열의 5'(예를 들어 푸린 절단 부위를 암호화하는 서열의 5' 바로 옆)에 배치되고, 푸린 절단 부위를 암호화하는 서열은 자가절단 펩티드를 암호화하는 서열의 5'(예를 들어 자가절단 펩티드를 암호화하는 서열의 5' 바로 옆)에 배치되고, 자가절단 펩티드를 암호화하는 서열은 이식유전자의 5'(예를 들어 이식유전자의 5' 바로 옆)에 배치되는, 핵산 분자.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 미니유전자 및 이식유전자에 작동 가능하게 연결된 프로모터를 추가로 포함하되, 임의적으로 상기 프로모터는 미니유전자의 5'에 배치되는, 핵산 분자.
  34. 제33항에 있어서, 프로모터는 JeT 프로모터, CBA 프로모터, PGK 프로모터, 또는 시냅신 프로모터, 또는 인트론을 포함하지 않는 임의의 프로모터인, 핵산 분자.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 전사후 조절 요소를 추가로 포함하는 핵산 분자.
  36. 제35항에 있어서, 전사후 조절 요소(PRE)는 B형 간염(HPRE), 박쥐(BPRE), 들다람쥐(GSPRE), 북극다람쥐(ASPRE), 오리(DPRE), 침팬지(CPRE) 및 양털원숭이(WMPRE), 또는 우드척(WPRE)에서 유래된 PRE를 포함하고, 임의적으로 상기 전사후 조절 요소는 이식유전자의 3'에 배치되는, 핵산 분자.
  37. 제35항에 있어서, 전사후 조절 요소는 서열번호 72, 서열번호 73, 또는 서열번호 88을 포함하는, 핵산 분자.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 구성체는 폴리아데닐화 신호(polyA)를 추가로 포함하고, 임의적으로 상기 polyA는 이식유전자의 3'에 배치되는, 핵산 분자.
  39. 제38항에 있어서, polyA 신호는 SV40 polyA, 인간 성장 호르몬(HGH) polyA, 소 성장 호르몬(BGH) polyA, 베타-글로빈 polyA, 알파-글로빈 polyA, 오브알부민 polyA, 카파-경쇄 polyA, 및 합성 polyA인, 핵산 분자.
  40. 제38항 또는 제39항에 있어서, polyA는 서열번호 22를 포함하는(예를 들어 서열번호 22로 이루어진), 핵산 분자.
  41. 제1항 내지 제40항 중 어느 한 항에 따른 핵산을 포함하는 벡터.
  42. 제41항에 있어서, 벡터는 DNA 벡터, 임의적으로 원형 벡터, 임의적으로 플라스미드인, 벡터.
  43. 제41항 또는 제42항에 있어서, 벡터는 이중가닥 또는 단일가닥인, 벡터.
  44. 제41항 내지 제43항 중 어느 한 항에 있어서, 벡터는 이중가닥인, 벡터.
  45. 제41항 내지 제44항 중 어느 한 항에 있어서, 벡터는 바이러스 벡터인, 벡터.
  46. 제45항에 있어서, 바이러스 벡터는 아데노 관련 바이러스(AAV) 벡터, 키메라 AAV 벡터, 아데노바이러스 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, DNA 바이러스 벡터, 단순 헤르페스 바이러스 벡터, 배큘로바이러스 벡터, 또는 이들의 임의의 돌연변이 또는 유도체인, 벡터.
  47. 제46항에 있어서, 바이러스 벡터는 재조합 AAV 벡터, 임의적으로 자기상보성 AAV(scAAV) 벡터인, 벡터.
  48. 제47항에 있어서, 재조합 AAV 벡터는 하나 이상의 역위 말단 반복부(ITR)를 포함하고, 임의적으로 ITR은 AAV2 ITR이고, 임의적으로 AAV 벡터는 2개의 ITR을 포함하고, 임의적으로 2개의 ITR은 서열번호 12 및 서열번호 23을 포함하는, 벡터.
  49. 제41항 내지 제48항 중 어느 한 항에 있어서, 벡터는 예를 들어 5'에서 3' 방향으로,
    a. ITR(임의적으로 AAV2 ITR이고, 임의적으로 ITR은 말단 분해 부위의 결실을 포함하도록 변형되었으며, 임의적으로 서열번호 12를 포함함);
    b. 프로모터(임의적으로, 서열번호 13을 포함하거나 서열번호 13으로 이루어진 JeT 프로모터임);
    c. 제1항 내지 제32항 중 어느 한 항의 핵산 분자;
    d. polyA 신호(임의적으로, 서열번호 22를 포함하거나 서열번호 22로 이루어짐); 및
    e. ITR(임의적으로 AAV2 ITR이고, 임의적으로 서열번호 23을 포함하거나 서열번호 23으로 이루어짐)
    을 포함하는, 벡터.
  50. 제1항 내지 제40항 중 어느 한 항의 핵산, 또는 제41항 내지 제49항 중 어느 한 항의 벡터를 포함하는 재조합 바이러스.
  51. 제50항에 있어서, 재조합 바이러스는 아데노 관련 바이러스(AAV), 키메라 AAV, 아데노바이러스, 레트로바이러스, 렌티바이러스, DNA 바이러스, 단순 헤르페스 바이러스, 배큘로바이러스, 또는 이들의 임의의 돌연변이 또는 유도체인, 재조합 바이러스.
  52. 제51항에 있어서, 바이러스는 AAV인, 재조합 바이러스.
  53. 제52항에 있어서, AAV는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV 8, AAV9, AAV10, and AAV11, AAV12, AAVrh8, AAVrh10, AAVrh36, AAVrh37, AAV-DJ, AAV-DJ/8, AAV.Anc80, AAV.Anc80L65, AAV-PHP.B, AAV-PHP.B2, AAV-PHP.B3, AAV-PHP.A, AAV-PHP.eB, 및 AAV-PHP.S 캡시드 혈청형, 또는 이들의 변이체, 예를 들어 둘 이상의 AAV 혈청형으로부터의 캡시드의 조합 중 하나 이상을 포함하는, 재조합 바이러스.
  54. 제52항에 있어서, AAV는 AAV9 캡시드 혈청형 또는 이의 임의의 돌연변이 또는 유도체를 포함하는, 재조합 바이러스.
  55. 제54항에 있어서, AAV9 캡시드 단백질 VP1, VP2, 및 VP3(예를 들어 서열번호 74, 서열번호 75, 및 서열번호 76에 의해 각각 암호화되거나, 서열번호 77, 서열번호 78, 및 서열번호 79의 아미노산 서열을 각각 포함하는 것)을 포함하는 재조합 바이러스.
  56. 제50항 내지 제55항 중 어느 한 항에 있어서, AAV는 자기상보성 AAV(scAAV) 벡터 또는 단일가닥 AAV(ssAAV) 벡터를 포함하는, 재조합 바이러스.
  57. 제1항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 또는 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스를 포함하는 세포.
  58. 제57항에 있어서, 세포는 인간 세포인, 세포.
  59. 제57항 또는 제58항에 있어서, 세포는 뉴런세포 또는 성상세포인, 세포.
  60. 제57항 내지 제59항 중 어느 한 항에 있어서, 세포가 스플라이스 조절자(예를 들어 LMI070)를 포함하는 경우 관심 단백질의 발현 수준은 세포가 상기 스플라이스 조절자를 포함하지 않은 경우의 관심 단백질 발현 수준보다 더 크고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고), 임의적으로 세포가 상기 스플라이스 조절자를 포함하지 않은 경우의 발현 수준은 검출 가능하지 않은, 세포.
  61. 제57항 내지 제59항 중 어느 한 항에 있어서, 세포가 스플라이스 조절자(예를 들어 LMI070)를 포함하지 않은 경우 관심 단백질의 발현 수준은 세포가 상기 스플라이스 조절자를 포함하는 경우의 관심 단백질 발현 수준보다 더 크고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고), 임의적으로 세포가 상기 스플라이스 조절자를 포함하는 경우의 발현 수준은 검출 가능하지 않은, 세포.
  62. 관심 단백질을 조건부로 발현시키는 방법으로서, 제1항, 제2항, 및 제4항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 또는 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스를 포함하는 발현 시스템(예: 세포, 예를 들어 제57항 내지 제61항 중 어느 한 항의 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고,
    a. 상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고);
    b. 상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소되는(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적은), 방법.
  63. 관심 단백질을 조건부로 발현시키는 방법으로서, 제1항 또는 제3항 내지 제36항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 또는 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스를 포함하는 발현 시스템(예: 세포, 예를 들어 제57항 내지 제61항 중 어느 한 항의 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고,
    a. 상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고);
    b. 상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소되는(예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적은), 방법.
  64. 제1항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스, 또는 제57항 내지 제61항 중 어느 한 항의 세포를 포함하는 제약 조성물.
  65. 유전자 요법을 필요로 하는 대상체의 치료 방법으로서, 제1항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스, 제57항 내지 제61항 중 어느 한 항의 세포, 또는 제64항의 제약 조성물을 상기 대상체에게 투여하는 단계를 포함하는 방법.
  66. 제65항에 있어서, 관심 단백질의 발현을 스플라이스 조절자의 부재하의 관심 단백질 발현 수준에 비해 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 증가 또는 감소시키는 데 효과적인 양의 스플라이스 조절자(예를 들어 LMI070)를 대상체에게 투여하는 단계를 추가로 포함하는 방법.
  67. 제1항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스, 제57항 내지 제61항 중 어느 한 항의 세포, 또는 제64항의 제약 조성물; 및 스플라이스 조절자를 포함하는 키트.
  68. 제1항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스, 제57항 내지 제61항 중 어느 한 항의 세포, 또는 제60항의 제약 조성물에 있어서, 관심 단백질을 조건부로 발현시키는 방법으로서, 제1항, 제2항, 및 제4항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 또는 제50항 내지 제62항 중 어느 한 항의 재조합 바이러스를 포함하는 발현 시스템(예: 세포, 예를 들어 제57항 내지 제61항 중 어느 한 항의 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고,
    a. 상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고);
    b. 상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소되는(예를 들어 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적은), 방법에 사용하기 위한 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물.
  69. 제1항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스, 제57항 내지 제61항 중 어느 한 항의 세포, 또는 제64항의 제약 조성물에 있어서, 관심 단백질을 조건부로 발현시키는 방법으로서, 제1항 또는 제3항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 또는 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스를 포함하는 발현 시스템(예: 세포, 예를 들어 제57항 내지 제61항 중 어느 한 항의 세포)을 스플라이스 조절자(예를 들어 LMI070)와 접촉시키는 단계를 포함하고,
    a. 상기 스플라이스 조절자의 부재하에, 상기 관심 단백질의 발현은 상기 스플라이스 조절자의 존재하의 상기 관심 단백질의 발현 수준에 비해 증가되고(예를 들어 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 크고);
    b. 상기 스플라이스 조절자의 존재하에, 상기 관심 단백질의 발현은 스플라이스 조절자의 부재하의 상기 관심 단백질의 발현 수준에 비해 실질적으로 감소되는(예를 들어 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 50, 또는 100배 더 적은), 방법에 사용하기 위한 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물.
  70. 제1항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스, 제57항 내지 제61항 중 어느 한 항의 세포, 또는 제64항의 제약 조성물에 있어서, 유전자 요법을 필요로 하는 대상체의 치료 방법에 사용하기 위한 핵산 분자, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물.
  71. 제1항 내지 제40항 중 어느 한 항의 핵산 분자, 제41항 내지 제49항 중 어느 한 항의 벡터, 제50항 내지 제56항 중 어느 한 항의 재조합 바이러스, 제57항 내지 제61항 중 어느 한 항의 세포, 제62항 또는 제63항 및 제65항 또는 제66항 중 어느 한 항의 방법, 제64항의 제약 조성물, 또는 제64항 내지 제66항 중 어느 한 항에 따른 사용을 위한 핵산, 벡터, 재조합 바이러스, 세포, 또는 제약 조성물에 있어서, 이식유전자는 게놈 편집 시스템의 단백질(예를 들어 Cas9 단백질, 징크 핑거 뉴클레아제, 또는 TALEN과 같은 RNA-가이드 뉴클레아제), RNA(예를 들어 shRNA 또는 miRNA), 항체 또는 항체 단편, 또는 치료용 단백질(예를 들어, 프로그래뉼린, SMN, MeCP2, CLN2, CLN3, CLN4, CLN5, CLN6, CLN7, CLN8로부터 선택되는 단백질)을 암호화하는, 핵산 분자, 벡터, 재조합 바이러스, 세포, 방법, 또는 제약 조성물.
KR1020227005340A 2019-07-25 2020-07-24 조절 가능한 발현 시스템 KR20220035937A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962878514P 2019-07-25 2019-07-25
US62/878,514 2019-07-25
US202063013283P 2020-04-21 2020-04-21
US63/013,283 2020-04-21
PCT/IB2020/057038 WO2021014428A1 (en) 2019-07-25 2020-07-24 Regulatable expression systems

Publications (1)

Publication Number Publication Date
KR20220035937A true KR20220035937A (ko) 2022-03-22

Family

ID=71944162

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227005340A KR20220035937A (ko) 2019-07-25 2020-07-24 조절 가능한 발현 시스템

Country Status (9)

Country Link
US (1) US20220307053A1 (ko)
EP (1) EP4004213A1 (ko)
JP (1) JP2022541070A (ko)
KR (1) KR20220035937A (ko)
CN (1) CN114174514A (ko)
AU (1) AU2020319168B2 (ko)
CA (1) CA3147574A1 (ko)
IL (1) IL289711A (ko)
WO (1) WO2021014428A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022226183A2 (en) * 2021-04-21 2022-10-27 The Board Of Regents Of The University Of Texas System Optimized ap4m1 polynucleotides and expression cassettes and their use
GB2617565A (en) * 2022-04-11 2023-10-18 Ucl Business Ltd A construct, vector and system and uses thereof
WO2023219533A1 (ru) * 2022-05-11 2023-11-16 Общество С Ограниченной Ответственностью "Герофарм" Аденоассоциированный вирусный вектор на основе серотипа aav.php.b и его применение
WO2024060205A1 (zh) * 2022-09-23 2024-03-28 北京基驭医疗科技有限公司 包含基于小分子药物的可变剪接调节元件的核酸分子
GB202215198D0 (en) * 2022-10-14 2022-11-30 Univ Sheffield Gene therapy treatment

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5837484A (en) 1993-11-09 1998-11-17 Medical College Of Ohio Stable cell lines capable of expressing the adeno-associated virus replication gene
CA2176117C (en) 1993-11-09 2006-01-03 Terence R. Flotte Generation of high titers of recombinant aav vectors
US5658785A (en) 1994-06-06 1997-08-19 Children's Hospital, Inc. Adeno-associated virus materials and methods
US5856152A (en) 1994-10-28 1999-01-05 The Trustees Of The University Of Pennsylvania Hybrid adenovirus-AAV vector and methods of use therefor
WO1996017947A1 (en) 1994-12-06 1996-06-13 Targeted Genetics Corporation Packaging cell lines for generation of high titers of recombinant aav vectors
US6001650A (en) 1995-08-03 1999-12-14 Avigen, Inc. High-efficiency wild-type-free AAV helper functions
FR2737730B1 (fr) 1995-08-10 1997-09-05 Pasteur Merieux Serums Vacc Procede de purification de virus par chromatographie
US6143548A (en) 1995-08-30 2000-11-07 Genzyme Corporation Chromatographic purification of adeno-associated virus (AAV)
EP0850313B8 (en) 1995-09-08 2009-07-29 Genzyme Corporation Improved aav vectors for gene therapy
US5910434A (en) 1995-12-15 1999-06-08 Systemix, Inc. Method for obtaining retroviral packaging cell lines producing high transducing efficiency retroviral supernatant
DK1009808T3 (da) 1997-09-05 2013-01-21 Genzyme Corp Fremgangsmåder til generering af hjælper-frie præparater af rekombinante aav-vektorer med høj titer
US6410300B1 (en) 1998-01-12 2002-06-25 The University Of North Carolina At Chapel Hill Methods and formulations for mediating adeno-associated virus (AAV) attachment and infection and methods for purifying AAV
US6258595B1 (en) 1999-03-18 2001-07-10 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
WO2001083692A2 (en) 2000-04-28 2001-11-08 The Trustees Of The University Of Pennsylvania Recombinant aav vectors with aav5 capsids and aav5 vectors pseudotyped in heterologous capsids
US9233131B2 (en) 2003-06-30 2016-01-12 The Regents Of The University Of California Mutant adeno-associated virus virions and methods of use thereof
US9441244B2 (en) 2003-06-30 2016-09-13 The Regents Of The University Of California Mutant adeno-associated virus virions and methods of use thereof
ES2647477T3 (es) 2004-06-01 2017-12-21 Genzyme Corporation Composiciones y métodos para prevenir la agregación del vector AAV
US8110681B2 (en) 2006-03-17 2012-02-07 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Compounds for the treatment of spinal muscular atrophy and other uses
JP5123936B2 (ja) 2006-05-30 2013-01-23 メイヨ・ファウンデーション・フォー・メディカル・エデュケーション・アンド・リサーチ 認知症の検出および治療
US8633019B2 (en) * 2008-05-27 2014-01-21 Ptc Therapeutics, Inc. Methods for treating spinal muscular atrophy
MX340102B (es) 2010-01-28 2016-06-24 The Children's Hospital Of Philadelphia * Una plataforma de fabricacion ajustable en escala, para la purificacion de vector viral y vectores virales asi purificados para el uso en terapia de genes.
DE102012007232B4 (de) 2012-04-07 2014-03-13 Susanne Weller Verfahren zur Herstellung von rotierenden elektrischen Maschinen
MY174339A (en) 2012-08-13 2020-04-09 Novartis Ag 1,4-disubstituted pyridazine analogs and methods for treating smn-deficiency-related conditions
US9040712B2 (en) 2013-01-23 2015-05-26 Novartis Ag Thiadiazole analogs thereof and methods for treating SMN-deficiency-related-conditions
KR102318727B1 (ko) 2013-07-31 2021-10-28 노파르티스 아게 1,4-이치환된 피리다진 유사체 및 smn-결핍-관련 상태를 치료하기 위한 그의 용도
JP2015092462A (ja) 2013-09-30 2015-05-14 Tdk株式会社 正極及びそれを用いたリチウムイオン二次電池
NZ719098A (en) * 2013-10-28 2022-08-26 Invectys A telomerase encoding dna vaccine
JP6202701B2 (ja) 2014-03-21 2017-09-27 株式会社日立国際電気 基板処理装置、半導体装置の製造方法及びプログラム
WO2016034680A1 (en) * 2014-09-05 2016-03-10 Stichting Katholieke Universiteit Antisense oligonucleotides for the treatment of leber congenital amaurosis
JP6197169B2 (ja) 2014-09-29 2017-09-20 東芝メモリ株式会社 半導体装置の製造方法
PL3386511T3 (pl) 2015-12-10 2021-11-08 Ptc Therapeutics, Inc. Sposoby leczenia choroby huntingtona
EP3481432A4 (en) * 2016-07-05 2020-05-06 The U.S.A. as represented by the Secretary, Department of Health and Human Services DIAGNOSIS OF DISEASES ASSOCIATED WITH THE COL6 GENE AND RELATED METHODS OF TREATMENT
WO2018098446A1 (en) * 2016-11-28 2018-05-31 Ptc Therapeutics, Inc Methods for modulating rna splicing
MX2019014514A (es) 2017-06-05 2020-07-20 Ptc Therapeutics Inc Compuestos para tratar la enfermedad de huntington.
EP3644996B1 (en) 2017-06-28 2023-07-26 PTC Therapeutics, Inc. Methods for treating huntington's disease
MX2019015580A (es) 2017-06-28 2020-07-28 Ptc Therapeutics Inc Metodos para tratar la enfermedad de huntington.
BR122020005073A2 (pt) 2017-08-04 2020-10-13 Skyhawk Therapeutics, Inc. Composto, composição farmacêutica e uso do composto
TWI827560B (zh) 2017-11-08 2024-01-01 瑞士商諾華股份有限公司 用於製備病毒載體之手段及方法與其用途

Also Published As

Publication number Publication date
AU2020319168A1 (en) 2022-02-03
WO2021014428A1 (en) 2021-01-28
JP2022541070A (ja) 2022-09-21
EP4004213A1 (en) 2022-06-01
CA3147574A1 (en) 2021-01-28
US20220307053A1 (en) 2022-09-29
CN114174514A (zh) 2022-03-11
AU2020319168B2 (en) 2024-02-29
IL289711A (en) 2022-03-01

Similar Documents

Publication Publication Date Title
KR20220035937A (ko) 조절 가능한 발현 시스템
KR20230022175A (ko) Aav 캡시드의 향성 방향변경
US11697825B2 (en) Compositions and methods for the production of scAAV
KR102655319B1 (ko) 유전적 안 질환 치료용 방법 및 조성물
KR20200018455A (ko) 파킨슨병의 치료를 위한 aadc 폴리뉴클레오티드
CN108753824B (zh) 用于治疗视网膜营养不良的病毒载体
KR20230057487A (ko) 게놈 조정을 위한 방법 및 조성물
CN106414474B (zh) 用于视锥细胞中增强的基因表达的组合物和方法
KR20200044793A (ko) Aav의 전달을 위한 조성물 및 방법
EP3262162A1 (en) Regulatable expression using adeno-associated virus (aav)
CN113271955A (zh) 用于细胞介导的溶瘤病毒疗法的增强的系统
KR20210068068A (ko) 조작된 프로모터를 갖는 프라탁신 발현 구축물 및 그의 사용 방법
KR20230053735A (ko) 게놈의 조정을 위한 개선된 방법 및 조성물
KR20190005223A (ko) 아데노-관련 바이러스 변이체 캡시드 및 그 용도
KR20170121745A (ko) 선택적 스플라이싱의 앱타머 매개 조절에 의한 유전자 발현의 조절
KR20210019996A (ko) 파킨슨병의 치료를 위한 조성물 및 방법
CN112218882A (zh) Foxp3在经编辑的cd34+细胞中的表达
JP7240007B2 (ja) 改良されたトランスポザーゼポリペプチドおよびその使用
KR20190111966A (ko) 아데노 관련 바이러스(aav) 캡시드 단백질의 돌연변이체
US20210301305A1 (en) Engineered untranslated regions (utr) for aav production
TW202221125A (zh) 用於治療與葡萄糖神經醯胺酶β缺陷相關之神經病症的組合物及方法
CN112041436A (zh) 雷帕霉素抗性细胞
AU2019323501B2 (en) Recombinant human type II mitochondrial dynein-like GTPase gene sequence and application thereof
KR20240022575A (ko) 아머링된 키메라 수용체 및 이의 사용 방법
JP2022513376A (ja) レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集