KR20210125472A - 생물학적 및 생물공학적 적용에 최적화된 수여 스플라이싱 부위 모듈 - Google Patents

생물학적 및 생물공학적 적용에 최적화된 수여 스플라이싱 부위 모듈 Download PDF

Info

Publication number
KR20210125472A
KR20210125472A KR1020217018661A KR20217018661A KR20210125472A KR 20210125472 A KR20210125472 A KR 20210125472A KR 1020217018661 A KR1020217018661 A KR 1020217018661A KR 20217018661 A KR20217018661 A KR 20217018661A KR 20210125472 A KR20210125472 A KR 20210125472A
Authority
KR
South Korea
Prior art keywords
sequence
splicing
nucleotides
nucleic acid
pyrimidine
Prior art date
Application number
KR1020217018661A
Other languages
English (en)
Inventor
스틸리아노스 미칼라키스
마틴 빌
엘비르 베치로비크
Original Assignee
비게네론 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 비게네론 게엠베하 filed Critical 비게네론 게엠베하
Publication of KR20210125472A publication Critical patent/KR20210125472A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/33Alteration of splicing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
    • C12N2840/445Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor for trans-splicing, e.g. polypyrimidine tract, branch point splicing

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Medicinal Chemistry (AREA)
  • Epidemiology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Ophthalmology & Optometry (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 수여 스플라이싱 영역뿐 아니라, 이의 용도와 적용에 관한 것이다.

Description

생물학적 및 생물공학적 적용에 최적화된 수여 스플라이싱 부위 모듈
본 발명은 신규 수여 스플라이싱 영역과, 이의 용도 및 적용에 관한 것이다.
대부분의 진핵생물 유전자는, 번역 가능한 성숙 메신저 RNA(mRNA)를 생성하기 위해 전구체 메신저 RNA(전 mRNA; pre-mRNA)로부터 제거(이 과정을 "스플라이싱(splicing)"이라 칭함)되어야 하는 비 암호화 인트론을 포함한다. 스플라이싱은 대형 리보핵산단백질 복합체, 즉 보존된 소형 핵내 리보핵산단백질(snRNP) 5개, 즉 U1, U2, U4, U5 및 U6 snRNP와, 300개를 초과하는 단백질로 이루어진 스플라이세오좀(spliceosome)을 통해 매개된다. 스플라이세오좀은 매우 역동적인 과정을 통하여 각각의 인트론에 대해 조립 및 해체된다. 이를 위하여 특이적 스플라이싱 서열이 인지되어야 하므로, 엑손과 인트론의 경계는 mRNA 스플라이싱 조절에 관여하는 리보핵산단백질에 대해 결합 위치로서의 역할을 하는 변별적 서열 모티프에 의해 한정된다.
가장 관련성이 많은 스플라이싱 모티프는 엑손-인트론 경계를 한정하는 표준 공여 및 수여 스플라이싱 부위이다. 5' 공여 스플라이싱 부위(DSS)는 엑손의 3' 말단과 하류 인트론의 5' 말단에 위치하고, 3' 수여 스플라이싱 부위(ASS)는 인트론의 3' 말단과 하류 엑손의 5' 말단에 위치한다. 기능성 수여 스플라이싱 부위(ASS)는, 보통 크기 범위가 약 50 bp정도인 분지점(BP), 폴리피리미딘 대역(Poly Pyrimidine Tract; PPT) 및 표준 ASS 서열과 함께 위치하는 변별적 요소 3개를 필요로 한다.
소위 GT-AG 스플라이싱은 포유동물에서 단연코 가장 일반적인 mRNA 스플라이싱 유형으로서, 인트론의 처음 뉴클레오티드 2개와 마지막 뉴클레오티드 2개를 DNA 수준에서 한정한다. 그러므로 표준 DSS 서열 일부분은 5' 인트론 서열의 처음 염기 2개(DNA 서열에서는 구아닌, 그리고 그 뒤 티민(GT)으로서, 이는 RNA 서열에서 GU에 해당함)를 나타내고, 인트론의 마지막 염기 2개(공통 ASS중 가장 많이 보존된 부분을 나타냄)는 아데닌→구아닌(AG)이다. GT-AG 뉴클레오티드는 유효 스플라이싱 반응에 필수적인 바, 이 뉴클레오티드가 파괴되거나 치환되면 기능성 스플라이싱 부위의 소실이 초래된다.
각각의 스플라이싱 사이클은 2회의 에스테르 교환 반응으로 이루어진다. 분지화(branching)라 공지된 제1 반응에 있어, 분지점 뉴클레오시드(통상 아데노신)는 5' 엑손-인트론 접합부에서 인산염 결합을 공격한다. 이는, (스플라이싱 부위의 엑손 하류와 인트론을 포함하는) 인트론 올가미(intronic lariat)- 3'엑손 중간체와, (스플라이싱 부위의 엑손 상류를 포함하는) 유리 5' 엑손 말단의 형성을 초래한다. 엑손 결찰이라 칭하여지는 제2 반응에 있어, 5' 엑손의 유리 말단은 인트론-3' 엑손 접합부에서 인산염을 공격하여, 엑손 2개의 결찰과 인트론 올가미 구조의 방출을 초래한다. 스플라이싱 반응은, 10개 이하의 뉴클레오티드로 구성된 전 mRNA의 보조적 시스-작용성(cis-acting) 스플라이싱 조절 요소에 의해 조절된다. 이 조절 요소의 기능과 위치에 따라서, 엑손 스플라이싱 인핸서(exonic splice enhancer; ESE), 엑손 스플라이싱 인핸서(exonic splice enhancer; ESS), 인트론 스플라이싱 인핸서(intronic splice enhancer; ISE) 및 인트론 스플라이싱 침묵인자(intronic splice silencer; ISS)로 분류될 수 있다. 이 요소들은 엑손이 포함되는 것을 촉진 또는 방지하기 위해 트랜스-작용성(trans-acting) 단백질을 보충할 수 있으므로, 대안적 스플라이싱에서 중요한 역할을 하는 것으로 제안되고 있다.
주어진 엑손에 대한 스플라이싱 효율은 공여 및 수여 스플라이싱 부위의 강도(strength)에 의존하는 것으로 예상된다. 이 DSS 또는 ASS 강도는 차례로 GT 또는 AG의 상류 또는 하류에 있는 인트론 또는 엑손 서열 요소에 의존적이다. 기능성 DSS의 강도는 인실리코(in silico) 표준 예측 소프트웨어(예컨대 NNSplice: http://www.fruitfly.org/seq_tools/splice.html 또는 Human Splice Finder: http://www.umd.be/HSF3/)를 사용하여 확실히 예측될 수 있다. 이와는 대조적으로, 이 방법의 복잡성으로 말미암아 ASS 강도의 인실리코 예측은 그 결과에 신뢰성이 떨어진다(예컨대 문헌(Koller et al., (2011) "A novel screening system improves genetic correction by internal exon replacement." Nucleic acids research. 39:e108; Lorain et al., (2013) "Dystrophin rescue by trans-splicing: a strategy for DMD genotypes not
eligible for exon skipping approaches." Nucleic acids research. 41:8391-8402) 참조). 따라서 사실에 기반을 둔 ASS 강도는 실험으로 인증되어야 한다. 다수의 생물학적, 생물공학적, 그리고 치료적 적용은 전통적 GT-AG mRNA 스플라이싱의 효율, 그리고 강력한 스플라이싱 부위의 사용에 달려있다.
비 암호화 인트론을 제거함으로써 전 mRNA로부터 번역 가능한 성숙 mRNA를 생성하기 위한 보통의 시스-스플라이싱(cis-splicing) 과정은 차치하고, 스플라이싱은 또한 트랜스 방식으로도 발생하여, 별도의 전 mRNA 분자 2개를 합함으로써, 비 동일선상 키메라 RNA를 생성할 수 있다(Lei et al., (2016) "Evolutionary insights into RNA trans-splicing in vertebrates", Genome Biol. Evol. 8(3):562-577). 이 과정은 처음에 트리파노소마(trypanosomes)에서 발견되었다. 그 이후로 트랜스-스플라이싱(trans-splicing) 과정도 또한 마우스를 비롯한 더 많은 종에서 확인되었고(Hirano M and Noda T., (2004) "Genomic organization of the mouse Msh4 gene producing bicistronic chimeric and antisense mRNA", Gene 342: 165-177), 또한 인간 세포에서도 확인되었지만(Chuang et al., (2018) "Integrative transcriptome sequencing reveals extensive alternative trans-splicing and cis-back splicing in human cells". Nucleic Acids Research, 46(7): 3671-3691), 이 트랜스-스플라이싱은 오로지 고등 척추동물에서만 덜 빈번하게 발생하는 것으로 보인다.
트랜스-스플라이싱을 유전자 치료법에 이용하려는 시도들이 행해져 오고 있다. 바이러스 벡터는 유전자 치료법에 매력적인 비이클이지만, 종종 담지능(loading capacity)에 제한이 따르므로, 어느 유전자가 치환될 수 있는지에 대해 한계가 있다. 예를 들어 아데노-연관 바이러스 벡터는 약 5.0 kb 이하의 팩키징 용량(packaging capacity)을 보이므로, 약 4 kb 이하의 이식유전자를 담을 수 있다. 트랜스-스플라이싱, 즉 물리적으로 분리된 전 mRNA 2개를 함께 연결하여 성숙 mRNA를 형성하는 과정은 이러한 한계들을 극복하기 위한 한 가지 방법일 수 있다. 예를 들어 스플라이세오좀 매개 RNA 트랜스-스플라이싱(SMaRT)은, 표적 세포에 도입되어 돌연변이된 내인성 전 mRNA 일부만을 치환하는, 외인성 전 mRNA 트랜스-스플라이싱 분자를 포함하는 유전자 치료법의 도구로 사용될 수 있다. 이는, 바이러스 벡터내 더 짧은 암호화 서열의 전달을 허용할 수 있다.
바이러스 벡터, 구체적으로 아데노-연관 바이러스(AAV) 기반 벡터의 크기 제한을 해결하기 위한 대안적 방법은, 재조합 AAV(rAAV) 이중 벡터 기술을 이용하는 것이다. AAV는 단일 가닥 DNA 바이러스이다. rAAV 이중 벡터 기술을 위해 이식유전자(관심 유전자)의 암호화 서열은 적어도 2개의 부분으로 분할된 다음, 2개 이상의 별도 rAAV 벡터에 팩키징된다. 분할된 게놈 벡터들이 표적 세포에 공동 형질도입된 후, 전장 암호화 서열은 재구성된다. 다수의 세포, 예컨대 망막의 광 수용기 세포는 높은(90% 초과) 공동 형질도입 효율을 보이므로, 두 rAAV의 동일 표적 세포로의 효율적 전달은 제한적일 것으로 보이지 않는다. 그러나 이식유전자 절반부 2개의 효율적 재구성은 여전히 난제로 남아있다. rAAV 이중 벡터계 개발후 수년 동안 재구성은 오로지 DNA 수준에서만 다루어졌고, 이 접근법을 개선하기 위해 몇 가지 전략들이 탐구되었다(McClements and MacLaren, (2017) "Adeno-associated virus (AAV) dual vector strategies for gene therapy encoding large transgenes, Yale Journal of Biology and Medicine 90: 611-623).
종종 이 rAAV 이중 벡터계는 "트랜스-스플라이싱 이중 벡터"를 지칭하는 것으로 오해되고 있지만, 실제로 이 접근법에서의 mRNA 스플라이싱은 결코 트랜스 방식으로 진행되지 않는다. 전술된 rAAV 이중 벡터계에서의 재구성은 오히려 ITR 구조의 콘카테머 형성(concatemerization) 및/또는 중첩 서열의 상동성 재조합에 의존적이며, 그 결과 단일 전 mRNA, 즉 시스 방식으로 스플라이싱되는 관계로 콘카테머 형성 ITR 요소 및/또는 인공 재조합유전성 요소가 제거될 수 있는, 단일 전 mRNA가 생성된다. 이러한 rAAV 이중 벡터계는, 예컨대 문헌(Trapani et al., "Effective delivery of large genes to the retina by dual AAV vectors", (2014) EMBO Molecular Medicine, 6(2): 194-211)에 개시되어 있다. rAAV 이중 벡터계의 DNA 수준에서의 재구성은 제1 AAV 벡터내 암호화 서열의 5' 부분의 발현을 구동시키는 프로모터의 존재와, 제2 AAV 벡터내 암호화 서열의 3' 부분의 발현을 구동시키는 프로모터의 부재에 의해 인지될 수 있다. 이러한 rAAV 이중 벡터계에 대해 보고된 생체내 재구성 효율은 비교적 낮다(즉 10% 이하이다)(Carvalho et al., "Evaluating efficiencies of dual AAV approaches for retinal targeting", (2017) Frontiers in Neuroscience, 11(503): 1-8). 이와는 대조적으로, rAAV 이중 벡터계의 벡터 2개는 트랜스 입체배열로 진행되는 전 mRNA 스플라이싱을 위해 별도의 전 mRNA 분자 2개를 생성하기 위한 프로모터를 필요로 한다.
최적의 mRNA 스플라이싱, 구체적으로 mRNA 트랜스-스플라이싱 수행을 위해, 최적화되었고 실험으로 인증된 강력한 ASS의 동정이 필요한데, 이 점은 아직 충족되지 않고 있다. 구체적으로 특히 유전자 치료법에 사용될 수 있는 추가의 AAV 벡터, 예컨대 매우 특이적이고 효율적인 전 mRNA 트랜스-스플라이싱 분자를 전달하는 차세대 rAAV 이중 벡터계 또는 AAV의 개발에 사용될 수 있는 강력한 ASS 영역이 필요하다.
본 발명은 본원에 기재된 바와 같고, 실시예, 도면 및 특허청구의 범위에 기재된 바와 같이 이러한 필요에 부응하는 것이다.
(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고; (iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역; (ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고; (ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는 수여 스플라이싱 부위를 포함하는 수여 스플라이싱 영역; (ii) 관심 뉴클레오티드 서열 또는 이의 일부[단, 여기서 수여 스플라이싱 영역은 관심 뉴클레오티드 서열 또는 이의 일부에 대해 3'쪽 또는 5'쪽에 위치함]; (iii) 관심 핵산 서열 또는 이의 일부에 대해 3' 쪽 또는 5'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 결합 도메인; 그리고 (iv) 결합 도메인과 수여 스플라이싱 영역 사이에 위치하는 선택적 스페이서 서열을 포함하는 전 mRNA 트랜스-스플라이싱 분자가 본원에 제공된다. 일 구현예에서, 청구항 1의 전 mRNA 트랜스-스플라이싱 분자는 (ii) 관심 뉴클레오티드 서열 또는 이의 일부[단, 여기서 수여 스플라이싱 영역은 관심 뉴클레오티드 서열 또는 이의 일부에 대해 5'쪽에 위치함]; (iii) 관심 뉴클레오티드 서열 또는 이의 일부에 대해 3'쪽에 위치하는 공여 스플라이싱 부위; (iv) 관심 뉴클레오티드 서열 또는 이의 일부에 대해 5'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제1 결합 도메인; (v) 관심 뉴클레오티드 서열 또는 이의 일부에 대해 3'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제2 결합 도메인; (vi) 제1 결합 도메인과 수여 스플라이싱 영역 사이에 위치하는, 선택적 제1 스페이서 서열; 및 (vii) 제2 결합 도메인과 공여 스플라이싱 영역 사이에 위치하는, 선택적 제2 스페이서 서열을 포함한다.
바람직하게 수여 스플라이싱 영역은 관심 뉴클레오티드 서열 또는 이의 일부에 대해 5'쪽에 위치하고, 결합 도메인은 수여 스플라이싱 영역에 대해 5'쪽에 위치한다. 전 mRNA 트랜스-스플라이싱 분자는 종결 서열, 바람직하게 폴리 A 서열을 추가로 포함할 수 있다. 바람직하게 본 발명에 따른 전 mRNA 트랜스-스플라이싱 분자는 피리미딘 대역을 포함하는데, 단 이 피리미딘 대역중 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT에 의해 암호화되는 서열을 포함한다. 추가로, 또는 대안적으로, 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가진다. 추가로, 또는 대안적으로, 수여 스플라이싱 부위는 서열 CAGG를 가진다.
수여 스플라이싱 영역은 (a) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임]; (b) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임]; (c) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임]; 또는 (d) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]를 포함할 수 있다. 일 구현예에서, 수여 스플라이싱 영역은 서열 번호 3 또는 4의 서열을 가지거나, 서열 번호 3 또는 4의 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열에 의해 암호화된다. 본 발명에 따른 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 서열 및 프로모터를 포함하는 DNA 분자로서, 바람직하게 벡터 또는 플라스미드인 DNA 분자도 또한 제공된다.
다른 양태에서, 본 발명은 핵산 서열을 제조하기 위한 방법에 관한 것으로서, 이 방법은 (A) 1개 이상의 공여 스플라이싱 부위 서열을 포함하는 제1 핵산 서열을 제공하는 단계; (B)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고; (iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역; (ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고; (ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는 수여 스플라이싱 부위를 포함하는 수여 스플라이싱 영역을 포함하는 제2 핵산 서열을 제공하는 단계; (C) 1개 이상의 공여 스플라이싱 부위 서열(들)에서 제1 핵산 서열을 절단하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계; (D) 절단된 제1 핵산 서열을 절단된 제2 핵산 서열에 결찰시킴으로써, 핵산 서열을 수득하는 단계를 포함한다. 제1 핵산 서열은 관심 뉴클레오티드 서열 또는 이의 일부를 추가로 포함하는데, 단 이 관심 뉴클레오티드 서열의 적어도 일부는 공여 스플라이싱 부위에 대해 5'쪽에 위치하고, 제2 핵산 서열은 관심 뉴클레오티드 서열 또는 이의 일부를 추가로 포함하는데, 단 이 관심 뉴클레오티드 서열의 적어도 일부는 수여 스플라이싱 부위에 대해 3'쪽에 위치한다. 바람직하게 제1 및 제2 핵산 서열은 숙주 세포에 도입되는데, 바람직하게 제1 및 제2 핵산 서열은 재조합 핵산 서열이다.
본 발명의 방법에 관한 구현예의 또 다른 양태에서, 본 방법은 (A) 전 mRNA 트랜스-스플라이싱 분자 서열 또는 상기 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 포함하는 제1 핵산 서열을 숙주 세포에 도입하는 단계로서, 이 제1 전 mRNA 트랜스-스플라이싱 분자는 5' → 3' 방향으로 (a) 관심 뉴클레오티드 산 서열의 5'부; (b) 공여 스플라이싱 부위; (c) 선택적 스페이서 서열; (d) 제1 결합 도메인; 및 (e) 선택적 종결 서열, 바람직하게는 폴리 A 서열을 포함하는 단계; (B) 전 mRNA 트랜스-스플라이싱 분자 서열 또는 상기 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 포함하는 제2 핵산 서열을 숙주 세포에 도입하는 단계로서, 이 제2 전 mRNA 트랜스-스플라이싱 분자는 5' → 3' 방향으로 (i) 제1 핵산 서열의 제1 표적 도메인에 상보성인 제2 결합 도메인; (ii)(iia)(iiaa) 5개 내지 25개 뉴클레오티드를 포함하고; (iiab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%가 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역; (iib)(iiba) 피리미딘 대역에 대해 3'쪽에 위치하고; (iibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위를 포함하는 수여 스플라이싱 영역 서열; (iii) 관심 뉴클레오티드 서열의 3'부와, (iv) 종결 서열, 바람직하게 폴리 A 서열을 포함하는 단계; (C) 공여 스플라이싱 부위 서열에서 제1 핵산 서열을 절단하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계; 그리고 (D) 관심 뉴클레오티드 서열의 5'부를 포함하는 절단된 제1 핵산 서열을, 관심 뉴클레오티드 서열의 3'부를 포함하는 절단된 제2 핵산 서열에 결찰시킴으로써, 관심 핵산 서열을 수득하는 단계를 포함한다.
또 다른 양태에서, 본 발명은 도치된 말단 반복부 적어도 2개를 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 아데노-연관 바이러스(AAV) 벡터에 관한 것으로서, 상기 핵산 서열은 5' → 3' 방향으로 (i) 프로모터; (ii) 결합 도메인; (iii) 선택적 스페이서 서열; (iv)(a)(aa) 5개 ~ 25개의 뉴클레오티드를 포함하고, (ab) 이 5개 ~ 25개의 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역; (b) 피리미딘 대역에 대해 3'쪽에 위치하고, 이 수여 스플라이싱 부위는 서열 NAGG[여기서 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 영역 서열; (v) 관심 뉴클레오티드 서열 또는 이의 일부; 그리고 (vi) 선택적 폴리 A 서열을 포함하는, 아데노-연관 바이러스(AAV) 벡터에 관한 것이다. AAV 벡터는 또한 (I) 도치된 말단 반복부 적어도 2개를 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있고, 이 도치된 말단 반복부 2개 사이에 있는 상기 핵산 서열은 5' → 3' 방향으로 (a) 프로모터, (b) 관심 폴리펩티드의 N-말단부를 암호화하는 뉴클레오티드 서열; (c) 공여 스플라이싱 부위; (d) 선택적 스페이서 서열; (e) 제1 결합 도메인; 그리고 (f) 선택적 종결 서열, 바람직하게 폴리 A 서열을 포함하는, 제1 AAV 벡터; (II) 도치된 말단 반복부 적어도 2개를 포함하며, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있고, 이 도치된 말단 반복부 2개 사이에 있는 상기 핵산 서열은 5' → 3' 방향으로 (i) 프로모터; (ii) 제1 AAV 벡터의 제1 결합 도메인에 상보성인 제2 결합 도메인; (ii) 선택적인 스페이서 서열; (iii)(a)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고; (ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역; (b) 피리미딘 대역에 대해 3'쪽에 위치하고; 5' → 3' 방향으로 서열 NAGG[여기서 N은 A, C, T/U 또는 G임]를 포함하는, 수여 스플라이싱 부위를 포함하는 수여 스플라이싱 영역 서열; (iv) 관심 폴리펩티드의 C-말단부를 암호화하는 뉴클레오티드 서열로서, (iva) 관심 폴리펩티드의 C-말단부와 관심 폴리펩티드의 N-말단부는 관심 폴리펩티드를 재구성하는 뉴클레오티드 서열; (v) 종결 서열, 바람직하게 폴리 A 서열을 포함하는 핵산 서열을 포함하는, 제2 AAV 벡터를 포함하는, AAV 벡터계의 일부일 수 있다. 일 구현예에서, 본 폴리펩티드는 전장 폴리펩티드이고, 제1 AAV 벡터는 관심 전장 폴리펩티드의 N-말단부를 포함하며, 제2 AAV 벡터는 관심 전장 폴리펩티드의 C-말단부를 포함한다.
(ia)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고, (ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역; (ib)ba) 이 피리미딘 대역에 대해 3'쪽에 위치하며, bb) 5' → 3' 방향으로 서열 NAGG[여기서 N은 A, C, T/U 또는 G임]를 포함하는 수여 스플라이싱 부위; 및 (ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽에 위치하는 관심 뉴클레오티드 서열을 포함하는 수여 스플라이싱 영역 서열을 포함하는 핵산 서열도 또한 제공된다.
본 발명에 따르는 임의의 구현예들에서, 본원에 기재된 수여 스플라이싱 영역은 피리미딘 대역을 포함하는데, 단 이 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT에 의해 암호화되는 서열을 포함한다. 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은, 바람직하게 10개 미만, 더욱 바람직하게 5개 미만, 더욱더 바람직하게 3개 미만의 염기를 가진다. 더욱이, 수여 스플라이싱 부위는, 바람직하게 서열 CAGG를 가진다. 수여 스플라이싱 영역은 서열 CAACGAG중 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽 뉴클레오티드 7개를 추가로 포함할 수 있는데, 단 5'쪽 처음 뉴클레오티드는 C이다. 바람직한 구현예에서, 스플라이싱 수여 영역은 서열 번호 3 또는 4의 서열을 포함하거나 이것으로 이루어져 있거나, 아니면 서열 번호 3 또는 4의 서열을 포함하거나 이것으로 이루어져 있는 핵산 서열에 의해 암호화된다.
도 1. HEK293 세포 및 형질도입된 광 수용기내 RHO 미니유전자의 mRNA 스플라이싱.
A. RHO 유전자를 정확히 축적하여 도시한 도해. 박스는 엑손을 나타내고, 그 사이 굵은 선은 인트론을 나타내며, 각각의 개시 코돈 및 종결 코돈이 명시되어 있다. 별표는 엑손 3에서의 c.620T>G 돌연변이를 표시한다. B 및 C. 엑손의 암호화 일부와, 이에 측접하는 인트론을 포함하는 로돕신 미니유전자는, HEK293 세포에서의 발현을 위해서는 CMV 프로모터에 의해 구동되었고(B), 또는 광 수용기에서의 발현을 위해서는 인간 로돕신(hRHO) 프로모터에 의해 구동되었다(C). RHO 미니유전자를 AAV 벡터에 팩키징할 수 있도록 만들기 위해, 인트론 1은 명시된 바와 같이 단축되었다. 단백질 시각화 및 검출을 위해, RHO는 C-말단쪽에서 시트린과 융합되었거나(B), myc-tag와 융합되었다(C). B와 C에서 화살표로 보인 프라이머는 HEK293 세포로부터 유래하거나(D) 형질도입된 광 수용기로부터 유래하는(E), 야생형(WT) 또는 돌연변이 스플라이싱 생성물의 특이적 검출을 위해 사용되었다. D. WT 및 돌연변이 RHO 미니유전자로 일시 형질감염된 HEK293 세포를 RT-PCR 분석한 결과. E, 좌측: 생후 14일차(P14)인 마우스의 망막으로 RHO 미니유전자를 망막하 전달하는 것에 관하여 도시한 도해. 우측: WT 또는 돌연변이 RHO 미니유전자 각각이 주사되어 함유된 마우스 망막을 RT-PCR 분석한 결과. RT-PCR은 주사후 4주차에 수행되었다. 모든 실험은 1회 반복되었다.
도 2. 가장 효율적인 ASS_620 서열의 동정
A. 기능성 ASS를 이루는 단일 요소의 구성. 분지점(BP)에는 인간 분지점에 대한 공통 서열을 나타내는 밑줄이 쳐있으며, 분지점 뉴클레오시드 아데노신에는 굵게 강조 표시되어 있다. 폴리피리미딘 대역(폴리-C/T)은 빈 박스로 표시되어 있으며, 인트론-엑손 경계에 확장된 ASS는 회색으로 채운 박스로 표시되어 있다. B, 인간 RHO 유전자의 엑손-인트론 조직으로서, 야생형(WT, 상단 패널) 및 c.620T>G 돌연변이체(하단 패널)에 대한 인간 RHO 유전자의 엑손 3 DNA 서열을 확대하여 보인 도면이다. 인트론 서열은 하단 케이스 안에 보였고, 엑손 서열은 상단 케이스 안에 (굵은) 글자로 보였다. 단일 ASS 요소에는 A에 보인 도식대로 강조 표시되어 있으며, BP 서열에는 밑줄(굵은 선)이 쳐있으며, 폴리-C/T 서열에는 빈 박스로 표시되어 있고, ASS 서열(들)에는 회색으로 채운 박스로 표시되어 있다. c.620T>G 돌연변이체내 AGG 서열로 전환된, WT내 ATG 서열에는 가는 선이 사용되어 밑줄이 쳐있다. c.620T>G 돌연변이는 신규의 표준 ASS 서열을 생성함에 주목한다. 기능성 ASS에 필요한 나머지 요소 2개(BP 및 폴리-C/T)는 이미 WT RHO 엑손 3에 존재한다. C, 스플라이싱 실험에 사용된 인간 리보좀 단백질 27(RPS27 ) 미니유전자의 구조. (D)에 보인 RT-PCR에 사용된 프라이머는 화살표로 표시된다. 이하에 보인 바와 같이, RHO_E3a-g라 칭하여지는 것으로서, ASS_620의 잠재적 요소를 함유하는 개별 서열은 명시된 바와 같이 RPS27 유전자의 엑손 3에 삽입되었다. RHO_E3a는 기능성 ASS가 결여된 WT RHO 서열이다. 잠재적 BP, 폴리-C/T 또는 ASS 서열은 상기와 같이 명시되어 있다. D, 명시된 바와 같이, 단일 키메라 RPS27 미니유전자로 형질감염된 HEK293 세포를 RT-PCR 분석한 결과. CS:(원산 엑손 3 ASS를 사용하여) 올바르게 스플라이싱된 RPS27 미니유전자, AS: (ASS_620을 사용하여) 비정상적으로 스플라이싱된 RPS27 미니유전자.
도 3. ASS_620은 강력한 수여 스플라이싱 부위이다.
A, 일반적으로 사용 가능한 예측 도구 2가지, 즉 NNSplice(0.9 버전; 1997년 1월)(http://www.fruitfly.org/seq_tools/splice.html) 또는 인간 스플라이싱 파인더(3.1 버전)(HSF, http://www.umd.be/HSF3/)이 사용된 인실리코 수여 스플라이싱 부위(ASS) 강도 예측. B, ASS, 폴리-C/T 및 폴리-C/T의 5'쪽 추가 뉴클레오티드 7개를 포함하는, 26 bp 서열인 단일 요소(vgASS_620이라 지칭됨)의 구성 및 서열. C, vgASS_620 강도를 확정하기 위해 사용된 상이한 미니유전자를 나타낸 도해. 단일 미니유전자내 vgASS_620의 삽입 위치는 별표 및 점선으로 표시되어 있다. D에 보인 RT-PCR을 위해 사용된 프라이머의 결합 위치는 화살표로 표시되어 있다. D, 원산(nat) 수여 스플라이싱 부위만을 함유하거나, 원산 수여 스플라이싱 부위와 vgASS_620(620)을 둘 다 함유하는 각각의 미니유전자로 형질감염된 HEK293 세포를 RT-PCR한 결과. 모든 밴드는 서열결정에 의해 검토되었다. E, 원산 수여 스플라이싱 부위 또는 vgASS_620을 이용하여 수득된 RT-PCR 생성물의 길이.
도 4. 상이한 결합 도메인들을 시험하는 세룰리안(cerulean) 재구성 검정법.
A, mRNA 트랜스-스플라이싱을 통한 세룰리안 재구성에서 결합 도메인으로 사용된 RHO 인트론 2 서열의 개략적 도해. RHO 인트론 2 서열 전체(a)뿐 아니라, 인트론 2의 상이한 5'부분(b, d, f, h) 및 3' 부분(c, e, g, i), 또는 소형 3'부분에 융합된 소형 5'부분(h+i)이 시험되었으며, 그 결과들이 B ~ G에 제공되었다. BC, 형질감염된 HEK293 세포를 대조 qRT-PCR(n=3)하여, A에 보인 상이한 결합 도메인을 포함하는 단일 구조체의 mRNA 수준을 비교하였다. 항존 아미노레불린산 신타아제(ALAS)에 관한 델타 CT(ΔCT) 값을 보인다. 프라이머 결합 위치(B: p1+p2, C: p3+p4)는 D에 표시되었다. 다중 비교를 위해 일원 ANOVA를 실시한 다음, Tukey 검정을 실시함으로써 통계 분석이 수행되었다(매회 형질감염마다 n=3). D, h+i 결합 도메인, 공여 스플라이싱 부위(DSS) 및 수여 스플라이싱 부위 ASS_620의 예가 사용되는 세룰리안 재구성 검정법의 원리. 세룰리안은, 점선으로 명시된 바와 같은 전장 세룰리안 서열(c1)의 개시 코돈 하류 154번 뉴클레오티드 위치에서 분할되었다. 대조군 구조체(c2)에서, 인공 인트론이 세룰리안 암호화 서열의 명시된 154번 위치에 도입되어, 인공 세룰리안 엑손 2개가 생성되었다. 웨스턴 블럿팅(Western blotting)에 사용된 항체(α-cerNT)는 세룰리안 절반의 N-말단에 결합한다. 대조군 구조체(c2)는 공초점 영상화 및 웨스턴 블럿팅 실험에서 정량 기준으로 사용되었다. 이중 벡터 접근법을 이용하여, (A)에 명시된 상이한 서열들을 결합 도메인으로서 시험하였다. 세룰리안 재구성을 위한 이중 벡터 접근법에 관한 도식은 vgASS_620 (c3) 또는 원산 RHO 엑손 3(RHO_E3) 수여 스플라이싱 부위(c4)와 함께 h+i 결합 도메인에 대해 예시로서 보인다. E, 상이한 결합 도메인의 세룰리안 재구성 효율(CRE)은 3회의 독립된 형질감염에서 수득된 웨스턴 블럿팅 밴드 진하기로부터 산정되었다. 정량을 위해 밴드 진하기는 처음에 내부 튜불린 대조군에 대해 정규화되었다. 정규화된 값은 기준 구조체(c2) 진하기의 백분율로서 제공된다. F, CMV 프로모터에 의해 구동된, c1, c2, c3 또는 c4 구조체가 형질감염된 HEK293 생세포에 관한 대표적 공초점 영상. 영상화를 위해 세룰리안 특이 레이저와 필터 세팅이 사용되었다, 축척 바 = 50 μm. G, 형질감염된 HEK293 세포의 단백질 용해물에 관한 대표적 웨스턴 블럿팅 결과(Ø, 미형질전환 세포; IB, 면역블럿팅; α-Tub, 베타-튜불린 특이 항체).
도 5. ABCA4의 5' 암호화 서열을 포함하는 제1 이중 AAV 서열(서열 번호 19): 5' 말단 및 3' 말단에 있는 ITR 서열에는 밑줄은 쳐있지 않고 회색으로 강조 표시되어 있다(NNN). 스페이서 서열은 소문자로 표시되어 있다. CMV 프로모터는 회색으로 강조 표시되어 있고, 실선이 사용되어 밑줄이 쳐있다(NNN). ABCA4 단백질의 5' 암호화 서열에는 점선이 사용되어 밑줄이 쳐있다
Figure pct00001
. DSS는 이탤릭체 글자로 표시되어 있고 밑줄이 쳐있다( Nnn , 여기서 대문자는 암호화 서열을 나타내고, 소문자는 비 암호화 서열을 나타냄). 결합 도메인에는 회색으로 강조 표시되어 있고, 파선이 사용되어 밑줄이 쳐있다
Figure pct00002
.
도 6. ABCA4의 3' 암호화 서열을 포함하는 제2 이중 AAV의 서열(서열 번호 20): 5' 말단 및 3' 말단에 있는 ITR 서열에는 회색으로 강조 표시되어 있되, 밑줄은 쳐있지 않다(NNN). 스페이서 서열은 소문자로 표시되어 있다. CMV 프로모터에 회색으로 강조 표시되어 있으면서, 실선이 사용되어 밑줄이 쳐있다(NNN). 결합 도메인에 회색으로 강조 표시되어 있으며, 파선이 사용되어 밑줄이 쳐있다
Figure pct00003
. 수여 스플라이싱 부위는 이탤릭체 글자로 표시되어 있으며, 밑줄이 쳐있다( NNN ). ABCA4 단백질의 3' 암호화 서열에는 점선이 사용되어 밑줄이 쳐있다
Figure pct00004
. 폴리 A 서열에는 진회색으로 강조 표시가 되어 있고, 물결선이 사용되어 밑줄이 쳐있다
Figure pct00005
.
도 7. ABCA4의 5' 암호화 서열 및 ABCA4 프로모터를 포함하는 제1 이중 AAV의 서열(서열 번호 21): 5' 말단 및 3' 말단에 있는 ITR 서열에 회색으로 강조 표시되어 있되, 밑줄은 쳐있지 않다(NNN). 스페이서 서열은 소문자로 표시되어 있다. ABCA4 프로모터에 회색으로 강조 표시되어 있으면서, 실선이 사용되어 밑줄이 쳐있다(NNN). ABCA4 단백질의 5' 암호화 서열에는 점선이 사용되어 밑줄이 쳐있다
Figure pct00006
. DSS는 이탤릭체 글자로 표시되어 있으며, 밑줄이 쳐있다( Nnn ; 대문자는 암호화 서열을, 소문자는 비 암호화 서열을 나타냄). 결합 도메인에는 파선이 사용되어 밑줄이 쳐있다
Figure pct00007
.
도 8. ABCA4의 3' 암호화 서열 및 ABCA4 프로모터(서열 번호 22)를 포함하는 제2 이중 AAV의 서열: 5' 말단 및 3' 말단에 있는 ITR 서열에 회색으로 강조 표시되어 있되, 밑줄은 쳐있지 않다(NNN). 스페이서 서열은 소문자로 표시되어 있다. ABCA4 프로모터에 회색으로 강조 표시되어 있으면서, 실선이 사용되어 밑줄이 쳐있다(NNN). 결합 도메인에 회색으로 강조 표시되어 있으며, 파선이 사용되어 밑줄이 쳐있다
Figure pct00008
. ASS는 이탤릭체 글자로 표시되어 있으며, 밑줄이 쳐있다( NNN ). ABCA4 단백질의 3' 암호화 서열에는 회색으로 강조 표시되어 있으며, 점선이 사용되어 밑줄이 쳐있다
Figure pct00009
. 폴리 A 서열에는 진한 회색으로 강조 표시가 되어 있고, 물결선이 사용되어 밑줄이 쳐있다
Figure pct00010
.
도 9. 수여 스플라이싱 부위 대 결합 도메인의 세룰리안 재구성 효율애 대한 영향력: A, 결합 도메인(BD) 및 수여 스플라이싱 부위(ASS)가 이 실험에서 시험되었다. BD 서열 모두는 인간 RHO 유전자로부터 기원한 것이다. 고효율을 보일 것으로 예상되는 BD 및 ASS는 굵은 이탤릭체 글자로 표시되어 있다. B, A에 보인 BD 3개와 ASS 3개의 상이한 조합들을 함유하는 구조체로 형질감염된 HEK293 세포의 공초점 라이브 영상. 각각의 BD 및 ASS의 강도가 명시되어 있다. 축척 바 = 50 μm. C, 상단 패널, 상이한 BD 및 ASS 조합의 RT-PCR 결과. 하단 패널, 상이한 BD 및 ASS 조합의 웨스턴 블럿팅 결과. GAPDH 및 베타 튜불린이 로딩 대조군으로 사용되었다. D, cis-ctrl과 관련된 세룰리안 단백질의 방사선 측정 분석에 의한 재구성 효율의 정량(n = 3 ~ 8). 단백질 밴드 모두는 베타 튜불린에 대해 정규화된 다음 정량되었다.
도 10. 생체내 mRNA 트랜스-스플라이싱 rAAV 이중 벡터 접근법
A, 5' 벡터 구조체 및 3' 벡터 구조체가 생체내 발현을 위해 사용되었다. 발현 대조군인 시트린 및 m체리 서열은, 세룰리안 5' 암호화 서열(CDS)의 5'쪽과 세룰리안 3' CDS의 3'쪽에 각각 융합되었다. B, BD_h+i를 함유하는 발현 구조체 주사후 2주차일 때의 망막 절편의 대표적 공초점 영상. 형광단 발현이 망막 색소 상피(RPE)에서 일어난다. ONL: 외핵층. 축척 바 = 20 μm. C, 시트린 및 m체리 형광단과 514 nm 레이저가 사용된 선택적 광표백 이전(상단 패널) 및 이후(하단 패널)의 RPE 세포의 공초점 영상. 축척 바 = 2 μm.
도 11. lacZ 유전자로부터 기원하는, 적합한 BD의 동정.
A, 세균lacZ 유전자로부터 취하여져, 검출 가능한 인간 게놈과의 상동성을 보유하지 않도록 변형된 결합 도메인(BD). B, A에 보인 BD를 함유하는 구조체로 일시 공동 형질감염된 HEK293 세포의 공초점 라이브 영상. 축척 바 = 50 μm. C, 형질감염된 HEK293 세포 용해물로부터 수득된 웨스턴 블럿팅 결과. D, 웨스턴 블럿팅 밴드의 진하기에 대한 방사선 분석을 기반으로 한, 세룰리안 재구성 효율의 정량(n = 3 ~ 8). BD_g 효율은 여태껏 수득된 최고 재구성에 대한 척도로 사용되었다(도 9 참조).
도 12. 조절 요소의 결실 및 mRNA 스플라이싱 효율에 미치는 영향.
A, BD_k. 5'polyAdel, 즉 폴리 A 신호가 없는 5' 벡터와, 3'promdel, 즉 프로모터 서열이 없는 3' 벡터를 함유하는 것으로 명시된 바와 같은 세룰리안 구조체로 일시 공동 형질감염된 HEK293 세포의 공초점 라이브 영상. B, A에 보인 형질감염 HEK293 세포로부터 얻어진 웨스턴 블럿팅 결과. 베타 튜불린이 로딩 대조군으로 사용되었다.
도 13. SpCas9-VPR의 재구성
A, HEK293 세포에서 SpCas9-VPR의 mRNA 트랜스-스플라이싱에 사용된 플라스미드(5' 벡터 및 3' 벡터). 양성 대조군으로서 전장(FL) SpCas9-VPR CDS를 함유하는 플라스미드(FL 벡터)가 사용되었다. 접합부 확장성 프라미어 쌍이 RT-PCR을 위해 사용되었다(검정색 화살표). B, BD_k 함유 5' 벡터 및 3' 벡터(n = 3) 또는 FL 벡터(n = 3)로 공동 형질감염된 HEK293 세포의 RT-PCR 결과. C, 재구성된 SpCas9-VPR 생성물의 대표적 서열결정 결과. D, 각각의 형질감염에서 유래한 단백질 용해물의 웨스턴 블럿팅 결과. Ø = 미형질감염 세포. 베타 튜불린이 로딩 대조군으로 사용되었다.
도 14. ABCA4의 재구성
A, HEK293 세포내 ABCA4의 mRNA 트랜스-스플라이싱을 위해 사용된 플라스미드(5' 및 3' 벡터). 추가로, 상이한 유전자 6개의 짧은 인트론 6개가 ABCA4의 CDS내에 통합되었는데, 즉 3개는 5' CDS에(인트론 함유 5' 벡터, 5'wi), 그리고 3개는 3' CDS에(인트론 함유 3' 벡터, 3'wi) 각각 통합되었다. 접합부 확장성 프라이머 쌍이 RT-PCR을 위해 사용되었다(검정색 화살표). myc, myc-태그. B, 명시된 바와 같은 각각의 구조체로 공동 형질감염된 HEK293 세포를 대상으로 상이한 회차수의 사이클로 진행된 RT-PCR 전개 결과. GAPDH는 로딩 대조군으로 사용되었다. Ø = 미형질감염 세포. C, 재구성된 ABCA4에 관한 대표적 서열결정 결과.
도 15. ABCA4의 생체내 rAAV 이중 벡터 mRNA 트랜스-스플라이싱
A. BD_k를 함유하는, 5' 벡터 구조체 및 3' 벡터 구조체가 생체내 발현을 위해 사용되었다. hRho = 인간 로돕신 프로모터. B, 명시된 바와 같은 각각의 구조체로 공동 형질감염된 C54Bl/6J 야생형 마우스의 망막 용해물을 대상으로 상이한 회차수의 사이클로 진행된 RT-PCR 결과. 미주사 야생형(WT) 마우스가 음성 대조군으로 사용되었다. NN/GL = AAV2의 캡시드 변이체. -RT = 역전사효소가 사용되지 않은 음성 대조군. GAPDH가 로딩 대조군으로 사용되었다. C, 재구성된 ABCA4의 대표적 서열결정 결과. D, B에 보인 망막과 동일한 망막을 대상으로 수행된 qRT-PCR의 예비 결과. 공동 형질도입을 통해 달성된 ABCA4 발현은 미주사 WT 망막에 대해 정규화되었다. E, B ~ D에 보인 마우스와 동일한 마우스의 망막 용해물을 대상으로 한 웨스턴 블럿팅 결과. 인간 ABCA4 단백질은 항 myc 항체에 의해 확인되었으며, 화살표 머리부분으로 명시되어 있다. 베타 튜불린이 로딩 대조군으로 사용되었다.
도 16. 세룰리안의 5' 암호화 서열과 결합 도메인 BD_g를 암호화하는 미니유전자의 서열(서열 번호 35). CMV 프로모터에는 회색으로 강조 표시되어 있다. 세룰리안 단백질의 5' 암호화 서열(굵은 글자)에는 회색으로 강조 표시되어 있으며, 굵은 실선이 사용되어 밑줄이 쳐있다
Figure pct00011
. DSS에는 물결선이 사용되어 밑줄이 쳐있다
Figure pct00012
. 결합 도메인은 이탤릭체 글자로 표시되어 있으며, 점선이 사용되어 밑줄이 쳐있으며
Figure pct00013
, 폴리아데닐화 신호에는 이중선이 사용되어 밑줄이 쳐있다
Figure pct00014
.
도 17. 세룰리안의 3' 암호화 서열과 결합 도메인 BD_g를 암호화하는 미니유전자의 서열(서열 번호 36). CMV 프로모터에는 회색으로 강조 표시되어 있다. 결합 도메인은 이탤릭체 글자로 표시되어 있으며, 점선이 사용되어 밑줄이 쳐있다
Figure pct00015
. ASS에는 물결선이 사용되어 밑줄이 쳐있으며, 굵은 글자로 표시되어 있다
Figure pct00016
. 세룰리안 단백질의 3' 암호화 서열에는 회색으로 강조 표시되어 있으며, 굵은 실선이 사용되어 밑줄이 쳐있고
Figure pct00017
, 폴리아데닐화 신호에는 이중선이 사용되어 밑줄이 쳐있다
Figure pct00018
.
도 18. SpCas9-VPR의 5' 암호화 서열과 결합 도메인 BD_k를 암호화하는 미니유전자의 서열(서열 번호 37). CMV 프로모터에는 회색으로 강조 표시되어 있다. SpCas9-VPR 단백질의 5' 암호화 서열은 굵은 글자로 강조 표시되어 있으며, 굵은 실선이 사용되어 밑줄이 쳐있다
Figure pct00019
. DSS에는 물결선이 사용되어 밑줄이 쳐있다
Figure pct00020
. 결합 도메인은 이탤릭체 글자로 표시되어 있으며, 점선이 사용되어 밑줄이 쳐있고
Figure pct00021
, 폴리아데닐화 신호에는 이중선이 사용되어 밑줄이 쳐있다
Figure pct00022
.
도 19a,19b. SpCas9-VPR의 3' 암호화 서열과 결합 도메인 BD_k를 암호화하는 미니유전자의 서열(서열 번호 38). CMV 프로모터에는 회색으로 강조 표시되어 있다. 결합 도메인은 이탤릭체 글자로 표시되어 있으며, 점선이 사용되어 밑줄이 쳐있다
Figure pct00023
. ASS에는 물결선이 사용되어 밑줄이 쳐있으며, 굵은 글자로 표시되어 있다
Figure pct00024
. SpCas9-VPR 단백질의 3' 암호화 서열에는 회색으로 강조 표시되어 있으며, 굵은 실선이 사용되어 밑줄이 쳐있고
Figure pct00025
, 폴리아데닐화 신호에는 이중선이 사용되어 밑줄이 쳐있다
Figure pct00026
.(도 19a 및 19b가 순서대로 결합되어 서열이 완성됨.)
도 20a,20b,20c. ABCA4의 5' 암호화 서열과 인트론을 포함하는 제1 이중 AAV의 서열(서열 번호 39): 5' 말단과 3' 말단의 ITR에는 회색으로 강조 표시되어 있되, 밑줄은 쳐있지 않다(NNN). 스페이서 서열은 소문자로 표시되어 있다. CMV 프로모터에는 회색으로 강조 표시되어 있으며, 실선이 사용되어 밑줄이 쳐있다
Figure pct00027
. ABCA4 단백질의 5' 암호화 서열에는 점선이 사용되어 밑줄이 쳐있되, 중간의 물결선은 인트론을 나타낸다
Figure pct00028
. DSS는 이탤릭체 글자로 표시되어 있고, 밑줄이 쳐있다( Nnn 에서, 대문자는 암호화 서열을 나타내고, 소문자는 비 암호화 서열을 나타냄). 결합 도메인에는 회색으로 강조 표시되어 있고, 파선이 사용되어 밑줄이 쳐있다
Figure pct00029
. 폴리 A 서열에는 진한 회색으로 강조 표시되어 있고, 물결선이 사용되어 밑줄이 쳐있다
Figure pct00030
.(도 20a.20b 및 20c가 순서대로 결합되어 서열이 완성됨.)
도 21a,21b,21c. ABCA4의 3' 암호화 서열을 포함하는 제2 이중 AAV의 서열(서열 번호 40): 5' 말단과 3' 말단의 ITR에는 회색으로 강조 표시되어 있되, 밑줄은 쳐있지 않다(NNN). 스페이서 서열은 소문자로 표시되어 있다. CMV 프로모터에는 회색으로 강조 표시되어 있으며, 실선이 사용되어 밑줄이 쳐있다(NNN). 결합 도메인은 회색으로 강조 표시되어 있으며, 파선이 사용되어 밑줄이 쳐있다
Figure pct00031
. 수여 스플라이싱 부위는 이탤릭체 글자로 표시되어 있으며, 밑줄이 쳐있다( NNN ). ABCA4 단백질의 3' 암호화 서열에는 점선이 사용되어 밑줄이 쳐있되, 중간의 물결선은 인트론을 나타낸다
Figure pct00032
. 폴리 A 서열에는 진한 회색으로 강조 표시되어 있으며, 물결선이 사용되어 밑줄이 쳐있다
Figure pct00033
.(도 21a.21b 및 21c가 순서대로 결합되어 서열이 완성됨.)
본 발명자들은 실시예에 기재된 바와 같은 신규 수여 스플라이싱 영역을 발견하였다. 이 수여 스플라이싱 영역은 매우 효율적이고, 스플라이싱이 활용되는 다양한 적용예에 사용될 수 있다. 그러므로 본 발명의 수여 스플라이싱 영역은 특히 분할 AAV 벡터, 2개의 AAV 벡터 및/또는 트랩 벡터(trap vector)를 포함하는 AAV 벡터계 재구성을 위한 트랜스-스플라이싱, 시스-스플라이싱, 전 mRNA 트랜스-스플라이싱 분자가 사용되는 SMaRT 기술(스플라이세오좀 매개 RNA 트랜스-스플라이싱)에 사용될 수 있다. 그러나, 본원에 기재된 바와 같은 수여 스플라이싱 영역은 또한 스플라이싱이 요망되는 임의의 추가 적용예에 사용될 수도 있다.
본 발명은
(i)(ia)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[단 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열; 및
(ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽, 바람직하게 수여 스플라이싱 영역에 대해 3'쪽에 위치하는 관심 뉴클레오티드 서열
을 포함하는 핵산 서열에 관한 것으로서, 본 발명에 따른 핵산 서열은, 바람직하게 수여 스플라이싱 영역에서 절단되고, 수여 스플라이싱 영역 서열로부터 관심 뉴클레오티드 서열이 분리된다.
본 발명은 또한 수여 스플라이싱 영역에서의 절단에 의해 수여 스플라이싱 영역 서열로부터 관심 뉴클레오티드 서열을 분리하기 위한, 상기 핵산 서열의 용도에 관한 것이기도 하다.
"핵산 분자", "핵산 서열" 또는 "뉴클레오티드 서열"이란 용어는 본원에서 유의어로 사용되고 있으며, 상기 핵산 분자/서열에 의해 포함되는 관계로 핵산 분자의 1차 구조를 나타내는 퓨린 및 피리미딘 염기들을 포함하는 뉴클레오티드 서열을 가지는 임의의 핵산 분자를 포함한다. 핵산 서열은 DNA, cDNA, 게놈 DNA, RNA의 센스 가닥 및 안티센스 가닥 둘 다를 포함할 수 있다. 본 RNA는, 예를 들어 전 mRNA, mRNA, tRNA 또는 Rrna일 수 있다. 본 발명의 폴리뉴클레오티드는 비변형 RNA 또는 DNA이거나, 변형 RNA 또는 DNA일 수 있는 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드로 구성될 수 있다. 당 업자는 폴리데옥시뉴클레오티드의 티민(T)은 폴리리보뉴클레오티드의 우라실(U)로 전사됨을 이해할 것이다. 본원에 언급된 서열들은, 통상 (임의의 스플라이싱 과정 이전의) 대응 RNA 서열로 전사될 수 있는 DNA 서열로서 제공된다. 따라서, T를 포함하는 핵산 서열은 또한 대응하는(전사된) RNA 서열, 바람직하게는 U를 포함하는 전 mRNA 서열을 개시하는 것이다.
DNA 및 RNA에 다양한 변형이 일어날 수 있으므로; "핵산 분자" 또는 "뉴클레오티드"란 용어는 화학적으로 변형되었거나, 효소에 의해 변형되었거나, 또는 대사 변형된 형태를 포함할 수 있다. "변형된" 염기/뉴클레오티드로서는, 예를 들어 트리틸화 염기 및 희귀 염기, 예컨대 이노신을 포함한다.
본 발명의 수여 스플라이싱 영역 서열은 2가지 특징을 포함하는데, 즉 수여 스플라이싱 부위와 피리미딘 대역이 그것이다. 피리미딘 대역은 5개 ~ 25개의 뉴클레오티드를 포함하고, 이 (전체) 5개 ~ 25개의 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)이다. 이 피리미딘 대역은 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개 또는 25개, 바람직하게는 10개 ~ 18개, 더욱 바람직하게는 12개 ~ 16개의 뉴클레오티드를 포함함도 또한 상상된다. 추가로, 또는 대안적으로 이처럼 (전체) 5개 ~ 25개의 뉴클레오티드중 뉴클레오티드의 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)이다. 예를 들어 피리미딘 대역은 6개의 뉴클레오티드를 포함할 수 있다. 피리미딘 대역은 서열 TTTTTT를 포함하거나 이것으로 이루어짐도 또한 상상된다. 피리미딘 대역은 서열 TCTTTT를 포함하거나 이것으로 이루어짐도 추가로 고려된다. 피리미딘 대역은 서열 TTTTTTGTCATTT(서열 번호 11)를 포함하거나 이것으로 이루어짐도 추가로 고려된다. 피리미딘 대역은 서열 TCTTTTGTCATCTA(서열 번호 12)를 포함하거나 이것으로 이루어짐도 추가로 고려된다. 피리미딘 대역 앞에는 7개의 뉴클레오티드가 있음과 아울러, 서열 CAACGAGTCTTTTGTCATCTA(서열 번호 13)을 포함하거나 이것으로 이루어짐도 추가로 고려된다. 피리미딘 대역은 또한 서열 TCTTTTGTCATCT(서열 번호 1)을 포함하거나 이것으로 이루어져 있을 수 있다. 본원에 기재된 바와 같은 피리미딘 대역은 서열 번호 1, 11, 12 또는 13의 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열 또는 서열 TTTTTT 또는 TCTTTT를 가짐도 또한 고려된다. 일 구현예에서, 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT를 포함한다. 바람직하게 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은 10개 미만, 바람직하게 5개 미만, 더욱 바람직하게 3개 미만의 염기를 가진다. "피리미딘 대역"이란 용어는, 본원에서 "폴리-피리미딘 대역"과 호환되어 사용되고, PPT 또는 폴리 C/T로 축약될 수 있다. "피리미딘 대역의 마지막 피리미딘"이란, 피리미딘 대역의 5개 ~ 25개 뉴클레오티드중 가장 3'쪽에 있는 피리미딘을 지칭한다.
본 발명에 따르면, 2개 이상의 핵산 분자에 관한 내용 중 "동일한" 또는 "동일성%"란 용어는, 당 분야에 공지된 서열 비교 알고리즘을 이용하여 측정되거나 수동식 정렬 및 시각적 관찰에 의해 측정된 바에 따르면, 비교 윈도우 또는 지정된 영역에 걸쳐 최대 대응도를 보이며 비교 및 정렬되었을 때 2개 이상의 서열 또는 종속 서열이 동일하거나, 또는 동일한 뉴클레오티드를 특정의 백분율만큼 가지는(예컨대 적어도 95%, 96%, 97%, 98% 또는 99%의 동일성을 가지는) 경우를 지칭한다. 예를 들어 80% ~ 95%, 또는 이 이상의 서열 동일성을 가지는 서열은 실질적으로 동일한 것으로 간주된다. 이러한 정의는 또한 시험 서열의 상보체에도 적용된다. 당 업자들은, 예를 들어 당 분야에 공지된 바와 같은 CLUSTALW 컴퓨터 프로그램 기반 알고리즘(Thompson Nucl. Acids Res. 2 (1994), 4673-4680) 또는 FASTDB 기반 알고리즘(Brutlag Comp. App. Biosci. 6 (1990), 237-245)과 같은 알고리즘을 이용하여 2개의 서열들 간/3개 이상의 서열들 간 동일성%를 확정하는 방법을 알 것이다.
당 업자는 BLAST 및 BLAST 2.0 알고리즘(Altschul Nucl. Acids Res. 25 (1977), 3389-3402)도 또한 이용 가능하다. 핵산 서열용인 BLASTN 프로그램은 디폴트값으로서 문자 크기(W) 28, 예상 역치값(E) 10, 매칭/미스매칭 스코어 1, -2, 갭 코스트(선형) 및 두 가닥 비교를 이용한다. 아미노산 서열용인 BLASTP 프로그램은 디폴트값으로서 문자 크기(W) 6, 예상 역치값(E) 10을 적용하고, 갭 코스트는 실존(Existence) 11 및 연장(Extension) 1을 이용한다. 게다가 BLOSUM62 점수매김 매트릭스(Henikoff Proc. Natl. Acad. Sci., USA, 89, (1989), 10915)가 이용될 수 있다.
예를 들어 기본 국소 정렬 검색 툴(Basic Local Alignment Search Tool)(Altschul, Nucl. Acids Res. 25 (1997), 3389-3402; Altschul, J. Mol. Evol. 36 (1993), 290-300; Altschul, J. Mol. Biol. 215 (1990), 403-410)을 대표하는 BLAST2.0은 국소 서열 정렬을 검색하기 위해 사용될 수 있다.
본원에 개략적으로 기재되어 있는 바와 같이, 피리미딘 대역에 더하여, 본 발명의 수여 스플라이싱 영역 서열은 수여 스플라이싱 부위를 포함한다. 본원에 사용된 바와 같이 "수여 스플라이싱 부위"는 당 업자에게 공지된 의미, 특히 문헌[Alberts B, Johnson A, Lewis J, et al. (2002) "Molecular Biology of the Cell. 4th edition." New York: Garland Science under the headline "from DNA to RNA"]에 기재된 의미를 가진다. 본 발명의 수여 스플라이싱 부위는 뉴클레오티드 NAGG, 바람직하게는 CAGG 또는 CAGGT(또는 RNA의 CAGG 또는 CAGGU)를 포함하거나 이것으로 이루어져 있다. 수여 스플라이싱 부위는 보통 "수여 스플라이싱 영역"으로 정의되는 서열내에 위치한다. 본원에 사용된 바와 같은 "수여 스플라이싱 부위"(ASS라고 축약)란 용어는, 공통 수여 스플라이싱 서열을 지칭하고, "스플라이싱 수여 부위"(SAS라고 축약)라 지칭될 수도 있다. 이 발명의 내용에 있어, "수여 스플라이싱 영역" 및 "수여 스플라이싱 부위"란 용어는, 영역과 공통 수여 스플라이싱 부위를 구별하기 위한 변별적 용어로 사용되는데, 여기서 이 수여 스플라이싱 영역은 수여 스플라이싱 부위를 포함한다. 문헌에서, 수여 스플라이싱 영역뿐 아니라, 수여 스플라이싱 부위는 ASS 또는 SAS라 지칭될 수 있다.
수여 스플라이싱 부위는 수여 스플라이싱 부위라 칭하여지는데, 그 이유는 이 부위에서 핵산은 소위 스플라이세오좀 또는 이의 인공 변이체에 의해 절단되기 때문이다. 스플라이세오좀과, 이것이 어떻게 작동하는지도 또한 당 업자에게 공지되어 있다. 인간 스플라이세오좀의 구조는, 예를 들어 문헌[Zhang et al. (2017) "An atomic structure of the human spliceosome" Cell 169, 918-926]에 기재되어 있다. 인공 스플라이세오좀은, 예컨대 스플라이세오좀으로서의 스플라이싱 부위에 대한 동일한 절단을 매개하는 효소를 포함한다. 인공 스플라이세오좀은 문헌[Coppins and Silvermann (2005) "Mimicking the First Step of RNA Splicing: An Artificial DNA Enzyme Can Synthesize Branched RNA Using an Oligonucleotide Leaving Group as a 5'-Exon Analogue" Biochemistry, 44 (41), pp 13439-13446] 및 문헌[Muller (2017) "Design and Experimental Evolution of trans-Splicing Group I Intron Ribozymes." Molecules. 22(1). p11: E75. doi: 10.3390/molecules22010075]에 기재된 바와 같은 DNA 효소를 포함할 수 있다. 본원에 기재된 바와 같은 수여 스플라이싱 부위는 서열 NAGG를 가지는데, 여기서 N은 임의의 뉴클레오티드일 수 있다. 예를 들어 N은 A, C, T, G 또는 U로부터 선택되는 뉴클레오티드이다. 본원에 기재된 바와 같은 수여 스플라이싱 부위는 또한 서열 CAGG를 가질 수 있다. 본원에 기재된 바와 같은 수여 스플라이싱 부위는 또한 서열 CAGGT(또는 RNA에 대해서는 CAGGU)를 가질 수 있다.
본 발명의 수여 스플라이싱 부위에서의 절단은 단편 2개, 즉 NAGG 및/또는 NAGGT 스플라이싱 부위의 NAG를 포함하는 단편 하나 또는 CAGG 스플라이싱 부위 및/또는 CAGGT 스플라이싱 부위의 CAG를 포함하는 단편 또 하나를 만들어낸다. 또 다른 단편은 NAGG 또는 CAGG 스플라이싱 부위의 마지막 G, 또는 NAGGT 또는 CAGGT 스플라이싱 부위의 마지막 GT를 포함한다. 그러므로 본원에 기재된 바와 같은 용도, 핵산 서열, AAV 벡터, AAV 벡터계 및 방법에서 (절단/스플라이싱 이후) 최종적으로 수득된 (관심) 뉴클레오티드 서열은 NAGG 또는 CAGG 서열의 마지막 G, 또는 NAGGT 또는 CAGGT 서열의 GT를 포함함이 상상된다. 당 업자는 본원에 언급된 스플라이싱이 RNA 수준에서 발생하므로, (절단/스플라이싱 이후) 최종적으로 수득된 (관심) RNA 뉴클레오티드 서열은 NAGG 또는 CAGG 서열의 마지막 G, 또는 전 mRNA 뉴클레오티드 서열의 CAGGU 서열의 GU를 포함함을 이해할 것이다. 그러나, 본 방법과 용도에서 (관심) 최종 핵산 서열은 NAGG 스플라이싱 부위 서열의 NAG, 및/또는 CAGG 또는 CAGGT 스플라이싱 부위 서열의 CAG를 포함함도 또한 고려된다. 그러므로, 수여 스플라이싱 부위에서의 절단은, NAGG, CAGG 및/또는 CAGGT(또는 CAGGU)의 수여 스플라이싱 부위 서열의 G와 G 사이를 절단함으로써, 인트론 수여 스플라이싱 영역 서열로부터 (관심) 뉴클레오티드 서열을 분리하는 단계를 포함함이 상상된다.
본 발명의 수여 스플라이싱 영역은, 특히 트랜스-스플라이싱이면서 시스-스플라이싱이기도 한 적용, 또는 기타 임의의 스플라이싱에서 사용될 수 있다. 스플라이싱의 발생은, 예컨대 문헌[Berger et al. (2016) "mRNA trans-splicing in gene therapy for genetic diseases" WIREs RNA 7: 487-498]에 기재된 바와 같이 측정될 수 있다. 예를 들어 스플라이싱된 뉴클레오티드 서열은 스플라이싱된 관심 생성물을 구별하는데 특이적 프라이머 및 프로브가 사용되는 종점 정량 RT-PCR(end-point quantitative RT-PCR)에 의해 정량될 수 있다. 본원의 실시예에 기재된 바와 같이 추가의 스플라이싱 측정이 수행될 수 있다. 예를 들어 스플라이싱은 문헌[Orengo et al. (2006) "A bichromatic fluorescent reporter for cell-based screens of alternative splicing." Nucleic Acids Research 34(22):e148]에 기재된 바와 같이 마커 유전자를 사용하여 측정될 수 있다. 추가의 스플라이싱은 문헌[Berger et al., (2016) "Repair of rhodopsin mRNA by spliceosome-mediated RNA trans-splicing: a new approach for autosomal dominant retinitis pigmentosa.", Mol Ther.; 23(5):918-930]에 기재된 바와 ??은 제한 효소 분석을 이용하여 확인될 수 있다.
수여 스플라이싱 부위가 전 mRNA에 존재할 때, 이 부위는 통상적으로 인트론의 3' 말단과 그 다음 엑손의 5' 말단에 대응한다. 인공적으로 수여 스플라이싱 부위, 바람직하게 수여 스플라이싱 영역이 도입될 때, 수여 스플라이싱 부위가 반드시 인트론-엑손의 경계에 위치할 필요는 없지만, 이 수여 스플라이싱 부위는 개방 해독틀, 인트론 내부, 또는 완전 또는 부분 개방 해독틀 5' 말단에 위치할 수도 있다. 수여 스플라이싱 부위는 인트론의 5' 말단에 위치함도 또한 상상된다. 수여 스플라이싱 부위는 전 mRNA 분자에 위치하지 않고, 인공 분자, 예컨대 임의의 핵산 분자 내부에 위치함도 또한 상상된다.
본 발명의 수여 스플라이싱 부위는 수여 스플라이싱 영역에 포함된다. 특히 본 발명의 수여 스플라이싱 부위는 피리미딘 대역에 대해 3'쪽에 위치한다.
수여 스플라이싱 영역(또는 수여 스플라이싱 부위 모듈)은 분지점 및/또는 분지점 서열을 추가로 포함할 수 있다. 원칙적으로 임의의 적합한 분지점 또는 분지점 서열은 본 발명에 의해 고려된다. 예시적 분지점(들) 또는 분지점 서열(들)은 특히 문헌[Gao et al. (2008) "Human branch point consensus sequence is yUnAy" Nucleic Acid Research, vol. 36, no. 7, pp. 2257-2267; Mercer et al. (2016) "Genome-wide discovery of human splicing branch points" Genome Research 25: 290-303]에 기재되어 있다.
예를 들어 분지점 서열은 서열 UACUA A C를 포함할 수 있거나, 또는 이것으로 이루어질 수 있다. 추가로, 또는 대안적으로, 분지점 서열은 서열 YNYUR A Y[여기서 Y는 U 또는 C이고, R은 A 또는 G임]를 포함할 수 있거나 또는 이것으로 이루어질 수 있다. 추가로, 또는 대안적으로, 분지점 서열은 서열 YNCUR A C[여기서 Y는 U 또는 C이고, R은 A 또는 G임]를 포함하거나 또는 이것으로 이루어질 수 있다. 추가로, 또는 대안적으로, 분지점 서열은 서열 YNCUR A Y[여기서 Y는 U 또는 C이고, R은 A 또는 G임]를 포함하거나 또는 이것으로 이루어질 수 있다. 추가로, 또는 대안적으로, 분지점 서열은 서열 CUR A Y[여기서 Y는 U 또는 C이고, R은 A 또는 G임]를 포함하거나 또는 이것으로 이루어질 수 있다. 추가로, 또는 대안적으로, 분지점 서열은 서열 YUV A Y[여기서 Y는 U 또는 C이고, R은 A 또는 G이며, V는 A, C 또는 G임]를 포함하거나 또는 이것으로 이루어질 수 있다. 추가로, 또는 대안적으로, 분지점 서열은 서열 CUS A Y[여기서 Y는 U 또는 C이고, S는 G 또는 C임]를 포함하거나 또는 이것으로 이루어질 수 있다. 추가로, 또는 대안적으로, 분지점 서열은 서열 CUG A C를 포함하거나 또는 이것으로 이루어질 수 있다. 추가로, 또는 대안적으로, 분지점 서열은 서열 CUA A C를 포함할 수 있거나 또는 이것으로 이루어질 수 있다. 분지점은 C/U-U-N- A -C/U, CAACGA 또는 CUC A A 또는 GUC A A의 분지점 서열내에 존재할 수 있다[단 여기서 분지점 서열은 각각의 DNA 서열 C/T-T-N- A -C/T, CAACGA 또는 CTC A A 또는 GTC A A에 의해 암호화됨]. 각각의 서열 모두에서 밑줄이 쳐진 아데노신은 분지점 뉴클레오티드를 나타낸다.
본 발명의 수여 스플라이싱 영역은 분지점 뉴클레오티드 서열(c)을 추가로 포함할 수 있는데, 여기서 이 분지점 뉴클레오티드 서열은
(ca) 1개 ~ 15개의 뉴클레오티드를 포함하고;
(cb) 분지점 뉴클레오티드, 바람직하게 아데노신(A)을 포함하며;
(cc) 피리미딘 대역 및 수여 스플라이싱 부위에 대해 5'쪽에 위치한다.
분지점 서열은 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개 또는 이 이상의 뉴클레오티드를 포함함도 또한 고려된다. 분지점 서열은 6개 ~ 8개의 뉴클레오티드를 포함함도 또한 고려된다. 분지점 서열은 8개의 뉴클레오티드를 포함함도 또한 상상된다. 그러나 주목할 점은, 분지점 서열의 뉴클레오티드들은 일렬로 존재할 수 있다는 점인데, 이는 이 뉴클레오티드가 왜 총 15개 이상, 예컨대 30개(15개 + 15개), 40개, 50개, 100개, 200개 또는 이 이상의 뉴클레오티드를 포함할 수 있는지를 설명해준다.
분지점 뉴클레오티드는 임의의 뉴클레오티드일 수 있다. 그러므로, 분지점 뉴클레오티드는 A(아데노신), T(티민), G(구아닌), C(시토신) 및 U(우라실)중 임의의 것일 수 있다. 바람직하게 분지점 뉴클레오티드는 A(아데노신)이다. 분지점 뉴클레오티드는 분지점 서열내에 위치한다.
수여 스플라이싱 영역은 추가로, 또는 대안적으로 인트론 스플라이싱 인핸서를 포함할 수 있다. 이러한 스플라이싱 인핸서는 당 업자에게 공지되어 있으며, 특히 문헌[Wang et al. (2012) "Intronic splicing enhancers, cognate splicing factors and context-dependent regulation rules" Nature Structural & Molecular Biology, vol. 19, no. 10, pp. 1044-1053]에 기재되어 있다. 두 가지 예로서는 스플라이싱 인핸서 서열 "AACG"(F군) 및 "CGAG"(D군)가 있다. 그러나, 임의의 적합한 인트론 스플라이싱 영역이 이 용어에 포함된다.
예시적 인트론 스플라이싱 인핸서는 서열 TGGGGGGAGG(서열 번호 2)를 가진다. 또 다른 예시적 인트론 스플라이싱 인핸서는 서열 GTAACGGC를 가진다. 인트론 스플라이싱 인핸서는 서열 AACG를 가짐도 또한 고려된다. 본원에 기재된 바와 같은 수여 스플라이싱 영역은 서열 번호 2와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열, GTAACGGC 또는 AACG를 가짐도 또한 고려된다.
본 발명의 수여 스플라이싱 영역은, 바람직하게 폴리피리미딘 대역에 대해 5'쪽에 약 7개의 뉴클레오티드(예컨대 5개 ~ 12개, 바람직하게 6개 ~ 10개, 더욱 바람직하게 6개 ~ 8개 뉴클레오티드)를 추가로 포함한다. 바람직한 구현예에서, 수여 스플라이싱 영역은 (a) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임]; (b) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임]; (c) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임]; (d) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임]; (e) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]; (f) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임]; (g) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]; (h) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임]; (i) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]; 또는 (j) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개를 추가로 포함한다. 이론에 국한되지 않을 때, 이 서열은 스플라이싱 인핸서로서 작용할 수 있다.
수여 스플라이싱 영역은 1개, 2개, 3개, 4개, 5개 또는 이 이상의 상이한/동일한 분지점 서열을 포함함도 추가로 상상된다. 수여 스플라이싱 영역은 1개, 2개, 3개, 4개, 5개 또는 이 이상의 상이하거나 동일한 인트론 스플라이싱 인핸서(서열)를 포함함도 추가로 상상된다.
피리미딘 대역, 수여 스플라이싱 부위, 그리고 선택적으로는 추가의 분지점 서열 및/또는 인트론 스플라이싱 앤핸서, 즉 전체 수여 스플라이싱 영역은 총 약 1000개, 500개, 250개, 100개, 50개, 45개, 40개, 35개, 30개, 25개, 20개, 15개 또는 이 이하, 바람직하게 26개의 뉴클레오티드를 포함함이 상상된다.
몇몇 구현예들에서, 특정 수여 스플라이싱 부위에 의해 사용되는 분지점 서열 또는 분지점 뉴클레오티드에는 융통성이 있을 수 있다. 이는, 상이한 분지점이, 예컨대 3개 이상, 5개 이상, 7개 이상, 9개 이상 또는 11개 이상 사용될 수 있음을 의미한다. 일 구현예에서, 각각의 분지점의 사용 빈도는 30% 미만이거나 20% 미만이다. 특이적 수여 스플라이싱 부위에 의해 사용되는 분지점 서열 또는 분지점 뉴클레오티드의 선택에 융통성이 있는 경우, 수여 스플라이싱 영역의 강도는 특이적으로 함유된 분지점 서열 또는 분지점 뉴클레오티드의 존재로부터 기인하지 않고, 그에 의존적이지도 않다. 임의의 분지점 서열 또는 분지점 뉴클레오티드를 사용하는 것에 대한 융통성은, 이 수여 스플라이싱 영역을 매우 효율적이면서 다재다능하고, 특히나 효율적인 스플라이싱이 서열 독립적 방식으로 유도되도록 상이한 핵산 서열에 사용하기 적합하도록 만들 수 있다.
본원에 기재된 바와 같고, 핵산에 존재하는 바와 같은 수여 스플라이싱 영역, 그리고 본 발명에 따른 방법에 사용되는 바와 같은 전 mRNA 트랜스-스플라이싱 분자, AAV 벡터 및 AAV 벡터계는, 수여 스플라이싱 부위 및 폴리피리미딘 대역을 포함하고, 나아가 폴리피리미딘 대역의 5'쪽 뉴클레오티드를 포함한다. 바람직한 구현예에서, 수여 스플라이싱 영역은 폴리피리미딘 대역에 대해 5'쪽으로 약 7개의 뉴클레오티드(예컨대 5개 ~ 12개, 바람직하게 6개 ~ 10개, 더욱 바람직하게 6개 ~ 8개 뉴클레오티드)를 포함한다. 특히 바람직한 구현예에서, 수여 스플라이싱 영역은 폴리피리미딘 대역에 대해 5'쪽에 서열 CAACGAG를 포함한다. 수여 스플라이싱 부위, 폴리피리미딘 대역, 그리고 추가로 폴리피리미딘 대역의 5'쪽 뉴클레오티드, 바람직하게 폴리피리미딘 대역의 5'쪽 추가 뉴클레오티드 약 7개를 포함하는 수여 스플라이싱 영역은 최소한의 수여 스플라이싱 영역으로서 작용하고, 임의의 핵산 서열에 삽입되어 매우 유력한 기능성 수여 스플라이싱 영역을 도입할 수 있다.
본 발명의 수여 스플라이싱 영역은 서열 CAACGAGTCTTTTGTCATCTACAGGT(서열 번호 3)를 포함하거나 이것으로 이루어져 있음이 추가로 상상된다. 본 발명의 수여 스플라이싱 부위는 서열 CAACGAGTTTTTTGTCATCTACAGGT(서열 번호 4)을 포함하거나 이것으로 이루어져 있음도 또한 고려된다. 수여 스플라이싱 영역은 CTACACGCTCAAGCCGGAGGTCAACAACGAGTCTTTTGTCATCTACAGGT(서열 번호 5), GCCGGAGGTC A ACAACGAGTCTTTTGTCATCTACAGGT(서열 번호 6), GTCTTTTGTCATCTACAGGT(서열 번호 7), GTCTTTTGTCATCTACAGGTGTTCGTG(서열 번호 26) 또는 GTCTTTTGTCATCTACAGGTGTTCGTGGTTCGTGGTCCA(서열 번호 8)중 임의의 것을 포함하거나 이것으로 이루어져 있음도 또한 상상된다. 바람직하게 본 발명의 수여 스플라이싱 영역은 서열 CAACGAGTCTTTTGTCATCTACAGGT(서열 번호 3) 또는 CAACGAGTTTTTTGTCATCTACAGGT(서열 번호 4)을 포함하거나 이것으로 이루어져 있다(또는 이 서열 CAACGAGTCTTTTGTCATCTACAGGT(서열 번호 3) 또는 CAACGAGTTTTTTGTCATCTACAGGT(서열 번호 4)을 포함하거나 이것으로 이루어져 있는 핵산 서열에 의해 암호화된다).
본원에 기재된 바와 같은 수여 스플라이싱 영역은 서열 번호 3, 4, 5, 6, 7, 26 또는 8중 임의의 하나의 임의의 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 가짐도 또한 고려된다. 바람직하게 수여 스플라이싱 영역은 서열 번호 3, 4, 5, 6, 7, 26 또는 8중 임의의 하나의 임의의 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일하거나, 더욱 바람직하게 서열 번호 3 또는 4의 임의의 서열과 적어도 85%, 90%, 95%, 97%, 98%, 99% 또는 100% 동일하거나, 더욱더 바람직하게 서열 번호 3 또는 4의 임의의 서열과 적어도 90%, 95%, 97%, 98%, 99% 또는 100% 동일한 뉴클레오티드 서열을 포함한다.
본 발명에 따른 핵산 서열은 수여 스플라이싱 부위에 더하여 관심 뉴클레오티드 서열을 추가로 포함할 수 있다. 관심 뉴클레오티드 서열은 임의의 적합한 뉴크ㄹ레오티드 서열일 수 있다 "관심 뉴클레오티드 서열" 및 "관심 핵산 서열"이란 용어는 본원에서 호환되어 사용된다. 통상적으로, 이 용어는 본 발명에 따른 핵산 서열 또는 핵산 분자와 더 잘 구별되도록 "관심 뉴클레오티드 서열"이라 지칭된다. 예를 들어 관심 뉴클레오티드 서열은 인트론 또는 엑손 뉴클레오티드 서열일 수 있거나, 또는 인트론 서열 및 엑손 서열(즉 비 암호화 서열 및 암호화 서열) 둘 다를 포함할 수 있다. 관심 뉴클레오티드 서열은 cDNA, mRNA, rRNA 또는 tRNA임도 또한 고려된다. 관심 뉴클레오티드 서열 또는 이의 일부는 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽, 바람직하게는 3'쪽에 위치할 수 있다. 임의의 구현예들에서, 핵산 서열, 전 mRNA 트랜스-스플라이싱 분자, AAV 벡터, AAV 벡터중 임의의 것에 포함되는 것과 같은 관심 뉴클레오티드 서열 또는 이의 일부, 또는 본 발명에 따른 방법들중 임의의 방법에 사용되는 것과 같은 관심 뉴클레오티드 서열 또는 이의 일부는 이식유전자 또는 그의 일부일 수 있다. 스플라이싱 효율, 구체적으로 트랜스-스플라이싱 효율은 관심 뉴클레오티드 서열 또는 이의 일부에 인트론이 존재하게 될 때 개선될 수 있음이 확인된 바 있다. 구체적으로 1000 bp를 초과하는 관심 뉴클레오티드 서열 또는 이의 일부는 그 서열에 인트론을 도입하거나 유지시키는 것이 유리할 수 있다. 바람직하게 인트론은 관심 뉴클레오티드 서열 또는 이이 일부의 약 200 bp ~ 1000 bp마다 존재하지만, 서열 간격은 이보다 더 짧거나 더 길 수도 있다. 인트론은 관심 뉴클레오티드 서열 및/또는 상이한 유전자 및/또는 인공물로부터 기원할 수 있다.
본원에 사용된 바와 같은 관심 뉴클레오티드 서열(관심 핵산 서열이라고도 지칭됨)은 또한, 암호화 서열, 예컨대 관심 폴리펩티드 또는 이의 일부를 암호화하는 서열일 수도 있다. 바람직한 구현예에서, 관심 뉴클레오티드 서열은 암호화 서열, 더욱 바람직하게는 이식유전자, 관심 폴리펩티드 또는 이의 일부를 암호화하는 서열이다.
관심 뉴클레오티드 서열은 치료 폴리펩티드, 치료 핵산(예컨대 치료 RNA) 또는 이의 일부를 암호화함도 또한 본 발명에 의해 추가로 상상된다.
치료 핵산 또는 치료 폴리펩티드는 안 장애, 예컨대 상염색체 열성 중증 조기 발병 망막변성증(레버(Leber) 선천성 흑내장), 선천성 색맹, 스타가르트(Stargardt)병, 베스트(Best)병(노른자 황반변성), 도인(Doyne)병, 망막색소변성증(구체적으로 상염색체 우성, 상염색체 열성, X-연관 이유전자 또는 다유전자 망막색소변성증), (X-연관) 망막층간분리증, 황반변성증(AMD), 노인성 황반변성증, 위축성 노인성황반변성증, 신생혈관 AMD, 당뇨병성 황반증, 증식성 당뇨병성 망막병증(PDR), 낭포황반부종, 중심성망맥락막염, 망막박리, 안내염, 녹내장, 후방 포도막염, 선천성 고정형 야맹증, 맥락막결손, 조기 발병 망막 이영양증, 원추세포 이영양증, 간상-원추 이영양증(rod-cone dystrophy) 또는 원추-간상 이영양증(cone-rod dystrophy), 패턴 이영양증(pattern dystrophy), 어셔 증후군(Usher syndrome) 및 기타 증상성 섬모병증(syndromic ciliopathy), 예컨대 바르데-비들(Bardet-Biedl) 증후군, 주버트(Joubert) 증후군, 시니어-뢰켄(Senior-Løken) 증후군 또는 알스트룀(Alstrom) 증후군을 치료하기 위해 사용될 수 있다.
본 핵산, 치료 핵산, 치료 단백질/폴리펩티드 또는 치료 분자는 광 수용기 세포, 예컨대 간상 및/또는 원추에 발병하는 장애(광 수용기 세포병)을 치료하는데 사용될 수 있다. 광 수용기 세포 질환의 비제한적 예들로서는 색맹, 노인성 황반변성증, 망막변성증, 망막 이영양증, 색소성 망막염, 원추 이영양증, 간상-원추 이영양증, 색맹, 황반변성증, 야맹증, 망막층간분리증, 맥락막결손, 당뇨병성 망막증, 유전성 시신경병증, 1형 오구치(Oguchi)병, 백점망막염(RPA), 진행성 망막위축증(PRA), 백점상안저(FA) 또는 선천성 고정형 야맹증(CSNB)을 포함한다.
본 치료 핵산 또는 치료 폴리펩티드는 유전성 망막병(IRD)을 치료하는데 사용될 수 있다. IRD는 유전적으로, 그리고 표현형이 이질적인 장애 군이다. IRD는 15세 ~ 45세의 인간들에서 실명의 주요 원인이 되고 있으며, 유병률은 1,500명중 1명 ~ 3,000명중 1명인 것으로 추산된다. IRD는 1차적으로 발병되는 망막세포의 유형(즉 간상 광 수용기인지 아니면 원추 광 수용기인지 여부)와 병상에 따라 분류될 수 있다. IRD의 비제한적 예들로서는 완전색맹, 노인성 황반변성증, 망막변성증, 망막 이영양증, 색소성 망막염, 원추 이영양증, 간상-원추 이영양증, 색맹, 황반변성증, 망막층간분리증, 맥락막결손, 당뇨병성 망막증, 유전성 시신경병증, 1형 오구치병, 백점망막염(RPA), 진행성 망막위축증(PRA), 백점상안저(FA) 또는 선천성 고정형 야맹증(CSNB)이 있다.
원추세포에 우세하게 발병하는 가장 일반적인 진행성 IRD는 스타가르트 황반 이영양증이다. 이 진행성 IRD는 상염색체 열성 방식으로 유전되며, 대부분 망막 운반체(retinal transporter) ABCR을 암호화하는 ABCA4 유전자에서의 돌연변이에 의해 유발된다. 일 구현예에서, 치료 핵산은 ABCA4 또는 이의 일부를 암호화하는데, 여기서 이 치료 핵산은 스타가르트 황반 이영양증을 치료하는데 사용된다.
간상 광 수용기에 1차적으로 발병하는, 가장 일반적인 IRD는 색소성 망막염(RP)이다. RP는 야맹증과 터널 시야현상(tunnel vision)을 초래하는 진행성 질환이다. 말기에는 2차 원추 광 수용기 세포 사멸이 유도되고, 결국에는 완전한 시력 상실에 이르게 된다. 색소성 망막염의 몇몇 형태는 로돕신 암호화 유전자의 돌연변이와 연관되어 있다. 일 구현예에서, 본 치료 핵산은 로돕신 또는 이의 일부를 암호화하는데, 여기서 이 치료 핵산은 색소성 망막염을 치료하는데 사용된다.
본 발명에 따른 핵산 서열은 또한 공여 스플라이싱 부위를 포함할 수도 있는데, 여기서 이 공여 스플라이싱 부위는 관심 뉴클레오티드 서열 또는 이의 일부에 대해 3'쪽에 위치한다. "공여 스플라이싱 영역"이란 용어는 본원에서 "공여 스플라이싱 부위"(약어 DSS) 또는 "스플라이싱 공여 부위"(약어 SDS)와 호환되어 사용된다. 따라서 본 발명의 핵산 서열은 또한 공여 스플라이싱 부위(DSS)를 포함할 수도 있다. 공여 스플라이싱 부위는 당 업자에게 공지되어 있으며, 특히 문헌[Buckley et al. (2009) "A method for identifying alternative or cryptic donor splice sites within gene and mRNA sequences. Comparisons among sequences from vertebrates, echinoderms and other groups" BMC Genomics 10: 318] 및 문헌[Qu et al. (2017) "A Bioinformatics-Based Alternative mRNA Splicing Code that May Explain Some Disease Mutations Is Conserved in Animals" Front. Genet., vol. 8 Art. 38]에 기재되어 있다. 여기서 임의의 적합한 공여 스플라이싱 부위가 이 용어에 의해 고려된다. 공여 스플라이싱 부위는 통상 엑손의 3' 말단쪽과 측접 인트론의 5' 말단쪽에 위치한다. 그러나 본 발명의 내용중 공여 스플라이싱 부위는 또한 관심 뉴클레오티드 서열내 다른 어느 곳에도 위치할 수 있다. 수여 스플라이싱 부위와 유사하게, 공여 스플라이싱 부위는 스플라이세오좀이 제자리에서 절단되는 것을 허용한다.
원칙적으로 본원에 기재된 바와 같은 공여 스플라이싱 부위는 핵산 분자의 임의의 위치에 위치할 수 있다. 공여 스플라이싱 부위는 (제1) 핵산 서열의 3' 말단에 위치함도 또한 상상된다. 예를 들어 공여 스플라이싱 부위 서열은 서열 AAGGTAAGT, AAGGTGAGT, CAGGTAAGT, CAGGTGAGT, AAGGTAAG, AAGGTGAG, CAGGTAAG 또는 CAGGTGAG를 포함할 수 있거나, 이것들로 이루어질 수 있다. 공여 스플라이싱 부위 서열은 서열 AAGGTAAGT, AAGGTGAGT, CAGGTAAGT, CAGGTGAGT, AAGGTAAG, AAGGTGAG, CAGGTAAG 또는 CAGGTGAG에 대해 적어도 70%, 80% 85%, 90%, 95%, 98%, 99% 또는 100%인 서열 동일성을 가지는 서열을 가짐도 또한 상상된다.
마찬가지로, 본원에 기재된 바와 같은 수여 스플라이싱 영역은 핵산 분자의 임의의 위치에 위치할 수 있다. 수여 스플라이싱 부위는 (제2) 핵산 서열의 5' 말단쪽에 위치함도 또한 상상된다.
관심 뉴클레오티드 서열은 본원에 기재된 바와 같은 폴리아데닐화 신호 및/또는 프로모터를 추가로 또는 대안적으로 포함할 수 있다.
본 발명은 또한 핵산 서열을 제조하기 위한 방법으로서,
(A) 1개 이상의 공여 스플라이싱 부위 서열을 포함하는 제1 핵산 서열을 제공하는 단계;
(B)(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열을 포함하는 제2 핵산 서열을 제공함으로써, 핵산 서열을 수득하는 단계를 포함하는 방법에 관한 것이다. 본 방법은, 바람직하게 시험관내 방법이다. 본 방법은 1개 이상의 공여 스플라이싱 서열(들)에서 제1 핵산 서열을 스플라이싱하고, 수여 스플라이싱 부위에 있는 제2 핵산 서열을 스플라이싱하여, 스플라이싱된 핵산 서열을 수득하는 단계를 추가로 포함할 수 있다. 본 방법은 또한 (C) 1개 이상의 공여 스플라이싱 부위 서열(들)에서 제1 핵산 서열을 절단하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계와, (D) 절단된 제1 핵산 서열을 절단된 제2 핵산 서열에 결찰시키는 단계를 포함할 수도 있다.
이 방법은 소위 트랜스-스플라이싱을 반영한다. 구체적으로 트랜스-스플라이싱은 2개의 별도 핵산 분자(바람직하게 전 mRNA 분자)로부터 유래한 엑손들을 서로 연결하여, 하나의 핵산 분자를 형성하는 스플라이싱의 한 유형이다. 예를 들어 전 RNA가 최종 mRNA, tRNA 또는 rRNA로 스플라이싱될 때의 경우와 같다. 이 과정은 또한 당 업자에게 공지되어 있으며, 특히 문헌[Alberts B, Johnson A, Lewis J, et al. (2002) "Molecular Biology of the Cell. 4th edition. New York: Garland Science under the headline "from DNA to RNA"]에 기재되어 있다. 그러므로 스플라이싱된 핵산 서열은, 바람직하게 mRNA, rRNA 또는 tRNA 서열이다. 따라서 관심 뉴클레오티드 서열은 전 mRNA일 수 있다.
제1 핵산 서열과 제2 핵산 서열은 DNA 서열 또는 RNA 서열일 수 있다. 제1 핵산 서열과 제2 핵산 서열이 DNA 서열인 경우, 제1 핵산 서열과 제2 핵산 서열 둘 다는 프로모터를 추가로 포함하고, 적어도 제2 핵산 서열, 바람직하게 둘 다도 또한 전사 종결 서열, 예컨대 폴리 A 서열을 포함한다. 제1 핵산 서열과 제2 핵산 서열이 RNA 서열인 경우, 적어도 제2 핵산 서열, 바람직하게 핵산 서열 둘 다는 종결 서열, 예컨대 폴리 A 서열을 포함한다. 바람직하게 핵산 서열은 DNA 서열, 더욱 바람직하게 이 DNA 서열을 포함하는 벡터 또는 플라스미드이다.
일 구현예에서, 제1 핵산 서열 및 제2 핵산 서열은 결합 도메인을 추가로 포함한다. 또 다른 구현예에서, 제1 핵산 서열 및 제2 핵산 서열은 본원에 기재된 바와 같은 전 mRNA 트랜스-스플라이싱 분자, 또는 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 DNA 서열이다.
이론에 의해 국한되지 않을 때, 1개 이상의 공여 스플라이싱 부위 서열(들)에서 제1 핵산 서열을 절단하는 것과, 수여 스플라이싱 영역 서열에서 제2 핵산 서열을 절단하는 것, 그리고 절단된 제1 핵산 서열과 절단된 제2 핵산 서열을 결찰시키는 것은 시스-스플라이싱뿐 아니라 트랜스-스플라이싱에서의 에스테르전이반응 2가지를 이용하여 수행되고, 본원에서 이 과정은 "스플라이싱"이라 지칭된다. 본원에 사용된 바와 같은 "트랜스-스플라이싱"이란 용어는, 성숙 RNA, 예컨대 최종 mRNA, tRNA 또는 rRNA를 생성하기 위한, 2개의 별도 RNA 또는 전 RNA 분자의 RNA 스플라이싱, 구체적으로 전 RNA 스플라이싱을 지칭한다.
"시험관내 방법"이란 용어는, 몸(즉 인간이나 동물의 몸) 외부에서 수행되는 방법을 지칭하며, 몸 외부에 있는 세포주 또는 1차 세포를 포함한다.
본원에 기재된 바와 같은 방법 및 용도는 임의의 적합한 무세포계, 예컨대 세포 용해물 또는 임의의 적합한 숙주 세포에서 수행 및 구현될 수 있다.
이처럼 적합한 숙주 세포는 당 업자에게 공지되어 있다, 예를 들어 적합한 숙주 세포는 스플라이싱 기구, 즉 스플라이세오좀을 포함한다. 당 업자는 적당한 숙주 세포, 예컨대 포유동물 또는 인간인 숙주 세포에서 사용하기 위한 조절 요소를 선택할 수 있다. 조절 요소로서는, 예를 들어 프로모터, 종결 서열(예컨대 전사 종결 서열, 번역 종결 서열), 인핸서 및 폴리아데닐화 요소를 포함한다. 더욱이, 이식유전자(관심 핵산 서열)의 발현 수준은 인핸서 서열 또는 우드척(woodchuck) 간염 바이러스 전사후 반응 요소(WPRE)와 같은 조절 요소가 사용됨으로써 향상될 수 있다. 그러나 이 요소들은 rAAV의 팩키징 용량을 더 제한한다. 따라서 몇몇 경우들, 구체적으로 크기 제한이 중요한 경우에서, 이러한 선택적 요소들은 생략하고, 바람직하게 소형의 필수 조절 요소, 예컨대 짧은 폴리아데닐화 신호를 본 발명에 따른 AAV 벡터, 구체적으로 이중 rAAV 벡터계에 대한 종결 서열로서 사용할 것이 권장된다. 숙주 세포는 진핵생물 세포 또는 포유동물 세포, 예컨대 인간 또는 설치류 세포주일 수 있다. 숙주 세포는 HEK 세포, 예컨대 HEK293(T) 세포, Cos7 세포, CHO 세포, 섬유아세포, 예컨대 인간이나 마우스 기원의 섬유아세포, 망막모세포종 세포, 661W 세포, 유도성 전능 줄기 세포(iPSC), 예컨대 인간 iPSC, 광 수용기 세포, 예컨대 척추동물 유래 광 수용기 세포, 뉴런 세포 또는 신경교세포일 수 있다.
일 구현예에서, 상기 제1 핵산 서열을 도입하는 단계와, 상기 제2 핵산 서열을 도입하는 단계를 포함하는 본 방법은 숙주 세포에서 시험관내(즉 몸 외부에서) 수행된다. 상기 제1 핵산 서열과 상기 제2 핵산 서열은 형질감염 또는 형질도입, 더욱 구체적으로는 공동형질감염 또는 공동형질도입에 의해 도입될 수 있다.
그러므로 일 구현예에서, 본 방법은
(A) 1개 이상의 공여 스플라이싱 부위 서열을 포함하는 제1 핵산 서열을 제공하는 단계;
(B)(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열;
(ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽에 위치하는 관심 뉴클레오티드 서열
을 포함하는 제2 핵산 서열을 제공함으로써, 핵산 서열을 수득하는 단계
를 포함한다. 본 방법은 1개 이상의 공여 스플라이싱 부위 서열(들)에서 제1 핵산 서열을 스플라이싱하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 스플라이싱하여, 스플라이싱된 핵산 서열을 수득하는 단계를 추가로 포함할 수 있다. 본 방법은 또한 (C) 1개 이상의 공여 스플라이싱 부위 서열(들)에서 제1 핵산 서열을 절단하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계와, (D) 절단된 제1 핵산 서열과 절단된 제2 핵산 서열을 결찰시켜, 핵산 서열을 수득하는 단계를 포함할 수도 있다.
두 핵산 서열이 관심 뉴클레오티드 서열을 포함하는 경우, 본 방법은 제1 뉴클레오티드 서열이 (ii) 관심 뉴클레오티드 서열을 포함하고, 이 관심 뉴클레오티드 서열은 공여 스플라이싱 부위에 대해 5'쪽에 위치한다는 특징을 추가로 포함한다.
제2 핵산 서열 및 제1 핵산 서열 둘 다는 본원에 기재된 바와 같은 관심 뉴클레오티드 서열을 포함할 수 있다. 이러한 관심 뉴클레오티드 서열은 공여 스플라이싱 부위의 5'쪽에 위치할 수 있다. 관심 뉴클레오티드 서열은 추가로, 또는 대안적으로 수여 스플라이싱 영역에 대해 3'쪽에 위치할 수 있다. 본 발명의 또 다른 구현예에서, 폴리뉴클레오티드는 하기 배열 순서, 바람직하게 5'-(수여 스플라이싱 영역)-(관심 서열) -3'과 합하여진 5'-(관심 서열)-(공여 스플라이싱 부위)-3', 대안적으로 5'-(공여 스플라이싱 부위)-(관심 서열) -3'과 합하여진 5'-(관심 서열)-(수여 스플라이싱 부위)-3'을 포함한다.
바람직한 구현예에서, 관심 뉴클레오티드 서열은 폴리펩티드를 암호화하는 서열이고, 제1 핵산 서열은 폴리펩티드를 암호화하는 서열의 5'부를 포함하며, 제2 핵산 서열은 폴리펩티드를 암호화하는 서열의 3'부를 포함하고, 트랜스-스플라이싱은 폴리펩티드를 암호화하는 서열의 5'부와 3'부를 재구성한다.
절단된 핵산 서열의 결찰은 당 업자에게 공지된 과정이다. 예를 들어 이 결찰 과정은 결찰 분자에 의해 수행될 수 있다, 예를 들어 결찰 분자는 RNA 리가아제 또는 RNA 리가아제 기능을 가지는 단백질일 수 있다. 이러한 RNA 리가아제는 당 업자에게 공지되어 있으며, 특히, 예컨대 문헌[Chambers and Patrick(2015) "Archaeal Nucleic Acid Ligases and Their Potential in Biotechnology" Hindawi Publishing Corporation Archaea Volume 2015, Article ID 170571, 10 페이지]에 기재되어 있다. 몇몇 (t)RNA 리가아제는, 예를 들어 문헌[Popow et al.(2012) "Diversity and roles of(t)RNA ligases" Cell Mol Life Sci. 69(16):2657-70]에 기재되어 있다. 그러므로 결찰 단계를 포함하는 방법은 RNA 리가아제를 첨가하는 단계를 추가로 포함할 수 있다. RNA 리가아제는, 예를 들어 mRNA 리가아제, tRNA 리가아제 또는 rRNA 리가아제일 수 있다. 예컨대 결찰된 mRNA 분자가 어떻게 분석될 수 있는지를 설명해주는 방법들이 실시예에 보인다.
바람직한 구현예에서, 본 방법은 숙주 세포내에서, 더욱 바람직하게는 시험관내(즉 몸의 외부)에서 수행된다. 그러므로 제1 핵산 서열 및 제2 핵산 서열은 숙주 세포에 도입되고, 이 경우 제1 핵산 서열과 제2 핵산 서열은 재조합 핵산 서열이고/이거나 숙주 세포에 대해 이종의 것이다. 제1 핵산 및 제2 핵산을 숙주 세포에 도입하는 것은 형질감염 또는 형질도입을 포함한다. 형질감염은 DNA 또는 RNA 형질감염일 수 있고, DNA 또는 RNA를 형질감염시키기 위한 방법은 당 업자에게 공지되어 있다. 바람직하게 핵산 서열은 DNA 서열이고, DNA 서열은 이 DNA 서열을 포함하는 플라스미드 또는 벡터의 형태로서 형질감염시킨다. 본원에 언급된 바와 같은 형질도입이란, DNA 또는 RNA를 포함할 수 있는 바이러스 벡터를 사용하여 핵산을 도입하는 것을 의미한다. 바람직한 구현예에서, 바이러스 벡터는 DNA 바이러스 벡터이고, 단일 가닥 DNA(예컨대 AAV) 또는 이중 가닥 DNA를 포함할 수 있다.
일 구현예에서, 본 발명에 따른 방법은 (A) 전 mRNA 트랜스-스플라이싱 분자 서열 또는 이 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 포함하는 제1 핵산 서열을 숙주 세포에 도입하는 단계로서, 제1 전 mRNA 트랜스-스플라이싱 분자는 5' → 3' 방향으로 (a) 관심 뉴클레오티드 산 서열의 5'부; (b) 공여 스플라이싱 부위; (c) 선택적 스페이서 서열; (d) 제1 결합 도메인; 및 (e) 선택적 종결 서열, 바람직하게는 폴리 A 서열을 포함하는 단계; (B) 전 mRNA 트랜스-스플라이싱 분자 서열 또는 이 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 포함하는 제2 핵산 서열을 숙주 세포에 도입하는 단계로서, 제2 전 mRNA 트랜스-스플라이싱 분자는 5' → 3' 방향으로 (i) 제1 핵산 서열의 제1 결합 도메인에 상보성인 제2 결합 도메인; (ii)(iia)(iiaa) 5개 내지 25개 뉴클레오티드를 포함하고; (iiab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%가 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역; (iib)(iiba) 피리미딘 대역에 대해 3'쪽에 위치하고; (iibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위를 포함하는 수여 스플라이싱 영역 서열; 및 (iii) 관심 뉴클레오티드 서열의 3'부를 포함하는 단계를 포함한다. 본 방법은 (C) 공여 스플라이싱 부위 서열에서 제1 핵산 서열을 절단하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계; 그리고 (D) 관심 뉴클레오티드 서열의 5'부를 포함하는 절단된 제1 핵산 서열을, 관심 뉴클레오티드 서열의 3'부를 포함하는 절단된 제2 핵산 서열에 결찰시킴으로써, 관심 핵산 서열을 수득하는 단계를 추가로 포함할 수 있다. 바람직한 구현예에서, 제1 핵산 서열 및 제2 핵산 서열은 상기 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 DNA 서열이고, 제1 핵산 서열은 관심 핵산 서열의 5'부의 5'쪽에 프로모터를 추가로 포함하며, 제2 핵산 서열은 제2 결합 도메인의 5'쪽에 프로모터를 추가로 포함한다.
본 발명은 또한
(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열;
(ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽에 위치하는 관심 뉴클레오티드 서열
을 포함하되, 여기서 관심 뉴클레오티드 서열은 서열 번호 9의 로돕신 유전자의 엑손 3이 아니거나, 또는 관심 뉴클레오티드 서열은 서열 번호 9 및/또는 10에 정의된 바와 같은 서열을 포함하지 않거나, 또는 관심 핵산 서열은 서열 번호 9의 로돕신 유전자의 엑손 3을 포함하지 않는, 핵산 서열에 관한 것이다.
본 발명은 또한
(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열;
(ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽에 위치하는 관심 뉴클레오티드 서열
을 포함하되, 여기서 관심 뉴클레오티드 서열은 서열 번호 10의 로돕신 mRNA가 아닌 핵산 서열에 관한 것이기도 하다.
본 발명의 핵산 서열은 그 길이가 길어야 5800개 뉴클레오티드임이 상상된다. 본 발명의 관심 핵산 서열은 그 길이가 길어야 5500개, 5000개, 4500개, 4000개, 3500개, 3000개, 2500개, 2000개, 1500개, 1000개, 500개, 400개, 300개, 200개 뉴클레오티드, 또는 길어야 150개 뉴클레오티드임도 또한 상상된다.
본 발명의 수여 스플라이싱 영역이 핵산 분자에 사용될 수 있는 추가의 적용예는 소위 Smart 기술을 위한 외인성 전 mRNA 트랜스-스플라이싱 분자이다. 이처럼 본 발명의 수여 스플라이싱 영역이 도입될 수 있는 전 mRNA 트랜스-스플라이싱 분자는 특히 WO 2011/042556, WO2013/025461뿐 아니라, 문헌[Berger et al.(2016) "mRNA trans splicing in gene therapy for genetic diseases" WIREs RNA, 7:487-498, Puttaraju et al.(1999) "Spliceosome-mediated RNA trans-splicing as a tool for gene therapy" Nature Biotechnology, vol. 17, pp. 246-252] 및 문헌[Mansfield et al.(2003) "5' Exon replacement and repair by spliceosome-mediated RNA trans-splicing" RNA, vol. 9: 1290-1297]에 기재되어 있다. 이러한 참고문헌들로부터, 당 업자는 또한 이러한 전 mRNA 트랜스-스플라이싱 분자가 어떻게 구성되는지 알고 있다. 몇몇 예시적 전 mRNA 트랜스-스플라이싱 분자 핵산 분자도 또한 본원에 기재되어 있다.
본 발명은 또한
(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, U 또는 G임]를 5' → 3' 방향으로 포함하는 수여 스플라이싱 부위
를 포함하는, 수여 스플라이싱 영역;
(ii) 관심 뉴클레오티드 서열[단, 여기서 수여 스플라이싱 영역은 관심 뉴클레오티드 서열에 대해 5'쪽에 위치함];
(iii) 관심 핵산 서열에 대해 5'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 결합 도메인; 그리고
(iv) 결합 도메인과 수여 스플라이싱 영역 사이에 위치하는 선택적 스페이서 서열
을 포함하는, 전 mRNA 트랜스-스플라이싱 분자에 관한 것이기도 하다.
바람직한 구현예에서, 수여 스플라이싱 영역은 관심 뉴클레오티드 서열에 대해 5'쪽에 위치하고, 결합 도메인은 수여 스플라이싱 영역에 대해 5'쪽에 위치한다. 바람직하게 핵산 서열 또는 전 mRNA 트랜스-스플라이싱 분자는 종결 서열, 바람직하게 폴리 A 서열을 추가로 포함한다.
본 발명은 또한
(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인. 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, U 또는 G임]를 5' → 3' 방향으로 포함하는 수여 스플라이싱 부위
를 포함하는, 수여 스플라이싱 영역;
(ii) 수여 스플라이싱 영역이 관심 뉴클레오티드 서열에 대해 5'쪽에 위치하는, 관심 뉴클레오티드 서열;
(iii) 관심 뉴클레오티드 서열에 대해 3'쪽에 위치하는 공여 스플라이싱 부위;
(iv) 관심 뉴클레오티드 서열에 대해 5'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제1 결합 도메인;
(v) 관심 뉴클레오티드 서열에 대해 3'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제2 결합 도메인;
(vi) 제1 결합 도메인과 수여 스플라이싱 영역 사이에 위치하는, 선택적 제1 스페이서 서열; 및
(vii) 제2 결합 도메인과 공여 스플라이싱 영역 사이에 위치하는, 선택적 제2 스페이서 서열
을 포함하는, 전 mRNA 트랜스-스플라이싱 분자에 관한 것이기도 하다.
일 구현예에서, 제1 결합 도메인은 수여 스플라이싱 영역에 대해 5'쪽에 위치하고, 제2 결합 도메인은 공여 스플라이싱 부위에 대해 3'쪽에 위치한다. 당 업자는 RNA 분자인 전 mRNA 트랜스-스플라이싱 분자가 전사되도록 이 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 DNA 서열이 프로모터를 포함함을 이해할 것이다. "전 mRNA를 표적화하는 결합 도메인"이란 용어는 또한 관심 뉴클레오티드 서열의 5'쪽 또는 3'쪽에 위치할 수 있는 "전 mRNA 표적화 결합 도메인"으로 지칭될 수도 있다.
본원에 기재된 바와 같은 핵산 서열은 전 mRNA 트랜스-스플라이싱 분자를 반영할 수 있다. 당 업자는 본원에 기재된 바와 같은 핵산 서열과 전 mRNA 트랜스-스플라이싱 분자가 재조합 서열 또는 분자임을 이해할 것이다. 이러한 전 mRNA 트랜스-스플라이싱 분자는 당 분야에 공지되어 있으며, 특히 WO 2011/042556, WO2013/025461뿐 아니라, 문헌[Berger et al. (2016) "mRNA trans splicing in gene therapy for genetic diseases" WIREs RNA, 7:487-498, Puttaraju et al. (1999) "Spliceosome-mediated RNA trans-splicing as a tool for gene therapy" Nature Biotechnology, vol. 17, pp. 246-252, Mansfield et al. (2003) "5' Exon replacement and repair by spliceosome-mediated RNA trans-splicing" RNA, vol. 9: 1290-1297] 및 문헌[Berger et al. (2016) "mRNA trans-splicing in gene therapy for genetic diseases" WIREs RNA 7: 487-498]에 기재되어 있다. 따라서, 당 업자는 이러한 전 mRNA 트랜스-스플라이싱 분자를 어떻게 구성하는지 알고 있다. 전 mRNA 트랜스-스플라이싱 분자는 표적 전 mRNA와 결합하되, 이 전 mRNA는 천연 전 mRNA, 구체적으로 숙주 세포에 내인성인 전 mRNA, 재조합 전 mRNA, 구체적으로 또 다른 전 mRNA 트랜스-스플라이싱 분자일 수 있음이 상상된다. 전 mRNA 트랜스-스플라이싱 분자는, 시스-스플라이싱 반응보다 트랜스-스플라이싱 반응을 우선적이면서 더 효율적으로 유도함도 또한 고려된다.
본원에 사용된 바와 같은 "전 mRNA를 표적화하는 결합 도메인"이란 용어는, 임의의 적합한 "전 mRNA를 표적화하는 결합 도메인"일 수 있는데, 즉 관심 뉴클레오티드 서열에 대해 5'쪽 또는 3'쪽에 위치하는, 표적화된 전 mRNA 서열에 상보성인 임의의 적합한 "전 mRNA를 표적화하는 결합 도메인"을 의미할 수 있다. 본원에 사용된 바와 같은 "전 mRNA를 표적화하는 결합 도메인"은 또한 "표적 결합 도메인", "결합 도메인"(BD라 약칭됨) 또는 "결합 서열"이라 지칭될 수 있다. 예를 들어 결합 도메인은 염기쌍 형성에 의해 표적 전 mRNA 또는 mRNA를 인지할 수 있다. 예를 들어 mRNA상 표적은 인트론일 수 있다. 본원에 기재된 전 mRNA 트랜스-스플라이싱 분자의 표적 결합 도메인은 적어도 15개 ~ 30개 뉴클레오티드, 바람직하게 80개 ~ 120개 뉴클레오티드, 더욱 바람직하게 약 100개 뉴클레오티드인 결합 도메인 1개 또는 2개를 함유할 수 있거나; 또는 미국 특허출원 공보 US 2006-0194317 A1에 기재된 바와 같이 선택된(예컨대 내인성) 전 mRNA의 표적화된 영역에 상보성이며 안티센스 방향인, 수백 개 이하의 뉴클레오티드로 이루어진 긴 표적 결합 도메인을 가질 수 있다. 이는, 결합 특이성을 부여하고, 내인성 전 mRNA를 공간상 가까이에 고정시켜, 예컨대 숙주 세포 핵의 스플라이세오좀이 전 mRNA 트랜스-스플라이싱 분자의 일부를 (예컨대 내인성) 전 mRNA의 일부에 트랜스-스플라이싱시킬 수 있도록 만든다. 대안적으로 결합 도메인은 또다른 재조합 전 mRNA, 예컨대 또 다른 전 mRNA 트랜스-스플라이싱 분자의 결합 도메인에 대해 역 상보성일 수 있다. 이는, 결합 특이성을 부여하고, 2개의 전 mRNA 트랜스-스플라이싱 분자를 공간상 가까이에 고정시켜, 예컨대 숙주 세포핵의 스플라이세오좀이 하나의 전 mRNA 트랜스-스플라이싱 분자의 일부를 또 다른 전 mRNA의 일부에 트랜스-스플라이싱시킬 수 있도록 만든다. 그러므로 결합 도메인은 약 15개 ~ 약 250개의 뉴클레오티드, 약 15개 ~ 약 200개의 뉴클레오티드, 약 100개 ~ 약 200개의 뉴클레오티드, 또는 500개, 400개, 300개 또는 200개 미만의 뉴클레오티드를 포함함이 상상된다. 일 구현예에서, 결합 도메인은 50개 ~ 150개의 뉴클레오티드, 바람직하게는 80개 ~ 120개의 뉴클레오티드, 더욱더 바람직하게는 90개 ~ 110개의 뉴클레오티드, 또는 약 100개의 뉴클레오티드를 포함한다. 대안적으로, 또는 더욱더 바람직하게, 효율적인 결합 도메인의 GC 함량은 45% ~ 65%이고/이거나, 진핵생물 인트론 서열 또는 세균 인트론 서열로부터 유래하고/유래하거나, (예컨대 인간 스플라이싱 파인더 3.1(http://www.umd.be/HSF/index.html)이 이용되어 평가되는 바에 따르면) 마지막 30 bp에 분지점 적어도 1개를 포함한다.
결합 도메인은 숙주 세포내에서 내인성 전 mRNA 또는 제2의 이종 또는 재조합 전 mRNA가 표적 결합 도메인과 역 상보성인 서열을 포함하는 한, 내인성 전 mRNA, 또는 (숙주 세포에 제공되거나 도입된) 제2의 이종 또는 재조합 전 mRNA에 결합할 수 있다. 그러므로 제2의 이종 또는 재조합 전 mRNA는 제1의 이종 전 mRNA의 결합 도메인에 역 상보성인 결합 도메인을 포함한다. "내인성" 및 "이종"이란 용어는, 본원에서 숙주 세포와 관련하여 사용되고 있다. 내인성 전 mRNA를 표적화하는 것이란, 스플라이세오좀 매개 RNA 트랜스-스플라이싱을 또한 지칭하는 것이기도 하며, 통상 내인성 전 mRNA의 일부를 치환하는데 사용된다. 제2의 이종 또는 재조합 전 mRNA를 표적화하는 것이란 트랜스-스플라이싱, 즉 하나의 전 mRNA 트랜스-스플라이싱 분자로부터 유래하는 제1 뉴클레오티드 서열 또는 이의 일부(5')를, 다른 전 mRNA 트랜스-스플라이싱 분자의 제2 뉴클레오티드 서열 또는 이의 일부(3')와 결찰시킨 신규 재조합 전 mRNA를 생성하는 것을 지칭하는 것이기도 하다. 본원에 사용된 바와 같은 "재조합"이란 용어는, DNA 분자 또는 서열이 유전자 재조합의 실험실 방법, 예컨대 분자 클로닝에 의해 생성된 경우와, RNA 또는 폴리펩티드 분자/서열이 상기 재조합 DNA 분자 또는 서열에 의해 암호화된 경우를 지칭한다.
"전 mRNA" 또는 "전 RNA"란 용어는, 트랜스-스플라이싱 이전의 RNA를 지칭하며, 통상적으로는 시스-스플라이싱 이전의(예컨대 인트론과 엑손을 포함하는) RNA 분자를 기술하는 용어이지만, 예컨대 결합 도메인이 엑손-엑손 경계까지 확장된 서열을 표적화하는 경우, 시스-스플라이싱 이후의(예컨대 엑손만을 포함하는) RNA 분자를 지칭할 수도 있다.
본원에 사용된 바와 같은 "이종"이란 용어는, 단백질 또는 핵산 분자 또는 서열이 실험을 통해 세포로 옮겨지거나 도입된 관계로, 해당 세포에 대해 내인성이 아니게 된 경우를 지칭한다. 이종 단백질 또는 핵산 분자 또는 서열이 수여 세포 또는 종과 상이한 세포 유형 또는 상이한 종으로부터 유래할 수 있으면, 이 이종 단백질 또는 핵산 분자 또는 서열도 또한 수여 숙주 세포에 도입되는 한, 수여 세포 또는 종과 동일한 세포 유형 또는 종으로부터 유래할 수도 있다. 본원에 언급된 바와 같은 "이종" 및 "재조합"이란 용어들은 호환되어 사용되고 있다.
본 발명에 사용하기 적합한 예시적 결합 도메인은 서열 번호 27, 28, 32, 33 또는 18의 서열에 의해 암호화되는 RNA 서열을 가지는 결합 도메인이지만, 이에 한정되는 것은 아니다. 추가의 표적 결합 도메인은 리포터 재구성 검정법, 예컨대 실시예 2 및 실시예 5에 기재 및 사용된 바와 같거나, 또는 문헌[Riedmayr LM. (2020, SMaRT for Therapeutic Purposes. Methods Mol Biol 2079:219-32. doi: 10.1007/978-1-4939-9904-0_17)] 또는 문헌[Dallinger G. et al. (2003, Development of spliceosome-mediated RNA trans-splicing (SMaRT) for the correction of inherited skin diseases. Exp Dermatol 12:37-46]에 기재된 바와 같이 재구성 효율을 확정하기 위한 세룰리안 재구성 검정법이 사용되어 동정될 수 있다.
제2의 결합 영역이 분자의 3' 말단에서 치환될 수 있으며, 본 발명의 전 mRNA 트랜스-스플라이싱 분자에 통합될 수 있다. 절대적 상보성이 바람직하기는 하지만, 반드시 그래야 하는 것은 아니다. 본원에 언급된 바와 같은 내인성 전 mRNA의 일부에 "상보성"인 서열이란, 내인성 전 mRNA와 혼성화될 수 있기에 충분한 상보성을 가져서, 안정적인 이중체를 형성하는 서열을 의미한다. 혼성화하는 능력은 상보성 정도와 핵산의 길이 둘 다에 따라 달라질 것이다[예컨대 문헌(Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, 2d Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.) 참조].
그러므로 전 mRNA를 표적화하는 결합 도메인과 관련하여 사용된 바와 같은 상보성이란, 결합 도메인이 서열, 즉 전 mRNA상 표적 서열과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 상보성이고, 바람직하게는 전 mRNA상 표적 서열과 적어도 90%, 95%, 98%, 99% 또는 100% 상보성인 서열을 포함함을 의미한다.
결합 도메인으로부터 스플라이싱 부위(들)를 분리하기 위한 스페이서 영역은, 바람직하게 전 mRNA 트랜스-스플라이싱 분자에도 또한 포함되어 있다. 스페이서 서열은, 전 mRNA 트랜스-스플라이싱 분자의 3'쪽 및/또는 5'쪽 스플라이싱 부위의 요소들을 (비교적 약한 상보성으로) 덮음으로써 비 특이적 트랜스-스플라이싱을 방지할 수 있는, 전 mRNA 트랜스-스플라이싱 분자의 영역이다.
5'쪽 공여 스플라이싱 부위와 3' 말단 결합 도메인을 분리하는 스페이서는 약 10개 ~ 약 100개 뉴클레오티드, 바람직하게 약 10개 ~ 약 70개 뉴클레오티드, 약 20개 ~ 약 70개 뉴클레오티드, 약 20개 ~ 약 30개 뉴클레오티드, 그리고 더욱 바람직하게는 약 30개 ~ 약 50개 뉴클레오티드를 포함할 수 있다. 이 스페이서는 하류 인트론 스플라이싱 인핸서(Downstream Intronic Splice Enhancer; DISE)를 포함할 수 있다. 5' 말단 결합 도메인으로부터 3'쪽 수여 스플라이싱 영역을 분리하는 스페이서 서열은 약 2개 ~ 약 100개 뉴클레오티드 또는 약 10개 ~ 약 100개 뉴클레오티드, 바람직하게 약 2개 ~ 약 50개 뉴클레오티드, 더욱 바람직하게 약 5개 ~ 약 20개 뉴클레오티드를 포함할 수 있다.
스페이서는 비 암호화 서열일 수 있지만, 예컨대 스플라이싱된 전 mRNA 트랜스-스플라이싱 분자의 그 어떤 번역도 차단할 종결 코돈과 같은 특징을 포함하도록 디자인될 수도 있다. 추가의 특징들이 전 mRNA 트랜스-스플라이싱 분자에 부가될 수 있음은 전술된 바와 같이 당 업자에게 공지되어 있다. 본원에 기재된 바와 같은 핵산 서열 또는 전 mRNA 트랜스-스플라이싱 분자는 (재조합) 벡터에 포함됨도 또한 상상된다. 이러한 벡터도 또한 당 업자에게 공지되어 있다. 본 발명의 뉴클레오티드 서열, 예컨대 관심 전 mRNA 트랜스-스플라이싱 분자를 포함하는 벡터는 포유동물 세포내에서의 복제 및 발현에 사용되는 플라스미드, 바이러스 또는 기타 당 분야에 공지된 것들일 수 있다.
관심 뉴클레오티드 서열 또는 본원에 기재된 바와 같은 뉴클레오티드 서열, 예컨대 전 mRNA 트랜스-스플라이싱 분자의 발현은 포유동물, 바람직하게는 인간 세포에서 작용하는 것으로 당 분야에 공지된 임의의 프로모터/인핸서 서열에 의해 조절될 수 있다. 이러한 프로모터/인핸서는 유도성(inducible)이거나 구성적(constitutive)일 수 있다. 이러한 프로모터는 또한 본원의 어딘가에 기재되어 있다. 한 가지 예시적 프로모터는 인간 또는 마우스 로돕신, 또는 짧거나 중간 길이거나 긴 파장 감수성 옵신 프로모터 등이다. 조직 부위에 직접 도입될 수 있는 재조합 DNA 구조체를 제조하기 위해 임의의 유형의 플라스미드, 코스미드, YAC 또는 바이러스 벡터가 사용될 수 있다. 대안적으로, 원하는 표적 세포를 선택적으로 감염시키는 바이러스 벡터가 사용될 수 있다. 본 발명의 실시에 사용될 벡터는 임의의 진핵생물 발현 벡터, 예컨대 바이러스 발현 벡터, 예컨대 레트로바이러스, 아데노바이러스 또는 아데노-연관 바이러스 군으로부터 유래하는 벡터(이에 한정되는 것은 아님)를 포함한다. 바람직한 구현예에서, 본 발명의 재조합 벡터는 진핵생물 발현 벡터이다.
다른 특정 구현예에서, 본 발명은 핵산 서열, 예컨대 본 발명의 전 mRNA 트랜스-스플라이싱 분자 또는 본 발명의 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 표적 세포에 전달하는 단계를 포함한다. 다양한 전달계가 공지되어 있으며, 예를 들어 리포좀내 캡슐화, 미립자, 마이크로캡슐, 조성물을 발현할 수 있는 재조합 세포, 수용체 매개 내포작용, 레트로바이러스, 아데노바이러스, 아데노-연관 바이러스 또는 기타 벡터의 일부로서의 핵산 구성, DNA 주입, 전기천공법, 인산칼슘 매개 형질감염 등이 본 발명의 조성물을 세포에 운반하는데 사용될 수 있다. 본 발명은 또한 핵산 서열, 예컨대 본 발명의 전 mRNA 트랜스-스플라이싱 분자, 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열, 또는 본 발명의 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 포함하는 재조합 벡터를 포함하는 세포에 관한 것이기도 하다.
관심 핵산 서열 또는 본원에 개시된 바와 같은 핵산 서열은 기능성이면서 생물 활성인 분자를 암호화하는 유전자를, 사라졌거나 돌연변이된 유전자 생성물의 발현이 정상 표현형을 나타내는 유전성 유전자 장애가 발병한 개체의 세포에 제공하는데 사용될 수 있다. 이는 특히 본원에도 개시된 바와 같이 아데노-연관 바이러스 벡터에 의해 달성될 수 있다.
본 발명은 또한 프로모터와, 본원에 기재된 바와 같은 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 서열을 포함하는 데옥시리보핵산(DNA) 분자에 관한 것이기도 하다. 바람직하게 DNA 분자는 벡터 또는 플라스미드인데, 단 벡터는 바이러스 벡터, 예컨대 AAV, 아데노바이러스 또는 렌티바이러스 벡터 또는 플라스미드일 수 있다. 전 mRNA 트랜스-스플라이싱 분자 또는 DNA 분자, 예컨대 바이러스 벡터는 치료법, 구체적으로 유전자 치료법, 더욱 구체적으로 안 장애를 치료하는 유전자 치료법에 사용될 수 있다.
본 발명의 수여 스플라이싱 부위가 사용될 수 있는 추가의 적용예는 임의의 AAV 벡터 또는 AAV 벡터계이다. 이러한 벡터계와, 이 벡터계가 어떻게 구성될 수 있는지는 당 업자에게 공지되어 있으며, 특히 문헌[Carvalho et al. (2017) "Evaluating efficiencies of dual AAV approaches for retinal targeting" Frontiers in Neuroscience, vol. 11, Article 503, US 2014/0256802 또는 Trapani et al. (2013) "Effective delivery of large genes to the retina by dual AAV vectors" EMBO Molecular Medicine, vol. 6, no. 2, pp. 194-211]에 기재되어 있다. 몇몇 예시적 AAV 벡터와 AAV 벡터계도 또한 본원에 기재되어 있다.
본 발명은 또한 도치된 말단 반복부 적어도 2개를 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 아데노-연관 바이러스(AAV) 벡터로서, 상기 핵산 서열은 5' → 3' 방향으로
(i) 프로모터;
(ii) 결합 도메인;
(iii) 선택적 스페이서 서열;
(iv)(a)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(b)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[단 N은 A, C, T/U 또는 G, 바람직하게 A, C, T 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열;
(v) 관심 뉴클레오티드 서열;
(vi) 선택적 종결 서열, 예컨대 폴리 A 서열
을 포함하는, 아데노-연관 바이러스(AAV) 벡터에 관한 것이기도 하다.
구조적으로 AAV는 작고(25 nm), 단일 DNA 가닥을 가지며, 정이십면체 캡시드로 된 피막을 가지지 않는 바이러스이다. 캡시드(cap) 단백질의 조성과 구조가 상이한 자연 발생 또는 조작된 AAV 변이체(AAV 혈청형이기도 함)는 가변적 향성(tropism), 즉 상이한 (망막) 세포 유형에 형질도입되는 능력을 가진다(Boye et al. (2013) "A comprehensive review of retinal gene therapy" Molecular therapy 21 509-519). 도처에 존재하는 활성 프로모터와 합하여질 때, 이 향성은 유전자 발현 부위를 한정한다. 반면에 세포 유형 특이적 프로모터와 조합되면, 부위 특이성(즉 간상 또는 원추 광 수용기에서만의 이식유전자 발현) 정도는 AAV 혈청형의 향성과 프로모터 특이성 둘 다의 조합에 의해 한정된다(Schon et al. (2015) "Retinal gene delivery by adeno-associated virus (AAV) vectors: Strategies and applications" Eur J Pharm Biopharm. 95(Pt B):343-52).
"아데노-연관 바이러스 벡터" 또는 "재조합 AAV" 또는 "rAAV"라는 용어들은 모두 호환되어 사용되고 있는 용어들로서, 자체의 바이러스 게놈에 이종 폴리뉴클레오티드 서열(본원에서 관심 뉴클레오티드 서열이라고도 지칭됨)을 포함하는 임의의 AAV를 포함하도록 의도된다. 일반적으로 관심 이종 폴리뉴클레오티드/뉴클레오티드 서열에는 적어도 1개, 일반적으로는 2개의 자연 발생 또는 변이 AAV 도치 말단 반복 서열(ITR)이 측접하고 있다. rAAV 벡터라는 용어는 rAAV 벡터 입자와 rAAV 벡터 플라스미드 둘 다를 포함한다. 그러므로 예를 들어 이종 폴리뉴클레오티드 서열을 포함하는 rAAV는, 보통 자연 발생 야생형 AAV에 포함되지 않는 핵산 서열, 예컨대 이식유전자(예컨대 비 AAV RNA 암호화 폴리뉴클레오티드 서열, 비 AAV 단백질 암호화 폴리뉴클레오티드 서열), 비 AAV 프로모터 서열, 비 AAV 폴리아데닐화 서열 등을 포함하는 rAAV일 것이다.
이러한 재조합 AAV 벡터는 당 분야에서 일반적인 상식이므로, 당 업자도 또한 이러한 재조합 AAV를 어떻게 구성하는지 알고 있다.
"rAAV 벡터 게놈" 또는 "rAAV 게놈"은 1개 이상의 이종 핵산 서열을 포함하는 AAV 게놈(즉 vDNA)이다. rAAV 벡터는, 일반적으로 바이러스를 생산하는 것과 관련하여 오로지 말단 반복부(들)(TR)만을 필요로 한다. 기타 모든 바이러스 서열은 불필요한 것으로 간주되며, 트랜스 방식으로 공급될 수 있다(Muzyczka, (1992) Curr Topics Microbiol. Immunol. 158:97). 통상적으로 rAAV 벡터 게놈은 벡터/캡시드에 의해 효율적으로 팩키징될 수 있는 이식유전자/관심 뉴클레오티드 서열/이종 핵산 서열의 크기를 최대로 만들기 위해 오로지 1개 이상의 TR 서열만을 보유할 것이다. 구조 및 비 구조 단백질 암호화 서열은 트랜스 방식으로(예컨대 플라스미드와 같은 벡터로부터, 아니면 서열을 팩키징 세포(packaging cell)에 안정적으로 혼입시킴으로써) 제공될 수 있다. 본 발명의 구현예들에서, rAAV 벡터 게놈은 통상 벡터 게놈의 5' 말단 및 3' 말단에 있고, 이종 핵산에 측접하여 존재하되, 이에 인접하여 존재할 필요는 없는 TR 서열(예컨대 AAV TR 서열) 적어도 1개, 선택적으로 TR 2개(예컨대 AAV TR 2개)를 포함한다. TR은 서로 동일하거나 상이할 수 있다.
"도치 말단 반복부", "말단 반복부" 또는 "TR"이란 용어는 모두 호환되어 사용되는 것으로서, (즉 복제, 바이러스 팩키징, 통합 및/또는 프로바이러스 구조(provirus rescue) 등과 같이 바람직한 기능을 매개한다면) 헤어핀 구조를 형성하여, 도치 말단 반복부로서의 기능을 하는 임의의 바이러스 말단 반복부 또는 합성 서열을 포함한다. TR은 AAV TR 또는 비 AAV TR일 수 있다. 예를 들어 비 AAV TR 서열, 예컨대 기타 파르보바이러스(예컨대 개 파르보바이러스(CPV), 마우스 파르보바이러스(MVM), 인간 파르보바이러스 B-19)의 TR 서열, 또는 기타 적합한 임의의 바이러스 서열(예컨대 SV40 복제 기원으로서 사용되는 SV40 헤어핀)은, 절단, 치환, 결실, 삽입 및/또는 부가에 의해 추가로 변형될 수 있는 TR로서 사용될 수 있다. 뿐 아니라, TR은 부분적으로나 전체적으로 합성된 것일 수 있는데, 예컨대 미국 특허 제5,478,745호에 기재된 바와 같은 "이중 D 서열"일 수 있다. 말단 반복부는 그 길이가 약 50개, 약 100개, 약 150개, 약 200개, 약 250개, 약 300개 또는 이 이상의 뉴클레오티드일 수 있다. 예를 들어 말단 반복부는 약 145개 뉴클레오티드를 가진다. 예를 들어 도치된 말단 반복부는 서열 번호 14 및/또는 15의 서열을 가질 수 있다. 도치된 말단 반본부는 서열 번호 14 및/또는 15의 서열에 대해 적어도 60%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 100%의 서열 동일성을 가지는 서열을 가질 수 있음도 또한 상상된다. 바람직하게 AAV 벡터는 서열 번호 14 및 15 둘 다, 또는 서열 번호 14 및 15에 대해 적어도 60%의 서열 동일성을 가지는 서열을 포함한다.
"AAV 말단 반복부" 또는 "AAV TR"은 임의의 AAV, 예컨대 혈청형 1, 2, 3, 3B, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13, 또는 현재 공지되어 있거나 추후 발견될 기타 임의의 AAV(이에 한정되는 것은 아님)로부터 유래할 수 있다. AAV 말단 반복부는, 이 말단 반복부가 원하는 기능, 예컨대 복제, 바이러스 팩키징, 통합 및/또는 프로바이러스 구조 등을 매개하는 한, 원산 말단 반복부 서열(예컨대 삽입, 결실, 절단 및/또는 미스센스 돌연변이에 의해 변경될 수 있는 원산 AAV TR 서열)을 필요로 하지 않는다. 본 발명의 바이러스 벡터는 또한 국제특허출원공보 WO 00/28004에 기재된 바와 같이 "표적화된" 바이러스 벡터(예컨대 유도된 향성을 가지는 바이러스 벡터) 및/또는 "하이브리드" 파르보바이러스(즉 바이러스 TR과 바이러스 캡시드가 상이한 파르보바이러스로부터 유래한 파르보바이러스)일 수도 있다.
재조합 AAV 또는 AAV 벡터는 자연 발생 AAV 1형(AAV-1), AAV 2형(AAV-2), AAV 3형(AAV-3), AAV3B, AAV 4형(AAV-4), AAV 5형(AAV-5), AAV 6형(AAV-6), AAV 7형(AAV-7), AAV 8형(AAV-8), AAV9, AAV10, AAV11, AAV12, rh10, 조류 AAV, 소 AAV, 개 AAV, 말 AAV, 영장류 AAV, 비영장류 AAV 및 양 AAV의 서열에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95%, 97%, 99% 또는 100%인 서열 동일성을 가지는 서열을 포함하거나 가짐도 또한 상상된다.
본 발명에 따르면, 2개의 도치된 말단 반복부 사이 핵산 서열은 본원에 기재된 바와 같은 프로모터를 추가로 포함한다. AAV에 사용될 프로모터의 선택은, 선택된 이식유전자/관심 뉴클레오티드 서열을 원하는 표적 세포내에서 발현시킬 수 있는 다수의 구성적 또는 유도성 프로모터로부터 이루어질 수 있다. 표적 세포는 광 수용기 세포일 수 있다. 프로모터는 인간을 비롯한 임의의 종으로부터 유래할 수 있다.
본원에 기재된 바와 같은 프로모터는 "세포 특이적"일 수 있다. "세포 특이적"이란 용어는, 재조합 벡터를 위해 선택된 특정 프로모터가, 선택된 이식유전자/관심 뉴클레오티드의 특정 세포 또는 안 세포 유형에서의 발현을 유도할 수 있음을 의미한다. 유용한 프로모터로서는 간상 옵신 프로모터, 적록 옵신 프로모터, 청 옵신 프로모터, cGMP-P-포스포디에스터라아제 프로모터, 마우스 옵신 프로모터(Beltran et al.(2010) "rAAV2/5 gene-targeting to rods:dose-dependent efficiency and complications associated with different promoters." Gene Ther. 17(9):1162-74), 로돕신 프로모터(Mussolino et al, Gene Ther, July 2011, 18(7):637-45); 원추 트랜스듀신의 알파 서브유닛(Morrissey et al, BMC Dev, Biol, Jan 2011, 11 :3); 베타 포스포디에스터라아제(PDE) 프로모터; 색소성 망막염(RP1) 프로모터(Nicord et al, J. Gene Med, Dec 2007, 9(12): 1015-23); NXNL2/NXNL 1 프로모터(Lambard et al, PLoS One, Oct. 2010, 5(10):el3025); PE65 프로모터; 망막 변성 슬로우/페리페린 2(Rds/perph2) 프로모터(Cai et al, Exp Eye Res. 2010 Aug;91(2): 186-94); 및 VMD2 프로모터(Achi et al, Human Gene Therapy,(2009) 20:31-9)를 포함하나, 이에 한정되는 것은 아니다.
본 발명에 사용되기에 유용한 프로모터는 또한 간상 옵신 프로모터(RHO), 적록 옵신 프로모터, 청 옵신 프로모터, cGMP-P-포스포디에스터라아제 프로모터, SWS 프로모터(청 단파장 감수성(SWS) 옵신 프로모터), 마우스 옵신 프로모터(Beltran et al 2010, 상기 언급됨), 로돕신 프로모터(Mussolino et al, Gene Ther, July 2011, 18(7):637-45); 원추 트랜스듀신의 알파 서브유닛(Morrissey et al, BMC Dev, Biol, Jan 2011, 11 :3); 원추 어레스틴(ARR3) 프로모터(Kahle NA et al., Hum Gene Ther Clin Dev, September 2018, 29(3):121-131), 베타 포스포디에스터라아제(PDE) 프로모터; 색소성 망막염(RP1) 프로모터(Nicord et al, J. Gene Med, Dec 2007, 9(12): 1015-23); NXNL2/NXNL 1 프로모터(Lambard et al, PLoS One, Oct. 2010, 5(10):el3025); RPE65 프로모터; 망막 변성 슬로우/페리페린 2(Rds/perph2) 프로모터(Cai et al, Exp Eye Res. 2010 Aug;91(2): 186-94); 및 VMD2 프로모터(Achi et al, Human Gene Therapy,(2009) 20:31-9)와, ABCA4 프로모터, 또는 상이한 프로모터 적어도 2개로 이루어진 임의의 하이브리드 프로모터를 포함하나, 이에 한정되는 것은 아니다.
도치 말단 반복부 2개 사이에 있는 핵산 서열은 관심 핵산 서열에 대해 3'쪽에 위치하는 종결 신호, 예컨대 폴리아데닐화 신호를 추가로 포함함도 또한 고려된다. 관심 핵산 서열에 대해 3'쪽에 위치하는 종결 신호, 예컨대 폴리아데닐화 신호는 선택적인 것인데, 그 이유는 전 RNA가 내인성 전 RNA 또는 추가의 재조합 전 RNA로 트랜스-스플라이싱되어, 성숙 RNA, 예컨대 성숙 mRNA의 5' 말단을 생성할 수 있기 때문이다. 그러나 트랜스-스플라이싱 효능은 폴리아데닐화 신호가 있을 때 더 큰 것으로 보였다.
프로모터는 전 RNA를 전사하기 위해 필요하지만, 핵산 서열은 ATG(번역 개시) 및/또는 Kozak 공통 서열을 반드시 필요로 하는 것은 아니다. 전 RNA가 내인성 전 RNA 또는 추가의 재조합 전 RNA로 트랜스-스플라이싱되어, 성숙 RNA, 예컨대 성숙 mRNA의 3' 말단을 생성할 수 있는 경우, ATG 및/또는 Kozak 공통 서열의 결여는 트랜스-스플라이싱 이전의 전 RNA로부터의 원치않는 번역을 피하는데 유리할 수 있다.
이러한 통상의 벡터 및 조절 요소와, 기타 통상의 벡터 및 조절 요소의 선택은 종래의 기술이며, 이러한 서열 다수가 이용될 수 있다. 예컨대 문헌[Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1989]을 참조한다. 물론, 모든 벡터와 발현 제어 서열이 본원에 기재된 바와 같은 이식유전자 전부를 발현시키기 위해 동일하게 잘 작용하는 것은 아닐 것이다. 그러나 당 업자는 이것들과, 본 발명의 범위로부터 벗어나지 않는 기타 발현 제어 서열로부터 선택할 수 있다.
본 발명은 또한
(I) 도치된 말단 반복부 적어도 2개를 포함하는 핵산 서열을 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 제1 AAV 벡터로서, 이 도치된 말단 반복부 2개 사이에 있는 상기 핵산 서열은 5' → 3' 방향으로
(a) 프로모터,
(b) 관심 폴리펩티드의 N-말단부를 암호화하는 뉴클레오티드 서열;
(c) 공여 스플라이싱 부위;
(d) 선택적 스페이서 서열;
(e) 제1 결합 도메인; 그리고
(f) 선택적 종결 신호, 바람직하게 폴리 A 신호를 포함하는 제1 AAV 벡터;
(II) 도치된 말단 반복부 적어도 2개를 포함하는 핵산 서열을 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 제2 AAV 벡터로서, 이 도치된 말단 반복부 2개 사이에 있는 상기 핵산 서열은 5' → 3' 방향으로
(i) 프로모터;
(ii) 제1 AAV 벡터의 제1 결합 도메인에 상보성인 제2 결합 도메인;
(iii) 선택적인 스페이서 서열;
(iv)(a)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(b)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[여기서 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열; 및
(v) 관심 폴리펩티드의 C-말단부를 암호화하는 뉴클레오티드 서열로서,
(vb) 관심 폴리펩티드의 C-말단부와 관심 폴리펩티드의 N-말단부는 관심 폴리펩티드를 재구성하는 뉴클레오티드 서열; 및
(vi) 종결 신호, 바람직하게 폴리 A 신호
를 포함하는 제2 AAV 벡터를 포함하는, 아데노-연관 바이러스(AVV) 벡터계에 관한 것이기도 하다.
그러므로 관심 폴리펩티드의 C-말단부는, 제1 AAV 벡터에 포함되었던 폴리펩티드의 N-말단부로부터 사라진 관심 폴리펩티드 일부에 대응한다. 일 구현예에서, 폴리펩티드는 전장 폴리펩티드이고, 제1 AAV 벡터는 관심 전장 폴리펩티드의 N-말단부를 포함하며, 제2 AAV 벡터는 관심 전장 폴리펩티드의 C-말단부를 포함하고, 관심 전장 폴리펩티드의 C-말단부와 관심 전장 폴리펩티드의 N-말단부는 관심 폴리펩티드를 재구성한다. 그러므로 관심 전장 폴리펩티드의 C-말단부는, 제1 AAV 벡터에 포함되었던 전장 폴리펩티드의 N-말단부로부터 사라진 관심 전장 폴리펩티드의 일부에 대응한다. 더욱 구체적으로, 트랜스-스플라이싱 후, mRNA는 관심 폴리펩티드의 N-말단부와 관심 폴리펩티드의 C-말단부를 암호화하는 서열을 (프레임 내에) 포함하되, 여기서 mRNA는 관심 (전장) 폴리펩티드를 암호화하므로, 관심 폴리펩티드는 재구성된다.
특히, rAAV 또는 AAV 벡터 게놈 팩키징 용량에는 크기 제한(약 5 kb)이 존재한다. 다수의 치료 단백질 cDNA는 크기 때문에, rAAV 벡터를 사용하여 큰 이식유전자를 전달하기 위한 전략을 고안하는 것은 rAAV 매개 유전자 치료법의 임상 적용을 유의미하게 확대시킬 수 있다. 따라서 일 구현예에서, 관심 폴리펩티드는 이식유전자에 의해 암호화되는 폴리펩티드이다. 이미 AAV 팩키징 용량을 초과하는 이식유전자를 전달하기 위한 트랜스-스플라이싱 접근법이 개발되었다. 요약하면, 별도 rAAV 벡터 2개가 이식유전자 부분 2개, 즉 이식유전자의 5'쪽 부분의 3' 말단에 공여 스플라이싱 신호를 함유하는 하나와, 이식유전자의 3'쪽 부분의 5' 말단에 수여 스플라이싱 신호를 보유하는 또 다른 하나를 표적 세포에 전달하는 것이다. 선행 기술 계에서 벡터 게놈 2개 사이의 분자간 재조합은 재조합유전성 서열을 함유하는 개입 서열 또는 개입 ITR 접합부를 생성하게 되고, 이는 다음 단계에서 세포내 시스-스플라이싱 기작에 의해 단일 전 mRNA 분자로부터 절개되어, 완전한 전장 이식유전자 카세트로 생성되는 반면에, 본 발명에 따른 AAV 벡터계에서는 벡터 게놈 2개가 별도로 전사되고, 전 mRNA는 이의 상보성 결합 도메인을 통해 상호작용하며, 전 mRNA 2개는 트랜스 방식으로 스플라이싱되어, 완전한 (전장) 이식유전자 전사체로 생성된다.
벡터계의 효율은 이중 AAV 벡터 접근법, 예컨대 본원에 기재되어 있거나 당 업자에게 공지된 수단과 기술에 의해 제공된 관심 (전장) 단백질 또는 이 관심 단백질을 암호화하는 mRNA의 발현을 측정함으로써 평가될 수 있다.
제2 결합 도메인은 제1 AAV 벡터의 제1 결합 도메인에 상보성이다. 절대적 상보성이 바람직하지만, 반드시 그래야 하는 것은 아니다. 본원에 언급된 바와 같이 제1 결합 도메인의 일부에 "상보성"인 서열이란, 제1 결합 도메인과 혼성화되어 안정적인 이중체를 형성할 수 있기에 충분한 상보성을 가지는 서열을 의미한다. 혼성화하는 능력은 상보성 정도와 핵산 길이 둘 다에 의존할 것이다(예를 들어 문헌(Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, 2d Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.) 참조). 그러므로 제2 결합 도메인에 관하여 사용된 바와 같은 상보성은, 제2 결합 도메인이 서열, 즉 제1 AAV에 포함된 제1 결합 도메인과 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 상보성인 서열, 바람직하게는 제1 AAV에 포함된 제1 결합 도메인과 적어도 90%, 95%, 98%, 99% 또는 100% 상보성인 서열을 포함함을 의미한다.
제1 결합 도메인은 서열 번호 17에 제시된 바와 같은 서열, 또는 서열 번호 17의 서열에 대해 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 가질 수 있거나 포함할 수 있다. 제2 결합 도메인은 서열 번호 18에 제시된 바와 같은 서열, 또는 서열 번호 18의 서열에 대해 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 가질 수 있거나 포함할 수 있다. 당 업자는, 제2 결합 도메인이 제1 결합 도메인에 대해 상보성인 한, 제1 결합 도메인과 제2 결합 도메인이 교환될 수 있음을 이해할 것이다. 그러므로 제1 결합 도메인은 서열 번호 18에 제시된 바와 같은 서열, 또는 서열 번호 17의 서열에 대해 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 가질 수 있거나 포함할 수 있다. 제2 결합 도메인은 서열 번호 17에 제시된 바와 같은 서열, 또는 서열 번호 18의 서열에 대해 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 가질 수 있거나 포함할 수 있다.
대안적으로, 제2 결합 도메인은 서열 번호 18, 27, 28, 32 및 33중 임의의 하나의 서열, 또는 서열 번호 18, 27, 28, 32 및 33중 임의의 하나의 서열에 대해 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 서열 동일성을 가지는 서열을 가지거나 포함하고, 제1 결합 도메인은 제2 결합 도메인에 대해 상보성인 서열, 바람직하게는 제2 결합 도메인에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 상보성인 서열, 더욱 바람직하게 제2 결합 도메인과 적어도 90%, 95%, 98%, 99% 또는 100% 상보성인 서열, 더욱더 바람직하게 제2 결합 도메인에 대해 98%, 99% 또는 100% 상보성인 서열을 가지거나 포함한다. 당 업자는, 결합 도메인들이 서로에 대해 상보성인 한, 제1 결합 도메인과 제2 결합 도메인이 교환될 수 있음을 이해할 것이다. 그러므로 제1 결합 도메인은 서열 번호 18, 27, 28, 32 및 33중 임의의 하나의 서열, 또는 서열 번호 18, 27, 28, 32 및 33중 임의의 하나의 서열에 대해 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 가질 수 있거나 포함할 수 있으며, 제2 결합 도메인은 제1 결합 도메인에 대해 상보성인 서열, 바람직하게는 제1 결합 도메인에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 상보성인 서열, 더욱 바람직하게 제1 결합 도메인에 대해 적어도 90%, 95%, 98%, 99% 또는 100% 상보성인 서열, 더욱더 바람직하게 제1 결합 도메인에 대해 98%, 99% 또는 100% 상보성인 서열을 가지거나 포함한다.
서열 번호 27 또는 28의 50번 ~ 100번 뉴클레오티드는 결합 도메인으로서 유효함이 추가로 확인되었다. 그러므로 일 구현예에서, 제2 결합 도메인 또는 제1 결합 도메인은 서열 번호 27 또는 28의 50번 ~ 100번 뉴클레오티드 서열, 또는 서열 번호 27 또는 28의 50번 ~ 100번 뉴클레오티드 서열에 대해 80%, 85%, 90%, 95%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 포함한다. 바람직하게, 결합 도메인은 서열 번호 27 또는 28의 50번 ~ 100번 뉴클레오티드 서열, 또는 서열 번호 27 또는 28의 50번 ~ 100번 뉴클레오티드 서열에 대해 80%, 85%, 90%, 95%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 포함하는 뉴클레오티드 적어도 80개를 가진다. 당 업자는 또 다른 결합 도메인이 제1 결합 도메인 또는 제2 결합 도메인 각각에 상보성인 서열, 바람직하게 제1 결합 도메인 또는 제2 결합 도메인 각각에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 상보성인 서열, 더욱 바람직하게 제1 결합 도메인 또는 제2 결합 도메인 각각에 대해 적어도 90%, 95%, 98%, 99% 또는 100% 상보성인 서열, 더욱더 바람직하게 제1 결합 도메인 또는 제2 결합 도메인 각각에 대해 98%, 99% 또는 100% 상보성인 서열을 가지거나 포함함을 이해할 것이다.
다른 구현예에서, 제2 결합 도메인 또는 제1 결합 도메인은 서열 번호 18, 32 또는 33의 1번 ~ 50번 뉴클레오티드 서열, 또는 서열 번호 18, 32 또는 33의 1번 ~ 50번 뉴클레오티드 서열에 대해 80%, 85%, 90%, 95%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 포함한다. 바람직하게 결합 도메인은 서열 번호 18, 32 또는 33의 1번 ~ 50번 뉴클레오티드 서열, 또는 서열 번호 18, 32 또는 33의 1번 ~ 50번 뉴클레오티드 서열에 대해 80%, 85%, 90%, 95%, 98%, 99% 또는 100%의 서열 동일성을 가지는 서열을 포함하는 뉴클레오티드를 적어도 80개 가진다. 당 업자는, 또 다른 결합 도메인이 제1 결합 도메인 또는 제2 결합 도메인 각각에 대해 상보성인 서열, 바람직하게 제1 결합 도메인 또는 제2 결합 도메인 각각에 대해 적어도 80%, 85%, 90%, 95%, 98%, 99% 또는 100% 상보성인 서열, 더욱 바람직하게 제1 결합 도메인 또는 제2 결합 도메인 각각에 대해 적어도 90%, 95%, 98%, 99% 또는 100% 상보성인 서열, 더욱더 바람직하게 제1 결합 도메인 또는 제2 결합 도메인 각각에 대해 98%, 99% 또는 100% 상보성인 서열을 가지거나 포함함을 이해할 것이다.
결합 도메인은 약 15개 ~ 약 250개 뉴클레오티드, 약 15개 ~ 약 200개 뉴클레오티드, 약 100개 ~ 약 200개 뉴클레오티드, 또는 500개, 400개, 300개 또는 200개 미만의 뉴클레오티드를 가질 수 있다. 일 구현예에서, 결합 도메인은 50개 ~ 150개의 뉴클레오티드, 바람직하게 80개 ~ 120개 뉴클레오티드, 더욱더 바람직하게 90개 ~ 110개 뉴클레오티드 또는 약 100개 뉴클레오티드를 포함한다. 본원에 기재된 바와 같은 결합 도메인은 또한 본 발명에 따른 전 mRNA 트랜스-스플라이싱 분자 또는 방법에 사용될 수 있다.
본 발명에 따라 사용되는 바와 같은 제1 결합 도메인 및 제2 결합 도메인은 인간 서열 또는 비 인간 서열, 예컨대 세균 서열로부터 유래될 수 있다. 비 인간 서열은, 예컨대 치료법(구체적으로 유전자 치료법)에서 인간에 사용되기 위하여 인간 세포내에서 표적을 벗어나는 현상(off-target effect)을 피하는 것이 바람직하다.
본원에 기재된 바와 같은 제2 AAV 벡터와, 선택적으로 제1 AAV 벡터는 핵산 서열의 3'쪽에 위치하는 종결 신호, 예컨대 폴리아데닐화(폴리 A) 신호를 포함할 수 있다. 폴리 A 신호/서열은 당 업자에게 공지되어 있으며, 다수의 적합한 종, 예컨대 SV-40, 인간 및 소(이에 한정되는 것은 아님)로부터 유래될 수 있다. "폴리 A"(A는 아데닐산)란, 가공된 전사체의 폴리아데닐화를 가능하게 하는 것으로서, 다수의 아데노신 일인산염을 포함하는 핵산 서열, 예컨대 AAUAAA 공통 서열을 포함하는 핵산 서열을 지칭한다. 유전자 파괴 또는 선택 카세트(GDSC)에서, 폴리 A 서열은 리포터 및/또는 선택가능한 마커 유전자의 하류에 위치하면서, 전사체 말단을 RNA 중합효소로 신호전달한다. AAV 벡터는 서열 번호 16의 폴리 A 서열, 또는 서열 번호 16에 제시된 폴리 A 서열에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 100%의 서열 동일성을 가지는 서열을 포함할 수 있음이 상상된다.
본 발명의 AAV 벡터 또는 기타 벡터는 또한, 선택적으로 1개 이상의 전사 종결 서열, 1개 이상의 번역 종결 서열, 1개 이상의 신호 펩티드 서열, 1개 이상의 내부 리보좀 도입 부위(IRES), 및/또는 1개 이상의 인핸서 요소 또는 이것들의 임의의 조합을 추가로 포함할 수 있다. 전사 종결 영역은, 통상 진핵생물 또는 바이러스 유전자 서열의 3'쪽 미번역 영역으로부터 수득될 수 있다. 전사 종결 서열은 암호화 서열의 하류에 위치하여, 효율적인 종결을 제공할 수 있다. 신호 펩티드 서열은, 작동 가능하게 연결된 폴리펩티드를 번역후 세포내 도착지 1군데 이상, 예를 들어 특정 소기관 구획 또는 단백질 합성 및/또는 활성을 보이는 부위, 그리고 심지어 세포외 환경으로 국소화(localization)시키는데 관여하는 정보를 암호화하는 아미노 말단 펩티드 서열이다.
개시된 AAV 벡터 또는 벡터들중 하나에는 인핸서(즉 유전자 전사를 증가시키는 시스-작용성 조절 요소)도 또한 포함될 수 있다. 다양한 인핸서 요소가 관련 분야의 당 업자들에게 공지되어 있으며, CaMV 35S 인핸서 요소, 거대세포바이러스(CMV) 초기 프로모터 인핸서 요소, SV40 인핸서 요소뿐 아니라, 이것들의 조합 및/또는 유도체를 포함하나, 이에 한정되는 것은 아니다. 관심 구조 유전자에 의해 암호화되는 mRNA의 폴리아데닐화를 유도하거나 조절하는 1개 이상의 핵산 서열도 또한 선택적으로 본 발명의 벡터들 중 1개 이상에 포함될 수 있다.
개시된 이중 벡터계는 유전자 치료법 및/또는 바이러스 기술 분야의 당 업자들에게 공지된 방법들 중 임의의 것 한 가지 이상이 사용되어 선택된 포유동물 세포 1개 이상에 도입될 수 있다. 이러한 방법으로는 형질감염, 미세주입, 전기천공, 리포펙션, 세포 융합 및 인산칼슘 침전법뿐 아니라 유전자총법을 포함하나, 이에 한정되는 것은 아니다. 일 구현예에서, 본 발명의 벡터는, 예컨대 리포펙션(즉 양이온성 지질 1개 이상으로부터 제조된 리포좀을 통한 DNA 형질감염)에 의해 생체내 도입될 수 있다. 선택된 세포 1개 이상으로 벡터가 도입되는 것을 촉진하기 위해 벡터를 캡슐화할 리포좀을 제조하는데 합성 양이온성 지질(LIPOFECTIN, Invitrogen Corp., La Jolla, Calif., USA)이 사용될 수 있다. 본 발명의 벡터계는 또한 당 업자들에게 공지된 방법이 이용되어 "나출된(naked)" DNA로서 생체내 도입될 수 있다.
본 발명은 또한 본 발명의 핵산 서열 및/또는 AAV 벡터 및/또는 AAV 벡터계를 포함하는 키트에 관한 것이기도 하다.
본 발명은 또한 관심 핵산 서열을 제조하기 위한 방법으로서,
(A) 핵산 서열과 숙주 세포를 접촉시키는 단계로서, 이 핵산 서열은
(i) 1개 이상의 공여 스플라이싱 부위 서열;
(ii)(a)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(b)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[단 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열; 및
(iii)(a) 관심 뉴클레오티드 서열 또는 이의 일부[단 여기서 공여 스플라이싱 부위에 대해 3'쪽 그리고 수여 스플라이싱 부위에 대해 5'쪽에 위치함]를 포함하는 단계;
(B)(i)의 공여 스플라이싱 부위 서열(들) 1개 이상에서, 그리고 (ii)의 수여 스플라이싱 영역 서열에서 핵산 서열을 절단함으로써, 관심 뉴클레오티드 서열 또는 이의 일부를 공여 스플라이싱 부위 및 수여 스플라이싱 영역으로부터 분리하는 단계
를 포함하는 방법에 관한 것이다.
당 업자에게 공지되어 있는 바와 같이, 스플라이싱은 상이한 방식으로 일어날 수 있다. 예를 들어 시스-스플라이싱과 트랜스-스플라이싱이 당 업자에게 공지되어 있다. 시스-스플라이싱은 인트론 서열이 RNA 전사체(mRNA 또는 기타 RNA)로부터 시스 방식으로 절단되는 과정이다. 숙주 세포내에서 진행되는 이 과정은 핵내에서 일어난다. 시스-스플라이싱은 당 업자에게 공지되어 있으며, 특히 문헌[Alberts B, Johnson A, Lewis J, et al.(2002) "Molecular Biology of the Cell. 4th edition." New York: Garland Science under the headline "from DNA to RNA"]에 기재되어 있다.
일반적으로 질환의 치료법 또는 치료 또는 예방은, 치료 또는 예방을 필요로 하는 포유동물 대상체에, 예컨대 대상체의 표적 세포, 예컨대 안 세포에서 유전자 생성물을 발현시키는 조절 서열의 제어하에 있으며, 관심 이식유전자/뉴클레오티드 서열을 암호화하는 핵산 서열 또는 이의 단편을 운반하는, 본원에 기재된 AAV 벡터, AAV 벡터계, 벡터 또는 핵산 분자, 예컨대 전 mRNA 트랜스-스플라이싱 분자와, 선택적으로는 약학적으로 허용 가능한 추가 담체를 포함하는 조성물 유효량만큼을 투여하는 단계를 포함한다.
그러므로 본 발명은 또한 본원에 기재된 바와 같은 AAV 벡터, AAV 벡터계, 벡터 또는 핵산 서열(예컨대 전 mRNA 트랜스-스플라이싱 분자)을 포함하는 약학 조성물에 관한 것이기도 하다. 이러한 약학 조성물은 담체, 바람직하게는 약학적으로 허용 가능한 담체를 추가로 포함할 수 있다.
본 약학 조성물은 주사가능한 용액의 형태일 수 있다. 주사가능한 용액 또는 현탁액은 적합한 무독성의 약학적으로 허용 가능한 희석제나 용매, 예컨대 만니톨, 1,3-부탄디올, 물, 링거 용액 또는 등장성 염화나트륨 용액, 또는 적합한 분산제 또는 습윤제 및 현탁제, 예컨대 멸균, 무자극성, 불휘발성 오일, 예컨대 합성 모노글리세라이드 또는 디글리세라이드, 그리고 지방산, 예컨대 올레산을 이용하여 당 분야에 공지된 바에 따라 제제화될 수 있다.
주사가능한 제제에 있어서, 약학 조성물은 적합한 부형제와 혼합되어 동결건조된 분말의 형태로서, 적합한 바이알이나 튜브에 담길 수 있다. 약물은 임상에서 사용되기 전, 이의 동결건조 분말을 적합한 용매계에 용해하여 재구성됨으로써 정맥내 또는 근육내 주사에 적합한 조성물, 또는 망막하, 유리체내 또는 결막하 주사에 적합한 조성물로 제조될 수 있다.
본 발명의 약학 조성물은 점안액으로 제제화/투여됨도 또한 상상된다.
본 발명의 AAV 벡터, AAV 벡터계, 벡터, 또는 핵산 서열(예컨대 전 mRNA 트랜스-스플라이싱 분자) 또는 본 발명의 약학 조성물은 치료적 유효량으로 투여될 수 있다. AAV 벡터, AAV 벡터계, 핵산 서열, 예컨대 전 mRNA 트랜스-스플라이싱 분자 또는 벡터에 대한 "치료적 유효량"은 숙련자에게 잘 알려질 바와 같이, 여러 요인들, 예컨대 환자 체내에서의 활성 화합물의 안정성, 경감될 병태의 심각성, 치료대상 환자의 총 체중, 투여 경로, 활성 화합물의 신체에의 흡수, 신체에 의한 분배 및 배출의 용이성, 치료대상 환자의 나이 및 감수성, 그리고 부작용 등(이에 한정되는 것은 아님)에 따라 달라질 수 있다. 투여량은 다양한 요인들이 시간이 경과함에 따라 달라질 때 조정될 수 있다.
원칙적으로 본 발명의 AAV 벡터, AAV 벡터계, 벡터, 또는 핵산 서열, 예컨대 전 mRNA 트랜스-스플라이싱 분자 또는 본 발명의 약학 조성물은 임의의 적합한 방법으로 투여될 수 있다. 예컨대 광 수용기 세포를 표적화하는데 사용하기 위한 것으로서, 바람직한 이식유전자(즉 관심 뉴클레오티드 서열)를 포함하는 본 발명의 AAV 벡터, AAV 벡터계, 벡터, 핵산 서열 또는 약학 조성물은 망막하 또는 유리체내 주사가 의도되는 약학 조성물로 제제화될 수 있다. 본원에 기재된 방법에 유용할 수 있는 투여의 다른 형태로서는 요망되는 장기(예컨대 눈)에의 직접 전달(예컨대 점안액), 구강, 흡입, 비내, 기관내, 정맥내, 근육내, 피하, 피내, 및 기타 비경구 투여 경로를 포함하나, 이에 한정되는 것은 아니다. 요망된다면 투여 경로는 조합될 수 있다
더욱이 치료법에 대해 표적화될 특정 안 세포의 구역을 동정하기 위한 비 침습적 망막 영상화 및 기능 연구를 수행하는 것이 바람직할 수 있다.
본원에 기재된 바와 같은 AAV 벡터, AAV 벡터계, 벡터, 또는 핵산 서열, 예컨대 전 mRNA 트랜스-스플라이싱 분자 또는 본 발명의 약학 조성물은 본원에 기재된 바와 같이 생리적으로 허용 가능한 담체와 섞여 대상체에 투여될 수 있다. 약학 조성물중 AAV의 농도 또는 투여시 AAV의 농도는 1 μl당 총 벡터 게놈 10E8개 내지 10E12개, 바람직하게 1 μl당 총 벡터 게놈 6 x 10E8개 내지 6 x 10E9개일 수 있다. AAV는 또한 1 μl당 약 10E9개의 벡터 게놈의 농도로 투여될 수 있다
본 발명의 AAV 벡터, AAV 벡터계, 벡터, 또는 핵산 서열(예컨대 전 mRNA 트랜스-스플라이싱 분자) 또는 약학 조성물은 단독으로 또는 기타 치료와 병행하여 투여될 수 있다. 그러므로 약학 조성물도 또한 1개 이상의 추가 활성 성분을 추가로 포함할 수 있거나, 또는 대안적으로 포함할 수 있다.
본 발명에 사용되기 위한 약학 조성물, AAV 벡터, AAV 벡터계, 벡터, 전 mRNA 트랜스-스플라이싱 분자 또는 핵산 서열은 대상체에 투여될 수 있다. 본원에 기재된 바와 같은 AAV 벡터, AAV 벡터계, 벡터, 전 mRNA 트랜스-스플라이싱 분자, 핵산 서열 또는 약학 조성물은 인간의 치료법 및 수의학 분야 둘 다, 바람직하게는 안 장애 치료, 구체적으로 안 장애의 유전자 치료법에 적용될 수 있다. 적합한 안 장애의 비제한적 예로서는 상염색체 열성 중증 조기 발병 망막변성증(레버 선천성 흑내장), 선천성 색맹, 스타가르트병, 베스트병(노른자 황반변성), 도인병, 망막색소변성증(구체적으로 상염색체 우성, 상염색체 열성, X-연관 이유전자 또는 다유전자 망막색소변성증), (X-연관) 망막층간분리증, 황반변성증(AMD), 노인성 황반변성증, 위축성 노인성황반변성증, 신생혈관 AMD, 당뇨병성 황반증, 증식성 당뇨병성 망막병증(PDR), 낭포황반부종, 중심성망맥락막염, 망막박리, 안내염, 녹내장, 후방 포도막염, 선천성 고정형 야맹증, 맥락막결손, 조기 발병 망막 이영양증, 원추세포 이영양증, 간상-원추 이영양증 또는 원추-간상 이영양증, 패턴 이영양증, 어셔 증후군 및 기타 증상성 섬모병증, 예컨대 바르데-비들 증후군, 주버트 증후군, 시니어-뢰켄 증후군 또는 알스트룀 증후군이 있다.
대상체는 포유동물 또는 기타 임의의 척추동물일 수 있다. 적합한 포유동물의 예로서는 마우스, 래트, 소, 염소, 양, 돼지, 개, 고양이, 말, 기니아 피그, 개과 동물, 햄스터, 밍크, 바다표범, 고래, 낙타, 침팬지, 레서스 원숭이 및 인간을 포함하나, 이에 한정되는 것은 아니며, 인간이 바람직하다. 기타 척추동물의 예로서는 제브라피시, 도롱뇽, 칠면조, 닭, 거위, 오리, 쇠오리, 청둥 오리, 찌르레기, 북부 고방 오리, 갈매기, 백조, 뿔닭 또는 몇 가지 물새류를 포함하나, 이에 한정되는 것은 아니다.
본 발명은 또한 광 수용기 세포 질환을 치료하는데 사용하기 위한 본 발명의 AAV 벡터, AAV 벡터계, 벡터, 핵산 서열(예컨대 전 mRNA 트랜스-스플라이싱 분자) 또는 약학 조성물에 관한 것이기도 하다. 이들 구현예에서, AAV 벡터(예컨대 rAAV) AAV 벡터, AAV 벡터계, 벡터, 핵산 서열(예컨대 전 mRNA 트랜스-스플라이싱 분자) 또는 약학 조성물은 치료 폴리펩티드 또는 이의 일부를 암호화하는 이종 핵산, 치료 핵산 또는 이의 일부, 치료 단백질/폴리펩티드 또는 이의 일부, 또는 치료 분자 또는 이의 일부인 관심 뉴클레오티드 서열을 포함할 수 있다.
비 암호화 RNA 서열이 제거되도록 진화된 mRNA 스플라이싱과 마찬가지로, 불필요한 단백질 서열도 단백질 스플라이싱이라 공지된 과정 동안 절단될 수 있다. 이 내용에서, 엑스테인(extein)(엑손의 유의어)이라 지칭되는 단백질 단편들은 소위 인테인(intein)(인트론의 유의어) 제거시 함께 스플라이싱될 수 있다. 복잡한 스플라이싱 기구를 필요로 하는 mRNA 스플라이싱과 대조적으로, 단백질 스플라이싱은 자가촉매적 화학 과정이다. 단백질 스플라이싱은 또한 상이한 단백질 2개 사이에서 일어날 수 있는데, 이 과정은 단백질 트랜스-스플라이싱이라 공지되어 있다. 이를 위하여 인테인은 두 부분으로 분할되며, 이 부분들 각각은 융합될 단백질에 태깅(tagging)된다. 이 접근법은 추가 요소가 필요 없는 단백질 또는 폴리펩티드 또는 이의 부분 2개의 흉터없는(scarless) 융합을 유도한다. 분할-인테인 기술은 mRNA 트랜스-스플라이싱과 합하여져, 단백질 재구성 효율을 한층 더 향상시킬 수 있다. 그러므로 일 구현예에서, 제1 핵산 서열 또는 제1 AAV 벡터는 관심 폴리펩티드의 N-말단부(또는 관심 핵산 서열의 5'부)를 암호화하는 뉴클레오티드 서열과, 공여 스플라이싱 부위 사이에 인테인의 N-말단 부분을 암호화하는 핵산 서열을 추가로 포함하고, 제2 핵산 서열 또는 제2 AAV 벡터는 관심 폴리펩티드의 C-말단부(또는 관심 핵산 서열의 3'부)를 암호화하는 뉴클레오티드 서열과, 수여 스플라이싱 영역 사이에 인테인의 C-말단 부분을 암호화하는 핵산 서열을 추가로 포함한다.
본 발명의 ASS에 대해 기재된, 실현가능한 구현예들 모두는 본원에 기재된 바와 같은 방법, 핵산 서열, 예컨대 전 mRNA 트랜스-스플라이싱 분자, 키트, AAV 벡터, AAV 벡터계 및 용도에 필요한 부분만 약간 수정되어 사용될 수 있음은 명백하다.
본 발명은 하기 항목들에 의해 추가로 특징지어진다:
1. (i)(ia)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[단 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열; 및
(ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽에 위치하는 관심 뉴클레오티드 서열
을 포함하는 핵산 서열의, 수여 스플라이싱 영역에서의 절단을 통해 이 수여 스플라이싱 영역 서열로부터 관심 뉴클레오티드 서열을 분리하기 위한 용도.
2. (i)(ia)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[단 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열
을 포함하는 것으로서, 선택적으로는 수여 스플라이싱 영역에서의 절단을 통하여, 이 수여 스플라이싱 영역 서열로부터 관심 뉴클레오티드 서열을 분리하기 위한 핵산 서열.
3. 항목 1의 핵산 서열 또는 항목 2의 핵산 서열의 용도로서, 이 수여 스플라이싱 영역은 분지점 뉴클레오티드, 바람직하게 아데노신 및/또는 인트론 스플라이싱 인핸서를 추가로 포함하는 용도.
4. 선행 항목들중 어느 한 항목의 용도 또는 핵산 서열로서, 이 수여 스플라이싱 영역은 (c) 분지점 뉴클레오티드 서열을 추가로 포함하고, 이 분지점 뉴클레오티드 서열은
(ca) 1개 ~ 15개의 뉴클레오티드를 포함하고;
(cb) 분지점 뉴클레오티드, 바람직하게는 아데노신(A)를 포함하고;
(cc) 피리미딘 대역 및 수여 스플라이싱 부위에 대해 5'쪽에 위치하는,
용도 또는 핵산 서열.
5. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 이 피리미딘 대역, 수여 스플라이싱 영역, 그리고 선택적으로 추가의 분지점 서열 및/또는 인트론 스플라이싱 인핸서는 총 약 200개, 약 150개, 약 100개, 약 50개, 약 45개, 약 40개, 약 35개, 약 30개, 약 25개, 약 20개, 약 15개 또는 그 이하의 뉴클레오티드, 바람직하게는 26개의 뉴클레오티드를 포함하는, 핵산 서열 또는 핵산 서열의 용도.
6. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서,
(a) 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT을 포함하고;
(b) 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가지고/가지거나;
(c) 수여 스플라이싱 부위는 서열 CAGG를 가지는, 핵산 서열 또는 핵산 서열의 용도.
7. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 수여 스플라이싱 영역은
(a) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(b) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(c) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(d) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(e) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(f) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(g) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(h) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임]; 또는
(i) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]
를 추가로 포함하는, 핵산 서열 또는 핵산 서열의 용도.
8. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 수여 스플라이싱 영역은 서열 번호 3 또는 4의 서열을 가지는, 핵산 서열 또는 핵산 서열의 용도.
9. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 핵산 서열은 공여 스플라이싱 부위를 추가로 포함하는, 핵산 서열 또는 핵산 서열의 용도.
10. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 핵산 서열은 프로모터를 추가로 포함하고, 바람직하게 핵산 서열은 DNA 서열이며, 프로모터를 추가로 포함하는, 핵산 서열 또는 핵산 서열의 용도.
11. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 핵산 서열은
(i)(iia)(iiaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iiab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(iib)(iiba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(iibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역;
(ii) 관심 뉴클레오티드 서열[단, 여기서 수여 스플라이싱 영역은 관심 뉴클레오티드 서열에 대해 3'쪽 또는 5'쪽에 위치함];
(iii) 관심 뉴클레오?? 서열에 대해 3'쪽 또는 5'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 결합 도메인; 그리고
(iv) 결합 도메인과 수여 스플라이싱 영역 사이에 위치하는 선택적 스페이서 서열
을 포함하는, 핵산 서열 또는 핵산 서열의 용도.
12. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 핵산 서열은
(i)(ia)(iiiaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iiiab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역;
(ii) 관심 뉴클레오티드 서열[단, 여기서 수여 스플라이싱 영역은 관심 뉴클레오티드 서열에 대해 5'쪽에 위치함];
(iii) 관심 뉴클레오티드 서열에 대해 3'쪽에 위치하는 공여 스플라이싱 부위;
(iv) 관심 뉴클레오티드 서열에 대해 5'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제1 결합 도메인;
(v) 관심 뉴클레오티드 서열에 대해 3'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제2 결합 도메인;
(vi) 제1 결합 도메인과 수여 스플라이싱 영역 사이에 위치하는, 선택적 제1 스페이서 서열; 및
(vii) 제2 결합 도메인과 공여 스플라이싱 부위 사이에 위치하는, 선택적 제2 스페이서 서열
을 포함하는, 핵산 서열 또는 핵산 서열의 용도.
13. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 도치된 말단 반복부 적어도 2개를 포함하는 핵산 서열을 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 아데노-연관 바이러스(AAV) 벡터로서, 상기 핵산 서열은 5' → 3' 방향으로
(i) 프로모터;
(ii) 선택적 스페이서 서열;
(iii)(a)(aa) 5개 ~ 25개의 뉴클레오티드를 포함하고,
(ab) 이 5개 ~ 25개의 뉴클레오티드중 뉴클레오티드중 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(b) 피리미딘 대역에 대해 3'쪽에 위치하고, 서열 NAGG[여기서 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열;
(iv) 관심 뉴클레오티드 서열; 그리고
(v) 선택적 종결 서열, 바람직하게 폴리 A 서열
을 포함하는, 핵산 서열 또는 핵산 서열의 용도.
14. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 수여 스플라이싱 영역은 벡터, AAV 벡터 및/또는 전 mRNA 트랜스-스플라이싱 분자내에 위치하는, 핵산 서열 또는 핵산 서열의 용도.
15. 선행 항목들중 어느 한 항목의 핵산 서열 또는 핵산 서열의 용도로서, 수여 스플라이싱 영역은 트랜스-스플라이싱에 사용되는, 핵산 서열 또는 핵산 서열의 용도.
16. 핵산 서열을 제조하기 위한 방법으로서,
(A) 1개 이상의 공여 스플라이싱 부위 서열을 포함하는 제1 핵산 서열을 제공하는 단계;
(B)(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위를 포함하는 수여 스플라이싱 영역 서열;
(ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽에 위치하는 관심 뉴클레오티드 서열
을 포함하는 제2 핵산 서열을 제공하는 단계;
(C) 핵산 서열을 수득하는 단계
를 포함하는 방법.
17. 항목 16의 방법으로서, 이 방법은
(D) 공여 스플라이싱 부위 서열(들) 1개 이상에서 제1 핵산 서열을 절단하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계; 및
(E) 절단된 제1 핵산 서열을, 절단된 제2 핵산 서열에 결찰시킴으로써 핵산 서열을 수득하는 단계
를 추가로 포함하는 방법.
18. 항목 16 또는 17의 방법으로서, 제1 핵산 서열은 관심 뉴클레오티드 서열 또는 이의 일부를 추가로 포함하고, 관심 뉴클레오티드 서열의 적어도 일부는 공여 스플라이싱 부위에 대해 5'쪽에 위치하고, 제2 핵산 서열은 관심 뉴클레오티드 서열 또는 이의 일부를 추가로 포함하고, 관심 뉴클레오티드 서열의 적어도 일부는 스플라이싱 수여 스플라이싱 영역에 대해 3'쪽에 위치하는 방법.
19. 항목 16 내지 18중 어느 한 항목의 방법으로서, 제1 핵산 서열 및 제2 핵산 서열은 숙주 세포에 도입되고, 바람직하게 제1 핵산 서열 및 제2 핵산 서열은 재조합 핵산 서열인 방법.
20. 핵산 서열을 제조하기 위한 방법으로서, 이 방법은
(A) 1개 이상의 공여 스플라이싱 부위 서열을 포함하는 제1 핵산 서열을 제공하는 단계;
(B)(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열을 포함하는 제2 핵산 서열을 제공하는 단계;
(C) 1개 이상의 공여 스플라이싱 부위 서열(들)에서 제1 핵산 서열을 절단하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계;
(D) 절단된 제1 핵산 서열을 절단된 제2 핵산 서열에 결찰시킴으로써, 핵산 서열을 수득하는 단계
를 포함하는 방법.
21. 항목 16 내지 20중 어느 한 항목의 방법으로서, 제1 핵산 서열은 관심 뉴클레오티드 서열 또는 이의 일부를 추가로 포함하고, 관심 뉴클레오티드 서열의 적어도 일부는 공여 스플라이싱 부위에 대해 5'쪽에 위치하고, 제2 핵산 서열은 관심 뉴클레오티드 서열 또는 이의 일부를 추가로 포함하고, 관심 뉴클레오티드 서열의 적어도 일부는 스플라이싱 수여 스플라이싱 영역에 대해 3'쪽에 위치하는 방법.
22. 항목 16 내지 21중 어느 한 항목의 방법 또는 핵산을 제조하기 위한 방법으로서,
(A) 전 mRNA 트랜스-스플라이싱 분자 서열 또는 상기 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 포함하는 제1 핵산 서열을 숙주 세포에 도입하는 단계로서, 이 제1 전 mRNA 트랜스-스플라이싱 분자는 5' → 3' 방향으로
(a) 관심 뉴클레오티드 산 서열의 5'부;
(b) 공여 스플라이싱 부위;
(c) 선택적 스페이서 서열;
(d) 제1 결합 도메인; 및
(e) 선택적 종결 서열, 바람직하게는 폴리 A 서열을 포함하는 단계;
(B) 전 mRNA 트랜스-스플라이싱 분자 서열 또는 상기 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 포함하는 제2 핵산 서열을 숙주 세포에 도입하여, 관심 핵산 서열을 수득하는 단계로서, 이 제2 전 mRNA 트랜스-스플라이싱 분자는 5' → 3' 방향으로
(i) 제1 핵산 서열의 제1 표적 도메인에 상보성인 제2 결합 도메인;
(ii)(iia)(iiaa) 5개 내지 25개 뉴클레오티드를 포함하고;
(iiab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(iib)(iiba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(iibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열;
(iii) 관심 뉴클레오티드 서열의 3'부를 포함하는 단계
를 포함하고, 선택적으로
(C) 공여 스플라이싱 부위 서열에서 제1 핵산 서열을 절단하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계; 그리고
(D) 관심 뉴클레오티드 서열의 5'부를 포함하는 절단된 제1 핵산 서열을, 관심 뉴클레오티드 서열의 3'부를 포함하는 절단된 제2 핵산 서열에 결찰시킴으로써, 관심 핵산 서열을 수득하는 단계
를 추가로 포함하는 방법.
23. 항목 16 내지 22중 어느 한 항목의 방법으로서,
(a) 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT을 포함하고;
(b) 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가지고/가지거나;
(c) 수여 스플라이싱 부위는 서열 CAGG를 가지는 방법.
24. 항목 16 내지 23중 어느 한 항목의 방법으로서,
수여 스플라이싱 영역은
(a) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(b) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(c) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(d) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(e) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(f) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(g) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(h) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(i) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]
를 추가로 포함하는 방법.
25. (i)(ia)(iaa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열; 및
(ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽에 위치하는 관심 뉴클레오티드 서열
을 포함하는 핵산 서열.
26. (i)(ia)(iaa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[단 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열; 및
(ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽에 위치하는 관심 뉴클레오티드 서열
을 포함하되, 선택적으로 관심 뉴클레오티드 서열은 서열 번호 10의 로돕신 유전자가 아니고/아니거나 서열 번호 9의 로돕신 유전자의 엑손 3이 아니고/아니거나 서열 번호 9의 로돕신 유전자의 엑손 3이 아니고/아니거나, 관심 뉴클레오티드 서열은 서열 번호 9 및/또는 10에 보인 바와 같은 서열을 포함하지 않는, 핵산 서열.
27. 항목 25 또는 26의 핵산 서열로서, 이 핵산 서열은 그 길이가 길어야 150개 뉴클레오티드인 핵산 서열.
28. 항목 25 내지 27중 어느 한 항목의 핵산 서열로서, 이 핵산 서열은 그 길이가 길어야 5500개 뉴클레오티드인 핵산 서열.
29. 항목 25 내지 28중 어느 한 항목의 핵산 서열로서,
(a) 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT을 포함하고/포함하거나;
(b) 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가지는 핵산 서열.
30. (ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 CAGG를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열.
31. 항목 25 내지 30중 어느 한 항목의 수여 스플라이싱 영역 서열 또는 핵산으로서,
(a) 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT을 포함하고;
(b) 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가지고/가지거나;
(c) 수여 스플라이싱 부위는 서열 CAGG를 가지는, 수여 스플라이싱 영역 서열 또는 핵산.
32. 항목 25 내지 31중 어느 한 항목의 수여 스플라이싱 영역 서열 또는 핵산으로서, 수여 스플라이싱 영역은
(a) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(b) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(c) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(d) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(e) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(f) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(g) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(h) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(i) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]
를 추가로 포함하는 수여 스플라이싱 영역 서열 또는 핵산.
33. (i)(iia)(iiaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iiab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(iib)(iiba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(iibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역;
(ii) 관심 뉴클레오티드 서열 또는 이의 일부[단, 여기서 수여 스플라이싱 영역은 관심 뉴클레오티드 서열 또는 이의 일부에 대해 3'쪽 또는 5'쪽에 위치함];
(iii) 관심 핵산 서열 또는 이의 일부에 대해 5'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 결합 도메인; 그리고
(iv) 결합 도메인과 수여 스플라이싱 영역 사이에 위치하는 선택적 스페이서 서열
을 포함하는, 전 mRNA 트랜스-스플라이싱 분자.
34. 항목 33의 전 mRNA 트랜스-스플라이싱 분자로서, 핵산 분자 및 수여 스플라이싱 영역에 대해 3'쪽에 공여 스플라이싱 부위를 추가로 포함하는 전 mRNA 트랜스-스플라이싱 분자.
35. 항목 33 또는 34의 전 mRNA 트랜스-스플라이싱 분자로서,
(i)(ia)(iiiaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iiiab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역;
(ii) 관심 뉴클레오티드 서열[단, 여기서 수여 스플라이싱 영역은 관심 뉴클레오티드 서열에 대해 5'쪽에 위치함];
(iii) 관심 뉴클레오티드 서열에 대해 3'쪽에 위치하는 공여 스플라이싱 부위;
(iv) 관심 뉴클레오티드 서열에 대해 5'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제1 결합 도메인;
(v) 관심 뉴클레오티드 서열에 대해 3'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제2 결합 도메인;
(vi) 제1 결합 도메인과 수여 스플라이싱 영역 사이에 위치하는 선택적 제1 스페이서 서열; 및
(vii) 제2 결합 도메인과 공여 스플라이싱 영역 사이에 위치하는 선택적 제2 스페이서 서열
을 포함하는, 전 mRNA 트랜스-스플라이싱 분자.
36. 항목 33 내지 35중 어느 한 항목의 전 mRNA 트랜스-스플라이싱 분자로서, 수여 스플라이싱 영역은 관심 뉴클레오티드 서열 또는 이의 일부에 대해 5'쪽에 위치하고, 결합 도메인은 수여 스플라이싱 영역에 대해 5'쪽에 위치하는, 전 mRNA 트랜스-스플라이싱 분자.
37. 항목 33 내지 36중 어느 한 항목의 전 mRNA 트랜스-스플라이싱 분자로서, 종결 서열, 바람직하게 폴리 A 서열을 추가로 포함하는, 전 mRNA 트랜스-스플라이싱 분자.
38. 항목 33 내지 37중 어느 한 항목의 전 mRNA 트랜스-스플라이싱 분자로서,
(a) 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT을 포함하고;
(b) 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가지고/가지거나;
(c) 수여 스플라이싱 부위는 서열 CAGG를 가지는, 전 mRNA 트랜스-스플라이싱 분자.
39. 항목 33 내지 38중 어느 한 항목의 전 mRNA 트랜스-스플라이싱 분자로서,
수여 스플라이싱 영역은
(a) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(b) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(c) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(d) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(e) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(f) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(g) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(h) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(i) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]
를 추가로 포함하는, 전 mRNA 트랜스-스플라이싱 분자.
40. 항목 33 내지 39중 어느 한 항목에 따른 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 서열 및 프로모터를 포함하는 DNA 분자.
41. (I) 도치된 말단 반복부 적어도 2개를 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 제1 AAV 벡터로서, 이 도치된 말단 반복부 2개 사이에 있는 상기 핵산 서열은 5' → 3' 방향으로
(a) 프로모터,
(b) 관심 폴리펩티드의 N-말단부를 암호화하는 뉴클레오티드 서열;
(c) 공여 스플라이싱 부위;
(d) 선택적 스페이서 서열;
(e) 제1 결합 도메인; 그리고
(f) 선택적 종결 서열, 바람직하게 폴리 A 서열을 포함하는, 제1 AAV 벡터;
(II) 도치된 말단 반복부 적어도 2개를 포함하는 핵산 서열을 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 제2 AAV 벡터로서, 이 도치된 말단 반복부 2개 사이에 있는 상기 핵산 서열은 5' → 3' 방향으로
(i) 프로모터;
(ii) 제1 AAV 벡터의 제1 결합 도메인에 상보성인 제2 결합 도메인;
(iii)(a)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(b)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[여기서 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열;
(iv) 관심 폴리펩티드의 C-말단부를 암호화하는 관심 뉴클레오티드 서열로서, (iva) 관심 폴리펩티드의 C-말단부와 관심 폴리펩티드의 N-말단부는 관심 폴리펩티드를 재구성하는 관심 뉴클레오티드 서열; 및
(v) 종결 서열, 바람직하게 폴리 A 서열
을 포함하는, 제2 AAV 벡터
를 포함하는 아데노-연관 바이러스(AAV) 벡터계.
42. 항목 41의 AAV 벡터계로서, 폴리펩티드는 전장 폴리펩티드이고, 제1 AAV 벡터는 관심 전장 폴리펩티드의 N-말단부를 포함하고, 제2 AAV 벡터는 관심 전장 폴리펩티드의 C-말단부를 포함하는 AAV 벡터계.
43. 항목 41 또는 42의 AAV 벡터계로서, 관심 폴리펩티드의 C-말단부는 관심 폴리펩티드, 선택적으로 관심 전장 단백질의 일부로서, 제1 AAV 벡터내에 포함되어 있던 폴리펩티드의 N-말단부로부터 사라진 일부에 대응하는 AAV 벡터계.
44. 항목 41 내지 43중 어느 한 항목의 AAV 벡터계로서, 제1 AAV 벡터 및 제2 AAV 벡터는 종결 서열, 바람직하게 폴리 A 서열을 포함하는 AAV 벡터계.
45. 도치된 말단 반복부 적어도 2개를 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 아데노-연관 바이러스(AAV) 벡터로서, 상기 핵산 서열은 5' → 3' 방향으로
(i) 프로모터;
(ii) 선택적 스페이서 서열;
(iii) 결합 도메인;
(iv)(a)(aa) 5개 ~ 25개의 뉴클레오티드를 포함하고,
(ab) 이 5개 ~ 25개의 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(b)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고,
(bb) 서열 NAGG[여기서 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열;
(iv) 관심 뉴클레오티드 서열; 그리고
(v) 선택적 종결 서열, 바람직하게 폴리 A 서열
을 포함하는, 아데노-연관 바이러스(AAV) 벡터.
46. 항목 41 내지 45중 어느 한 항목의 AAV 벡터 또는 AAV 벡터계로서,
(a) 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT을 포함하고;
(b) 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가지고/가지거나;
(c) 수여 스플라이싱 부위는 서열 CAGG를 가지는, AAV 벡터 또는 AAV 벡터계.
47. 항목 41 내지 46중 어느 한 항목의 AAV 벡터 또는 AAV 벡터계로서,
수여 스플라이싱 영역은
(a) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(b) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(c) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(d) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(e) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(f) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(g) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(h) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(i) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]
를 추가로 포함하는, AAV 벡터 또는 AAV 벡터계.
48. (ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
(iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역.
49. 선행 항목들중 어느 한 항목의 수여 스플라이싱 영역으로서, 본 발명에 따른 벡터, AAV 벡터에 사용되거나, 또는 전 mRNA 트랜스-스플라이싱 분자에 사용하기 위한 수여 스플라이싱 영역.
50. 항목 48 또는 49중 어느 한 항목의 수여 스플라이싱 영역 서열로서,
(a) 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT을 포함하고;
(b) 피리미딘 대역의 마지막 피리미딘과 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가지고/가지거나;
(c) 수여 스플라이싱 부위는 서열 CAGG를 가지는, 수여 스플라이싱 영역 서열.
51. 항목 48 내지 50중 어느 한 항목의 수여 스플라이싱 영역 서열로서,
수여 스플라이싱 영역은
(a) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(b) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(c) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
(d) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(e) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(f) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(g) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
(h) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임];
(i) 서열 CAACGAG의 뉴클레오티드 적어도 6개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임]
를 추가로 포함하는, 수여 스플라이싱 영역 서열.
52. 본 발명에 따른 수여 스플라이싱 영역, AAV 벡터, AAV 벡터계, 벡터, DNA, 핵산 서열 또는 전 mRNA 트랜스-스플라이싱 분자를 포함하는 키트.
53. 관심 핵산 서열을 제조하기 위한 방법으로서,
(A) 핵산 서열과 숙주 세포를 접촉시키는 단계로서, 이 핵산 서열은
(i) 1개 이상의 공여 스플라이싱 부위 서열;
(ii)(a)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(b)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[단 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열; 및
(iii)(a) 공여 스플라이싱 영역에 대해 3'쪽 그리고 수여 스플라이싱 영역에 대해 5'쪽에 위치하는 관심 뉴클레오티드 서열을 포함하는 단계;
(B)(i)의 공여 스플라이싱 부위 서열(들) 1개 이상과, NAGG의 수여 스플라이싱 서열(부위)의 G와 G 사이의 핵산 서열을 절단함으로써, 관심 뉴클레오티드 서열을 공여 스플라이싱 부위 및 수여 스플라이싱 영역으로부터 분리하는 단계
를 포함하는 방법.
54. 관심 핵산 서열을 제조/절단하기 위한 방법으로서,
(a)(i)(ia)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
(ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
(ib)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고;
(bb) 서열 NAGG[단 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
를 포함하는 수여 스플라이싱 영역 서열; 및
(ii)(iia) 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽에 위치하는 관심 뉴클레오티드 서열
을 포함하는 핵산 서열을 제공하는 단계;
(b) 수여 스플라이싱 영역을 절단하여, 수여 스플라이싱 영역 서열로부터 관심 뉴클레오티드 서열을 분리하는 단계
를 포함하는 방법.
55. 선행 항목들중 어느 한 항목의 핵산 분자, 전 mRNA 트랜스-스플라이싱 분자, AAV 벡터, AAV 벡터계, 벡터를 포함하는 약학 조성물.
56. 치료법, 바람직하게는 안 장애를 치료하는데 사용하기 위한, 선행 항목들중 어느 한 항목의 핵산 분자, 전 mRNA 트랜스-스플라이싱 분자, AAV 벡터, AAV 벡터계, 벡터, DNA 분자 또는 약학 조성물.
57. 관심 핵산 서열에 대해 대상체를 치료하는 방법으로서,
(a) 선행 항목들중 어느 한 항목의 핵산 분자, 전 mRNA 트랜스-스플라이싱 분자, AAV 벡터, AAV 벡터계, 벡터, DNA 분자 또는 약학 조성물 (치료학적 유효량만큼)을 (치료를 필요로 하는) 대상체, 바람직하게 안 장애가 발병한 대상체에 투여하는 단계를 포함하는 방법.
58. 의약을 제조하기 위한, 선행 항목들중 어느 한 항목의 핵산 분자, 전 mRNA 트랜스-스플라이싱 분자, AAV 벡터, AAV 벡터계, 벡터, DNA 분자 또는 약학 조성물.
59. 선행 항목들중 어느 항목의 용도를 가지거나 방법에 사용되는 핵산 분자, 전 mRNA 트랜스-스플라이싱 분자, AAV 벡터, AAV 벡터계, 벡터, DNA 분자 또는 약학 조성물로서, 안 장애는 상염색체 열성 중증 조기 발병 망막변성증(레버 선천성 흑내장), 선천성 색맹, 스타가르트병, 베스트병(노른자 황반변성), 도인병, 망막색소변성증(구체적으로 상염색체 우성, 상염색체 열성, X-연관 이유전자 또는 다유전자 망막색소변성증), (X-연관) 망막층간분리증, 황반변성증(AMD), 노인성 황반변성증, 위축성 노인성황반변성증, 신생혈관 AMD, 당뇨병성 황반증, 증식성 당뇨병성 망막병증(PDR), 낭포황반부종, 중심성망맥락막염, 망막박리, 안내염, 녹내장, 후방 포도막염, 선천성 고정형 야맹증, 맥락막결손, 조기 발병 망막 이영양증, 원추세포 이영양증, 간상-원추 이영양증 또는 원추-간상 이영양증, 패턴 이영양증, 어셔 증후군 및 기타 증상성 섬모병증, 예컨대 바르데-비들 증후군, 주버트 증후군, 시니어-뢰켄 증후군 또는 알스트룀 증후군으로 이루어진 군으로부터 선택되는 핵산 분자, 전 mRNA 트랜스-스플라이싱 분자, AAV 벡터, AAV 벡터계, 벡터, DNA 분자 또는 약학 조성물.
본원에 사용된 바와 같은 단일 형태를 나타내는 "하나의", "한" 및 "본"은 문맥 중 명백히 달리 명시되지 않는 한 복수의 대상도 포함함을 인지하여야 한다. 따라서 "하나의 시약"에 대한 언급대상은 이처럼 상이한 시약 1개 이상을 포함하고, "본 방법"에 대한 언급대상은 본원에 기술된 방법에 수정을 가할 수 있었거나, 또는 이러한 방법을 대체할 수 있었던 방법으로서 당 업자들에게 공지된 균등한 방법 및 단계들에 대한 언급대상을 포함한다.
더욱이, 측정 가능한 값, 예컨대 폴리뉴클레오티드 또는 폴리펩티드 서열의 길이, 용량, 시간의 길이, 온도 등에 관한 양을 언급할 때 본원에 사용된 바와 같은 "약"이란 용어는, 지정된 양의 ±20%, ±10%, ±5%, ±1%, ±0.5%, 또는 심지어 ±0.1%만큼의 편차를 포함하는 의미이다. 또한 본원에 사용된 바와 같은 "및/또는"이란, 연관되어 나열된 항목들 중 1가지 이상이 이룰 수 있는 모든 조합과, 그 중 임의의 조합을 지칭하고 포함할뿐 아니라, 대안으로서 해석될 때("또는")에는 조합들의 배제를 지칭하고 포함한다.
내용 중 달리 명시되지 않는 한, 본원에 기술된 본 발명의 여러가지 특징들은 임의의 조합을 이루며 사용될 수 있음이 특히 의도된다.
게다가 본 발명은, 본 발명의 몇몇 구현예에서 본원에 제시된 임의의 특징 또는 이러한 특징들의 조합이 배제 또는 생략될 수 있음도 또한 고려한다.
본 발명에 인용된 모든 간행물과 특허는 그 전체로서 참조로 인용되어 있다. 참조로 인용된 자료가 상충되거나 본 명세서와 부합하지 않는다면, 이러한 자료 중 그 어떤 것보다도 본 명세서가 우선시될 것이다.
달리 명시되지 않는 한, 일련의 요소들 앞에 붙는"적어도"란 용어는 연속된 요소들 모두를 지칭하는 것으로 이해될 것이다. 당업자들은 단지 보통으로 행하여지는 실험을 이용하여 본원에 기술된 본 발명의 구체적 구현예에 버금가는 다수의 균등물을 인지하거나, 또는 확인할 수 있을 것이다. 이러한 균등물은 본 발명에 의해 포함되도록 의도된다.
본 발명의 설명과 이에 후속되는 특허청구의 범위 전반에 걸쳐, 문맥 중 달리 요구되지 않는 한, "~를 포함하다(comprise)"라는 단어와 이의 변형어, 예컨대 "~를 포함한다(comprises)" 및 "~를 포함하는(comprising)"은 진술된 정수 또는 단계, 또는 정수들이나 단계들의 군을 포함하되, 기타 임의의 정수 또는 단계, 또는 정수나 단계의 군은 배제하지 않음을 암시하는 것으로 이해될 것이다. "~를 포함하는"이란 용어가 본원에 사용될 때, 또는 "~를 가지는(having)"이란 용어와 함께 본원에 사용될 때, 이 용어는 "~를 함유하는(containing)"이란 용어로 대체될 수 있다. 그러나 본원에 시용된 바와 같은 "~로 구성된(comprising of)"이란 용어와 이의 균등한 용어는 이하에 정의된 바와 같은 "~로 이루어진(consisting of)" 또는 "본질적으로 ~로 이루어진(consisting essentially of)"이란 용어를 포함하므로, 이 용어는 "~로 이루어진" 또는 "본질적으로 ~로 이루어진"이란 용어로 대체될 수 있다.
본원에 사용된 바와 같은 "~로 이루어진"이란 용어는, 특허청구의 범위에 명시되지 않은 임의의 요소, 단계 또는 성분을 배제한다. 본원에 사용된 바와 같은 "본질적으로 ~로 이루어진"은, 특허청구의 범위의 기본적 특징 및 신규 특징에 실질적으로 영향을 미치지 않는 재료 또는 단계를 배제하지 않는다.
본 발명에 사용된 바와 같은 서열들:
10개를 초과하는 뉴클레오티드를 가지는 하기 서열들이 본원에 언급되었다.
[표 1]
Figure pct00034
Figure pct00035
Figure pct00036
Figure pct00037
[상기 표 1에서, 추정 분지점 서열에는 밑줄이 쳐있으며, 분지점에는 이중으로 밑줄이 쳐있음과 동시에 굵은 글자로 표시되어 있고, 피리미딘 대역 서열은 이탤릭 글자로 나열되어 있으며, 수여 스플라이싱 부위는 긁은 글자로 표시되어 있다. 서열 9 및 10의 밑줄이 쳐진 부분은 돌연변이부인 620T>G와, 개시 코돈 및 종결 코돈임]
실시예
하기 실시예들은 본 발명을 설명하고 있다. 이러한 실시예들은 본 발명의 범위를 제한하는 것으로서 해석되어서는 안 될 것이다. 실시예는 예시를 위하여 포함되었으며, 본 발명은 오로지 특허청구의 범위에 의해서만 한정된다
재료 및 방법
세포 배양 및 형질감염
37℃ 및 10% CO2에서 CO2 항온처리기(Heraeus, Thermo Fisher Scientific)내 DMEM 배지 + GlutaMAX + 1 g/l 글루코스 + 피루브산염 + 10% FBS(Biochrom) + 1% 페니실린/스트렙토마이신(Biochrom)중에 인간 배 신장 293(HEK293) 세포(DMSZ)를 방치하였다. HEK293 유래 Lenti-X 293T(HEK293T) 세포(Clontech, Takara)를 동일 조건하에 DMEM 배지 + GlutaMAX + 4.5 g/l 글루코스 + 10% FBS + 1% 페니실린/스트렙토마이신중에서 배양하였다. 합류도 약 90%일 때 두 세포주를 1주일에 2회 계대배양하였다.
인산칼슘법을 이용하여 일시 형질감염을 수행하였다. 이를 위해, 세포를 6 cm의 세포 배양 평판에 접종하였다. 웨스턴 블럿팅을 위해 SpCas9 함유 플라스미드를 형질감염시킬 때, 10 cm의 세포 배양 평판을 사용하였다. 세포가 원하는 합류도인 약 70%를 달성할 때까지 세포를 밤새도록 항온처리하였다. 형질감염용 혼합 성분들을 15 ml들이 Falcon 튜브에 정해진 순서대로 넣었다. 와류(vortexing)시키면서 2x BBS를 적가하였다.
형질감염용 혼합물을 3분 ~ 4분 동안 RT에서 항온처리한 다음, 배양 배지에 적가하였다. 초기 실험(실시예 2, 도 4)을 위해 세포를 5% CO2 환경에서 24시간 동안 항온처리한 다음, 배지를 교환하지 않고 세포를 수득하였다. 최적화된 프로토콜(실시예 3, 5 ~ 8, 도 9, 도 11 ~ 도 14)을 위해, 세포를 5% CO2 환경에서 3시간 ~ 4시간 동안 항온처리하였고, 배양 배지를 교환한 다음, 세포를 10% CO2하에 약 48시간 동안 방치하였다. 형광단 함유 플라스미드가 형질감염되었을 때, 형질감염과 발현이 성공적으로 이루어졌는지 여부는 EVOS® FL 세포 영상화 시스템(Life Technologies, Thermo Fisher Scientific)을 통해 평가하였다.
661W 세포는 감사하게도 Muayyad Al-Ubaidi(University of Houston) 교수님이 제공해주셨다. 이 세포주는 마우스 망막 종양으로부터 클로닝된 것으로서, 원추 광 수용기의 분자적 특징을 보이는 것으로 확인되었다(al-Ubaidi et al., 1992, Tan et al., 2004). 661W 세포를, 37℃ 및 10% CO2, 그리고 CO2 항온처리기(Heraeus, Thermo Fisher Scientific)내 DMEM 배지 + GlutaMAX + 1 g/l 글루코스 + 피루브산염 + 10% FBS(Biochrom) + 1% 항생제-안티마이코틱에 방치하였다. 합류도 약 90%일 때 이 세포를 1주일에 2회 계대배양하였다. 전술한 바와 같이 인산칼슘법을 이용하여 일시 형질감염을 수행하였다.
마우스 배 섬유아세포(MEF)를 문헌[Jat et al., 1986, Xu, 2005]에 기재된 바와 같이 제조하였다. 이 세포를, 37℃ 및 5% CO2, 그리고 CO2 항온처리기(Heraeus, Thermo Fisher Scientific)내 DMEM 배지 + GlutaMAX + 1 g/l 글루코스 + 피루브산염 + 10% FBS(Biochrom) + 1% 페니실린/스트렙토마이신(Biochrom)에 방치하였다. 합류도 약 90%일 때, 세포를 1주일에 1회 계대배양하였다. TurboFectTM 형질감염 시약(Thermo Fisher Scientific)을 이용하여 MEF를 일시 형질감염시켰다. 세포를 6 cm 세포 배양 평판에 접종한 다음, 합류도가 70% ~ 90%에 이르게될 때까지 항온처리하였다. 반응 혼합물을 하기 순서로 제조하였다.
각각의 성분을 첨가한 후, 용액을 격렬하게 와류시켜 혼합하였다. 형질감염 혼합물을 RT에서 15분 ~ 20분 동안 항온처리한 다음, 이를 배양 평판에 적가하였다. 3시간 후 배지를 교환하고 나서, 형질감염 48시간 후 세포를 수집하였다. 형광단 함유 플라스미드로 형질감염시켰을 때, 형질감염 및 발현이 성공적으로 이루어졌는지 여부는 EVOS® FL 세포 영상화 시스템(Life Technologies, Thermo Fisher Scientific)으로 평가하였다.
재조합 아데노-연관 바이러스의 제조
인산칼슘 형질감염을 3회 진행하여 관심 유전자를 함유하는 pAAV2.1 플라스미드, pAD, 즉 조력 플라스미드(helper plasmid) 및 원하는 캡시드를 암호화하는 플라스미드를 도입함으로써 재조합 아데노-연관 바이러스(rAAV)를 제조하였다. 광 수용기 및 RPE의 형질도입시 2/8Y733F 캡시드 변이체의 높은 효율로 말미암아, 마우스 망막으로의 망막하 주사를 위해 2/8Y733F 캡시드 변이체를 선택하였다(Petrs-Silva et al., 2009, Mol. Ther, 17, 463-71). HEK293T 세포를 15 x 15 cm 세포 배양 평판에 접종하고 나서, 합류도가 60% ~ 80%에 도달할 때까지 밤새도록 항온처리하였다. 형질감염에 앞서, FBS 함유 배지를 무혈청 배지로 교환하였다. 형질감염 시약을 정해진 순서대로 50 ml들이 Falcon 튜브에 첨가하였다: pAAV2.1 플라스미드 270 μg, pAD 조력 플라스미드 X μg, 캡시드 플라스미드 Y μg, H2O 11.85 ml, 폴리브렌(8 mg/ml) 15 μl, 덱스트란(10 mg/ml) 1.5 ml, CaCl2(2.5 M) 1.5 ml, 2x BBS 15 ml. pAD 조력 플라스미드 및 캡시드 플라스미드의 필요량은 하기 식을 이용하여 계산하였다: X μg = 270 μg x pAAV2.1의 pAD 조력 MM의 MM, Y μg = 270 μg Х pAAV2.1의 캡시드 플라스미드 MM의 MM. 와류하면서 CaCl2 및 2x BBS를 적가하였다. 형질감염 혼합물 2 ml를 15개의 배양 평판 각각에 적가하였다. 평판을 가볍게 흔들어준 다음, 24시간 동안 5% CO2 환경에 놓아두었다. 이후, 배지를 교환하고 나서, 평판을 10% CO2 환경에 48시간 더 놓아두었다.
바이러스 함유 배양 배지를 2회 수득하였다. 첫 번째 수득은 형질감염후 72시간 경과시 모든 평판의 전체 배지를 수집한 다음, 신선한 배지를 첨가하여 진행하였다. 두 번째 수득은 추가 항온처리 기간 72시간후에 진행하였다. 배양 배지를 500 ml들이 원심분리 튜브에 수집하였다. 4,000 rpm에서의 원심분리(4℃, 15분)(JA-10 로터, J2-MC 고속 원심분리기, Beckman Coulter) 및 0.45 μm PES 필터 유닛(Nalgene, Thermo Fisher Scientific)을 통한 상청액 여과에 의해 배지로부터 잔여 세포를 제거하였다. 통과액에 40% 폴리에틸렌 글리콜(PEG) 용액을 최종 농도 8%가 되도록 첨가하였으며, 4℃에 밤새도록 방치함으로써, 바이러스 입자를 침전시켰다. 그 다음, 이 용액을 4,000 rpm 및 4℃에서 15분 동안 원심분리하였다(JA-10 로터, J2-MC 고속 원심분리기, Beckman Coulter). 상청액을 폐기한 다음, 바이러스 함유 펠릿을, 추가 처리시까지 -20℃에 보관하여 두었다.
이오딕사놀 밀도 구배 원심분리를 위해, 펠릿을 멸균 여과 PBS 7.5 ml에 재현탁하여 최종 농도 50 U/ml로 만든다음, 37℃ 수조(Haake)에서 Benzonase®(VWR)와 함께 30분 동안 항온처리하여, 잔여 미팩키징 DNA를 제거하였다. 그 다음, 바이러스 현탁액을 피펫팅하여 Quick-Seal 폴리프로필렌 튜브(39 ml, Beckman Coulter)에 넣은 후, 바이러스 현탁액 아래에 이오딕사놀 농도가 상이한 용액들을 순서대로(즉 이오딕사놀 용액 15% 7 ml, 25% 6 ml, 40% 5 ml 및 60% 6 ml) 첨가함으로써 밀도 구배를 확립하였다. 이를 위해 MINIPULS 3 연동 펌프(Gilson)와 긴 유리 피펫을 사용하였다. 그 다음, 튜브들을 Beckman 튜브 뚜껑으로 밀봉한 다음, 18℃에서 1시간 45분 동안 70,000 rpm으로 원심분리하였다(Optima L-80K 초원심분리기(70 Ti 로터, Beckman Coulter)). 그 다음, 튜브 상단에 구멍을 뚫어 캐뉼러를 꽂아 공기가 통하게 만들었다. 튜브내 40% 상 및 60% 상 사이 경계가 있는 지점 튜브 외측에 구멍을 뚫고 20 G 캐뉼러 및 20 ml들이 시린지를 사용하여 구배로부터 바이러스 입자가 증량된 40% 이오딕사놀 상을 수집하였다. 추가 처리시까지 바이러스 함유 용액을 -80℃에 보관하여 두었다.
바이러스를 더 정제하기 위해, AKTAprime + 크로마토그래피 시스템(GE Healthcare), 5 ml HiTrapTM Q FF 음이온 교환 크로마토그래피 컬럼(GE Healthcare) 및 PrimeView 5.31 소프트웨어(GE Healthcare)를 사용하여 음이온 교환 크로마토그래피를 수행하였다. 시작하기에 앞서, 컬럼을 완충제 A(20 mM Tris, 15 mM NaCl, pH 8.5)로 평형화한 다음, 바이러스 함유 용액을 이 완충제로 1:1 비율로 희석하였다. 루프형 주입기(50 ml Superloop, GE Healthcare)로 용액을 컬럼에 로딩하였다. 수집한 분획들의 UV 흡광성 및 도전성을 모니터링하여, 함유된 바이러스의 양에 관한 정보를 제공받았다. 잔류하는 결합 분자를, 2.5 M NaCl 용액을 이용하여 컬럼으로부터 제거하였다. 바이러스 함유 분획 모두를 플링(pooling)한 다음, 이후의 처리에 사용하였다.
3.5.4 rAAV 농도의 증가
바이러스 농도를 증가시키기 위해, 분자량 컷-오프가 100 kDa인 Amicon® Ultra-4 원심분리 필터 유닛(Merck)을 사용하였다. 바이러스 함유 용액을 필터 유닛 상단에 로딩한 다음, 용적이 500 μl로 감소할 때까지 20분 간격을 두며 4℃ 및 4,000 rpm에서 원심분리하였다(JA-10 로터, J2-MC 고속 원심분리기, Beckman Coulter). 그 다음, 필터 유닛을 0.014% Tween/PBS-MK(10xPBS 50ml, 1M MgCl 500 μl, 2.5 M KCl 500 μl, 500 ml 물 첨가) 1 ml로 세척하였다. 용적이 농축 바이러스 용액 100 μl로 감소할 때까지 용액을 동일 조건하에서 추가로 원심분리하였다. 10 μl만큼의 분취액을 제조하여, 사용시까지 -80℃에 보관하여 두었다.
제조한 rAAV의 역가를 확정하기 위해, StepOnePlus 실시간 PCR 시스템(Applied Biosystems, Thermo Fisher Scientific)을 사용하여 qPCR을 수행하였다. 표준 곡선을 그려 기준으로 삼았다. 이를 위해서, ITR 부분을 함유하는 단편을, 하기 프라미어들이 사용되는 PCR로 증폭시켰다.
ITR2 정: 5' GGAACCCCTAGTGATGGAGTT 3'(서열 번호 30)
ITR2 역: 5' CGGCCTCAGTGAGCGA 3'(서열 번호 31)
그 다음, 앰플리콘(amplicon)을 정제한 다음, NanodropTM 2000c 분광분석기(Thermo Fisher Scientific)를 사용하여 농도를 확정하였다. 농도 c인 표준 용액을 제조한 다음, 복사체 수가 1010 개 ~ 101 개 범위인 일련의 희석물을 만들었다. 표준 곡선을 확보하기 위해, 일련의 표준 희석을 기술상 3회 반복 수행하면서 qPCR을 진행하였다. 이를 위해, MicroAmp?? 급속 광학 96-웰 반응 평판(Applied Biosystems, Thermo Fisher Scientific)과 PowerUpTM SYBRTM 그린 마스터 믹스(Thermo Fisher Scientific)를 사용하였다. 바이러스 용액을 H2O로 100배 희석하여, 동일한 반응 평판상에서 전개하였다(기술상 3회 반복). 반응 혼합물은 하기와 같이 제조하였다. 수득한 데이터를, StepOnePlus 실시간 PCR 시스템 소프트웨어(Applied Biosystems, Thermo Fisher Scientific)를 사용하여 분석하였다. 필요할 경우, 기준 환경 및 사이클링 임계 위치를 수동으로 조정하였다. 얻어진 사이클링 임계값(Ct)을 희석 대수에 대해 플로팅(plotting)하여 표준 곡선을 그렸다. 제조한 rAAV의 1 μl당 바이러스 게놈 수(vg/μl)는 표준 곡선으로부터 추론할 수 있었다.
망막하 주사
망막하 주사를 위해, 생후 21일차(P21) C57Bl6/J 마우스에 케타민(체중 1 kg당 40 mg)과 자일라진(체중 1 kg당 20 mg)을 복막내 주사하여 이 마우스를 마취시켰다. 사지 도피 반사가 완전히 사라진 다음, 아트로핀(1%) 및 트로피카마이드(0.5%) 함유 점안액(Mydriaticum Stulln, Pharma Stulln GmbH)을 투여하여 동공을 확장시켰다. 수술용 현미경(OPMI 1 FR pro, Zeiss)으로 눈의 안저에 초점을 맞추었다. NANOFIL 10 μl들이 시린지(World Precision Instruments) 및 34 G의 모서리가 깎인 바늘(World Precision Instruments)을 사용하여 1회 주사함으로써 1010 rAAV 입자 함유 용액 1 μl를 망막하 주사하였다. 주사한 눈을, 겐타마이신 5 mg/g 및 덱사메타손 0.3 mg/g을 함유하는 안 연고로 처치하였다. 마취에서 완전히 깨어날 때까지 마우스를 37℃의 가열 평판(Leica HI1120, Leica Biosystems) 상에 올려놓았다. 주사후 2주차 ~ 4주차에, 주사한 망막 모두를 수득하여, RT-PCR 분석 또는 면역조직화학 분석을 위해 처리하였다.
면역조직화학
면역조직화학 분석을 위해, 망막하 주사한 마우스를 경추 탈골하여 안락사시켰다. 눈을 분리해낸 다음, 0.1 M 인산염 완충제(PB)에 담가 두었다. 그 다음, 21 G 캐뉼러로 안구 망막거상면에 구멍을 낸 후, 4% 파라포름알데히드(PFA, Sigma Aldrich, pH 7.4로 조정)에 5분 동안 고정시켰다. 그 다음, 눈을 0.1 M PB로 흠뻑 적신 필터지 위에 놓은 채 입체현미경(Stemi2000, Zeiss)으로 가져갔다. 수술용 가위(SuperFine Vannas, World Precision Instruments)를 사용하여 거상면을 따라 절단하여 각막, 수정체 및 유리체를 제거하였다. 망막을 함유하는 안구 나머지 부분을 RT 및 4% PFA에 넣어 45분 동안 고정시킨 다음, 5분 동안 0.1 M PB로 3회 세적하였다. 초저온 보존을 위해, 안구를 30% 수크로스 용액(w/v)중에 밤새도록 방치하였다(4℃).
그 다음 날, 안구를 조직 동결 매질(Sakura)에 매립한 다음, 이 매질이 고화될 때까지 드라이아이스상에서 냉각시켰다. 저온유지장치(Leica CM3050 S, Leica Biosystems)를 사용하여 망막을 10 μm 두께의 박편으로 절편화한 다음, 코팅한 유리 대물 슬라이드(Superfrost Plus microscopic slides, Thermo Fisher Scientific)상에 수집한 후, -20℃에 보관하여 두었다.
면역조직화학적 염색을 위해, 망막 절편을 RT에서 해동시킨 다음, Super PAP Pen 액체 블로커(Science Services)를 사용하여 감쌌다. 이후, 절편을 0.1 M PB로 5분 동안 재수화한 다음, 4% PFA로 10분 동안 고정시켰다. 절편을 회당 5분 동안 0.1 M 인산염 완충제(pH 7.4)(PB)로 총 3회 세척한 후, 여기에 1차 항체, 5% ChemiBLOCKER(Merck) 및 0.3% Triton X-100을 함유하는, 0.1 M PB중 용액을 적용하였다. 초저온 절편을 1차 항체 용액과 함께 밤새도록 4℃에서 항온처리하였다. 다음 날, 망막을 0.1 M PB로 5분 동안 3회 세척한 다음, 2차 항체 및 2% ChemiBLOCKER를 함유하는, 0.1 M PB중 용액과 함께 1.5시간 동안 RT에서 항온처리하였다. 이후 0.1 M PB로 5분 동안 3회 세척한 다음, 세포의 핵을 5 μg/ml Hoechst 33342 용액(Invitrogen)으로 염색하였다. 마지막으로 절편을 0.1 M PB로 세척한 후, Fluoromount-G 마운팅 매질(Thermo Fisher Scientific)에 매립하고 나서, 커버 슬립으로 덮은 다음, 4℃에 보관하여 두었다.
공초점 현미경
Hoechst 33342, Cy3 및 Cy5 각각을 여기시키는데 적당한 552 nm 및 633 nm 광학 펌핑 반도체 레이저뿐 아니라, 405 nm 다이오드가 장착된 Leica TCS SP8 도치 공초점 레이저 주사 현미경(Leica Microsystems)을 사용하여, 염색한 망막의 영상을 수득하였다. 각각의 염료의 방출 스펙트럼에 따라 필터 환경을 선택하였다. LAS X 소프트웨어(Leica Microsystems)를 사용하여, F형 침액(Leica Microsystems) 및 HC PL APO 40x/1.30 오일 CS2 대물렌즈(Leica Microsystems)로 z-스택(z-stack)(1 μm 스텝)으로서 영상을 획득하였다. 최대강도투사를 적용하고 동일한 소프트웨어를 사용하여 z-스택을 2D 영상으로 압축하였다. ImageJ 1.48v 소프트웨어(National Institutes of Health)로 영상을 추가 처리하였다.
세룰리안, 시트린 및 m체리 각각을 여기시키는데 적당한 448 nm, 514 nm 및 552 nm 광학 펌핑 반도체 레이저가 장착된 Leica TCS SP8 스펙트럼 공초점 레이저 주사 현미경(Leica Microsystems)을 사용하여, 일시 형질감염된 생세포의 영상을 획득하였다. 각각의 형광단의 방출 스펙트럼에 따라 필터 환경을 선택하였다. HCX APO 20x/1.00 W 오브젝티브(Leica Microsystems)로 영상을 획득하였다. 모든 영상을 ImageJ 1.48v 소프트웨어로 처리하였다.
RNA 추출
주사한 망막으로부터 RNA를 추출하기 위해, 마우스를 경추 탈골로 안락사시켰다. 끝이 뭉뚝한 핀셋(blunt forceps)을 눈 아래에 넣고, 멸균 메스(Swann-Morton)를 사용하여 안구를 절개한 다음, 핀셋을 서서히 위로 이동시켜 망막을 수집하였다. 구조체당 망막 3개를 풀링(pooling)하였으며, 제조자의 지침에 따라 RNeasy 미니 키트(Qiagen)를 사용하여 RNA를 추출하였다. 조직을 파쇄시키기 위해, 여기에 RLT 완충제(Qiagen, 키트와 함께 공급) 350 μl + β-머캅토에탄올(β-ME, Sigma Aldrich) 3.5 μl를 첨가하여 조직을 균질화한 다음, 멸균 시린지에 끼운 20 G 바늘을 적어도 5회 통과시켰다. 프로토콜에 따라 나머지 단계들을 수행하였다. RNA를 무 RNAse H2O 30 μl중에 용리시켰다.
일시 형질감염시킨 세포로부터 RNA를 추출하기 위해, RNeasy 미니 키트 플러스(Qiagen)를 사용하였다. 이를 위해, 6 cm 배양 평판으로부터 배지를 제거한 다음, 16 cm 세포 스크레이퍼(Sarstedt)를 사용하여 세포를 긁어냈다. 세포를 배지 500 μl에 수집한 다음, 2 ml들이 안전 잠금 튜브(Eppendorf)에 넣고, 3,000 x g 및 4℃에서 10분 동안 원심분리하였다. 상청액을 폐기한 후, 펠릿을 RLT 플러스 완충제(Qiagen, 키트와 함께 공급) 600 μl + β-ME(Sigma Aldrich) 6 μl에 재현탁하였다. 강철 볼을 각각의 튜브에 넣은 후, 믹서 밀 MM400(Retsch)을 사용하여 30 Hz에서 1분 동안 세포를 파쇄시켰다. 그 다음, 볼을 제거하고, 현탁액을 21,000 x g 및 RT에서 5분 동안 원심분리하였다. 프로토콜에 따라서, 선택적 단계인 게놈 DNA를, gDNA 제거용 스핀 컬럼으로 제거하는 단계를 포함한 나머지 단계들을 수행하였다. RNA를 무 RNAse H2O 30 μl중에 용리하였다.
NanodropTM 2000c 분광분석기(Thermo Fisher Scientific)를 사용하여 RNA 농도를 측정하였다. RNA를 추후 사용시까지 얼음상에 놓아 두었거나, 단기간 동안 -20℃에, 또는 장기간 동안 -80℃에 보관하여 두었다.
cDNA 합성
cDNA 합성을 위해, 제조자의 지침에 따라 Revert Aid First Strand cDNA 합성 키트(Thermo Fisher Scientific)를 사용하였다. 매 실험마다 동량의 RNA를 사용하였다. cDNA 반응 혼합물을 Mastercycler® 넥서스 구배하에 항온처리하였다. cDNA를 추후 사용시까지 얼음상에 방치하여 두었거나, 단기간 동안 -20℃에, 또는 장기간 동안 -80℃에 보관하여 두었다.
역전사 PCR
Herculase II 융합 DNA 중합효소(Agilent Technologies) 또는 VWR Taq DNA 중합효소(VWR)를 사용하여 역전사 PCR(RT-PCR)을 수행하였다.
분지점 분석
내포 올가미 RT-PCR(Nested Lariat RT-PCR)을 위해, RNA를 전술한 바와 같이 추출하였다. 제조자의 지침에 따라 RNA 10 μg을 RNase R(Lucigen)과 함께 항온처리하여, 임의의 비환형 RNA를 제거하였다. 이후, 전술한 바와 같이 cDNA 합성(Revert Aid First Strand cDNA 합성 키트, Life Technologies)을 수행하였다. 이 반응을 위해, 오로지 무작위 6량체 프라이머만을 사용하였다. 그 다음, Herculase II 융합 DNA 중합효소(Agilent Technologies)를 사용하는 내포 RT-PCR을 통해 올가미를 증폭시켰다. 증폭의 제1 라운드를 위해, 반응 혼합물을 3.12에 기재한 바와 같이 제조하였다. 증폭의 제2 라운드를 위해, cDNA 대신 제1 PCR 생성물 5 μl를 반응 혼합물에 첨가하였다. 더욱이, 제1 프라이머 쌍의 25 bp ~ 30 bp 하류에 결합하는 제2 프라이머 쌍을 사용하였다. 적용한 사이클링 조건을 표 11에 나열하였다.
TOPO 클로닝 및 올가미 분석을 위해, 내포 RT-PCR 생성물을 플라스미드에 서브클로닝하였다. 이를 위해, Taq 중합효소(VWR) 1 유닛과 PCR 반응물을 72℃에서 10분 동안 항온처리함으로써 증폭후 DNA 단편에 3'-아데노신 돌출 말단(overhang)을 부가하였다. 그 다음, 제조자의 지침에 따라 올가미를 TOPO 벡터(TOPO TA 클로닝 키트, Thermo Fisher Scientific)에 서브클로닝하였다. 플라스미드로 세균을 형질전환시킨 다음, 소규모 플라스미드 제조를 수행하였다. 이로부터 얻어진 플라스미드를 서열결정하였으며(Eurofins Genomics), 수득된 올가미 서열을 조사대상 인트론과 정렬한 후 DNAMAN 소프트웨어(Lynnon Biosoft)를 사용하여 분석하였다.
단백질 추출
단백질 추출을 위해, 6 cm 또는 10 cm 배양 평판으로부터 배지를 제거하였다. 16 cm 세포 스크레이퍼(Sarstedt)를 사용하여 세포를 긁어낸 다음, 배지 500 μl에 수집하여, 2 ml들이 안전 잠금 튜브(Eppendorf)에 넣었다. 세포 현탁액을 3,000 x g 및 4℃에서 10분 동안 원심분리하고 나서, 상청액을 폐기하고, 펠릿을 150 μl 및 250 μl Triton X-100(TX) 용해 완충제(2.5 ml Triton X-100, 15 ml 5 mM NaCl ml, 0.4 ml 2.5 M CaCl2, 500 ml 물 첨가)에 재현탁한 후, 6 cm 및 10 cm 평판 각각에 대해 c0mpleteTM ULTRA 프로테아제 억제제 칵테일 정제(Roche)를 사용 직전에 첨가하였다(10 ml당 정제 1개). 강철 볼을 각각의 안전 잠금 튜브에 첨가한 다음, 믹서 밀 MM400(Retsch)을 사용하여(30 Hz, 1분) 세포를 파쇄시켰다. 그 다음, 볼이 담긴 튜브를 4℃에서 20분 동안 빙글빙글 회전시켰다(VWRTM 튜브 회전기). 그 다음, 볼을 꺼내고, 용해물을 4℃ 및 5,000 x g에서 10분 동안 원심분리하였다. 단백질 함유 상청액을 새로운 반응 튜브로 옮긴 후, -20℃에 보관하였다.
Bradford 검정법을 이용하여 단백질 총 농도를 확정하였다. 단백질 용해물 5 μl를 0.15 M NaCl 용액 95 μl와 혼합한 다음, PMMA 표준 1회용 큐벳(BRAND)으로 옮겼다. 이후, 쿠마시 블루 용액 1 ml를 첨가하고 나서, 피펫팅으로 철저히 혼합한 다음, RT에서 2분 동안 항온처리하였다. BioPhotometer(Eppendorf)를 사용하여 용액의 흡광도를 측정하였는데, 이 때 블랭크 대조군은 TX 용해 완충제 5 μl를 함유하였다. 수득한 값은 용해물 5 μl중 함유된 단백질의 총량을 나타낸다.
실시예 1: 최적화한 ASS 모듈의 동정
HEK293 세포와 형질도입시킨 마우스 광 수용기에서 인간 로돕신(RHO) 미니유전자를 사용하여 질환 연계 로돕신 돌연변이가 mRNA 스플라이싱에 미치는 영향을 분석하였다. 그 중에서 본 발명자들은 RHO 유전자 엑손 3에 하나의 돌연변이(c.620T>G)(신규 ASS를 생성하는 돌연변이)가 일어났음을 발견하였다(도 1). ASS 및 예측 ASS 요소의 서열은 도 2의 A 및 B에 보였다.
인실리코 예측은, c.620T>G 돌연변이에 의해 형성된 수여 스플라이싱 부위(이하 ASS_620이라 칭함)가 엑손 3의 원산 로돕신 수여 스플라이싱 부위와 유사한 스플라이싱 점수를 가짐을 보여주었다(도 3의 A 참조). 이 점은, 두 스플라이싱 부위가 스플라이싱 기구에 의해 대안적으로 사용될 수 있었음을 암시한다. 그러나, 실험 데이터는 ASS_620이 HEK293 세포(도 1의 D) 및 마우스 광 수용기(도 1의 E) 둘 다에 배타적으로 사용되었음을 보여준다. 이 점은, ASS_620이 강력한 수여 스플라이싱 부위임을 암시한다.
생물공학적 적용시 ASS의 잠재적 사용에 있어서, ASS의 강도와 기능은 유전자 환경에 독립적이어야 한다. ASS_620이 다른 비 원산 환경에서 기능성인지 여부를 시험하고, 대부분의 효율적 스플라이싱에 필요한 ASS_620 요소를 확정하기 위해, 길이가 가변적인 서열로서, c.620T>G 돌연변이에 측접하는 서열을 RPS27 유전자의 엑손 3에 도입하였다(도 2의 C). 단일 서열은 ASS_620 위치에서 가변적 스플라이싱 효율을 초래하였다(도 2의 D). RPS27 미니유전자, 즉 5' 말단 7 bp 서열, 폴리피리미딘 대역 및 규범적 ASS로 이루어진 26 bp 서열 (CAACGAGTCTTTTGTCATCTACAGGT; 서열 번호 3)을 포함하는 미니유전자를 포함하는 RHO-E3d가 사용되었을 때, 가장 큰(100%에 가까운) 스플라이싱 효율을 수득하였다. 놀랍게도, 이 서열은 RHO 엑손 3에 존재하는 예측 분지점들중 그 어떤 것도 함유하지 않았다. 5' 말단의 7 bp 서열(CAACGAG)은 현재 특성 규명되어 있지 않은 유효 분지점 서열, 또는 효율적인 ASS 사용에 필요한 인트론 스플라이싱 인핸서 인지 부위를 보유할 수 있었다. 26 bp 서열(서열 번호 3)은 본원에서 "vgASS_620"이라 지칭된다.
vgASS_620의 스플라이싱 효율을 더 확인하기 위해, 이를 가변적 예측 수여 스플라이싱 부위 강도를 보이는 추가 무작위 선택 유전자 4개(HBQ1, S100A12, CLRN1 CNGB1)에 도입하였다(도 3의 C). 원산 엑손 수여 스플라이싱 부위의 예측 강도는, RPS27의 경우 S100A12, CLRN1 HBQ1의 경우와 유사하게 vgASS_620의 예측 강도에 비하여 더 컸으며, CNGB1의 경우에는 vgASS_620의 예측 강도에 비하여 더 작았다(도 3의 A). 후속 RT-PCR 실험에서, vgASS_620은 RPS27에서뿐 아니라, 본원에서 시험된 추가의 모든 유전자에서도 배타적으로 사용하였다(도 3의 D 및 E). 이 결과는, vgASS_620이 유전자 환경과는 독립적으로 매우 강력한 수여 스플라이싱 부위임을 입증해준다. 그러므로, 현재는 훨씬 더 낮은 트랜스-스플라이싱 효율을 개선하기 위해 vgASS_620이 SMaRT 또는 이중 아데노-연관 바이러스(AAV) 벡터 하이브리드 기술에서 사용될 수 있다는 가설이 세워질 수 있었다.
실시예 2: 시험관내 적용을 위한 세룰리안 리포터 검정법
이 가설을 시험하기 위해, 세룰리안의 암호화 서열을 2개의 인공 엑손으로 분할하고, 이 사이에 인공 인트론을 끼워넣어 스플라이싱 리포터 검정법을 개발하였다(도 4의 D). 이 인트론은 vgASS_620과, 인공 145 bp에 의해 서로 분리된 강력한 공여 스플라이싱 부위를 함유하였다. 형질감염시킨 HEK293 세포의 공초점 영상화는, 두 스플라이싱 부위가 시스 방식으로 제공되면 강력하고 견고한 세룰리안 형광을 보임을 규명하였다(도 4의 F(c1)). 대응하는 밴드들에 관한 RT-PCR 실험 및 서열결정은, 이 입체배열에서 두 세룰리안 엑손이 함께 효율적으로 스플라이싱됨을 확인시켜 주었다(데이터는 보이지 않음). 도 4의 G에 보인 바와 같이, 세룰리안의 N-말단부에 대해 특이적인 항체를 사용하는 웨스턴 블럿팅 실험은 예상 크기(27 kDa)를 가지는 특이적 면역 신호를 검출하였다. 종합하여 보건대, 이러한 발견은 리포터 검정법이 시스 입체배열에서 매우 효율적이고 기능적임을 암시한다. 그러므로, 이 구조체는 후속 실험에서 2개의 세룰리안 스플라이싱 단편이 트랜스 방식으로 제공되었을 때(즉 별도의 플라스미드를 통해 제공되었을 때) 세룰리안 재구성 효율을 확정하기 위한 기준으로 사용하였다. 이 실험에 사용된 DSS는 서열 AAGGTAAG를 가진다.
그 다음, 리포터 검정법을 이용하여 결합 도메인과 수여 스플라이싱 부위 강도의 세룰리안 재구성 효율에 대한 영향을 분석하였는데, 이때 리포터의 재구성에는 mRNA 트랜스-스플라이싱이 필요하였다.
이를 위해서, 형광 리포터 기반 검정법이 개발되었는데, 여기서 청색 형광 단백질 "세룰리안"의 암호화 서열은 다시 154번 위치에서 2개의 절반부로 분할하였다(도 4의 D). CMV 프로모터의 제어하에 있는 5'쪽 부분을 포함하는 제1 DNA 구조체에 추가로 강력한 DSS(AAGGTAAG)를 붙였고, 그 뒤에 결합 도메인을 붙였으며, CMV 프로모터의 제어하에 있는 3'쪽 부분을 포함하는 제2 DNA 구조체에는 ASS로서 vgASS_620을 붙였고, 그 뒤에 제1 DNA 구조체의 결합 도메인에 상보성인 결합 도메인을 붙였다(도 4의 D, c3 참조). 전사후, BD간 염기 쌍형성은 스플라이싱 요소들을 근접하게 만들었는데, 이는 트랜스 방식의 스플라이싱을 촉진하였고, 그 결과 전장 성숙 세룰리안 mRNA를 생성하였다. 세룰리안의 재구성은, 예컨대 현미경관찰(도 4의 F 참조) 또는 유세포분석법에 의해 mRNA 수준에서(예컨대 RT-PCR 이용) 또는 단백질 수준에서(예컨대 웨스턴 블럿팅 이용, 도 4의 G 참조) 광학적으로 검출할 수 있었다.
두 가지 이유로 말미암아, 결합 도메인의 최적화를 위한 예시적 주형으로서 인간 로돕신 유전자의 인트론 2를 선택하였다: (1) c.620T>G 스플라이싱 돌연변이는 엑손 3에 위치하였기 때문에 RHO 인트론 2 결합 도메인의 최적화된 유형을 이 c.620T>G 스플라이싱 돌연변이의 SMaRT-기반 치환을 위해 사용할 수 있음(도 1); (2) RHO 인트론 2 서열은 마우스 게놈 서열들중 그 어떤 것과도 상동성이 아니므로(데이터는 보이지 않음), 표적을 벗어난 현상을 유발할 것으로 예상되지 않음. 결과적으로 최적화된 RHO 인트론 2 결합 도메인은 또한 이중 AAV 벡터 접근법이 사용되어 마우스 망막에서 기타 대형 인간 유전자의 재구성에 이용될 수 있었다.
전술된 바와 같고, 도 4의 D(c3)에 BD_h+i에 대해 예시적으로 보인 바와 같은, 제1 DNA 구조체 및 제2 DNA 구조체로 HEK 293 세포를 일시적으로 공동 형질감염시켰으며, 세룰리안 형광 발현을 공초점 라이브 세포 영상화를 통해 평가하였다. 동일한 스플라이싱 요소를 포함하는 개입 인공 인트론과 함께, 두개의 세룰리안 부분을 시스 방식으로 함유하는 구조체를 시스-스플라이싱 기준 대조군(cis-ctrl)으로 사용하였다. 절반부 2개를 별도로 형질감염시켰을 때, 형광은 검출되지 않았다. 두개의 구조체를 공동 형질감염시켰을 때, 형광 세포가 관찰될 수 있었는데, 이 점은 세룰리안 암호화 서열이 성공적으로 트랜스-스플라이싱되어 재구성되었음을 보여주는 것이다.
RHO 인트론 2 결합 도메인을, 그 크기와 위치를 변경시켜 최적화하였다(도 4의 A). 뿐 아니라, 인공 BD를 만든 다음, 여기에 BD_h+i에 대한 인트론의 5' 말단과 3' 말단으로부터 기원한 서열들을 융합하여 시험하였다.
HEK293 세포를 공동 형질감염시킨 다음, 구조체 2개의 mRNA 발현을 분석한 다음, 항존 유전자 ALAS의 경우와 비교하였는데(5' 구조체의 경우에는 프라이머 p1 및 p2를 사용하고, 3' 구조체의 경우에는 프라이머 p3 및 p4를 사용함), 이로부터 전-mRNA 수준에서의 발현 차이는 단지 작을 뿐임이 입증되었다(도 4의 B 및 C). cis-ctrl을 기준으로 세룰리안 단백질 밴드를 방사선 측정 분석함으로써 재구성 효율을 확정한 다음, 상이한 BD를 사용하여 대폭 변경하였다(도 4의 E). 단백질 밴드 모두를 베타 튜불린에 대해 정규화한 후, 정량하였다. 결합 도메인 2개, 즉 BD_g(서열 번호 27) 및 BD_h+i(서열 번호 28)(둘 다 길이 약 100 bp임)는 높은(30%를 초과하는) 세룰리안 재구성 효율을 달성하였다. 중요한 점은, 이처럼 높은 효율은 이전의 연구, 즉 분할 유전자의 재구성을 기반으로 한 대안적 접근법(하이브리드, 중첩 및 게놈 "트랜스"-스플라이싱 접근법)(Carvalho et al., 2017, Frontiers in Neurosciences, 11, Article 503)을 이용한 연구를 통해 공지된 효율을 게놈 수준에서 훨씬 능가하였다는 점이다. 리포터 유전자 lacZ를 사용하여 세 가지 전략 모두를 시험관내에서 시험하였다. 이 환경에서 최고라고 보고된 재구성 효율은 17.7%에 달하였다.
최근의 연구는, 트랜스-스플라이싱 효율은 스플라이싱 부위의 강도에 의해 영향받지 않는다고 가정하였다(Lorain et al., 2013). 이 가정을 시험하기 위해, vgASS_620의 세룰리안 재구성 효율을, 가장 효율적인 결합 도메인 BD_h+i(서열 번호 28)와 함께 RHO 엑손 3의 원산 수여 스플라이싱 부위의 세룰리안 재구성 효율과 비교하였다. 도 4의 E에서 볼 수 있는 바와 같이, 원산 ASS로부터 기원하는 재구성 효율은 vgASS_620으로부터 기원하는 재구성 효율에 비해 눈에 띄게 더 낮았다(35.7 ± 4.6% vs 0.7 ± 0.1%). 이러한 발견은, 이중 벡터 접근법에서의 트랜스-스플라이싱 효율이 수여 스플라이싱 부위 강도에 많이 의존한다는 명백한 증거를 제공한다(도 4의 D ~ G).
실험 후반부에 재구성 효능은 증가할 수 있었다(예컨대 실시예 3 및 도 9의 D 참조). 무엇보다도 초기 실험에서 독립된 시료의 수(n)는 여전히 매우 적었다. 독립된 시료의 수(n)를 증가시키고 형질감염 프로토콜을 최적화함으로써 재구성 효율은 더욱 확실히 정량할 수 있었고, 공동형질감염 효율이 증가함에 따라 더 큰 값, 예컨대 60% 또는 심지어 그 이상의 재구성 효율(도 9)이 달성될 수 있었다.
HEK293 세포에 더하여, 661W 세포 및 MEF 세포에서의 재구성 효능 트랜스-스플라이싱도 또한 시험되었다. 결합 도메인 BD_g가 이용되었을 때 재구성 효능은, 661W 세포의 경우 40%를 초과하였고, MEF 세포의 경우에는 50%를 초과하였음이 관찰되었다(데이터는 보이지 않음). 세포주 2개를 비교하였을 때, 트랜스-스플라이싱 효능에 유의미한 차이는 없음을 확인할 수 있었다. 이 점은, mRNA 트랜스-스플라이싱 접근법이 세포 유형에 독립적임을 암시한다.
종합해보면, 시험관내 결과는 트랜스-스플라이싱 효율은 결합 도메인의 서열과 길이에 변화를 줌으로써뿐 아니라, 수여 스플라이싱 부위 강도를 최적화함으로써 눈에 띄게 증가할 수 있음을 보여준다. 이와 같은 고무적인 발견은 트랜스-스플라이싱 기반 기술을 한층 더 최적화하는데 새로운 길을 열어준다.
도 4에 보인 결합 도메인 "g"는 vgASS_620과 더불어 엑손 3 또는 이의 하류에서의 로돕신 돌연변이에 관한 SMaRT 기반 유전자 치료 접근법을 확립하는데 사용될 수 있다. 뿐만 아니라, vgASS_620은 또한 다양한 기타 결합 도메인과 합하여질 때, SMaRT 또는 이중 AAV 벡터 접근법을 통하여 기타 유전성 망막 질환(IRD) 유전자를 치료할 수 있다. 본원에 제공된 개시내용은, 자체의 자연 발생 환경과는 별도로(즉 c.620T>G 돌연변이를 보유하는 환자의 로돕신 유전자와는 별도로), vgASS_620 스플라이싱 모듈을 함유하는 임의의 DNA 또는 RNA 서열 사용시에 적용된다. 서열 번호 3의 vgASS_620 또는 서열 번호 3에 대해 적어도 70%의 서열 동일성을 가지는 뉴클레오티드 서열은 이하와 같은 적용에 사용될 수 있었다:
1) (예컨대 mRNA 스플라이싱에 대한 돌연변이 분석을 위한) 미니 유전자 디자인;
2) (예컨대 SMaRT 기술이 사용되는) 생물 또는 치료 환경에서의 내인성 mRNA 표적화;
3) mRNA 단편 2개의 트랜스 방식 재구성[이는 아데노-연관 바이러스(AAV) 벡터의 제한된 게놈 팩키징 용량(약 5.0 kb, 바람직하게 4.7 kb 미만)을 보완하는 경우에 특히 중요하다. 도 5 ~ 도 8은, 본원에 기재된 이중 AAV 벡터계에 사용될 수 있는 AAV 벡터의 서열을 도시한 것이다];
4) 약한 ASS 스플라이싱 부위를 함유하는, 대안적으로 스플라이싱된 유전자에 있어 임의의 스플라이싱 생성물의 존재를 선택적으로 증가시키는 유전자 발현 또는 표적화 카세트 디자인.
실시예 3: 재구성 효능에 대한 수여 스플라이싱 부위의 영향력 대 결합 도메인(BD)의 영향력
BD 길이와 서열은 재구성 효율의 핵심적 결정요인을 나타낸다. BD는 밀접 결합(tight binding)에 영향을 미치고, 잠재적으로는 mRNA를 폴딩(folding)시킬 가능성이 크지만, 후속 스플라이싱 과정의 효율 또는 정확성을 직접적으로 높일 것이라 예상되지는 않는다. 상기 언급한 바와 같이, DSS는 특성 규명이 잘 되어 있으며, 이의 강도 예측은 실험에서의 성능에 잘 들어맞는다. 결과적으로, 분할 형광단 재구성 검정법의 틀 안에서 이 스플라이싱 부위의 최적화가 필요한지는 분명하지 않다. 이와는 대조적으로, ASS의 복잡성으로 말미암아, ASS의 강도는 확실히 예측할 수 없다. 이 결과는, vgASS_620이 예외적으로 강력한 수여 스플라이싱 부위임을 암시한다. 만일 스플라이싱 부위의 강도가 분할 형광단 검정법의 재구성 효율에 영향을 미칠 수 있다면, vgASS_620은 다른 수여 스플라이싱 부위와 비교되었을 때 더 큰 값을 내야할 것이다.
이를 분석하기 위해, vgASS_620 또는 다른 ASS 2개, 즉 RHO 엑손 3의 원산 ASS(S3, 도 9)와, vgASS_62의 폴리피리미딘 대역(PPT)의, 원산 RHO 엑손 3 ASS로의 치환에 의해 생성된 하이브리드 ASS(S2)의 존재하에서의 재구성 효율을 비교하였다. 더욱이, 각각의 ASS를 상이한 결합 도메인 3개, 즉 이 연구에서 기원한 강력한 결합 도메인(BD_g, B1; 서열 번호 27) 및 약한 결합 도메인(BD_f, B3), 그리고 RHO 인트론 1로부터 수득한 공표 BD 서열(PTM1, B2)(서열 번호 29)와 합하였다. 이 서열은 스플라이세오좀 매개 mRNA 트랜스-스플라이싱을 통해 돌연변이된 RHO 전사체를 수복함에 있어 높은 효율을 나타내는 것으로 보였다(Berger et al., "Repair of rhodopsin mRNA by spliceosome-mediated RNA trans-splicing: A new approach for autosomal dominant retinitis pigmentosa"(2015) Mol. Ther. 23(5): 918-930). 공초점 라이브 세포 영상화, RT-PCR 및 웨스턴 블럿팅을 통해 모든 조합을 분석하였다(도 9). 이 실험을 통하여 중요한 발견 몇 가지를 얻었다. 첫 번째, BD 및 ASS 둘 다는 재구성 효율을 확정하는 핵심 구성요소이다. 두 번째, 이 연구에서 동정된 가장 유력한 BD(BD_g, B1)는 공표된 RHO 결합 도메인(B2)을 능가한다. 세 번째, 가장 약한 BD가 가장 강한 ASS와 합하여졌을 때(B3+S1) 검출 가능한 트랜스-스플라이싱을 유도하였던 반면에, 가장 강한 BD가 가장 약한 ASS와 합하여졌을 때(B3+S3) 암호화 서열의 검출 가능한 재구성을 유도하지 않았던 것으로 보아, ASS 강도는 BD 강도보다 더욱더 유력하게 재구성 효율에 영향을 미치는 것으로 보인다.
vgASS_620은 ASS, PPT 및 추가 7 bp 서열 상류(단 이의 결실은 ASS_620 인지능을 손상시킴)로 이루어져 있다. 그러므로 이 7 bp 서열은, 유전자 환경과는 독립적으로, 보편적이면서 효율적인 vgASS_620 인지를 잠재적으로 설명해주는 매우 유력한 분지점을 함유할 수 있는 것으로 추측되었다. 그러나 이 서열 내에 유력한 예측 분지점은 없었다. 그 대신, 기타 몇몇 서열이 c.620T>G ASS의 40 bp 이하만큼의 상류에 위치하는 분지점으로 사용될 것으로 예측되었다. 그럼에도 불구, PPT의 7 bp 서열만큼의 상류에 함유된 잠재적 분지점 아데닌 모두와 예측 분지점 뉴클레오티드 모두가 동시에 돌연변이되면, 스플라이싱은 c.620T>G 돌연변이체에 대해 변경될 수 없었다(데이터는 보이지 않음), 이러한 발견은, 분지점(들)이 다른 어느 곳에 위치하고 있거나, 또는 c.620T>G ASS가 분지점 선택에 있어 큰 융통성을 가짐을 말해주는 것이다. c.620T>G ASS에서의 스플라이싱에 이용되는 분지점(들)을 더 직접적으로 동정하기 위해, RHO c.620T>G 미니 유전자를 일시 발현하는 HEK293 세포를 사용하여 내포 올가미 RT-PCR을 수행하였다. RHO WT 미니 유전자가 형질감염된 HEK293 세포는 기준으로 사용하였다. 올가미 RT-PCR을 수행할 때, WT에 대해 하나의 밴드가 얻어졌으며, 돌연변이 미니 유전자에 대해서도 하나의 밴드가 얻어졌는데, 이 두 밴드는 크기에 차이가 있었다. 두 밴드는 약간 퍼진 형태로 보였는데, 이 점은 대응하는 올가미의 크기가 상이하였음을 암시한다. 이러한 퍼진 형태의 밴드에 함유된 단일 서열을 동정하기 위해, 올가미 RT-PCR 생성물을 TOPO 벡터에 서브클로닝한 다음, 수득한 클론을 서열결정하여 개별 분석하였다. RHO WT 올가미를 관찰해보면, 주 분지점 2개(사례의 42% 및 33%에 사용됨)와, 부 분지점 3개(각각의 사례의 8%)가 동정되었다(표 2). 주 분지점 2개는 공통 서열과 매우 유사하였으며, 높은 예측 점수를 보였다. RHO WT 분지점 모두는 인트론-엑손 접합부의 57 bp ~ 184 bp 상류에서 발견되었다. 인간 분지점의 90%를 초과하는 만큼이 ASS 서열의 50 bp 상류에서 발견된 것으로 보아, RHO 엑손 3의 mRNA 스플라이싱은 기존과는 다른 것으로 보인다(Corvelo et al., 2010, PLoS Comput. Biol., 6(11): e1001016).
[표 2]
Figure pct00038
그럼에도 불구, RHO c.620T>G에 대해 수득된 분지점 프로필은 WT 미니 유전자의 경우에 비해 눈에 띄게 상이하였다. 첫 번째, c.620T>G에 대해 다양한 분지점이 동정되었다. 하지만, 주 분지점(들)은 검출되지 않았고, 이것들 중 그 어떤 것도 WT 미니 유전자에 대해 수득된 것과 동일하지 않았다. 두 번째, 분지점은, 사용된 ASS로부터 훨씬 상류(즉 원산 엑손 3 ASS의 21 bp ~ 159 bp만큼의 상류에 대응하는 107 bp ~ 245 bp만큼)에 위치하였다. 세 번째, 검출된 분지점 거의 절반은 공통 서열과 유사하지 않았던 관계로, 인간 스플라이싱 파인더(HSF) 스플라이싱 예측 도구를 사용하였을 때 예측되지 않았다. 대체로 이 데이터는 vgASS_620 강도가, 함유되어 있던 매우 유력한 분지점의 존재 여부에 기인하지 않으며, 분지점 선택의 큰 융통성에 의해 부분적으로 유발될 수 있음을 암시한다. 이 점은, 자체의 유달리 효율적인 성능을 설명할 수 있었고, 효율적인 스플라이싱을 필요로 하는 생물공학적 적용에서 이를 매우 매력적인 도구로 만들어준다.
실시예 4: mRNA 트랜스-스플라이싱 기반 rAAV 이중 벡터의 생체내 연구
이전 섹션에서 평가되었던 mRNA 트랜스-스플라이싱 기반 검정법의 가장 유력한 적용예는, 이중 rAAV 벡터의 틀에 대형 유전자를 재구성하는 것이다. 결과적으로, rAAV를 사용하여 마우스 망막에서 mRNA 트랜스-스플라이싱 접근법을 시험하였다. 이를 위해, 분할 형광단 검정법의 약간 변형된 방법을 이용하였다. 단일 바이러스가 형질도입된 세포내 rAAV 벡터 매개 발현을 제어하기 위해서, 이중 rAAV 벡터 카세트 2개에 형광단 서열, 즉 시트린(5' 벡터에 대한 암호화 서열의 5' 말단) 및 m체리(3' 벡터에 대한 암호화 서열의 3' 말단)를 통합하였다. 시험관내에서 가장 높은 재구성 효율을 보이는 BD중 어느 하나(즉 BD_h+i)를 생체내에서 사용하였다(도 10의 A). 이 실험 환경에서, 세룰리안 형광은 시트린뿐 아니라 m체리를 발현하는 세포내에서 발현되어야 한다.
역가 부합 바이러스를 생후 21일차(P21) WT C57Bl6/J 마우스에 망막하 주사하였다. 주사후 2주차에 망막을 수득한 후, RPE에서 고체 형광단 발현을 검출할 수 있었다(도 10의 B). 뿐 아니라, 세룰리안 형광은 시트린 및 m체리가 발현되었던 모든 구역에서 관찰할 수 있었는데, 이 점은 두 AAV가 공동 형질도입된 세포내에서 mRNA 트랜스-스플라이싱이 성공적으로 일어났음을 나타낸다. 그러나 시트린과 세룰리안은 부분적으로 중첩하는 여기 스펙트럼 및 방출 스펙트럼을 가졌다. 예컨대 시트린 또는 m체리의 관통 누출(bleed-through)에 의해 유발되는 인공적인 결과인 세룰리안 형광 발현의 가능성을 배제하기 위해, RPE 소 구역에서 두 형광단을 고강도 514 nm 레이저로 여기시켜 이 형광단들을 선택적으로 탈색(bleaching)시켰다. 시트린과 m체리 형광을 이 방법으로 완전히 제거할 수 있었다(도 10의 C). 그럼에도 불구, 세룰리안 형광은 바뀌지 않은 채 유지되었는데, 이 점은 세룰리안 형광이 오로지 트랜스-스플라이싱된 세룰리안 mRNA로부터 기원함을 나타낸다. 이 실험은, AAV로부터 발현된 유전자의 생체내 재구성에 있어 mRNA 트랜스-스플라이싱의 유용성에 관한 원리 증명을 제공한다.
실시예 5: 인간 유전자 치료법에 적합한 유력 결합 도메인의 동정
지금까지는, 모든 결합 도메인(BD) 서열을 인간 인트론 영역에서 수득하였다. 결합 도메인(BD) 서열이 인간 유전자 치료법에 사용되면, 이는 잠재적으로 내인성 mRNA와 결합할 수 있으며, 이러한 전사체에서의 트랜스-스플라이싱을 유도할 수 있다. 그러므로 인간 유전자 치료법에 mRNA 트랜스-스플라이싱을 적용하기 위해서는 인간 게놈과 상동성인 서열을 함유하지 않는 BD를 동정할 칠요가 있다. 이를 위해서, 무작위 100 bp 서열을 세균 lacZ 유전자로부터 취하여, 무작위 삽입, 결실 및 치환을 통해 변형시킴으로써, 인간 게놈과의 그 어떠한 상동성도 가지지 않는 4개의 서열을 수득하였다(도 11의 A).
반복 결합 도메인을 함유하는 5' 벡터 구조체 및 3' 벡터 구조체로 HEK293 세포를 공동 형질감염시켰을 때, BD들중 어느 하나(BD_k)에 대하여 78.3% ± 2.1%로 매우 높은 세룰리안 재구성 효율을 관찰할 수 있었다(도 11의 B ~ D). 따라서 BD_k는, 성능이 가장 좋은 인간 BD보다 효율이 더 좋았으므로(도 4 참조), mRNA 트랜스-스플라이싱을 통해 대형 유전자의 재구성을 평가하는 예비 실험에 사용되었다.
실시예 6: 시험관내 검정법에서 DNA 기반 재구성 연루 및 재구성 효율에 대한 폴리아데닐화 신호의 영향력
5' 벡터 및 3' 벡터로부터 기원하는 전 mRNA 분자 2개의 재구성은 핵내에서 일어나므로, 성숙 mRNA의 안정화 및 번역에 필요한 폴리아데닐화 신호(pA)는 이론상 5' 벡터에서는 생략될 수 있다. 이러한 결실의 이점은, 잔류하는 임의의 미 스플라이싱 5' 전 mRNA가 절단된 단백질의 번역을 초래하지 않을 것이라는 점이다, 그러므로 5' 벡터내 pA의 결실이 세룰리안 재구성 효율에 미치는 영향력을 관찰하였다. 이를 위해서, pA가 결여된 5' 벡터를 보통의 3' 벡터와 함께 공동 형질감염시켰다. 재구성은, 두 벡터(둘 다 pA 함유)로 공동 형질감염시킨 경우에 비하여 약간 감소한 것으로 보였다(도 12의 A 및 B). 그러나 이 실험은, 필요하다면 pA 신호가 생략될 수 있음을 보여준다. 더욱이, 필요한 구성요소 모두, 즉 재조합 유전성 서열과, 시스-스플라이싱을 통해 이 서열을 제거하기 위한 스플라이싱 요소는 mRNA 트랜스-스플라이싱 벡터에 존재하는 것으로 보아, 지금까지 관찰하여 왔던 성공적 재구성은 이론상 선행 기술의 하이브리드 이중 벡터 접근법에서와 같이 DNA 수준의 상동성 재조합에 의해 매개될 수 있었다(Carvalho et al., 2017). 이러한 가능성을 배제하기 위해, 3' 벡터내 프로모터를 결실시켰으며, 그 결과 3' 벡터는 전 mRNA로 전사되는 것이 방지되었고, 이로써 이 3' 벡터는 지금까지 공지되어 왔던 하이브리드 이중 벡터 접근법에 사용되었던 3' 벡터와 유사해졌다. 이 구조체를 보통의 5' 벡터와 함께 공동 형질감염시킨 후, 재구성은 관찰되지 않았다. 이 결과는, 세룰리안에 대하여 관찰된 모든 재구성이 mRNA 트랜스-스플라이싱을 통해 배타적으로 매개됨을 확인시켜주는 것이다.
실시예 7: mRNA 트랜스- 스플라이싱을 통한 대형 유전자 재구성에 대한 원리 증명
mRNA 트랜스-스플라이싱을 평가하기 위한 AAV 세룰리안 분할 리포터 검정법에 더하여, 치료 잠재성을 가지는 단백질을 시험하였다. 전사 활성인자 SpCas9-VPR, 즉 전사 활성인자 도메인 VP64-p65-Rta(VPR)에 융합된 촉매 불활성 뉴클레아제는 최근에 개발된 새로운 유전자 치료법용 도구이다. 이것의 크기가 큰 관계로(5.8 kb), 생체내 적용을 위해서는 이중 벡터를 통해 전달되어야 한다. 결과적으로, SpCas9-VPR은 mRNA 트랜스-스플라이싱을 통한 재구성에 적합한 후보를 대표한다. SpCas9-VPR의 암호화 서열을 c.2185에서 절반부 2개로 분할한 다음, 이 암호화 서열 절반부 2개에 BD_k 또는 이의 상보성 서열, 그리고 적당한 스플라이싱 요소, 즉 DSS 또는 vgASS_620을 통합시켰다. 전장(FL) SpCas9-VPR 구조체를 양성 대조군으로 사용하였다. 분할 구조체로 공동 형질감염된 HEK293 세포로부터의 RT-PCR은, SpCas9-VPR mRNA가 성공적으로 재구성되었음과, 원치않는 부산물은 생성되지 않았음을 규명하였다(도 13의 B). PCR 생성물의 서열결정은, 해독틀이 정확히 복구되었음을 확인시켜 주었다(도 13의 C). 또한, FL SpCas9-VPR 단백질은 웨스턴 블럿팅을 통해 검출될 수 있었다(도 13의 D). SpCas9-VPR의 재구성 효율은 13.2% ± 0.9%이었다. 이는, 대형 유전자의 재구성을 위한 mRNA 트랜스-스플라이싱 접근법의 이용 가능성에 대한 원리 증명을 제공한다.
실시예 8: ABCA4의 재구성(도 14)
마지막으로 인간 기원의 대형 유전자 재구성도 관찰하기 위해, 망막 ATP 결합 카세트 운반체를 암호화하는 ABCA4 유전자(6.8 kb)를 선택하였다. 이 유전자의 돌연변이는 유전성 망막 이영양증인 스타가르트 황반 이영양증을 일으키므로, 이 유전자는 유전자 치료법에 적합한 후보이다. ABCA4를 c.3243에서 절반부 2개로 분할한 다음, 여기에 BD_ k, DSS 및 vgASS_620을 통합하였다(도 14의 A). 절반부 2개는 인트론이 없고, 엑손 및 인트론으로 구성된 원산 전 mRNA와 유사하지 않은 긴 ABCA4 암호화 서열(CDS)을 함유하였다. 그러므로, 이것은 스플라이싱 인자의 전 mRNA로의 보충을 방해할 수 있었으며, 결과적으로는 mRNA 트랜스-스플라이싱 효율도 또한 감소시킬 수 있었다. 내인성 인간 전 mRNA와 더 많이 유사한 분할 유전자에 대해, CDS 절반부 둘 다에 짧은(80 bp) 개입 인트론 3개가 함유되도록 추가 구조체를 디자인하였다. 인트론이 없는 구조체들 또는 인트론을 함유하는 구조체들로 HEK293 세포를 일시 공동 형질감염시켜, 시험관내 재구성 역량을 관찰하였다. RT-PCR은, 개입 인트론을 가지는 분할 구조체와 개입 인트론을 가지지 않는 분할 구조체에 대해 ABCA4가 mRNA 수준에서 성공적으로 재구성되었음을 규명하였다(도 14의 B). 흥미롭게도, 인트론을 함유하는 분할 구조체는 더 효율적으로 트랜스-스플라이싱되는 것으로 보였다. 또한, 비 특이적 스플라이싱 생성물은 검출되지 않았으며, 해독틀도 올바르게 복구되었다(도 14의 C).
실시예 9: ABCA4의 생체내 rAAV 이중 벡터 mRNA 트랜스-스플라이싱(도 15)
마지막 실험에서, ABCA4 재구성에 대해 추가로 생체내 시험하였다. 이를 위해서, CMV 프로모터를 인간 로돕신(hRHO) 프로모터로 치환하여, 광 수용기 특이적 발현을 보장하였다(도 15의 A). WO 2019/076856에 기재된 바와 같이, 야생형 AAV2 캡시드로부터 유래한 자사의 최적화 NN 및 GL 캡시드 변이체를 사용하여 AAV를 제조하였다. ABCA4의 5'쪽 또는 3'쪽 CDS를 함유하는 역가 부합 바이러스를 1월령 C57Bl6/J 야생형 마우스에 망막하 공동 주사하였다. 4주 후, 망막을 수득하여, mRNA 수준에서뿐 아니라 단백질 수준에서 재구성이 성공적으로 이루어졌는지 평가하였다. 접합부 확장 프라이머 쌍으로 수행한 RT-PCR은, 두 캡시드 변이체, 즉 NN 및 GL이 성공적 재구성을 초래하였으며, 이 경우 NN 캡시드는 아마도 더 높은 (공동)형질도입 효율로 말미암아 재구성된 mRNA 수준을 한층 더 높였음을 규명하였다(도 15의 B). 서열결정을 통해 별도의 전 mRNA 분자 2개의 이음매 없는(seamless) 결찰을 확인하였다(도 15의 C). 더 정확한 정량을 위해 qRT-PCR을 수행하였다. 이러한 예비적 결과들(n = 1)은, 미주사 C57Bl6/J 야생형 망막에 비해 10배 ~ 40배 증가한 상대적 ABCA4 발현이 달성되었음을 보여주었고, 이는 또한 mRNA 수준에서 성공적이고 효율적인 재구성이 달성되었음을 확인시켜 주었다(도 15의 D). 마지막으로, ABCA4 재구성을 단백질 수준에서 관찰하기 위해, 주사한 망막의 단백질 용해물을 웨스턴 블럿팅에 사용하였다. 이식유전자 유래 단백질의 특이적 검출을 보장하기 위해. 항 myc 항체를 사용하였다. 결과는, 두 경우에서 재구성한 mRNA는 성공적인 생체내 단백질 발현을 달성하였음을 보여준다(도 15의 E).
<110> ViGeneron GmbH <120> An optimized acceptor splice site module for biological and biotechnological applications <130> 116313P1274PC <150> EP 18214415.4 <151> 2018-12-20 <160> 40 <170> KoPatentIn 3.0 <210> 1 <211> 13 <212> DNA <213> Unknown <220> <223> pyrimidine tract <400> 1 tcttttgtca tct 13 <210> 2 <211> 10 <212> DNA <213> Unknown <220> <223> intronic splice enhancer <400> 2 tggggggagg 10 <210> 3 <211> 26 <212> DNA <213> Unknown <220> <223> ASS region <400> 3 caacgagtct tttgtcatct acaggt 26 <210> 4 <211> 26 <212> DNA <213> Unknown <220> <223> ASS region <400> 4 caacgagttt tttgtcatct acaggt 26 <210> 5 <211> 50 <212> DNA <213> Unknown <220> <223> ASS region <400> 5 ctacacgctc aagccggagg tcaacaacga gtcttttgtc atctacaggt 50 <210> 6 <211> 38 <212> DNA <213> Unknown <220> <223> ASS region <400> 6 gccggaggtc aacaacgagt cttttgtcat ctacaggt 38 <210> 7 <211> 20 <212> DNA <213> Unknown <220> <223> ASS region <400> 7 gtcttttgtc atctacaggt 20 <210> 8 <211> 39 <212> DNA <213> Unknown <220> <223> ASS region <400> 8 gtcttttgtc atctacaggt gttcgtggtt cgtggtcca 39 <210> 9 <211> 166 <212> DNA <213> Unknown <220> <223> exon 3 of rhodopsin gene (containing the c.620T>G mutation <400> 9 gtacatcccc gagggcctgc agtgctcgtg tggaatcgac tactacacgc tcaagccgga 60 ggtcaacaac gagtcttttg tcatctacag gttcgtggtc cacttcacca tccccatgat 120 tatcatcttt ttctgctatg ggcagctcgt cttcaccgtc aaggag 166 <210> 10 <211> 1213 <212> DNA <213> Unknown <220> <223> mutated rhodopsin <400> 10 ccagctggag ccctgagtgg ctgagctcag gccttcgcag cattcttggg tgggagcagc 60 cacgggtcag ccacaagggc cacagccatg aatggcacag aaggccctaa cttctacgtg 120 cccttctcca atgcgacggg tgtggtacgc agccccttcg agtacccaca gtactacctg 180 gctgagccat ggcagttctc catgctggcc gcctacatgt ttctgctgat cgtgctgggc 240 ttccccatca acttcctcac gctctacgtc accgtccagc acaagaagct gcgcacgcct 300 ctcaactaca tcctgctcaa cctagccgtg gctgacctct tcatggtcct aggtggcttc 360 accagcaccc tctacacctc tctgcatgga tacttcgtct tcgggcccac aggatgcaat 420 ttggagggct tctttgccac cctgggcggt gaaattgccc tgtggtcctt ggtggtcctg 480 gccatcgagc ggtacgtggt ggtgtgtaag cccatgagca acttccgctt cggggagaac 540 catgccatca tgggcgttgc cttcacctgg gtcatggcgc tggcctgcgc cgcaccccca 600 ctcgccggct ggtccaggta catccccgag ggcctgcagt gctcgtgtgg aatcgactac 660 tacacgctca agccggaggt caacaacgag tcttttgtca tctacaggtt cgtggtccac 720 ttcaccatcc ccatgattat catctttttc tgctatgggc agctcgtctt caccgtcaag 780 gaggccgctg cccagcagca ggagtcagcc accacacaga aggcagagaa ggaggtcacc 840 cgcatggtca tcatcatggt catcgctttc ctgatctgct gggtgcccta cgccagcgtg 900 gcattctaca tcttcaccca ccagggctcc aacttcggtc ccatcttcat gaccatccca 960 gcgttctttg ccaagagcgc cgccatctac aaccctgtca tctatatcat gatgaacaag 1020 cagttccgga actgcatgct caccaccatc tgctgcggca agaacccact gggtgacgat 1080 gaggcctctg ctaccgtgtc caagacggag acgagccagg tggccccggc ctaagacctg 1140 cctaggactc tgtggccgac tataggcgtc tcccatcccc tacaccttcc cccagccaca 1200 gccatcccac cag 1213 <210> 11 <211> 13 <212> DNA <213> Unknown <220> <223> pyrimidine tract <400> 11 ttttttgtca ttt 13 <210> 12 <211> 14 <212> DNA <213> Unknown <220> <223> pyrimidine tract <400> 12 tcttttgtca tcta 14 <210> 13 <211> 21 <212> DNA <213> Unknown <220> <223> pyrimidine tract <400> 13 caacgagtct tttgtcatct a 21 <210> 14 <211> 130 <212> DNA <213> Unknown <220> <223> inverted repeat <400> 14 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct 130 <210> 15 <211> 130 <212> DNA <213> Unknown <220> <223> inverted repeat <400> 15 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120 gagcgcgcag 130 <210> 16 <211> 82 <212> DNA <213> Unknown <220> <223> poly A sequence <400> 16 gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 60 tataagctgc aataaacaag tt 82 <210> 17 <211> 100 <212> DNA <213> Unknown <220> <223> first binding domain <400> 17 agtgcatcaa ggcgatcaca tcagtgaaaa aaagccagac aggcggttaa accaacgcag 60 attaaacagc aggatgcaaa aattcgcagg tggtcagatg 100 <210> 18 <211> 100 <212> DNA <213> Unknown <220> <223> second binding domain <400> 18 catctgacca cctgcgaatt tttgcatcct gctgtttaat ctgcgttggt ttaaccgcct 60 gtctggcttt ttttcactga tgtgatcgcc ttgatgcact 100 <210> 19 <211> 4455 <212> DNA <213> Unknown <220> <223> Sequence shown in Fig 5 <400> 19 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagggcgc gccgtttaaa tagctagcga cattgattat 240 tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 300 tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 360 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 420 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 480 tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 540 agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 600 ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac 660 ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 720 aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc 780 gtgtacggtg ggaggtctat ataagcagag ctggtaccac cggtgccacc atgggcttcg 840 tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 900 gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 960 atgccaaccc actctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 1020 caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 1080 gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 1140 gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1200 gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1260 agagaattgc aggaagagga atacgaataa gggatatctt gaaagatgaa gaaacactga 1320 cactatttct cattaaaaac atcggcctgt ctgactcagt ggtctacctt ctgatcaact 1380 ctcaagtccg tccagagcag ttcgctcatg gagtcccgga cctggcgctg aaggacatcg 1440 cctgcagcga ggccctcctg gagcgcttca tcatcttcag ccagagacgc ggggcaaaga 1500 cggtgcgcta tgccctgtgc tccctctccc agggcaccct acagtggata gaagacactc 1560 tgtatgccaa cgtggacttc ttcaagctct tccgtgtgct tcccacactc ctagacagcc 1620 gttctcaagg tatcaatctg agatcttggg gaggaatatt atctgatatg tcaccaagaa 1680 ttcaagagtt tatccatcgg ccgagtatgc aggacttgct gtgggtgacc aggcccctca 1740 tgcagaatgg tggtccagag acctttacaa agctgatggg catcctgtct gacctcctgt 1800 gtggctaccc cgagggaggt ggctctcggg tgctctcctt caactggtat gaagacaata 1860 actataaggc ctttctgggg attgactcca caaggaagga tcctatctat tcttatgaca 1920 gaagaacaac atccttttgt aatgcattga tccagagcct ggagtcaaat cctttaacca 1980 aaatcgcttg gagggcggca aagcctttgc tgatgggaaa aatcctgtac actcctgatt 2040 cacctgcagc acgaaggata ctgaagaatg ccaactcaac ttttgaagaa ctggaacacg 2100 ttaggaagtt ggtcaaagcc tgggaagaag tagggcccca gatctggtac ttctttgaca 2160 acagcacaca gatgaacatg atcagagata ccctggggaa cccaacagta aaagactttt 2220 tgaataggca gcttggtgaa gaaggtatta ctgctgaagc catcctaaac ttcctctaca 2280 agggccctcg ggaaagccag gctgacgaca tggccaactt cgactggagg gacatattta 2340 acatcactga tcgcaccctc cgcctggtca atcaatacct ggagtgcttg gtcctggata 2400 agtttgaaag ctacaatgat gaaactcagc tcacccaacg tgccctctct ctactggagg 2460 aaaacatgtt ctgggccgga gtggtattcc ctgacatgta tccctggacc agctctctac 2520 caccccacgt gaagtataag atccgaatgg acatagacgt ggtggagaaa accaataaga 2580 ttaaagacag gtattgggat tctggtccca gagctgatcc cgtggaagat ttccggtaca 2640 tctggggcgg gtttgcctat ctgcaggaca tggttgaaca ggggatcaca aggagccagg 2700 tgcaggcgga ggctccagtt ggaatctacc tccagcagat gccctacccc tgcttcgtgg 2760 acgattcttt catgatcatc ctgaaccgct gtttccctat cttcatggtg ctggcatgga 2820 tctactctgt ctccatgact gtgaagagca tcgtcttgga gaaggagttg cgactgaagg 2880 agaccttgaa aaatcagggt gtctccaatg cagtgatttg gtgtacctgg ttcctggaca 2940 gcttctccat catgtcgatg agcatcttcc tcctgacgat attcatcatg catggaagaa 3000 tcctacatta cagcgaccca ttcatcctct tcctgttctt gttggctttc tccactgcca 3060 ccatcatgct gtgctttctg ctcagcacct tcttctccaa ggccagtctg gcagcagcct 3120 gtagtggtgt catctatttc accctctacc tgccacacat cctgtgcttc gcctggcagg 3180 accgcatgac cgctgagctg aagaaggctg tgagcttact gtctccggtg gcatttggat 3240 ttggcactga gtacctggtt cgctttgaag agcaaggcct ggggctgcag tggagcaaca 3300 tcgggaacag tcccacggaa ggggacgaat tcagcttcct gctgtccatg cagatgatgc 3360 tccttgatgc tgctgtctat ggcttactcg cttggtacct tgatcaggtg tttccaggag 3420 actatggaac cccacttcct tggtactttc ttctacaaga gtcgtattgg cttggcggtg 3480 aagggtgttc aaccagagaa gaaagagccc tggaaaagac cgagccccta acagaggaaa 3540 cggaggatcc agagcaccca gaaggaatac acgactcctt ctttgaacgt gagcatccag 3600 ggtgggttcc tggggtatgc gtgaagaatc tggtaaagat ttttgagccc tgtggccggc 3660 cagctgtgga ccgtctgaac atcaccttct acgagaacca gatcaccgca ttcctgggcc 3720 acaatggagc tgggaaaacc accaccttgt ccatcctgac gggtctgttg ccaccaacct 3780 ctgggactgt gctcgttggg ggaagggaca ttgaaaccag cctggatgca gtccggcaga 3840 gccttggcat gtgtccacag cacaacatcc tgttccacca cctcacggtg gctgagcaca 3900 tgctgttcta tgcccagctg aaaggaaagt cccaggagga ggcccagctg gagatggaag 3960 ccatgttgga ggacacaggc ctccaccaca agcggaatga agaggctcag gacctatcag 4020 gtggcatgca gagaaagctg tcggttgcca ttgcctttgt gggagatgcc aaggtaaggg 4080 cactgagcag aagggaagaa gctccggggg ctctttgtag ggtaagctta gtgcatcaag 4140 gcgatcacat cagtgaaaaa aagccagaca ggcggttaaa ccaacgcaga ttaaacagca 4200 ggatgcaaaa attcgcaggt ggtcagatga agcttattct cgagttaagg gcgaattccc 4260 gattaggatc ttcctagagc atggctacgt agataagtag catggcgggt taatcattaa 4320 ctacaaggaa cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac 4380 tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag 4440 cgagcgagcg cgcag 4455 <210> 20 <211> 4855 <212> DNA <213> Unknown <220> <223> Sequence shown in Figure 6 <400> 20 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagggcgc gccgtttaaa tagctagcga cattgattat 240 tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 300 tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 360 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 420 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 480 tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 540 agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 600 ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac 660 ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 720 aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc 780 gtgtacggtg ggaggtctat ataagcagag ctggtaccac cggtagaaag cttcatctga 840 ccacctgcga atttttgcat cctgctgttt aatctgcgtt ggtttaaccg cctgtctggc 900 tttttttcac tgatgtgatc gccttgatgc actaagcttc aacgagtctt ttgtcatcta 960 caggtggtga ttctggacga acccacctct ggggtggacc cttactcgag acgctcaatc 1020 tgggatctgc tcctgaagta tcgctcaggc agaaccatca tcatgtccac tcaccacatg 1080 gacgaggccg acctccttgg ggaccgcatt gccatcattg cccagggaag gctctactgc 1140 tcaggcaccc cactcttcct gaagaactgc tttggcacag gcttgtactt aaccttggtg 1200 cgcaagatga aaaacatcca gagccaaagg aaaggcagtg aggggacctg cagctgctcg 1260 tctaagggtt tctccaccac gtgtccagcc cacgtcgatg acctaactcc agaacaagtc 1320 ctggatgggg atgtaaatga gctgatggat gtagttctcc accatgttcc agaggcaaag 1380 ctggtggagt gcattggtca agaacttatc ttccttcttc caaataagaa cttcaagcac 1440 agagcatatg ccagcctttt cagagagctg gaggagacgc tggctgacct tggtctcagc 1500 agttttggaa tttctgacac tcccctggaa gagatttttc tgaaggtcac ggaggattct 1560 gattcaggac ctctgtttgc gggtggcgct cagcagaaaa gagaaaacgt caacccccga 1620 cacccctgct tgggtcccag agagaaggct ggacagacac cccaggactc caatgtctgc 1680 tccccagggg cgccggctgc tcacccagag ggccagcctc ccccagagcc agagtgccca 1740 ggcccgcagc tcaacacggg gacacagctg gtcctccagc atgtgcaggc gctgctggtc 1800 aagagattcc aacacaccat ccgcagccac aaggacttcc tggcgcagat cgtgctcccg 1860 gctacctttg tgtttttggc tctgatgctt tctattgtta tccctccttt tggcgaatac 1920 cccgctttga cccttcaccc ctggatatat gggcagcagt acaccttctt cagcatggat 1980 gaaccaggca gtgagcagtt cacggtactt gcagacgtcc tcctgaataa gccaggcttt 2040 ggcaaccgct gcctgaagga agggtggctt ccggagtacc cctgtggcaa ctcaacaccc 2100 tggaagactc cttctgtgtc cccaaacatc acccagctgt tccagaagca gaaatggaca 2160 caggtcaacc cttcaccatc ctgcaggtgc agcaccaggg agaagctcac catgctgcca 2220 gagtgccccg agggtgccgg gggcctcccg cccccccaga gaacacagcg cagcacggaa 2280 attctacaag acctgacgga caggaacatc tccgacttct tggtaaaaac gtatcctgct 2340 cttataagaa gcagcttaaa gagcaaattc tgggtcaatg aacagaggta tggaggaatt 2400 tccattggag gaaagctccc agtcgtcccc atcacggggg aagcacttgt tgggttttta 2460 agcgaccttg gccggatcat gaatgtgagc gggggcccta tcactagaga ggcctctaaa 2520 gaaatacctg atttccttaa acatctagaa actgaagaca acattaaggt gtggtttaat 2580 aacaaaggct ggcatgccct ggtcagcttt ctcaatgtgg cccacaacgc catcttacgg 2640 gccagcctgc ctaaggacag gagccccgag gagtatggaa tcaccgtcat tagccaaccc 2700 ctgaacctga ccaaggagca gctctcagag attacagtgc tgaccacttc agtggatgct 2760 gtggttgcca tctgcgtgat tttctccatg tccttcgtcc cagccagctt tgtcctttat 2820 ttgatccagg agcgggtgaa caaatccaag cacctccagt ttatcagtgg agtgagcccc 2880 accacctact gggtgaccaa cttcctctgg gacatcatga attattccgt gagtgctggg 2940 ctggtggtgg gcatcttcat cgggtttcag aagaaagcct acacttctcc agaaaacctt 3000 cctgcccttg tggcactgct cctgctgtat ggatgggcgg tcattcccat gatgtaccca 3060 gcatccttcc tgtttgatgt ccccagcaca gcctatgtgg ctttatcttg tgctaatctg 3120 ttcatcggca tcaacagcag tgctattacc ttcatcttgg aattatttga gaataaccgg 3180 acgctgctca ggttcaacgc cgtgctgagg aagctgctca ttgtcttccc ccacttctgc 3240 ctgggccggg gcctcattga ccttgcactg agccaggctg tgacagatgt ctatgcccgg 3300 tttggtgagg agcactctgc aaatccgttc cactgggacc tgattgggaa gaacctgttt 3360 gccatggtgg tggaaggggt ggtgtacttc ctcctgaccc tgctggtcca gcgccacttc 3420 ttcctctccc aatggattgc cgagcccact aaggagccca ttgttgatga agatgatgat 3480 gtggctgaag aaagacaaag aattattact ggtggaaata aaactgacat cttaaggcta 3540 catgaactaa ccaagattta tccaggcacc tccagcccag cagtggacag gctgtgtgtc 3600 ggagttcgcc ctggagagtg ctttggcctc ctgggagtga atggtgccgg caaaacaacc 3660 acattcaaga tgctcactgg ggacaccaca gtgacctcag gggatgccac cgtagcaggc 3720 aagagtattt taaccaatat ttctgaagtc catcaaaata tgggctactg tcctcagttt 3780 gatgcaattg atgagctgct cacaggacga gaacatcttt acctttatgc ccggcttcga 3840 ggtgtaccag cagaagaaat cgaaaaggtt gcaaactgga gtattaagag cctgggcctg 3900 actgtctacg ccgactgcct ggctggcacg tacagtgggg gcaacaagcg gaaactctcc 3960 acagccatcg cactcattgg ctgcccaccg ctggtgctgc tggatgagcc caccacaggg 4020 atggaccccc aggcacgccg catgctgtgg aacgtcatcg tgagcatcat cagagaaggg 4080 agggctgtgg tcctcacatc ccacagcatg gaagaatgtg aggcactgtg tacccggctg 4140 gccatcatgg taaagggcgc ctttcgatgt atgggcacca ttcagcatct caagtccaaa 4200 tttggagatg gctatatcgt cacaatgaag atcaaatccc cgaaggacga cctgcttcct 4260 gacctgaacc ctgtggagca gttcttccag gggaacttcc caggcagtgt gcagagggag 4320 aggcactaca acatgctcca gttccaggtc tcctcctcct ccctggcgag gatcttccag 4380 ctcctcctct cccacaagga cagcctgctc atcgaggagt actcagtcac acagaccaca 4440 ctggaccagg tgtttgtaaa ttttgctaaa cagcagactg aaagtcatga cctccctctg 4500 caccctcgag ctgctggagc cagtcgacaa gcccaggact gagtcgacgc ggccgcgcag 4560 tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata 4620 agctgcaata aacaagttct cgagttaagg gcgaattccc gattaggatc ttcctagagc 4680 atggctacgt agataagtag catggcgggt taatcattaa ctacaaggaa cccctagtga 4740 tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg 4800 tcgcccgacg cccgggcttt gcccgggcgg cctcagtgag cgagcgagcg cgcag 4855 <210> 21 <211> 4390 <212> DNA <213> Unknown <220> <223> Sequence shown in Figure 7 <400> 21 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagggcgc gccgtttaaa tagctagcaa aagactaaaa 240 gagggaggga tcacttcaga tctgccgagt gagtcgattg gacttaaagg gccagtcaaa 300 ccctgactgc cggctcatgg caggctcttg ccgaggacaa atgcccagcc tatatttatg 360 caaagagatt ttgttccaaa cttaaggtca aagataccta aagacatccc cctcaggaac 420 ccctctcatg gaggagagtg cctgagggtc ttggtttccc attgcatccc ccacctcaat 480 ttccctggtg cccagccact tgtgtcttta gggttctctt tctctccata aaagggagcc 540 aacacagtgt cggcctcctc tccccaacta agggcttatg tgtaattaaa agggattatg 600 ctttgaaggg gaaaagtagc ctttaatcac caggagaagg acacagcgtc cggagccaga 660 ggcgctctta acggcgttta tgtcctttgc tgtctgaggg gcctcagctc tgaccaatct 720 ggtcttcgtg tggtcattag cggtaccggt accaccggtg ccaccatggg cttcgtgaga 780 cagatacagc ttttgctctg gaagaactgg accctgcgga aaaggcaaaa gattcgcttt 840 gtggtggaac tcgtgtggcc tttatcttta tttctggtct tgatctggtt aaggaatgcc 900 aacccactct acagccatca tgaatgccat ttccccaaca aggcgatgcc ctcagcagga 960 atgctgccgt ggctccaggg gatcttctgc aatgtgaaca atccctgttt tcaaagcccc 1020 accccaggag aatctcctgg aattgtgtca aactataaca actccatctt ggcaagggta 1080 tatcgagatt ttcaagaact cctcatgaat gcaccagaga gccagcacct tggccgtatt 1140 tggacagagc tacacatctt gtcccaattc atggacaccc tccggactca cccggagaga 1200 attgcaggaa gaggaatacg aataagggat atcttgaaag atgaagaaac actgacacta 1260 tttctcatta aaaacatcgg cctgtctgac tcagtggtct accttctgat caactctcaa 1320 gtccgtccag agcagttcgc tcatggagtc ccggacctgg cgctgaagga catcgcctgc 1380 agcgaggccc tcctggagcg cttcatcatc ttcagccaga gacgcggggc aaagacggtg 1440 cgctatgccc tgtgctccct ctcccagggc accctacagt ggatagaaga cactctgtat 1500 gccaacgtgg acttcttcaa gctcttccgt gtgcttccca cactcctaga cagccgttct 1560 caaggtatca atctgagatc ttggggagga atattatctg atatgtcacc aagaattcaa 1620 gagtttatcc atcggccgag tatgcaggac ttgctgtggg tgaccaggcc cctcatgcag 1680 aatggtggtc cagagacctt tacaaagctg atgggcatcc tgtctgacct cctgtgtggc 1740 taccccgagg gaggtggctc tcgggtgctc tccttcaact ggtatgaaga caataactat 1800 aaggcctttc tggggattga ctccacaagg aaggatccta tctattctta tgacagaaga 1860 acaacatcct tttgtaatgc attgatccag agcctggagt caaatccttt aaccaaaatc 1920 gcttggaggg cggcaaagcc tttgctgatg ggaaaaatcc tgtacactcc tgattcacct 1980 gcagcacgaa ggatactgaa gaatgccaac tcaacttttg aagaactgga acacgttagg 2040 aagttggtca aagcctggga agaagtaggg ccccagatct ggtacttctt tgacaacagc 2100 acacagatga acatgatcag agataccctg gggaacccaa cagtaaaaga ctttttgaat 2160 aggcagcttg gtgaagaagg tattactgct gaagccatcc taaacttcct ctacaagggc 2220 cctcgggaaa gccaggctga cgacatggcc aacttcgact ggagggacat atttaacatc 2280 actgatcgca ccctccgcct ggtcaatcaa tacctggagt gcttggtcct ggataagttt 2340 gaaagctaca atgatgaaac tcagctcacc caacgtgccc tctctctact ggaggaaaac 2400 atgttctggg ccggagtggt attccctgac atgtatccct ggaccagctc tctaccaccc 2460 cacgtgaagt ataagatccg aatggacata gacgtggtgg agaaaaccaa taagattaaa 2520 gacaggtatt gggattctgg tcccagagct gatcccgtgg aagatttccg gtacatctgg 2580 ggcgggtttg cctatctgca ggacatggtt gaacagggga tcacaaggag ccaggtgcag 2640 gcggaggctc cagttggaat ctacctccag cagatgccct acccctgctt cgtggacgat 2700 tctttcatga tcatcctgaa ccgctgtttc cctatcttca tggtgctggc atggatctac 2760 tctgtctcca tgactgtgaa gagcatcgtc ttggagaagg agttgcgact gaaggagacc 2820 ttgaaaaatc agggtgtctc caatgcagtg atttggtgta cctggttcct ggacagcttc 2880 tccatcatgt cgatgagcat cttcctcctg acgatattca tcatgcatgg aagaatccta 2940 cattacagcg acccattcat cctcttcctg ttcttgttgg ctttctccac tgccaccatc 3000 atgctgtgct ttctgctcag caccttcttc tccaaggcca gtctggcagc agcctgtagt 3060 ggtgtcatct atttcaccct ctacctgcca cacatcctgt gcttcgcctg gcaggaccgc 3120 atgaccgctg agctgaagaa ggctgtgagc ttactgtctc cggtggcatt tggatttggc 3180 actgagtacc tggttcgctt tgaagagcaa ggcctggggc tgcagtggag caacatcggg 3240 aacagtccca cggaagggga cgaattcagc ttcctgctgt ccatgcagat gatgctcctt 3300 gatgctgctg tctatggctt actcgcttgg taccttgatc aggtgtttcc aggagactat 3360 ggaaccccac ttccttggta ctttcttcta caagagtcgt attggcttgg cggtgaaggg 3420 tgttcaacca gagaagaaag agccctggaa aagaccgagc ccctaacaga ggaaacggag 3480 gatccagagc acccagaagg aatacacgac tccttctttg aacgtgagca tccagggtgg 3540 gttcctgggg tatgcgtgaa gaatctggta aagatttttg agccctgtgg ccggccagct 3600 gtggaccgtc tgaacatcac cttctacgag aaccagatca ccgcattcct gggccacaat 3660 ggagctggga aaaccaccac cttgtccatc ctgacgggtc tgttgccacc aacctctggg 3720 actgtgctcg ttgggggaag ggacattgaa accagcctgg atgcagtccg gcagagcctt 3780 ggcatgtgtc cacagcacaa catcctgttc caccacctca cggtggctga gcacatgctg 3840 ttctatgccc agctgaaagg aaagtcccag gaggaggccc agctggagat ggaagccatg 3900 ttggaggaca caggcctcca ccacaagcgg aatgaagagg ctcaggacct atcaggtggc 3960 atgcagagaa agctgtcggt tgccattgcc tttgtgggag atgccaaggt aagggcactg 4020 agcagaaggg aagaagctcc gggggctctt tgtagggtaa gcttagtgca tcaaggcgat 4080 cacatcagtg aaaaaaagcc agacaggcgg ttaaaccaac gcagattaaa cagcaggatg 4140 caaaaattcg caggtggtca gatgaagctt attctcgagt taagggcgaa ttcccgatta 4200 ggatcttcct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca 4260 aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 4320 ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 4380 gagcgcgcag 4390 <210> 22 <211> 4790 <212> DNA <213> Unknown <220> <223> Sequence shown in Figure 8 <400> 22 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagggcgc gccgtttaaa tagctagcaa aagactaaaa 240 gagggaggga tcacttcaga tctgccgagt gagtcgattg gacttaaagg gccagtcaaa 300 ccctgactgc cggctcatgg caggctcttg ccgaggacaa atgcccagcc tatatttatg 360 caaagagatt ttgttccaaa cttaaggtca aagataccta aagacatccc cctcaggaac 420 ccctctcatg gaggagagtg cctgagggtc ttggtttccc attgcatccc ccacctcaat 480 ttccctggtg cccagccact tgtgtcttta gggttctctt tctctccata aaagggagcc 540 aacacagtgt cggcctcctc tccccaacta agggcttatg tgtaattaaa agggattatg 600 ctttgaaggg gaaaagtagc ctttaatcac caggagaagg acacagcgtc cggagccaga 660 ggcgctctta acggcgttta tgtcctttgc tgtctgaggg gcctcagctc tgaccaatct 720 ggtcttcgtg tggtcattag cggtaccggt accaccggta gaaagcttca tctgaccacc 780 tgcgaatttt tgcatcctgc tgtttaatct gcgttggttt aaccgcctgt ctggcttttt 840 ttcactgatg tgatcgcctt gatgcactaa gcttcaacga gtcttttgtc atctacaggt 900 ggtgattctg gacgaaccca cctctggggt ggacccttac tcgagacgct caatctggga 960 tctgctcctg aagtatcgct caggcagaac catcatcatg tccactcacc acatggacga 1020 ggccgacctc cttggggacc gcattgccat cattgcccag ggaaggctct actgctcagg 1080 caccccactc ttcctgaaga actgctttgg cacaggcttg tacttaacct tggtgcgcaa 1140 gatgaaaaac atccagagcc aaaggaaagg cagtgagggg acctgcagct gctcgtctaa 1200 gggtttctcc accacgtgtc cagcccacgt cgatgaccta actccagaac aagtcctgga 1260 tggggatgta aatgagctga tggatgtagt tctccaccat gttccagagg caaagctggt 1320 ggagtgcatt ggtcaagaac ttatcttcct tcttccaaat aagaacttca agcacagagc 1380 atatgccagc cttttcagag agctggagga gacgctggct gaccttggtc tcagcagttt 1440 tggaatttct gacactcccc tggaagagat ttttctgaag gtcacggagg attctgattc 1500 aggacctctg tttgcgggtg gcgctcagca gaaaagagaa aacgtcaacc cccgacaccc 1560 ctgcttgggt cccagagaga aggctggaca gacaccccag gactccaatg tctgctcccc 1620 aggggcgccg gctgctcacc cagagggcca gcctccccca gagccagagt gcccaggccc 1680 gcagctcaac acggggacac agctggtcct ccagcatgtg caggcgctgc tggtcaagag 1740 attccaacac accatccgca gccacaagga cttcctggcg cagatcgtgc tcccggctac 1800 ctttgtgttt ttggctctga tgctttctat tgttatccct ccttttggcg aataccccgc 1860 tttgaccctt cacccctgga tatatgggca gcagtacacc ttcttcagca tggatgaacc 1920 aggcagtgag cagttcacgg tacttgcaga cgtcctcctg aataagccag gctttggcaa 1980 ccgctgcctg aaggaagggt ggcttccgga gtacccctgt ggcaactcaa caccctggaa 2040 gactccttct gtgtccccaa acatcaccca gctgttccag aagcagaaat ggacacaggt 2100 caacccttca ccatcctgca ggtgcagcac cagggagaag ctcaccatgc tgccagagtg 2160 ccccgagggt gccgggggcc tcccgccccc ccagagaaca cagcgcagca cggaaattct 2220 acaagacctg acggacagga acatctccga cttcttggta aaaacgtatc ctgctcttat 2280 aagaagcagc ttaaagagca aattctgggt caatgaacag aggtatggag gaatttccat 2340 tggaggaaag ctcccagtcg tccccatcac gggggaagca cttgttgggt ttttaagcga 2400 ccttggccgg atcatgaatg tgagcggggg ccctatcact agagaggcct ctaaagaaat 2460 acctgatttc cttaaacatc tagaaactga agacaacatt aaggtgtggt ttaataacaa 2520 aggctggcat gccctggtca gctttctcaa tgtggcccac aacgccatct tacgggccag 2580 cctgcctaag gacaggagcc ccgaggagta tggaatcacc gtcattagcc aacccctgaa 2640 cctgaccaag gagcagctct cagagattac agtgctgacc acttcagtgg atgctgtggt 2700 tgccatctgc gtgattttct ccatgtcctt cgtcccagcc agctttgtcc tttatttgat 2760 ccaggagcgg gtgaacaaat ccaagcacct ccagtttatc agtggagtga gccccaccac 2820 ctactgggtg accaacttcc tctgggacat catgaattat tccgtgagtg ctgggctggt 2880 ggtgggcatc ttcatcgggt ttcagaagaa agcctacact tctccagaaa accttcctgc 2940 ccttgtggca ctgctcctgc tgtatggatg ggcggtcatt cccatgatgt acccagcatc 3000 cttcctgttt gatgtcccca gcacagccta tgtggcttta tcttgtgcta atctgttcat 3060 cggcatcaac agcagtgcta ttaccttcat cttggaatta tttgagaata accggacgct 3120 gctcaggttc aacgccgtgc tgaggaagct gctcattgtc ttcccccact tctgcctggg 3180 ccggggcctc attgaccttg cactgagcca ggctgtgaca gatgtctatg cccggtttgg 3240 tgaggagcac tctgcaaatc cgttccactg ggacctgatt gggaagaacc tgtttgccat 3300 ggtggtggaa ggggtggtgt acttcctcct gaccctgctg gtccagcgcc acttcttcct 3360 ctcccaatgg attgccgagc ccactaagga gcccattgtt gatgaagatg atgatgtggc 3420 tgaagaaaga caaagaatta ttactggtgg aaataaaact gacatcttaa ggctacatga 3480 actaaccaag atttatccag gcacctccag cccagcagtg gacaggctgt gtgtcggagt 3540 tcgccctgga gagtgctttg gcctcctggg agtgaatggt gccggcaaaa caaccacatt 3600 caagatgctc actggggaca ccacagtgac ctcaggggat gccaccgtag caggcaagag 3660 tattttaacc aatatttctg aagtccatca aaatatgggc tactgtcctc agtttgatgc 3720 aattgatgag ctgctcacag gacgagaaca tctttacctt tatgcccggc ttcgaggtgt 3780 accagcagaa gaaatcgaaa aggttgcaaa ctggagtatt aagagcctgg gcctgactgt 3840 ctacgccgac tgcctggctg gcacgtacag tgggggcaac aagcggaaac tctccacagc 3900 catcgcactc attggctgcc caccgctggt gctgctggat gagcccacca cagggatgga 3960 cccccaggca cgccgcatgc tgtggaacgt catcgtgagc atcatcagag aagggagggc 4020 tgtggtcctc acatcccaca gcatggaaga atgtgaggca ctgtgtaccc ggctggccat 4080 catggtaaag ggcgcctttc gatgtatggg caccattcag catctcaagt ccaaatttgg 4140 agatggctat atcgtcacaa tgaagatcaa atccccgaag gacgacctgc ttcctgacct 4200 gaaccctgtg gagcagttct tccaggggaa cttcccaggc agtgtgcaga gggagaggca 4260 ctacaacatg ctccagttcc aggtctcctc ctcctccctg gcgaggatct tccagctcct 4320 cctctcccac aaggacagcc tgctcatcga ggagtactca gtcacacaga ccacactgga 4380 ccaggtgttt gtaaattttg ctaaacagca gactgaaagt catgacctcc ctctgcaccc 4440 tcgagctgct ggagccagtc gacaagccca ggactgagtc gacgcggccg cgcagtgaaa 4500 aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg 4560 caataaacaa gttctcgagt taagggcgaa ttcccgatta ggatcttcct agagcatggc 4620 tacgtagata agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag 4680 ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 4740 cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag 4790 <210> 23 <211> 240 <212> DNA <213> Unknown <220> <223> ASS sequence <400> 23 ctcggcagcc accttggctg ttcccaagtc cctcacaggc agggtctccc tacctgcctg 60 tcctcaggta catccccgag ggcctgcagt gctcgtgtgg aatcgactac tacacgctca 120 agccggaggt caacaacgag tcttttgtca tctacatgtt cgtggtccac ttcaccatcc 180 ccatgattat catctttttc tgctatgggc agctcgtctt caccgtcaag gaggtacggg 240 240 <210> 24 <211> 240 <212> DNA <213> Unknown <220> <223> ASS sequence <400> 24 ctcggcagcc accttggctg ttcccaagtc cctcacaggc agggtctccc tacctgcctg 60 tcctcaggta catccccgag ggcctgcagt gctcgtgtgg aatcgactac tacacgctca 120 agccggaggt caacaacgag tcttttgtca tctacaggtt cgtggtccac ttcaccatcc 180 ccatgattat catctttttc tgctatgggc agctcgtctt caccgtcaag gaggtacggg 240 240 <210> 25 <211> 50 <212> DNA <213> Unknown <220> <223> ASS sequence <400> 25 ctacacgctc aagccggagg tcaacaacga gtcttttgtc atctacatgt 50 <210> 26 <211> 27 <212> DNA <213> Unknown <220> <223> ASS sequence <400> 26 gtcttttgtc atctacaggt gttcgtg 27 <210> 27 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> binding domain BD_g <400> 27 gttccaggga gggaatgtga agccccagaa agggccagcg ccaggtggaa ttcgctagct 60 cggcagccac cttggctgtt cccaagtccc tcacaggcag gg 102 <210> 28 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Binding domain BD_h+i <400> 28 gttaaccctc cagtcaggac tcaaacccag tagtgtctgg ttccaggcac tgacctgcta 60 gctcggcagc caccttggct gttcccaagt ccctcacagg caggg 105 <210> 29 <211> 149 <212> DNA <213> Artificial Sequence <220> <223> Binding domain PTM1, B2 <400> 29 caccattcat ggtgatagcc gggctgctgt ttgtgcaggg ctggcactga acactgcctt 60 gatcttattt ggagcaatat gcgcttgtct aatttcacag caagaaaact gagctgaggc 120 tcaaagaagt caagcgccct gctggggcg 149 <210> 30 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> ITR2 forward primer <400> 30 ggaaccccta gtgatggagt t 21 <210> 31 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> ITR2 reverse primer <400> 31 cggcctcagt gagcga 16 <210> 32 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Binding domain BD_j <400> 32 catctgacca ccagcgaatt tttgcatcca gctgtttaat cagcgttggt ttaaccgcca 60 gtcaggcttt ctttcaaaga tgtgatcgcc ttgcagcact 100 <210> 33 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Binding domain BD_I <400> 33 ccatcccgca tctgaccacc agcgaaatgg atttttgcat ccagctgggt aacgttggca 60 atttaaccgc cagtcaggct ttctttcaaa gatgtggatt 100 <210> 34 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> Binding domain BD_m <400> 34 ccatcccgca tctgaccacc tgcgaaatgg atttttgcat cctgctgggt aacgttggca 60 atttaaccgc ctgtctggct ttctttcaat gatgtggatt 100 <210> 35 <211> 1324 <212> DNA <213> Artificial Sequence <220> <223> 5' cerulean + BD_g <400> 35 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctctctgg ctaactagag 600 aacccactgc ttactggctt atcgaaatta atacgactca ctatagggag acccaagctg 660 gctagttaag cttatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 720 ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 780 cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accacaggta agggcactga 840 gcagaaggga agaagctccg ggggctcttt gtagggtgga tccccctgcc tgtgagggac 900 ttgggaacag ccaaggtggc tgccgagcta gcgaattcca cctggcgctg gccctttctg 960 gggcttcaca ttccctccct ggaacggatc cctcgaggtc acccattcga acaaaaactc 1020 atctcagaag aggatctgaa tatgcatacc ggtcatcatc accatcacca ttgagtttaa 1080 acccgctgat cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc 1140 cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag 1200 gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag 1260 gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct 1320 atgg 1324 <210> 36 <211> 1710 <212> DNA <213> Artificial Sequence <220> <223> 3' cerulean + BD_g <400> 36 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctctctgg ctaactagag 600 aacccactgc ttactggctt atcgaaatta atacgactca ctatagggag acccaagctg 660 gctagttaag cttggatccg ttccagggag ggaatgtgaa gccccagaaa gggccagcgc 720 caggtggaat tcgctagctc ggcagccacc ttggctgttc ccaagtccct cacaggcagg 780 gggatcccaa cgagtctttt gtcatctaca ggtaagctgc ccgtgccctg gcccaccctc 840 gtgaccaccc tgacctgggg cgtgcagtgc ttcgcccgct accccgacca catgaagcag 900 cacgacttct tcaagtccgc catgcccgaa ggctacgtcc aggagcgcac catcttcttc 960 aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt tcgagggcga caccctggtg 1020 aaccgcatcg agctgaaggg catcgacttc aaggaggacg gcaacatcct ggggcacaag 1080 ctggagtaca acgccatcag cgacaacgtc tatatcaccg ccgacaagca gaagaacggc 1140 atcaaggcca acttcaagat ccgccacaac atcgaggacg gcagcgtgca gctcgccgac 1200 cactaccagc agaacacccc catcggcgac ggccccgtgc tgctgcccga caaccactac 1260 ctgagcaccc agtccaagct gagcaaagac cccaacgaga agcgcgatca catggtcctg 1320 ctggagttcg tgaccgccgc cgggatcact ctcggcatgg acgagctgta caagtaactc 1380 gaggtcaccc attcgaacaa aaactcatct cagaagagga tctgaatatg cataccggtc 1440 atcatcacca tcaccattga gtttaaaccc gctgatcagc ctcgactgtg ccttctagtt 1500 gccagccatc tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc 1560 ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt 1620 ctattctggg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca 1680 ggcatgctgg ggatgcggtg ggctctatgg 1710 <210> 37 <211> 3142 <212> DNA <213> Artificial Sequence <220> <223> 5' SpCas9-VPR + BD_k <400> 37 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctcgttta gtgaaccgtc 600 agaaccggtc gactagagga tccatggccc caaagaagaa gcggaaggtc ggtatccacg 660 gagtcccagc agccgacaag aagtactcca ttgggctcgc tatcggcaca aacagcgtcg 720 gctgggccgt cattacggac gagtacaagg tgccgagcaa aaaattcaaa gttctgggca 780 ataccgatcg ccacagcata aagaagaacc tcattggcgc cctcctgttc gactccgggg 840 aaacggccga agccacgcgg ctcaaaagaa cagcacggcg cagatatacc cgcagaaaga 900 atcggatctg ctacctgcag gagatcttta gtaatgagat ggctaaggtg gatgactctt 960 tcttccatag gctggaggag tcctttttgg tggaggagga taaaaagcac gagcgccacc 1020 caatctttgg caatatcgtg gacgaggtgg cgtaccatga aaagtaccca accatatatc 1080 atctgaggaa gaagcttgta gacagtactg ataaggctga cttgcggttg atctatctcg 1140 cgctggcgca tatgatcaaa tttcggggac acttcctcat cgagggggac ctgaacccag 1200 acaacagcga tgtcgacaaa ctctttatcc aactggttca gacttacaat cagcttttcg 1260 aagagaaccc gatcaacgca tccggagttg acgccaaagc aatcctgagc gctaggctgt 1320 ccaaatcccg gcggctcgaa aacctcatcg cacagctccc tggggagaag aagaacggcc 1380 tgtttggtaa tcttatcgcc ctgtcactcg ggctgacccc caactttaaa tctaacttcg 1440 acctggccga agatgccaag cttcaactga gcaaagacac ctacgatgat gatctcgaca 1500 atctgctggc ccagatcggc gaccagtacg cagacctttt tttggcggca aagaacctgt 1560 cagacgccat tctgctgagt gatattctgc gagtgaacac ggagatcacc aaagctccgc 1620 tgagcgctag tatgatcaag cgctatgatg agcaccacca agacttgact ttgctgaagg 1680 cccttgtcag acagcaactg cctgagaagt acaaggaaat tttcttcgat cagtctaaaa 1740 atggctacgc cggatacatt gacggcggag caagccagga ggaattttac aaatttatta 1800 agcccatctt ggaaaaaatg gacggcaccg aggagctgct ggtaaagctt aacagagaag 1860 atctgttgcg caaacagcgc actttcgaca atggaagcat cccccaccag attcacctgg 1920 gcgaactgca cgctatcctc aggcggcaag aggatttcta cccctttttg aaagataaca 1980 gggaaaagat tgagaaaatc ctcacatttc ggatacccta ctatgtaggc cccctcgccc 2040 ggggaaattc cagattcgcg tggatgactc gcaaatcaga agagaccatc actccctgga 2100 acttcgagga agtcgtggat aagggggcct ctgcccagtc cttcatcgaa aggatgacta 2160 actttgataa aaatctgcct aacgaaaagg tgcttcctaa acactctctg ctgtacgagt 2220 acttcacagt ttataacgag ctcaccaagg tcaaatacgt cacagaaggg atgagaaagc 2280 cagcattcct gtctggagag cagaagaaag ctatcgtgga cctcctcttc aagacgaacc 2340 ggaaagttac cgtgaaacag ctcaaagaag actatttcaa aaagattgaa tgtttcgact 2400 ctgttgaaat cagcggagtg gaggatcgct tcaacgcatc cctgggaacg tatcacgatc 2460 tcctgaaaat cattaaagac aaggacttcc tggacaatga ggagaacgag gacattcttg 2520 aggacattgt cctcaccctt acgttgtttg aagataggga gatgattgaa gaacgcttga 2580 aaacttacgc tcatctcttc gacgacaaag tcatgaaaca gctcaagagg cgccgatata 2640 caggatgggg gcggctgtca agaaaactga tcaatgggat ccgagacaag cagagtggaa 2700 agacaatcct ggattttctt aagtccgatg gatttgccaa ccggaacttc atgcagttga 2760 tccatgatga ctctctcacc tttaaggagg acatccagaa agcacaagtt tctggccagg 2820 gggacagtct tcacgagcac atcgctaatc ttgcaggtaa gggcactgag cagaagggaa 2880 gaagctccgg gggctctttg tagggtgcgg ccgcagtgca tcaaggcgat cacatcagtg 2940 aaaaaaagcc agacaggcgg ttaaaccaac gcagattaaa cagcaggatg caaaaattcg 3000 caggtggtca gatggcggcc gctctagact cgatgagttt ggacaaacca caactagaat 3060 gcagtgaaaa aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat 3120 tataagctgc aataaacaag tt 3142 <210> 38 <211> 4430 <212> DNA <213> Artificial Sequence <220> <223> 3' SpCas9-VPR + BD_k <400> 38 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctcgttta gtgaaccgtc 600 agaggtacca ccggtcgact agaggatccc ggccgccatc tgaccacctg cgaatttttg 660 catcctgctg tttaatctgc gttggtttaa ccgcctgtct ggcttttttt cactgatgtg 720 atcgccttga tgcactcggc cgccaacgag tcttttgtca tctacaggta gcccagctat 780 caaaaaggga atactgcaga ccgttaaggt cgtggatgaa ctcgtcaaag taatgggaag 840 gcataagccc gagaatatcg ttatcgagat ggcccgagag aaccaaacta cccagaaggg 900 acagaagaac agtagggaaa ggatgaagag gattgaagag ggtataaaag aactggggtc 960 ccaaatcctt aaggaacacc cagttgaaaa cacccagctt cagaatgaga agctctacct 1020 gtactacctg cagaacggca gggacatgta cgtggatcag gaactggaca tcaatcggct 1080 ctccgactac gacgtggatc atatcgtgcc ccagtctttt ctcaaagatg attctattga 1140 taataaagtg ttgacaagat ccgataaaaa tagagggaag agtgataacg tcccctcaga 1200 agaagttgtc aagaaaatga aaaattattg gcggcagctg ctgaacgcca aactgatcac 1260 acaacggaag ttcgataatc tgactaaggc tgaacgaggt ggcctgtctg agttggataa 1320 agccggcttc atcaaaaggc agcttgttga gacacgccag atcaccaagc acgtggccca 1380 aattctcgat tcacgcatga acaccaagta cgatgaaaat gacaaactga ttcgagaggt 1440 gaaagttatt actctgaagt ctaagctggt ctcagatttc agaaaggact ttcagtttta 1500 taaggtgaga gagatcaaca attaccacca tgcgcatgat gcctacctga atgcagtggt 1560 aggcactgca cttatcaaaa aatatcccaa gcttgaatct gaatttgttt acggagacta 1620 taaagtgtac gatgttagga aaatgatcgc aaagtctgag caggaaatag gcaaggccac 1680 cgctaagtac ttcttttaca gcaatattat gaattttttc aagaccgaga ttacactggc 1740 caatggagag attcggaagc gaccacttat cgaaacaaac ggagaaacag gagaaatcgt 1800 gtgggacaag ggtagggatt tcgcgacagt ccggaaggtc ctgtccatgc cgcaggtgaa 1860 catcgttaaa aagaccgaag tacagaccgg aggcttctcc aaggaaagta tcctcccgaa 1920 aaggaacagc gacaagctga tcgcacgcaa aaaagattgg gaccccaaga aatacggcgg 1980 attcgattct cctacagtcg cttacagtgt actggttgtg gccaaagtgg agaaagggaa 2040 gtctaaaaaa ctcaaaagcg tcaaggaact gctgggcatc acaatcatgg agcgatcaag 2100 cttcgaaaaa aaccccatcg actttctcga ggcgaaagga tataaagagg tcaaaaaaga 2160 cctcatcatt aagcttccca agtactctct ctttgagctt gaaaacggcc ggaaacgaat 2220 gctcgctagt gcgggcgagc tgcagaaagg taacgagctg gcactgccct ctaaatacgt 2280 taatttcttg tatctggcca gccactatga aaagctcaaa gggtctcccg aagataatga 2340 gcagaagcag ctgttcgtgg aacaacacaa acactacctt gatgagatca tcgagcaaat 2400 aagcgaattc tccaaaagag tgatcctcgc cgacgctaac ctcgataagg tgctttctgc 2460 ttacaataag cacagggata agcccatcag ggagcaggca gaaaacatta tccacttgtt 2520 tactctgacc aacttgggcg cgcctgcagc cttcaagtac ttcgacacca ccatagacag 2580 aaagcggtac acctctacaa aggaggtcct ggacgccaca ctgattcatc agtcaattac 2640 ggggctctat gaaacaagaa tcgacctctc tcagctcggt ggagacagca gggctgaccc 2700 caagaagaag aggaaggtgt cgccagggat ccgtcgactt gacgcgttga tatcaacaag 2760 tttgtacaaa aaagcaggct acaaagaggc cagcggttcc ggacgggctg acgcattgga 2820 cgattttgat ctggatatgc tgggaagtga cgccctcgat gattttgacc ttgacatgct 2880 tggttcggat gcccttgatg actttgacct cgacatgctc ggcagtgacg cccttgatga 2940 tttcgacctg gacatgctga ttaactctag aagttccgga tctccgaaaa agaaacgcaa 3000 agttggtagc cagtacctgc ccgacaccga cgaccggcac cggatcgagg aaaagcggaa 3060 gcggacctac gagacattca agagcatcat gaagaagtcc cccttcagcg gccccaccga 3120 ccctagacct ccacctagaa gaatcgccgt gcccagcaga tccagcgcca gcgtgccaaa 3180 acctgccccc cagccttacc ccttcaccag cagcctgagc accatcaact acgacgagtt 3240 ccctaccatg gtgttcccca gcggccagat ctctcaggcc tctgctctgg ctccagcccc 3300 tcctcaggtg ctgcctcagg ctcctgctcc tgcaccagct ccagccatgg tgtctgcact 3360 ggctcaggca ccagcacccg tgcctgtgct ggctcctgga cctccacagg ctgtggctcc 3420 accagcccct aaacctacac aggccggcga gggcacactg tctgaagctc tgctgcagct 3480 gcagttcgac gacgaggatc tgggagccct gctgggaaac agcaccgatc ctgccgtgtt 3540 caccgacctg gccagcgtgg acaacagcga gttccagcag ctgctgaacc agggcatccc 3600 tgtggcccct cacaccaccg agcccatgct gatggaatac cccgaggcca tcacccggct 3660 cgtgacaggc gctcagaggc ctcctgatcc agctcctgcc cctctgggag caccaggcct 3720 gcctaatgga ctgctgtctg gcgacgagga cttcagctct atcgccgata tggatttctc 3780 agccttgctg ggctctggca gcggcagccg ggattccagg gaagggatgt ttttgccgaa 3840 gcctgaggcc ggctccgcta ttagtgacgt gtttgagggc cgcgaggtgt gccagccaaa 3900 acgaatccgg ccatttcatc ctccaggaag tccatgggcc aaccgcccac tccccgccag 3960 cctcgcacca acaccaaccg gtccagtaca tgagccagtc gggtcactga ccccggcacc 4020 agtccctcag ccactggatc cagcgcccgc agtgactccc gaggccagtc acctgttgga 4080 ggatcccgat gaagagacga gccaggctgt caaagccctt cgggagatgg ccgatactgt 4140 gattccccag aaggaagagg ctgcaatctg tggccaaatg gacctttccc atccgccccc 4200 aaggggccat ctggatgagc tgacaaccac acttgagtcc atgaccgagg atctgaacct 4260 ggactcaccc ctgaccccgg aattgaacga gattctggat accttcctga acgacgagtg 4320 cctcttgcat gccatgcata tcagcacagg actgtccatc ttcgacacat ctctgttttg 4380 acaataaaat atctttattt tcattacatc tgtgtgttgg ttttttgtgt 4430 <210> 39 <211> 4775 <212> DNA <213> Artificial Sequence <220> <223> Dual AAV vector-5'ABCA4_w introns <400> 39 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagggcgc gccgtttaaa tagctagcga cattgattat 240 tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 300 tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 360 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 420 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 480 tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 540 agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 600 ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac 660 ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 720 aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc 780 gtgtacggtg ggaggtctat ataagcagag ctggtaccac cggtgccacc atgggcttcg 840 tgagacagat acagcttttg ctctggaaga actggaccct gcggaaaagg caaaagattc 900 gctttgtggt ggaactcgtg tggcctttat ctttatttct ggtcttgatc tggttaagga 960 atgccaaccc actctacagc catcatgaat gccatttccc caacaaggcg atgccctcag 1020 caggaatgct gccgtggctc caggggatct tctgcaatgt gaacaatccc tgttttcaaa 1080 gccccacccc aggagaatct cctggaattg tgtcaaacta taacaactcc atcttggcaa 1140 gggtatatcg agattttcaa gaactcctca tgaatgcacc agagagccag caccttggcc 1200 gtatttggac agagctacac atcttgtccc aattcatgga caccctccgg actcacccgg 1260 agagaattgc aggtaagtgg cgaccgtgcc ccacagccct agccgccctc cccactgccc 1320 gggcttaccc tggtcctgct cccgcaggaa gaggaatacg aataagggat atcttgaaag 1380 atgaagaaac actgacacta tttctcatta aaaacatcgg cctgtctgac tcagtggtct 1440 accttctgat caactctcaa gtccgtccag agcagttcgc tcatggagtc ccggacctgg 1500 cgctgaagga catcgcctgc agcgaggccc tcctggagcg cttcatcatc ttcagccaga 1560 gacgcggggc aaagacggtg cgctatgccc tgtgctccct ctcccagggc accctacagt 1620 ggatagaaga cactctgtat gccaacgtgg acttcttcaa gctcttccgt gtgcttccca 1680 cactcctaga cagccgttct caaggtatca atctgagatc ttggggagga atattatctg 1740 atatgtcacc aagaattcaa gagtttatcc atcggccgag tatgcaggac ttgctgtggg 1800 tgaccaggcc cctcatgcag aatggtggtc cagagacctt tacaaagctg atgggcatcc 1860 tgtctgacct cctgtgtggc taccccgagg gaggtggctc tcgggtgctc tccttcaact 1920 ggtatgaaga caataactat aaggcctttc tggggattga ctccacaagg aaggatccta 1980 tctattctta tgacagaaga acaacatcct tttgtaatgc attgatccag agcctggagt 2040 caaatccttt aaccaaaatc gcttggaggg cggcaaagcc tttgctgatg ggaaaaatcc 2100 tgtacactcc tgattcacct gcagcacgaa ggatactgaa gaatgccaac tcaacttttg 2160 aagaactgga acacgttagg aagttggtca aagcctggga agaagtaggg ccccagatct 2220 ggtacttctt tgacaacagc acacagatga acatgatcag agataccctg gggaacccaa 2280 cagtaaaaga ctttttgaat aggcagcttg gtgaagaagg tattactgct gaagccatcc 2340 taaacttcct ctacaagggc cctcgggaaa gccaggctga cgacatggcc aacttcgact 2400 ggagggacat atttaacatc actgatcgca ccctccgcct ggtcaatcaa tacctggagt 2460 gcttggtcct ggataagttt gaaagctaca atgatgaaac tcagctcacc caacgtgccc 2520 tctctctact ggaggaaaac atgttctggg ccggagtggt attccctgac atgtatccct 2580 ggaccagctc tctaccaccc cacgtgaagt ataagatccg aatggacata gacgtggtgg 2640 agaaaaccaa taagattaaa gacaggtgag tggactggag cctgggcacg aggtgtgggg 2700 tggcccctgc cctgccactt acaccacctg cctcttcctg caggtattgg gattctggtc 2760 ccagagctga tcccgtggaa gatttccggt acatctgggg cgggtttgcc tatctgcagg 2820 acatggttga acaggggatc acaaggagcc aggtgcaggc ggaggctcca gttggaatct 2880 acctccagca gatgccctac ccctgcttcg tggacgattc tttcatgatc atcctgaacc 2940 gctgtttccc tatcttcatg gtgctggcat ggatctactc tgtctccatg actgtgaaga 3000 gcatcgtctt ggagaaggag ttgcgactga aggagacctt gaaaaatcag ggtgtctcca 3060 atgcagtgat ttggtgtacc tggttcctgg acagcttctc catcatgtcg atgagcatct 3120 tcctcctgac gatattcatc atgcatggaa gaatcctaca ttacagcgac ccattcatcc 3180 tcttcctgtt cttgttggct ttctccactg ccaccatcat gctgtgcttt ctgctcagca 3240 ccttcttctc caaggccagt ctggcagcag cctgtagtgg tgtcatctat ttcaccctct 3300 acctgccaca catcctgtgc ttcgcctggc aggaccgcat gaccgctgag ctgaagaagg 3360 ctgtgagctt actgtctccg gtggcatttg gatttggcac tgagtacctg gttcgctttg 3420 aagagcaagg cctggggctg cagtggagca acatcgggaa cagtcccacg gaaggggacg 3480 aattcagctt cctgctgtcc atgcagatga tgctccttga tgctgctgtc tatggcttac 3540 tcgcttggta ccttgatcag gtgtttccag gagactatgg aaccccactt ccttggtact 3600 ttcttctaca agagtcgtat tggcttggcg gtgaaggtaa gtagtctgat tatacacaag 3660 atattgtcta gaacttgatg agactgtgga tatgaatatt tcactctttt ctcagggtgt 3720 tcaaccagag aagaaagagc cctggaaaag accgagcccc taacagagga aacggaggat 3780 ccagagcacc cagaaggaat acacgactcc ttctttgaac gtgagcatcc agggtgggtt 3840 cctggggtat gcgtgaagaa tctggtaaag atttttgagc cctgtggccg gccagctgtg 3900 gaccgtctga acatcacctt ctacgagaac cagatcaccg cattcctggg ccacaatgga 3960 gctgggaaaa ccaccacctt gtccatcctg acgggtctgt tgccaccaac ctctgggact 4020 gtgctcgttg ggggaaggga cattgaaacc agcctggatg cagtccggca gagccttggc 4080 atgtgtccac agcacaacat cctgttccac cacctcacgg tggctgagca catgctgttc 4140 tatgcccagc tgaaaggaaa gtcccaggag gaggcccagc tggagatgga agccatgttg 4200 gaggacacag gcctccacca caagcggaat gaagaggctc aggacctatc aggtggcatg 4260 cagagaaagc tgtcggttgc cattgccttt gtgggagatg ccaaggtaag ggcactgagc 4320 agaagggaag aagctccggg ggctctttgt agggtaagct tagtgcatca aggcgatcac 4380 atcagtgaaa aaaagccaga caggcggtta aaccaacgca gattaaacag caggatgcaa 4440 aaattcgcag gtggtcagat gaagcttatt gtcgaggcag tgaaaaaaat gctttatttg 4500 tgaaatttgt gatgctattg ctttatttgt aaccattata agctgcaata aacaagttct 4560 cgagttaagg gcgaattccc gattaggatc ttcctagagc atggctacgt agataagtag 4620 catggcgggt taatcattaa ctacaaggaa cccctagtga tggagttggc cactccctct 4680 ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 4740 gcccgggcgg cctcagtgag cgagcgagcg cgcag 4775 <210> 40 <211> 5092 <212> DNA <213> Artificial Sequence <220> <223> Dual AAV vector-3'ABCA4_w introns <400> 40 ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60 ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120 aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180 aggaagatcg gaattcgccc ttaagggcgc gccgtttaaa tagctagcga cattgattat 240 tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 300 tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 360 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 420 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 480 tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 540 agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 600 ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg tttgactcac 660 ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg caccaaaatc 720 aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg ggcggtaggc 780 gtgtacggtg ggaggtctat ataagcagag ctggtaccac cggtagaaag cttcatctga 840 ccacctgcga atttttgcat cctgctgttt aatctgcgtt ggtttaaccg cctgtctggc 900 tttttttcac tgatgtgatc gccttgatgc actaagcttc aacgagtctt ttgtcatcta 960 caggtggtga ttctggacga acccacctct ggggtggacc cttactcgag acgctcaatc 1020 tgggatctgc tcctgaagta tcgctcaggc agaaccatca tcatgtccac tcaccacatg 1080 gacgaggccg acctccttgg ggaccgcatt gccatcattg cccagggaag gctctactgc 1140 tcaggcaccc cactcttcct gaagaactgc tttggcacag gcttgtactt aaccttggtg 1200 cgcaagatga aaaacatcca gagccaaagg aaaggcagtg aggtgagtca ggctgggcgc 1260 ccccgccccc aggggccctc cctccccaag ccccccggac gcgcctcacc cacgttcctc 1320 tcgcagggga cctgcagctg ctcgtctaag ggtttctcca ccacgtgtcc agcccacgtc 1380 gatgacctaa ctccagaaca agtcctggat ggggatgtaa atgagctgat ggatgtagtt 1440 ctccaccatg ttccagaggc aaagctggtg gagtgcattg gtcaagaact tatcttcctt 1500 cttccaaata agaacttcaa gcacagagca tatgccagcc ttttcagaga gctggaggag 1560 acgctggctg accttggtct cagcagtttt ggaatttctg acactcccct ggaagagatt 1620 tttctgaagg tcacggagga ttctgattca ggacctctgt ttgcgggtgg cgctcagcag 1680 aaaagagaaa acgtcaaccc ccgacacccc tgcttgggtc ccagagagaa ggctggacag 1740 acaccccagg actccaatgt ctgctcccca ggggcgccgg ctgctcaccc agagggccag 1800 cctcccccag agccagagtg cccaggcccg cagctcaaca cggggacaca gctggtcctc 1860 cagcatgtgc aggcgctgct ggtcaagaga ttccaacaca ccatccgcag ccacaaggac 1920 ttcctggcgc agatcgtgct cccggctacc tttgtgtttt tggctctgat gctttctatt 1980 gttatccctc cttttggcga ataccccgct ttgacccttc acccctggat atatgggcag 2040 cagtacacct tcttcagcat ggatgaacca ggcagtgagc agttcacggt acttgcagac 2100 gtcctcctga ataagccagg ctttggcaac cgctgcctga aggaagggtg gcttccggag 2160 tacccctgtg gcaactcaac accctggaag actccttctg tgtccccaaa catcacccag 2220 ctgttccaga agcagaaatg gacacaggtc aacccttcac catcctgcag gtgcagcacc 2280 agggagaagc tcaccatgct gccagagtgc cccgagggtg ccgggggcct cccgcccccc 2340 cagagaacac agcgcagcac ggaaattcta caagacctga cggacaggaa catctccgac 2400 ttcttggtaa aaacgtatcc tgctcttata agaagcagct taaagagcaa attctgggtc 2460 aatgaacaga ggtatggagg aatttccatt ggaggaaagc tcccagtcgt ccccatcacg 2520 ggggaagcac ttgttgggtt tttaagcgac cttggccgga tcatgaatgt gagcgggggc 2580 cctatcacta gagaggcctc taaagaaata cctgatttcc ttaaacatct agaaactgaa 2640 gacaacatta aggtgtggtt taataacaaa ggctggcatg ccctggtcag ctttctcaat 2700 gtggcccaca acgccatctt gtaagtccta ccttttttgt tcctttgaaa gcctcctgga 2760 aagcttttcc tgaagtgttt gttctgtaat ttctttgcag acgggccagc ctgcctaagg 2820 acaggagccc cgaggagtat ggaatcaccg tcattagcca acccctgaac ctgaccaagg 2880 agcagctctc agagattaca gtgctgacca cttcagtgga tgctgtggtt gccatctgcg 2940 tgattttctc catgtccttc gtcccagcca gctttgtcct ttatttgatc caggagcggg 3000 tgaacaaatc caagcacctc cagtttatca gtggagtgag ccccaccacc tactgggtga 3060 ccaacttcct ctgggacatc atgaattatt ccgtgagtgc tgggctggtg gtgggcatct 3120 tcatcgggtt tcagaagaaa gcctacactt ctccagaaaa ccttcctgcc cttgtggcac 3180 tgctcctgct gtatggatgg gcggtcattc ccatgatgta cccagcatcc ttcctgtttg 3240 atgtccccag cacagcctat gtggctttat cttgtgctaa tctgttcatc ggcatcaaca 3300 gcagtgctat taccttcatc ttggaattat ttgagaataa ccggacgctg ctcaggttca 3360 acgccgtgct gaggaagctg ctcattgtct tcccccactt ctgcctgggc cggggcctca 3420 ttgaccttgc actgagccag gctgtgacag atgtctatgc ccggtttggt gaggagcact 3480 ctgcaaatcc gttccactgg gacctgattg ggaagaacct gtttgccatg gtggtggaag 3540 gggtggtgta cttcctcctg accctgctgg tccagcgcca cttcttcctc tcccaatgga 3600 ttgccgagcc cactaaggag cccattgttg atgaagatga tgatgtggct gaagaaagac 3660 aaagaattat tactggtgga aataaaactg acatcttaag gctacatgaa ctaaccaaga 3720 tttatccagg cacctccagc ccagcagtgg acaggctgtg tgtcggagtt cgccctggag 3780 agtgctttgg cctcctggga gtgaatggtg ccggcaaaac aaccacattc aagatgctca 3840 ctggggacac cacagtgacc tcaggggatg ccaccgtagc aggcaagagt attttaacca 3900 atatttctga agtccatcaa aatatgggct actgtcctca gtttgatgca attgatgagc 3960 tgctcacagg acgagaacat ctttaccttt atgcccggct tcgaggtgta ccagcagaag 4020 aaatcgaaaa ggtaagtgat tcctagggct ggggaaggtg ggtgggaatc ctctcctgct 4080 cacctcctct ctcctgcccc acaggttgca aactggagta ttaagagcct gggcctgact 4140 gtctacgccg actgcctggc tggcacgtac agtgggggca acaagcggaa actctccaca 4200 gccatcgcac tcattggctg cccaccgctg gtgctgctgg atgagcccac cacagggatg 4260 gacccccagg cacgccgcat gctgtggaac gtcatcgtga gcatcatcag agaagggagg 4320 gctgtggtcc tcacatccca cagcatggaa gaatgtgagg cactgtgtac ccggctggcc 4380 atcatggtaa agggcgcctt tcgatgtatg ggcaccattc agcatctcaa gtccaaattt 4440 ggagatggct atatcgtcac aatgaagatc aaatccccga aggacgacct gcttcctgac 4500 ctgaaccctg tggagcagtt cttccagggg aacttcccag gcagtgtgca gagggagagg 4560 cactacaaca tgctccagtt ccaggtctcc tcctcctccc tggcgaggat cttccagctc 4620 ctcctctccc acaaggacag cctgctcatc gaggagtact cagtcacaca gaccacactg 4680 gaccaggtgt ttgtaaattt tgctaaacag cagactgaaa gtcatgacct ccctctgcac 4740 cctcgagctg ctggagccag tcgacaagcc caggactgag tcgacgcggc cgcgcagtga 4800 aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 4860 tgcaataaac aagttctcga gttaagggcg aattcccgat taggatcttc ctagagcatg 4920 gctacgtaga taagtagcat ggcgggttaa tcattaacta caaggaaccc ctagtgatgg 4980 agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 5040 cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc ag 5092

Claims (17)

  1. (i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
    (iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
    (ib)(iba) 피리미딘 대역에 대해 3'쪽에 위치하고;
    (ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
    를 포함하는 수여 스플라이싱 영역;
    (ii) 관심 뉴클레오티드 서열 또는 이의 일부[단, 여기서 수여 스플라이싱 영역은 이 관심 뉴클레오티드 서열 또는 이의 일부에 대해 3'쪽 또는 5'쪽에 위치함];
    (iii) 관심 핵산 서열 또는 이의 일부에 대해 5'쪽 또는 3'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 결합 도메인; 그리고
    (iv) 결합 도메인과 수여 스플라이싱 영역 사이에 위치하는 선택적 스페이서 서열
    을 포함하는, 전 mRNA 트랜스-스플라이싱 분자.
  2. 제1항에 있어서,
    (ii) 상기 수여 스플라이싱 영역이 상기 관심 뉴클레오티드 서열 또는 이의 일부에 대해 5'쪽에 위치하는, 관심 뉴클레오티드 서열 또는 이의 일부;
    (iii) 상기 관심 뉴클레오티드 서열 또는 이의 일부에 대해 3'쪽에 위치하는 공여 스플라이싱 부위;
    (iv) 상기 관심 뉴클레오티드 서열 또는 이의 일부에 대해 5'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제1 결합 도메인;
    (v) 상기 관심 뉴클레오티드 서열 또는 이의 일부에 대해 3'쪽에 위치하는 것으로서, 전 mRNA를 표적화하는 제2 결합 도메인;
    (vi) 상기 제1 결합 도메인과 상기 수여 스플라이싱 영역 사이에 위치하는, 선택적 제1 스페이서 서열; 및
    (vii) 상기 제2 결합 도메인과 상기 공여 스플라이싱 영역 사이에 위치하는, 선택적 제2 스페이서 서열
    을 포함하는, 전 mRNA 트랜스-스플라이싱 분자.
  3. 제1항 또는 제2항에 있어서, 상기 수여 스플라이싱 영역은 상기 관심 뉴클레오티드 서열 또는 이의 일부에 대해 5'쪽에 위치하고, 상기 결합 도메인은 상기 수여 스플라이싱 영역에 대해 5'쪽에 위치하는, 전 mRNA 트랜스-스플라이싱 분자.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 종결 서열, 바람직하게 폴리 A 서열을 추가로 포함하는, 전 mRNA 트랜스-스플라이싱 분자.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    (a) 상기 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT에 의해 암호화되는 서열을 포함하고;
    (b) 상기 피리미딘 대역의 마지막 피리미딘과 상기 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가지고/가지거나;
    (c) 상기 수여 스플라이싱 부위는 서열 CAGG를 가지는, 전 mRNA 트랜스-스플라이싱 분자.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 수여 스플라이싱 영역은
    (a) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
    (b) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임];
    (c) 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAA임]; 또는
    (d) 서열 CAACGAG의 뉴클레오티드 적어도 5개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드들은 CAAC임];
    를 추가로 포함하는, 전 mRNA 트랜스-스플라이싱 분자.
  7. 제1항 내지 제6항 중 어느 한 항에 의한 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 서열과, 프로모터를 포함하는 DNA 분자.
  8. 핵산 서열을 제조하기 위한 방법으로서,
    (A) 1개 이상의 공여 스플라이싱 부위 서열을 포함하는 제1 핵산 서열을 제공하는 단계;
    (B)(i)(ia)(iaa) 5개 ~ 25개의 뉴클레오티드를 포함하고;
    (iab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
    (ib)(iba) 상기 피리미딘 대역에 대해 3'쪽에 위치하고;
    (ibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위를 포함하는 수여 스플라이싱 영역 서열을 포함하는 제2 핵산 서열을 제공하는 단계;
    (C) 공여 스플라이싱 부위 서열(들) 1개 이상에서 제1 핵산 서열을 절단하고, 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계; 및
    (D) 절단된 제1 핵산 서열을, 절단된 제2 핵산 서열에 결찰시킴으로써 핵산 서열을 수득하는 단계
    를 포함하는 방법.
  9. 제8항에 있어서, 상기 제1 핵산 서열은 관심 뉴클레오티드 서열 또는 이의 일부를 추가로 포함하고, 상기 관심 뉴클레오티드 서열의 적어도 일부는 상기 공여 스플라이싱 부위에 대해 5'쪽에 위치하고, 상기 제2 핵산 서열은 관심 뉴클레오티드 서열 또는 이의 일부를 추가로 포함하고, 상기 관심 뉴클레오티드 서열의 적어도 일부는 상기 스플라이싱 수여 스플라이싱 영역에 대해 3'쪽에 위치하는 방법.
  10. 제8항 또는 제9항에 있어서, 상기 제1 핵산 서열 및 상기 제2 핵산 서열은 숙주 세포에 도입되고, 바람직하게 상기 제1 핵산 서열 및 상기 제2 핵산 서열은 재조합 핵산 서열인 방법.
  11. 제8항 내지 제10항 중 어느 한 항에 있어서,
    (A) 전 mRNA 트랜스-스플라이싱 분자 서열 또는 상기 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 포함하는 제1 핵산 서열을 숙주 세포에 도입하는 단계로서, 이 제1 전 mRNA 트랜스-스플라이싱 분자는 5' → 3' 방향으로
    (a) 관심 뉴클레오티드 산 서열의 5'부;
    (b) 공여 스플라이싱 부위;
    (c) 선택적 스페이서 서열;
    (d) 제1 결합 도메인; 및
    (e) 선택적 종결 서열, 바람직하게는 폴리 A 서열을 포함하는 단계;
    (B) 전 mRNA 트랜스-스플라이싱 분자 서열 또는 상기 전 mRNA 트랜스-스플라이싱 분자를 암호화하는 핵산 서열을 포함하는 제2 핵산 서열을 숙주 세포에 도입하는 단계로서, 이 제2 전 mRNA 트랜스-스플라이싱 분자는 5' → 3' 방향으로
    (i) 제1 핵산 서열의 제1 표적 도메인에 상보성인 제2 결합 도메인;
    (ii)(iia)(iiaa) 5개 내지 25개 뉴클레오티드를 포함하고;
    (iiab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
    (iib)(iiba) 상기 피리미딘 대역에 대해 3'쪽에 위치하고;
    (iibb) 서열 NAGG[단, N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
    를 포함하는 수여 스플라이싱 영역 서열;
    (iii) 관심 뉴클레오티드 서열의 3'부
    (iv) 종결 서열, 바람직하게 폴리 A 서열
    을 포함하는 단계;
    (C) 상기 공여 스플라이싱 부위 서열에서 제1 핵산 서열을 절단하고, 상기 수여 스플라이싱 부위에서 제2 핵산 서열을 절단하는 단계; 그리고
    (D) 관심 뉴클레오티드 서열의 5'부를 포함하는 절단된 제1 핵산 서열을, 관심 뉴클레오티드 서열의 3'부를 포함하는 절단된 제2 핵산 서열에 결찰시킴으로써, 관심 핵산 서열을 수득하는 단계
    를 포함하는 방법.
  12. 도치된 말단 반복부 적어도 2개를 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 아데노-연관 바이러스(AAV) 벡터로서, 상기 핵산 서열은 5' → 3' 방향으로
    (i) 프로모터;
    (ii) 결합 도메인;
    (iii) 선택적 스페이서 서열;
    (iv)(a)(aa) 5개 ~ 25개의 뉴클레오티드를 포함하고,
    (ab) 이 5개 ~ 25개의 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
    (b)(ba) 피리미딘 대역에 대해 3'쪽에 위치하고,
    (bb) 서열 NAGG[여기서 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
    를 포함하는 수여 스플라이싱 영역 서열;
    (v) 관심 뉴클레오티드 서열 또는 이의 일부; 그리고
    (vi) 선택적 폴리 A 서열
    을 포함하는, 아데노-연관 바이러스(AAV) 벡터.
  13. (I) 도치된 말단 반복부 적어도 2개를 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 제1 AAV 벡터로서, 이 도치된 말단 반복부 2개 사이에 있는 상기 핵산 서열은 5' → 3' 방향으로
    (a) 프로모터,
    (b) 관심 폴리펩티드의 N-말단부를 암호화하는 뉴클레오티드 서열;
    (c) 공여 스플라이싱 부위;
    (d) 선택적 스페이서 서열;
    (e) 제1 결합 도메인; 그리고
    (f) 선택적 종결 서열, 바람직하게 폴리 A 서열을 포함하는, 제1 AAV 벡터;
    (II) 도치된 말단 반복부 적어도 2개를 포함하는 핵산 서열을 포함하고, 이 도치된 말단 반복부 2개 사이에는 핵산 서열이 포함되어 있는 제2 AAV 벡터로서, 이 도치된 말단 반복부 2개 사이에 있는 상기 핵산 서열은 5' → 3' 방향으로
    (i) 프로모터;
    (ii) 상기 제1 AAV 벡터의 제1 결합 도메인에 상보성인 제2 결합 도메인;
    (ii) 선택적 스페이서 서열;
    (iii)(a)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
    (ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
    (b)(ba) 상기 피리미딘 대역에 대해 3'쪽에 위치하고;
    (bb) 서열 NAGG[여기서 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
    를 포함하는 수여 스플라이싱 영역 서열;
    (iv) 관심 폴리펩티드의 C-말단부를 암호화하는 뉴클레오티드 서열로서,
    (iva) 상기 관심 폴리펩티드의 C-말단부와 상기 관심 폴리펩티드의 N-말단부는 관심 폴리펩티드를 재구성하는 뉴클레오티드 서열; 및
    (v) 종결 서열, 바람직하게 폴리 A 서열을 포함하는, 제2 AAV 벡터
    를 포함하는 아데노-연관 바이러스(AAV) 벡터계.
  14. 제13항에 있어서, 상기 폴리펩티드는 전장 폴리펩티드이고, 상기 제1 AAV 벡터는 관심 전장 폴리펩티드의 N-말단부를 포함하고, 상기 제2 AAV 벡터는 관심 전장 폴리펩티드의 C-말단부를 포함하는 AAV 벡터계.
  15. (i)(ia)(aa) 5개 ~ 25개 뉴클레오티드를 포함하고;
    (ab) 이 5개 ~ 25개 뉴클레오티드중 뉴클레오티드의 적어도 60%는 피리미딘 염기, 예컨대 시토신(C), 티민(T) 및/또는 우라실(U)인, 피리미딘 대역;
    (ib)(ba) 상기 피리미딘 대역에 대해 3'쪽에 위치하고;
    (bb) 서열 NAGG[단 N은 A, C, T/U 또는 G임]를 5' → 3' 방향으로 포함하는, 수여 스플라이싱 부위
    를 포함하는 수여 스플라이싱 영역 서열; 및
    (ii)(iia) 상기 수여 스플라이싱 영역에 대해 3'쪽 또는 5'쪽에 위치하는 관심 뉴클레오티드 서열
    을 포함하는 핵산 서열.
  16. 제8항 내지 제11항 중 어느 한 항에 의한 방법, 제12항에 의한 AAV 벡터, 제13항 또는 제14항에 의한 AAV 벡터계, 및 제15항에 의한 핵산으로서,
    (a) 상기 피리미딘 대역의 5개 ~ 25개 뉴클레오티드는 서열 TTTTTT 또는 TCTTTT을 포함하고;
    (b) 상기 피리미딘 대역의 마지막 피리미딘과 상기 수여 스플라이싱 부위 사이의 서열은 10개 미만의 염기, 바람직하게 5개 미만의 염기, 더욱 바람직하게 3개 미만의 염기를 가지고;
    (c) 상기 수여 스플라이싱 부위는 서열 CAGG를 가지고;
    (d) 상기 수여 스플라이싱 영역은 서열 CAACGAG의 뉴클레오티드 적어도 4개를 가지고, 피리미딘 대역에 대해 5'쪽에 존재하는 뉴클레오티드 7개[단 5'쪽 처음 뉴클레오티드는 C임]를 추가로 포함하고/포함하거나;
    (e) 상기 수여 스플라이싱 영역은 서열 번호 3 또는 4의 서열을 포함하는 방법, AAV 벡터, AAV 벡터계 및 핵산.
  17. 치료법에 사용하기 위한, 제1항 내지 제6항 중 어느 한 항에 의한 전 mRNA 트랜스-스플라이싱 분자, 제12항에 의한 아데노-연관 바이러스 벡터, 또는 제13항 또는 제14항에 의한 아데노-연관 바이러스 벡터계.
KR1020217018661A 2018-12-20 2019-12-19 생물학적 및 생물공학적 적용에 최적화된 수여 스플라이싱 부위 모듈 KR20210125472A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18214415.4 2018-12-20
EP18214415 2018-12-20
PCT/EP2019/086454 WO2020127831A1 (en) 2018-12-20 2019-12-19 An optimized acceptor splice site module for biological and biotechnological applications

Publications (1)

Publication Number Publication Date
KR20210125472A true KR20210125472A (ko) 2021-10-18

Family

ID=64755152

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217018661A KR20210125472A (ko) 2018-12-20 2019-12-19 생물학적 및 생물공학적 적용에 최적화된 수여 스플라이싱 부위 모듈

Country Status (10)

Country Link
US (1) US20220160898A1 (ko)
EP (1) EP3898996A1 (ko)
JP (1) JP2022515606A (ko)
KR (1) KR20210125472A (ko)
CN (1) CN113474460A (ko)
AU (1) AU2019406702A1 (ko)
CA (1) CA3122909A1 (ko)
IL (1) IL284021A (ko)
SG (1) SG11202106356QA (ko)
WO (1) WO2020127831A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022015788A1 (en) * 2020-07-14 2022-01-20 Abeona Therapeutics Inc. Recombinant adeno-associated viral vectors for multipartite gene delivery
US20230374476A1 (en) * 2021-02-05 2023-11-23 University Of Massachusetts Prime editor system for in vivo genome editing

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5478745A (en) 1992-12-04 1995-12-26 University Of Pittsburgh Recombinant viral vector system
US20030077754A1 (en) * 1995-12-15 2003-04-24 Mitchell Lloyd G. Methods and compositions for use in spliceosome mediated RNA trans-splicing
US6436707B1 (en) * 1998-03-27 2002-08-20 Lexicon Genetics Incorporated Vectors for gene mutagenesis and gene discovery
JP2009000120A (ja) * 1998-08-13 2009-01-08 Virxsys Corp スプライソソーム媒介rnaトランス−スプライシングにおける使用のための方法及び組成物
AU780231B2 (en) 1998-11-10 2005-03-10 University Of North Carolina At Chapel Hill, The Virus vectors and methods of making and administering the same
GB9906615D0 (en) * 1999-03-22 1999-05-19 Oxford Biomedica Ltd Vector
CA2477295A1 (en) * 2002-02-25 2003-09-04 Intronn, Inc. Trans-splicing mediated imaging of gene expression
US7968334B2 (en) 2004-01-23 2011-06-28 Virxsys Corporation Expression of apoAI and variants thereof using spliceosome mediated RNA trans-splicing
US9303078B2 (en) 2009-10-08 2016-04-05 Association Institut De Myologie Nucleic acid molecules and methods for exchanging exon(s) by transsplicing
SG2014012207A (en) 2011-08-12 2014-05-29 Virxsys Corp Compositions and methods for inducing apoptosis
WO2013075008A1 (en) 2011-11-16 2013-05-23 University Of Florida Research Foundation Inc. Aav dual vector systems for gene therapy
EA034575B1 (ru) * 2013-04-18 2020-02-21 Фондацьоне Телетон Эффективная доставка больших генов посредством двойных aav векторов
EP3697896A1 (en) 2017-10-16 2020-08-26 Vigeneron GmbH Aav vectors

Also Published As

Publication number Publication date
EP3898996A1 (en) 2021-10-27
WO2020127831A1 (en) 2020-06-25
AU2019406702A1 (en) 2021-06-10
JP2022515606A (ja) 2022-02-21
SG11202106356QA (en) 2021-07-29
US20220160898A1 (en) 2022-05-26
CN113474460A (zh) 2021-10-01
IL284021A (en) 2021-08-31
CA3122909A1 (en) 2020-06-25

Similar Documents

Publication Publication Date Title
US6544786B1 (en) Method and vector for producing and transferring trans-spliced peptides
KR20200093635A (ko) 변형된 폐쇄된 말단 dna (cedna)를 사용한 유전자 편집
KR20210102882A (ko) 핵산 구조체 및 사용 방법
JP7303816B2 (ja) Aavベクター
JP2018512125A (ja) 多重ベクターシステム及びその使用
US20230193319A1 (en) Compositions and methods for treatment of inherited macular degeneration
CN114126665A (zh) 眼底黄色斑点症(abca4)的基因疗法
CA3129321A1 (en) Modulation of rep protein activity in closed-ended dna (cedna) production
KR20210125472A (ko) 생물학적 및 생물공학적 적용에 최적화된 수여 스플라이싱 부위 모듈
KR20200141435A (ko) 망막 질환 치료를 위한 조성물 및 방법
KR20220042340A (ko) 로돕신 전사체에 특이적인 트랜스-스플라이싱 라이보자임 및 이의 용도
CA3097004A1 (en) Trans-splicing molecules
KR20240045198A (ko) 캡시드 변이체 및 이의 사용 방법
RU2811724C2 (ru) РЕДАКТИРОВАНИЕ ГЕНОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННОЙ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК)
US20220409744A1 (en) Method of transactivating a homologous gene of a gene of interest and an in vitro method of diagnosing a disease
US11993776B2 (en) Trans-splicing molecules
RU2793112C2 (ru) Векторы aav
CN117836420A (zh) 重组tert编码病毒基因组和运载体
WO2024069144A1 (en) Rna editing vector
CN117377771A (zh) 载体系统