KR20220141829A - 리보자임-매개 rna 조립 및 발현 - Google Patents

리보자임-매개 rna 조립 및 발현 Download PDF

Info

Publication number
KR20220141829A
KR20220141829A KR1020227030839A KR20227030839A KR20220141829A KR 20220141829 A KR20220141829 A KR 20220141829A KR 1020227030839 A KR1020227030839 A KR 1020227030839A KR 20227030839 A KR20227030839 A KR 20227030839A KR 20220141829 A KR20220141829 A KR 20220141829A
Authority
KR
South Korea
Prior art keywords
ribozyme
rna
protein
encoding
rna molecule
Prior art date
Application number
KR1020227030839A
Other languages
English (en)
Inventor
더글라스 매튜 앤더슨
Original Assignee
유니버시티 오브 로체스터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유니버시티 오브 로체스터 filed Critical 유니버시티 오브 로체스터
Publication of KR20220141829A publication Critical patent/KR20220141829A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y605/00Ligases forming phosphoric ester bonds (6.5)
    • C12Y605/01Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/121Hammerhead
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/12Type of nucleic acid catalytic nucleic acids, e.g. ribozymes
    • C12N2310/123Hepatitis delta
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/40Systems of functionally co-operating vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor
    • C12N2840/445Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor for trans-splicing, e.g. polypyrimidine tract, branch point splicing

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 관심 단백질 또는 융합 단백질을 발현하기 위해 RNA 분자의 리보자임-매개 시스-절단 및 트랜스-스플라이싱을 사용하기 위한 조성물, 시스템 및 방법을 제공한다.

Description

리보자임-매개 RNA 조립 및 발현
관련 출원에 대한 상호-참조
본 출원은 2020년 2월 7일에 출원된 미국 가특허 출원 제62/971,356호에 대한 우선권을 주장하며, 이의 내용은 그 전체가 본원에 참조로 원용된다.
특정 상황에서, 플라스미드 및 벡터의 크기 제한으로 인해 전장 단백질의 발현이 제한된다. 예를 들어, 치료적 환경에서, 전장 단백질을 코딩하는 일부 핵산은 AAV의 패키징 크기를 초과하여, 유전자 요법 환경에서의 적용가능성을 제한한다. 추가적으로, 특정 생물학적 및 산업적으로 관련된 단백질은 발현을 어렵게 만들 수 있는 수많은 반복부를 함유한다.
따라서, 효율적인 단백질 발현을 위한 개선된 조성물 및 방법이 당업계에 필요하다. 본 발명은 이러한 충족되지 않은 요구를 만족시킨다.
발명의 요약
일 실시양태에서, 본 발명은 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 코딩하는 핵산 분자; 및 관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 코딩하는 핵산 분자를 포함하는, 관심 단백질을 코딩하는 RNA 분자를 생성하기 위한 시스템을 포함한다.
일 실시양태에서, 3' 리보자임은 제1 RNA 분자에서 스스로를 촉매화하여, 3'P 또는 2'3' cP 단부를 생성한다. 일 실시양태에서, 5' 리보자임은 제2 RNA 분자에서 스스로를 촉매화하여 5'OH 단부를 생성한다. 일 실시양태에서, 3'P 또는 2'3' cP 단부는 5'OH 단부에 결찰되어, 제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역을 포함하는 RNA 분자를 형성한다. 일 실시양태에서, 3' 리보자임은 리보자임의 HDV 패밀리의 구성원이다. 일 실시양태에서, 5' 리보자임은 리보자임의 HH 패밀리의 구성원이다.
일 실시양태에서, 시스템은 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 추가로 포함하고, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임을 포함한다.
일 실시양태에서, 시스템은 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 추가로 포함하고, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함한다. 일 실시양태에서, 시스템은 3' 인식 서열의 제거를 유도하는 3' 리보자임 인식 서열과 상호작용하는 리보자임을 추가로 포함한다. 일 실시양태에서, 3' 리보자임 인식 서열은 VS-S를 포함하고, 여기서 리보자임은 VS-Rz이다.
일 실시양태에서, 본 발명은 다음을 포함하는, 관심 단백질을 코딩하는 RNA 분자를 생성하는 방법에 관한 것이다: 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 코딩하는 핵산 분자를 세포 또는 조직에 투여하는 단계; 및 관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 코딩하는 핵산 분자를 세포 또는 조직에 투여하는 단계.
일 실시양태에서, 3' 리보자임은 제1 RNA 분자에서 스스로를 촉매화하여, 3'P 또는 2'3' cP 단부를 생성한다. 일 실시양태에서, 5' 리보자임은 제2 RNA 분자에서 스스로를 촉매화하여, 5'OH 단부를 생성한다. 일 실시양태에서, 3'P 또는 2'3' cP 단부는 5'OH 단부에 결찰되어, 제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역을 포함하는 RNA 분자를 형성한다. 일 실시양태에서, 3' 리보자임은 리보자임의 HDV 패밀리의 구성원이다. 일 실시양태에서, 5' 리보자임은 리보자임의 HH 패밀리의 구성원이다.
일 실시양태에서, 방법은 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 세포 또는 조직에 투여하는 단계를 추가로 포함하고, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임을 포함한다.
일 실시양태에서, 방법은 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 세포 또는 조직에 투여하는 단계를 추가로 포함하고, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함한다. 일 실시양태에서, 방법은 3' 인식 서열의 제거를 유도하는 3' 리보자임 인식 서열과 상호작용하는 리보자임을 세포 또는 조직에 투여하는 단계를 추가로 포함한다. 일 실시양태에서, 3' 리보자임 인식 서열은 VS-S를 포함하며, 여기서 리보자임은 VS-Rz이다. 일 실시양태에서, 방법은 RNA 분자의 조립을 유도하기 위해 리가아제를 세포 또는 조직에 투여하는 단계를 추가로 포함한다. 일 실시양태에서, 리가아제는 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다.
일 실시양태에서, 본 발명은 다음을 포함하는, 관심 단백질을 코딩하는 RNA 분자를 생성하는 생체외 방법을 포함한다: 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 제공하는 단계; 관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 제공하는 단계; 및 제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역으로부터 RNA 분자의 조립을 유도하기 위해 리가아제를 제공하는 단계.
일 실시양태에서, 본 발명은 다음의 단계를 포함하는 관심 반복 도메인 단백질을 코딩하는 RNA 분자를 생성하는 생체외 방법을 포함한다: a) 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 제공하는 단계; b) 관심 단백질의 도메인을 코딩하는 코딩 영역, 5' 리보자임 및 3' 리보자임 인식 서열을 포함하는 하나 이상의 추가적인 RNA 분자를 제공하는 단계; c) 제1 RNA 분자의 코딩 영역 및 하나 이상의 추가적인 RNA 분자의 코딩 영역을 결찰시키기 위해 리가아제를 제공하는 단계; d) 3' 리보자임 인식 서열을 인식하고 이의 제거를 촉매화하는 리보자임을 제공하는 단계; e) 단계 b)-d)를 1 회 이상 반복하여, 복수의 반복 도메인을 코딩하는 RNA 분자를 생성하는 단계; f) 관심 단백질의 마지막 부분을 코딩하는 코딩 영역 및 5'리보자임을 포함하는 마지막 RNA 분자를 제공하는 단계; 및 g) 하나 이상의 추가적인 RNA 분자의 코딩 영역 및 마지막 RNA 분자의 코딩 영역을 결찰시키기 위해 리가아제를 제공하여, 반복 도메인 단백질을 코딩하는 완전한 RNA 분자를 생성하는 단계.
일 실시양태에서, 본 발명은 다음을 포함하는, 큰 관심 단백질의 돌연변이에 의해 유발된 대상체의 질환 또는 장애를 치료하는 방법을 포함한다: 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 핵산 분자를 상기 대상체에 투여하는 단계; 및 관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 핵산을 상기 대상체에 투여하는 단계.
일 실시양태에서, 질환 또는 장애는 뒤센 근이영양증, 상염색체 열성 다낭성 신장 질환, 혈우병 A, 스타가르트 황반변성, 사지대 근이영양증, DFNB9, 신경감각 비증후군 열성 난청, 낭포성 섬유증, 윌슨 질환, 미요시 근이영양증 및 난청, 상염색체 열성 9, 어셔 증후군, 유형 I 및 난청, 상염색체 열성 2, 난청, 상염색체 열성 3 및 비증후군성 청력 손실, 어셔 증후군 유형 I, 상염색체 열성 난청-16 (DFNB16), 메니에르 질환 (MD), 난청, 상염색체 우성 12 및 난청, 상염색체 열성 21, 어셔 증후군 유형 1F (USH1F) 및 DFNB23, 난청, 상염색체 열성 28 및 비증후군성 청력 손실, 난청, 상염색체 열성 30 및 비증후군성 청력 손실, 귀척추거대골단 이형성증, 상염색체 열성 및 귀척추거대골단 이형성증, 상염색체 우성, 난청, 상염색체 열성 77 및 상염색체 열성 비-증후군성 감각신경성 난청 유형 Dfnb, 상염색체-열성 비증후군성 청각 장해 DFNB84, 난청, 상염색체 열성 84B 및 희귀 유전성 난청, 말초 신경병증, 근병증, 쉰 목소리, 및 청각 손실 및 난청, 상염색체 우성 4A, 선천성 혈소판감소증, 감각 청력 손실, DFNA56, HXB, 난청, 상염색체 우성 56, 헥사브라키온(hexabrachion), 간질성 뇌병증, 티모시 증후군 및 긴 Qt 증후군8, X-연관 망막 장애, 고알도스테론증, 척수소뇌 운동실조증 42, 원발성 알도스테론증, 발작, 및 신경학적 이상 및 동방결절 기능장애 및 난청, 신경발달 장애, 저칼륨성 주기성 마비, 간질, 발달성 및 간질성 뇌병증, 브로디 근병증, 다리에 질환/심장 질환, 폰 빌레브란트 질환 및 젤웨거 증후군으로 이루어진 군으로부터 선택된 하나 이상이다.
일 실시양태에서, 본 발명은 관심 단백질을 코딩하는 RNA 분자 및 다음을 코딩하는 핵산을 포함하는 원형 RNA 분자를 생성하기 위한 시스템을 포함한다: 관심 단백질의 제1 부분; 5' 리보자임, 카고 서열 및 3' 리보자임을 포함하는 합성 인트론; 및 관심 단백질의 제2 부분.
일 실시양태에서, 관심 단백질은 치료적 단백질, 리포터 단백질 및 Cas9 단백질로 이루어진 군으로부터 선택된 하나 이상이다.
일 실시양태에서, 카고 서열은 관심 치료적 단백질을 코딩하는 서열, CRISPR 가이드 RNA 서열, 작은 RNA 서열 및 트랜스-절단 리보자임 서열로 이루어진 군으로부터 선택된 하나 이상이다. 일 실시양태에서, 상기 작은 RNA 서열은 마이크로RNA (miRNA), Piwi-상호작용 RNA (piRNA), 작은 간섭 RNA (siRNA), 작은 핵소체 RNA (snoRNA), 작은 tRNA-유래 RNA (tsRNA), 작은 rDNA-유래 RNA (srRNA) 및 작은 핵 RNA (snRNA)로 이루어진 군으로부터 선택된 하나 이상을 포함한다.
일 실시양태에서, 합성 인트론의 3' 리보자임은 리보자임의 HH 패밀리의 구성원이다. 일 실시양태에서, 합성 인트론의 5' 리보자임은 리보자임의 HDV 패밀리의 구성원, 리보자임의 HDV 패밀리의 구성원 및 VS-S 리보자임 인식 서열로 이루어진 군으로부터 선택된 하나 이상이다. 일 실시양태에서, 시스템은 RtcB 리가아제 및 RtcB 리가아제를 코딩하는 핵산으로 이루어진 군으로부터 선택된 하나 이상을 추가로 포함한다.
일 실시양태에서, 본 발명은 관심 단백질을 코딩하는 RNA 분자 및 원형 RNA 분자를 전달하는 방법을 포함하며, 이 방법은 다음을 포함한다: 관심 단백질의 제1 부분을 코딩하는 핵산, 시스-절단 5' 리보자임, 카고 서열 및 시스-절단 3' 리보자임을 포함하는 합성 인트론, 및 관심 단백질의 제2 부분을 세포 또는 조직에 투여하는 단계.
일 실시양태에서, 관심 단백질은 치료적 단백질, 리포터 단백질 및 Cas9 단백질로 이루어진 군으로부터 선택된 하나 이상이다.
일 실시양태에서, 카고 서열은 관심 치료적 단백질을 코딩하는 서열, CRISPR 가이드 RNA 서열, 작은 RNA 서열 및 트랜스-절단 리보자임 서열로 이루어진 군으로부터 선택된 하나 이상이다. 일 실시양태에서, 상기 작은 RNA 서열은 마이크로RNA (miRNA), Piwi-상호작용 RNA (piRNA), 작은 간섭 RNA (siRNA), 작은 핵소체 RNA (snoRNA), 작은 tRNA-유래 RNA (tsRNA), 작은 rDNA-유래 RNA (srRNA) 및 작은 핵 RNA (snRNA)로 이루어진 군으로부터 선택된 하나 이상을 포함한다.
일 실시양태에서, 방법은 RtcB 리가아제 및 RtcB 리가아제를 코딩하는 핵산으로 이루어진 군으로부터 선택된 하나 이상을 세포 또는 조직에 투여하는 단계를 추가로 포함한다.
본 발명의 실시양태의 다음의 상세한 설명은 첨부된 도면과 함께 판독할 때 더 잘 이해될 것이다. 본 발명은 도면에 도시된 실시양태의 정확한 배열 및 수단으로 제한되지 않는다는 것을 이해해야 한다.
도 1a 내지 도 1e를 포함하는 도 1은 포유동물 세포에서의 리보자임-매개 트랜스-스플라이싱 및 발현을 묘사한다. 도 1a는 3' HDV 리보자임을 포함하는 GFP의 N-말단 (Nt) 절반 및 5' 해머헤드 (HH) 리보자임을 포함하는 GFP의 C-말단 (Ct) 절반을 코딩하는 벡터를 묘사하는 다이어그램을 도시한다. 도 1b는 COS7 및 HEK293T 세포에서 Nt-GFP-HDV 및 HH-Ct-GFP 둘 모두의 공동-발현이 검출가능한 GFP 형광을 나타내었지만 별도로 형질주입된 경우에는 그렇지 않음을 입증하는 예시적인 결과를 묘사한다. 도 1c-1d는 각각의 독립적인 RNA (G1 및 G2)에 특이적인 프라이머를 사용한 RT-PCR 증폭 (도 1c) 및 생어 서열 분석 (도 1d)의 예시적인 결과를 묘사하며, 리보자임의 제거 및 GFP 코딩 서열의 스카-리스 트랜스-스플라이싱 및 복원을 도시한다. 도 1e는 GFP에 대해 예측된 전장 단백질 크기를 보여주는 GFP에 특이적인 항체를 사용한 예시적인 웨스턴 블롯 결과를 묘사한다.
도 2a 내지 도 2e를 포함하는 도 2는 포유동물 세포에서 트랜스-스플라이싱에 대한 리보자임 서열의 영향을 정량화하기 위한 루시퍼라제-기반 리포터의 발달을 묘사한다. 도 2a는 3' HDV 리보자임을 포함하는 루시퍼라제의 N-말단 (Nt) 절반 및 5' 해머헤드 (HH) 리보자임을 포함하는 루시퍼라제의 C-말단 (Ct) 절반을 코딩하는 벡터를 묘사하는 다이어그램을 도시한다. 도 2b-2c는 각각의 독립적인 Luc RNA (L1 및 L2)에 특이적인 프라이머를 사용한 RT-PCR 증폭 (도 2b) 및 생어 서열 분석 (도 2c)의 예시적인 결과를 묘사하며, 리보자임의 제거 및 루시퍼라제 오픈 리딩 프레임의 스카-리스 트랜스-스플라이싱을 도시한다. 도 2d-2e는 포유동물 세포에서 트랜스-스플라이싱에 대한 상이한 HDV (도 2d) 및 HH (도 2e) 리보자임 서열의 영향을 보여준다. 게다가, 리보자임 촉매 뉴클레오티드의 돌연변이는 루시퍼라제 활성의 손실을 초래하였다 (도 2d, 마지막 열 및 도 2e, 마지막 열).
도 3a 내지 도 3d를 포함하는 도 3은 Nt 및 Ct 벡터로부터의 단백질 발현의 조절을 보여준다. 도 3a는 단백질 코딩된 Nt 벡터의 발현을 방지하는 C-말단 단백질 분해 서열의 배치를 묘사하는 다이어그램을 도시한다. 도 3b는 전장 GFP를 코딩하는 Nt 벡터로부터 GFP-HDV 발현을 방지할 때 상이한 단백질 분해 서열의 효율을 입증하는 예시적인 결과를 묘사한다. 도 3c는 Ct 벡터에서 단백질 서열의 번역을 방지하기 위한 N-말단 번역 제어 서열의 배치를 묘사하는 다이어그램을 도시한다. 도 3d는 포유동물 세포에서 GFP 형광을 방지할 때 상이한 GFP 서열 변형 또는 번역 제어 서열의 효율을 입증하는 예시적인 결과를 묘사한다.
도 4a 내지 도 4d를 포함하는 도 4는 포유동물 세포에서 단일 및 멀티플렉스 리보자임-매개 트랜스-스플라이싱을 보여준다. 도 4a는 미토콘드리아 표적화된 GFP 단백질의 트랜스-스플라이싱 및 발현을 매개하는 리보자임을 포함하는 4xMTS 및 전장 GFP를 코딩하는 벡터 (출발 ATG 코돈 없음)를 묘사하는 다이어그램을 도시한다. 도 4b는 이들 벡터의 공동-발현이 미토트래커(mitotracker) CMXRos의 적색 형광과 중첩되는 미토콘드리아 국소화된 녹색 형광을 초래한다는 것을 입증하는 예시적인 결과를 묘사한다. 도 4c는 리딩 프레임 1에서 미토콘드리아 표적화된 GFP 단백질 (4xMTS-GFP) 및 리딩 프레임 2에서 미리스토일화 막 표적화된 적색 형광 단백질 (F2-Myr-RFP)의 멀티플렉스 트랜스-스플라이싱 및 발현을 위한 벡터를 묘사하는 다이어그램을 도시한다. 도 4d는 포유동물 Cos7 세포에서 모든 4 개의 벡터의 공동-발현이 미토콘드리아에서 특이적 녹색 형광 및 막에서 적색 형광을 초래한다는 것을 입증하는 예시적인 결과를 묘사한다.
도 5a 및 도 5b를 포함하는 도 5는 최적화된 리보자임 서열 및 시스-스플라이싱 스플라이스 수용자 및 스플라이스 공여자 서열을 사용한 향상된 리보자임-매개 트랜스 스플라이싱을 보여준다. 도 5a는 통칭 Nt-GFP-3'Rz 및 5' Rz-Ct-GFP 트랜스-스플라이싱 GFP 리포터에서 키메라 스플라이스 공여자 (SD) 및 스플라이스 수용자 (SA) 서열의 배치를 묘사하는 다이어그램을 도시하며, 여기서 Rz는 시스-절단 리보자임을 나타낸다. 도 5b는 형질주입 18 시간 후 (처음 3 개의 열) 또는 형질주입 36 시간 후 (마지막 열) 단일 벡터 형질주입 (처음 2 개의 열) 또는 공동-형질주입 (마지막 2 개의 열) 후 Cos7 세포에서 GFP 형광의 예시적인 결과를 묘사한다. 제1 행은 최적화되지 않은 HH 및 HDV 리보자임의 사용을 묘사하고, 제2 행은 최적화된 트위스터 및 RzB 리보자임의 사용을 묘사하며, 마지막 행은 트위스터 및 RzB 리보자임, 및 SD 및 SA 서열의 조합을 묘사한다.
도 6a 내지 도 6d를 포함하는 도 6은 큰 단백질 코딩 유전자의 리보자임-매개 트랜스 스플라이싱을 보여준다. 도 6a는 AAV 벡터를 사용하여 전달하기 위한 분할 μ디스트로핀-GFP 융합 단백질을 코딩하는 벡터를 묘사하는 다이어그램을 도시한다. 도 6b-6c는 특이적 트랜스-스플라이싱을 나타내는 Nt-Dys 및 Ct-Dys 벡터로 형질주입된 세포에 대한 RT-PCR (도 6b) 및 생어 시퀀싱 (도 6c) 분석의 예시적인 결과를 묘사한다. 도 6d는 디스트로핀의 예측된 막 국소화를 보여주는 공초점 현미경을 사용하여 영상화된 Nt 및 Ct 디스트로핀 벡터 둘 모두로 형질주입된 세포로부터의 GFP 형광의 예시적인 결과를 묘사한다.
도 7a 내지 도 7c를 포함하는 도 7은 표적 세포에서 트랜스-스플라이싱을 위한 리보자임-함유 RNA의 렌티바이러스 전달을 보여준다. 도 7a는 렌티바이러스 유전자 전달 벡터에서 Nt 및 Ct 분할 GFP 발현 카세트의 네거티브 센스 배향을 묘사하는 다이어그램을 도시한다. 도 7b는 Nt-GFP 및 Ct-GFP 유전자 둘 모두를 코딩하는 렌티바이러스로 공동-형질도입된 세포만이 GFP 형광을 나타낸다는 것을 입증하는 예시적인 결과를 묘사한다. 도 7c는 렌티바이러스 유전자 전달 벡터에서 Nt 및 Ct 분할 Dys 발현 카세트의 네거티브 센스 배향을 묘사하는 다이어그램을 도시한다.
도 8a 및 도 8b를 포함하는 도 8은 리보자임-매개 트랜스-스플라이싱 및 독성 DTA 유전자의 발현을 보여준다. 도 8a는 분할 Nt 및 Ct DTA 유전자를 코딩하는 벡터를 묘사하는 다이어그램을 도시한다. 도 8b는 포유동물 세포에서 DTA의 번역 억압인자 기능과 일치하는, Nt-DTA 및 Ct-DTA 둘 모두로 공동-형질주입된 세포가 공동-형질주입된 GFP 리포터의 감소된 발현을 초래한다는 것을 입증하는 예시적인 결과를 묘사한다.
도 9는 외인성 RNA 조정 효소의 공동-발현이 포유동물 세포에서 리보자임-매개 트랜스-스플라이싱을 향상 또는 억제할 수 있다는 것을 입증하는 예시적인 결과를 묘사한다.
도 10a 내지 도 10d를 포함하는 도 10은 RtcB가 생체외에서 리보자임-매개 트랜스-스플라이싱을 촉매화하기에 충분하다는 것을 보여준다. 도 10a는 생체외 RNA 전사를 가능하게 하는 업스트림 T7 RNA 프로모터를 함유하는 분할 루시퍼라제 트랜스-스플라이싱 리포터를 묘사하는 다이어그램을 도시한다. 도 10b는 생체외 트랜스-스플라이싱된 루시퍼라제 RNA가 제조업체의 권장 반응 조건을 사용한 RtcB 단백질 (NEB)의 첨가에 의존함을 보여주는 예시적인 RT-PCR 결과를 도시한다. 도 10c는 스피드로인의 보존된 N-말단 (N1L) 및 C-말단 (N3R) 도메인에 대한 트랜스-스플라이싱 벡터를 묘사하는 다이어그램을 도시한다. 도 10d는 대장균으로부터의 RtcB 리가아제가 리보자임 절단된 N1L 및 N3R 코딩 RNA의 트랜스-결찰을 촉매화하기에 충분함을 입증하는 예시적인 생어 시퀀싱 결과를 묘사한다.
도 11은 RtcB, VS-S 및 VS-Rz를 사용한 리보자임-촉매화된 RNA의 생체외 방향성 결찰을 묘사한다.
도 12a 내지 12d를 포함하는 도 12는 RNA의 트랜스-스플라이싱을 위한 트랜스-절단 리보자임의 사용을 묘사한다. 도 12a는 시스로 절단하는 리보자임의 이차 구조를 묘사한다. 도 12b는 트랜스에서 절단할 수 있는 조작된 리보자임을 묘사한다. 도 12c 및 도 12d는 단백질 발현 및 기능을 복원시키기 위해, 질환 유발 돌연변이, 예컨대, 프레임-시프팅 또는 조기 정지 코돈을 결실시키기 위한 트랜스-절단 리보자임의 잠재적 적용을 나타내는 다이어그램을 묘사한다.
도 13a 및 도 13b를 포함하는 도 13은 RNA의 스카-리스 트랜스-스플라이싱에 활용될 수 있는 대표적인 리보자임의 이차 구조를 묘사한다. 도 13a는 스카-리스 5' 절단에 사용될 수 있는 대표적인 리보자임을 묘사한다. 도 13b는 스카-리스 3' 절단에 사용될 수 있는 대표적인 리보자임을 묘사한다. N = 임의의 뉴클레오티드. 적색 가위는 절단 부위를 획정한다. 적색 뉴클레오티드는 촉매 돌연변이를 나타낸다. 주황색 뉴클레오티드는 트랜스-스플라이싱될 RNA 서열을 나타낸다. 진한 청색 뉴클레오티드는 줄기를 형성하는 데 필요한 리보자임 서열을 나타낸다. 밝은 청색은 줄기 2 루프와 상호작용하는 줄기 1의 삼차 안정화 모티프 (TSM)를 나타낸다. HH - 해머헤드, HDV - 델타 간염 바이러스, Rz - 리보자임.
도 14a 내지 도 14c를 포함하는 도 14는 스카-리스 절단 및 유도성 RNA 트랜스-스플라이싱 및 트랜스-활성화 리보자임을 사용한 발현을 묘사한다. 도 14a는 VS 리보자임이 자가촉매 활성이 결여된 작은 VS-S 줄기 루프 및 트랜스로 전달될 때 VS-S 절단을 유도하는 더 큰 VS-Rz의 2 개의 구성요소로 분할될 수 있음을 보여주는 다이어그램을 묘사한다. VS-S/VS-Rz 리보자임 쌍은 유도성 스카-리스 트랜스-스플라이싱을 생성하는 데 활용될 수 있다. 도 14b는 유도성 RNA 트랜스-스플라이싱 시스템을 생성하기 위해 VS-S/VS-Rz 트랜스-활성화된 리보자임 쌍을 활용하는 방법을 묘사하는 다이어그램을 도시한다. VS-Rz의 전달 또는 발현 시에만 Nt-GFP-VS-S RNA가 공동-발현된 Ct-GFP RNA와의 트랜스-스플라이싱에 참여할 수 있는 적합한 RNA 말단을 생성한다. 도 14c는 N-말단 서열, 가변 또는 비-가변 반복 영역, 및 C-말단 서열을 갖는 RNA를 생성하는 방법을 묘사하는 다이어그램을 도시한다. '반복' RNA는 5' 자가촉매 리보자임 및 3' 트랜스-활성화된 리보자임, 예컨대, VS-S을 함유하며, 이는 트랜스-활성화 VS-Rz 및 리가아제, 예컨대, RtcB의 선택적 첨가에 따라 제어된 반복 첨가를 허용한다.
도 15a 내지 도 15e를 포함하는 도 15는 안정한 인트론 RNA 서열의 생성과 함께 리보자임-매개 트랜스-스플라이싱을 묘사한다. 도 15a는 2 개의 독립적인 RNA의 트랜스-스플라이싱을 매개하기 위한 시스-절단 리보자임의 사용을 묘사하는 다이어그램을 도시한다. 도 15b는 합성 인트론을 생성하기 위한 내부 시스-절단 리보자임의 사용을 묘사하는 다이어그램을 도시한다. 도 15c는 합성 인트론의 효율적인 시스-절단 및 기능적 단백질 (GFP)을 산출하기 위한 독립적인 RNA의 트랜스-스플라이싱을 입증하는 예시적인 결과를 묘사한다. 도 15d 및 도 15e는 트랜스-스플라이싱된 및 번역된 리포터, 및 임의의 유용한 RNA 서열 또는 유전자 발현 카세트일 수 있는 인트론 서열인 '카고'를 생성하기 위한 내부 시스-절단 리보자임의 사용을 묘사하는 다이어그램을 도시한다.
도 16a 내지 도 16c를 포함하는 도 16은 생체내 리보자임-매개 트랜스-스플라이싱을 위한 최적화된 리보자임 서열의 예시적인 결과를 묘사한다. 도 16a는 루시퍼라제 트랜스-스플라이싱 리포터를 사용한 상대적인 리보자임 활성의 비교를 묘사한다. 삼차 안정화 모티프를 함유하고 낮은 마그네슘 농도에서 활성인 RzB 해머헤드 리보자임 변이체는 포유동물 세포에서 가장 큰 루시퍼라제 활성을 보였다. 도 16b는 HDV 리보자임 (HDV68 및 트위스터 리보자임 (Twst)을 갖는 게놈 HDV)의 비교를 묘사한다. Nt-Luc의 3' 단부 상의 트위스터 리보자임은 가장 큰 루시퍼라제 활성을 제공하였으며, 이는 촉매 불활성화 돌연변이 (Twst mut)로 철폐되었다. 도 16c는 트위스터 리보자임 서열 변형의 비교를 묘사한다. P1 줄기의 단축은 리포터 활동을 감소시켰다. 제1 잔기의 변형은 트위스터가 위치 1에서 A 뉴클레오티드 (U1A)를 용인할 수 있음을 보여주었다.
정의
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
일반적으로, 본원에 사용된 명명법 및 세포 배양, 분자 유전학, 유기 화학, 및 핵산 화학 및 혼성화의 실험실 절차는 당업계에 잘 알려져 있고 일반적으로 사용되는 것들이다.
핵산 및 펩티드 합성에 대해 표준 기술이 사용된다. 기술 및 절차는 일반적으로 당업계의 통상적인 방법 및 다양한 일반 참고문헌 (예컨대, Sambrook and Russell, 2012, Molecular Cloning, A Laboratory Approach, Cold Spring Harbor Press, Cold Spring Harbor, NY, 및 Ausubel et al., 2012, Current Protocols in Molecular Biology, John Wiley & Sons, NY)에 따라 수행되며, 이는 이 문서 전체에 제공된다.
본원에 사용된 명명법 및 하기에 기재된 분석 화학 및 유기 합성에 사용되는 실험실 절차는 당업계에 잘 알려져 있고 일반적으로 사용되는 것들이다. 화학 합성 및 화학 분석에 대해 표준 기술 또는 이의 변형이 사용된다.
본 발명의 맥락에서 (특히 청구범위의 맥락에서) 사용된 용어 "(단수형)" 및 유사한 용어는 본원에 달리 나타내지 않거나 맥락상 명백히 모순되지 않는 한 단수형 및 복수형 둘 모두를 포함하는 것으로 해석되어야 한다.
측정가능한 값, 예컨대, 양 및 시간적 지속시간 등을 언급할 때 본원에 사용된 바와 같은 "약"은 명시된 값으로부터 ±20%, 또는 ±10%, 또는 ±5%, 또는 ±1%, 또는 ±0.1%의 변동을 포함하는 것을 의미하며, 이는 이러한 변동이 개시된 방법을 수행하는 데 적절하기 때문이다.
"안티센스"는 특히 단백질을 코딩하는 이중 가닥 DNA 분자의 비-코딩 가닥의 핵산 서열, 또는 비-코딩 가닥과 실질적으로 상동인 서열을 지칭한다. 본원에 정의된 바와 같이, 안티센스 서열은 단백질을 코딩하는 이중 가닥 DNA 분자의 서열에 상보적이다. 안티센스 서열이 오로지 DNA 분자의 코딩 가닥의 코딩 부분에만 상보적일 필요는 없다. 안티센스 서열은 단백질을 코딩하는 DNA 분자의 코딩 가닥에 명시된 조절 서열에 상보적일 수 있으며, 이 조절 서열은 코딩 서열의 발현을 제어한다.
고체 지지체에 대한 분자 (예컨대, 핵산 분자)의 고정화를 언급할 때, 본원에 사용된 바와 같은 용어 "부착된"은 명시적으로 또는 맥락에 의해 달리 나타내지 않는 한, 직접 또는 간접, 공유 또는 비-공유 부착을 포함하도록 의도된다.
본원에 상호교환적으로 사용된 바와 같이, "미세구체", "비드" 또는 이들의 문법적 등가물은 생체분자 (예컨대, 핵산 분자)의 부착을 위한 고체 지지체로 작용할 수 있는 작은 단립자를 설명한다.
"질환"은 동물이 항상성을 유지할 수 없는 동물의 건강 상태이며, 질환이 호전되지 않으면 동물의 건강이 계속 악화된다.
대조적으로, 동물의 "장애"는 동물이 항상성을 유지할 수 있는 건강 상태이지만, 동물의 건강 상태가 장애의 부재일 때보다 덜 유리한 건강 상태이다. 치료하지 않은 채로 두면, 장애가 반드시 동물의 건강 상태의 추가의 감소를 유발하는 것은 아니다.
질환 또는 장애의 징후 또는 증상의 중증도, 환자가 이러한 징후 또는 증상을 경험하는 빈도, 또는 둘 모두가 감소하면, 질환 또는 장애가 "경감"된다.
"코딩"은 정의된 뉴클레오티드 (즉, rRNA, tRNA 및 mRNA) 서열 또는 정의된 아미노산 서열을 갖는 생물학적 과정에서 다른 중합체 및 거대분자의 합성을 위한 주형으로서 역할을 하는 폴리뉴클레오티드, 예컨대, 유전자, cDNA 또는 mRNA의 특이적 뉴클레오티드 서열의 내재 특성 및 그로부터 생성되는 생물학적 특성을 지칭한다. 따라서, 해당 유전자에 상응하는 mRNA의 전사 및 번역이 세포 또는 다른 생물학적 시스템에서 단백질을 생산하는 경우 유전자는 단백질을 코딩한다. 뉴클레오티드 서열이 mRNA 서열과 동일하고 일반적으로 서열 목록에 제공되는 코딩 가닥, 및 유전자 또는 cDNA의 전사를 위한 주형으로서 사용되는 비-코딩 가닥 둘 모두는 단백질 또는 해당 유전자 또는 cDNA의 다른 생성물을 코딩하는 것으로서 지칭될 수 있다.
용어 "환자", "대상체" 및 "개체" 등은 본원에 상호교환적으로 사용되며, 생체외 또는 생체내 여부에 관계없이 본원에 기재된 방법에 따를 수 있는 임의의 동물 또는 세포를 지칭한다. 일 실시양태에서, 대상체는 척추동물 및 무척추동물을 포함한다. 무척추동물은 드로소필라 멜라노가스터 및 캐노랍디티스 엘레간스를 포함하나, 이에 제한되지 않는다. 척추동물은 영장류, 설치류, 가축 또는 사냥감 동물을 포함하나, 이에 제한되지 않는다. 영장류는 침팬지, 시노몰구스 원숭이, 거미 원숭이 및 마카크 (예컨대, 레수스)를 포함하나, 이에 제한되지 않는다. 설치류는 마우스, 랫트, 우드척, 페럿, 토끼 및 햄스터를 포함하나, 이에 제한되지 않는다. 가축 및 사냥감 동물은 소, 말, 돼지, 사슴, 들소, 버팔로, 펠린 종 (예컨대, 집 고양이), 카닌 종 (예컨대, 개, 여우, 늑대), 조류 종 (예컨대, 닭, 에뮤, 타조) 및 어류 (예컨대, 제브라피쉬, 송어, 메기 및 연어)를 포함하나, 이에 제한되지 않는다. 일부 실시양태에서, 대상체는 포유류, 예컨대, 영장류, 예컨대, 인간이다. 특정 비-제한적인 실시양태에서, 환자, 대상체 또는 개체는 인간이다.
항체와 관련하여 본원에 사용된 바와 같이, 용어 "특이적으로 결합하는"은 특이적 항원을 인식하나, 샘플 중의 다른 분자를 실질적으로 인식하거나 이에 결합하지 않는 항체를 의미한다. 예를 들어, 하나의 종으로부터의 항원에 특이적으로 결합하는 항체는 또한 하나 이상의 종으로부터의 항원에 결합할 수 있다. 그러나, 이러한 종간 반응성은 그 자체로 항체의 분류를 특이적으로 변경하지 않는다. 다른 예에서, 항원에 특이적으로 결합하는 항체는 또한 항원의 상이한 대립형질 형태에 결합할 수 있다. 그러나, 이러한 교차 반응성은 그 자체로 항체의 분류를 특이적으로 변경하지 않는다.
일부 경우에, 용어 "특이적 결합" 또는 "특이적으로 결합하는"은 항체, 단백질 또는 펩티드와 제2 화학 종과의 상호작용과 관련하여 사용될 수 있으며, 이는 상호작용이 화학 종에 대한 특정 구조 (예컨대, 항원 결정기 또는 에피토프)의 존재에 의존하며; 예를 들어, 항체는 일반적으로 단백질보다는 특이적 단백질 구조를 인식하고 이에 결합한다는 것을 의미한다. 항체가 에피토프 "A"에 특이적인 경우, 표지된 "A" 및 항체를 함유하는 반응에서 에피토프 A (또는 유리, 표지되지 않은 A)를 함유하는 분자의 존재는 항체에 결합된 표지된 A의 양을 감소시킬 것이다.
유전자의 "코딩 영역"은 각자, 유전자의 전사에 의해 생산되는 mRNA 분자의 코딩 영역과 상동이거나 이에 상보적인 유전자의 코딩 가닥의 뉴클레오티드 잔기 및 유전자의 비-코딩 가닥의 뉴클레오티드로 이루어진다.
mRNA 분자의 "코딩 영역"은 또한 mRNA 분자의 번역 동안 전달 RNA 분자의 안티-코돈 영역과 매칭되거나 정지 코돈을 코딩하는 mRNA 분자의 뉴클레오티드 잔기로 이루어진다. 따라서, 코딩 영역은 mRNA 분자에 의해 코딩된 성숙 단백질에 존재하지 않는 아미노산 잔기 (예컨대, 단백질 수출 신호 서열의 아미노산 잔기)에 대한 코돈을 포함하는 뉴클레오티드 잔기를 포함할 수 있다.
핵산을 지칭하기 위해 본원에 사용된 바와 같은 "상보적"은 2 개의 핵산 가닥의 영역 사이 또는 동일한 핵산 가닥의 2 개 영역 사이의 서열 상보성의 광범위한 개념을 지칭한다. 제1 핵산 영역의 아데닌 잔기는 잔기가 티민 또는 우라실인 경우 제1 영역에 역평행인 제2 핵산 영역의 잔기와 특이적 수소 결합 ("염기 페어링")을 형성할 수 있는 것으로 알려져 있다. 유사하게, 제1 핵산 가닥의 시토신 잔기는 잔기가 구아닌인 경우 제1 가닥에 역평행인 제2 핵산 가닥의 잔기와 염기 페어링을 할 수 있는 것으로 알려져 있다. 핵산의 제1 영역은, 두 영역이 역평행 방식으로 배열되어 있을 때 제1 영역의 하나 이상의 뉴클레오티드 잔기가 제2 영역의 잔기와 염기 페어링을 할 수 있는 경우 동일한 또는 상이한 핵산의 제2 영역에 상보적이다. 일 실시양태에서, 제1 영역은 제1 부분을 포함하고, 제2 영역은 제2 부분을 포함하며, 이에 의해 제1 및 제2 부분이 역평행 방식으로 배열될 때, 제1 부분의 뉴클레오티드 잔기의 약 50% 이상, 약 75% 이상, 약 90% 이상, 또는 약 95% 이상은 제2 부분의 뉴클레오티드 잔기와 염기 페어링을 할 수 있다. 일 실시양태에서, 제1 부분의 모든 뉴클레오티드 잔기는 제2 부분의 뉴클레오티드 잔기와 염기 페어링을 할 수 있다.
본원에 사용된 바와 같이, 용어 "DNA"는 데옥시리보핵산으로서 정의된다.
본원에 사용된 바와 같이, 용어 "발현"은 이의 프로모터에 의해 구동된 특정 뉴클레오티드 서열의 전사 및/또는 번역으로서 정의된다.
본원에 사용된 바와 같이, 용어 "발현 벡터"는 전사될 수 있는 유전자 생성물의 적어도 일부를 코딩하는 핵산 서열을 함유하는 벡터를 지칭한다. 일부 경우에, RNA 분자는 단백질, 폴리펩티드 또는 펩티드로 번역된다. 다른 경우에, 이들 서열은 예를 들어, 안티센스 분자, siRNA 및 리보자임 등의 생산에서 번역되지 않는다. 발현 벡터는 특정 숙주 유기체에서 작동적으로 연결된 코딩 서열의 전사 및 가능하게는 번역에 필요한 핵산 서열을 지칭하는 다양한 제어 서열을 함유할 수 있다. 전사 및 번역을 지배하는 제어 서열에 더하여, 벡터 및 발현 벡터는 다른 기능을 또한 수행하는 핵산 서열을 함유할 수 있다.
본원에 사용된 바와 같이, 용어 "야생형"은 당업자에 의해 이해되는 당업계의 용어이며, 돌연변이체 또는 변이체 형태와 구별되는 자연에서 발생하는 유기체, 균주, 유전자 또는 특질의 전형적인 형태를 의미한다.
용어 "상동성"은 상보성의 정도를 지칭한다. 부분적 상동성 또는 완전한 상동성 (즉, 동일성)이 있을 수 있다. 상동성은 종종 서열 분석 소프트웨어 (예컨대, 유전학 컴퓨터 그룹의 서열 분석 소프트웨어 패키지. 위스콘신대학교 생명공학센터. 1710 University Avenue. Madison, Wis. 53705)를 사용하여 측정된다. 이러한 소프트웨어는 다양한 치환, 결실, 삽입 및 기타 변형에 상동성 정도를 할당함으로써 유사한 서열을 매칭시킨다. 보존적 치환은 전형적으로 다음의 기 내의 치환을 포함한다: 글리신, 알라닌; 발린, 이소류신, 류신; 아스파르트산, 글루탐산, 아스파라긴, 글루타민; 세린, 트레오닌; 리신, 아르기닌; 및 페닐알라닌, 티로신.
"단리된"은 자연 상태로부터 변경되거나 제거된 것을 의미한다. 예를 들어, 살아있는 동물의 정상적인 맥락에서 자연적으로 존재하는 핵산 또는 펩티드는 "단리"되지 않지만, 자연적 맥락의 공존 재료로부터 부분적으로 또는 완전히 분리된 동일한 핵산 또는 펩티드는 "단리"된다. 단리된 핵산 또는 단백질은 실질적으로 정제된 형태로 존재할 수 있거나, 비-천연 환경, 예컨대, 예를 들어, 숙주 세포에 존재할 수 있다.
"단리된 올리고뉴클레오티드" 또는 "단리된 폴리뉴클레오티드"에서와 같이 핵산과 관련하여 사용될 때 용어 "단리된"은 이의 공급원에서 일반적으로 연관된 하나 이상의 오염물로부터 식별된 및 분리된 핵산 서열을 의미한다. 따라서, 단리된 핵산은 자연에서 발견되는 것과 상이한 형태 또는 설정으로 존재한다. 대조적으로, 비-단리된 핵산 (예컨대, DNA 및 RNA)은 자연에 존재하는 상태에서 발견된다. 예를 들어, 주어진 DNA 서열 (예컨대, 유전자)은 근처의 유전자에 근접한 숙주 세포 염색체에서 발견되며; RNA 서열 (예컨대, 특이적 단백질을 코딩하는 특이적 mRNA 서열)은 다수의 단백질을 코딩하는 수많은 다른 mRNA와의 혼합물로서 세포에서 발견된다. 그러나, 단리된 핵산은 예로서, 핵산이 자연 세포의 염색체 위치와 상이한 염색체 위치에 있거나 그렇지 않으면 자연에서 발견되는 것과 상이한 핵산 서열이 플랭킹된 핵산을 정상적으로 발현하는 세포 중의 이러한 핵산을 포함한다. 단리된 핵산 또는 올리고뉴클레오티드는 단일-가닥 또는 이중-가닥 형태로 존재할 수 있다. 단리된 핵산 또는 올리고뉴클레오티드가 단백질을 발현하는 데 활용될 때, 올리고뉴클레오티드는 최소의 센스 또는 코딩 가닥을 함유하지만 (즉, 올리고뉴클레오티드가 단일-가닥일 수 있음), 센스 및 안티-센스 가닥 둘 모두를 함유할 수 있다 (즉, 올리고뉴클레오티드는 이중-가닥일 수 있음).
"단리된 단백질" 또는 "단리된 폴리펩티드"에서와 같이 폴리펩티드와 관련하여 사용될 때 용어 "단리된"은 이의 공급원에서 일반적으로 연관된 하나 이상의 오염물로부터 식별된 및 분리된 폴리펩티드를 지칭한다. 따라서, 단리된 폴리펩티드는 자연에서 발견되는 것과 상이한 형태 또는 설정으로 존재한다. 대조적으로, 비-단리된 폴리펩티드 (예컨대, 단백질 및 효소)는 자연에 존재하는 상태에서 발견된다.
"핵산"은 데옥시리보뉴클레오시드 또는 리보뉴클레오시드로 구성되었는지 여부, 및 포스포디에스테르 연결 또는 변형된 연결, 예컨대, 포스포트리에스테르, 포스포라미데이트, 실록산, 카보네이트, 카복시메틸에스테르, 아세트아미데이트, 카바메이트, 티오에테르, 브릿지된 포스포라미데이트, 브릿지된 메틸렌 포스포네이트, 포스포로티오에이트, 메틸포스포네이트, 포스포로디티오에이트, 브릿지된 포스포로티오에이트 또는 설폰 연결, 및 이러한 연결의 조합으로 구성되었는지 여부에 관계없이 임의의 핵산을 의미한다. 용어 핵산은 또한 생물학적으로 발생하는 5 개의 염기 (아데닌, 구아닌, 티민, 시토신 및 우라실) 이외의 염기로 구성된 핵산을 구체적으로 포함한다. 용어 "핵산"은 전형적으로 큰 폴리뉴클레오티드를 지칭한다.
폴리뉴클레오티드 서열을 설명하기 위해 본원에서 통상적인 표기법이 사용되며: 단일-가닥 폴리뉴클레오티드 서열의 좌측-핸드(left-hand) 단부는 5'-단부이고; 이중-가닥 폴리뉴클레오티드 서열의 좌측-핸드 방향은 5'-방향으로서 지칭된다.
초기 RNA 전사물에 대한 뉴클레오티드의 5'에서 3'으로의 첨가 방향은 전사 방향으로서 지칭된다. mRNA와 동일한 서열을 갖는 DNA 가닥은 "코딩 가닥"으로서 지칭되고; DNA 상의 기준점에 대해 5'에 위치한 DNA 가닥 상의 서열은 "업스트림 서열"로서 지칭되고; DNA 상의 기준점에 대해 3'인 DNA 가닥 상의 서열은 "다운스트림 서열"로서 지칭된다.
"발현 카세트"는 전사 및 임의로 코딩 서열의 번역에 필요한 프로모터/조절 서열에 작동가능하게 연결된 코딩 서열을 포함하는 핵산 분자를 의미한다.
본원에 사용된 바와 같이, 용어 "작동가능하게 연결된"은 주어진 유전자의 전사 및/또는 원하는 단백질 분자의 합성을 지시할 수 있는 핵산 분자가 생산되는 방식으로의 핵산 서열의 연결을 지칭한다. 용어는 또한 기능적 (예컨대, 효소적으로 활성인, 결합 파트너에 결합할 수 있는, 억제할 수 있는 등) 단백질 또는 폴리펩티드가 생산되는 방식으로의 아미노산을 코딩하는 서열의 연결을 지칭한다.
본원에 사용된 바와 같이, 용어 "프로모터/조절 서열"은 프로모터/조절 서열에 작동가능하게 연결된 유전자 생성물의 발현에 필요한 핵산 서열을 의미한다. 일부 경우에, 이 서열은 코어 프로모터 서열일 수 있고, 다른 경우에, 이 서열은 또한 유전자 생성물의 발현에 필요한 인핸서 서열 및 기타 조절 요소를 포함할 수 있다. 프로모터/조절 서열은 예를 들어, 유전자 생성물을 유도성 방식으로 발현하는 것일 수 있다.
본원에 사용된 바와 같이, 혼성화를 위한 "엄격한 조건"은 표적 서열에 상보성을 갖는 핵산이 표적 서열과 우세하게 혼성화하고 실질적으로 비-표적 서열에 혼성화하지 않는 조건을 지칭한다. 엄격한 조건은 일반적으로 서열-의존적이며, 많은 인자에 따라 달라진다. 일반적으로, 서열이 길수록 서열이 이의 표적 서열에 특이적으로 혼성화하는 온도가 더 높아진다. 엄격한 조건의 비-제한적인 예는 Tijssen (1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part 1, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay" Elsevier, N.Y에 상세히 설명되어 있다.
"혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 복합체를 형성하는 반응을 지칭한다. 수소 결합은 Watson Crick 염기 페어링, Hoogstein 결합 또는 임의의 기타 서열 특이적 방식으로 발생할 수 있다. 복합체는 듀플렉스 구조를 형성하는 2 개의 가닥, 다중 가닥 복합체를 형성하는 3 개 이상의 가닥, 단일 자기-혼성화 가닥, 또는 이들의 임의의 조합을 포함할 수 있다. 혼성화 반응은 PCR 개시 또는 효소에 의한 폴리뉴클레오티드 절단과 같은 보다 광범위한 과정의 단계를 구성할 수 있다. 주어진 서열과 혼성화할 수 있는 서열은 주어진 서열의 "보체"로서 지칭된다.
"유도성" 프로모터는 유전자 생성물을 코딩하거나 지정하는 폴리뉴클레오티드와 작동가능하게 연결될 때 프로모터에 상응하는 인듀서가 존재하는 경우에만 유전자 생성물이 실질적으로 생산되도록 유발하는 뉴클레오티드 서열이다.
"구성적" 프로모터는 유전자 생성물을 코딩하거나 지정하는 폴리뉴클레오티드와 작동가능하게 연결될 때 세포의 대부분 또는 모든 생리학적 조건 하에서 유전자 생성물이 세포에서 생산되도록 유발하는 뉴클레오티드 서열이다.
본원에 사용된 바와 같이, 용어 "폴리뉴클레오티드"는 뉴클레오티드의 쇄로서 정의된다. 더욱이, 핵산은 뉴클레오티드의 중합체이다. 따라서, 본원에 사용된 바와 같은 핵산 및 폴리뉴클레오티드는 상호교환가능하다. 당업자는 핵산이 단량체 "뉴클레오티드"로 가수분해될 수 있는 폴리뉴클레오티드라는 일반적인 지식을 가지고 있다. 단량체 뉴클레오티드는 뉴클레오시드로 가수분해될 수 있다. 본원에 사용된 바와 같이, 폴리뉴클레오티드는 재조합 수단, 즉, 일반적인 클로닝 기술 및 PCR 등을 이용한, 및 합성 수단에 의한 재조합 라이브러리 또는 세포 게놈으로부터의 핵산 서열의 클로닝을 제한 없이 포함하는 당업계에서 이용가능한 임의의 수단에 의해 수득된 모든 핵산 서열을 포함하나, 이에 제한되지 않는다.
본 발명의 맥락에서, 일반적으로 발생하는 핵산 염기에 대해 다음의 약어가 사용된다. "A"는 아데노신을 지칭하고, "C"는 시토신을 지칭하고, "G"는 구아노신을 지칭하고, "T"는 티미딘을 지칭하며, "U"는 우리딘을 지칭한다.
본원에 사용된 바와 같이, 용어 "펩티드", "폴리펩티드" 및 "단백질"은 상호교환적으로 사용되며, 펩티드 결합에 의해 공유 연결된 아미노산 잔기를 포함하는 화합물을 지칭한다. 단백질 또는 펩티드는 2 개 이상의 아미노산을 함유해야 하며, 단백질의 서열 또는 펩티드의 서열을 포함할 수 있는 아미노산의 최대 수에는 제한이 없다. 폴리펩티드는 펩티드 결합에 의해 서로 접합된 2 개 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질을 포함한다. 본원에 사용된 바와 같이, 용어는 예를 들어, 일반적으로 당업계에서 펩티드, 올리고펩티드 및 올리고머로서 또한 지칭되는 짧은 쇄, 및 일반적으로 당업계에서 단백질로서 지칭되는 보다 긴 쇄 둘 모두를 지칭하며, 이들 중 많은 유형이 있다. "폴리펩티드"는 예를 들어, 그 중에서도 생물학적으로 활성인 단편, 실질적으로 상동인 폴리펩티드, 올리고펩티드, 동종이합체, 이종이합체, 폴리펩티드의 변이체, 변형된 폴리펩티드, 유도체, 유사체, 융합 단백질을 포함한다. 폴리펩티드는 자연 펩티드, 재조합 펩티드, 합성 펩티드, 또는 이들의 조합을 포함한다.
본원에 사용된 바와 같이, 용어 "RNA"는 리보핵산으로서 정의된다.
본원에 사용된 바와 같이, 용어 "리보자임"은 효소로서 작용할 수 있는 RNA 분자를 지칭한다. 예를 들어, 일부 리보자임은 RNA 분자를 절단할 수 있다. RNA 절단 리보자임은 전형적으로 적어도 촉매 도메인 및 촉매 도메인에 의해 인식되는 인식 서열로 이루어진다. 촉매 도메인은 인식 서열과 동일한 RNA 분자의 일부일 수 있으며, 따라서 시스-절단을 매개한다. 대안적으로, 촉매 도메인은 인식 서열을 포함하는 RNA 분자로부터 분리된 RNA 분자일 수 있으며, 따라서 트랜스-절단을 매개한다.
"재조합 폴리뉴클레오티드"는 자연적으로 함께 접합되지 않은 서열을 갖는 폴리뉴클레오티드를 지칭한다. 증폭되거나 조립된 재조합 폴리뉴클레오티드가 적합한 벡터에 포함될 수 있으며, 벡터는 적합한 숙주 세포를 형질전환시키는 데 사용될 수 있다.
재조합 폴리뉴클레오티드는 비-코딩 기능 (예컨대, 프로모터, 복제 기점, 리보솜-결합 부위 등)을 또한 제공할 수 있다.
본원에 사용된 바와 같이, 용어 "재조합 폴리펩티드"는 재조합 DNA 방법을 사용함으로써 생산된 폴리펩티드로서 정의된다.
본원에 사용된 바와 같이, 용어 "고체 표면", "고체 지지체" 및 이들의 다른 문법적 등가물은 생체분자 (예컨대, 핵산 분자)의 부착에 적절하거나 적절하도록 변형될 수 있는 임의의 재료를 지칭한다.
본원에 사용된 바와 같이, 용어 "태그"는 추가적인 기능성 (예컨대, 고체 지지체에 대한 부착, 형광 시각화 등)을 제공하는 생체분자 (예컨대, 핵산 분자)의 임의의 화학적 변형을 지칭한다.
본원에 사용된 용어 "변이체"는 각자 참조 핵산 서열 또는 펩티드 서열과 서열이 상이하지만 참조 분자의 필수적인 생물학적 특성을 보유하는 핵산 서열 또는 펩티드 서열이다. 핵산 변이체의 서열 변화는 참조 핵산에 의해 코딩된 펩티드의 아미노산 서열을 변경하지 않을 수 있거나, 아미노산 치환, 첨가, 결실, 융합 및 절삭을 초래할 수 있다. 펩티드 변이체의 서열 변화는 전형적으로 제한적이거나 보존적이어서, 참조 펩티드 및 변이체의 서열은 전체적으로 매우 유사하고 많은 영역에서 동일하다. 변이체 및 참조 펩티드는 임의의 조합의 하나 이상의 치환, 첨가, 결실에 의해 아미노산 서열이 상이할 수 있다. 핵산 또는 펩티드의 변이체는 대립형질 변이체와 같이 자연적으로 발생할 수 있거나, 자연적으로 발생하는 것으로 알려지지 않은 변이체일 수 있다. 핵산 및 펩티드의 비-자연 발생 변이체는 돌연변이유발 기술 또는 직접 합성에 의해 제조될 수 있다.
"벡터"는 단리된 핵산을 포함하고 단리된 핵산을 세포 내부로 전달하는 데 사용될 수 있는 물질의 조성물이다. 선형 폴리뉴클레오티드, 이온성 또는 양친매성 화합물과 연관된 폴리뉴클레오티드, 플라스미드 및 바이러스를 비제한적으로 포함하는 수많은 벡터가 당업계에 알려져 있다. 따라서, 용어 "벡터"는 자율 복제 플라스미드 또는 바이러스를 포함한다. 용어는 또한 핵산의 세포로의 전달을 용이하게 하는 비-플라스미드 및 비-바이러스성 화합물, 예컨대, 예를 들어, 폴리리신 화합물 및 리포솜 등을 포함하는 것으로 해석되어야 한다. 바이러스 벡터의 예는 아데노바이러스 벡터, 아데노-연관 바이러스 벡터 및 레트로바이러스 벡터 등을 포함하나, 이에 제한되지 않는다.
범위: 본 개시내용 전반에 걸쳐, 본 발명의 다양한 양태가 범위 형식으로 제시될 수 있다. 범위 형식의 설명은 단지 편의 및 간결함을 위한 것이며 본 발명의 범주에 대한 융통성 없는 제한으로서 해석되어서는 안 된다는 것을 이해해야 한다. 따라서, 범위의 설명은 가능한 모든 하위범위뿐만 아니라 해당 범위 내의 개별 수치를 구체적으로 개시한 것으로 간주되어야 한다. 예를 들어, 범위, 예컨대, 1 내지 6의 설명은 하위범위, 예컨대, 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등뿐만 아니라 해당 범위 내의 개별 숫자, 예를 들어, 1, 2, 2.7, 3, 4, 5, 5.3 및 6을 구체적으로 개시한 것으로 간주되어야 한다. 이는 범위의 폭에 관계없이 적용된다.
설명
본 발명은 2 개 이상의 개별 RNA 분자를 효율적이고 안정적으로 결찰시켜, 단백질 및 융합 단백질을 코딩하는 더 큰 단일 RNA 분자를 생산하기 위한 조성물 및 방법을 제공한다. 발명은 관심 단백질 또는 융합 단백질을 코딩하는 단일 RNA 분자를 조립하기 위해 다중 RNA 분자의 리보자임-매개 트랜스-스플라이싱을 활용한다. 본 발명은 융합 단백질 및 키메라 단백질 등을 효율적으로 생산하는 데 사용될 수 있다. 게다가, 본 발명은 코딩 서열이 너무 커서 단일 벡터로 패키징될 수 없는 큰 전장 단백질을 생산하는 데 유용하다. 게다가, 본 발명의 기술은 또한 신규 단백질 조합 또는 라이브러리 서열을 생성하기 위한 승수 효과를 가질 수 있는 2 개의 상이한 서열의 빠르고 쉬운 조합을 허용한다. 이는 예를 들어, (나노바디와 같은) 합성 항체를 생성하거나 효소의 기능적 선택에 특히 유용할 수 있다.
본 발명은 또한 리보자임-플랭킹된 합성 인트론과 함께 하나 이상의 RNA 분자를 효율적으로 전달하기 위한 조성물 및 방법을 제공한다. 리보자임-플랭킹된 합성 인트론은 관심 단백질의 N-말단 부분을 코딩하는 제1 RNA 부분 및 관심 단백질의 C-말단 부분을 코딩하는 제2 RNA 부분 사이에 위치될 수 있다. 리보자임-플랭킹된 합성 인트론은 카고 서열, 예를 들어, 치료적 단백질을 코딩하거나 기능적 RNA를 포함하는 서열을 포함할 수 있다. 2 개의 리보자임의 사용은 시스-스플라이싱을 통해 다음의 3 개의 RNA 단편을 생성할 수 있다: 1) 관심 단백질의 N-말단 부분을 코딩하는 제1 RNA 부분, 2) 리보자임-플랭킹된 합성 인트론, 및 3) 관심 단백질의 C-말단 부분을 코딩하는 제2 RNA 부분. 상기 시스-스플라이싱은 결찰을 위한 양립가능한 단부를 생성한다. 시스-스플라이싱된 합성 인트론의 양립가능한 단부의 결찰은 선형 RNA 분자보다 분해에 보다 저항성인 원형 RNA 분자를 생성한다. 관심 단백질의 N-말단 부분을 코딩하는 제1 RNA 부분 및 관심 단백질의 C-말단 부분을 코딩하는 제2 RNA 부분의 양립가능한 단부의 결찰은 관심 전장 단백질을 코딩하는 RNA 분자를 생성한다. 관심 전장 단백질은 예를 들어, 치료적 단백질, CRISPR-Cas 단백질, 또는 리보자임-플랭킹된 합성 인트론을 포함하는 원형 RNA 분자에서 카고 서열의 전달 및 발현을 위한 프록시 지표를 제공하는 리포터 단백질일 수 있다.
일 양태에서, 본 발명은 2 개 이상의 RNA 분자를 코딩하는 하나 이상의 핵산 분자를 제공한다. 특정 실시양태에서, RNA 분자 중 하나 이상은 리보자임을 포함한다. 일 실시양태에서, RNA 분자 중 하나 이상은 코딩 영역 및 리보자임을 포함한다. 특정 실시양태에서, 리보자임은 RNA 분자에서 자기-절단하여, 코딩 영역을 남긴다. 본 발명의 맥락에서 사용될 수 있는 예시적인 리보자임은 해머헤드 (HH), 델타 간염 바이러스 (HDV), 바쿠드 위성(Varkud Satellite) (VS), 시스터, 트위스터-시스터, 헤어핀, 리보자임의 해쳇 및 피스톨 패밀리의 구성원을 포함하나, 이에 제한되지 않는다.
예를 들어, 일 실시양태에서, 조성물은 제1 RNA 분자를 코딩하는 핵산 분자를 포함하며, 여기서 제1 RNA 분자는 코딩 영역 및 3' 리보자임을 포함하고, 여기서 3' 리보자임은 RNA 분자에서 스스로를 촉매화할 수 있어, 3'P 또는 2'3' 사이클릭 포스페이트 (cP) 단부를 포함하는 코딩 영역을 남긴다. 일 실시양태에서, 3' 리보자임은 HDV 리보자임을 포함한다. 추가로, 일 실시양태에서, 조성물은 제2 RNA 분자를 코딩하는 핵산 분자를 포함하고, 여기서 제2 RNA 분자는 코딩 영역 및 5' 리보자임을 포함하고, 여기서 5' 리보자임은 RNA 분자에서 스스로를 촉매화할 수 있어, 5'OH 단부를 포함하는 코딩 영역을 남긴다. 일 실시양태에서, 5' 리보자임은 HH 리보자임을 포함한다. 특정 경우에, 리가아제는 제1 RNA 분자의 코딩 영역을 제2 RNA 분자의 코딩 영역에 함께 접합하여, 관심 단백질을 코딩하는 더 긴 RNA 분자를 형성한다.
예를 들어, 일 실시양태에서, 조성물은 제1 RNA 분자를 포함하며, 여기서 제1 RNA 분자는 코딩 영역 및 3' 리보자임을 포함하고, 여기서 3' 리보자임은 RNA 분자에서 스스로를 촉매화할 수 있어, 3'P 또는 2'3' 사이클릭 포스페이트 (cP) 단부를 포함하는 코딩 영역을 남긴다. 일 실시양태에서, 3' 리보자임은 HDV 리보자임을 포함한다. 추가로, 일 실시양태에서, 조성물은 제2 RNA 분자를 포함하며, 여기서 제2 RNA 분자는 코딩 영역 및 5' 리보자임을 포함하고, 여기서 5' 리보자임은 RNA 분자에서 스스로를 촉매화할 수 있어, 5'OH 단부를 포함하는 코딩 영역을 남긴다. 일 실시양태에서, 5' 리보자임은 HH 리보자임을 포함한다. 특정 경우에, 리가아제는 제1 RNA 분자의 코딩 영역을 제2 RNA 분자의 코딩 영역에 함께 접합하여 관심 단백질을 코딩하는 더 긴 RNA 분자를 형성한다.
특정 실시양태에서, 제1 RNA는 관심 단백질의 제1 부분을 코딩하는 코딩 영역을 포함하고, 제2 RNA는 관심 단백질의 제2 부분을 코딩하는 코딩 영역을 포함하고, 따라서 RNA 분자의 리보자임-매개 절단 및 리가아제-매개 조립은 제1 부분 및 제2 부분 둘 모두를 갖는 단백질을 코딩하는 RNA 분자의 생산을 초래한다. 본 발명은 각각이 전장 단백질의 일부를 코딩하는 코딩 영역을 포함하는 다중 RNA로부터 전장 단백질을 생산하는 데 사용될 수 있다. 추가로, 본 발명은 다중 도메인을 포함하는 융합 단백질을 생산하는 데 사용될 수 있으며, 여기서 각각의 RNA 분자는 융합 단백질의 도메인을 코딩하는 코딩 영역을 포함한다. 예를 들어, 본 발명은 리더 서열, N-말단 태그 또는 C-말단 태그를 코딩하는 코딩 서열을 포함하는 제1 RNA, 및 단백질을 코딩하는 코딩 서열을 포함하는 제2 RNA 분자로부터 RNA를 조립함으로써 리더 서열, N-말단 태그 또는 C-말단 태그 등을 갖는 단백질을 코딩하는 RNA 분자를 생성하는 데 사용될 수 있다.
특정 실시양태에서, 본 발명은 3 개 이상의 개별 RNA 분자로부터 단일 RNA 분자의 형성에 관한 것이다. 예를 들어, 특정 양태에서, 조성물은 제1 RNA 분자를 코딩하는 핵산 분자를 포함하고, 여기서 제1 RNA 분자는 단백질의 N-말단 영역을 코딩하는 코딩 영역; 단백질의 C-말단 영역을 코딩하는 코딩 영역을 포함하는 제2 RNA 분자를 코딩하는 핵산 분자; 및 단백질 도메인 (예컨대, 반복 도메인)을 코딩하는 코딩 영역을 각각 포함하는 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 핵산 분자를 포함한다. 일 실시양태에서, 제1 RNA 분자는 N-말단 영역을 코딩하는 코딩 영역 및 3' 리보자임을 포함하고, 여기서 3' 리보자임은 RNA 분자에서 스스로를 촉매화할 수 있어, 3'P 또는 2'3' 사이클릭 포스페이트 (cP) 단부를 포함하는 코딩 영역을 남긴다. 일 실시양태에서, 3' 리보자임은 HDV 리보자임을 포함한다. 일 실시양태에서, 제2 RNA 분자는 C-말단 영역을 코딩하는 코딩 영역 및 5' 리보자임을 포함하며, 여기서 5' 리보자임은 RNA 분자에서 스스로를 촉매화할 수 있어, 5'OH 단부를 포함하는 코딩 영역을 남긴다. 일 실시양태에서, 5' 리보자임은 HH 리보자임을 포함한다. 일 실시양태에서, 추가적인 RNA 분자는 각각 단백질 도메인을 코딩하는 코딩 영역, 3' 리보자임 및 5' 리보자임을 포함한다. 일 실시양태에서, 3' 리보자임은 HDV 리보자임이다. 일 실시양태에서, 5' 리보자임은 HH 리보자임이다. 특정 양태에서, 3' 리보자임은 RNA 분자에서 스스로를 촉매화할 수 있고, 5' 리보자임은 RNA 분자에서 스스로를 촉매화할 수 있어, 5'OH 및 3'P 또는 2'3' cP 단부를 포함하는 코딩 영역을 남긴다. 일 실시양태에서, 추가적인 RNA 분자는 각각 단백질 도메인을 코딩하는 코딩 영역, 5' 리보자임 및 3' 리보자임 인식 서열을 포함한다. 특정 양태에서, 5'리보자임은 RNA 분자에서 스스로를 촉매화할 수 있어, 5'OH 단부를 포함하는 코딩 영역을 남기며; 3'리보자임 인식 서열은 리보자임과 상호작용하여 RNA 분자 밖으로 3' 리보자임 인식 서열의 스플라이싱을 유도하여, 3'P 또는 2'3' cP 단부를 포함하는 코딩 영역을 남긴다. 일 실시양태에서, 3' 리보자임 인식 서열은 VS 리보자임과 상호작용하는 Vsv1 서열을 포함한다. 이 기술은 리보자임 (예컨대, VS 리보자임)을 순차적으로 제공하여 3' 리보자임 인식 서열과 상호작용하여 3'P 또는 2'3' cP 단부를 생성하고, 반복 도메인을 코딩하는 다른 코딩 영역의 5'OH 단부에 코딩 영역을 결찰시킴으로써 반복 도메인을 코딩하는 코딩 영역을 순차적으로 첨가함으로써 다중 반복 도메인을 포함하는 단백질을 코딩하는 RNA 분자를 생성하는 데 사용될 수 있다. 특정 양태에서, 반복 도메인의 순차적인 첨가는 N-말단 영역을 코딩하는 제1 RNA 분자가 기질 또는 지지체에 결합되는 고체 기질 또는 지지체 상에서 수행될 수 있다.
특정 양태에서, 다중 RNA 분자는 5'OH 및 3'P 또는 2'3'cP 단부의 리보자임-매개 생성 후에 함께 결찰된다. 일부 경우에, RNA 분자는 RNA 조립이 일어나는 천연 세포 또는 조직에 존재하는 내인성 리가아제에 의해 함께 결찰된다. 일부 경우에, 본 발명의 방법은 외인성 리가아제를 첨가하여 가공된 RNA 분자의 결찰을 함께 유도하는 단계를 포함한다. 일 실시양태에서, 리가아제는 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다.
조성물
일 실시양태에서, 본 발명은 하나 이상의 리보자임을 코딩하는 하나 이상의 핵산 분자를 포함하는 조성물에 관한 것이다. 일 실시양태에서, 본 발명은 하나 이상의 리보자임을 포함하는 하나 이상의 RNA 분자를 포함한다. 일부 실시양태에서, 하나 이상의 RNA 분자는 적어도 제1 RNA 분자 및 제2 RNA 분자를 포함한다.
일부 실시양태에서, 조성물의 상기 하나 이상의 리보자임은 상기 하나 이상의 RNA 분자로부터 자발적으로 시스-절단될 수 있다. 일부 실시양태에서, 상기 하나 이상의 리보자임은 3' 리보자임이다. 일부 실시양태에서, 상기 3' 리보자임은 자발적인 시스-절단 후 나머지 하나 이상의 RNA 분자에서 3'P 또는 2'3' cP 단부를 생성한다. 일부 실시양태에서, 상기 하나 이상의 리보자임은 5' 리보자임이다. 일부 실시양태에서, 상기 5' 리보자임은 자발적인 시스-절단 후에 나머지 하나 이상의 RNA 분자에 5'OH 단부를 생성한다. 일부 실시양태에서, 상기 3'P 또는 2'3' cP 단부 및 상기 5'OH 단부는 함께 결찰될 수 있다.
일부 실시양태에서, 상기 제1 RNA 분자는 3' 리보자임을 포함한다. 일부 실시양태에서, 상기 3' 리보자임은 해머헤드 (HH), 델타 간염 바이러스 (HDV), 바쿠드 위성 (VS), 트위스터 (Twst), 시스터, 트위스터-시스터 (TS), 헤어핀, 해쳇 및 피스톨, 또는 시스-절단 기능성을 유지하는 이의 변이체 또는 단편으로 이루어진 군으로부터 선택된 하나 이상의 패밀리로부터의 것이다. 일부 실시양태에서, 3' 리보자임은 하나 이상의 뉴클레오티드의 오버행을 포함한다. 일 실시양태에서, 오버행은 제1 RNA 분자 내에서 상기 3' 리보자임의 업스트림 서열에 혼성화하는 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 오버행은 자발적 시스-절단의 효율을 개선한다.
일부 실시양태에서, 상기 제2 RNA 분자는 5' 리보자임을 포함한다. 일부 실시양태에서, 상기 5' 리보자임은 해머헤드 (HH), 델타 간염 바이러스 (HDV), 바쿠드 위성 (VS), 트위스터 (Twst), 시스터, 트위스터-시스터 (TS), 헤어핀, 해쳇 및 피스톨, 또는 시스-절단 기능성을 유지하는 이의 변이체 또는 단편으로 이루어진 군으로부터 선택된 하나 이상의 패밀리로부터의 것이다. 일부 실시양태에서, 5' 리보자임은 하나 이상의 뉴클레오티드의 오버행을 포함한다. 일 실시양태에서, 오버행은 제2 RNA 분자 내에서 상기 5' 리보자임의 다운스트림 서열에 혼성화하는 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 오버행은 자발적 시스-절단의 효율을 개선한다.
일 실시양태에서, 조성물의 HDV 리보자임은 HDV, HDV68, HDV67, HDV56, genHDV, 및 항HDV, 또는 이의 변이체 또는 단편으로 이루어진 군으로부터 선택된 하나 이상을 포함한다. 일 실시양태에서, HDV68은 서열번호 9의 핵산 서열을 포함한다. 일 실시양태에서, HDV67은 서열번호 10의 핵산 서열을 포함한다. 일 실시양태에서, HDV56은 서열번호 11의 핵산 서열을 포함한다. 일 실시양태에서, genHDV는 서열번호 12의 핵산 서열을 포함한다. 일 실시양태에서, 항HDV는 서열번호 13의 핵산 서열을 포함한다.
일 실시양태에서, HH 리보자임은 상기 HH 리보자임의 업스트림 또는 다운스트림 서열의 뉴클레오티드와 혼성화하는 줄기 1 오버행에 하나 이상의 뉴클레오티드를 포함한다. 일 실시양태에서, 줄기 1 오버행의 뉴클레오티드의 수는 1 개 이상의 뉴클레오티드, 2 개 이상의 뉴클레오티드, 4 개 이상의 뉴클레오티드, 6 개 이상의 뉴클레오티드, 8 개 이상의 뉴클레오티드, 10 개 이상의 뉴클레오티드, 12 개 이상의 뉴클레오티드, 14 개 이상의 뉴클레오티드, 16 개 이상의 뉴클레오티드, 18 개 이상의 뉴클레오티드 또는 20 개 이상의 뉴클레오티드일 수 있다. 일 실시양태에서, 하나 이상의 뉴클레오티드 줄기 1 오버행을 포함하는 HH 리보자임은 서열번호 111, 서열번호 112, 서열번호 113, 서열번호 114, 서열번호 115, 서열번호 116, 서열번호 117 및 서열번호 118로 이루어진 군으로부터 선택된 핵산 서열을 포함하며, 여기서 N으로서 지정된 뉴클레오티드는 상기 HH 리보자임의 다운스트림 서열의 뉴클레오티드와 혼성화하는 뉴클레오티드에 상응한다. 일 실시양태에서, HH 리보자임은 줄기 3 오버행에 하나 이상의 뉴클레오티드를 갖는다. 일 실시양태에서, HH 리보자임은 5 개의 뉴클레오티드 줄기 3 오버행을 갖는다. 일 실시양태에서, HH 리보자임은 서열번호 105의 핵산 서열을 포함하며, 여기서 N으로서 지정된 뉴클레오티드는 상기 HH 리보자임의 업스트림 서열의 뉴클레오티드와 혼성화하는 뉴클레오티드에 상응한다. 일 실시양태에서, HH 리보자임은 줄기 2 루프에서 변형된다. 일 실시양태에서, 변형된 줄기 2 루프를 갖는 HH 리보자임은 서열번호 119, 서열번호 120, 서열번호 121, 서열번호 122, 서열번호 123 및 서열번호 124로 이루어진 군으로부터 선택된 핵산 서열을 포함하며, 여기서 N으로서 지정된 뉴클레오티드는 상기 HH 리보자임의 다운스트림 서열의 뉴클레오티드와 혼성화하는 뉴클레오티드에 상응한다. 일 실시양태에서, HH 리보자임은 삼차 안정화 모티프 (TSM)를 포함하도록 줄기 1에서 변형된다. 일 실시양태에서, HH 리보자임은 줄기 2 루프에서 변형되고, 줄기 1에서 변형되어, 삼차 안정화 모티프 (TSM)를 포함한다. 일 실시양태에서, 변형된 HH 리보자임은 HH 리보자임보다 더 효율적으로 시스-절단한다. 일 실시양태에서, 변형된 HH 리보자임은 RzB이다. 일 실시양태에서, RzB는 서열번호 125의 핵산 서열을 포함하며, 여기서 N으로서 지정된 뉴클레오티드는 상기 HH 리보자임의 다운스트림 서열의 뉴클레오티드와 혼성화하는 뉴클레오티드에 상응한다.
일 실시양태에서, 트위스터 리보자임은 서열번호 32의 핵산 서열을 포함한다. 일 실시양태에서, 트위스터 리보자임은 P1 줄기 오버행에 하나 이상의 뉴클레오티드를 포함한다. 일 실시양태에서, P1 줄기 오버행의 뉴클레오티드의 수는 하나 이상, 2 개 이상, 3 개 이상, 4 개 이상 또는 5 개 이상일 수 있다. 일 실시양태에서, 하나 이상의 뉴클레오티드 P1 줄기 오버행을 포함하는 트위스터 리보자임은 서열번호 106, 서열번호 107, 서열번호 108, 서열번호 109 및 서열번호 110으로 이루어진 군으로부터 선택된 핵산 서열을 포함하며, 여기서 N으로서 지정된 뉴클레오티드는 상기 트위스터 리보자임의 다운스트림 서열의 뉴클레오티드와 혼성화하는 뉴클레오티드에 상응한다.
일부 실시양태에서, 조성물의 상기 하나 이상의 리보자임은 제1 부분 및 제2 부분으로 구성된다. 일부 실시양태에서, 제1 부분은 상기 하나 이상의 RNA 분자에 통합된다. 일부 실시양태에서, 제1 부분은 리보자임 인식 서열이다. 일부 실시양태에서, 상기 제2 부분은 별도로 도입된다. 일부 실시양태에서, 상기 하나 이상의 RNA 분자로부터의 제1 부분의 시스-절단은 제1 부분 및 제2 부분이 서로 접촉되는 경우에만 발생한다. 일부 실시양태에서, 상기 하나 이상의 리보자임은 VS 리보자임이다. 일 실시양태에서, 상기 VS 리보자임은 서열번호 14의 핵산 서열을 포함한다. 일 실시양태에서, 상기 제1 부분은 VS 리보자임 줄기 루프 (VS-S)이다. 일 실시양태에서, VS-S는 서열번호 15의 핵산 서열을 포함한다. 일 실시양태에서, 상기 제2 부분은 줄기 루프가 없는 VS의 나머지 부분 (VS-Rz)이다. 일 실시양태에서, VS-Rz는 서열번호 16의 핵산 서열을 포함한다.
리보자임은 본원에 기재된 바와 같이, 고유한 RNA 3' 및 5' 말단을 생산하기 위해 시스로 절단하는 자가촉매 RNA이다. 그러나, 시스-절단 리보자임은 표적 RNA가 뉴클레오티드 특이적 방식으로 절단되어 유사한 RNA 말단을 생성할 수 있도록 트랜스로 절단하도록 조작될 수 있다. 일부 실시양태에서, 본 발명은 트랜스-절단 조작된 리보자임을 포함하는 단일 RNA 분자를 코딩하는 단일 핵산 분자를 포함하는 조성물을 포함한다. 일 실시양태에서, 상기 트랜스-절단 조작된 리보자임은 별개의 RNA 분자를 트랜스-절단할 수 있다. 일 실시양태에서, 상기 트랜스-절단 조작된 리보자임은 별개의 RNA 분자의 특이적 핵산 서열을 인식한다. 일부 실시양태에서, 트랜스-절단 조작된 리보자임은 결실에 대한 질환 유발 돌연변이를 표적화한다. 일부 실시양태에서, 질환 유발 돌연변이는 엑손에 있다. 일부 실시양태에서, 질환 유발 돌연변이는 인트론에 있다. 일부 실시양태에서, 조성물은 질환 유발 돌연변이의 업스트림 및 다운스트림을 표적화하는 2 개의 트랜스-절단 조작된 리보자임을 포함한다. 일부 실시양태에서, 질환 유발 돌연변이의 업스트림 및 다운스트림에서의 트랜스-절단은 질환 유발 돌연변이의 제거를 초래한다. 일부 실시양태에서, 유전자의 나머지 부분은 질환 유발 돌연변이의 트랜스-절단 후에 함께 트랜스-스플라이싱된다. 일부 실시양태에서, 트랜스-스플라이싱된 유전자는 기능적 단백질로서 발현된다.
본원에 기재된 바와 같이, 리보자임-매개 절단을 거친 RNA 분자의 3'P 또는 2'3' cP 단부 및 5'OH 단부는 함께 결찰될 수 있다. 이와 같이, 더 큰 전장 단백질의 별개의 부분을 코딩하는 분리된 RNA 서열은 전장 단백질의 발현을 가능하게 하기 위해 스카-리스 방식으로 함께 트랜스-스플라이싱될 수 있다. 일 실시양태에서, 본 발명은 관심 단백질의 2 개 이상의 부분을 코딩하고 하나 이상의 리보자임을 코딩하는 하나 이상의 핵산 분자를 포함하는 조성물에 관한 것이다. 일 실시양태에서, 본 발명은 관심 단백질의 2 개 이상의 부분을 코딩하고 하나 이상의 리보자임을 포함하는 하나 이상의 RNA 분자를 포함하는 조성물에 관한 것이다.
일 실시양태에서, 관심 단백질의 2 개 이상의 부분을 코딩하는 상기 하나 이상의 핵산 분자는 관심 단백질의 제1 부분을 코딩하는 제1 핵산 분자 및 관심 단백질의 제2 부분을 코딩하는 제2 핵산 분자를 포함한다. 일 실시양태에서, 상기 제1 핵산은 제1 RNA 분자를 포함한다. 일 실시양태에서, 상기 제2 핵산은 제2 RNA 분자를 포함한다. 일 실시양태에서, 제1 RNA 분자는 3' 단부에서 3' 리보자임에 연결된다. 일 실시양태에서, 제2 RNA 분자는 5' 단부에서 5' 리보자임에 연결된다. 일 실시양태에서, 3' 및 5' 리보자임 서열의 시스-절단 시, 제1 RNA 분자의 3'P 또는 2'3' cP 단부가 제2 RNA 분자의 5'OH 단부에 결찰됨으로써, 관심 전장 단백질을 코딩하는 단일 RNA 분자를 생성한다. 일 실시양태에서, 관심 전장 단백질은 동일한 서열의 내인성으로 발현된 전장 단백질과 동일하게 기능한다.
일 실시양태에서, 관심 전장 단백질은 치료적 단백질을 포함한다. 일 실시양태에서, 치료적 단백질은 유트로핀, 디스트로핀, 디스펠린, 마이오펠린, 낭포성 섬유증 막관통 전도도 조절인자 (CFTR), 응고 인자 VIII, 피브로시스틴, 망막-특이적 인지질-수송 ATPase (ABCA4), 오토펠린, 구리-수송 ATPase 2, MYO7A, MYO15A, CDH23, STRC, OTOG, TECTA, PCDH15, TRIOBP, MYO3A, COL11A2, LOXHD1, PTPRQ, OTOGL, MYH14, MYH9, TNC, CACNA1A, CACNA1C, CACNA1F, CACNA1H, CACNA1G, CACNA1D, CACNA1B, CACNA1S, CACNA1I, CACNA1E, ATP2A1, ATP2A2, Adcy6, FKBP12-라파마이신-결합 도메인 및 Cas9로 이루어진 군으로부터 선택된 하나 이상을 포함하나, 이에 제한되지 않는다. 일 실시양태에서, 관심 전장 단백질은 재조합효소이다. 일 실시양태에서, 재조합효소는 CRE 재조합효소, FLP 재조합효소로 이루어진 군으로부터 선택된 하나 이상이지만, 이에 제한되지 않는다. 일 실시양태에서, 관심 전장 단백질은 진핵생물/원핵생물 항생제 저항성 유전자 생성물이다. 일 실시양태에서, 진핵생물/원핵생물 항생제 저항성 유전자 생성물은 암피실린, 카나마이신, 블라스티시딘, 퓨로마이신, 네오마이신 및 하이그로마이신으로 이루어진 군으로부터 선택된 하나 이상이지만, 이에 제한되지 않는다. 특정 실시양태에서, 관심 전장 단백질은 항체이다. 일 실시양태에서, 항체는 관심 표적 단백질에 결합할 수 있다. 일부 실시양태에서, 항체는 표적 단백질에 결합하는 능력을 유지하는 항체 단편, 합성 항체, 나노바디, 또는 이의 단편 또는 변이체이다. 일 실시양태에서, 관심 전장 단백질은 하이드로겔, 합성 거미줄 및 콜라겐을 구성하는 것들을 비제한적으로 포함하는 합성 반복 단백질을 포함한다. 일 실시양태에서, 합성 반복 단백질은 스피드로인, 실크, 케라틴, 콜라겐, 엘라스틴, 레실린, 및 오징어 고리 이빨(Squid Ring Teeth), 베타-솔레노이드 단백질, 아연 핑거 뉴클레아제 (ZFN, 및 Tal 이펙터 뉴클레아제 (TALEN)로 이루어진 군으로부터 선택된 하나 이상을 포함하나, 이에 제한되지 않는다. 일 실시양태에서, 관심 전장 단백질은 포유동물 패킹 세포에서 렌티바이러스 입자의 생성을 억제할 수 있는 독성 단백질 또는 항바이러스 단백질을 포함한다. 일 실시양태에서, 독성 단백질은 세포 자살 유전자이다. 일 실시양태에서, 세포 자살 유전자는 디프테리아 독소 A (DTA), HSV-tk, 리신, 콜레라 독소, 주요 프리온 단백질, 백일해 독소, 엑타토민, 코노펩티드, 아브린, 베로톡신, 테타노스파스민, 보툴리눔 독소, 슈도모나스 외독소 A, 탄저병, 사포린 및 포케위드 항바이러스 단백질 (PAP)로 이루어진 군으로부터 선택된 하나 이상을 포함하나, 이에 제한되지 않는다. 일 실시양태에서, 항바이러스 단백질은 인터페론-유도된 GTP-결합 단백질 (MxA), 미엘로페록시다제 (MPO) 및 인터페론으로 이루어진 군으로부터 선택된 하나 이상을 포함하나, 이에 제한되지 않는다.
관심 단백질의 일부를 코딩하는 N-말단 또는 C-말단 RNA 분자는 리보자임-매개 절단 전에 번역될 수 있거나, 별도로 발현될 때, 잠재적으로 원치 않은 또는 절삭된 단백질 발현을 초래할 수 있다. 그러나, 단백질 분해 서열의 번역 제어는 이러한 원치 않은 발현을 제한하는 데 활용될 수 있다. 일 실시양태에서, 조성물의 상기 하나 이상의 RNA 분자는 단백질 분해 서열의 번역 제어를 코딩하는 핵산 서열을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 단백질 분해 서열의 번역 제어를 코딩하는 핵산 서열을 포함한다. 일 실시양태에서, 상기 제2 RNA 분자는 단백질 분해 서열의 번역 제어를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 단백질 분해 서열의 상기 번역 제어는 리보자임 서열의 절단 및 스플라이싱 전에 단백질의 부분적 발현을 방지한다. 일부 실시양태에서, 단백질 분해 서열의 번역 제어는 hCL1-PEST 서열, E1A-PEST 서열, 핵산의 폴리(A) 서열의 제거, 폴리 K 꼬리를 생성하기 위해 폴리 A 꼬리를 통한 시뮬레이션된 번역, ATG 정지 코돈의 결실, N-말단 NTG 코돈 내의 침묵 돌연변이, 번역 억제제로서 기능하는 4 개의 작은 업스트림 ORF를 코딩하는 효모 GCN4 서열의 5' UTR, 효모 GCN4 서열의 5' UTR의 작은 내부 단편으로 이루어진 군으로부터 선택된 하나 이상을 포함한다. 일부 실시양태에서, 단백질 분해 서열의 번역 제어는 서열번호 43, 서열번호 44, 서열번호 45, 서열번호 46, 서열번호 47, 서열번호 48, 서열번호 49, 서열번호 77, 서열번호 79, 및 서열번호 104로 이루어진 군으로부터 선택된 하나 이상의 핵산 서열을 포함한다. 일부 실시양태에서, 단백질 분해 서열의 번역 제어는 서열번호 52, 서열번호 53, 서열번호 54, 서열번호 55, 서열번호 56, 서열번호 57, 서열번호 58, 서열번호 59, 서열번호 60, 서열번호 61, 서열번호 62, 서열번호 63, 서열번호 64, 서열번호 65, 서열번호 66, 서열번호 67, 서열번호 68, 서열번호 69, 서열번호 70, 서열번호 71, 서열번호 72, 서열번호 73, 서열번호 74, 서열번호 76, 서열번호 78 및 서열번호 80으로 이루어진 군으로부터 선택된 하나 이상의 아미노산 서열을 포함한다.
특정 양태에서, 원치 않은 또는 절삭된 단백질 발현을 추가로 방지하기 위해, RNA 핵 국소화 신호는 스플라이싱되지 않은 RNA 분자의 사이토졸 유출 및 번역을 방지하는 데 유용할 수 있다. 일 실시양태에서, 조성물의 상기 하나 이상의 RNA 분자는 RNA 핵 국소화 서열을 코딩하는 핵산 서열을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 RNA 핵 국소화 서열을 코딩하는 핵산 서열을 포함한다. 일 실시양태에서, 상기 제2 RNA 분자는 RNA 핵 국소화 서열을 코딩하는 핵산 서열을 포함한다. 일 실시양태에서, 상기 RNA 핵 국소화 서열은 리보자임 서열의 절단 및 스플라이싱 전에 사이토졸 RNA 유출 및 부분 단백질의 번역을 방지한다. 일 실시양태에서, RNA 핵 국소화 서열은 서열번호 50 및 서열번호 51로 이루어진 군으로부터 선택된 하나 이상의 핵산 서열을 포함한다.
일부 실시양태에서, 조성물은 하나 이상의 추가적인 RNA 분자를 추가로 포함하고, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임을 포함한다. 일부 실시양태에서, 시스템은 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 추가로 포함하고, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임을 포함한다.
일부 실시양태에서, 조성물은 하나 이상의 추가적인 RNA 분자를 추가로 포함하고, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함한다. 일부 실시양태에서, 시스템은 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 추가로 포함하고, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함한다.
스플라이소솜에 의한 프리-mRNA 스플라이싱은 번역의 선구자 라운드를 촉진하는 인자의 침착을 통해 또는 RNA 가공 및 세포질로의 유출을 촉진하는 것을 통해 mRNA 번역을 향상시키는 것으로 나타났다. 트랜스진 내의 키메라 시스-스플라이싱 인트론의 첨가는 또한 트랜스진 단백질 발현을 촉진하는 것으로 나타났다. 따라서, 특정 실시양태에서, 스플라이소솜에 의해 인식되고 시스-스플라이싱된 스플라이스 공여자 및 스플라이스 수용자 부위의 첨가는 분할 전구체 RNA 분자로부터의 단백질 발현을 향상시킬 수 있다. 일 실시양태에서, 조성물은 스플라이스 공여자 또는 스플라이스 수용자 서열을 포함하는 하나 이상의 RNA 분자를 포함한다. 일 실시양태에서, 조성물의 상기 제1 RNA 분자는 스플라이스 공여자 서열을 포함한다. 일 실시양태에서, 상기 스플라이스 공여자 서열은 리보자임 서열 다음에 오는 제1 RNA 분자의 3' 단부에 연결된다. 일 실시양태에서, 조성물의 상기 제2 RNA 분자는 스플라이스 수용자 서열을 포함한다. 일 실시양태에서, 상기 스플라이스 수용자 서열은 리보자임 서열 전에 제2 RNA 분자의 5' 단부에 연결된다. 일 실시양태에서, 스플라이스 공여자 및 스플라이스 수용자 서열의 포함은 리보자임-매개 트랜스-스플라이싱 후 단백질 발현을 향상시킨다.
단백질이 번역되는 3 개의 오픈 리딩 프레임으로 인한 리보자임 매개된 트랜스-스플라이싱 및 다중 상이한 기능적 단백질의 발현이 또한 동시에 가능할 수 있다. 이 특징을 활용함으로써, 상이한 3 개의 양립할 수 없는 오픈 리딩 프레임에 있는 RNA의 트랜스-스플라이싱을 사용하여 기능적 단백질을 생성할 수 있다. 일 실시양태에서, 본 발명의 조성물은 2 개 이상의 핵산 분자 쌍을 포함하는 4 개 이상의 핵산 분자를 포함한다. 일 실시양태에서, 핵산 분자의 각각의 쌍은 관심 단백질의 2 개 이상의 부분을 코딩하고 2 개 이상의 리보자임을 코딩한다. 일 실시양태에서, 조성물은 2 개 이상의 RNA 분자 쌍을 포함하는 4 개 이상의 RNA 분자를 포함한다. 일 실시양태에서, RNA 분자의 각각의 쌍은 관심 단백질의 2 개 이상의 부분을 코딩하고, 2 개 이상의 리보자임을 포함한다.
일 실시양태에서, 상기 2 개 이상의 RNA 분자 쌍은 RNA 분자의 제1 쌍 및 RNA 분자의 제2 쌍을 포함한다. 일 실시양태에서, RNA 분자의 제1 쌍은 제1 RNA 분자 및 제2 RNA 분자를 포함한다. 일 실시양태에서, RNA 분자의 제2 쌍은 제3 RNA 분자 및 제4 RNA 분자를 포함한다. 일부 실시양태에서, 상기 제3 RNA 분자 및 상기 제4 RNA 분자는 제1 RNA 분자 및 제2 RNA 분자와 상이한 오픈 리딩 프레임을 갖고, 이에 따라, 자발적 시스-절단 시, 제1 RNA 분자 또는 제2 RNA 분자의 제3 RNA 분자 또는 제4 RNA 분자와의 결찰은 전장 기능적 단백질 생성물을 번역할 수 없다.
일 실시양태에서, 상기 2 개 이상의 RNA 분자 쌍은 RNA 분자의 제3 쌍을 추가로 포함한다. 일 실시양태에서, RNA 분자의 제3 쌍은 제5 RNA 분자 및 제6 RNA 분자를 포함한다. 일부 실시양태에서, 상기 제5 RNA 분자 및 상기 제6 RNA 분자는 RNA 분자의 제1 쌍 및 RNA 분자의 제2 쌍이 상이한 오픈 리딩 프레임을 가지며, 이에 따라, 자발적 시스-절단 시, RNA 분자의 제1 쌍, 제2 쌍 또는 제3 쌍의 결찰만이 전장 기능적 단백질 생성물을 번역할 수 있다.
2 개의 독립적인 RNA 사이의 리보자임-매개 트랜스-스플라이싱은 본원에 기재된 바와 같이 하나의 RNA가 3' 리보자임을 함유하고 다른 RNA가 5' 리보자임을 함유할 때 발생할 수 있다. 그러나, 동일한 RNA 분자 내에서 시스로 전사될 때, 2 개의 리보자임이 자체적으로 스카-리스 제거를 매개할 수 있다. 이 접근법은 유사하게 3'-P 및 5' OH 말단을 포함하는 2 개의 독립적인 RNA를 생성하며, 이는 세포에서 트랜스-스플라이싱 및 번역의 대상이 될 수 있다. 상기 3' 및 5' 리보자임 사이의 카고 서열의 포함은 또한 결찰 시 원형화된 RNA 분자를 생성할 가능성을 생산한다.
일 실시양태에서, 본 발명은 관심 단백질의 2 개 이상의 부분을 코딩하고 하나 이상의 리보자임을 코딩하는 단일 핵산 분자를 포함하는 조성물에 관한 것이다. 일 실시양태에서, 본 발명은 관심 단백질의 2 개 이상의 부분을 코딩하고 하나 이상의 리보자임을 포함하는 단일 RNA 분자를 포함하는 조성물에 관한 것이다.
일 실시양태에서, 상기 단일 핵산 분자는 RNA의 제1 부분, 합성 인트론 및 RNA의 제2 부분을 코딩한다. 일 실시양태에서, 합성 인트론은 5' 리보자임 및 3' 리보자임을 포함한다. 일 실시양태에서, RNA의 상기 제1 부분은 관심 단백질의 제1 부분을 코딩한다. 일 실시양태에서, RNA의 상기 제2 부분은 관심 단백질의 제2 부분을 코딩한다. 일 실시양태에서, 상기 단일 핵산은 다음의 순서로 연결된 서열을 포함한다: (관심 단백질의 제1 부분을 코딩하는 RNA의 제1 부분)-(합성 인트론의 5' 리보자임)-(합성 인트론의 3' 리보자임)-(관심 단백질의 제2 부분을 코딩하는 RNA의 제2 부분). 일 실시양태에서, 관심 단백질의 상기 제1 부분은 GFP의 N-말단 부분이다. 일 실시양태에서, 합성 인트론의 5' 리보자임은 HDV를 포함한다. 일 실시양태에서, RNA의 제1 부분 및 합성 인트론의 5' 리보자임은 서열번호 127의 핵산 서열을 포함하고, 여기서 소문자는 5' 리보자임 서열을 지정하고 대문자는 GFP의 N-말단 부분을 코딩하는 서열을 지정한다 (실시예 4, "카고가 있거나 없는 내부 합성 리보자임 인트론을 포함하는 GFP" 참고). 일 실시양태에서, 관심 단백질의 상기 제2 부분은 GFP의 C-말단 부분이다. 일 실시양태에서, 합성 인트론의 상기 3' 리보자임은 HH를 포함한다. 일 실시양태에서, RNA의 제2 부분 및 합성 인트론의 3' 리보자임은 서열번호 128의 핵산 서열을 포함하고, 여기서 소문자는 3' 리보자임 서열을 지정하고 대문자는 GFP의 C-말단 부분을 코딩하는 서열을 지정한다 (실시예 4, "카고가 있거나 없는 내부 합성 리보자임 인트론을 포함하는 GFP" 참고).
일 실시양태에서, 상기 합성 인트론은 상기 5' 리보자임 및 상기 3' 리보자임 사이에 위치한 카고 서열을 포함한다. 일 실시양태에서, 상기 단일 핵산은 다음의 순서로 연결된 서열을 포함한다: (관심 단백질의 제1 부분을 코딩하는 RNA의 제1 부분)-(합성 인트론의 5' 리보자임)-(카고 서열)-(합성 인트론의 3' 리보자임)-(관심 단백질의 제2 부분을 코딩하는 RNA의 제2 부분).
일 실시양태에서, 합성 인트론의 5' 리보자임 서열은 활성을 위해 양측 플랭킹 서열을 필요로 하지 않는다. 일 실시양태에서, 활성을 위해 양측 플랭킹 서열을 필요로 하지 않는 5' 리보자임 서열을 포함하는 합성 인트론의 단부의 결찰로부터 생성된 원형 RNA는 원형 및 재-절단된 선형 형태 둘 모두로 존재할 수 있다. 일 실시양태에서, 상기 리보자임 서열은 HDV 리보자임이다.
일 실시양태에서, 합성 인트론의 5' 리보자임 서열은 활성을 위해 양측 플랭킹 서열을 필요로 한다. 일 실시양태에서, 활성을 위해 양측 플랭킹 서열을 필요로 하는 5' 리보자임 서열을 포함하는 합성 인트론의 단부의 결찰로부터 생성된 원형 RNA는 원형 형태로만 존재할 수 있다. 일 실시양태에서, 상기 리보자임 서열은 HH 리보자임이다.
일 실시양태에서, 합성 인트론의 5' 리보자임 서열은 리보자임 인식 서열이다. 일 실시양태에서, 리보자임 인식 서열은 유도성 절단을 위해 트랜스-절단 리보자임의 첨가를 필요로 한다. 일 실시양태에서, 상기 리보자임 인식 서열은 VS-S를 포함한다. 일부 실시양태에서, VS-S는 서열번호 15를 포함하는 핵산 서열에 의해 코딩된다. 일 실시양태에서, 상기 트랜스-절단 리보자임은 VS-Rz를 포함한다. 일부 실시양태에서, VS-Rz는 서열번호 16을 포함하는 핵산 서열에 의해 코딩된다.
일 실시양태에서, 5' 리보자임 서열 및 3' 리보자임 서열의 자기-절단은 다음의 3 개의 별개의 RNA 분자를 생성한다: 1) 관심 단백질의 제1 부분을 코딩하는 RNA의 제1 부분을 포함하는 제1 단편, 2) 합성 인트론을 포함하는 제2 단편, 3) 관심 단백질의 제2 부분을 코딩하는 RNA의 제2 부분을 포함하는 제3 단편. 일 실시양태에서, 제2 단편의 양립가능한 단부가 결찰되어, 카고 서열을 포함하는 합성 인트론을 포함하는 원형 RNA 분자를 생성한다. 실시양태에서, 제1 단편 및 제3 단편은 함께 결찰되어, 단일 전장 선형 RNA 분자를 생성한다.
일 실시양태에서, 합성 인트론의 카고 서열은 관심 치료적 단백질을 코딩하는 서열, CRISPR 가이드 RNA 서열, 작은 RNA 서열 및 트랜스-절단 리보자임 서열로 이루어진 군으로부터 선택된 하나 이상이다. 일 실시양태에서, 상기 작은 RNA 서열은 마이크로RNA (miRNA), Piwi-상호작용 RNA (piRNA), 작은 간섭 RNA (siRNA), 작은 핵소체 RNA (snoRNA), 작은 tRNA-유래 RNA (tsRNA), 작은 rDNA-유래 RNA (srRNA) 및 작은 핵 RNA (snRNA)로 이루어진 군으로부터 선택된 하나 이상을 포함한다.
일 실시양태에서, 단일 전장 선형 RNA 분자는 관심 전장 단백질을 코딩한다. 일 실시양태에서, 관심 전장 단백질은 치료적 단백질이다. 일 실시양태에서, 치료적 단백질은 유트로핀, 디스트로핀, 디스펠린, 마이오펠린, 낭포성 섬유증 막관통 전도도 조절인자 (CFTR), 응고 인자 VIII, 피브로시스틴, 망막-특이적 인지질-수송 ATPase (ABCA4), 오토펠린, 구리-수송 ATPase 2, MYO7A, MYO15A, CDH23, STRC, OTOG, TECTA, PCDH15, TRIOBP, MYO3A, COL11A2, LOXHD1, PTPRQ, OTOGL, MYH14, MYH9, TNC, CACNA1A, CACNA1C, CACNA1F, CACNA1H, CACNA1G, CACNA1D, CACNA1B, CACNA1S, CACNA1I, CACNA1E, ATP2A1, ATP2A2, Adcy6, FKBP12-라파마이신-결합 도메인 및 Cas9로 이루어진 군으로부터 선택된 하나 이상일 수 있지만, 이에 제한되지 않는다. 일 실시양태에서, 관심 전장 단백질은 재조합효소이다. 일 실시양태에서, 재조합효소는 CRE 재조합효소, FLP 재조합효소로 이루어진 군으로부터 선택된 하나 이상이지만, 이에 제한되지 않는다. 일 실시양태에서, 관심 전장 단백질은 진핵생물/원핵생물 항생제 저항성 유전자 생성물이다. 일 실시양태에서, 진핵생물/원핵생물 항생제 저항성 유전자 생성물은 암피실린, 카나마이신, 블라스티시딘, 퓨로마이신, 네오마이신 및 하이그로마이신으로 이루어진 군으로부터 선택된 하나 이상이지만, 이에 제한되지는 않는다. 일 실시양태에서, 관심 전장 단백질은 리포터 단백질이다. 일 실시양태에서, 리포터 단백질은 녹색 형광 단백질 (GFP), 적색 형광 단백질 (RFP) 및 루시퍼라제 (Luc)로 이루어진 군으로부터 선택된 하나 이상이다. 일 실시양태에서, 리포터 단백질은 카고 서열의 전달 및 발현을 판정하기 위한 프록시 지표로서 사용된다. 특정 실시양태에서, 관심 전장 단백질은 항체이다. 일 실시양태에서, 항체는 관심 표적 단백질에 결합할 수 있다. 일부 실시양태에서, 항체는 표적 단백질에 결합하는 능력을 유지하는 항체 단편, 합성 항체, 나노바디, 또는 이의 단편 또는 변이체이다.
특정 양태에서, 본 발명의 기술은 전장 RNA 바이러스 게놈을 조립하는 데 사용될 수 있다. 일 실시양태에서, 본 발명의 하나 이상의 리보자임을 코딩하는 상기 하나 이상의 핵산 분자는 RNA 바이러스 게놈의 하나 이상의 부분을 코딩한다. 일 실시양태에서, 본 발명의 하나 이상의 리보자임을 포함하는 상기 하나 이상의 RNA 분자는 RNA 바이러스 게놈의 하나 이상의 부분을 포함한다.
일 실시양태에서, 상기 하나 이상의 핵산 분자는 RNA 바이러스 게놈의 제1 부분을 코딩하고 3' 리보자임을 코딩하는 제1 핵산 분자를 포함한다. 일 실시양태에서, 상기 하나 이상의 핵산 분자는 RNA 바이러스 게놈의 제2 부분을 코딩하고 5' 리보자임을 코딩하는 제2 핵산을 포함한다. 일 실시양태에서, 상기 하나 이상의 RNA 분자는 RNA 바이러스 게놈의 제1 부분 및 3' 리보자임을 포함하는 제1 RNA 분자를 포함한다. 일 실시양태에서, 상기 하나 이상의 RNA 분자는 RNA 바이러스 게놈의 제2 부분 및 5' 리보자임을 포함하는 제2 RNA 분자를 포함한다. 일 실시양태에서, 조성물은 리가아제를 코딩하는 핵산 또는 리가아제를 포함한다. 일 실시양태에서, 3' 및 5' 리보자임의 시스-절단 시, RNA 바이러스 게놈의 제1 부분 및 RNA 바이러스 게놈의 제2 부분이 함께 결찰되어, 전장 RNA 바이러스 게놈을 생성한다. 예시적인 RNA 바이러스는 코로나바이러스, 파라믹소바이러스, 오르토믹소바이러스, 레트로바이러스, 렌티바이러스, 알파바이러스, 플라비바이러스, 랍도바이러스, 홍역 바이러스, 뉴캐슬 질환 바이러스 및 피코르나바이러스를 포함하나, 이에 제한되지 않는다.
일부 실시양태에서, 본 발명은 리가아제를 코딩하는 핵산을 포함하는 조성물을 포함한다. 일부 실시양태에서, 리가아제는 3'P 또는 2'3' cP 단부 및 5'OH 단부의 결찰을 매개한다. 일부 실시양태에서, 리가아제는 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다. 일부 실시양태에서, RtcB 리가아제는 진핵생물, 박테리아 및 고세균으로 이루어진 군으로부터 선택된 유기체의 하나 이상의 도메인으로부터 유래한다. 일부 실시양태에서, 유기체는 인간, 대장균, 데이노코커스 라디오듀란스, 파이로코커스 호리코시이, 파이로코커스 종 ST04, 및 써모코커스 종 EP로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 리가아제를 코딩하는 핵산 서열은 서열번호 82, 서열번호 84, 서열번호 86, 서열번호 88, 서열번호 90, 서열번호 92로 이루어진 군으로부터 선택된 하나 이상이다. 일부 실시양태에서, 리가아제를 코딩하는 핵산 서열은 서열번호 81, 서열번호 83, 서열번호 85, 서열번호 87, 서열번호 89, 서열번호 91로 이루어진 군으로부터 선택된 하나 이상의 아미노산 서열을 코딩한다.
핵산
일부 실시양태에서, 본 발명의 하나 이상의 핵산은 본원에 기재된 핵산 서열과 실질적으로 상동인 핵산 서열을 포함한다. 예를 들어, 일부 실시양태에서, 핵산은 원래의 핵산 서열에 대해 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상 또는 99.5% 이상의 동일성의 정도를 갖는다.
일부 실시양태에서, 본 발명의 하나 이상의 핵산은 본원에 기재된 핵산 서열의 일부인 핵산 서열을 포함한다. 예를 들어, 일부 실시양태에서, 핵산은 원래의 핵산 서열에 대해 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상 또는 99.5% 이상의 길이를 갖는다.
일부 실시양태에서, 본 발명의 하나 이상의 핵산은 본원에 기재된 핵산 서열의 일부이고 본원에 기재된 핵산 서열과 실질적으로 상동인 핵산 서열을 포함한다. 예를 들어, 일부 실시양태에서, 핵산은 원래의 핵산 서열에 대해 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상 또는 99.5% 이상의 동일성의 정도를 갖고/갖거나 원래의 핵산 서열에 대해 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상 또는 99.5% 이상의 길이를 갖는다.
본 발명의 핵산은 DNA 및 RNA를 비제한적으로 포함하는 임의의 유형의 핵산을 포함할 수 있다. 예를 들어, 일 실시양태에서, 조성물은 예를 들어, 발명의 융합 단백질을 코딩하는 단리된 cDNA 분자를 포함하는 단리된 DNA 분자를 포함한다. 일 실시양태에서, 조성물은 발명의 융합 단백질 또는 이의 기능적 단편을 코딩하는 단리된 RNA 분자를 포함한다.
본 발명의 핵산 분자는 세포 배양을 위한 혈청 또는 성장 배지에서 안정성을 개선하도록 변형될 수 있다. 안정성, 기능성 및/또는 특이성을 향상시키고 발명의 핵산 분자의 면역자극 특성을 최소화하기 위해 변형이 첨가될 수 있다. 예를 들어, 안정성을 향상시키기 위해, 3'-잔기는 분해에 대해 안정화될 수 있으며, 예컨대, 이들은 퓨린 뉴클레오티드, 특히 아데노신 또는 구아노신 뉴클레오티드로 이루어지도록 선택될 수 있다. 대안적으로, 변형된 유사체에 의한 피리미딘 뉴클레오티드의 치환, 예컨대, 2'-데옥시티미딘에 의한 우리딘의 치환은 용인되며 분자의 기능에 영향을 미치지 않는다.
본 발명의 일 실시양태에서, 핵산 분자는 하나 이상의 변형된 뉴클레오티드 유사체를 함유할 수 있다. 예를 들어, 단부는 변형된 뉴클레오티드 유사체를 통합함으로써 안정화될 수 있다.
뉴클레오티드 유사체의 비-제한적인 예는 당- 및/또는 백본-변형된 리보뉴클레오티드를 포함한다 (즉, 포스페이트-당 백본에 대한 변형을 포함함). 예를 들어, 자연 RNA의 포스포디에스테르 연결은 질소 또는 황 헤테로원자 중 하나 이상을 포함하도록 변형될 수 있다. 예시적인 백본-변형된 리보뉴클레오티드에서, 인접한 리보뉴클레오티드에 연접되는 포스포에스테르 기는 변형된 기, 예컨대, 포스포티오에이트 기의 변형된 기로 대체된다. 예시적인 당-변형된 리보뉴클레오티드에서, 2' OH-기는 H, OR, R, 할로, SH, SR, NH2, NHR, NR2 또는 ON으로부터 선택된 기로 대체되고, 여기서 R은 C1-C6 알킬, 알케닐 또는 알키닐이고, 할로는 F, Cl, Br 또는 I이다.
변형의 다른 예는 자연 발생 핵염기 대신에 하나 이상의 비-자연 발생 핵염기를 함유하는 핵염기-변형된 리보뉴클레오티드, 즉, 리보뉴클레오티드이다. 염기는 아데노신 데아미나제의 활성을 차단하도록 변형될 수 있다. 예시적인 변형된 핵염기는 5-위치에서 변형된 우리딘 및/또는 시티딘, 예컨대, 5-(2-아미노)프로필 우리딘, 5-브로모 우리딘; 8 위치에서 변형된 아데노신 및/또는 구아노신, 예컨대, 8-브로모 구아노신; 데아자 뉴클레오티드, 예컨대, 7-데아자-아데노신; O- 및 N-알킬화된 뉴클레오티드를 포함하나, 이에 제한되지 않으며, 예컨대, N6-메틸 아데노신이 적합하다. 위의 변형이 조합될 수 있음에 주목해야 한다.
일부 경우에, 핵산 분자는 다음의 화학적 변형 중 하나 이상을 포함한다: 2'-H, 2'-O-메틸, 또는 하나 이상의 뉴클레오티드의 2'-OH 변형. 특정 실시양태에서, 발명의 핵산 분자는 뉴클레아제에 대한 향상된 저항성을 가질 수 있다. 증가된 뉴클레아제 저항성을 위해, 핵산 분자는 예를 들어, 2'-변형된 리보스 유닛 및/또는 포스포로티오에이트 연결을 포함할 수 있다. 예를 들어, 2' 하이드록실 기 (OH)는 상이한 "옥시" 또는 "데옥시" 치환기의 수로 변형되거나 대체될 수 있다. 증가된 뉴클레아제 저항성을 위해, 발명의 핵산 분자는 2'-O-메틸, 2'-플루오린, 2'-O-메톡시에틸, 2'-O-아미노프로필, 2'-아미노 및/또는 포스포로티오에이트 연결을 포함할 수 있다. 잠금 핵산 (LNA), 에틸렌 핵산 (ENA), 예컨대, 2'-4'-에틸렌-브릿지된 핵산 및 특정 핵염기 변형, 예컨대, 2-아미노-A, 2-티오 (예컨대, 2-티오-U), G-클램프 변형의 포함은 또한 표적에 대한 결합 친화도를 증가시킬 수 있다.
일 실시양태에서, 핵산 분자는 2'-변형된 뉴클레오티드, 예컨대, 2'-데옥시, 2'-데옥시-2'-플루오로, 2'-O-메틸, 2'-O-메톡시에틸 (2'-O-MOE), 2'-O-아미노프로필 (2'-O-AP), 2'-O-디메틸아미노에틸 (2'-O-DMAOE), 2'-O-디메틸아미노프로필 (2'-O-DMAP), 2'-O-디메틸아미노에틸옥시에틸 (2'-O-DMAEOE) 또는 2'-O-N-메틸아세트아미도 (2'-O-NMA)를 포함한다. 일 실시양태에서, 핵산 분자는 하나 이상의 2'-O-메틸-변형된 뉴클레오티드를 포함하고, 일부 실시양태에서 핵산 분자의 모든 뉴클레오티드는 2'-O-메틸 변형을 포함한다.
특정 실시양태에서, 발명의 핵산 분자는 다음의 특성 중 하나 이상을 갖는다:
본원에 논의된 핵산 약제는 변형되지 않은 RNA 및 DNA뿐만 아니라, 예컨대, 효험을 개선하기 위해 변형된 RNA 및 DNA, 및 뉴클레오시드 대용물의 중합체를 포함한다. 변형되지 않은 RNA는 핵산의 구성요소, 즉, 당, 염기 및 포스페이트 모이어티가 자연에서 발생하거나 인체에서 자연적으로 발생하는 것과 동일하거나 본질적으로 동일한 분자를 지칭한다. 당업계에서는 희귀하거나 비정상적이지만 자연적으로 발생하는 RNA를 변형된 RNA로서 지칭하고 있으며, 예컨대, Limbach et al. (Nucleic Acids Res., 1994, 22:2183-2196)을 참고한다. 종종 변형된 RNA라고 하는 이러한 희귀하거나 비정상적인 RNA는 전형적으로 전사-후 변형의 결과이며 본원에 사용된 바와 같은 용어 변형되지 않은 RNA 내에 있다. 본원에 사용된 바와 같은 변형된 RNA는 핵산의 구성요소, 즉, 당, 염기 및 포스페이트 모이어티 중 하나 이상이 자연에서 발생하는 것과 상이하거나, 인체에서 발생하는 것과 상이한 분자를 지칭한다. 이들은 "변형된 RNA"로서 지칭되지만, 물론 변형으로 인해 엄밀히 말하면 RNA가 아닌 분자를 포함할 것이다. 뉴클레오시드 대용물은 리보포스페이트 백본이 염기가 올바른 공간 관계로 제시되도록 하는 비-리보포스페이트 작제물로 대체되어, 혼성화가 리보포스페이트 백본, 예컨대, 리보포스페이트 백본의 비-하전된 모방체에서 볼 수 있는 것과 실질적으로 유사하도록 하는 분자이다.
발명의 핵산의 변형은 포스페이트 기, 당 기, 백본, N-말단, C-말단, 또는 핵염기 중 하나 이상에 존재할 수 있다.
벡터
본 발명은 또한 본 발명의 하나 이상의 핵산 분자가 삽입된 하나 이상의 벡터를 포함하는 조성물을 포함한다. 일 실시양태에서, 벡터는 2 개 이상의 RNA 분자를 코딩한다. 일 실시양태에서, 벡터는 2 개 이상의 RNA 분자를 포함한다. 일부 실시양태에서, 2 개 이상의 RNA 분자는 동일한 벡터에 의해 코딩된다. 일부 실시양태에서, 2 개 이상의 RNA 분자는 동일한 벡터 내에 함유된다. 일 실시양태에서, 상기 2 개 이상의 RNA 분자는 제1 RNA 분자 및 제2 RNA 분자를 포함한다.
일부 실시양태에서, 본 발명은 2 개 이상의 RNA 분자를 코딩하는 2 개 이상의 벡터를 포함한다. 일부 실시양태에서, 2 개 이상의 벡터는 2 개 이상의 RNA 분자를 포함한다. 일부 실시양태에서, 2 개 이상의 벡터는 별개의 RNA 분자를 코딩한다. 일부 실시양태에서, 2 개 이상의 벡터는 별개의 RNA 분자를 포함한다. 일부 실시양태에서, 2 개 이상의 별개의 RNA 분자는 제1 RNA 분자 및 제2 RNA 분자를 포함한다. 일부 실시양태에서, 제1 RNA 분자는 제1 벡터에 의해 코딩되고 제2 RNA 분자는 제2 벡터에 의해 코딩된다. 일부 실시양태에서, 제1 RNA 분자는 제1 벡터를 포함하고 제2 RNA 분자는 제2 벡터를 포함한다.
일부 실시양태에서, 본 발명은 하나 이상의 추가적인 RNA 분자를 코딩하는 벡터를 추가로 포함한다. 일부 실시양태에서, 본 발명은 하나 이상의 추가적인 RNA 분자를 포함하는 하나 이상의 벡터를 추가로 포함한다. 일부 실시양태에서, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임을 포함한다. 일부 실시양태에서, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함한다.
당업계에는 본 발명에 유용한 적합한 벡터가 풍부하다. 간략히 요약하면, 발명의 융합 단백질을 코딩하는 자연 또는 합성 핵산의 발현은 전형적으로 발명의 융합 단백질 또는 이의 일부를 코딩하는 핵산을 프로모터에 작동가능하게 연결하고, 작제물을 발현 벡터에 통합함으로써 달성된다. 사용되는 벡터는 복제 및 임의로 진핵 세포에서의 통합에 적합하다. 전형적인 벡터는 원하는 핵산 서열의 발현 조절에 유용한 전사 및 번역 종결자, 개시 서열 및 프로모터를 함유한다.
본 발명의 벡터는 또한 표준 유전자 전달 프로토콜을 사용하여 핵산 면역화 및 유전자 요법에 사용될 수 있다. 유전자 전달 방법은 당업계에 알려져 있다. 예컨대, 그 전체 내용이 본원에 참조로 원용되는 미국 특허 제5,399,346호, 제5,580,859호, 제5,589,466호를 참고한다. 다른 실시양태에서, 발명은 유전자 요법 벡터를 제공한다.
발명의 단리된 핵산은 다수의 유형의 벡터로 클로닝될 수 있다. 예를 들어, 핵산은 플라스미드, 파지미드, 파지 유도체, 동물 바이러스 및 코스미드를 비제한적으로 포함하는 벡터에 클로닝될 수 있다. 특히 관심 벡터는 발현 벡터, 복제 벡터, 프로브 생성 벡터 및 시퀀싱 벡터를 포함한다.
추가로, 벡터는 바이러스 벡터의 형태로 세포에 제공될 수 있다. 바이러스 벡터 기술은 당업계에 잘 알려져 있으며, 예를 들어, Sambrook et al. (2012, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New York) 및 기타 바이러스학 및 분자 생물학 매뉴얼에 기재되어 있다. 벡터로서 유용한 바이러스는 레트로바이러스, 아데노바이러스, 아데노-연관 바이러스, 헤르페스 바이러스 및 렌티바이러스를 포함하나, 이에 제한되지 않는다. 일반적으로, 적합한 벡터는 하나 이상의 유기체에서 기능적인 복제 기점, 프로모터 서열, 편리한 제한 엔도뉴클레아제 부위, 및 하나 이상의 선택가능한 마커를 함유한다 (예컨대, WO 01/96584호; WO 01/29058호; 및 미국 특허 제6,326,193호).
추가로, 포유동물 세포로의 유전자 전달을 위해 다수의 추가적인 바이러스 기반 시스템이 개발되었다. 예를 들어, 레트로바이러스는 유전자 전달 시스템을 위한 편리한 플랫폼을 제공한다. 선택된 유전자는 당업계에 알려진 기술을 사용하여 벡터에 삽입되고 레트로바이러스 입자에 패키징될 수 있다. 그 다음, 재조합 바이러스는 단리되고, 생체내 또는 엑스 비보에서 대상체의 세포에 전달될 수 있다. 다수의 레트로바이러스 시스템이 당업계에 알려져 있다. 일부 실시양태에서, 아데노바이러스 벡터가 사용된다. 다수의 아데노바이러스 벡터가 당업계에 알려져 있다.
일 실시양태에서, 조성물은 아데노-연관 바이러스 (AAV)로부터 유래된 벡터를 포함한다. 용어 "AAV 벡터"는 제한 없이 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8 및 AAV-9를 포함하여 아데노-연관 바이러스 혈청형으로부터 유래된 벡터를 의미한다. AAV 벡터는 다양한 장애 치료를 위한 강력한 유전자 전달 도구가 되었다. AAV 벡터는 병원성의 결여, 최소 면역원성, 및 유사분열 후 세포를 안정적이고 효율적인 방식으로 형질도입하는 능력을 포함하여, 유전자 요법에 이상적으로 적합하도록 하는 다수의 특징을 보유한다. AAV 벡터 내에 함유된 특정 유전자의 발현은 AAV 혈청형, 프로모터 및 전달 방법의 적절한 조합을 선정함으로써 하나 이상의 유형의 세포에 특이적으로 표적화될 수 있다.
AAV 벡터는 전체 또는 일부가 결실된 AAV 야생형 유전자, 바람직하게는 rep 및/또는 cap 유전자 중 하나 이상을 가질 수 있지만, 기능적 플랭킹 ITR 서열을 보유할 수 있다. 높은 정도의 상동성에도 불구하고, 상이한 혈청형은 상이한 조직에 대해 친화성을 갖는다. AAV1에 대한 수용체는 알려져 있지 않으나; AAV1은 AAV2보다 더 효율적으로 골격 및 심장 근육을 형질도입하는 것으로 알려져 있다. 대부분의 연구는 AAV2 ITR이 플랭킹된 벡터 DNA가 대체 혈청형의 캡시드로 패키징된 슈도타입화된 벡터로 수행되었기 때문에, 생물학적 상이함은 게놈보다는 캡시드와 관련이 있음이 분명하다. 최근의 증거는 AAV1 캡시드에 패키징된 DNA 발현 카세트가 AAV2 캡시드에 패키징된 것들보다 심근세포를 형질도입하는 데 1 log 10 이상 더 효율적임을 나타낸다. 일 실시양태에서, 바이러스 전달 시스템은 아데노-연관 바이러스 전달 시스템이다. 아데노-연관 바이러스는 혈청형 1 (AAV 1), 혈청형 2 (AAV2), 혈청형 3 (AAV3), 혈청형 4 (AAV4), 혈청형 5 (AAV5), 혈청형 6 (AAV6), 혈청형 7 (AAV7), 혈청형 8 (AAV8) 또는 혈청형 9 (AAV9)일 수 있다.
벡터로 조립하기 위한 바람직한 AAV 단편은 vp1, vp2, vp3 및 초가변 영역을 포함하는 cap 단백질, rep 78, rep 68, rep 52 및 rep 40을 포함하는 rep 단백질, 및 이들 단백질을 코딩하는 서열을 포함한다. 이들 단편은 다양한 벡터 시스템 및 숙주 세포에서 용이하게 활용될 수 있다. 이러한 단편은 단독으로, 다른 AAV 혈청형 서열 또는 단편과 조합하여, 또는 다른 AAV 또는 비-AAV 바이러스 서열로부터의 요소와 조합하여 사용될 수 있다. 본원에 사용된 바와 같이, 인공 AAV 혈청형은 제한 없이 비-자연 발생 캡시드 단백질을 갖는 AAV를 포함한다. 이러한 인공 캡시드는 비-AAV 바이러스 공급원 또는 비-바이러스 공급원으로부터 상이한 선택된 AAV 혈청형, 동일한 AAV 혈청형의 비-인접 부분으로부터 수득될 수 있는 이종 서열과 조합된 선택된 AAV 서열 (예컨대, vp1 캡시드 단백질의 단편)을 사용하여 임의의 적합한 기술에 의해 생성될 수 있다. 인공 AAV 혈청형은 제한 없이 키메라 AAV 캡시드, 재조합 AAV 캡시드, 또는 "인간화" AAV 캡시드일 수 있다. 따라서, 하나 이상의 단백질의 발현에 적합한 예시적인 AAV 또는 인공 AAV는 그 중에서도 AAV2/8 (미국 특허 제7,282,199호 참고), AAV2/5 (미국국립보건원으로부터 이용가능), AAV2/9 (국제 특허 공개공보 WO2005/033321호), AAV2/6 (미국 특허 제6,156,303호) 및 AAVrh8 (국제 특허 공개공보 WO2003/042397호)을 포함한다.
일 실시양태에서, 조성물은 본 발명의 하나 이상의 핵산을 전달하기 위한 렌티바이러스 벡터를 포함한다. 일 실시양태에서, 본 발명은 하나 이상의 관심 단백질을 코딩하는 하나 이상의 RNA 분자를 포함하는 렌티바이러스 벡터를 포함한다. 예를 들어, 레트로바이러스, 예컨대, 렌티바이러스로부터 유래된 벡터는 트랜스진의 장기적이고 안정적인 통합 및 딸 세포에서의 전파를 허용하기 때문에 장기적인 유전자 전달을 달성하는 데 적합한 도구이다. 렌티바이러스 벡터는 비-증식성 세포, 예컨대, 간세포를 형질도입할 수 있다는 점에서 종양-레트로바이러스, 예컨대, 뮤린 백혈병 바이러스로부터 유래된 벡터에 비해 추가적인 이점이 있다. 이들은 또한 낮은 면역원성의 추가 이점을 가지고 있다.
특정 실시양태에서, 벡터는 또한 플라스미드 벡터로 형질주입되거나 발명에 의해 생산된 바이러스로 감염된 세포에서 이의 전사, 번역 및/또는 발현을 허용하는 방식으로 트랜스진에 작동가능하게 연결된 통상적인 제어 요소를 포함한다. 본원에 사용된 바와 같이, "작동가능하게 연결된" 서열은 관심 유전자와 인접한 발현 제어 서열 및 관심 유전자를 제어하기 위해 트랜스로 또는 먼 거리에서 작용하는 발현 제어 서열 둘 모두를 포함한다. 발현 제어 서열은 적절한 전사 개시, 종결, 프로모터 및 인핸서 서열; 효율적인 RNA 가공 신호, 예컨대, 스플라이싱 및 폴리아데닐화 (폴리A) 신호; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 향상시키는 서열 (즉, Kozak 컨센서스 서열); 단백질 안정성을 향상시키는 서열; 및 원하는 경우, 코딩된 생성물의 분비를 향상시키는 서열을 포함한다. 천연, 구성적, 유도성 및/또는 조직-특이적인 프로모터를 포함하는 다수의 발현 제어 서열이 당업계에 알려져 있고, 활용될 수 있다.
추가적인 프로모터 요소, 예컨대, 인핸서는 전사 개시의 빈도를 조절한다. 전형적으로, 이들은 출발 부위의 업스트림의 30-110 bp 영역에 위치하지만, 최근에 많은 프로모터가 출발 부위의 다운스트림에서 또한 기능적 요소를 함유하는 것으로 나타났다. 프로모터 요소 사이의 간격은 종종 가요성이므로, 요소가 서로에 대해 반전되거나 이동할 때 프로모터 기능이 보존된다. 티미딘 키나제 (tk) 프로모터에서, 프로모터 요소 사이의 간격은 활성이 감퇴하기 시작하기 전에 50 bp 간격으로 증가될 수 있다. 프로모터에 따라, 개별 요소가 협력적으로 또는 독립적으로 기능하여 전사를 활성화할 수 있는 것으로 보인다.
적합한 프로모터의 일 예는 즉시 초기 사이토메갈로바이러스 (CMV) 프로모터 서열이다. 이 프로모터 서열은 이에 작동적으로 연결된 임의의 폴리뉴클레오티드 서열의 높은 수준의 발현을 구동할 수 있는 강력한 구성적 프로모터 서열이다. 적합한 프로모터의 다른 예는 신장 성장 인자-1α (EF-1α)이다. 그러나, 시미안 바이러스 40 (SV40) 초기 프로모터, 마우스 유방 종양 바이러스 (MMTV), 인간 면역결핍 바이러스 (HIV) 긴 말단 반복 (LTR) 프로모터, MoMuLV 프로모터, 조류 백혈병 바이러스 프로모터, 엡스타인-바(Epstein-Barr) 바이러스 즉시 초기 프로모터, 라우스 육종 바이러스 프로모터뿐만 아니라 인간 유전자 프로모터, 예컨대, 비제한적으로 액틴 프로모터, 미오신 프로모터, 헤모글로빈 프로모터, 및 크레아틴 키나제 프로모터를 비제한적으로 포함하는 다른 구성적 프로모터 서열이 또한 사용될 수 있다. 추가로, 발명은 구성적 프로모터의 사용으로 제한되어서는 안 된다. 유도성 프로모터가 또한 발명의 일부로서 고려된다. 유도성 프로모터의 사용은 이러한 발현이 바람직할 때 작동적으로 연결되는 폴리뉴클레오티드 서열의 발현을 켜거나, 발현이 바람직하지 않을 때 발현을 끌 수 있는 분자 스위치를 제공한다. 유도성 프로모터의 예는 메탈로티오닌 프로모터, 글루코코르티코이드 프로모터, 프로게스테론 프로모터 및 테트라사이클린 프로모터를 포함하나, 이에 제한되지 않는다.
벡터에서 발견되는 인핸서 서열은 또한 그 안에 함유된 유전자의 발현을 조절한다. 전형적으로, 인핸서는 단백질 인자와 결합하여 유전자의 전사를 향상시킨다. 인핸서는 조절하는 유전자의 업스트림 또는 다운스트림에 위치될 수 있다. 인핸서는 또한 특이적 세포 또는 조직 유형에서 전사를 향상시키기 위해 조직-특이적일 수 있다. 일 실시양태에서, 본 발명의 벡터는 벡터 내에 존재하는 유전자의 전사를 증진시키기 위한 하나 이상의 인핸서를 포함한다.
발명의 융합 단백질의 발현을 판정하기 위해, 세포로 도입될 발현 벡터는 또한 바이러스 벡터를 통해 형질주입 또는 감염시키려는 세포 집단으로부터 발현 세포의 식별 및 선택을 용이하게 하기 위해 선택가능한 마커 유전자 또는 리포터 유전자 또는 둘 모두를 함유할 수 있다. 다른 양태에서, 선택가능한 마커는 DNA의 별개의 조각에 운반될 수 있고, 공동-형질주입 절차에 사용될 수 있다. 선택가능한 마커 및 리포터 유전자 둘 모두는 숙주 세포에서 발현을 가능하게 하는 적절한 조절 서열과 플랭킹될 수 있다. 유용한 선택가능한 마커는 예를 들어, 항생제-저항성 유전자, 예컨대, neo 등을 포함한다.
리포터 유전자는 잠재적으로 형질주입된 세포를 식별하고 조절 서열의 기능성을 평가하는 데 사용된다. 일반적으로, 리포터 유전자는 수용 유기체 또는 조직에 존재하지 않거나 이에 의해 발현되지 않고 발현이 일부 쉽게 검출가능한 특성, 예컨대, 효소 활성에 의해 나타나는 폴리펩티드를 코딩하는 유전자이다. 리포터 유전자의 발현은 DNA가 수용 세포에 도입된 후 적합한 시간에 검정된다. 적합한 리포터 유전자는 루시퍼라제, 베타-갈락토시다제, 클로람페니콜 아세틸 트랜스퍼라제, 분비된 알칼리성 포스파타제, 또는 녹색 형광 단백질 유전자를 코딩하는 유전자를 포함할 수 있다 (예컨대, Ui-Tei et al., 2000 FEBS Letters 479: 79-82). 적합한 발현 시스템은 잘 알려져 있으며, 알려진 기술을 사용하여 제조되거나 상업적으로 수득될 수 있다. 일반적으로, 리포터 유전자의 가장 높은 발현 수준을 나타내는 최소 5' 플랭킹 영역을 갖는 작제물이 프로모터로서 식별된다. 이러한 프로모터 영역은 리포터 유전자에 연결될 수 있으며, 프로모터-구동된 전사를 조정하는 능력에 대한 약제를 평가하는 데 사용될 수 있다.
단백질
일부 실시양태에서, 본 발명은 리가아제를 포함하는 조성물을 포함한다. 일부 실시양태에서, 리가아제는 RNA 분자의 3'P 또는 2'3' cP 단부 및 RNA 분자의 5'OH 단부의 결찰을 매개한다. 일부 실시양태에서, 리가아제는 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다. 일부 실시양태에서, RtcB 리가아제는 진핵생물, 박테리아 및 고세균으로 이루어진 군으로부터 선택된 유기체의 하나 이상의 도메인으로부터 유래한다. 일부 실시양태에서, 유기체는 인간, 대장균, 데이노코커스 라디오듀란스, 파이로코커스 호리코시이, 파이로코커스 종 ST04, 및 써모코커스 종 EP로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 리가아제는 서열번호 81, 서열번호 83, 서열번호 85, 서열번호 87, 서열번호 89, 서열번호 91로 이루어진 군으로부터 선택된 하나 이상의 아미노산 서열을 포함한다.
일부 실시양태에서, 본 발명의 하나 이상의 단백질은 본원에 기재된 아미노산 서열과 실질적으로 상동인 아미노산 서열을 포함한다. 예를 들어, 일부 실시양태에서, 단백질은 원래의 아미노산 서열에 대해 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상 또는 99.5% 이상의 동일성의 정도를 갖는다.
일부 실시양태에서, 본 발명의 하나 이상의 단백질은 본원에 기재된 아미노산 서열의 일부인 아미노산 서열을 포함한다. 예를 들어, 일부 실시양태에서, 단백질은 원래의 아미노산 서열에 대해 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상 또는 99.5% 이상의 길이를 갖는다.
일부 실시양태에서, 본 발명의 하나 이상의 단백질은 본원에 기재된 아미노산 서열의 일부이고 본원에 기재된 아미노산 서열과 실질적으로 상동인 아미노산 서열을 포함한다. 예를 들어, 일부 실시양태에서, 단백질은 원래의 아미노산 서열에 대해 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상 또는 99.5% 이상의 동일성의 정도를 갖고/갖거나 원래의 아미노산 서열에 대해 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 81% 이상, 82% 이상, 83% 이상, 84% 이상, 85% 이상, 86% 이상, 87% 이상, 88% 이상, 89% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상 또는 99.5% 이상의 길이를 갖는다.
약학 조성물
발명은 또한 발명의 방법을 실시하기 위한 발명의 약학 조성물 또는 이의 염의 용도를 포함한다. 이러한 약학 조성물은 대상체에 투여하기에 적합한 형태의 하나 이상의 발명의 핵산 또는 이의 염으로 이루어질 수 있거나, 약학 조성물은 하나 이상의 발명의 핵산 또는 이의 염, 및 하나 이상의 약학적으로 허용가능한 담체, 하나 이상의 추가적인 성분, 또는 이들의 일부 조합을 포함할 수 있다. 발명의 핵산은 당업계에 잘 알려진 바와 같이 생리학적으로 허용가능한 염의 형태로, 예컨대, 생리학적으로 허용가능한 양이온 또는 음이온과 조합하여 약학 조성물에 존재할 수 있다.
일 실시양태에서, 발명의 방법을 실시하는 데 유용한 약학 조성물은 1 ng/kg/일 내지 100 mg/kg/일의 용량을 전달하도록 투여될 수 있다. 다른 실시양태에서, 발명을 실시하는 데 유용한 약학 조성물은 1 ng/kg/일 내지 500 mg/kg/일의 용량을 전달하도록 투여될 수 있다.
발명의 약학 조성물에서 활성 성분, 약학적으로 허용가능한 담체 및 임의의 추가적인 성분의 상대적인 양은 치료된 대상체의 아이덴티티, 크기 및 병태에 따라, 및 추가로 조성물이 투여되는 경로에 따라 달라질 것이다. 예로서, 조성물은 0.1% 내지 100% (w/w) 활성 성분을 포함할 수 있다.
발명의 방법에 유용한 약학 조성물은 경구, 직장, 질, 비경구, 국부, 폐, 비강내, 협측, 안과 또는 다른 투여 경로에 적합하게 개발될 수 있다. 발명의 방법 내에서 유용한 조성물은 피부, 또는 포유류의 임의의 다른 조직에 직접 투여될 수 있다. 다른 고려되는 제형은 리포솜 제제, 활성 성분을 함유하는 재밀봉된 적혈구, 및 면역학적-기반 제형을 포함한다. 투여 경로(들)는 당업자에게 용이하게 명백할 것이고, 치료되는 질환의 유형 및 중증도, 및 치료되는 수의과 또는 인간 대상체의 유형 및 연령 등을 포함하는 임의의 수의 인자에 의존할 것이다.
본원에 기재된 약학 조성물의 제형은 약리학 분야에서 알려진 또는 이후 개발될 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 제조 방법은 활성 성분을 담체 또는 하나 이상의 다른 보조 성분과 회합시킨 다음, 필요하거나 원하는 경우, 원하는 단일- 또는 다중-용량 유닛으로 생성물을 성형하거나 패키징하는 단계를 포함한다.
본원에 사용된 바와 같이, "유닛 용량"은 활성 성분의 미리결정된 양을 포함하는 약학 조성물의 별개의 양이다. 활성 성분의 양은 일반적으로 대상체에 투여될 활성 성분의 투여량 또는 이러한 투여량의 편리한 분획, 예를 들어, 이러한 투여량의 1/2 또는 1/3과 동등하다. 유닛 투여량 형태는 단일 1 일 용량 또는 다중 1 일 용량 (예컨대, 1 일당 약 1 내지 4 회 이상) 중 하나일 수 있다. 1 일 다중 용량을 사용하는 경우, 유닛 투여량 형태는 각각의 용량에 대해 동일하거나 상이할 수 있다.
일 실시양태에서, 발명의 조성물은 하나 이상의 약학적으로 허용가능한 부형제 또는 담체를 사용하여 제형화된다. 일 실시양태에서, 발명의 약학 조성물은 치료적 유효량의 발명의 핵산 및 약학적으로 허용가능한 담체를 포함한다. 유용한 약학으로 허용가능한 담체는 글리세롤, 물, 식염수, 에탄올 및 기타 약학적으로 허용가능한 염 용액, 예컨대, 포스페이트 및 유기산의 염을 포함하나, 이에 제한되지 않는다. 이들 및 기타 약학적으로 허용가능한 담체의 예는 Remington's Pharmaceutical Sciences (1991, Mack Publication Co., New Jersey)에 기재되어 있다.
담체는 예를 들어, 물, 에탄올, 폴리올 (예를 들어, 글리세롤, 프로필렌 글리콜 및 액체 폴리에틸렌 글리콜 등), 이들의 적합한 혼합물, 및 식물성 오일을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은 예를 들어, 레시틴과 같은 코팅의 사용, 분산의 경우 필요한 입자 크기의 유지 및 계면활성제의 사용에 의해 유지될 수 있다. 미생물 작용의 방지는 다양한 항박테리아제 및 항진균제, 예를 들어, 파라벤, 클로로부탄올, 페놀, 아스코르브산 및 티메로살 등에 의해 달성될 수 있다. 많은 경우에, 등장화제, 예를 들어, 당, 소듐 클로라이드 또는 폴리알콜, 예컨대, 만니톨 및 소르비톨이 조성물에 포함된다. 주사가능한 조성물의 연장된 흡수는 조성물에 흡수를 지연시키는 약제, 예를 들어, 알루미늄 모노스테아레이트 또는 젤라틴을 포함함으로써 야기될 수 있다. 일 실시양태에서, 약학적으로 허용가능한 담체는 DMSO 단독이 아니다.
제형은 통상적인 부형제, 즉, 경구, 질, 비경구, 비강, 정맥내, 피하, 장내 또는 당업계에 알려진 임의의 다른 적합한 투여 방식에 적합한 약학적으로 허용가능한 유기 또는 무기 담체 물질과의 혼합물로 사용될 수 있다. 약학 제제는 멸균될 수 있고, 원하는 경우 보조제, 예컨대, 윤활제, 보존제, 안정화제, 습윤제, 유화제, 및 삼투압 완충액, 착색, 향미 및/또는 방향 물질에 영향을 미치기 위한 염 등과 혼합될 수 있다. 이들은 또한 원하는 경우 다른 활성제, 예컨대, 다른 진통제와 조합될 수 있다.
본원에 사용된 바와 같이, "추가적인 성분"은 다음 중 하나 이상을 포함하나, 이에 제한되지 않는다: 부형제; 표면 활성제; 분산제; 불활성 희석제; 과립화제 및 붕해제; 결합제; 윤활제; 감미제; 향미제; 착색제; 보존제; 생리학적으로 분해가능한 조성물, 예컨대, 젤라틴; 수성 비히클 및 용매; 유성 비히클 및 용매; 현탁제; 분산제 또는 습윤제; 유화제, 완화제; 완충액; 염; 증점제; 충전제; 유화제; 항산화제; 항생제; 항진균제; 안정화제; 및 약학적으로 허용가능한 중합체성 또는 소수성 재료. 발명의 약학 조성물에 포함될 수 있는 다른 "추가적인 성분"은 당업계에 알려져 있으며, 예를 들어, 참조로 본원에 원용되는 Genaro, ed. (1985, Remington's Pharmaceutical Sciences, Mack Publishing Co., Easton, PA)에 기재되어 있다.
발명의 조성물은 조성물의 총 중량 대비 약 0.005% 내지 2.0%의 보존제를 포함할 수 있다. 보존제는 환경의 오염물에 노출되는 경우 부패를 방지하는 데 사용된다. 발명에 따라 유용한 보존제의 예는 벤질 알콜, 소르브산, 파라벤, 이미두레아 및 이들의 조합으로 이루어진 군으로부터 선택된 것들을 포함하나, 이에 제한되지 않는다. 예시적인 보존제는 약 0.5% 내지 2.0% 벤질 알콜 및 0.05% 내지 0.5% 소르브산의 조합이다.
일 실시양태에서, 조성물은 항-산화제 및 핵산의 분해를 억제하는 킬레이팅제를 포함한다. 일부 화합물에 대한 예시적인 항산화제는 조성물의 총 중량을 기준으로 중량 대비 약 0.01% 내지 0.3% 범위의 BHT, BHA, 알파-토코페롤 및 아스코르브산, 및 0.03% 내지 0.1% 범위의 BHT이다. 일 실시양태에서, 킬레이팅제는 조성물의 총 중량을 기준으로 중량 대비 0.01% 내지 0.5%의 양으로 존재한다. 예시적인 킬레이팅제는 약 0.01% 내지 0.20% 중량 범위의 에데테이트 염 (예컨대, 디소듐 에데테이트) 및 시트르산을 포함한다. 일부 실시양태에서, 킬레이팅제는 조성물의 총 중량을 기준으로 중량 대비 0.02% 내지 0.10% 범위이다. 킬레이팅제는 제형의 저장 수명에 해로울 수 있는 조성물의 금속 이온을 킬레이팅하는 데 유용하다. BHT 및 디소듐 에데테이트가 각자 일부 화합물에 대한 예시적인 항산화제 및 킬레이팅제이지만, 따라서 당업자에게 알려진 바와 같이 다른 적합하고 등가인 항산화제 및 킬레이팅제로 교체될 수 있다.
액체 현탁액은 수성 또는 유성 비히클에서 활성 성분의 현탁액을 달성하기 위해 통상적인 방법을 사용하여 제조될 수 있다. 수성 비히클은 예를 들어, 물 및 등장 식염수를 포함한다. 유성 비히클은 예를 들어, 아몬드 오일, 유성 에스테르, 에틸 알콜, 식물성 오일, 예컨대, 아라키스, 올리브, 참깨 또는 코코넛 오일, 분획화된 식물성 오일, 및 미네랄 오일, 예컨대, 액체 파라핀을 포함한다. 액체 현탁액은 현탁제, 분산제 또는 습윤제, 유화제, 완화제, 보존제, 완충액, 염, 향미제, 착색제 및 감미제를 비제한적으로 포함하는 하나 이상의 추가적인 성분을 추가로 포함할 수 있다. 유성 현탁액은 증점제를 추가로 포함할 수 있다. 알려진 현탁제는 소르비톨 시럽, 수소화된 식용 지방, 소듐 알기네이트, 폴리비닐피롤리돈, 검 트라가칸트, 검 아카시아, 및 셀룰로스 유도체, 예컨대, 소듐 카복시메틸셀룰로스, 메틸셀룰로스, 하이드록시프로필메틸셀룰로스를 포함하나, 이에 제한되지 않는다. 알려진 분산제 또는 습윤제는 자연-발생 포스파티드, 예컨대, 레시틴, 지방산과, 장쇄 지방족 알콜과, 지방산 및 헥시톨로부터 유래된 부분 에스테르와, 또는 지방산 및 헥시톨 무수물로부터 유래된 부분 에스테르와 알킬렌 옥사이드의 축합 생성물 (예컨대, 각자 폴리옥시에틸렌 스테아레이트, 헵타데카에틸렌옥시세탄올, 폴리옥시에틸렌 소르비톨 모노올레에이트 및 폴리옥시에틸렌 소르비탄 모노올레에이트)을 포함하나, 이에 제한되지 않는다. 알려진 유화제는 레시틴 및 아카시아를 포함하나, 이에 제한되지 않는다. 알려진 보존제는 메틸, 에틸 또는 n-프로필-파라-하이드록시벤조에이트, 아스코르브산 및 소르브산을 포함하나, 이에 제한되지 않는다. 알려진 감미제는 예를 들어, 글리세롤, 프로필렌 글리콜, 소르비톨, 수크로스 및 사카린을 포함한다. 유성 현탁액을 위한 알려진 증점제는 예를 들어, 밀랍, 경질 파라핀 및 세틸 알콜을 포함한다.
수성 또는 유성 용매 중 활성 성분의 액체 용액은 액체 현탁액과 실질적으로 동일한 방식으로 제조될 수 있으며, 주요 상이함은 활성 성분이 용매에 현탁되는 것이 아니라 용해된다는 점이다. 본원에 사용된 바와 같이, "유성" 액체는 탄소-함유 액체 분자를 포함하고 물보다 덜 극성인 특성을 나타내는 액체이다. 발명의 약학 조성물의 액체 용액은 액체 현탁액과 관련하여 기재된 각각의 구성요소를 포함할 수 있으며, 현탁제가 용매 중 활성 성분의 용해를 반드시 보조하지는 않을 것으로 이해된다. 수성 용매는 예를 들어, 물 및 등장 식염수를 포함한다. 유성 용매는 예를 들어, 아몬드 오일, 유성 에스테르, 에틸 알콜, 식물성 오일, 예컨대, 아라키스, 올리브, 참깨 또는 코코넛 오일, 분획화된 식물성 오일, 및 미네랄 오일, 예컨대, 액체 파라핀을 포함한다.
발명의 약학 제제의 분말 및 과립 제형은 알려진 방법을 사용하여 제조될 수 있다. 예를 들어, 정제를 형성하거나, 캡슐을 채우거나, 그것에 수성 또는 유성 비히클을 첨가하여 수성 또는 유성 현탁액 또는 용액을 제조하기 위해 사용된 이러한 제형은 대상체에 직접 투여될 수 있다. 이들 제형 각각은 분산제 또는 습윤제, 현탁제 및 보존제 중 하나 이상을 추가로 포함할 수 있다. 추가적인 부형제, 예컨대, 충전제 및 감미제, 향미제 또는 착색제가 또한 이들 제형에 포함될 수 있다.
발명의 약학 조성물은 또한 수-중-유 에멀젼 또는 유-중-수 에멀젼의 형태로 제조, 패키징 또는 판매될 수 있다. 유성 상은 식물성 오일, 예컨대, 올리브 또는 아라키스 오일, 미네랄 오일, 예컨대, 액체 파라핀, 또는 이들의 조합일 수 있다. 이러한 조성물은 하나 이상의 유화제, 예컨대, 자연 발생 검, 예컨대, 검 아카시아 또는 검 트라가칸트, 자연-발생 포스파티드, 예컨대, 대두 또는 레시틴 포스파티드, 지방산과 헥시톨 무수물의 조합으로부터 유래된 에스테르 또는 부분 에스테르, 예컨대, 소르비탄 모노올레에이트, 및 에틸렌 옥사이드와 이러한 부분 에스테르의 축합 생성물, 예컨대, 폴리옥시에틸렌 소르비탄 모노올레에이트를 추가로 포함할 수 있다. 이들 에멀젼은 또한 예를 들어, 감미제 또는 향미제를 비롯한 추가적인 성분을 함유할 수 있다.
재료를 화학 조성물로 함침시키거나 코팅하는 방법은 당업계에 알려져 있으며, 화학 조성물을 표면에 침착 또는 결합시키는 방법, (즉, 예컨대, 생리학적으로 분해가능한 재료와 함께) 재료의 합성 동안 재료의 구조에 화학 조성물을 통합하는 방법, 및 후속 건조의 유무에 관계없이 수성 또는 유성 용액 또는 현탁액을 흡수성 재료에 흡수하는 방법을 포함하나, 이에 제한되지 않는다.
투여 양생법은 유효량을 구성하는 것에 영향을 미칠 수 있다. 치료적 제형은 질환의 진단 전 또는 후에 대상체에 투여될 수 있다. 추가로, 여러 분할 투여량뿐만 아니라 시차 투여량을 매일 또는 순차적으로 투여될 수 있거나, 용량을 계속적으로 주입할 수 있거나, 볼루스 주사할 수 있다. 추가로, 치료적 제형의 투여량은 치료적 또는 예방적 상황의 긴급성으로 표시된 바와 같이 비례적으로 증가 또는 감소될 수 있다.
포유류, 예를 들어, 인간을 포함하는 대상체에 대한 본 발명의 조성물의 투여는 알려진 절차를 사용하여 질환을 예방하거나 치료하기에 효과적인 투여량 및 기간 동안 수행될 수 있다. 치료적 효과를 달성하는 데 필요한 핵산의 유효량은 인자, 예컨대, 사용된 특정 핵산의 활성; 투여 시간; 핵산 배설 속도; 치료의 지속기간; 핵산과 조합하여 사용되는 기타 약물, 화합물 또는 재료; 질환 또는 장애의 상태, 연령, 성별, 체중, 병태, 일반적 건강 및 치료되는 대상체의 이전 의학적 병력, 및 의학 분야에서 잘 알려진 유사 인자에 따라 달라질 수 있다. 투여량 양생법은 최적의 치료적 반응을 제공하도록 조정될 수 있다. 예를 들어, 여러 분할 용량을 매일 투여할 수 있거나, 치료적 상황의 긴급성으로 표시된 바와 같이 용량을 비례적으로 감소시킬 수 있다. 발명의 핵산에 대한 유효 용량 범위의 비-제한적인 예는 약 1 내지 5,000 mg/체중 kg/일이다. 당업자는 관련 인자를 연구하고 과도한 실험 없이 치료적 핵산의 유효량에 관해 결정할 수 있을 것이다.
핵산은 하루에 여러 번만큼 빈번하게 대상체에 투여될 수 있거나, 하루에 한 번, 일주일에 한 번, 2 주마다 한 번, 한 달에 한 번, 또는 더 적은 빈도로, 예컨대, 몇 달마다 한 번 또는 심지어 일 년에 한 번 이하와 같이 덜 빈번하게 투여될 수 있다. 하루당 투약된 핵산의 양은 비-제한적인 예에서 매일, 격일로, 2 일마다, 3 일마다, 4 일마다, 또는 5 일마다 투여될 수 있는 것으로 이해된다. 예를 들어, 격일로 투여하는 경우, 월요일에 하루당 5 mg 용량을 개시하고, 수요일에 제1 후속의 하루당 5 mg 용량을 투여하고, 금요일에 제2 후속의 하루당 5 mg 용량 등을 투여할 수 있다. 용량의 빈도는 당업자에게 용이하게 명백할 것이고, 임의의 수의 인자, 예컨대, 비제한적으로 치료되는 질환의 유형 및 중증도, 동물의 유형 및 연령 등에 따라 달라질 것이다.
본 발명의 약학 조성물에서 활성 성분의 실제 투여량 수준은 대상체에 대한 독성 없이, 특정 대상체, 조성물 및 투여 방식에 대해 원하는 치료적 반응을 달성하는 데 효과적인 활성 성분의 양을 수득하도록 변동될 수 있다.
당업계에 통상의 지식을 가진 의사, 예컨대, 의사 또는 수의사는 필요한 약학 조성물의 유효량을 용이하게 결정하고 처방할 수 있다. 예를 들어, 의사 또는 수의사는 원하는 치료적 효과를 달성하기 위해 필요한 것보다 낮은 수준으로 약학 조성물에 사용된 발명의 핵산의 용량을 출발하고, 원하는 효과가 달성될 때까지 투여량을 점진적으로 증가시킬 수 있다.
특정 실시양태에서, 투여의 용이성 및 투여량의 균일성을 위해 투여량 유닛 형태로 핵산을 제형화하는 것이 특히 유리하다. 본원에 사용된 바와 같은 투여량 유닛 형태는 치료될 대상체에 대한 일원화된(unitary) 투여량으로서 적합한 물리적으로 별개의 유닛을 지칭하며; 각각의 유닛은 필요한 약학 비히클과 관련하여 원하는 치료적 효과를 생산하도록 계산된 치료적 핵산의 미리결정된 수량을 함유한다. 발명의 투여량 유닛 형태는 (a) 핵산의 고유한 특질 및 달성될 특정 치료적 효과, 및 (b) 대상체의 질환 치료를 위한 이러한 핵산을 배합/제형화하는 분야에 내재된 제한에 의해 지시되고 이에 직접적으로 의존한다.
일 실시양태에서, 발명의 조성물은 하루당 1 회 내지 5 회 또는 그 초과 범위의 투여량으로 대상체에 투여된다. 다른 실시양태에서, 발명의 조성물은 1 일마다 1 회, 2 일마다 1 회, 3 일마다 1 회 내지 1 주 1 회, 및 2 주마다 1 회를 비제한적으로 포함하는 투여량 범위로 대상체에 투여된다. 발명의 다양한 조합 조성물의 투여 빈도는 연령, 치료할 질환 또는 장애, 성별, 전반적인 건강 및 기타 인자를 비제한적으로 포함하는 많은 인자에 따라 대상체마다 달라질 것이라는 것이 당업자에게 용이하게 명백할 것이다. 따라서, 발명은 임의의 특정 투여량 양생법으로 제한되는 것으로 해석되어서는 안 되며, 임의의 대상체에 투여될 정확한 투여량 및 조성물은 대상체에 대한 다른 모든 인자를 고려하여 주치의에 의해 결정될 것이다.
투여를 위한 발명의 조성물은 약 1 mg 내지 약 10,000 mg, 약 20 mg 내지 약 9,500 mg, 약 40 mg 내지 약 9,000 mg, 약 75 mg 내지 약 8,500 mg, 약 150 mg 내지 약 7,500 mg, 약 200 mg 내지 약 7,000 mg, 약 3050 mg 내지 약 6,000 mg, 약 500 mg 내지 약 5,000 mg, 약 750 mg 내지 약 4,000 mg, 약 1 mg 내지 약 3,000 mg, 약 10 mg 내지 약 2,500 mg, 약 20 mg 내지 약 2,000 mg, 약 25 mg 내지 약 1,500 mg, 약 50 mg 내지 약 1,000 mg, 약 75 mg 내지 약 900 mg, 약 100 mg 내지 약 800 mg, 약 250 mg 내지 약 750 mg, 약 300 mg 내지 약 600 mg, 약 400 mg 내지 약 500 mg의 범위, 및 이들 사이의 임의의 모든 전체 또는 부분적 증분일 수 있다.
일부 실시양태에서, 발명의 조성물의 용량은 약 1 mg 내지 약 2,500 mg이다. 일부 실시양태에서, 본원에 기재된 조성물에 사용된 발명의 조성물의 용량은 약 10,000 mg 미만, 또는 약 8,000 mg 미만, 또는 약 6,000 mg 미만, 또는 약 5,000 mg 미만, 또는 약 3,000 mg 미만, 또는 약 2,000 mg 미만, 또는 약 1,000 mg 미만, 또는 약 500 mg 미만, 또는 약 200 mg 미만, 또는 약 50 mg 미만이다. 유사하게, 일부 실시양태에서, 본원에 기재된 바와 같은 제2 조성물 (즉, 발명의 조성물에 의해 치료되는 것과 동일한 또는 다른 질환을 치료하는 데 사용되는 약물)의 용량은 약 1,000 mg 미만, 또는 약 800 mg 미만, 또는 약 600 mg 미만, 또는 약 500 mg 미만, 또는 약 400 mg 미만, 또는 약 300 mg 미만, 또는 약 200 mg 미만, 또는 약 100 mg 미만, 또는 약 50 mg 미만, 또는 약 40 mg 미만, 또는 약 30 mg 미만, 또는 약 25 mg 미만, 또는 약 20 mg 미만, 또는 약 15 mg 미만, 또는 약 10 mg 미만, 또는 약 5 mg 미만, 또는 약 2 mg 미만, 또는 약 1 mg 미만, 또는 약 0.5 mg 미만, 및 이들의 임의의 모든 전체 또는 부분적 증분이다.
일 실시양태에서, 본 발명은 단독으로 또는 제2 약학적 약제와 조합하여 발명의 핵산의 치료적 유효량을 보유하는 용기; 및 대상체에서 질환의 하나 이상의 증상을 치료, 예방 또는 감소시키기 위해 핵산을 사용하기 위한 지침서를 포함하는 패키징된 약학 조성물에 관한 것이다.
용어 "용기"는 약학 조성물을 보유하기 위한 임의의 그릇을 포함한다. 예를 들어, 일 실시양태에서, 용기는 약학 조성물을 함유하는 패키징이다. 다른 실시양태에서, 용기는 약학 조성물을 함유하는 패키징이 아니며, 즉, 용기는 패키징된 약학 조성물 또는 패키징되지 않은 약학 조성물 및 약학 조성물의 사용을 위한 지침서를 함유하는 그릇, 예컨대, 상자 또는 바이알이다. 게다가, 패키징 기술은 당업계에 잘 알려져 있다. 약학 조성물의 사용을 위한 지침서는 약학 조성물을 함유하는 패키징에 함유될 수 있으며, 이에 따라 지침서는 패키징된 생성물에 대한 증가된 기능적 관계를 형성한다는 것을 이해해야 한다. 그러나, 지침서는 의도된 기능, 예컨대, 대상체의 질환을 치료 또는 예방하거나 대상체에 영상화제 또는 진단제를 전달하는 것을 수행하는 핵산의 능력에 관한 정보를 함유할 수 있음을 이해해야 한다.
발명의 조성물 중 임의의 것의 투여 경로는 경구, 비강, 비경구, 설하, 경피, 경점막 (예컨대, 설하, 설측, (경)협측, 및 (내)비강), 방광내, 십이지장내, 위내, 직장, 복강-내, 피하, 근육내, 피내, 동맥-내, 정맥내 또는 투여를 포함한다.
적합한 조성물 및 투여량 형태는 예를 들어, 정제, 캡슐, 캐플릿, 환제, 겔 캡, 트로키, 분산액, 현탁액, 용액, 시럽, 과립, 비드, 경피 패치, 겔, 분말, 펠렛, 마그마, 로젠지, 크림, 페이스트, 플라스터, 로션, 디스크, 좌약, 비강 또는 경구 투여용 액체 스프레이, 흡입용 건조 분말 또는 에어로졸 제형, 및 방광내 투여용 조성물 및 제형 등을 포함한다. 본 발명에 유용할 제형 및 조성물은 본원에 기재된 특정 제형 및 조성물로 제한되지 않음을 이해해야 한다.
시스템
일부 실시양태에서, 본 발명은 독립적인 RNA 분자의 시스-절단 및 트랜스-스플라이싱을 위한 시스템에 관한 것이다. 일부 실시양태에서, 본 발명은 단일 RNA 분자의 시스-절단 및 트랜스-스플라이싱 시스템에 관한 것이다. 일부 실시양태에서, 독립적인 RNA 분자 또는 단일 RNA 분자의 단편의 시스-절단 및 트랜스-스플라이싱은 본원에 기재된 바와 같이 관심 전장 단백질을 코딩하는 단일 RNA 분자를 생성한다. 일부 실시양태에서, 시스템은 본원에 기재된 바와 같이 리가아제 또는 리가아제, 예컨대, RtcB를 코딩하는 핵산을 포함한다.
일 실시양태에서, 본 발명은 리보자임의 시스-절단 및 2 개의 독립적인 RNA 분자의 트랜스-스플라이싱을 통해 전장 단백질의 제1 부분 및 제2 부분을 코딩하는 2 개의 별개의 RNA 분자로부터 전장 단백질을 코딩하는 단일 RNA를 생성하기 위한 유도성 시스템에 관한 것이다. 일부 실시양태에서, 시스템은 본원에 기재된 바와 같이 리보자임 인식 서열 및 리보자임을 포함한다. 일부 실시양태에서, 시스템은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 포함한다.
일 실시양태에서, 본 발명은 전장 RNA 바이러스 게놈을 조립하는 시스템에 관한 것이다. 예시적인 RNA 바이러스는 코로나바이러스, 파라믹소바이러스, 오르토믹소바이러스, 레트로바이러스, 렌티바이러스, 알파바이러스, 플라비바이러스, 랍도바이러스, 홍역 바이러스, 뉴캐슬 질환 바이러스 및 피코르나바이러스를 포함하나, 이에 제한되지 않는다. 일 실시양태에서, 시스템은 RNA 바이러스 게놈의 제1 부분을 코딩하고 3' 리보자임을 코딩하는 제1 핵산을 포함한다. 일 실시양태에서, 시스템은 RNA 바이러스 게놈의 제2 부분을 코딩하고 5' 리보자임을 코딩하는 제2 핵산을 포함한다. 일 실시양태에서, 시스템은 RNA 바이러스 게놈의 제1 부분 및 3' 리보자임을 포함한다. 일 실시양태에서, 시스템은 RNA 바이러스 게놈의 제2 부분 및 5' 리보자임을 포함한다. 일 실시양태에서, 시스템은 리가아제 또는 리가아제를 코딩하는 핵산을 포함한다. 일 실시양태에서, 3' 및 5' 리보자임의 시스-절단 시, RNA 바이러스 게놈의 제1 부분 및 RNA 바이러스 게놈의 제2 부분이 함께 결찰되어, 전장 RNA 바이러스 게놈을 생성한다.
생체내
일 실시양태에서, 본 발명은 전장 단백질의 일부를 코딩하는 독립적인 RNA 분자의 시스-절단 및 트랜스-스플라이싱을 통한 하나 이상의 전장 단백질의 전달 및 발현을 위한 시스템에 관한 것이다. 일부 실시양태에서, 시스템은 전통적인 벡터의 패키지 크기를 초과하는 큰 단백질 (예를 들어, AAV 벡터의 패키징 크기를 초과하는 디스트로핀), 핵산 작제물이 생체외에서 합성하기 어려운 합성 반복 도메인 단백질 (예를 들어, 합성 거미줄) 또는 독성/항바이러스 단백질 (예를 들어, DTA)의 전달 및 발현을 허용한다. 일 실시양태에서, 본 발명은 하나 이상의 관심 전장 단백질의 전달 및 발현을 위한 AAV 시스템을 포함한다. 일부 실시양태에서, 시스템은 본원에 기재된 바와 같은 리가아제 또는 리가아제를 코딩하는 핵산을 포함한다.
일 실시양태에서, 발명은 하나 이상의 관심 단백질을 코딩하는 하나 이상의 핵산 분자를 전달하기 위한 렌티바이러스 전달 시스템을 포함한다. 일 양태에서, 렌티바이러스 전달 시스템은 (1) 패키징 플라스미드, (2) 외피 플라스미드, 및 (3) 전달 플라스미드를 포함한다. 일 실시양태에서, 전달 플라스미드는 제1 RNA 분자 및 제2 RNA 분자를 코딩한다.
일 실시양태에서, 발명은 제1 렌티바이러스 벡터 및 제2 렌티바이러스 벡터를 포함하는 듀얼 렌티바이러스 전달 시스템을 포함한다. 일 실시양태에서, 제1 렌티바이러스 벡터 시스템은 (1) 패키징 플라스미드, (2) 외피 플라스미드, 및 (3) 제1 전달 플라스미드를 포함한다. 일 실시양태에서, 제2 렌티바이러스 벡터 시스템은 (1) 패키징 플라스미드, (2) 외피 플라스미드, 및 (3) 제2 전달 플라스미드를 포함한다. 일 실시양태에서, 제1 전달 플라스미드는 제1 RNA 분자를 코딩한다. 일 실시양태에서, 제2 전달 플라스미드는 제2 RNA 분자를 코딩한다.
일 실시양태에서, 패키징 플라스미드는 gag-pol 폴리단백질을 코딩하는 핵산 서열을 포함한다. 일 실시양태에서, gag-pol 폴리단백질은 촉매적으로 사멸한 인테그라제를 포함한다. 일 실시양태에서, gag-pol 폴리단백질은 D116N 인테그라제 돌연변이를 포함한다.
일 실시양태에서, 외피 플라스미드는 외피 단백질을 코딩하는 핵산 서열을 포함한다. 일 실시양태에서, 외피 플라스미드는 HIV 외피 단백질을 코딩하는 핵산 서열을 포함한다. 일 실시양태에서, 외피 플라스미드는 수포성 구내염 바이러스 g-단백질 (VSV-g) 외피 단백질을 코딩하는 핵산 서열을 포함한다. 일 실시양태에서, 외피 단백질은 원하는 세포 유형에 기반하여 선택될 수 있다.
일 실시양태에서, 단일 전달 플라스미드의 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 단백질 코딩 영역 및 3' 리보자임을 포함한다. 일 실시양태에서, 단일 전달 플라스미드의 제2 RNA 분자는 관심 단백질의 제2 부분을 코딩하는 단백질 코딩 영역 및 5' 리보자임을 포함한다. 일 실시양태에서, 전달 플라스미드는 5' 긴 말단 반복부 (LTR) 서열 및 3' LTR 서열을 포함한다. 일 실시양태에서, 3' LTR은 자기-비활성화 (SIN) LTR이다. 따라서, 일 실시양태에서, 5' LTR은 U3 서열, R 서열 및 U5 서열을 포함하며, 3' LTR은 R 서열 및 U5 서열을 포함하지만 U3 서열은 포함하지 않는다. 일 실시양태에서, 5'LTR 및 3'LTR은 관심 단백질의 제1 부분 및 관심 단백질의 제2 부분을 코딩하는 서열에 플랭킹된다.
일 실시양태에서, 제1 전달 플라스미드의 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 단백질 코딩 영역 및 3' 리보자임을 포함한다. 일 실시양태에서, 제2 전달 플라스미드의 제2 RNA 분자는 관심 단백질의 제2 부분을 코딩하는 단백질 코딩 영역 및 5' 리보자임을 포함한다. 일 실시양태에서, 제1 및 제2 전달 플라스미드는 5' 긴 말단 반복부 (LTR) 서열 및 3' LTR 서열을 포함한다. 일 실시양태에서, 3' LTR은 자기-비활성화 (SIN) LTR이다. 따라서, 일 실시양태에서, 5' LTR은 U3 서열, R 서열 및 U5 서열을 포함하며, 3' LTR은 R 서열 및 U5 서열을 포함하지만 U3 서열은 포함하지 않는다. 일 실시양태에서, 제1 전달 플라스미드의 5'LTR 및 3'LTR은 관심 단백질의 제1 부분 및 3' 리보자임을 코딩하는 서열에 플랭킹된다. 일 실시양태에서, 제2 전달 플라스미드의 5'LTR 및 3'LTR은 관심 단백질의 제2 부분 및 5' 리보자임을 코딩하는 서열에 플랭킹된다.
일 실시양태에서, 패키징 플라스미드, 외피 플라스미드, 및 전달 플라스미드는 세포에 도입된다. 일 실시양태에서, 세포는 gag-pol 단백질을 코딩하는 핵산 서열을 전사 및 번역하여, gag-pol 폴리단백질을 생산한다. 일 실시양태에서, 세포는 외피 단백질을 생산하기 위해 외피 단백질을 코딩하는 핵산 서열을 전사 및 번역한다. 일 실시양태에서, 세포는 단일 전달 플라스미드를 전사하여, 제1 RNA 분자 및 제2 RNA 분자를 제공한다. 일 실시양태에서, 세포는 제1 전달 플라스미드를 전사하여, 제1 RNA 분자를 제공하고, 제2 전달 플라스미드를 전사하여, 제2 RNA 분자를 제공한다. 일 실시양태에서, gag-pol 단백질, 외피 폴리단백질, 제1 RNA 분자 및 제2 RNA 분자는 바이러스 입자에 패키징된다. 일 실시양태에서, 바이러스 입자는 세포 배지로부터 수집된다. 일 실시양태에서, 바이러스 입자는 표적 세포를 형질도입하며, 여기서 3' 리보자임은 제1 RNA 분자에서 스스로를 촉매화하여, 3'P 또는 2'3' cP 단부를 생성하고, 5' 리보자임은 제2 RNA 분자에서 스스로를 촉매화하여, 5'OH 단부를 생성하고, 내인성 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제는 3'P 또는 2'3' cP 단부를 5'OH 단부에 결찰시켜, 관심 단백질을 코딩하는 완전한 RNA 분자를 생성하고, 세포는 관심 단백질을 번역한다.
일 실시양태에서, 패키징 플라스미드, 외피 플라스미드, 및 제1 전달 플라스미드는 세포에 도입된다. 일 실시양태에서, 세포는 gag-pol 단백질을 코딩하는 핵산 서열을 전사 및 번역하여, gag-pol 폴리단백질을 생산한다. 일 실시양태에서, 세포는 외피 단백질을 코딩하는 핵산 서열을 전사 및 번역하여, 외피 단백질을 생산한다. 일 실시양태에서, 세포는 제1 전달 플라스미드를 전사하여, 제1 RNA 분자를 제공한다. 일 실시양태에서, gag-pol 단백질, 외피 폴리단백질, 제1 RNA 분자는 제1 바이러스 입자에 패키징된다. 일 실시양태에서, 제1 바이러스 입자는 세포 배지로부터 수집된다.
일 실시양태에서, 패키징 플라스미드, 외피 플라스미드, 및 제2 전달 플라스미드는 세포에 도입된다. 일 실시양태에서, 세포는 gag-pol 단백질을 코딩하는 핵산 서열을 전사 및 번역하여, gag-pol 폴리단백질을 생산한다. 일 실시양태에서, 세포는 외피 단백질을 코딩하는 핵산 서열을 전사 및 번역하여, 외피 단백질을 생산한다. 일 실시양태에서, 세포는 제2 전달 플라스미드를 전사하여 제2 RNA 분자를 제공한다. 일 실시양태에서, gag-pol 단백질, 외피 폴리단백질, 제2 RNA 분자는 제2 바이러스 입자에 패키징된다. 일 실시양태에서, 제2 바이러스 입자는 세포 배지로부터 수집된다.
일 실시양태에서, 제1 바이러스 입자 및 제2 바이러스 입자는 표적 세포를 형질도입하며, 여기서 3' 리보자임은 제1 RNA 분자에서 스스로를 촉매화하여, 3'P 또는 2'3' cP 단부를 생성하고, 5' 리보자임은 제2 RNA 분자에서 스스로를 촉매화하여, 5'OH 단부를 생성하고, 내인성 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제는 3'P 또는 2'3' cP 단부를 5'OH 단부에 결찰시켜, 관심 단백질을 코딩하는 완전한 RNA 분자를 생성하고, 세포는 관심 단백질을 번역한다. 일 실시양태에서, 본 발명은 분할 전구체 RNA 분자로부터 원치 않은 부분 단백질 발현을 방지하는 시스템에 관한 것이다. 일 실시양태에서, 시스템은 본원에 기재된 바와 같이 분할 전구체 RNA 분자에서 단백질 분해 서열의 번역 제어를 통합하는 것을 포함한다.
일 실시양태에서, 본 발명은 리보자임의 시스-절단 및 한 쌍의 독립적인 RNA 분자의 트랜스-스플라이싱을 통해 관심 단백질의 일부를 코딩하는 2 개 이상의 쌍의 독립적인 RNA 분자로부터 2 개 이상의 관심 단백질을 발현하기 위한 시스템에 관한 것이다. 일 실시양태에서, 독립적인 RNA 분자의 각각의 개별 쌍은 별개의 리딩 프레임을 갖고, 이로써 원하지 않은 쌍의 트랜스-스플라이싱은 본원에 기재된 바와 같이 전장 기능적 단백질의 번역을 초래하지 않는다. 일부 실시양태에서, 시스템은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 포함한다.
일 실시양태에서, 본 발명은 관심 전장 단백질 및 카고 서열의 전달 및 발현을 위한 시스템을 포함한다. 일 실시양태에서, 상기 시스템은 3' 단부에서 합성 인트론에 연결된 관심 단백질의 제1 부분을 코딩하는 RNA의 제1 부분 및 5' 단부에서 합성 인트론에 연결된 관심 단백질의 제2 부분을 코딩하는 RNA의 제2 부분을 포함한다. 일 실시양태에서, 상기 합성 인트론은 5' 리보자임 서열 및 3' 리보자임 서열에 의해 양측에 플랭킹된다. 일 실시양태에서, 상기 합성 인트론은 상기 5' 리보자임 서열 및 3' 리보자임 서열 사이에 위치한 카고 서열을 포함한다. 일 실시양태에서, 5' 리보자임 서열 및 3' 리보자임 서열의 자기-절단은 다음의 3 개의 별개의 RNA 분자를 생성한다: 1) 관심 단백질의 제1 부분을 코딩하는 RNA의 제1 부분을 포함하는 제1 단편, 2) 합성 인트론을 포함하는 제2 단편, 3) 관심 단백질의 제2 부분을 코딩하는 RNA의 제2 부분을 포함하는 제3 단편. 일 실시양태에서, 제2 단편의 양립가능한 단부가 결찰되어, 카고 서열을 포함하는 합성 인트론을 포함하는 원형 RNA 분자를 생성한다. 실시양태에서, 제1 단편 및 제3 단편은 함께 결찰되어, 단일 전장 선형 RNA 분자를 생성한다. 일 실시양태에서, 관심 전장 단백질은 치료적 단백질, 리포터 단백질, 재조합효소, 항생제 저항성 유전자 생성물, 항체, 또는 Cas9 단백질을 포함한다. 일 실시양태에서, 카고 서열은 치료적 핵산 서열 (예를 들어, miRNA 서열 또는 CRISPR 가이드 RNA 서열)을 포함하거나, 치료적 단백질을 코딩한다. 일부 실시양태에서, 관심 전장 단백질은 Cas9를 포함하고, 카고 서열은 가이드 RNA 서열을 포함하여, 편집을 위해 Cas9를 특정 게놈 서열로 표적화한다. 일부 실시양태에서, 시스템은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 포함한다.
일 실시양태에서, 본 발명은 하나 이상의 트랜스-절단 조작된 리보자임을 포함하는 유전자 편집용 시스템을 포함한다. 일부 실시양태에서, 시스템은 질환 유발 돌연변이의 업스트림 및 다운스트림를 표적화하는 2 개의 트랜스-절단 조작된 리보자임을 포함한다. 일부 실시양태에서, 질환 유발 돌연변이의 업스트림 및 다운스트림의 트랜스-절단은 질환 유발 돌연변이의 제거를 초래한다. 일부 실시양태에서, 유전자의 나머지 부분은 질환 유발 돌연변이의 트랜스-절단 후에 함께 트랜스-스플라이싱된다. 일부 실시양태에서, 트랜스-스플라이싱된 유전자는 기능적 단백질로서 발현된다. 일부 실시양태에서, 시스템은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 포함한다.
생체외
일 실시양태에서, 본 발명은 관심 단백질을 코딩하는 RNA 분자를 생성하기 위한 생체외 시스템을 포함한다. 일 실시양태에서, 시스템은 2 개 이상의 RNA 분자를 포함한다. 일 실시양태에서, 상기 2 개 이상의 RNA 분자는 제1 RNA 분자 및 제2 RNA 분자를 포함한다.
일 실시양태에서, 상기 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 3' 리보자임을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 본원에 기재된 바와 같이, 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함한다.
일 실시양태에서, 상기 제2 RNA 분자는 관심 단백질의 제2 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 제2 RNA 분자는 5' 리보자임을 포함한다. 일 실시양태에서, 상기 제2 RNA 분자는 본원에 기재된 바와 같이, 관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함한다.
일 실시양태에서, 관심 단백질을 코딩하는 RNA 분자를 생성하기 위한 생체외 시스템은 리가아제를 추가로 포함한다. 일 실시양태에서, 리가아제는 제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역으로부터 RNA 분자의 조립을 유도한다. 일 실시양태에서, 리가아제는 본원에 기재된 바와 같이, RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다.
일 실시양태에서, 본 발명은 관심 반복 도메인 단백질을 코딩하는 RNA 분자를 생성하기 위한 생체외 시스템을 포함한다. 일 실시양태에서, 상기 시스템은 제1 RNA 분자, 하나 이상의 추가적인 RNA 분자, 및 마지막 RNA 분자를 포함한다.
일 실시양태에서, 상기 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 3' 리보자임을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함한다. 일 실시양태에서, 상기 3' 리보자임은 제1 RNA 분자에서 스스로를 촉매화하여, 3'P 또는 2'3' cP 단부를 생성한다. 일 실시양태에서, 상기 제1 RNA 분자는 5' 태그를 추가로 포함한다. 일 실시양태에서, 상기 5' 태그는 고체 지지체에 대한 상기 제1 RNA 분자의 부착을 매개한다.
일 실시양태에서, 상기 하나 이상의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함한다. 일 실시양태에서, 상기 5' 리보자임은 스스로를 절단하여, 5'OH 단부를 생성한다. 일 실시양태에서, 상기 3' 리보자임 인식 서열은 본원에 기재된 바와 같이, VS-S 서열을 포함한다.
일 실시양태에서, 상기 마지막 RNA 분자는 관심 단백질의 마지막 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 마지막 RNA 분자는 5' 리보자임을 포함한다. 일 실시양태에서, 상기 마지막 RNA 분자는 관심 단백질의 마지막 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함한다. 일 실시양태에서, 상기 5' 리보자임은 스스로를 절단하여, 5'OH 단부를 생성한다.
일 실시양태에서, 시스템은 리보자임을 추가로 포함한다. 일 실시양태에서, 상기 리보자임은 본원에 기재된 바와 같이 VS-Rz를 포함한다. 일 실시양태에서, 상기 VS-Rz는 본원에 기재된 바와 같이 VS-S를 인식하고, 하나 이상의 추가적인 RNA 분자로부터 이의 절단을 매개한다. 일 실시양태에서, 상기 절단은 3'P 또는 2'3' cP 단부를 생성한다.
일 실시양태에서, 시스템은 리가아제를 포함한다. 일부 실시양태에서, 리가아제는 제1 RNA 분자의 3'P 또는 2'3' cP 단부를 하나 이상의 추가적인 RNA 분자의 5'OH 단부에 결찰시킨다. 일부 실시양태에서, 리가아제는 하나 이상의 추가적인 RNA 분자의 3'P 또는 2'3' cP 단부를 마지막 RNA 분자의 5'OH 단부에 결찰시킨다. 일부 실시양태에서, 리가아제는 제1 RNA 분자의 3'P 또는 2'3' cP 단부를 하나 이상의 추가적인 RNA 분자의 5'OH 단부에 결찰시키고, 하나 이상의 추가적인 RNA 분자의 3'P 또는 2'3' cP 단부를 마지막 RNA 분자의 5'OH 단부에 결찰시켜, N-말단 도메인, 하나 이상의 추가적인 도메인 및 C-말단 도메인을 코딩하는 완전한 RNA 분자를 생성한다. 일부 실시양태에서, 리가아제는 본원에 기재된 바와 같이, RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다.
방법
일부 실시양태에서, 본 발명은 독립적인 RNA 분자의 시스-절단 및 트랜스-스플라이싱 방법에 관한 것이다. 일부 실시양태에서, 본 발명은 단일 RNA 분자의 시스-절단 및 트랜스-스플라이싱 방법에 관한 것이다. 일부 실시양태에서, 독립적인 RNA 분자 또는 단일 RNA 분자의 단편의 시스-절단 및 트랜스-스플라이싱은 본원에 기재된 바와 같이, 관심 전장 단백질을 코딩하는 단일 RNA 분자를 생성한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 투여하는 단계를 포함한다.
일 실시양태에서, 본 발명은 리보자임의 시스-절단 및 2 개의 독립적인 RNA 분자의 트랜스-스플라이싱을 통해 전장 단백질의 제1 부분 및 제2 부분을 코딩하는 2 개의 별개의 RNA 분자로부터 전장 단백질을 코딩하는 단일 RNA를 생성하기 위한 유도성 방법에 관한 것이다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이 리보자임 인식 서열 및 리보자임을 포함한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 투여하는 단계를 포함한다.
생체내
일 실시양태에서, 본 발명은 관심 단백질을 코딩하는 RNA 분자를 생성하는 방법을 포함한다. 일부 실시양태에서, 방법은 2 개 이상의 핵산 분자를 세포 또는 조직에 투여하는 단계를 포함한다. 일 실시양태에서, 2 개 이상의 핵산 분자는 제1 RNA 분자 및 제2 RNA 분자를 포함한다. 일부 실시양태에서, 2 개 이상의 핵산 분자는 제1 RNA 분자 및 제2 RNA 분자를 코딩한다.
일 실시양태에서, 상기 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 3' 리보자임을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함한다. 일 실시양태에서, 상기 3' 리보자임은 제1 RNA 분자에서 스스로를 촉매화하여, 3'P 또는 2'3' cP 단부를 생성한다. 일 실시양태에서, 3' 리보자임은 리보자임의 HDV 패밀리의 구성원이다.
일 실시양태에서, 상기 제2 RNA 분자는 관심 단백질의 제2 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 제2 RNA 분자는 5' 리보자임을 포함한다. 일 실시양태에서, 상기 제2 RNA 분자는 관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함한다. 일 실시양태에서, 상기 5'리보자임은 제2 RNA 분자에서 스스로를 촉매화하여, 5'OH 단부를 생성한다. 일 실시양태에서, 5' 리보자임은 리보자임의 HH 패밀리의 구성원이다.
일 실시양태에서, 상기 3'P 또는 2'3' cP 단부는 5'OH 단부에 결찰되어, 제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역을 포함하는 RNA 분자를 형성한다.
일 실시양태에서, 방법은 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 세포 또는 조직에 투여하는 단계를 포함하며, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임을 포함한다.
일 실시양태에서, 방법은 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 세포 또는 조직에 투여하는 단계를 포함하며, 각각의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함한다. 일 실시양태에서, 3' 리보자임 인식 서열은 VS-S를 포함한다. 일 실시양태에서, 리보자임은 VS이다.
일 실시양태에서, 방법은 리가아제 및 리가아제를 코딩하는 핵산 분자로 이루어진 군으로부터 선택된 하나 이상을 세포 또는 조직에 투여하는 단계를 포함한다. 일 실시양태에서, 리가아제는 제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역으로부터 RNA 분자의 조립을 유도한다. 일 실시양태에서, 리가아제는 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다.
일부 실시양태에서, 방법은 세포 또는 조직에 관심 단백질의 제1 부분을 코딩하는 단백질 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자, 및 관심 단백질의 제2 부분을 코딩하는 단백질 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 코딩하는 하나 이상의 AAV 벡터를 투여하는 단계를 포함한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 투여하는 단계를 포함한다.
일부 실시양태에서, 방법은 제1 AAV 벡터 및 제2 AAV 벡터를 포함하는 2 개 이상의 AAV 벡터를 투여하는 단계를 포함한다. 일 실시양태에서, 제1 AAV 벡터는 관심 단백질의 제1 부분을 코딩하는 단백질 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 코딩한다. 일 실시양태에서, 제2 AAV 벡터는 세포 또는 조직에 대한 관심 단백질의 제2 부분을 코딩하는 단백질 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 코딩한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 투여하는 단계를 포함한다.
일부 실시양태에서, 방법은 세포 또는 조직에 관심 단백질의 제1 부분을 코딩하는 단백질 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자, 및 관심 단백질의 제2 부분을 코딩하는 단백질 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 코딩하는 하나 이상의 렌티바이러스 벡터를 투여하는 단계를 포함한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 투여하는 단계를 포함한다.
일부 실시양태에서, 방법은 제1 렌티바이러스 벡터 및 제2 렌티바이러스 벡터를 포함하는 2 개 이상의 렌티바이러스 벡터를 투여하는 단계를 포함한다. 일 실시양태에서, 제1 렌티바이러스 벡터는 관심 단백질의 제1 부분을 코딩하는 단백질 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 코딩한다. 일 실시양태에서, 제2 렌티바이러스 벡터는 세포 또는 조직에 대한 관심 단백질의 제2 부분을 코딩하는 단백질 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 코딩한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 투여하는 단계를 포함한다.
일부 실시양태에서, 방법은 세포 또는 조직에 관심 단백질의 제1 부분을 코딩하는 단백질 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자, 및 관심 단백질의 제2 부분을 코딩하는 단백질 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 제공하기 위해 하나 이상의 렌티바이러스 벡터 전달 시스템을 투여하는 단계를 포함한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 투여하는 단계를 포함한다.
일부 실시양태에서, 방법은 제1 렌티바이러스 벡터 전달 시스템 및 제2 렌티바이러스 벡터 전달 시스템을 포함하는 2 개 이상의 렌티바이러스 벡터 전달 시스템을 투여하는 단계를 포함한다. 일 실시양태에서, 제1 렌티바이러스 벡터 전달 시스템은 관심 단백질의 제1 부분을 코딩하는 단백질 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 제공한다. 일 실시양태에서, 제2 렌티바이러스 벡터 전달 시스템은 세포 또는 조직에 관심 단백질의 제2 부분을 코딩하는 단백질 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 제공한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 투여하는 단계를 포함한다.
일부 실시양태에서, 방법은 AAV 벡터, 렌티바이러스 벡터, 렌티바이러스 벡터 전달 시스템 또는 이들의 조합으로 이루어진 군으로부터 선택된 2 개 이상의 전달 비히클을 투여하는 단계를 포함한다. 일 실시양태에서, 상기 2 개 이상의 전달 비히클은 제1 전달 비히클 및 제2 전달 비히클을 포함한다. 일 실시양태에서, 제1 전달 비히클은 관심 단백질의 제1 부분을 코딩하는 단백질 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 제공한다. 일 실시양태에서, 제2 전달 비히클은 세포 또는 조직에 관심 단백질의 제2 부분을 코딩하는 단백질 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 제공한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 투여하는 단계를 포함한다.
유전자를 세포에 도입하고 발현시키는 방법은 당업계에 알려져 있다. 발현 벡터의 맥락에서, 벡터는 당업계의 임의의 방법에 의해 숙주 세포, 예컨대, 포유동물, 박테리아, 효모 또는 곤충 세포에 용이하게 도입될 수 있다. 예를 들어, 발현 벡터는 물리적, 화학적 또는 생물학적 수단에 의해 숙주 세포에 전달될 수 있다.
폴리뉴클레오티드를 숙주 세포에 도입하기 위한 물리적 방법은 칼슘 포스페이트 침전, 리포펙션, 유전자총, 미세주사, 및 전기천공 등을 포함한다. 벡터 및/또는 외인성 핵산을 포함하는 세포를 생산하는 방법은 당업계에 잘 알려져 있다. 예를 들어, Sambrook et al. (2012, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, New York)을 참고한다. 폴리뉴클레오티드를 숙주 세포에 도입하기 위한 예시적인 방법은 칼슘 포스페이트 형질주입이다.
관심 폴리뉴클레오티드를 숙주 세포에 도입하기 위한 생물학적 방법은 DNA 및 RNA 벡터의 사용을 포함한다. 바이러스 벡터, 특히 레트로바이러스 벡터는 유전자를 포유동물, 예컨대, 인간 세포에 삽입하기 위해 가장 널리 사용되는 방법이 되었다. 다른 바이러스 벡터는 렌티바이러스, 폭스바이러스, 단순 헤르페스 바이러스 I, 아데노바이러스 및 아데노-연관 바이러스 등으로부터 유래될 수 있다. 예를 들어, 미국 특허 제5,350,674호 및 제5,585,362호를 참고한다.
폴리뉴클레오티드를 숙주 세포에 도입하기 위한 화학적 수단은 콜로이드 분산 시스템, 예컨대, 거대분자 복합체, 나노캡슐, 미소구체, 비드, 및 수-중-유 에멀젼, 미셀, 혼합 미셀 및 리포솜을 포함하는 지질-기반 시스템을 포함한다. 생체외 및 생체내 전달 비히클로서 사용하기 위한 예시적인 콜로이드 시스템은 리포솜 (예컨대, 인공 막 소포)이다.
비-바이러스 전달 시스템이 활용되는 경우, 예시적인 전달 비히클은 리포솜이다. 지질 제형의 사용은 핵산을 (생체외, 엑스 비보 또는 생체내에서) 숙주 세포에 도입하기 위해 고려된다. 다른 양태에서, 핵산은 지질과 연관될 수 있다. 지질과 연관된 핵산은 리포솜의 수성 내부에 캡슐화되거나, 리포솜의 지질 이중층 내에 산재되어 있거나, 리포솜 및 올리고뉴클레오티드 둘 모두와 연관된 연결 분자를 통해 리포솜에 부착되거나, 리포솜에 포획되거나, 리포솜과 복합체화되거나, 지질을 함유하는 용액에 분산되거나, 지질과 혼합되거나, 지질과 조합되거나, 지질에 현탁액으로서 함유되거나, 미셀을 함유하거나 미셀과 복합체되거나, 달리 지질과 연관될 수 있다. 지질, 지질/DNA 또는 지질/발현 벡터 연관된 조성물은 용액 중 임의의 특정 구조로 제한되지 않는다. 예를 들어, 이중층 구조, 미셀 또는 "붕괴된" 구조로 존재할 수 있다. 이들은 또한 용액에 단순히 산재되어, 크기 또는 형상이 균일하지 않은 응집체를 형성할 수 있다. 지질은 자연 발생 또는 합성 지질일 수 있는 지방 물질이다. 예를 들어, 지질은 세포질에서 자연적으로 발생하는 지방 방울뿐만 아니라 장-쇄 지방족 탄화수소 및 이들의 유도체, 예컨대, 지방산, 알콜, 아민, 아미노 알콜 및 알데히드를 함유하는 화합물 부류를 포함한다.
사용에 적합한 지질은 상업적 공급원으로부터 수득될 수 있다. 예를 들어, 디미리스틸 포스파티딜콜린 ("DMPC")은 Sigma, St. Louis, MO로부터 수득될 수 있고; 디세틸 포스페이트 ("DCP")는 K & K Laboratories (Plainview, NY)로부터 수득될 수 있고; 콜레스테롤 ("Choi")은 Calbiochem-Behring으로부터 수득될 수 있으며; 디미리스틸 포스파티딜글리세롤 ("DMPG") 및 기타 지질은 Avanti Polar Lipids, Inc. (Birmingham, AL)로부터 수득될 수 있다. 클로로포름 또는 클로로포름/메탄올 중 지질의 스톡 용액은 약 -20℃에서 저장될 수 있다. 클로로포름은 메탄올보다 더 용이하게 증발되기 때문에 유일한 용매로서 사용된다. "리포솜"은 봉입된 지질 이중층 또는 응집체의 생성에 의해 형성된 다양한 단일 및 다중라멜라 지질 비히클을 포함하는 일반적인 용어이다. 리포솜은 인지질 이중층 막 및 내부 수성 매질을 갖는 소포 구조를 갖는 것을 특징으로 할 수 있다. 다중라멜라 리포솜은 수성 매질에 의해 분리된 다중 지질층을 가지고 있다. 이들은 인지질이 과량의 수용액에 현탁되는 경우 자발적으로 형성된다. 지질 구성요소는 닫힌 구조의 형성 전에 자기-재배열을 거치고, 지질 이중층 사이에 물 및 용해된 용질을 포획한다 (Ghosh et al., 1991 Glycobiology 5: 505-10). 그러나, 용액에서 정상적인 소포 구조와 상이한 구조를 갖는 조성물이 또한 포함된다. 예를 들어, 지질은 미셀 구조를 가정하거나, 단지 지질 분자의 비균일한 응집체로서 존재할 수 있다. 리포펙타민-핵산 복합체가 또한 고려된다.
외인성 핵산을 숙주 세포에 도입하는 데 사용된 방법에 관계없이, 숙주 세포에서 재조합 DNA 서열의 존재를 확인하기 위해, 다양한 검정이 수행될 수 있다. 이러한 검정은 예를 들어, 당업자에게 잘 알려진 "분자 생물학적" 검정, 예컨대, 서던 및 노던 블롯팅, RT-PCR 및 PCR; "생화학적" 검정, 예컨대, 면역학적 수단 (ELISA 및 웨스턴 블롯)에 의해 또는 발명의 범주 내에 속하는 약제를 식별하기 위해 본원에 기재된 검정에 의해 특정 펩티드의 존재 또는 부재를 검출하는 것을 포함한다.
일 실시양태에서, 본 발명은 리보자임의 시스-절단 및 한 쌍의 독립적인 RNA 분자의 트랜스-스플라이싱을 통해 관심 단백질의 일부를 코딩하는 2 개 이상의 쌍의 독립적인 RNA 분자로부터 2 개 이상의 관심 단백질을 발현시키는 방법에 관한 것이다. 일 실시양태에서, 방법은 RNA 분자를 코딩하거나 포함하는 1, 2 또는 3 개의 쌍의 핵산 분자를 투여하는 단계를 포함하며, 여기서 독립적인 RNA 분자의 각각의 개별 쌍은 별개의 리딩 프레임을 갖고, 이로써 원하지 않은 쌍의 트랜스-스플라이싱은 전장 기능적 단백질의 번역을 초래하지 않는다. 일 실시양태에서, 방법은 리가아제 및 리가아제를 코딩하는 핵산 분자로 이루어진 군으로부터 선택된 하나 이상을 세포 또는 조직에 투여하는 단계를 추가로 포함한다. 일 실시양태에서, 리가아제는 본원에 기재된 바와 같이, RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다.
일 실시양태에서, 본 발명은 관심 전장 단백질 및 카고 서열의 전달 및 발현의 방법을 포함한다. 일 실시양태에서, 상기 방법은 3' 단부에서 합성 인트론에 연결된 관심 단백질의 제1 부분을 코딩하는 RNA의 제1 부분 및 5' 단부에서 합성 인트론에 연결된 관심 단백질의 제2 부분을 코딩하는 RNA의 제2 부분을 세포 또는 조직에 투여하는 단계를 포함한다. 일 실시양태에서, 상기 합성 인트론은 5' 리보자임 서열 및 3' 리보자임 서열에 의해 양측에 플랭킹된다. 일 실시양태에서, 상기 합성 인트론은 상기 5' 리보자임 서열 및 3' 리보자임 서열 사이에 위치한 카고 서열을 포함한다. 일 실시양태에서, 5' 리보자임 서열 및 3' 리보자임 서열의 자기-절단은 다음의 3 개의 별개의 RNA 분자를 생성한다: 1) 관심 단백질의 제1 부분을 코딩하는 RNA의 제1 부분을 포함하는 제1 단편, 2) 합성 인트론을 포함하는 제2 단편, 3) 관심 단백질의 제2 부분을 코딩하는 RNA의 제2 부분을 포함하는 제3 단편. 일 실시양태에서, 제2 단편의 양립가능한 단부가 결찰되어, 카고 서열을 포함하는 합성 인트론을 포함하는 원형 RNA 분자를 생성한다. 실시양태에서, 제1 단편 및 제3 단편은 함께 결찰되어, 단일 전장 선형 RNA 분자를 생성한다. 일 실시양태에서, 관심 전장 단백질은 치료적 단백질, 리포터 단백질, 재조합효소, 항생제 저항성 유전자 생성물, 항체, 또는 Cas9 단백질을 포함한다. 일 실시양태에서, 카고 서열은 치료적 핵산 서열 (예를 들어, miRNA 서열 또는 CRISPR 가이드 RNA 서열)을 포함하거나, 치료적 단백질을 코딩한다. 일부 실시양태에서, 관심 전장 단백질은 Cas9를 포함하고, 카고 서열은 가이드 RNA 서열을 포함하여, 편집을 위해 Cas9를 특정 게놈 서열로 표적화한다. 일부 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 세포 또는 조직에 투여하는 단계를 포함한다.
일 실시양태에서, 본 발명은 하나 이상의 트랜스-절단 조작된 리보자임을 포함하는 유전자 편집 방법을 포함한다. 일부 실시양태에서, 방법은 제1 트랜스-절단 조작된 리보자임 및 제2 트랜스-절단 조작된 리보자임을 투여하는 단계를 포함하며, 여기서 제1 트랜스-절단 조작된 리보자임은 질환 유발 돌연변이의 업스트림을, 제2 트랜스-절단 조작된 리보자임은 이의 다운스트림을 표적화한다. 일부 실시양태에서, 질환 유발 돌연변이의 업스트림 및 다운스트림에서의 트랜스-절단은 질환 유발 돌연변이의 제거를 초래한다. 일부 실시양태에서, 유전자의 나머지 부분은 질환 유발 돌연변이의 트랜스-절단 후에 함께 트랜스-스플라이싱된다. 일부 실시양태에서, 트랜스-스플라이싱된 유전자는 기능적 단백질로서 발현된다.
일 실시양태에서, 본 발명은 전장 RNA 바이러스 게놈을 조립하는 생체내 방법에 관한 것이다. 예시적인 RNA 바이러스는 코로나바이러스, 파라믹소바이러스, 오르토믹소바이러스, 레트로바이러스, 렌티바이러스, 알파바이러스, 플라비바이러스, 랍도바이러스, 홍역 바이러스, 뉴캐슬 질환 바이러스 및 피코르나바이러스를 포함하나, 이에 제한되지 않는다. 일 실시양태에서, 방법은 RNA 바이러스 게놈의 제1 부분을 코딩하고 3' 리보자임을 코딩하는 제1 핵산을 세포 또는 조직에 투여하는 단계를 포함한다. 일 실시양태에서, 방법은 RNA 바이러스 게놈의 제2 부분을 코딩하고 5' 리보자임을 코딩하는 제2 핵산을 세포 또는 조직에 투여하는 단계를 포함한다. 일 실시양태에서, 방법은 RNA 바이러스 게놈의 제1 부분 및 3' 리보자임을 포함하는 제1 RNA 분자를 세포 또는 조직에 투여하는 단계를 포함한다. 일 실시양태에서, 방법은 RNA 바이러스 게놈의 제2 부분 및 5' 리보자임을 포함하는 제2 RNA 분자를 세포 또는 조직에 투여하는 단계를 포함한다. 일 실시양태에서, 방법은 본원에 기재된 바와 같이, 리가아제 또는 리가아제를 코딩하는 핵산을 세포 또는 조직에 투여하는 단계를 포함한다. 일 실시양태에서, 3' 및 5' 리보자임의 시스-절단 시, RNA 바이러스 게놈의 제1 부분 및 RNA 바이러스 게놈의 제2 부분이 함께 결찰되어, 전장 RNA 바이러스 게놈을 생성한다.
생체외
일 실시양태에서, 본 발명은 관심 단백질을 코딩하는 RNA 분자를 생성하는 생체외 방법을 포함한다. 일 실시양태에서, 방법은 2 개 이상의 RNA 분자를 제공하는 단계를 포함한다. 일 실시양태에서, 상기 단계는 제1 RNA 분자 및 제2 RNA 분자를 제공하는 단계를 포함한다.
일 실시양태에서, 상기 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 3' 리보자임을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함한다.
일 실시양태에서, 상기 제2 RNA 분자는 관심 단백질의 제2 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 제2 RNA 분자는 5' 리보자임을 포함한다. 일 실시양태에서, 상기 제2 RNA 분자는 관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함한다.
일 실시양태에서, 관심 단백질을 코딩하는 RNA 분자를 생성하는 생체외 방법은 리가아제를 제공하는 단계를 추가로 포함한다. 일 실시양태에서, 리가아제는 제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역으로부터 RNA 분자의 조립을 유도한다. 일 실시양태에서, 리가아제는 본원에 기재된 바와 같이, RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다.
일 실시양태에서, 본 발명은 관심 다중-도메인 단백질을 코딩하는 RNA 분자를 생성하는 생체외 방법을 포함한다. 일 실시양태에서, 방법은 a) 제1 RNA 분자를 제공하는 단계, b) 하나 이상의 추가적인 RNA 분자를 제공하는 단계, c) 리보자임을 제공하는 단계, 및 d) 마지막 RNA 분자를 제공하는 단계를 포함한다.
일 실시양태에서, 단계 a)의 상기 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 3' 리보자임을 포함한다. 일 실시양태에서, 상기 제1 RNA 분자는 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함한다. 일 실시양태에서, 상기 3' 리보자임은 제1 RNA 분자에서 스스로를 촉매화하여, 3'P 또는 2'3' cP 단부를 생성한다. 일 실시양태에서, 상기 제1 RNA 분자는 5' 태그를 추가로 포함한다. 일 실시양태에서, 상기 5' 태그는 고체 지지체에 대한 상기 제1 RNA 분자의 부착을 매개한다.
일 실시양태에서, 단계 b)의 상기 하나 이상의 추가적인 RNA 분자는 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함한다. 일 실시양태에서, 상기 5' 리보자임은 스스로를 절단하여, 5'OH 단부를 생성한다. 일 실시양태에서, 리가아제가 하나 이상의 추가적인 RNA 분자에 대한 제1 RNA 분자의 결찰을 촉매화하기 위해 제공된다. 일 실시양태에서, 리가아제는 본원에 기재된 바와 같이, RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다. 일 실시양태에서, 상기 3' 리보자임 인식 서열은 본원에 기재된 바와 같이 VS-S 서열을 포함한다.
일 실시양태에서, 단계 c)의 상기 리보자임은 본원에 기재된 바와 같이 VS-Rz를 포함한다. 일 실시양태에서, 상기 VS-Rz는 VS-S를 인식하고, 하나 이상의 추가적인 RNA 분자로부터 이의 절단을 매개한다. 일 실시양태에서, 상기 절단은 3'P 또는 2'3' cP 단부를 생성한다. 일 실시양태에서, 단계 b) 내지 c)는 1 회 이상 반복되어, 복수의 도메인을 코딩하는 RNA 분자를 생성한다. 일 실시양태에서, 상기 VS-Rz는 단계 b)를 반복하기 전에 제거된다.
일 실시양태에서, 단계 d)의 상기 마지막 RNA 분자는 관심 단백질의 마지막 부분을 코딩하는 코딩 영역을 포함한다. 일 실시양태에서, 상기 마지막 RNA 분자는 5' 리보자임을 포함한다. 일 실시양태에서, 상기 마지막 RNA 분자는 관심 단백질의 마지막 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함한다. 일 실시양태에서, 상기 5' 리보자임은 마지막 RNA 분자에서 스스로를 촉매화하여, 5'OH 단부를 생성한다. 일 실시양태에서, 마지막 RNA 분자에 대한 하나 이상의 추가적인 RNA 분자의 결찰을 촉매화하여, N-말단 도메인, 하나 이상의 추가적인 도메인 및 C-말단 도메인을 코딩하는 완전한 RNA 분자를 생성하기 위한 리가아제가 제공된다. 일 실시양태에서, 리가아제는 본원에 기재된 바와 같이 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제이다.
본 개시내용의 임의의 RNA 분자는 "생체외 전사 주형"으로서 지칭되는 주형 DNA로부터 생체외 전사될 수 있다. DNA의 공급원은 예를 들어, 게놈 DNA, 플라스미드 DNA, 파지 DNA, cDNA, 합성 DNA 서열 또는 임의의 다른 적절한 DNA 공급원일 수 있다. 일부 실시양태에서, 생체외 전사 주형은 5' 비번역 (UTR) 영역을 코딩하고, 오픈 리딩 프레임을 함유하고, 3' UTR 및 폴리A 꼬리를 코딩한다. 생체외 전사 주형의 특정 핵산 서열 조성 및 길이는 주형에 의해 코딩된 mRNA에 의존할 것이다.
일 실시양태에서, 5' UTR은 0 내지 3000 개의 뉴클레오티드 길이이다. 코딩 영역에 첨가될 5' 및 3' UTR 서열의 길이는 UTR의 상이한 영역에 어닐링하는 PCR용 프라이머를 설계하는 단계를 비제한적으로 포함하는 상이한 방법에 의해 변경될 수 있다. 이 접근법을 사용하여, 당업자는 전사된 RNA의 형질주입 후 최적의 번역 효율을 달성하는 데 필요한 5' 및 3' UTR 길이를 변형할 수 있다.
5' 및 3' UTR은 관심 유전자에 대한 자연 발생, 내인성 5' 및 3' UTR일 수 있다. 대안적으로, 관심 유전자에 내인성이 아닌 UTR 서열은 UTR 서열을 정방향 및 역방향 프라이머에 통합함으로써 또는 주형의 임의의 다른 변형에 의해 첨가될 수 있다. 관심 유전자에 내인성이 아닌 UTR 서열의 사용은 RNA의 안정성 및/또는 번역 효율을 변형하는 데 유용할 수 있다. 예를 들어, 3' UTR 서열의 AU-풍부 요소는 mRNA의 안정성을 감소시킬 수 있는 것으로 알려져 있다. 따라서, 3' UTR은 당업계에 잘 알려진 UTR의 특성에 기반하여 전사된 RNA의 안정성을 증가시키도록 선택되거나 설계될 수 있다.
일 실시양태에서, 5' UTR은 내인성 유전자의 Kozak 서열을 함유할 수 있다. 대안적으로, 관심 유전자에 내인성이 아닌 5' UTR이 위에 기재된 바와 같이 PCR에 의해 첨가될 때, 5' UTR 서열을 첨가함으로써 컨센서스 Kozak 서열을 재설계할 수 있다. Kozak 서열은 일부 RNA 전사물의 번역 효율을 증가시킬 수 있지만, 모든 RNA가 효율적인 번역을 가능하게 하는 데 필요한 것으로 보이지 않는다. 많은 mRNA에 대한 Kozak 서열에 대한 요건은 당업계에 알려져 있다. 다른 실시양태에서, 5' UTR은 RNA 게놈이 세포에서 안정한 RNA 바이러스로부터 유래될 수 있다. 다른 실시양태에서, mRNA의 엑소뉴클레아제 분해를 방해하기 위해 다양한 뉴클레오티드 유사체가 3' 또는 5' UTR에 사용될 수 있다.
DNA 주형으로부터 RNA의 합성을 가능하게 하기 위해, 전사의 프로모터가 전사될 서열의 업스트림의 DNA 주형에 부착되어야 한다. RNA 중합효소에 대한 프로모터로서 기능하는 서열이 정방향 프라이머의 5' 단부에 첨가되는 경우, RNA 중합효소 프로모터는 전사될 오픈 리딩 프레임의 업스트림의 PCR 생성물에 통합된다. 일 실시양태에서, 프로모터는 본원의 다른 곳에서 기재된 바와 같이 T7 RNA 폴리머라제 프로모터이다. 다른 유용한 프로모터는 T3 및 SP6 RNA 폴리머라제 프로모터를 포함하나, 이에 제한되지 않는다. T7, T3 및 SP6 프로모터에 대한 컨센서스 뉴클레오티드 서열은 당업계에 알려져 있다.
일 실시양태에서, mRNA는 세포에서 mRNA의 리보솜 결합, 번역 개시 및 안정성을 결정하는 5' 단부 상의 캡 및 3' 폴리(A) 꼬리 둘 모두를 갖는다. 원형 DNA 주형, 예를 들어, 플라스미드 DNA에서, RNA 중합효소는 진핵 세포에서의 발현에 적합하지 않은 긴 연쇄체성 생성물을 생산한다. 3' UTR의 단부에서 선형화된 플라스미드 DNA의 전사는 정상적인 크기의 mRNA를 생성하며, 이는 전사 후 폴리아데닐화될 때 진핵생물 형질주입에 효과적이다.
선형 DNA 주형에서, 파지 T7 RNA 중합효소는 주형의 마지막 염기를 지나 전사물의 3' 단부를 확장시킬 수 있다 (Schenborn and Mierendorf, Nuc Acids Res., 13:6223-36 (1985); Nacheva and Berzal-Herranz, Eur. J. Biochem., 270:1485-65 (2003)).
폴리A/T 스트레치의 DNA 주형으로의 통합의 통상적인 방법은 분자 클로닝이다. 그러나, 플라스미드 DNA에 통합된 폴리A/T 서열은 플라스미드 불안정성을 유발할 수 있으며, 이는 플라스미드 전파를 위한 재조합 비적격 박테리아 세포의 사용을 통해 호전될 수 있다.
RNA의 폴리(A) 꼬리는 폴리(A) 폴리머라제, 예컨대, 대장균 폴리A 폴리머라제 (E-PAP) 또는 효모 폴리A 폴리머라제를 사용하여 생체외 전사 후 추가로 확장될 수 있다. 일 실시양태에서, 폴리(A) 꼬리의 길이를 100 개의 뉴클레오티드에서 300개 내지 400 개의 뉴클레오티드로 증가시키면 RNA의 번역 효율의 약 2-배 증가를 초래한다. 추가적으로, 3' 단부에 상이한 화학 기의 부착은 mRNA 안정성을 증가시킬 수 있다. 이러한 부착은 변형된/인공 뉴클레오티드, 압타머 및 기타 화합물을 함유할 수 있다. 예를 들어, ATP 유사체는 폴리(A) 폴리머라제를 사용하여 폴리(A) 꼬리에 통합될 수 있다. ATP 유사체는 RNA의 안정성을 추가로 증가시킬 수 있다.
5' 캡은 또한 mRNA 분자에 안정성을 제공한다. 일 실시양태에서, 방법에 의해 생산된 RNA는 5' 캡1 구조를 포함한다. 이러한 캡1 구조는 백시니아 캡핑 효소 및 2'-O-메틸트랜스퍼라제 효소를 사용하여 생성될 수 있다 (CellScript, Madison, WI). 대안적으로, 5' 캡은 당업계에 알려져 있고 본원에 기재된 기술을 사용하여 제공된다 (Cougot, et al., Trends in Biochem. Sci., 29:436-444 (2001); Stepinski, et al., RNA, 7:1468-95 (2001); Elango, et al., Biochim. Biophys. Res. Commun., 330:958-966 (2005)).
발명의 특정 실시양태는 예를 들어, 폴리뉴클레오티드와 같은 생체분자에 공유 부착을 허용하는 반응성 기를 포함하는 중간 재료의 층 또는 코팅의 적용에 의해 기능화된 불활성 기질 또는 매트릭스 (예컨대, 유리 슬라이드, 중합체 비드 등)를 포함하는 고체 지지체를 사용할 수 있다. 이러한 지지체의 예는 불활성 기질, 예컨대, 유리 상에 지지된 폴리아크릴아미드 하이드로겔, 특히 내용이 본원에 참조로 그 전체가 원용되는 WO 2005/065814호 및 US 2008/0280773호에 기재된 바와 같은 폴리아크릴아미드 하이드로겔을 포함하나, 이에 제한되지 않는다. 이러한 실시양태에서, 생체분자 (예컨대, 폴리뉴클레오티드)는 중간 재료 (예컨대, 하이드로겔)에 직접 공유적으로 부착될 수 있지만, 중간 재료 자체는 기질 또는 매트릭스 (예컨대, 유리 기질)에 비-공유적으로 부착될 수 있다. 따라서, 용어 "고체 지지체에 대한 공유 부착"은 이러한 유형의 배열을 포함하는 것으로서 해석되어야 한다.
당업자에 의해 이해될 것인 바와 같이, 가능한 기질의 수는 매우 많다. 가능한 기질은 유리 및 변형된 또는 기능화된 유리, 플라스틱 (아크릴, 폴리스티렌, 및 스티렌 및 기타 재료의 공중합체, 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리우레탄, Teflon™ 등), 다당류, 나일론 또는 니트로셀룰로스, 세라믹, 수지, 실리콘 및 변형된 실리콘을 포함하는 실리카 또는 실리카-기반 재료, 탄소, 금속, 무기 유리, 플라스틱, 광섬유 번들 및 기타 다양한 중합체를 포함하나, 이에 제한되지 않는다.
일부 실시양태에서, 고체 지지체는 미소구체 또는 비드를 포함한다. 적합한 비드 조성물은 플라스틱, 세라믹, 유리, 폴리스티렌, 메틸스티렌, 아크릴 중합체, 상자성 재료, 토리아 졸, 탄소 흑연, 이산화티타늄, 라텍스 또는 가교 덱스트란, 예컨대, 세파로스, 셀룰로스, 나일론, 가교 미셀 및 테프론을 포함하나, 이에 제한되지 않으며, 뿐만 아니라 고체 지지체에 대해 본원에 개괄된 임의의 다른 재료가 모두 사용될 수 있다. Bangs Laboratories, Fishers Ind.의 "Microsphere Detection Guide"는 유용한 가이드이다. 특정 실시양태에서, 미소구체는 자기 미소구체 또는 비드이다.
비드는 구형일 필요는 없으며; 불규칙한 입자를 사용할 수 있다. 대안적으로, 또는 추가적으로, 비드는 다공성일 수 있다. 비드 크기는 나노미터, 즉, 100 nm 내지 밀리미터, 즉, 1 mm 범위이며, 약 0.2 미크론 내지 약 200 미크론의 비드가 바람직하고, 약 0.5 내지 약 5 미크론의 비드가 특히 바람직하지만, 일부 실시양태에서 더 작거나 더 큰 비드가 사용될 수 있다.
일 실시양태에서, 본 발명은 전장 RNA 바이러스 게놈을 조립하는 생체외 방법에 관한 것이다. 예시적인 RNA 바이러스는 코로나바이러스, 파라믹소바이러스, 오르토믹소바이러스, 레트로바이러스, 렌티바이러스, 알파바이러스, 플라비바이러스, 랍도바이러스, 홍역 바이러스, 뉴캐슬 질환 바이러스 및 피코르나바이러스를 포함하나, 이에 제한되지 않는다. 일 실시양태에서, 방법은 RNA 바이러스 게놈의 제1 부분 및 3' 리보자임을 포함하는 제1 RNA 분자를 제공하는 단계를 포함한다. 일 실시양태에서, 방법은 RNA 바이러스 게놈의 제2 부분 및 5' 리보자임을 포함하는 제2 RNA 분자를 제공하는 단계를 포함한다. 일 실시양태에서, 본원에 기재된 바와 같이, 3' 및 5' 리보자임의 시스-절단 시, RNA 바이러스 게놈의 제1 부분 및 RNA 바이러스 게놈의 제2 부분은 결찰을 위한 양립가능한 말단을 갖는다. 일 실시양태에서, 방법은 본원에 기재된 바와 같이 제1 RNA 분자 및 제2 RNA 분자를 리가아제와 접촉시켜, 전장 RNA 바이러스 게놈을 생성하는 단계를 포함한다.
치료 및 사용
본 발명은 대상체에서 질환 또는 장애의 치료, 이의 증상의 감소 및/또는 이의 발달 위험 감소 방법을 제공한다. 예를 들어, 일 실시양태에서, 발명의 방법은 포유류에서 질환 또는 장애를 치료하고/하거나, 이의 증상을 감소시키고/시키거나, 이의 발달 위험을 감소시킨다. 일 실시양태에서, 발명의 방법은 식물에서 질환 또는 장애를 치료하고/하거나, 이의 증상을 감소시키고/시키거나, 이의 발달 위험을 감소시킨다. 일 실시양태에서, 발명의 방법은 효모 유기체에서 질환 또는 장애를 치료하고/하거나, 이의 증상을 감소시키고/시키거나, 이의 발달 위험을 감소시킨다.
일 실시양태에서, 대상체는 세포이다. 일 실시양태에서, 세포는 원핵 세포 또는 진핵 세포이다. 일 실시양태에서, 세포는 진핵 세포이다. 일 실시양태에서, 세포는 식물, 동물 또는 진균 세포이다. 일 실시양태에서, 세포는 식물 세포이다. 일 실시양태에서, 세포는 동물 세포이다. 일 실시양태에서, 세포는 효모 세포이다.
일 실시양태에서, 대상체는 포유류이다. 예를 들어, 일 실시양태에서, 대상체는 인간, 비-인간 영장류, 개, 고양이, 말, 소, 염소, 양, 토끼, 돼지, 랫트 또는 마우스이다. 일 실시양태에서, 대상체는 비-포유동물 대상체이다. 예를 들어, 일 실시양태에서, 대상체는 제브라피쉬, 초파리 또는 회충이다.
일 실시양태에서, 질환 또는 장애는 핵산 서열이 바이러스 벡터의 패키징 크기를 초과하는 부재 또는 결함 단백질에 의해 유발된다. 따라서, 일 실시양태에서, 질환 또는 장애는 본 발명의 조성물, 시스템 및 방법을 사용하여 치료되거나, 감소되거나, 위험이 감소될 수 있다. 따라서, 일 실시양태에서, 방법은 본 발명의 하나 이상의 조성물을 대상체에 투여하는 단계를 포함한다. 추가로, 일 실시양태에서, 방법은 본 발명의 하나 이상의 시스템을 활용하여, 대상체에서 질환 또는 장애를 치료하고/하거나, 이의 증상을 감소시키고/시키거나, 이의 발달 위험을 감소시키는 단계를 포함한다.
일 실시양태에서, 질환 또는 장애는 뒤센 근이영양증, 상염색체 열성 다낭성 신장 질환, 혈우병 A, 스타가르트 황반변성, 사지대 근이영양증, DFNB9, 신경감각 비증후군 열성 난청, 낭포성 섬유증, 윌슨 질환, 미요시 근이영양증 및 난청, 상염색체 열성 9, 어셔 증후군, 유형 I 및 난청, 상염색체 열성 2, 난청, 상염색체 열성 3 및 비증후군성 청력 손실, 어셔 증후군 유형 I, 상염색체 열성 난청-16 (DFNB16), 메니에르 질환 (MD), 난청, 상염색체 우성 12 및 난청, 상염색체 열성 21, 어셔 증후군 유형 1F (USH1F) 및 DFNB23, 난청, 상염색체 열성 28 및 비증후군성 청력 손실, 난청, 상염색체 열성 30 및 비증후군성 청력 손실, 귀척추거대골단 이형성증, 상염색체 열성 및 귀척추거대골단 이형성증, 상염색체 우성, 난청, 상염색체 열성 77 및 상염색체 열성 비-증후군성 감각신경성 난청 유형 Dfnb, 상염색체-열성 비증후군성 청각 장해 DFNB84, 난청, 상염색체 열성 84B 및 희귀 유전성 난청, 말초 신경병증, 근병증, 쉰 목소리, 및 청각 손실 및 난청, 상염색체 우성 4A, 선천성 혈소판감소증, 감각 청력 손실, DFNA56, HXB, 난청, 상염색체 우성 56, 헥사브라키온(hexabrachion), 간질성 뇌병증, 티모시 증후군 및 긴 Qt 증후군8, X-연관 망막 장애, 고알도스테론증, 척수소뇌 운동실조증 42, 원발성 알도스테론증, 발작, 및 신경학적 이상 및 동방결절 기능장애 및 난청, 신경발달 장애, 저칼륨성 주기성 마비, 간질, 발달성 및 간질성 뇌병증, 브로디 근병증, 다리에 질환/심장 질환, 폰 빌레브란트 질환 및 젤웨거 증후군으로 이루어진 군으로부터 선택된 하나 이상이다. 일 실시양태에서, 질환 또는 장애는 CRISPR-Cas9 매개된 편집을 수용할 수 있는 유전적 돌연변이에 의해 유발되는 임의의 것이다.
일 실시양태에서, 본 발명의 방법은 디스트로핀의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 핵산, 및 디스트로핀의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 핵산을 포함하는 조성물을 뒤센 근이영양증을 갖는 대상체에 투여하는 단계를 포함하며, 여기서 제1 핵산은 제1 RNA 분자를 전사하고, 제2 핵산은 제2 RNA 분자를 전사하고, 여기서 3' 및 5' 리보자임의 시스-절단 및 디스트로핀의 제1 부분을 코딩하는 코딩 영역 및 디스트로핀의 제2 부분을 코딩하는 코딩 영역의 트랜스-스플라이싱은 전장 디스트로핀 단백질을 코딩하는 단일 RNA 분자를 생성한다.
일 실시양태에서, 본 발명의 방법은 서열번호 129의 핵산 서열을 코딩하는 제1 핵산 및 서열번호 130의 핵산 서열을 코딩하는 제2 핵산을 포함하는 조성물을 뒤센 근이영양증을 갖는 대상체에 투여하는 단계를 포함하며, 여기서 제1 핵산은 제1 RNA 분자를 전사하고, 제2 핵산은 제2 RNA 분자를 전사하고, 여기서 3' 및 5' 리보자임의 시스-절단 및 제1 RNA 분자 및 제2 RNA 분자의 트랜스-스플라이싱은 전장 디스트로핀 단백질을 코딩하는 단일 RNA 분자를 생성한다.
일 실시양태에서, 본 발명의 방법은 서열번호 22의 핵산 서열을 코딩하는 제1 핵산 및 서열번호 23의 핵산 서열을 코딩하는 제2 핵산을 포함하는 조성물을 뒤센 근이영양증을 갖는 대상체에 투여하는 단계를 포함하며, 여기서 제1 핵산은 제1 RNA 분자를 전사하고, 제2 핵산은 제2 RNA 분자를 전사하고, 여기서 3' 및 5' 리보자임의 시스-절단 및 제1 RNA 분자 및 제2 RNA 분자의 트랜스-스플라이싱은 C-말단 GFP 리포터를 포함하는 전장 디스트로핀 단백질을 코딩하는 단일 RNA 분자를 생성한다. 일 실시양태에서, 제2 핵산은 서열번호 23의 단편을 코딩하며, 여기서 단편은 C-말단 GFP 리포터에 대한 코딩 서열을 포함하지 않는다.
일 실시양태에서, 방법은 디스트로핀의 제1 부분을 코딩하고 3' 리보자임을 포함하는 제1 RNA 분자, 및 디스트로핀의 제2 부분을 코딩하고 5' 리보자임을 포함하는 제2 RNA 분자를 포함하는 조성물을 뒤센 근이영양증을 갖는 대상체에 투여하는 단계를 포함하며, 여기서 3' 및 5' 리보자임의 시스-절단 및 제1 및 제2 RNA 분자의 트랜스-스플라이싱은 전장 디스트로핀 단백질을 코딩하는 단일 RNA 분자를 생성한다.
일 실시양태에서, 방법은 서열번호 129의 핵산 서열을 포함하는 제1 RNA 분자, 및 서열번호 130의 핵산 서열을 포함하는 제2 RNA 분자를 포함하는 조성물을 뒤센 근이영양증을 갖는 대상체에 투여하는 단계를 포함하며, 여기서 3' 및 5' 리보자임의 시스-절단 및 제1 및 제2 RNA 분자의 트랜스-스플라이싱은 전장 디스트로핀 단백질을 코딩하는 단일 RNA 분자를 생성한다.
일 실시양태에서, 방법은 서열번호 22의 핵산 서열을 포함하는 제1 RNA 분자, 및 서열번호 23의 핵산 서열을 포함하는 제2 RNA 분자를 포함하는 조성물을 뒤센 근이영양증을 갖는 대상체에 투여하는 단계를 포함하며, 여기서 3' 및 5' 리보자임의 시스-절단 및 제1 및 제2 RNA 분자의 트랜스-스플라이싱은 C-말단 GFP 리포터를 포함하는 전장 디스트로핀 단백질을 코딩하는 단일 RNA 분자를 생성한다. 일 실시양태에서, 제2 핵산은 서열번호 23의 단편을 코딩하며, 여기서 단편은 C-말단 GFP 리포터에 대한 코딩 서열을 포함하지 않는다.
일 실시양태에서, 본 발명의 방법은 표 1의 관련 질환에 상응하는 치료적 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 핵산, 및 표 1의 관련 질환에 상응하는 치료적 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 핵산을 포함하는 조성물을 표 1로부터 선택된 하나 이상의 질환을 갖는 대상체에 투여하는 단계를 포함하며, 여기서 제1 핵산은 제1 RNA 분자를 전사하고, 제2 핵산은 제2 RNA 분자를 전사하고, 여기서 3' 및 5' 리보자임의 시스-절단 및 치료적 단백질의 제1 부분을 코딩하는 코딩 영역 및 치료적 단백질의 제2 부분을 코딩하는 코딩 영역의 트랜스-스플라이싱은 전장 치료적 단백질을 코딩하는 단일 RNA 분자를 생성한다.
일 실시양태에서, 방법은 표 1의 관련 질환에 상응하는 치료적 단백질의 제1 부분을 코딩하고 3' 리보자임을 포함하는 제1 RNA 분자 및 표 1의 관련 질환에 상응하는 치료적 단백질의 제2 부분을 코딩하고 5' 리보자임을 포함하는 제2 RNA 분자를 포함하는 조성물을 표 1로부터 선택된 하나 이상의 질환을 갖는 대상체에 투여하는 단계를 포함하며, 여기서 3' 및 5' 리보자임의 시스-절단 및 제1 및 제2 RNA 분자의 트랜스-스플라이싱은 전장 치료적 단백질을 코딩하는 단일 RNA 분자를 생성한다.
Figure pct00001
Figure pct00002
Figure pct00003
실험적 실시예
본 발명은 다음의 실험적 실시예를 참조하여 더욱 상세하게 설명된다. 이러한 실시예는 설명의 목적으로만 제공되며, 달리 명시되지 않는 한 제한하는 것으로 의도되지 않는다. 따라서, 발명은 다음의 실시예로 제한되는 것으로 해석되어서는 안 되며, 오히려 본원에 제공된 교시의 결과로서 명백해지는 임의의 모든 변동을 포함하는 것으로 해석되어야 한다.
추가 설명 없이, 당업자는 이전의 설명 및 다음의 예시적인 실시예를 사용하여 본 발명을 만들고 활용하고 청구된 방법을 실시할 수 있다고 여겨진다. 따라서, 다음의 작업 실시예는 개시내용의 나머지 부분을 임의의 방식으로 제한하는 것으로서 해석되어서는 안 된다.
실시예 1: 포유동물 세포에서 리보자임-매개 RNA 조립 및 발현
리보자임 (Rzs)은 뉴클레오티드-특이적 자기-절단이 가능한 작은 촉매 RNA 서열이다 (Doherty and Doudna 2000). 리보자임-매개 RNA 절단은 고유한 3' 포스페이트 및 5'-하이드록시 말단을 생성하며, 이는 생명의 3 개의 계(kingdoms) 모두에 존재하는 유비쿼터스 RNA 복구 경로에 대한 기질과 유사하다. 본원에 도시된 바와 같이, 리보자임-매개 시스-절단은 포유동물 세포에서 독립적인 RNA 전사물의 트랜스-스플라이싱을 위해 활용될 수 있으며, 이는 스티치R (스티치 RNA)로 명명된 접근법이다. 놀랍게도, 스티치R에 의한 메신저 RNA의 재구성은 포유동물 세포에서 전장 단백질의 효율적인 번역 및 발현을 허용하였다. 입증된 바와 같이, 스티치R은 단백질 코딩 기능적 도메인의 조합 또는 바이러스 벡터에 의한 큰 단백질 코딩 서열의 전달 및 발현을 위해 활용될 수 있다. 추가로, RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제의 과발현은 포유동물 세포에서 스티치R 활성을 향상시키고, 생체외에서 스티치R 활성을 촉매화하기에 충분하다. 이들 데이터는 무수한 연구 및 치료적 적용에 유용할 수 있는 세포에서의 기능적 RNA의 스카-리스 트랜스-스플라이싱을 위해 리보자임을 활용하는 신규 접근법을 특징으로 한다.
자가촉매 RNA 서열은 자연에 널리 퍼져 있으며, 인트론 스플라이싱, 롤링 서클 바이러스 게놈 복제 및 펩티드 결합 형성을 포함한 다양한 생물학적 과정을 촉매한다 (Weinberg et al. 2019). 해머헤드 (HH), 델타 간염 바이러스 (HDV), 바쿠드 위성 (VS), 시스터, 트위스터-시스터, 헤어핀, 해쳇 및 피스톨을 포함하여 7 개 이상의 주요 리보자임 패밀리가 구별되는 서열 및 구조적 특징으로 식별되었다. 가장 널리 연구된 것은 HH, HDV 및 트위스터 패밀리 구성원이며, 이는 작은 크기 및 절단 특질로 인해 생체외 및 생체내에서 리보자임 서열이 없는 정확한 말단을 포함하는 RNA를 생성하는 데 활용되었다 (도 13)(Ferre-D'Amare and Doudna 1996; Avis et al. 2012; Zhang et al. 2017).
원핵생물 및 진핵생물에서, 메신저 및 긴 비코딩 RNA를 포함하여 대부분의 세포성 RNA가 합성되고, 5'-포스페이트 (P) 및 3'-하이드록실 (OH) 말단과 스플라이싱된다. 대조적으로, 많은 tRNA 및 ER 스트레스-반응성 단백질 XBP1을 코딩하는 mRNA의 비통상적인 시스-스플라이싱은 고유한 5'-OH 및 3'-P 또는 2'3' 사이클릭 포스페이트 (cP) 단부를 생성하는 효소 경로에 의해 촉매화된다. 최근 연구결과는 RNA의 비통상적인 시스-스플라이싱이 포유류의 유비쿼터스 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제에 의해 촉매화된다는 것을 시사한다. 추가적으로, RtcB 및 기타 여러 효소 패밀리는 스트레스 또는 외인성 리보톡신에 의해 손상된 숙주 세포 RNA를 복구하는 기능을 할 수 있다. 리보자임-매개 절단은 유사한 말단 단부를 생성하기 때문에, 리보자임-절단된 RNA는 내인성 RNA 복구 경로에 의해 트랜스-스플라이싱될 수 있다.
리보자임-절단된 mRNA는 포유동물 세포에서 트랜스-스플라이싱되고 번역된다
리보자임이 포유동물 세포에서 RNA의 스카-리스 트랜스-스플라이싱에 활용될 수 있는지 여부를 결정하기 위해, 형광 리포터 GFP (각자 Nt-GFP 및 Ct-GFP)의 비-중첩 N-말단 (Nt) 및 C-말단 (Ct) 단편을 함유하는 2 개의 발현 플라스미드를 설계하였다. Nt-GFP의 3' HDV 리보자임 및 Ct-GFP의 5' HH 리보자임을 포함하여 리보자임을 GFP 단편의 인접 뉴클레오티드로부터 자체 제거를 촉매하도록 설계하였다 (도 1a). GFP-리보자임 RNA만을 코딩하는 Nt 또는 Ct의 발현은 포유동물 COS-7 또는 HEK293T 세포에 형질주입될 때 검출가능한 GFP 형광을 초래하지 않았다 (도 1b). 놀랍게도, Nt- 및 Ct-GFP 코딩된 RNA의 공동-발현은 함께 48 시간 후에 녹색 형광을 초래하였다 (도 1b). RT-PCR 분석 및 생어 시퀀싱은 별개의 Nt- 및 Ct-GFP RNA의 트랜스-스플라이싱이 예측된 리보자임-촉매화된 절단 부위 사이에서 발생한 것으로 나타났다 (도 1c 및 도 1d). 추가로, 전장 GFP 단백질을 공동-형질주입된 세포에서 웨스턴 블롯에 의해 검출하였다 (도 1e). 이들 데이터는 내인성 포유동물 세포성 RNA 복구 경로가 전장 단백질로 효율적으로 번역된 독립적인 리보자임-가공된 RNA의 트랜스-스플라이싱을 촉매화하기에 충분하다는 것을 입증한다. 이 RNA 트랜스-스플라이싱 접근법을 스티치R이라고 명명하였다.
리보자임-매개 트랜스-스플라이싱에 대한 리보자임 서열 및 유형의 영향
세포에서 리보자임-매개 트랜스 스플라이싱에 의해 생성된 기능적 전장 단백질의 상대적인 양을 정확하게 정량화하기 위해, 반딧불이 루시퍼라제의 2 개의 비-중첩 절반을 사용하여 리포터를 생성하였다 (도 2a). 본 발명자들의 이전 연구결과와 일치하게, Nt- 및 Ct-루시퍼라제-리보자임 코딩 RNA 둘 모두의 공동-형질주입만이 세포에서 트랜스-스플라이싱 및 루시퍼라제 활성을 초래하였다 (도 2b 및 도 2c). 이 검정을 사용하여, 포유동물 세포에서 트랜스-스플라이싱 활성에 대한 상이한 HH 및 HDV 리보자임 서열의 효과를 추가로 특성화하였다. 줄기 1 HH 리보자임의 6 개의 염기쌍 (bp) 중첩은 생체외에서 특성화된 HH 리보자임 활성에 대한 이전 보고서와 일치하는 가장 큰 루시퍼라제 활성 및 HH 촉매 잔기 철폐된 활성의 돌연변이를 제공하였다 (도 2d). 추가적으로, 게놈 및 안티게놈 HDV 리보자임 서열 둘 모두는 유의하게 감소된 활성을 보여주는 최소 56 개의 뉴클레오티드 HDV 리보자임 (HDV56)을 제외하고, 루시퍼라제 활성이 비슷하였다 (도 2e). 또한 이전 보고서와 일치하게, HDV 촉매에 필요한 뉴클레오티드의 C에서 U로의 돌연변이는 루시퍼라제 활성의 완전한 손실을 초래하였다 (도 2e). 이러한 연구결과는 리보자임-매개 트랜스 스플라이싱 활성이 포유동물 세포에서 리보자임 절단에 의존함을 입증한다.
번역 제어 및/또는 단백질 분해 서열을 사용하여 Nt 또는 Ct 벡터로부터 원치 않은 또는 절삭된 단백질 발현의 방지
Nt 또는 Ct RNA는 리보자임-매개 절단 전에 번역되거나, 별도로 발현될 때, 잠재적으로 원치 않은 또는 절삭된 단백질 발현을 초래할 수 있다. 스플라이싱되지 않은 Nt 또는 Ct 벡터의 발현을 제한하기 위해, 전장 GFP를 코딩하는 벡터의 안정성에 대한 단백질 분해 서열의 이전에 특성화된 번역 제어의 효험을 테스트하였다. GFP의 3' 단부에 대한 HDV 리보자임의 첨가는 GFP 형광을 변경하는 것으로 보이지 않았다 (도 3a 및 b). GFP의 발현을 선택적으로 방지하기 위해, 단백질 분해 서열 hCL1-PEST, E1A-PEST, 벡터의 폴리(A) 서열 제거 또는 폴리 K 꼬리를 생성하기 위한 폴리 A 꼬리를 통한 시뮬레이션된 번역의 효과를 테스트하였다 (도 3a 및 b). 모든 분해 서열을 HDV 리보자임 서열을 통해 번역이 발생하도록 GFP 오픈 리딩 프레임을 사용하여 프레임 내에 클로닝하였다. hCL1-PEST의 포함은 GFP 형광의 강한 감소를 보인 반면, EF1a PEST는 그렇지 않았다. 발현 벡터로부터 벡터 폴리(A) 서열의 결실은 GFP 발현의 완전한 손실을 초래하였고, 폴리 K 꼬리를 생성하기 위한 폴리 A 서열을 통한 번역은 또한 감소된 형광을 초래하였다.
Ct 코딩된 GFP 리포터의 경우, 5' HH 리보자임의 포함 및 GFP 출발 코돈 (ATG)의 결실은 예측된 업스트림 대체 ATG의 결여에도 불구하고 여전히 약하지만 검출가능한 GFP 발현을 초래하였다 (도 3c 및 d). GFP의 N-말단 NTG 코돈 내의 추가 침묵 돌연변이 (GFPcdn)는 GFP 검출을 추가로 감소시켰지만, 약한 형광은 여전히 명백하였다. 번역 억제제로서 기능하는 4 개의 작은 업스트림 ORF를 코딩하는 효모 GCN4 유전자의 5' UTR의 포함은 검출가능한 GFP 형광을 철폐하였다. 4 개의 uORF만 코딩하는 GCN4 5' UTR의 더 작은 내부 단편은 GFP 발현을 방지하는 데 유사하게 효과적이었다. 이들 데이터는 단백질 분해 서열의 번역 제어가 개별 Nt 또는 Ct 벡터로부터 원치 않은 단백질 발현을 방지하는 데 활용될 수 있음을 입증한다.
이들 번역 제어 또는 단백질 분해 서열은 원치 않은 또는 절삭된 단백질 발현을 제한하는 것이 바람직한 다른 듀얼 벡터 응용분야, 예컨대, 큰 단백질 코딩 오픈 리딩 프레임을 생성하기 위해 상동 재조합에 의존하는 듀얼 AAV 벡터 전략에 활용될 수 있다.
기능 단백질 코딩 RNA의 단일 및 멀티-플렉스 트랜스-스플라이싱
리보자임-매개 트랜스-스플라이싱이 세포의 단백질 코딩 기능적 도메인, 미토콘드리아 표적화 서열의 4 개의 카피를 코딩하는 RNA (Nt-4xMTS) 및 전장 GFP를 코딩하는 오픈 리딩 프레임의 조합에 사용될 수 있는지 여부를 결정하기 위해, ATG 출발 코돈의 결여 (Ct-GFP)를 생성하였다 (도 4a). 이 2 개의 독립적인 RNA의 공동-발현은 적색 형광 미토콘드리아 마커 미토트래커 적색 CMXRos와 중첩되는 미토콘드리아-국소화 GFP의 강력한 발현을 초래하였다 (도 4b). 이들 연구결과는 리보자임-매개 트랜스-스플라이싱이 2 개의 독립적인 RNA를 빠르게 조합하여 세포에서 특이적 기능적 융합 단백질을 발현하는 데 사용될 수 있음을 입증한다.
단백질이 번역되는 3 개의 오픈 리딩 프레임으로 인해 리보자임 매개된 트랜스-스플라이싱 및 다중 상이한 기능적 단백질의 발현이 또한 동시에 가능할 수 있다. 이 특징을 활용함으로써, 상이한 3 개의 양립가능한 오픈 리딩 프레임에 있는 RNA의 트랜스-스플라이싱을 사용하여 기능적 단백질을 생성할 수 있다. 이 기능성을 입증하기 위해, 미리스토일화 막 표적화 서열 (Nt-F2-Myr) 및 적색 형광 단백질 (Ct-F2-RFP)을 코딩하는 리딩 프레임 2 (F2)의 추가적인 리보자임 쌍을 설계하였다 (도 4c). 이러한 Nt 및 Ct 벡터 쌍은 또한 각자 개별 Nt 및 Ct 벡터로부터 절삭된 단백질 발현을 제한하기 위해 hCL1-PEST 단백질 분해 서열 및 GCN4 번역 억제 서열도 포함하였다. 공동-형질주입된 세포에서, GFP 형광은 미토콘드리아에 매우 특이적이었고 RFP 형광은 막에 매우 특이적이었으며 (도 4d), 이는 세포에서 상이한 기능적 단백질을 생성하기 위한 RNA의 트랜스-스플라이싱에 대한 이 접근법의 능력을 입증한다.
최적화된 리보자임은 리보자임-매개 트랜스-스플라이싱에서 단백질 발현을 향상시킨다
작은 서열 변형은 이차 구조, 안정성 또는 금속 이온 보조인자에 대한 결합을 변경함으로써 리보자임 촉매 활성에 중대한 영향을 미칠 수 있다. 트랜스-스플라이싱 루시퍼라제 리포터 검정을 사용하여, 본 발명자들은 포유류 세포에서 트랜스-스플라이싱 루시퍼라제 리포터 활성을 향상시키는 개선된 리보자임 유형 및 서열 변형을 식별하였다 (도 16). 삼차 안정화 모티프 (TSM)를 함유하는 RzB 해머헤드 변이체 리보자임은 TSM이 없는 리보자임보다 더 큰 활성을 보였다 (도 16a). 추가로, 트위스터 (twst) 리보자임은 Nt-Luc에 대해 3'에 클로닝될 때 HDV 리보자임보다 더 큰 활성을 보였다. 트위스터 리보자임 내의 촉매적 돌연변이는 유사하게 루시퍼라제 활성을 철폐할 수 있고 (도 16b), P1 줄기 형성에 의존한다 (도 16c). 트위스터 리보자임은 위치 1에 U가 필요하기 때문에, 이 요구사항은 U로 끝나는 서열로 스카-리스 트랜스-스플라이싱의 설계를 제한할 수 있다. 따라서, 본 발명자들은 뉴클레오티드 치환이 위치 1에서 용인될 수 있는지 여부를 테스트하고, U1A이 유의하게 상이한 활성을 나타내지 않는 반면, U1C 또는 U1G 치환이 다소 감소되기는 했지만 활성을 유지함을 발견하였다 (도 16c).
최적화된 스플라이스 공여자 및 수용자 서열은 리보자임-매개 트랜스-스플라이싱에서 단백질 발현을 향상시킨다
스플라이소솜에 의한 프리-mRNA 스플라이싱은 번역의 선구자 라운드를 촉진하는 인자의 침착을 통해 또는 RNA 가공 및 세포질로의 유출을 촉진하는 것을 통해 mRNA 번역을 향상시키는 것으로 나타났다. 트랜스진 내의 키메라 시스-스플라이싱 인트론의 첨가는 또한 트랜스진 단백질 발현을 촉진하는 것으로 나타났다. 이어서, 트랜스-스플라이싱된 RNA가 스플라이소솜에 의해 시스-스플라이싱을 겪을 수 있는지 여부, 및 이것이 트랜스-스플라이싱된 mRNA의 번역 및 발현에 영향을 미칠 것인지 여부를 조사하였다. 이를 테스트하기 위해, 스플라이스 공여자 (SD) 및 스플라이스 수용자 (SA) 서열을 트랜스-스플라이싱 GFP 리포터 내에 통합하여, 트랜스-스플라이싱된 RNA는 키메라 인트론을 재구성할 것이다 (도 5a). 놀랍게도, SD 및 SA 서열의 첨가는 SD 또는 SA 서열이 없는 트랜스-스플라이싱 GFP 리포터와 비교하여 GFP 형광의 강력한 향상을 초래하였다 (도 5b). RT-PCR 및 생어 시퀀싱은 SD 및 SA 서열을 함유하는 Nt-GFP 및 Ct-GFP RNA가 모두 트랜스- 및 시스-스플라이싱되어, 정상 GFP 오픈 리딩 프레임의 복원을 초래함을 나타냈다 (데이터는 도시되지 않음). 이들 데이터는 핵에서 트랜스-스플라이싱이 발생할 수 있으며, 후속 시스-스플라이싱이 트랜스-스플라이싱된 RNA의 발현을 향상시키는 데 유용한 전략임을 시사한다.
바이러스 치료적 벡터를 사용한 전달용 큰 유전자 서열의 리보자임-매개 트랜스-스플라이싱 및 발현
리보자임-매개 트랜스-스플라이싱은 치료적 바이러스 유전자 요법 벡터, 예컨대, AAV에 대한 패키징 크기 제한을 초과하는 큰 단백질 코딩 mRNA의 전달 및 발현에 활용될 수 있다 (도 6a). 이는 수많은 인간 일유전자성 질환에서 돌연변이된 큰 유전자, 예컨대, 뒤센 근이영양증 (DMD)에서의 디스트로핀 (Dys), 낭포성 섬유증 (CF)에서의 CFTR, 혈우병 A에서의 인자 VIII (F8) 등의 발현을 복원하는 데 유용할 수 있다. 세포-기반 형질주입 검정에서, C-말단 GFP 태그를 포함하는 Nt 및 Ct-분할 μ디스트로핀을 코딩하는 벡터의 공동-발현은 포유동물 세포에서 트랜스-스플라이싱되고 (도 6b 및 도 6c), 막에 국소화되었다 (도 6d). 이들 데이터는 큰 단백질 코딩 유전자를 재구성하고 발현하기 위해 리보자임-매개 트랜스-스플라이싱을 사용하는 것의 실행가능성을 입증한다.
세포에서 트랜스-스플라이싱을 위한 리보자임-가능 RNA의 렌티바이러스 전달
리보자임의 자가촉매 자기-절단은 포지티브-센스 RNA 바이러스, 예컨대, 일반적으로 사용되는 감마 레트로바이러스 및 렌티바이러스 벡터에 의한 리보자임-코딩 RNA의 패키징을 방해할 수 있다. 이 잠재적인 이슈를 피하기 위해, Nt 및 Ct 분할 GFP 발현 카세트를 3세대 렌티바이러스 벡터 백본의 네가티브 센스 가닥에 코딩하였다 (도 7a). 렌티바이러스 입자를 Nt 및 Ct 벡터에 대해 별도로 생성하였으며, 이어서, 이는 HEK293T 세포를 형질도입하는 데 사용하였다. Nt-GFP 및 Ct-GFP 둘 모두로 형질도입된 세포는 녹색 형광 발현을 나타낸 반면, Nt-GFP 또는 Ct-GFP 단독으로 형질도입된 세포는 검출가능한 형광을 나타내지 않았다 (도 7b). 이들 데이터는 렌티바이러스 벡터가 트랜스-스플라이싱을 위한 리보자임 코딩 RNA의 전달 및 발현이 가능함을 입증한다.
이 접근법은 이러한 바이러스 벡터의 패키징 크기를 초과하는 큰 유전자 서열, 예컨대, Dys의 전달에 또한 유용할 수 있다 (도 7c). 리보자임-매개 트랜스 스플라이싱은 또한 바이러스 게놈, 예컨대, 렌티바이러스 또는 큰 코로나바이러스 RNA 게놈의 안전한 취급 또는 재구성을 허용할 수 있다.
바이러스 벡터를 사용한 독성 유전자 또는 항바이러스 유전자의 안전한 취급, 전달 및 발현
리보자임-매개 트랜스 스플라이싱은 또한 포유동물 패키징 세포에서 렌티바이러스 입자의 생성을 억제할 수 있는 독성 또는 항바이러스 단백질의 안전한 취급 또는 재구성을 허용할 수 있다. 이들은 많은 세포 자살 유전자, 예컨대, 번역 억제 디프테리아 독소 A (DTA)를 포함한다 (도 8a). 본 발명자들은 트랜스-스플라이싱 및 발현 시 분할 DTA 서열을 코딩하는 벡터가 포유동물 세포에서 DTA의 번역 억제 역할과 일치하는 CS2GFP 리포터 작제물의 공동-발현을 억제한다는 것을 보여준다 (도 8b).
리보자임-매개 트랜스-스플라이싱을 향상 또는 억제하는 효소
다수의 효소 패밀리가 5'-OH 및 3'-P 또는 2'3' 사이클릭 포스페이트 (cP) 단부를 결찰시키는 것으로 시사되었으며, 특히 RtcB는 생명의 3 개의 역(Domain) 모두에서 보존되는 것으로 밝혀져 있다. 진핵 (H. 사피엔스), 박테리아 (대장균) 및 고세균 (P. 호리코시이) 종으로부터의 인간 코돈 최적화된 RtcB 오르토로그를 클로닝하고, 공동-발현하여, 트랜스-스플라이싱 루시퍼라제 리포터의 활성에 대한 효과를 측정하였다. 흥미롭게도, P. 호리코시이로부터의 RtcB의 공동-발현은 루시퍼라제 활성의 향상된 (4.5-배) 활성화를 초래한 반면, 인간 및 박테리아 오르토로그는 각자 대단하지 않은 향상을 나타내거나 향상을 나타내지 않았다 (도 9).
다른 효소 패밀리는 이러한 RNA 말단을 조정하는 것으로 나타났다. 흥미롭게도, 5'-하이드록실 키나제 및 3'-포스파타제 및 2',3'-사이클릭 포스포디에스테라제로서 작용하는 T4 폴리뉴클레오티드 키나제 (T4 PNK)의 발현은 루시퍼라제 활성을 유의하게 억제하였다 (도 9). 이들 데이터는 외인성 효소의 공동-발현이 포유동물 세포에서 리보자임-매개 트랜스-스플라이싱을 향상시키거나 억제할 수 있음을 나타낸다.
RtcB는 생체외에서 리보자임-매개 RNA 트랜스 -스플라이싱을 촉매화하기에 충분하다
뉴클레오티드-특이적 절단으로 인해, 리보자임은 정확한 RNA 단부를 생성하기 위해 생체외에서 광범위하게 활용되었다. 다음으로, 리보자임이 생체외에서 독립적으로 합성된 RNA의 방향성 트랜스-스플라이싱에 사용될 수 있는지 여부를 결정하기 위해 연구하였다. T7 RNA 중합효소를 사용하는 Nt- 및 Ct-루시퍼라제-리보자임 리포터 작제물의 생체외 RNA 전사를 사용하여, 재조합 대장균 RtcB의 첨가가 RT-PCR을 사용하여 검출된 트랜스-스플라이싱을 촉매화하는 데 필요하고 충분하다는 것을 발견하였다 (도 10a 및 도 10b). 유사하게, 거미 단백질 스피드로인의 도메인을 코딩하는 RNA를 설계하였다 (도 10c). 스피드로인은 인장 특성으로 인정받는 재료인 드래그라인 거미줄의 주요 구성요소이지만, 이는 단백질의 고도로 반복적인 성질로 인해 이종 시스템에서 합성하기 어려웠다. 스피드로인은 보존된 N-말단 (N1L) 및 C-말단 (N3R) 도메인에 플랭킹된 다중 A 및 Q 반복부로 자연적으로 이루어진다. T7 중합효소를 사용한 스피드로인 RNA의 생체외 합성 후, 대장균으로부터의 재조합 RtcB 리가아제의 첨가는 RT-PCR 및 생어 시퀀싱에 의해 검출된 바와 같이, 리보자임 절단된 N1L 및 N3R 코딩 RNA의 트랜스-결찰을 촉매화하기에 충분하다는 것이 밝혀졌다 (도 10d).
다중-도메인 단백질을 코딩하는 RNA의 제어된 탠덤 트랜스-스플라이싱
다음으로, 플랭킹 리보자임을 포함하는 A-Q 융합 도메인을 코딩하는 제3 RNA의 첨가가 제어되지는 않지만 탠덤 반복 조립을 초래할 것인지 여부를 조사하였다 (도 11a). 각각의 별개의 RNA 사이의 방향성 트랜스-스플라이싱은 검출할 수 있었지만, 3 개 이상의 독립적인 RNA 단편의 조립은 검출할 수 없었다 (데이터는 도시되지 않음). 이는 RtcB에 의한 결찰에 모두 양립가능한 말단을 함유하는 RNA의 빠른 원형화 때문일 수 있다. 대안적인 접근법으로, 트랜스-활성화된 VS 리보자임의 활용은 생체외에서 RNA 서열의 순차적이고 제어된 조립을 허용할 가능성이 있다 (도 11b 및 도 11c). 이 접근법에서, 3' 말단 RNA 리보자임은 VS-Rz에 의한 첨가 및 트랜스-절단 시 RtcB에 의한 결찰에만 적합하다. VS-Rz 트랜스-활성화 리보자임 RNA는 공유적으로 부착되어 있지 않기 때문에, 스티치R 양립가능한 RNA, VS-Rz 및 RtcB 리가아제를 단계적으로 첨가하면 RNA 서열의 제어된 탠덤 조립을 허용할 수 있으며, 이는 생물학적 또는 산업적으로 중요한 단백질, 예컨대, 합성 거미줄, 엘라스틴, 콜라겐 등을 코딩하는 반복 RNA의 조립에 유용할 수 있다.
트랜스-절단 리보자임을 사용한 내인성 RNA의 트랜스-스플라이싱 - 질환 유발 돌연변이를 교정하기 위한 치료적 적용
리보자임은 시스로 절단하는 자가촉매 RNA이며, 본 발명자들이 보여준 고유한 RNA 말단을 생산하기 위해 트랜스-스플라이싱된 후, 포유동물 세포에서 발현된다 (도 12a). 놀랍게도, 시스-절단 리보자임은 표적 RNA가 뉴클레오티드 특이적 방식으로 절단되어 유사한 RNA 말단을 생성할 수 있도록 트랜스로 절단하도록 조작될 수 있다 (도 12b) (Carbonell et al. 2011; Webb and Luptak 2018). 따라서, 트랜스-절단 리보자임은 세포 또는 생체외에서 RNA의 스카리스 트랜스-스플라이싱을 촉매화하는 데 활용될 수 있다. 이 접근법은 수많은 적용에 유용할 수 있으며, 주요 접근법 중 하나는 엑손 또는 인트론 서열에서 돌연변이 플랭킹 서열을 표적화함으로써 유전자 전사물에서 질환 유발 돌연변이를 결실시키는 것이다 (도 12c 및 도 12d).
결론적으로, 세포에서 발현된 독립적인 RNA의 리보자임-매개 절단이 포유동물 세포에서 효율적으로 조립되고 번역될 수 있음이 본원에 나타난다. 본원에서 스티치R이라고 하는 이 접근법은 기본 및 치료적 적용 둘 모두를 위한 기능적 RNA 및 단백질의 조합적 조립을 위한 신규 방법으로서 기능하는 능력을 갖는다. 리보자임의 자가촉매 성질 및 세포에 존재하는 내인성 RNA 복구 경로로 인해, 스티치R은 세포에서 발생하는 트랜스-스플라이싱 및 번역을 위한 별개의 RNA 발현만 필요로 한다. 생체외에서, RtcB 리가아제가 트랜스-스플라이싱에 충분하였으며, 생명의 3 개의 계 모두에 걸친 RtcB의 유니쿼터스 및 광범위한 발현으로 인해, 스티치R은 많은 다양한 유기체에서 유용한 접근법이 될 가능성이 있다.
이 시스템의 강력한 성질은 단백질 코딩 오픈 리딩 프레임의 복원에 필수적인 신뢰할 수 있고 정확한 뉴클레오티드 특이적 단부를 생산하는 리보자임-매개 RNA 절단의 효율적이고 정확한 성질에 의존한다. 추가로, 자체 제거를 완전히 촉매화하는 리보자임을 사용하여 RNA를 생성하는 능력은 스카-리스 조립을 허용하여, 본질적으로 자연 대응물과 구별할 수 없는 RNA를 생성한다.
리보자임 절단은 생체외에서 광범위하게 연구되었지만, 생체내에서의 리보자임 절단은 잘 이해되지 않았으며, RNA 결합 단백질과의 상호작용을 통한 접힘 및 촉매작용에 필요한 금속 이온의 가용성에 의해 영향을 받는 것으로 생각된다. 스티치R은 리보자임 매개된 절단의 간접적인 판독값으로서 역할을 하며, 흥미롭게도 본원에서 리보자임 서열 및 구조의 변화에 의해 유의하게 영향을 받는 것으로 밝혀졌다. 이는 리보자임 절단의 최적화가 생체내에서 스티치R 활성을 향상시키는 데 유용한 접근법일 수 있음을 시사한다. RNA 복구 경로 구성요소, 예컨대, RtcB, RtcA 및 아키에이즈의 효과의 추가 분석은 또한 스티치R 활성을 조절하는 중요한 인자로서 역할을 할 수 있다.
리보자임은 자기-절단을 촉진하기 위해 시스에서 기능하도록 자연적으로 진화하였지만, 다수의 리보자임 패밀리 (특히 HDV 및 HH)는 트랜스에서 표적 RNA를 절단하도록 조작되었다. 트랜스-절단 리보자임을 스티치R과 조합하는 것은 세포 또는 생체외에서 강력한 RNA 절단 및 복구 방법에 대해 추가로 허용될 수 있다는 점에 주목해야 한다. 이 접근법은 RNA 다양성을 생성하거나 질환 유발 RNA에서 특정 해로운 돌연변이를 제거하는 데 유용할 수 있는 RNA에 대한 뉴클레오티드-특이적 '잘라내기 및 붙여넣기' 접근법으로서 역할을 할 수 있다.
실시예 2: 트랜스-활성화된 리보자임을 사용한 RNA의 유도성 트랜스-스플라이싱 및 발현
대부분의 리보자임은 자가촉매적이며, 접힘 및 화학적 촉매작용을 돕는, 생물학적 환경에서 용이하게 발견되는 보조인자로서 금속 이온만을 필요로 한다. 바쿠드 위성 (VS) 리보자임은 공여자 RNA가 G 뉴클레오티드로 끝나는 경우 스카-리스 트랜스-스플라이싱에 활용될 수 있다. 흥미롭게도, VS 리보자임은 리보자임의 트랜스-활성화가 촉매작용을 유도하도록 변형될 수 있다 (Guo and Collins 1995; Ouellet et al. 2009). 2 개의 구성요소로 분할할 때, 작은 VS 줄기 루프 (VS-S)만으로는 시스-절단을 유도하기에 충분하지 않지만, 나머지 서열인 VS-Rz의 첨가는 VS-S의 효율적인 절단을 촉진한다 (도 14a). 이 트랜스-활성화 특징은 유도성 리보자임-매개 트랜스-절단을 허용할 수 있으며, 여기서 VS-Rz 서열의 첨가는 Nt 공여자 RNA의 VS-S 절단에 필요하며, 이어서 이는 5'-OH 말단을 함유하는 Ct 수용자 RNA를 이용한 트랜스-스플라이싱에 적합할 수 있다 (도 14b). 전형적인 5'-P- 및 3'-OH RNA 말단을 함유하는 VS-Rz 서열은 트랜스-스플라이싱에 참여할 수 없으므로, 반응의 다중-턴오버 촉매로서 기능할 수 있다.
VS-Rz와 같은 트랜스-활성화 서열의 필수 첨가를 통해 리보자임-매개 절단을 제어하는 능력은 합성 반복 RNA를 생성하기 위해 가변 또는 비-가변 RNA 서열의 제어된 첨가를 허용할 수 있다 (도 14c). 한 가지 접근법은 고유한 N-말단 도메인, 고유한 C-말단 도메인 및 내부 가변 또는 비-가변 '반복' 도메인을 포함하는 RNA를 생성하는 것이다. 이 접근법은 N-말단 및 C-말단 RNA 둘 모두가 각자 3' 및 5' 단부에 단일 리보자임을 함유해야 한다. 내부 반복 RNA는 5' 및 3' 단부 둘 모두에 리보자임을 필요로 하여, 트랜스-스플라이싱 동안 수용자 및 공여자 둘 모두로서 기능할 수 있다. 그러나, RNA의 두 말단에 대한 리보자임의 첨가, 또는 3'-P 및 5'-OH 둘 모두를 포함하는 RNA는 리가아제, 예컨대, RtcB에 의한 원형화를 야기하여 (Desai et al. 2015), 선형 쇄의 성장에 참여하는 것을 방지한다. 그러나, 유도성 트랜스-활성화된 리보자임의 활용은 VS-Rz 및 RtcB 리가아제 둘 모두의 첨가 및 제거를 통해 5' 및 3' 단부의 단계적 결찰을 허용하여, 제어된 RNA 도메인 합성을 야기할 수 있다 (도 14c). 이 접근법은 합성 반복 단백질, 예컨대, 하이드로겔, 합성 거미줄 또는 콜라겐 등을 구성하는 것들을 생성하기 위해 후속적으로 번역될 수 있는 고도로 반복적인 RNA 서열의 생성에 유용할 수 있으며, 이는 재조합으로 인해 DNA로 생성 및 코딩하기 어려울 수 있다. 이러한 접근법은 약물 전달, 생체재료 또는 산업 재료의 생성에 유용할 수 있다 (Chambre et al. 2020).
실시예 3: 리보자임을 사용한 안정한 합성 인트론 서열의 생성
2 개의 독립적인 RNA 사이의 리보자임-매개 트랜스-스플라이싱은 하나의 RNA가 3' 리보자임을 함유하고 다른 RNA가 5' 리보자임을 함유하는 경우 발생할 수 있다 (도 15a). 그러나, 동일한 RNA 내에서 시스로 전사될 때, 2 개의 리보자임이 이들 자신의 스카-리스 제거를 매개할 수 있는 것으로 나타났다 (도 15b). 이 접근법은 유사하게 3'-P 및 5' OH 말단을 포함하는 2 개의 독립적인 RNA를 생성하며, 이는 세포에서 트랜스-스플라이싱 및 번역의 대상이 될 수 있다 (도 15b). 이는 리가아제, 예컨대, RtcB를 첨가하여 생체외에서 또한 달성될 수 있다.
양립가능한 5'-OH 및 3'-P 단부를 또한 함유하는 리보자임-생성 인트론 서열은 시스-스플라이싱 또는 원형화될 수 있으며, 이는 생체외 RtcB 리가아제 활성의 일반적인 판독값이다. 빠르게 분해되는 엑손 스플라이싱 동안 스플라이소솜에 의해 생성되는 올가미(lariat) RNA와 대조적으로, 원형 RNA는 더 이상 5' 또는 3' 단부를 함유하지 않아 RNA 엑소뉴클레아제에 의해 분해될 수 없기 때문에 고도로 안정적인 것으로 생각된다. 임의의 수의 기능적 또는 유용한 RNA (예컨대, 마이크로RNA, CRISPR 가이드 RNA 등) 또는 유전자 발현 서열을 포함할 수 있는 카고 서열은 2 개의 리보자임 사이에 '카고'로서 삽입될 수 있다 (도 15c). 이 접근법은 리보자임-매개 트랜스-스플라이싱 및 발현 동안 유용한 RNA 서열의 공동-전달 및 발현에 유용할 수 있다. 내부 리보자임 중 하나가 활성을 위해 양측 플랭킹 서열을 필요로 하지 않는 경우, 예컨대, 5' HDV 리보자임의 경우, 원형 RNA은 원형 및 재-절단된 선형 형태 둘 모두로 존재할 수 있다 (도 15c). HDV 대신 VS-S를 사용하는 경우, 시스템이 유도성일 수 있으므로 VS-Rz의 전달 또는 발현이 필요하다. HH 리보자임과 같은 절단을 위해 양측 플랭킹 서열을 필요로 하는 리보자임의 사용은 카고 RNA의 RNA 원형화가 단방향이도록 설계될 수 있다 (도 15d).
실시예 4: 서열
트랜스-스플라이싱 단백질 코딩 핵산 서열
Nt-GFP (서열번호 1)
Figure pct00004
Ct-GFP (서열번호 2)
Figure pct00005
Nt-루시퍼라제 (서열번호 3)
Figure pct00006
Ct-루시퍼라제 (서열번호 4)
Figure pct00007
Figure pct00008
N1L (서열번호 5)
Figure pct00009
AQ (서열번호6)
Figure pct00010
NR3 (서열번호 7)
Figure pct00011
Nt-4xMTS (서열번호 8)
Figure pct00012
Nt-DTA (서열번호 17)
Figure pct00013
Ct-DTA (서열번호 18)
Figure pct00014
GFPcdn (출발 ATG 코돈 없음) (서열번호 19)
Figure pct00015
F2-Myr (서열번호 20)
Figure pct00016
F2-RFP (서열번호 21)
Figure pct00017
Nt-uDys (서열번호 22)
Figure pct00018
Ct-uDys-GFP (서열번호 23)
Figure pct00019
Figure pct00020
Nt-미니Dys (ΔH2-R15) (서열번호 129)
Figure pct00021
Figure pct00022
Ct-미니Dys (ΔH2-R15) (서열번호 130)
Figure pct00023
스카-리스 3' RNA 절단을 위한 리보자임 핵산 서열
HDV68 (서열번호 9)
Figure pct00024
HDV68 촉매 돌연변이 (서열번호 24)
Figure pct00025
HDV67 (서열번호 10)
Figure pct00026
HDV56 (서열번호 11)
Figure pct00027
게놈 HDV (genHDV) (서열번호 12)
Figure pct00028
안티게놈 HDV (안티HDV) (서열번호 13)
Figure pct00029
VS 리보자임 (서열번호 14)
Figure pct00030
VS-S (서열번호 15)
Figure pct00031
VS-Rz (서열번호 16)
Figure pct00032
Nt-Luc에 특이적인 줄기 3 오버행을 포함하는 해머헤드 (서열번호 25)
Figure pct00033
Ct-Luc에 대한 5 nt P1 줄기를 포함하는 트위스터 (서열번호 26)
Figure pct00034
Ct-Luc에 대한 5 nt P1 줄기 및 T6A 돌연변이를 포함하는 트위스터 (서열번호 27)
Figure pct00035
Ct-Luc에 대한 5 nt P1 줄기를 포함하는 트위스터 돌연변이 (서열번호 28)
Figure pct00036
Ct-Luc에 대한 5 nt P1 줄기를 포함하는 트위스터 (서열번호 29)
Figure pct00037
Ct-Luc에 대한 2 nt P1 줄기를 포함하는 트위스터 (서열번호 30)
Figure pct00038
Ct-Luc에 대한 1 nt P1 줄기를 포함하는 트위스터 (서열번호 31)
Figure pct00039
Ct-Luc에 대한 P1 줄기가 없는 트위스터 (서열번호 32)
Figure pct00040
3'에 대한 해머헤드 (HH) (서열번호 105)
Figure pct00041
5 nt P1 줄기를 포함하는 트위스터 WT (서열번호 106)
Figure pct00042
5 nt P1 줄기를 포함하는 트위스터 돌연변이체 (서열번호 107)
Figure pct00043
U1A 돌연변이가 있는 5 nt P1 줄기를 포함하는 트위스터 (서열번호 108)
Figure pct00044
U1C 돌연변이가 있는 5 nt P1 줄기를 포함하는 트위스터 (서열번호 109)
Figure pct00045
U1G 돌연변이가 있는 5 nt P1 줄기를 포함하는 트위스터 (서열번호 110)
Figure pct00046
스카-리스 5' RNA 절단을 위한 리보자임 핵산 서열
Ct-Luc에 특이적인 줄기 1 오버행을 포함하는 해머헤드 (HH) 리보자임
16HH (서열번호 33)
Figure pct00047
14HH (서열번호 34)
Figure pct00048
12HH (서열번호 35)
Figure pct00049
8HH (서열번호 36)
Figure pct00050
6HH (서열번호 37)
Figure pct00051
6HH 돌연변이체 (서열번호 38)
Figure pct00052
4HH (서열번호 39)
Figure pct00053
5'에 대한 해머헤드 4 nt 오버행 (서열번호 111)
Figure pct00054
5'에 대한 해머헤드 6 nt 오버행 (서열번호 112)
Figure pct00055
5'에 대한 해머헤드 8 nt 오버행 (서열번호 113)
Figure pct00056
5'에 대한 해머헤드 10 nt 오버행 (서열번호 114)
Figure pct00057
5'에 대한 해머헤드 12 nt 오버행 (서열번호 115)
Figure pct00058
5'에 대한 해머헤드 14 nt 오버행 (서열번호 116)
Figure pct00059
5'에 대한 해머헤드 16 nt 오버행 (서열번호 117)
Figure pct00060
5'에 대한 TX2 해머헤드 4 nt 오버행 (Huang et al. 2019) (서열번호 118)
Figure pct00061
5'에 대한 TX2 해머헤드 6 nt 오버행 (Huang et al. 2019) (서열번호 119)
Figure pct00062
5'에 대한 TX2 해머헤드 8 nt 오버행 (Huang et al. 2019) (서열번호 120)
Figure pct00063
5'에 대한 TX2 해머헤드 10 nt 오버행 (Huang et al. 2019) (서열번호 121)
Figure pct00064
5'에 대한 TX2 해머헤드 12 nt 오버행 (Huang et al. 2019) (서열번호 122)
Figure pct00065
5'에 대한 TX2 해머헤드 14 nt 오버행 (Huang et al. 2019) (서열번호 123)
Figure pct00066
5'에 대한 TX2 해머헤드 16 nt 오버행 (Huang et al. 2019) (서열번호 124)
Figure pct00067
5'에 대한 RzB 해머헤드 (Saksmerprome et al. 2004) (서열번호 125)
Figure pct00068
Ct-Luc에 특이적인 줄기1 오버행을 포함하는 RzB (Saksmerprome et al. 2004) (서열번호 40)
Figure pct00069
Nt 벡터에 대한 스플라이스 공여자 서열 (서열번호 41)
Figure pct00070
Ct 벡터에 대한 스플라이스 수용자 서열 (서열번호 42)
Figure pct00071
Ct 벡터에 대한 번역 조절 서열
GCN4 5' UTR uORF (Zhang and Hinnebusch 2011) (서열번호 43)
Figure pct00072
sGCN4 5' UTR uORF (서열번호 104)
Figure pct00073
SRY 5' UTR uORF (Calvo et al. 2009) (서열번호 44)
Figure pct00074
Hoxa9 TIE (Leppek et al. 2020) (서열번호 45)
Figure pct00075
Hoxa3 TIE (Leppek et al. 2020) (서열번호 46)
Figure pct00076
NRAS 5'UTR G-사중식(quadruplex) (Kumari et al. 2007) (서열번호 47)
Figure pct00077
인간 IFNG 5' UTR 슈도노트 (Kaempfer 2006) (서열번호 48)
Figure pct00078
Rat ODC 5'UTR (Manzella and Blackshear 1990) (서열번호 49)
Figure pct00079
RNA 핵 국소화 신호
SIRLOIN RNA 핵 국소화 신호 (Lubelsky and Ulitsky 2018) (서열번호 50)
Figure pct00080
BORG lncRNA NLS (Zhang et al. 2014) (서열번호 51)
Figure pct00081
단백질 분해 아미노산 서열
Nt 또는 Ct 벡터에 대한 N- 및 C-말단 단백질 분해 서열
FKBP DD (Banaszynski et al. 2006) (서열번호 52)
Figure pct00082
C-말단 단백질 분해 서열
PEST (enhanced ODC PEST) (Li et al. 1998) (서열번호 53)
Figure pct00083
ODC PEST (효모) (Rogers et al. 1986) (서열번호 54)
Figure pct00084
ODC PEST (인간) (서열번호 55)
Figure pct00085
CL1 (Gilon et al. 1998) (서열번호 56)
Figure pct00086
CL1-PEST (서열번호 57)
Figure pct00087
E1A PEST (Rogers et al. 1986) (서열번호 58)
Figure pct00088
C-myc PEST (Rogers et al. 1986) (서열번호 59)
Figure pct00089
c-Fos PEST (Rogers et al. 1986) (서열번호 60)
Figure pct00090
v-Myb PEST (Rogers et al. 1986) (서열번호 61)
Figure pct00091
NPDC1 PEST (서열번호 62)
Figure pct00092
IkBa PEST (Shumway et al. 1999) (서열번호 63)
Figure pct00093
m.m. AZIN2 PEST (Lambertos and Penafiel 2019) (서열번호 64)
Figure pct00094
x.l. AZIN2 PEST (Lambertos and Penafiel 2019) (서열번호 65)
Figure pct00095
CRL2 유비퀴틴 리가아제에 의해 지시된 C-단부 데그론 (Lin et al. 2018)
NS1 (서열번호 66)
Figure pct00096
NS6 (서열번호 67)
Figure pct00097
NS7 (서열번호 68)
Figure pct00098
NS12 (서열번호 69)
Figure pct00099
NS15 (서열번호 70)
Figure pct00100
SELK (서열번호 71)
Figure pct00101
SELS (서열번호 72)
Figure pct00102
E3 유비퀴틴 리가아제에 의해 지시된 C-단부 데그론 (Koren et al. 2018)
EMID1 (서열번호 73)
Figure pct00103
IRX6 (서열번호 74)
Figure pct00104
유비퀴틴 데그론 (Chassin et al. 2019)
UbVR (서열번호 75)
Figure pct00105
2xUbVR (서열번호 76)
Figure pct00106
폴리 A 꼬리를 통한 번역을 모방하는 서열
12x 폴리 K 코딩 꼬리 서열 (서열번호 77)
Figure pct00107
번역 생성물 12x 폴리 K (서열번호 78)
Figure pct00108
16x 폴리 K 코딩 꼬리 서열 (서열번호 79)
Figure pct00109
번역 생성물 16x 폴리 K (서열번호 80)
Figure pct00110
리보자임-매개 트랜스-스플라이싱을 향상 또는 억압하는 효소
인간 RtcB 단백질 서열 (서열번호 81)
Figure pct00111
인간 RtcB 인간 코돈 최적화된 핵산 서열 (서열번호 82)
Figure pct00112
대장균 RtcB 단백질 서열 (서열번호 83)
Figure pct00113
대장균 RtcB 인간 코돈 최적화된 핵산 서열 (서열번호 84)
Figure pct00114
데이노코커스 라디오듀란스 RtcB 단백질 서열 (서열번호 85)
Figure pct00115
데이노코커스 라디오듀란스 RtcB 인간 코돈 최적화된 핵산 서열 (서열번호 86)
Figure pct00116
파이로코커스 호리코시이 RtcB 단백질 서열 (서열번호 87)
Figure pct00117
파이로코커스 호리코시이 RtcB 인간 코돈 최적화된 핵산 서열 (서열번호 88)
Figure pct00118
파이로코커스 종 ST04 RtcB 단백질 서열(서열번호 89)
Figure pct00119
파이로코커스 종 ST04 RtcB 인간 코돈 최적화된 핵산 서열 (서열번호 90)
Figure pct00120
써모코커스 종 EP1 RtcB 단백질 서열 (서열번호 91)
Figure pct00121
써모코커스 종 EP1 RtcB 인간 코돈 최적화된 핵산 서열 (서열번호 92)
Figure pct00122
인간 아키에이즈 단백질 서열 (서열번호 93)
Figure pct00123
인간 아키에이즈 인간 코돈 최적화된 핵산 서열 (서열번호 94)
Figure pct00124
파이로코커스 호리코시이 아키에이즈 단백질 서열 (서열번호 95)
Figure pct00125
파이로코커스 호리코시이 아키에이즈 인간 코돈 최적화된 핵산 서열 (서열번호 96)
Figure pct00126
T4 폴리뉴클레오티드 키나제 (T4 PNK) 단백질 서열 (서열번호 97)
Figure pct00127
T4 PNK 인간 코돈 최적화된 핵산 서열 (서열번호 98)
Figure pct00128
대장균 thpR 단백질 서열 (서열번호 99)
Figure pct00129
대장균 thpR 인간 코돈 최적화된 핵산 서열 (서열번호 100)
Figure pct00130
인간 PNKP 단백질 서열 (서열번호 101)
Figure pct00131
Figure pct00132
인간 PNKP 인간 코돈 최적화된 핵산 서열 (서열번호 102)
Figure pct00133
카고가 있거나 없는 내부 합성 리보자임 인트론을 포함하는 GFP
NtGFP-HDV-HH-CtGFP (서열번호 103)
Figure pct00134
NtGFP-HDV-카고-HH-CtGFP (서열번호 126)
Figure pct00135
NtGFP-HDV (서열번호 127)
Figure pct00136
Figure pct00137
HH-CtGFP (서열번호 128)
Figure pct00138
본원에 인용된 각각의 모든 특허, 특허 출원 및 공개물의 개시내용은 그 전체가 참조로 본원에 원용된다. 본 발명이 구체적인 실시양태를 참조하여 개시되었지만, 본 발명의 진정한 사상 및 범주를 벗어나지 않으면서 본 발명의 다른 실시양태 및 변동이 당업자에 의해 고안될 수 있음이 명백하다. 첨부된 청구범위는 이러한 모든 실시양태 및 등가 변동을 포함하는 것으로 해석되도록 의도된다.
SEQUENCE LISTING <110> University of Rochester Anderson, Douglas Matthew <120> Ribozyme-mediated RNA Assembly and Expression <130> 204606-0127-00WO <150> US 62/971,356 <151> 2020-02-07 <160> 130 <170> PatentIn version 3.5 <210> 1 <211> 302 <212> RNA <213> Artificial Sequence <220> <223> Nt-GFP <400> 1 auggugagca agggcgagga gcuguucacc gggguggugc ccauccuggu cgagcuggac 60 ggcgacguaa acggccacaa guucagcgug uccggcgagg gcgagggcga ugccaccuac 120 ggcaagcuga cccugaaguu caucugcacc accggcaagc ugcccgugcc cuggcccacc 180 cucgugacca cccugaccua cggcgugcag ugcuucagcc gcuaccccga ccacaugaag 240 cagcacgacu ucuucaaguc cgccaugccc gaaggcuacg uccaggagcg caccaucuuc 300 uu 302 <210> 2 <211> 421 <212> RNA <213> Artificial Sequence <220> <223> Ct-GFP <400> 2 caaggacgac ggcaacuaca agacccgcgc cgaggugaag uucgagggcg acacccuggu 60 gaaccgcauc gagcugaagg gcaucgacuu caaggaggac ggcaacaucc uggggcacaa 120 gcuggaguac aacuacaaca gccacaacgu cuauaucaug gccgacaagc agaagaacgg 180 caucaaggug aacuucaaga uccgccacaa caucgaggac ggcagcgugc agcucgccga 240 ccacuaccag cagaacaccc ccaucggcga cggccccgug cugcugcccg acaaccacua 300 ccugagcacc caguccgccc ugagcaaaga ccccaacgag aagcgcgauc acaugguccu 360 gcuggaguuc gugaccgccg ccgggaucac ucucggcaug gacgagcugu acaaguagua 420 a 421 <210> 3 <211> 831 <212> RNA <213> Artificial Sequence <220> <223> Nt-Luciferase <400> 3 auggaagacg ccaaaaacau aaagaaaggc ccggcgccau ucuauccgcu ggaagaugga 60 accgcuggag agcaacugca uaaggcuaug aagagauacg cccugguucc uggaacaauu 120 gcuuuuacag augcacauau cgagguggac aucacuuacg cugaguacuu cgaaaugucc 180 guucgguugg cagaagcuau gaaacgauau gggcugaaua caaaucacag aaucgucgua 240 ugcagugaaa acucucuuca auucuuuaug ccgguguugg gcgcguuauu uaucggaguu 300 gcaguugcgc ccgcgaacga cauuuauaau gaacgugaau ugcucaacag uaugggcauu 360 ucgcagccua ccgugguguu cguuuccaaa aagggguugc aaaaaauuuu gaacgugcaa 420 aaaaagcucc caaucaucca aaaaauuauu aucauggauu cuaaaacgga uuaccaggga 480 uuucagucga uguacacguu cgucacaucu caucuaccuc ccgguuuuaa ugaauacgau 540 uuugugccag aguccuucga uagggacaag acaauugcac ugaucaugaa cuccucugga 600 ucuacugguc ugccuaaagg ugucgcucug ccucauagaa cugccugcgu gagauucucg 660 caugccagag auccuauuuu uggcaaucaa aucauuccgg auacugcgau uuuaaguguu 720 guuccauucc aucacgguuu uggaauguuu acuacacucg gauauuugau auguggauuu 780 cgagucgucu uaauguauag auuugaagaa gagcuguuuc ugaggagccu u 831 <210> 4 <211> 825 <212> RNA <213> Artificial Sequence <220> <223> Ct-Luciferase <400> 4 caggauuaca agauucaaag ugcgcugcug gugccaaccc uauucuccuu cuucgccaaa 60 agcacucuga uugacaaaua cgauuuaucu aauuuacacg aaauugcuuc ugguggcgcu 120 ccccucucua aggaagucgg ggaagcgguu gccaagaggu uccaucugcc agguaucagg 180 caaggauaug ggcucacuga gacuacauca gcuauucuga uuacacccga gggggaugau 240 aaaccgggcg cggucgguaa aguuguucca uuuuuugaag cgaagguugu ggaucuggau 300 accgggaaaa cgcugggcgu uaaucaaaga ggcgaacugu gugugagagg uccuaugauu 360 auguccgguu auguaaacaa uccggaagcg accaacgccu ugauugacaa ggauggaugg 420 cuacauucug gagacauagc uuacugggac gaagacgaac acuucuucau cguugaccgc 480 cugaagucuc ugauuaagua caaaggcuau cagguggcuc ccgcugaauu ggaauccauc 540 uugcuccaac accccaacau cuucgacgca ggugucgcag gucuucccga cgaugacgcc 600 ggugaacuuc ccgccgccgu uguuguuuug gagcacggaa agacgaugac ggaaaaagag 660 aucguggauu acgucgccag ucaaguaaca accgcgaaaa aguugcgcgg aggaguugug 720 uuuguggacg aaguaccgaa aggucuuacc ggaaaacucg acgcaagaaa aaucagagag 780 auccucauaa aggccaagaa gggcggaaag aucgccgugu aguaa 825 <210> 5 <211> 543 <212> DNA <213> Artificial Sequence <220> <223> N1L <400> 5 atgggtcagg ccaatacgcc ctggagcagt aaggcaaacg cggatgcctt tataaattca 60 ttcatcagtg cagcatccaa tactggttcc ttctctcaag accaaatgga ggacatgtca 120 ctcatcggca atactctgat ggctgccatg gacaatatgg gaggccgcat aacaccatct 180 aagttgcagg cgttggatat ggccttcgca tcatcagtgg ccgagatcgc ggctagtgag 240 ggcggcgact tgggagtcac taccaacgcg atcgcggatg ccctcacttc tgctttttat 300 caaacgaccg gggttgtcaa ttcacgattc atatctgaga tcaggagcct cataggaatg 360 ttcgcgcagg cttccgcaaa tgacgtttat gcatctgctg gctctggcag cgggggtggt 420 gggtatggag ccagctcagc atctgcggct tctgcaagtg ctgctgcccc gagtggcgta 480 gcttatcagg ctcctgctca ggctcaaatc agttttacgt tgcgagggca acaacctgtt 540 tcc 543 <210> 6 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> AQ <400> 6 ggtccttatg gacccggtgc tagcgctgcg gcagcagccg ctggcggtta tggcccaggt 60 tcagggcaac aggggcctgg gcaacaagga cctggccaac aaggtcctgg tcagcagggt 120 ccagggcagc ag 132 <210> 7 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> NR3 <400> 7 ggcgctgctt ccgctgcagt atcagtaggt ggctatggac ctcaatctag tagcgcccct 60 gttgcctctg ccgccgcatc tcgactttca agtcccgccg ctagttccag ggtcagttcc 120 gcggtatcta gcttggtaag tagcggaccc actaatcaag cggcactttc aaacacaata 180 tcctcagtag tcagtcaagt aagcgcatca aaccctggct tgtcagggtg tgacgttctg 240 gttcaggcac ttctggaagt tgtctcagcg ttggtaagca tcctgggtag ctcctccata 300 ggtcaaatta attatggcgc gagcgcccaa tacacacaaa tggtgggtca gagtgtggcg 360 caggcactcg caggcgacta caaggatcat gacggagact ataaggatca tgatatagat 420 tacaaggacg atgatgacaa ggcctagtaa 450 <210> 8 <211> 453 <212> RNA <213> Artificial Sequence <220> <223> Nt-4xMTS <400> 8 augagugugu ugacgccguu gcuucugcga gggcuuaccg ggucugcuag aagacuuccg 60 guccccaggg ccaagauaca uagccucgga gacccgaugu cugugcucac uccucugcuu 120 uugcgaggac ugacuggguc cgccagacga cucccggugc cgagagcuaa aauccauagc 180 cugggaaaau uggcaacuau gucaguccug acgccgcuuc uucuccgggg ucuuacaggg 240 ucugcaagaa ggcugccugu accucgggcg aaaauucaua gcuugggcga cccgaugagu 300 guauugacgc cccuguugcu gagaggauug acugggucag cgcgccggcu cccugucccc 360 cgagcuaaga uucacucccu ugguaagcug agaauccucc aaucaacggu uccgagagca 420 agagauccgc cggucgccac gaggccucuc gag 453 <210> 9 <211> 68 <212> RNA <213> Artificial Sequence <220> <223> HDV68 <400> 9 ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacaugcuu cggcauggcg 60 aaugggac 68 <210> 10 <211> 67 <212> RNA <213> Artificial Sequence <220> <223> HDV67 <400> 10 gggucggcau ggcaucucca ccuccucgcg guccgaccug ggcuacuucg guaggcuaag 60 ggagaag 67 <210> 11 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> HDV56 <400> 11 gagggauagu acagagccuc cccguggcuc ccuuggauaa ccaacugaua cuguac 56 <210> 12 <211> 87 <212> RNA <213> Artificial Sequence <220> <223> Genomic HDV <400> 12 ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacauuccg aggggaccgu 60 ccccucggua auggcgaaug ggaccca 87 <210> 13 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Antigenomic HDV <400> 13 gggucggcau ggcaucucca ccuccucgcg guccgaccug ggcauccgaa ggaggacgca 60 cguccacucg gauggcuaag ggagagccac u 91 <210> 14 <211> 144 <212> RNA <213> Artificial Sequence <220> <223> VS Ribozyme <400> 14 gcgguaguaa gcagggaacu caccuccaau uucaguacug aaauugucgu agcaguugac 60 uacuguuaug ugauugguag aggcuaagug acgguauugg cguaagucag uauugcagca 120 cagcacaagc ccgcuugcga gaau 144 <210> 15 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> VS-S <400> 15 gaagggcguc gucgccccga g 21 <210> 16 <211> 144 <212> RNA <213> Artificial Sequence <220> <223> VS-Rz <400> 16 gcgguaguaa gcagggaacu caccuccaau uucaguacug aaauugucgu agcaguugac 60 uacuguuaug ugauugguag aggcuaagug acgguauugg cguaagucag uauugcagca 120 cagcacaagc ccgcuugcga gaau 144 <210> 17 <211> 291 <212> RNA <213> Artificial Sequence <220> <223> Nt-DTA <400> 17 auggaccccg acgacguggu ggacagcagc aagagcuucg ugauggagaa cuucagcagc 60 uaccacggca ccaagcccgg cuacguggac agcauccaga agggcaucca gaagcccaag 120 agcggcaccc agggcaacua cgacgacgac uggaagggcu ucuacagcac cgacaacaag 180 uacgacgcug ccggcuacag cguggacaac gagaaccccc ugagcggcaa ggccggcggc 240 guggugaagg ugaccuaccc cggccugacc aaggugcugg cccugaaggu g 291 <210> 18 <211> 297 <212> RNA <213> Artificial Sequence <220> <223> Ct-DTA <400> 18 gacaaugccg agaccaucaa gaaggagcug ggccugagcc ugaccgagcc ccugauggag 60 caggugggca ccgaggaguu caucaagaga uucggcgacg gcgccagcag aguggugcug 120 agccugcccu ucgccgaggg cagcagcagc guggaguaca ucaacaacug ggagcaggcc 180 aaggcccuga gcguggagcu ggagaucaac uucgagacca gaggcaagag aggccaggac 240 gccauguacg aguacauggc ccaggcuugc gccggcaaca gagugagaag auaguaa 297 <210> 19 <211> 717 <212> RNA <213> Artificial Sequence <220> <223> GFPcdn (no start ATG codon) <400> 19 guuagcaagg gcgaggagcu cuucaccggg gucgucccca uccucgucga gcucgacggc 60 gacguaaacg gccacaaguu cagcgucucc ggcgagggcg agggcgaugc caccuacggc 120 aagcucaccc ugaaguucau cugcaccacc ggcaagcugc ccgugcccug gcccacccuc 180 gugaccaccc ugaccuacgg cgugcagugc uucagccgcu accccgacca caugaagcag 240 cacgacuucu ucaaguccgc caugcccgaa ggcuacgucc aggagcgcac caucuucuuc 300 aaggacgacg gcaacuacaa gacccgcgcc gaggugaagu ucgagggcga cacccuggug 360 aaccgcaucg agcugaaggg caucgacuuc aaggaggacg gcaacauccu ggggcacaag 420 cuggaguaca acuacaacag ccacaacguc uauaucaugg ccgacaagca gaagaacggc 480 aucaagguga acuucaagau ccgccacaac aucgaggacg gcagcgugca gcucgccgac 540 cacuaccagc agaacacccc caucggcgac ggccccgugc ugcugcccga caaccacuac 600 cugagcaccc aguccgcccu gagcaaagac cccaacgaga agcgcgauca caugguccug 660 cuggaguucg ugaccgccgc cgggaucacu cucggcaugg acgagcugua caaguag 717 <210> 20 <211> 131 <212> RNA <213> Artificial Sequence <220> <223> F2-Myr <400> 20 auggguuguu guuucagcaa gacagcggcg aaaggugaag cagcagcaga aagaccaggc 60 gaggcugcgg uagcaucaag ucccuccaag gcuaaugggc aggaaaacgg acacgucaaa 120 guuggaagcg u 131 <210> 21 <211> 685 <212> RNA <213> Artificial Sequence <220> <223> F2-RFP <400> 21 agccaucauc aaggaguuca ugcgcuucaa ggugcacaug gagggcuccg ugaacggcca 60 cgaguucgag aucgagggcg agggcgaggg ccgccccuac gagggcaccc agaccgccaa 120 gcugaaggug accaagggug gcccccugcc cuucgccugg gacauccugu ccccucaguu 180 cauguacggc uccaaggccu acgugaagca ccccgccgac auccccgacu acuugaagcu 240 guccuucccc gagggcuuca agugggagcg cgugaugaac uucgaggacg gcggcguggu 300 gaccgugacc caggacuccu cccugcagga cggcgaguuc aucuacaagg ugaagcugcg 360 cggcaccaac uuccccuccg acggccccgu aaugcagaag aagaccaugg gcugggaggc 420 cuccuccgag cggauguacc ccgaggacgg cgcccugaag ggcgagauca agcagaggcu 480 gaagcugaag gacggcggcc acuacgacgc ugaggucaag accaccuaca aggccaagaa 540 gcccgugcag cugcccggcg ccuacaacgu caacaucaag uuggacauca ccucccacaa 600 cgaggacuac accaucgugg aacaguacga acgcgccgag ggccgccacu ccaccggcgg 660 cauggacgag cuguacaagu aguaa 685 <210> 22 <211> 2337 <212> RNA <213> Artificial Sequence <220> <223> Nt-uDys <400> 22 augcuuuggu gggaagaagu agaggacugu uaugaaagag aagauguuca aaagaaaaca 60 uucacaaaau ggguaaaugc acaauuuucu aaguuuggga agcagcauau ugagaaccuc 120 uucagugacc uacaggaugg gaggcgccuc cuagaccucc ucgaaggccu gacagggcaa 180 aaacugccaa aagaaaaagg auccacaaga guucaugccc ugaacaaugu caacaaggca 240 cugcggguuu ugcagaacaa uaauguugau uuagugaaua uuggaaguac ugacaucgua 300 gauggaaauc auaaacugac ucuugguuug auuuggaaua uaauccucca cuggcagguc 360 aaaaauguaa ugaaaaauau cauggcugga uugcaacaaa ccaacaguga aaagauucuc 420 cugagcuggg uccgacaauc aacucguaau uauccacagg uuaauguaau caacuucacc 480 accagcuggu cugauggccu ggcuuugaau gcucucaucc auagucauag gccagaccua 540 uuugacugga auaguguggu uugccagcag ucagccacac aacgacugga acaugcauuc 600 aacaucgcca gauaucaauu aggcauagag aaacuacucg auccugaaga uguugauacc 660 accuauccag auaagaaguc caucuuaaug uacaucacau cacucuucca aguuuugccu 720 caacaaguga gcauugaagc cauccaggaa guggaaaugu ugccaaggcc accuaaagug 780 acuaaagaag aacauuuuca guuacaucau caaaugcacu auucucaaca gaucacgguc 840 agucuagcac agggauauga gagaacuucu uccccuaagc cucgauucaa gagcuaugcc 900 uacacacagg cugcuuaugu caccaccucu gacccuacac ggagcccauu uccuucacag 960 cauuuggaag cuccugaaga caagucauuu ggcaguucau ugauggagag ugaaguaaac 1020 cuggaccguu aucaaacagc uuuagaagaa guauuaucgu ggcuucuuuc ugcugaggac 1080 acauugcaag cacaaggaga gauuucuaau gauguggaag uggugaaaga ccaguuucau 1140 acucaugagg gguacaugau ggauuugaca gcccaucagg gccggguugg uaauauucua 1200 caauugggaa guaagcugau uggaacagga aaauuaucag aagaugaaga aacugaagua 1260 caagagcaga ugaaucuccu aaauucaaga ugggaaugcc ucaggguagc uagcauggaa 1320 aaacaaagca auuuacauag aguuuuaaug gaucuccaga aucagaaacu gaaagaguug 1380 aaugacuggc uaacaaaaac agaagaaaga acaaggaaaa uggaggaaga gccucuugga 1440 ccugaucuug aagaccuaaa acgccaagua caacaacaua aggugcuuca agaagaucua 1500 gaacaagaac aagucagggu caauucucuc acucacaugg uggugguagu ugaugaaucu 1560 aguggagauc acgcaacugc ugcuuuggaa gaacaacuua agguauuggg agaucgaugg 1620 gcaaacaucu guagauggac agaagaccgc uggguucuuu uacaagacau ccuucucaaa 1680 uggcaacguc uuacugaaga acagugccuu uuuagugcau ggcuuucaga aaaagaagau 1740 gcagugaaca agauucacac aacuggcuuu aaagaucaaa augaaauguu aucaagucuu 1800 caaaaacugg ccguuuuaaa agcggaucua gaaaagaaaa agcaauccau gggcaaacug 1860 uauucacuca aacaagaucu ucuuucaaca cugaagaaua agucagugac ccagaagacg 1920 gaagcauggc uggauaacuu ugcccggugu ugggauaauu uaguccaaaa acuugaaaag 1980 aguacagcac agauuucaca ggcugucacc accacucagc caucacuaac acagacaacu 2040 guaauggaaa caguaacuac ggugaccaca agggaacaga uccugguaaa gcaugcucaa 2100 gaggaacuuc caccaccacc uccccaaaag aagaggcaga uuacugugga ucuugaaaga 2160 cuccaggaac uucaagaggc cacggaugag cuggaccuca agcugcgcca agcugaggug 2220 aucaagggau ccuggcagcc cgugggcgau cuccucauug acucucucca agaucaccuc 2280 gagaaaguca aggcacuucg aggagaaauu gcgccucuga aagagaacgu gagccac 2337 <210> 23 <211> 1974 <212> RNA <213> Artificial Sequence <220> <223> Ct-uDys-GFP <400> 23 gucaaugacc uugcucgcca gcuuaccacu uugggcauuc agcucucacc guauaaccuc 60 agcacucugg aagaccugaa caccagaugg aagcuucugc agguggccgu cgaggaccga 120 gucaggcagc ugcaugaagc ccacagggac uuugguccag caucucagca cuuucuuucc 180 acgucugucc agggucccug ggagagagcc aucucgccaa acaaagugcc cuacuauauc 240 aaccacgaga cucaaacaac uugcugggac caucccaaaa ugacagagcu cuaccagucu 300 uuagcugacc ugaauaaugu cagauucuca gcuuauagga cugccaugaa acuccgaaga 360 cugcagaagg cccuuugcuu ggaucucuug agccugucag cugcauguga ugccuuggac 420 cagcacaacc ucaagcaaaa ugaccagccc auggauaucc ugcagauuau uaauuguuug 480 accacuauuu augaccgccu ggagcaagag cacaacaauu uggucaacgu cccucucugc 540 guggauaugu gucugaacug gcugcugaau guuuaugaua cgggacgaac agggaggauc 600 cguguccugu cuuuuaaaac uggcaucauu ucccugugua aagcacauuu ggaagacaag 660 uacagauacc uuuucaagca aguggcaagu ucaacaggau uuugugacca gcgcaggcug 720 ggccuccuuc ugcaugauuc uauccaaauu ccaagacagu ugggugaagu ugcauccuuu 780 gggggcagua acauugagcc aaguguccgg agcugcuucc aauuugcuaa uaauaagcca 840 gagaucgaag cggcccucuu ccuagacugg augagacugg aaccccaguc cauggugugg 900 cugcccgucc ugcacagagu ggcugcugca gaaacugcca agcaucaggc caaauguaac 960 aucugcaaag aguguccaau cauuggauuc agguacagga gucuaaagca cuuuaauuau 1020 gacaucugcc aaagcugcuu uuuuucuggu cgaguugcaa aaggccauaa aaugcacuau 1080 cccauggugg aauauugcac uccgacuaca ucaggagaag auguucgaga cuuugccaag 1140 guacuaaaaa acaaauuucg aaccaaaagg uauuuugcga agcauccccg aaugggcuac 1200 cugccagugc agacugucuu agagggggac aacauggaaa cugacacaau ucuagaggug 1260 agcaagggcg aggagcuguu caccggggug gugcccaucc uggucgagcu ggacggcgac 1320 guaaacggcc acaaguucag cguguccggc gagggcgagg gcgaugccac cuacggcaag 1380 cugacccuga aguucaucug caccaccggc aagcugcccg ugcccuggcc cacccucgug 1440 accacccuga ccuacggcgu gcagugcuuc agccgcuacc ccgaccacau gaagcagcac 1500 gacuucuuca aguccgccau gcccgaaggc uacguccagg agcgcaccau cuucuucaag 1560 gacgacggca acuacaagac ccgcgccgag gugaaguucg agggcgacac ccuggugaac 1620 cgcaucgagc ugaagggcau cgacuucaag gaggacggca acauccuggg gcacaagcug 1680 gaguacaacu acaacagcca caacgucuau aucauggccg acaagcagaa gaacggcauc 1740 aaggugaacu ucaagauccg ccacaacauc gaggacggca gcgugcagcu cgccgaccac 1800 uaccagcaga acacccccau cggcgacggc cccgugcugc ugcccgacaa ccacuaccug 1860 agcacccagu ccgcccugag caaagacccc aacgagaagc gcgaucacau gguccugcug 1920 gaguucguga ccgccgccgg gaucacucuc ggcauggacg agcuguacaa guaa 1974 <210> 24 <211> 68 <212> RNA <213> Artificial Sequence <220> <223> HDV68 catalytic mutant <400> 24 ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacaugcuu cggcauggug 60 aaugggac 68 <210> 25 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> Hammerhead with stem 3 overhangs specific to Nt-Luc <400> 25 gagccuuacc ggauguguuu uccggucuga ugaguccggu agcggacgaa aggcuc 56 <210> 26 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> Twister with 5 nt P1 stem for Ct-Luc <400> 26 agccuuaaca cugccaaugc cggucccaag cccggauaaa aguggaggga ggcu 54 <210> 27 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> Twister with 5 nt P1 stem for Ct-Luc and T6A mutation <400> 27 agccuaaaca cugccaaugc cggucccaag cccggauaaa aguggaggga ggcu 54 <210> 28 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> Twister mutant with 5 nt P1 stem for Ct-Luc <400> 28 agccuuaacu cuuccaaugc cggucccaag cccggauaaa aguggaggga ggcu 54 <210> 29 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> Twister with 5 nt P1 stem for Ct-Luc <400> 29 agccuuaaca cugccaaugc cggucccaag cccggauaaa aguggaggga ggcu 54 <210> 30 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> Twister with 2 nt P1 stem for Ct-Luc <400> 30 agccuuaaca cugccaaugc cggucccaag cccggauaaa aguggaggga g 51 <210> 31 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> Twister with 1 nt P1 stem for Ct-Luc <400> 31 agccuuaaca cugccaaugc cggucccaag cccggauaaa aguggaggg 49 <210> 32 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> Twister with no P1 stem for Ct-Luc <400> 32 agccuuaaca cugccaaugc cggucccaag cccggauaaa aguggaggg 49 <210> 33 <211> 53 <212> RNA <213> Artificial Sequence <220> <223> 16HH stem 1 overhang specific to Ct-Luc <400> 33 gaaucuugua auccugcuga ugaguccgug aggacgaaac gaguaagcuc guc 53 <210> 34 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> 14HH stem 1 overhang specific to Ct-Luc <400> 34 aucuuguaau ccugcugaug aguccgugag gacgaaacga guaagcucgu c 51 <210> 35 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> 12HH stem 1 overhang specific to Ct-Luc <400> 35 cuuguaaucc ugcugaugag uccgugagga cgaaacgagu aagcucguc 49 <210> 36 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> 8HH stem 1 overhang specific to Ct-Luc <400> 36 uaauccugcu gaugaguccg ugaggacgaa acgaguaagc ucguc 45 <210> 37 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> 6HH stem 1 overhang specific to Ct-Luc <400> 37 auccugcuga ugaguccgug aggacgaaac gaguaagcuc guc 43 <210> 38 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> 6HH Mutant stem 1 overhang specific to Ct-Lu <400> 38 auccugcuga ugaguccgug aggacgagac gaguaagcuc guc 43 <210> 39 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> 4HH stem 1 overhang specific to Ct-Luc <400> 39 ccugcugaug aguccgugag gacgaaacga guaagcucgu c 41 <210> 40 <211> 55 <212> RNA <213> Artificial Sequence <220> <223> RzB stem1 overhang specific to Ct-Luc <400> 40 uuguaauaau ccugcugaug agucgcuggg augcgacgaa acgccuucgg gcguc 55 <210> 41 <211> 52 <212> RNA <213> Artificial Sequence <220> <223> Splice Donor sequence for Nt vector <400> 41 guaaguauca agguuacaag acagguuuaa ggagaccaau agaaacuggg cu 52 <210> 42 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> Splice Acceptor sequence for Ct vector <400> 42 ugucgagaca gagaagacuc uugcguuucu gauaggcacc uauuggucuu acugacaucc 60 acuuugccuu ucucuccaca g 81 <210> 43 <211> 560 <212> RNA <213> Artificial Sequence <220> <223> GCN4 5' UTR uORFs <400> 43 aaacaaaaac ucacaacaca gguuacucuc cccccuaaau ucaaauuuuu uuugcccauc 60 aguuucacua gcgaauuaua caacucacca gccacacagc ucacucaucu acuucgcaau 120 caaaacaaaa uauuuuauuu uaguucaguu uauuaaguua uuaucaguau cguauuaaaa 180 aauuaaagau cauugaaaaa uggcuugcua aaccgauuau auuuuguuuu uaaaguagau 240 uauuauuaga aaauuauuaa gagaauuaug uguuaaauuu auugaaagag aaaauuuauu 300 uucccuuauu aauuaaaguc cuuuacuuuu uuugaaaacu gucaguuuuu ugaagaguua 360 uuuguuuugu uaccaauugc uaucauguac ccguagaauu uuauucaaga uguuuccgua 420 acgguuaccu uucugucaaa uuauccaggu uuacucgcca auaaaaauuu cccuauacua 480 ucauuaauua aaucauuauu auuacuaaag uuuuguuuac caauuugucu gcucaagaaa 540 auaaauuaaa uacaaauaaa 560 <210> 44 <211> 148 <212> RNA <213> Artificial Sequence <220> <223> SRY 5' UTR uORFs <400> 44 guugaggggg uguugagggc ggagaaaugc aaguuucauu acaaaaguua acguaacaaa 60 gaaucuggua gaaaugaguu uuggauagua aaauaaguuu cgaacucugg caccuuucaa 120 uuuugucgca cucuccuugu uuuugaca 148 <210> 45 <211> 343 <212> RNA <213> Artificial Sequence <220> <223> Hoxa9 TIE <400> 45 gaaaaaacag aagagggaag gauaccagag cgguucauac agggcccaga aacuaggcga 60 ggugaccccu cagcaagaca aacaccucuu gauguugacu ggcgauuuuc cccaucucca 120 gucuggggag cgggacuagg cauacagaug auggagcuua gaacccgcug gcuagggaau 180 aaaauucgcu gggcaguuug ugcucaaaga agugggccag ggcgcuugug acacaaucag 240 ggcguuugug acacaaaccc uugaggguug gcaguucucu ccuuggcggu ugcucugguu 300 gcucuguggg gccuucccug uggagcaagg gugaucuggc cga 343 <210> 46 <211> 170 <212> RNA <213> Artificial Sequence <220> <223> Hoxa3 TIE <400> 46 aggacaauuc gucucuuggg cugccgaagc gacagcuguc agagaggcag aagcuucugg 60 gagccgcggu cugaaggcua cgugugcugc cuggucauuc aaagugucaa uuuuaggucc 120 agaagugucc aaaccacaag uucucaaaac ucugaaaaau ggcucccucc 170 <210> 47 <211> 38 <212> RNA <213> Artificial Sequence <220> <223> NRAS 5'UTR G-quadruplex <400> 47 cgucccgugu gggaggggcg ggucugggug cggccugc 38 <210> 48 <211> 126 <212> RNA <213> Artificial Sequence <220> <223> Human IFNG 5' UTR pseudoknot <400> 48 cacauuguuc ugaucaucug aagaucagcu auuagaagag aaagaucagu uaaguccuuu 60 ggaccugauc agcuugauac aagaacuacu gauuucaacu ucuuuggcuu aauucucucg 120 gaaacg 126 <210> 49 <211> 132 <212> RNA <213> Artificial Sequence <220> <223> Rat ODC 5'UTR <400> 49 ugucaguccc ugcagccgcc gccgccggcc gccuucaguc agcagcucgg cgccaccucc 60 ggucggcgac ugcggcgggc ucgacgaggc ggcugacggg gcggcggcgg gaagacggcc 120 gggugcgccu ug 132 <210> 50 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> SIRLOIN RNA Nuclear Localization Signal <400> 50 cgccucccgg guucaagcga uucuccugcc ucagccuccc gaguagcug 49 <210> 51 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> BORG lncRNA NLS <400> 51 accucagaau cuacaaguca gccccaauua aauguuguuu ua 42 <210> 52 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> FKBP DD <400> 52 Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe 1 5 10 15 Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu 20 25 30 Asp Gly Lys Lys Val Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys 35 40 45 Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val 50 55 60 Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp 65 70 75 80 Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala 85 90 95 Thr Leu Val Phe Asp Val Glu Leu Leu Lys Pro Glu 100 105 <210> 53 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> PEST (enhanced ODC PEST) <400> 53 Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Ala Ala Gly Thr Leu 1 5 10 15 Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro Ala Ala 20 25 30 Cys Ala Ser Ala Arg Ile Asn Val 35 40 <210> 54 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> ODC PEST (yeast) <400> 54 Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Asp Asp Gly Thr Leu 1 5 10 15 Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro Ala Ala 20 25 30 Cys Ala Ser Ala Arg Ile Asn Val 35 40 <210> 55 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> ODC PEST (human) <400> 55 Asn Pro Asp Phe Pro Pro Glu Val Glu Glu Gln Asp Ala Ser Thr Leu 1 5 10 15 Pro Val Ser Cys Ala Trp Glu Ser Gly Met Lys Arg His Arg Ala Ala 20 25 30 Cys Ala Ser Ala Ser Ile Asn Val 35 40 <210> 56 <211> 57 <212> PRT <213> Artificial Sequence <220> <223> CL1 <400> 56 Ala Cys Lys Asn Trp Phe Ser Ser Leu Ser His Phe Val Ile His Leu 1 5 10 15 Asn Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Ala Ala Gly Thr 20 25 30 Leu Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro Ala 35 40 45 Ala Cys Ala Ser Ala Arg Ile Asn Val 50 55 <210> 57 <211> 57 <212> PRT <213> Artificial Sequence <220> <223> CL1-PEST <400> 57 Ala Cys Lys Asn Trp Phe Ser Ser Leu Ser His Phe Val Ile His Leu 1 5 10 15 Asn Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Ala Ala Gly Thr 20 25 30 Leu Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro Ala 35 40 45 Ala Cys Ala Ser Ala Arg Ile Asn Val 50 55 <210> 58 <211> 68 <212> PRT <213> Artificial Sequence <220> <223> E1A PEST <400> 58 Ser Arg Glu Cys Asn Ser Ser Thr Asp Ser Cys Asp Ser Gly Pro Ser 1 5 10 15 Asn Thr Pro Pro Glu Ile His Pro Val Val Pro Leu Cys Pro Ile Lys 20 25 30 Pro Val Ala Val Arg Val Gly Gly Arg Arg Gln Ala Val Glu Cys Ile 35 40 45 Glu Asp Leu Leu Asn Glu Pro Gly Gln Pro Leu Asp Leu Ser Cys Lys 50 55 60 Arg Pro Arg Pro 65 <210> 59 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> C-myc PEST <400> 59 Leu His Glu Glu Thr Pro Pro Thr Thr Ser Ser Asp Ser Glu Glu Glu 1 5 10 15 Gln Glu Asp Glu Glu Glu Ile Asp Val Val Ser Val Glu Lys Arg 20 25 30 <210> 60 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> c-Fos PEST <400> 60 Ala Ala His Arg Lys Gly Ser Ser Ser Asn Glu Pro Ser Ser Asp Ser 1 5 10 15 Leu Ser Ser Pro Thr Leu Leu Ala Leu 20 25 <210> 61 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> v-Myb PEST <400> 61 Pro Ser Pro Pro Val Asp His Gly Cys Leu Pro Glu Glu Ser Ala Ser 1 5 10 15 Pro Ala Arg Cys Met Ile Val His Gln Ser 20 25 <210> 62 <211> 59 <212> PRT <213> Artificial Sequence <220> <223> NPDC1 PEST <400> 62 Pro Pro Lys Glu Leu Asp Thr Ala Ser Ser Asp Glu Glu Asn Glu Asp 1 5 10 15 Gly Asp Phe Thr Val Tyr Glu Cys Pro Gly Leu Ala Pro Thr Gly Glu 20 25 30 Met Glu Val Arg Asn Pro Leu Phe Asp His Ala Ala Leu Ser Ala Pro 35 40 45 Leu Pro Ala Pro Ser Ser Pro Pro Ala Leu Pro 50 55 <210> 63 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> IkBa PEST <400> 63 Pro Glu Ser Glu Asp Glu Glu Ser Tyr Asp Thr Glu Ser Glu Phe Thr 1 5 10 15 Glu Phe Thr Glu Asp Glu Leu Pro Tyr Asp Asp Cys Val Phe Gly Gly 20 25 30 Gln Arg Leu Thr Leu 35 <210> 64 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> m.m. AZIN2 PEST <400> 64 Gly Gln Leu Leu Pro Ala Glu Glu Asp Gln Asp Ala Glu Gly Val Cys 1 5 10 15 Lys Pro Leu Ser Cys Gly Trp Glu Ile Thr Asp Thr Leu Cys Val Gly 20 25 30 Pro Val Phe Thr Pro Ala Ser Ile Met 35 40 <210> 65 <211> 43 <212> PRT <213> Artificial Sequence <220> <223> x.l. AZIN2 PEST <400> 65 Val Gln Leu Leu Gln Arg Gly Leu Gln Gln Thr Glu Glu Lys Glu Asn 1 5 10 15 Val Cys Thr Pro Met Ser Cys Gly Trp Glu Ile Ser Asp Ser Leu Cys 20 25 30 Phe Thr Arg Thr Phe Ala Ala Thr Ser Ile Ile 35 40 <210> 66 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> NS1 <400> 66 Thr Ser Leu Tyr Lys Lys Val Gly Met Gly Arg Lys 1 5 10 <210> 67 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> NS6 <400> 67 Ser Leu Tyr Lys Lys Val Gly Thr Met Ala Ala Gly 1 5 10 <210> 68 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> NS7 <400> 68 Tyr Lys Lys Val Gly Thr Met Arg Gly Arg Gly Leu 1 5 10 <210> 69 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> NS12 <400> 69 Glu Arg Ala Pro Thr Gly Arg Trp Gly Arg Arg Gly 1 5 10 <210> 70 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> NS15 <400> 70 Glu Gly Pro Leu Trp His Pro Arg Ile Cys Gly Ser 1 5 10 <210> 71 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> SELK <400> 71 Leu Arg Gly Pro Ser Pro Pro Pro Met Ala Gly Gly 1 5 10 <210> 72 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> SELS <400> 72 Trp Arg Pro Gly Arg Arg Gly Pro Ser Ser Gly Gly 1 5 10 <210> 73 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> EMID1 <400> 73 Arg Asp Glu Arg Gly 1 5 <210> 74 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> IRX6 <400> 74 Gly Ala Glu Ala Gly 1 5 <210> 75 <211> 80 <212> PRT <213> Artificial Sequence <220> <223> UbVR <400> 75 Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu Val 1 5 10 15 Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp Lys 20 25 30 Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln 35 40 45 Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser 50 55 60 Thr Leu His Leu Val Leu Arg Leu Arg Gly Val Arg Ala Ser Ala Ser 65 70 75 80 <210> 76 <211> 162 <212> PRT <213> Artificial Sequence <220> <223> 2xUbVR <400> 76 Thr Ser Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu 1 5 10 15 Glu Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln 20 25 30 Asp Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly 35 40 45 Lys Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys 50 55 60 Glu Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Val Arg Ala Ser 65 70 75 80 Ala Ser Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu 85 90 95 Glu Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln 100 105 110 Asp Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly 115 120 125 Lys Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys 130 135 140 Glu Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Val Arg Ala Ser 145 150 155 160 Ala Ser <210> 77 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> 12x poly K encoding tail sequence <400> 77 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaataa 39 <210> 78 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Translation Product 12x poly K <400> 78 Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys 1 5 10 <210> 79 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> 16x poly K encoding tail sequence <400> 79 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaata a 51 <210> 80 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Translation Product 16x poly K <400> 80 Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys 1 5 10 15 <210> 81 <211> 505 <212> PRT <213> Artificial Sequence <220> <223> Human RtcB protein sequence <400> 81 Met Ser Arg Ser Tyr Asn Asp Glu Leu Gln Phe Leu Glu Lys Ile Asn 1 5 10 15 Lys Asn Cys Trp Arg Ile Lys Lys Gly Phe Val Pro Asn Met Gln Val 20 25 30 Glu Gly Val Phe Tyr Val Asn Asp Ala Leu Glu Lys Leu Met Phe Glu 35 40 45 Glu Leu Arg Asn Ala Cys Arg Gly Gly Gly Val Gly Gly Phe Leu Pro 50 55 60 Ala Met Lys Gln Ile Gly Asn Val Ala Ala Leu Pro Gly Ile Val His 65 70 75 80 Arg Ser Ile Gly Leu Pro Asp Val His Ser Gly Tyr Gly Phe Ala Ile 85 90 95 Gly Asn Met Ala Ala Phe Asp Met Asn Asp Pro Glu Ala Val Val Ser 100 105 110 Pro Gly Gly Val Gly Phe Asp Ile Asn Cys Gly Val Arg Leu Leu Arg 115 120 125 Thr Asn Leu Asp Glu Ser Asp Val Gln Pro Val Lys Glu Gln Leu Ala 130 135 140 Gln Ala Met Phe Asp His Ile Pro Val Gly Val Gly Ser Lys Gly Val 145 150 155 160 Ile Pro Met Asn Ala Lys Asp Leu Glu Glu Ala Leu Glu Met Gly Val 165 170 175 Asp Trp Ser Leu Arg Glu Gly Tyr Ala Trp Ala Glu Asp Lys Glu His 180 185 190 Cys Glu Glu Tyr Gly Arg Met Leu Gln Ala Asp Pro Asn Lys Val Ser 195 200 205 Ala Arg Ala Lys Lys Arg Gly Leu Pro Gln Leu Gly Thr Leu Gly Ala 210 215 220 Gly Asn His Tyr Ala Glu Ile Gln Val Val Asp Glu Ile Phe Asn Glu 225 230 235 240 Tyr Ala Ala Lys Lys Met Gly Ile Asp His Lys Gly Gln Val Cys Val 245 250 255 Met Ile His Ser Gly Ser Arg Gly Leu Gly His Gln Val Ala Thr Asp 260 265 270 Ala Leu Val Ala Met Glu Lys Ala Met Lys Arg Asp Lys Ile Ile Val 275 280 285 Asn Asp Arg Gln Leu Ala Cys Ala Arg Ile Ala Ser Pro Glu Gly Gln 290 295 300 Asp Tyr Leu Lys Gly Met Ala Ala Ala Gly Asn Tyr Ala Trp Val Asn 305 310 315 320 Arg Ser Ser Met Thr Phe Leu Thr Arg Gln Ala Phe Ala Lys Val Phe 325 330 335 Asn Thr Thr Pro Asp Asp Leu Asp Leu His Val Ile Tyr Asp Val Ser 340 345 350 His Asn Ile Ala Lys Val Glu Gln His Val Val Asp Gly Lys Glu Arg 355 360 365 Thr Leu Leu Val His Arg Lys Gly Ser Thr Arg Ala Phe Pro Pro His 370 375 380 His Pro Leu Ile Ala Val Asp Tyr Gln Leu Thr Gly Gln Pro Val Leu 385 390 395 400 Ile Gly Gly Thr Met Gly Thr Cys Ser Tyr Val Leu Thr Gly Thr Glu 405 410 415 Gln Gly Met Thr Glu Thr Phe Gly Thr Thr Cys His Gly Ala Gly Arg 420 425 430 Ala Leu Ser Arg Ala Lys Ser Arg Arg Asn Leu Asp Phe Gln Asp Val 435 440 445 Leu Asp Lys Leu Ala Asp Met Gly Ile Ala Ile Arg Val Ala Ser Pro 450 455 460 Lys Leu Val Met Glu Glu Ala Pro Glu Ser Tyr Lys Asn Val Thr Asp 465 470 475 480 Val Val Asn Thr Cys His Asp Ala Gly Ile Ser Lys Lys Ala Ile Lys 485 490 495 Leu Arg Pro Ile Ala Val Ile Lys Gly 500 505 <210> 82 <211> 1518 <212> DNA <213> Artificial Sequence <220> <223> Human RtcB human codon optimized nucleic acid sequence <400> 82 atgtcccggt catataatga cgagctgcaa ttccttgaga agataaataa gaattgctgg 60 cgcatcaaga aaggcttcgt tcctaatatg caagttgaag gtgtatttta tgtaaatgac 120 gctttggaaa agttgatgtt cgaggaactg aggaacgcat gtcgcggtgg aggtgtcggg 180 ggttttcttc ccgctatgaa gcagattggc aatgtggcgg ctctgcccgg aattgtgcac 240 cgctctatag gattgcctga cgtacacagc ggctacggat tcgccattgg gaatatggcg 300 gcgttcgata tgaacgaccc tgaggcggtt gttagccctg gaggtgtcgg cttcgatata 360 aattgcggag tcagattgct tcggacaaat ttggatgaat ctgacgtaca accagtgaaa 420 gagcaacttg cacaagcgat gttcgatcat attcccgtgg gtgtggggtc aaagggagta 480 atcccaatga acgcgaaaga cctggaagaa gcattggaga tgggtgtaga ctggtcactg 540 cgagaaggtt atgcctgggc tgaagacaaa gagcactgcg aggagtacgg tcgcatgttg 600 caagcagacc caaataaagt atccgcgagg gccaagaaaa gaggtttgcc gcagctgggg 660 acattggggg ccggtaacca ctatgcagaa atacaagtag tggatgagat tttcaatgag 720 tacgctgcga agaaaatggg gatcgaccat aaaggtcaag tgtgcgtaat gatacattct 780 gggagtcgcg gactcgggca ccaagttgca acggacgccc ttgtcgccat ggaaaaagcg 840 atgaagcggg ataaaatcat cgtaaatgat aggcaattgg cttgcgctcg cattgcgagt 900 ccggaagggc aagactactt gaaagggatg gctgctgccg ggaattatgc atgggtcaac 960 cggagcagta tgacattctt gacgcggcag gcttttgcaa aagtgtttaa tacgactccg 1020 gacgacctcg atctccatgt tatatatgat gtatcacaca atatcgcaaa ggttgagcaa 1080 cacgttgtgg atggtaagga aaggactctg ctggtacacc ggaaaggcag tacacgggca 1140 ttcccgcctc atcacccatt gatcgcagtc gattatcaat tgacaggtca gccagttctg 1200 atcggaggaa caatgggcac atgtagctac gtattgaccg ggactgaaca ggggatgacc 1260 gaaacttttg gcacaacatg ccatggcgcg gggagggcac tctcccgagc taaaagtagg 1320 aggaatcttg acttccagga tgtactggat aagctggccg atatggggat agccatccgg 1380 gtagcgtcac ccaaattggt aatggaggaa gctcctgaaa gctataaaaa tgtcactgac 1440 gttgtcaaca catgccatga cgcgggtata tccaagaaag ctattaagct gcgcccaata 1500 gctgtaatta aaggatag 1518 <210> 83 <211> 408 <212> PRT <213> Artificial Sequence <220> <223> E. Coli RtcB protein sequence <400> 83 Met Asn Tyr Glu Leu Leu Thr Thr Glu Asn Ala Pro Val Lys Met Trp 1 5 10 15 Thr Lys Gly Val Pro Val Glu Ala Asp Ala Arg Gln Gln Leu Ile Asn 20 25 30 Thr Ala Lys Met Pro Phe Ile Phe Lys His Ile Ala Val Met Pro Asp 35 40 45 Val His Leu Gly Lys Gly Ser Thr Ile Gly Ser Val Ile Pro Thr Lys 50 55 60 Gly Ala Ile Ile Pro Ala Ala Val Gly Val Asp Ile Gly Cys Gly Met 65 70 75 80 Asn Ala Leu Arg Thr Ala Leu Thr Ala Glu Asp Leu Pro Glu Asn Leu 85 90 95 Ala Glu Leu Arg Gln Ala Ile Glu Thr Ala Val Pro His Gly Arg Thr 100 105 110 Thr Gly Arg Cys Lys Arg Asp Lys Gly Ala Trp Glu Asn Pro Pro Val 115 120 125 Asn Val Asp Ala Lys Trp Ala Glu Leu Glu Ala Gly Tyr Gln Trp Leu 130 135 140 Thr Gln Lys Tyr Pro Arg Phe Leu Asn Thr Asn Asn Tyr Lys His Leu 145 150 155 160 Gly Thr Leu Gly Thr Gly Asn His Phe Ile Glu Ile Cys Leu Asp Glu 165 170 175 Ser Asp Gln Val Trp Ile Met Leu His Ser Gly Ser Arg Gly Ile Gly 180 185 190 Asn Ala Ile Gly Thr Tyr Phe Ile Asp Leu Ala Gln Lys Glu Met Gln 195 200 205 Glu Thr Leu Glu Thr Leu Pro Ser Arg Asp Leu Ala Tyr Phe Met Glu 210 215 220 Gly Thr Glu Tyr Phe Asp Asp Tyr Leu Lys Ala Val Ala Trp Ala Gln 225 230 235 240 Leu Phe Ala Ser Leu Asn Arg Asp Ala Met Met Glu Asn Val Val Thr 245 250 255 Ala Leu Gln Ser Ile Thr Gln Lys Thr Val Arg Gln Pro Gln Thr Leu 260 265 270 Ala Met Glu Glu Ile Asn Cys His His Asn Tyr Val Gln Lys Glu Gln 275 280 285 His Phe Gly Glu Glu Ile Tyr Val Thr Arg Lys Gly Ala Val Ser Ala 290 295 300 Arg Ala Gly Gln Tyr Gly Ile Ile Pro Gly Ser Met Gly Ala Lys Ser 305 310 315 320 Phe Ile Val Arg Gly Leu Gly Asn Glu Glu Ser Phe Cys Ser Cys Ser 325 330 335 His Gly Ala Gly Arg Val Met Ser Arg Thr Lys Ala Lys Lys Leu Phe 340 345 350 Ser Val Glu Asp Gln Ile Arg Ala Thr Ala His Val Glu Cys Arg Lys 355 360 365 Asp Ala Glu Val Ile Asp Glu Ile Pro Met Ala Tyr Lys Asp Ile Asp 370 375 380 Ala Val Met Ala Ala Gln Ser Asp Leu Val Glu Val Ile Tyr Thr Leu 385 390 395 400 Arg Gln Val Val Cys Val Lys Gly 405 <210> 84 <211> 1227 <212> DNA <213> Artificial Sequence <220> <223> E. Coli RtcB human codon optimized nucleic acid sequence <400> 84 atgaattacg agcttcttac cactgagaat gcacctgtga aaatgtggac taagggagtg 60 cccgtggaag cggacgcaag gcagcagctc ataaatacag ctaagatgcc tttcatcttc 120 aaacacatcg cggttatgcc cgacgtgcac ctcggaaaag gctctactat tggaagtgtg 180 attccgacaa agggtgcgat catacctgct gccgtcgggg tggacatagg ctgtggaatg 240 aatgccctgc gaacggctct taccgcagaa gatcttcctg agaatctggc cgagctgcga 300 caggccattg aaacagcggt tccgcatggt cggactaccg gacggtgcaa aagggacaaa 360 ggtgcgtggg aaaaccctcc cgttaacgtg gatgcgaaat gggctgagtt ggaagcaggc 420 tatcaatggc ttacccagaa atatccacgg ttcttgaaca ctaataacta caaacacctg 480 gggaccttgg ggacggggaa tcatttcatc gaaatctgtc ttgatgagtc tgaccaagtg 540 tggattatgc ttcatagcgg tagccgcggc attggtaacg caattgggac atattttatt 600 gacctcgcgc agaaagagat gcaggaaacg cttgagacgc tgccgtcccg agatcttgcg 660 tattttatgg aagggacgga atactttgac gattatctga aggcggtagc atgggctcaa 720 ctgtttgcta gtctcaaccg agacgcgatg atggaaaatg tggtaacagc acttcaatca 780 atcacccaaa agacagtgcg acagccccaa actctcgcta tggaagaaat caattgccac 840 cacaattacg ttcagaaaga gcaacatttc ggagaagaaa tttacgtgac aagaaaagga 900 gctgttagcg cgagggccgg acagtacggc atcattcctg ggtcaatggg tgcgaaatct 960 tttatagtac gcgggcttgg taatgaagaa tccttctgca gctgttctca tggagccgga 1020 agggtaatgt ccaggactaa ggccaagaaa ctcttctctg tggaagatca aattagagct 1080 acagcacatg ttgaatgtag aaaggatgcc gaagtcatag acgagatccc tatggcttac 1140 aaagatatag atgctgtaat ggctgcacag tcagacctcg tagaggttat ctacacactc 1200 cggcaagtcg tatgcgtaaa aggatag 1227 <210> 85 <211> 470 <212> PRT <213> Artificial Sequence <220> <223> Deinococcus radiodurans RtcB protein sequence <400> 85 Met Asn Gly Lys His Ile Thr Lys Leu Gly Phe Glu Gly Lys Ala Val 1 5 10 15 Gly Leu Ala Leu Ser Ala Ala Gly Leu Arg Glu Asp Ala Gly Val Ser 20 25 30 Arg Gly Asp Ile Leu Asp Glu Leu Arg Ser Val Gln Asn Tyr Pro Glu 35 40 45 Gln Tyr Gln Gly Gly Gly Val Tyr Ala Asp Leu Ala Thr His Leu Ile 50 55 60 Glu Gln Gln Ala Ala Gln Gln Thr Arg Gln Ser Ala Lys Leu Arg Ala 65 70 75 80 Ala Pro Leu Pro Tyr Arg Thr Trp Gly Glu Asp Leu Ile Glu Pro Gly 85 90 95 Ala His Arg Gln Met Asp Val Ala Met Gln Leu Pro Ile Ser Arg Ala 100 105 110 Gly Ala Leu Met Pro Asp Ala His Val Gly Tyr Gly Leu Pro Ile Gly 115 120 125 Gly Val Leu Ala Thr Glu Asn Ala Val Ile Pro Tyr Gly Val Gly Val 130 135 140 Asp Ile Gly Cys Ser Met Met Leu Ser Val Phe Pro Val Ala Ala Thr 145 150 155 160 Gly Leu Ser Val Asp Glu Ala Arg Ser Leu Leu Leu Lys His Thr Arg 165 170 175 Phe Gly Ala Gly Val Gly Phe Glu Lys Arg Asp Arg Leu Asp His Pro 180 185 190 Val Leu Ala Glu Ala Thr Trp Asp Glu Gln Pro Leu Leu Arg His Leu 195 200 205 Phe Asp Lys Ala Ala Gly Gln Ile Gly Ser Ser Gly Ser Gly Asn His 210 215 220 Phe Val Glu Phe Gly Thr Phe Thr Leu Ala Gln Ala Asp Pro Gln Leu 225 230 235 240 Glu Gly Leu Asp Pro Gly Glu Tyr Leu Ala Val Leu Ser His Ser Gly 245 250 255 Ser Arg Gly Phe Gly Ala Gln Val Ala Gly His Phe Thr Asn Leu Ala 260 265 270 Gln Arg Leu Trp Pro Ala Leu Asp Lys Glu Ala Gln Lys Leu Ala Trp 275 280 285 Leu Pro Leu Asp Ser Glu Ala Gly Gln Ala Tyr Trp Gln Ala Met Asn 290 295 300 Leu Ala Gly Arg Tyr Ala Leu Ala Asn His Glu Gln Ile His Ala Arg 305 310 315 320 Leu Ala Arg Ala Leu Gly Glu Lys Pro Leu Leu Arg Ala Gln Asn Ser 325 330 335 His Asn Leu Ala Trp Lys Gln Gln Val Asn Gly Gln Glu Leu Ile Val 340 345 350 His Arg Lys Gly Ala Thr Pro Ala Glu Ala Gly Gln Leu Gly Leu Ile 355 360 365 Pro Gly Ser Met Ala Asp Pro Gly Tyr Leu Val Arg Gly Arg Gly Asn 370 375 380 Pro Glu Ala Leu Ala Ser Ala Ser His Gly Ala Gly Arg Gln Leu Gly 385 390 395 400 Arg Lys Ala Ala Glu Arg Ser Leu Ala Lys Lys Asp Val Gln Ala Tyr 405 410 415 Leu Lys Asp Arg Gly Val Thr Leu Ile Gly Gly Gly Ile Asp Glu Ala 420 425 430 Pro Gln Ala Tyr Lys Arg Ile Glu Asp Val Ile Ala Arg Gln Arg Asp 435 440 445 Leu Val Asp Val Leu Gly Glu Phe Arg Pro Arg Val Val Arg Met Asp 450 455 460 Thr Gly Ser Glu Asp Val 465 470 <210> 86 <211> 1413 <212> DNA <213> Artificial Sequence <220> <223> Deinococcus radiodurans RtcB human codon optimized nucleic acid sequence <400> 86 atgaacggaa agcacatcac gaagttgggt ttcgaaggga aggctgttgg cctggcattg 60 tctgcggctg gtctcaggga agacgcaggc gtttcccgag gagatattct cgatgaactt 120 aggtctgtcc agaattatcc ggagcaatat caagggggag gggtctatgc cgacttggcg 180 acacacctta ttgagcaaca agctgctcag cagactaggc aatccgccaa gctgcgagca 240 gcaccacttc cgtaccgaac gtggggtgaa gacctgatcg agccaggcgc acacagacag 300 atggatgtag caatgcagct cccgatctcc cgggcgggag cgctgatgcc agatgcccac 360 gtaggatacg gacttcccat tggaggcgtg ctcgctaccg aaaacgccgt aatcccctat 420 ggagtgggcg ttgacatcgg ttgctcaatg atgttgagtg ttttcccggt ggctgcaaca 480 ggtctgtcag tggatgaggc gcggtcactg cttctcaaac acacgcgctt cggtgcgggg 540 gtcggattcg agaaacgcga caggctcgac catcctgtct tggcggaggc tacgtgggac 600 gagcagcctt tgctgagaca cttgtttgat aaagctgctg gccagattgg gtcttccgga 660 tcagggaacc acttcgtcga atttggaact ttcaccctcg cacaggccga tccgcagttg 720 gaaggtttgg accctgggga atacttggct gttctttcac actcagggag tagaggattt 780 ggagcccagg tggctgggca ttttaccaac ttggcgcagc gcttgtggcc cgcacttgat 840 aaggaagctc aaaaactcgc atggctgcca ctggattctg aggctgggca agcctactgg 900 caagccatga acttggcggg acgatatgcg ttggctaacc atgagcaaat tcacgcccga 960 ctggcccgcg cacttggtga gaagcctctt ctgcgcgccc agaactccca caatctggcc 1020 tggaaacagc aggtgaatgg gcaggaattg atagtccacc gcaaaggggc tactcctgcg 1080 gaagccgggc aacttggtct catccctggc tccatggccg acccgggata tttggtcagg 1140 ggaaggggaa atccggaagc attggcctct gcgtcacacg gagcaggtag acagctcggc 1200 cggaaggcag cggaaaggtc cctggcgaag aaagatgtgc aggcttacct taaagataga 1260 ggagtaaccc ttatcggggg cgggattgac gaggctcccc aggcgtataa aaggatcgaa 1320 gacgtcatag cacgccagcg ggaccttgtg gatgtgttgg gagaatttag gccacgagta 1380 gtgcggatgg atacagggtc tgaagatgtt tag 1413 <210> 87 <211> 481 <212> PRT <213> Artificial Sequence <220> <223> Pyrococcus horikoshii RtcB protein sequence <400> 87 Met Val Val Pro Leu Lys Arg Ile Asp Lys Ile Arg Trp Glu Ile Pro 1 5 10 15 Lys Phe Asp Lys Arg Met Arg Val Pro Gly Arg Val Tyr Ala Asp Glu 20 25 30 Val Leu Leu Glu Lys Met Lys Asn Asp Arg Thr Leu Glu Gln Ala Thr 35 40 45 Asn Val Ala Met Leu Pro Gly Ile Tyr Lys Tyr Ser Ile Val Met Pro 50 55 60 Asp Gly His Gln Gly Tyr Gly Phe Pro Ile Gly Gly Val Ala Ala Phe 65 70 75 80 Asp Val Lys Glu Gly Val Ile Ser Pro Gly Gly Ile Gly Tyr Asp Ile 85 90 95 Asn Cys Gly Val Arg Leu Ile Arg Thr Asn Leu Thr Glu Lys Glu Val 100 105 110 Arg Pro Arg Ile Lys Gln Leu Val Asp Thr Leu Phe Lys Asn Val Pro 115 120 125 Ser Gly Val Gly Ser Gln Gly Arg Ile Lys Leu His Trp Thr Gln Ile 130 135 140 Asp Asp Val Leu Val Asp Gly Ala Lys Trp Ala Val Asp Asn Gly Tyr 145 150 155 160 Gly Trp Glu Arg Asp Leu Glu Arg Leu Glu Glu Gly Gly Arg Met Glu 165 170 175 Gly Ala Asp Pro Glu Ala Val Ser Gln Arg Ala Lys Gln Arg Gly Ala 180 185 190 Pro Gln Leu Gly Ser Leu Gly Ser Gly Asn His Phe Leu Glu Val Gln 195 200 205 Val Val Asp Lys Ile Phe Asp Pro Glu Val Ala Lys Ala Tyr Gly Leu 210 215 220 Phe Glu Gly Gln Val Val Val Met Val His Thr Gly Ser Arg Gly Leu 225 230 235 240 Gly His Gln Val Ala Ser Asp Tyr Leu Arg Ile Met Glu Arg Ala Ile 245 250 255 Arg Lys Tyr Arg Ile Pro Trp Pro Asp Arg Glu Leu Val Ser Val Pro 260 265 270 Phe Gln Ser Glu Glu Gly Gln Arg Tyr Phe Ser Ala Met Lys Ala Ala 275 280 285 Ala Asn Phe Ala Trp Ala Asn Arg Gln Met Ile Thr His Trp Val Arg 290 295 300 Glu Ser Phe Gln Glu Val Phe Lys Gln Asp Pro Glu Gly Asp Leu Gly 305 310 315 320 Met Asp Ile Val Tyr Asp Val Ala His Asn Ile Gly Lys Val Glu Glu 325 330 335 His Glu Val Asp Gly Lys Arg Val Lys Val Ile Val His Arg Lys Gly 340 345 350 Ala Thr Arg Ala Phe Pro Pro Gly His Glu Ala Val Pro Arg Leu Tyr 355 360 365 Arg Asp Val Gly Gln Pro Val Leu Ile Pro Gly Ser Met Gly Thr Ala 370 375 380 Ser Tyr Ile Leu Ala Gly Thr Glu Gly Ala Met Lys Glu Thr Phe Gly 385 390 395 400 Ser Thr Cys His Gly Ala Gly Arg Val Leu Ser Arg Lys Ala Ala Thr 405 410 415 Arg Gln Tyr Arg Gly Asp Arg Ile Arg Gln Glu Leu Leu Asn Arg Gly 420 425 430 Ile Tyr Val Arg Ala Ala Ser Met Arg Val Val Ala Glu Glu Ala Pro 435 440 445 Gly Ala Tyr Lys Asn Val Asp Asn Val Val Lys Val Val Ser Glu Ala 450 455 460 Gly Ile Ala Lys Leu Val Ala Arg Met Arg Pro Ile Gly Val Ala Lys 465 470 475 480 Gly <210> 88 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> Pyrococcus horikoshii RtcB human codon optimized nucleic acid sequence <400> 88 atggtggttc ccctgaagag aatagataaa attcgctggg agatccctaa gttcgacaaa 60 aggatgagag taccaggacg ggtgtatgca gatgaggtct tgctcgaaaa aatgaaaaat 120 gaccgcacgc ttgaacaggc aacgaacgtc gcaatgctgc caggcattta taaatacagt 180 attgtgatgc ccgatggcca ccaggggtac ggatttccaa ttggaggggt agccgctttc 240 gatgttaaag agggcgtaat cagtcctggt gggatcgggt acgacatcaa ttgtggagtc 300 cgactgatca gaaccaatct cactgagaaa gaagtaaggc ccagaatcaa gcaactggtt 360 gatactctgt ttaaaaacgt cccttctgga gtgggcagtc aagggcggat taaactgcat 420 tggactcaaa tagacgatgt actcgtagac ggggcaaaat gggctgtgga caacggatat 480 ggatgggagc gcgacctcga acggttggaa gaaggtggtc ggatggaggg ggccgatcca 540 gaggcggtct cccaacgggc aaagcagagg ggagcacccc agctcgggtc cctggggtct 600 ggcaaccatt tcctcgaagt acaggtcgta gataagatct ttgatcctga agtagcgaaa 660 gcgtatggcc tcttcgaggg gcaagtggtt gtgatggttc acactggtag cagaggtctt 720 gggcaccaag ttgcatccga ctacttgcga atcatggagc gcgcaattag gaagtataga 780 atcccctggc cggatagaga gcttgtctca gtcccttttc aaagcgagga aggacaaaga 840 tacttcagcg ccatgaaagc cgcggcaaac tttgcatggg caaatcggca gatgataact 900 cattgggtac gagaatcatt ccaagaggtc ttcaaacaag atccggaagg cgacctcggc 960 atggacattg tgtacgatgt cgcccacaat ataggcaaag tggaggagca cgaggtcgat 1020 ggcaaacggg tgaaagttat agtccatcga aagggagcaa ctcgcgcttt tccaccaggt 1080 cacgaggctg tacctaggct gtatcgggat gtcggtcaac ctgtactcat acccggatct 1140 atgggcacag cttcctatat tctggctggc actgaaggag caatgaaaga gacgtttgga 1200 tctacctgtc acggagctgg tagggtactc tcccggaagg ccgcgacacg acaatatcgc 1260 ggggacagga tcagacaaga acttttgaat agaggcatct acgtgcgcgc cgctagtatg 1320 cgcgtcgtgg ccgaagaggc acctggggct tacaagaacg tggataacgt agttaaagta 1380 gtaagtgaag ccggcatcgc caagctggtg gcccggatgc gcccgattgg cgtggcaaag 1440 ggttag 1446 <210> 89 <211> 481 <212> PRT <213> Artificial Sequence <220> <223> Pyrococcus sp. ST04 RtcB protein sequence <400> 89 Met Thr Val Pro Leu Lys Arg Ile Asp Arg Ile Arg Trp Glu Ile Pro 1 5 10 15 Lys Phe Asp Lys Arg Met Arg Val Pro Gly Arg Val Tyr Ala Asp Glu 20 25 30 Val Leu Ile Glu Lys Met Arg Ser Asp Arg Thr Leu Glu Gln Ala Ala 35 40 45 Asn Val Ala Met Leu Pro Gly Ile Tyr Lys Tyr Ser Ile Val Met Pro 50 55 60 Asp Gly His Gln Gly Tyr Gly Phe Pro Ile Gly Gly Val Ala Ala Phe 65 70 75 80 Asp Val Lys Glu Gly Val Ile Ser Pro Gly Gly Ile Gly Tyr Asp Ile 85 90 95 Asn Cys Gly Val Arg Leu Ile Arg Thr Asn Leu Thr Glu Lys Glu Val 100 105 110 Arg Pro Lys Ile Lys Gln Leu Val Asp Thr Leu Phe Lys Asn Val Pro 115 120 125 Ser Gly Val Gly Ser Gln Gly Arg Ile Arg Leu His Trp Thr Gln Ile 130 135 140 Asp Asp Val Leu Val Asp Gly Ala Lys Trp Ala Val Asp Asn Gly Tyr 145 150 155 160 Gly Trp Glu Arg Asp Leu Glu Arg Leu Glu Glu Gly Gly Arg Met Glu 165 170 175 Gly Ala Asp Pro Asp Ala Val Ser Gln Arg Ala Lys Gln Arg Gly Ala 180 185 190 Pro Gln Leu Gly Ser Leu Gly Ser Gly Asn His Phe Leu Glu Val Gln 195 200 205 Val Val Asp Lys Ile Tyr Asp Glu Glu Val Ala Lys Ala Tyr Gly Leu 210 215 220 Phe Glu Gly Gln Val Val Val Met Val His Thr Gly Ser Arg Gly Leu 225 230 235 240 Gly His Gln Val Ala Ser Asp Tyr Leu Arg Ile Met Glu Arg Ala Ile 245 250 255 Arg Lys Tyr Arg Ile Pro Trp Pro Asp Arg Glu Leu Val Ser Val Pro 260 265 270 Phe Gln Ser Glu Glu Gly Gln Arg Tyr Phe Ser Ala Met Lys Ala Ala 275 280 285 Ala Asn Phe Ala Trp Ala Asn Arg Gln Met Ile Thr His Trp Val Arg 290 295 300 Glu Ser Phe Gln Glu Val Phe Arg Gln Asp Pro Glu Gly Asp Leu Gly 305 310 315 320 Met Asp Ile Val Tyr Asp Val Ala His Asn Ile Gly Lys Val Glu Glu 325 330 335 His Glu Val Asp Gly Lys Lys Val Thr Val Ile Val His Arg Lys Gly 340 345 350 Ala Thr Arg Ala Phe Pro Pro Gly His Glu Ala Ile Pro Arg Ile Tyr 355 360 365 Arg Asp Val Gly Gln Pro Val Leu Ile Pro Gly Ser Met Gly Thr Ala 370 375 380 Ser Tyr Val Leu Ala Gly Thr Glu Gly Ala Met Lys Glu Thr Phe Gly 385 390 395 400 Ser Thr Cys His Gly Ala Gly Arg Val Leu Ser Arg Lys Ala Ala Thr 405 410 415 Arg Gln Tyr Arg Gly Asp Arg Ile Arg Asn Glu Leu Leu Gln Arg Gly 420 425 430 Ile Tyr Val Arg Ala Ala Ser Met Arg Val Val Ala Glu Glu Ala Pro 435 440 445 Gly Ala Tyr Lys Asn Val Asp Asn Val Val Lys Val Val Ser Glu Ala 450 455 460 Gly Ile Ala Lys Leu Val Ala Arg Met Arg Pro Ile Gly Val Ala Lys 465 470 475 480 Gly <210> 90 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> Pyrococcus sp. ST04 RtcB human codon optimized nucleic acid sequence <400> 90 atgaccgttc ccctgaagag aatagatagg attcgctggg agatccctaa gttcgacaaa 60 aggatgagag taccaggacg ggtgtatgca gatgaggtct tgatcgagaa aatgagaagc 120 gaccgcacgc ttgaacaggc agccaacgtc gcaatgctgc caggcattta taaatacagt 180 attgtgatgc ccgatggcca ccaggggtac ggatttccaa ttggaggggt agccgctttc 240 gatgttaaag agggcgtaat cagtcctggt gggatcgggt acgacatcaa ttgtggagtc 300 cgactgatca gaaccaatct cactgagaaa gaagtaaggc ccaaaatcaa gcaactggtt 360 gatactctgt ttaaaaacgt cccttctgga gtgggcagtc aagggcggat tagactgcat 420 tggactcaaa tagacgatgt actcgtagac ggggcaaaat gggctgtgga caacggatat 480 ggatgggagc gcgacctcga acggttggaa gaaggtggtc ggatggaggg ggccgatcca 540 gacgcggtct cccaacgggc aaagcagagg ggagcacccc agctcgggtc cctggggtct 600 ggcaaccatt tcctcgaagt acaggtcgta gataagatct acgatgagga agtagcgaaa 660 gcgtatggcc tcttcgaggg gcaagtggtt gtgatggttc acactggtag cagaggtctt 720 gggcaccaag ttgcatccga ctacttgcga atcatggagc gcgcaattag gaagtataga 780 atcccctggc cggatagaga gcttgtctca gtcccttttc aaagcgagga aggacaaaga 840 tacttcagcg ccatgaaagc cgcggcaaac tttgcatggg caaatcggca gatgataact 900 cattgggtac gagaatcatt ccaagaggtc ttcagacaag atccggaagg cgacctcggc 960 atggacattg tgtacgatgt cgcccacaat ataggcaaag tggaggagca cgaggtcgat 1020 ggcaagaaag tgaccgttat agtccatcga aagggagcaa ctcgcgcttt tccaccaggt 1080 cacgaggcta tccctaggat ctatcgggat gtcggtcaac ctgtactcat acccggatct 1140 atgggcacag cttcctatgt gctggctggc actgaaggag caatgaaaga gacgtttgga 1200 tctacctgtc acggagctgg tagggtactc tcccggaagg ccgcgacacg acaatatcgc 1260 ggggacagga tcagaaatga acttttgcaa agaggcatct acgtgcgcgc cgctagtatg 1320 cgcgtcgtgg ccgaagaggc acctggggct tacaagaacg tggataacgt agttaaagta 1380 gtaagtgaag ccggcatcgc caagctggtg gcccggatgc gcccgattgg cgtggcaaag 1440 ggttag 1446 <210> 91 <211> 480 <212> PRT <213> Artificial Sequence <220> <223> Thermococcus sp. EP1 RtcB protein sequence <400> 91 Met Glu Ile Pro Leu Lys Arg Leu Asp Lys Ile Arg Trp Glu Ile Pro 1 5 10 15 Lys Phe Asn Arg Arg Met Arg Val Pro Gly Arg Val Tyr Ala Asp Asp 20 25 30 Thr Leu Leu Gln Lys Met Arg Gln Asp Lys Thr Leu Glu Gln Ala Thr 35 40 45 Asn Val Ala Met Leu Pro Gly Ile Tyr Lys Tyr Ser Ile Val Met Pro 50 55 60 Asp Gly His Gln Gly Tyr Gly Phe Pro Ile Gly Gly Val Ala Ala Phe 65 70 75 80 Asp Val Lys Glu Gly Val Ile Ser Pro Gly Gly Val Gly Tyr Asp Ile 85 90 95 Asn Cys Gly Val Arg Leu Ile Arg Thr Asn Leu Val Glu Lys Glu Val 100 105 110 Arg Pro Lys Ile Lys Gln Leu Ile Asp Thr Leu Phe Lys Asn Val Pro 115 120 125 Ser Gly Leu Gly Ser Lys Gly Arg Ile Arg Leu His Trp Thr Gln Leu 130 135 140 Asp Asp Val Leu Ala Asp Gly Ala Lys Trp Ala Val Asp Asn Gly Tyr 145 150 155 160 Gly Trp Lys Asp Asp Leu Glu His Leu Glu Glu Gly Gly Arg Met Glu 165 170 175 Gly Ala Asn Pro Asn Ala Val Ser Gln Lys Ala Lys Gln Arg Gly Ala 180 185 190 Pro Gln Leu Gly Ser Leu Gly Ser Gly Asn His Phe Leu Glu Ile Gln 195 200 205 Val Val Asp Lys Val Phe Asn Glu Glu Ile Ala Lys Ala Tyr Gly Leu 210 215 220 Phe Glu Gly Gln Ile Val Val Met Val His Thr Gly Ser Arg Gly Leu 225 230 235 240 Gly His Gln Val Ala Ser Asp Tyr Leu Arg Ile Met Glu Lys Ala Asn 245 250 255 Arg Lys Tyr Asn Val Pro Trp Pro Asp Arg Glu Leu Val Ser Val Pro 260 265 270 Phe Gln Thr Glu Glu Gly Gln Arg Tyr Phe Ser Ala Met Lys Ala Ala 275 280 285 Ala Asn Phe Ala Trp Ala Asn Arg Gln Met Ile Thr His Trp Val Arg 290 295 300 Glu Ser Phe Glu Glu Val Phe Lys Gln Lys Ala Glu Asp Leu Gly Met 305 310 315 320 His Ile Val Tyr Asp Val Ala His Asn Ile Ala Lys Val Glu Glu His 325 330 335 Glu Val Asn Gly Arg Lys Ile Lys Val Val Val His Arg Lys Gly Ala 340 345 350 Thr Arg Ala Phe Pro Ala Gly His Glu Ala Ile Pro Lys Ala Tyr Arg 355 360 365 Asp Val Gly Gln Pro Val Leu Ile Pro Gly Ser Met Gly Thr Ala Ser 370 375 380 Tyr Val Leu Ala Gly Ala Glu Gly Ser Met Arg Glu Thr Phe Gly Ser 385 390 395 400 Thr Cys His Gly Ala Gly Arg Val Leu Ser Arg His Ala Ala Thr Arg 405 410 415 Gln Phe Arg Gly Asp Arg Leu Arg Asn Glu Leu Met Gln Arg Gly Ile 420 425 430 Tyr Ile Arg Ala Ala Ser Met Arg Val Val Ala Glu Glu Ala Pro Gly 435 440 445 Ala Tyr Lys Asn Val Asp Asn Val Val Arg Val Val His Glu Ala Gly 450 455 460 Ile Ala Asn Leu Val Ala Arg Met Arg Pro Ile Gly Val Ala Lys Gly 465 470 475 480 <210> 92 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> Thermococcus sp. EP1 RtcB human codon optimized nucleic acid sequence <400> 92 atggagatac cactcaaacg acttgacaag atccgatggg agattcccaa atttaacaga 60 cgaatgagag ttccgggaag agtttacgca gatgatacat tgctccaaaa gatgcgacaa 120 gataagacgc tcgaacaagc caccaacgtg gccatgctcc caggcattta taagtatagt 180 atagtcatgc ctgacggaca ccagggttat ggattcccga ttggcggtgt agcagccttc 240 gacgtaaaag agggagtaat tagtcctggc ggtgttggtt atgatattaa ctgtggcgtg 300 aggcttatca ggacgaatct tgtagagaag gaagtgcgac caaaaatcaa acaacttata 360 gatactttgt tcaaaaatgt cccgtctggg ctcggatcaa agggtcggat aaggctccac 420 tggactcaac tggatgatgt tctggctgat ggggcaaaat gggctgttga caatgggtac 480 gggtggaagg atgatctcga acatttggag gagggcggac ggatggaggg cgcaaacccc 540 aatgccgttt cacagaaagc gaagcaaagg ggagcgccac agcttgggtc ccttggctca 600 ggcaatcatt tcctcgaaat tcaggtcgtc gataaggttt ttaacgaaga gatagcaaag 660 gcttacggac tctttgaagg tcagatagtg gtaatggtcc atacgggctc tcggggactg 720 ggacatcaag tcgcaagtga ctacctgagg atcatggaga aagccaatcg caagtacaat 780 gtgccctggc ctgaccggga gcttgttagc gtgcccttcc agacggaaga gggtcaacga 840 tactttagcg ctatgaaggc ggcagctaat ttcgcttggg caaacagaca gatgataaca 900 cattgggtta gagagtcctt cgaggaggtc tttaaacaaa aagctgagga ccttggaatg 960 catattgtct atgatgttgc ccataacata gcaaaagtag aggaacatga ggtgaacggg 1020 cggaaaatta aggtcgtagt acacagaaaa ggcgctacca gagcattccc cgcaggacac 1080 gaggccatac ccaaagcata tagagatgtc ggccagccag tgctcatacc gggatctatg 1140 ggtacggcgt cctatgtctt ggcgggtgct gaaggatcaa tgagggagac gttcggctca 1200 acctgtcatg gggcaggtcg ggtcttgtct cggcatgctg caactcggca gttccgcggg 1260 gatcgactca ggaatgaact catgcagaga ggcatttaca tacgcgctgc ctccatgcgc 1320 gttgtcgccg aggaagctcc cggcgcctat aagaacgtag acaatgtcgt cagggtggtg 1380 catgaagcgg gaattgcgaa cttggtagcc aggatgcgcc caataggggt tgccaaggga 1440 tagtaa 1446 <210> 93 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Human Archease protein sequence <400> 93 Met Ala Gln Glu Glu Glu Asp Val Arg Asp Tyr Asn Leu Thr Glu Glu 1 5 10 15 Gln Lys Ala Ile Lys Ala Lys Tyr Pro Pro Val Asn Arg Lys Tyr Glu 20 25 30 Tyr Leu Asp His Thr Ala Asp Val Gln Leu His Ala Trp Gly Asp Thr 35 40 45 Leu Glu Glu Ala Phe Glu Gln Cys Ala Met Ala Met Phe Gly Tyr Met 50 55 60 Thr Asp Thr Gly Thr Val Glu Pro Leu Gln Thr Val Glu Val Glu Thr 65 70 75 80 Gln Gly Asp Asp Leu Gln Ser Leu Leu Phe His Phe Leu Asp Glu Trp 85 90 95 Leu Tyr Lys Phe Ser Ala Asp Glu Phe Phe Ile Pro Arg Glu Val Lys 100 105 110 Val Leu Ser Ile Asp Gln Arg Asn Phe Lys Leu Arg Ser Ile Gly Trp 115 120 125 Gly Glu Glu Phe Ser Leu Ser Lys His Pro Gln Gly Thr Glu Val Lys 130 135 140 Ala Ile Thr Tyr Ser Ala Met Gln Val Tyr Asn Glu Glu Asn Pro Glu 145 150 155 160 Val Phe Val Ile Ile Asp Ile 165 <210> 94 <211> 461 <212> DNA <213> Artificial Sequence <220> <223> Human Archease human codon optimized nucleic acid sequence <400> 94 aggaacaaaa ggccatcaaa gcgaaatatc cgcctgtaaa ccgaaagtat gagtacctgg 60 atcacactgc ggacgtccag ttgcatgcct ggggcgacac tctggaggag gcattcgaac 120 aatgtgcaat ggcaatgttt ggctacatga ctgatacagg cacagtggag ccccttcaaa 180 cggtagaggt agaaactcag ggagatgatc ttcagagctt gctcttccat tttctcgacg 240 aatggttgta taagttcagt gccgacgagt tcttcattcc acgcgaagtg aaagtgctga 300 gtattgatca gagaaacttt aaacttaggt ctattgggtg gggtgaagag ttctctttgt 360 ctaaacaccc tcaaggaact gaggtaaagg cgataactta ctcagccatg caggtatata 420 acgaggagaa tcctgaggtt ttcgtaatca ttgatatata g 461 <210> 95 <211> 142 <212> PRT <213> Artificial Sequence <220> <223> Pyrococcus horikoshii Archease protein sequence <400> 95 Met Lys Lys Trp Glu His Tyr Glu His Thr Ala Asp Ile Gly Ile Arg 1 5 10 15 Gly Tyr Gly Asp Ser Leu Glu Glu Ala Phe Glu Ala Val Ala Ile Ala 20 25 30 Leu Phe Asp Val Met Val Asn Val Asn Lys Val Glu Lys Lys Glu Val 35 40 45 Arg Glu Ile Glu Val Glu Ala Glu Asp Leu Glu Ala Leu Leu Tyr Ser 50 55 60 Phe Leu Glu Glu Leu Leu Val Ile His Asp Ile Glu Gly Leu Val Phe 65 70 75 80 Arg Asp Phe Glu Val Lys Ile Glu Arg Val Asn Gly Lys Tyr Arg Leu 85 90 95 Arg Ala Lys Ala Tyr Gly Glu Lys Leu Asp Leu Lys Lys His Glu Pro 100 105 110 Lys Glu Glu Val Lys Ala Ile Thr Tyr His Asp Met Lys Ile Glu Arg 115 120 125 Leu Pro Asn Gly Lys Trp Met Ala Gln Leu Val Pro Asp Ile 130 135 140 <210> 96 <211> 429 <212> DNA <213> Artificial Sequence <220> <223> Pyrococcus horikoshii Archease human codon optimized nucleic acid sequence <400> 96 atgaagaaat gggagcacta tgagcatact gccgacattg gtattcgggg atatggggat 60 agccttgagg aggcattcga agcagtagcc atcgcgctct ttgatgtaat ggtgaacgtg 120 aataaagtcg agaagaagga agtccgagaa attgaagtgg aggcagaaga tttggaggcc 180 ctcctttatt cattcctgga agaactgttg gttattcatg atatagaggg actggttttc 240 agggactttg aagttaagat agagagagta aatggcaaat accgacttcg agcgaaagcc 300 tacggtgaga agctcgacct caagaagcac gaaccgaaag aggaagtaaa ggcgataacc 360 taccatgata tgaaaattga acggttgccc aatggaaagt ggatggctca actcgttcca 420 gatatttag 429 <210> 97 <211> 301 <212> PRT <213> Artificial Sequence <220> <223> T4 Polynucleotide Kinase (T4 PNK) protein sequence <400> 97 Met Lys Lys Ile Ile Leu Thr Ile Gly Cys Pro Gly Ser Gly Lys Ser 1 5 10 15 Thr Trp Ala Arg Glu Phe Ile Ala Lys Asn Pro Gly Phe Tyr Asn Ile 20 25 30 Asn Arg Asp Asp Tyr Arg Gln Ser Ile Met Ala His Glu Glu Arg Asp 35 40 45 Glu Tyr Lys Tyr Thr Lys Lys Lys Glu Gly Ile Val Thr Gly Met Gln 50 55 60 Phe Asp Thr Ala Lys Ser Ile Leu Tyr Gly Gly Asp Ser Val Lys Gly 65 70 75 80 Val Ile Ile Ser Asp Thr Asn Leu Asn Pro Glu Arg Arg Leu Ala Trp 85 90 95 Glu Thr Phe Ala Lys Glu Tyr Gly Trp Lys Val Glu His Lys Val Phe 100 105 110 Asp Val Pro Trp Thr Glu Leu Val Lys Arg Asn Ser Lys Arg Gly Thr 115 120 125 Lys Ala Val Pro Ile Asp Val Leu Arg Ser Met Tyr Lys Ser Met Arg 130 135 140 Glu Tyr Leu Gly Leu Pro Val Tyr Asn Gly Thr Pro Gly Lys Pro Lys 145 150 155 160 Ala Val Ile Phe Asp Val Asp Gly Thr Leu Ala Lys Met Asn Gly Arg 165 170 175 Gly Pro Tyr Asp Leu Glu Lys Cys Asp Thr Asp Val Ile Asn Pro Met 180 185 190 Val Val Glu Leu Ser Lys Met Tyr Ala Leu Met Gly Tyr Gln Ile Val 195 200 205 Val Val Ser Gly Arg Glu Ser Gly Thr Lys Glu Asp Pro Thr Lys Tyr 210 215 220 Tyr Arg Met Thr Arg Lys Trp Val Glu Asp Ile Ala Gly Val Pro Leu 225 230 235 240 Val Met Gln Cys Gln Arg Glu Gln Gly Asp Thr Arg Lys Asp Asp Val 245 250 255 Val Lys Glu Glu Ile Phe Trp Lys His Ile Ala Pro His Phe Asp Val 260 265 270 Lys Leu Ala Ile Asp Asp Arg Thr Gln Val Val Glu Met Trp Arg Arg 275 280 285 Ile Gly Val Glu Cys Trp Gln Val Ala Ser Gly Asp Phe 290 295 300 <210> 98 <211> 906 <212> DNA <213> Artificial Sequence <220> <223> T4 PNK human codon optimized nucleic acid sequence <400> 98 atgaagaaaa ttatacttac aatcggatgc cctggtagtg gtaagagcac ttgggcgagg 60 gaatttattg cgaagaaccc tggattttat aatatcaatc gagacgacta ccggcagtct 120 attatggccc acgaggaacg agacgaatac aagtatacca agaagaaaga agggattgtc 180 acgggtatgc aatttgacac cgccaaatca atactgtacg gaggtgattc agtcaaaggc 240 gttatcatat cagacactaa cctcaatcct gaacgccgat tggcatggga aacatttgcg 300 aaggaatacg gttggaaggt tgaacacaag gtgttcgatg tcccgtggac cgaactggta 360 aaacgcaatt ctaaacgagg cactaaagct gtgcccattg acgtacttcg aagtatgtac 420 aagtccatga gagagtacct ggggcttccc gtctataacg gtacgccggg caaaccgaag 480 gcggtgatct ttgacgtaga tgggactctg gcgaagatga atggtcgcgg accatacgat 540 ttggaaaaat gtgacacaga tgtaatcaac ccaatggtag tagagcttag caagatgtac 600 gcattgatgg gctaccaaat tgtcgtggtg tccgggcggg agtcaggcac aaaagaagat 660 ccgacgaagt attatcgcat gacacggaaa tgggtcgaag atatagccgg ggtgcctctc 720 gttatgcaat gtcaacgaga acagggcgac acacggaagg atgacgtagt gaaggaggaa 780 attttctgga agcatatagc gccacacttt gacgttaagc tcgccatcga cgaccgaact 840 caggtggtcg agatgtggcg acgaattggc gtagagtgtt ggcaagttgc atctggagat 900 ttttag 906 <210> 99 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> E. Coli thpR protein sequence <400> 99 Met Ser Glu Pro Gln Arg Leu Phe Phe Ala Ile Asp Leu Pro Ala Glu 1 5 10 15 Ile Arg Glu Gln Ile Ile His Trp Arg Ala Thr His Phe Pro Pro Glu 20 25 30 Ala Gly Arg Pro Val Ala Ala Asp Asn Leu His Leu Thr Leu Ala Phe 35 40 45 Leu Gly Glu Val Ser Ala Glu Lys Glu Lys Ala Leu Ser Leu Leu Ala 50 55 60 Gly Arg Ile Arg Gln Pro Gly Phe Thr Leu Thr Leu Asp Asp Ala Gly 65 70 75 80 Gln Trp Leu Arg Ser Arg Val Val Trp Leu Gly Met Arg Gln Pro Pro 85 90 95 Arg Gly Leu Ile Gln Leu Ala Asn Met Leu Arg Ser Gln Ala Ala Arg 100 105 110 Ser Gly Cys Phe Gln Ser Asn Arg Pro Phe His Pro His Ile Thr Leu 115 120 125 Leu Arg Asp Ala Ser Glu Ala Val Thr Ile Pro Pro Pro Gly Phe Asn 130 135 140 Trp Ser Tyr Ala Val Thr Glu Phe Thr Leu Tyr Ala Ser Ser Phe Ala 145 150 155 160 Arg Gly Arg Thr Arg Tyr Thr Pro Leu Lys Arg Trp Ala Leu Thr Gln 165 170 175 <210> 100 <211> 531 <212> DNA <213> Artificial Sequence <220> <223> E. Coli thpR human codon optimized nucleic acid sequence <400> 100 atgagtgagc ctcaacgatt gttctttgcc atagatttgc ctgctgaaat tagagagcaa 60 attatccatt ggagagccac ccatttcccc ccagaagctg gacgaccagt cgcagcggac 120 aacctccacc ttacactggc gttcttgggt gaagtgagcg ccgagaaaga gaaagctctc 180 tcacttctgg ctgggaggat tcggcagccg ggctttaccc ttactctgga tgatgccggc 240 cagtggctga ggtccagggt tgtctggctc ggaatgaggc aaccacctag ggggctcatc 300 cagctcgcca atatgctgag atcccaggcc gcaaggtctg gctgcttcca atcaaacagg 360 ccattccacc cgcatattac cttgctcaga gatgcctccg aggcagtaac tattccacct 420 cccggcttta actggagtta cgccgtcaca gaatttactc tgtacgcctc cagcttcgcc 480 cgagggagaa ccaggtacac gcctttgaag cggtgggcct tgacccagta g 531 <210> 101 <211> 521 <212> PRT <213> Artificial Sequence <220> <223> Human PNKP protein sequence <400> 101 Met Gly Glu Val Glu Ala Pro Gly Arg Leu Trp Leu Glu Ser Pro Pro 1 5 10 15 Gly Gly Ala Pro Pro Ile Phe Leu Pro Ser Asp Gly Gln Ala Leu Val 20 25 30 Leu Gly Arg Gly Pro Leu Thr Gln Val Thr Asp Arg Lys Cys Ser Arg 35 40 45 Thr Gln Val Glu Leu Val Ala Asp Pro Glu Thr Arg Thr Val Ala Val 50 55 60 Lys Gln Leu Gly Val Asn Pro Ser Thr Thr Gly Thr Gln Glu Leu Lys 65 70 75 80 Pro Gly Leu Glu Gly Ser Leu Gly Val Gly Asp Thr Leu Tyr Leu Val 85 90 95 Asn Gly Leu His Pro Leu Thr Leu Arg Trp Glu Glu Thr Arg Thr Pro 100 105 110 Glu Ser Gln Pro Asp Thr Pro Pro Gly Thr Pro Leu Val Ser Gln Asp 115 120 125 Glu Lys Arg Asp Ala Glu Leu Pro Lys Lys Arg Met Arg Lys Ser Asn 130 135 140 Pro Gly Trp Glu Asn Leu Glu Lys Leu Leu Val Phe Thr Ala Ala Gly 145 150 155 160 Val Lys Pro Gln Gly Lys Val Ala Gly Phe Asp Leu Asp Gly Thr Leu 165 170 175 Ile Thr Thr Arg Ser Gly Lys Val Phe Pro Thr Gly Pro Ser Asp Trp 180 185 190 Arg Ile Leu Tyr Pro Glu Ile Pro Arg Lys Leu Arg Glu Leu Glu Ala 195 200 205 Glu Gly Tyr Lys Leu Val Ile Phe Thr Asn Gln Met Ser Ile Gly Arg 210 215 220 Gly Lys Leu Pro Ala Glu Glu Phe Lys Ala Lys Val Glu Ala Val Val 225 230 235 240 Glu Lys Leu Gly Val Pro Phe Gln Val Leu Val Ala Thr His Ala Gly 245 250 255 Leu Tyr Arg Lys Pro Val Thr Gly Met Trp Asp His Leu Gln Glu Gln 260 265 270 Ala Asn Asp Gly Thr Pro Ile Ser Ile Gly Asp Ser Ile Phe Val Gly 275 280 285 Asp Ala Ala Gly Arg Pro Ala Asn Trp Ala Pro Gly Arg Lys Lys Lys 290 295 300 Asp Phe Ser Cys Ala Asp Arg Leu Phe Ala Leu Asn Leu Gly Leu Pro 305 310 315 320 Phe Ala Thr Pro Glu Glu Phe Phe Leu Lys Trp Pro Ala Ala Gly Phe 325 330 335 Glu Leu Pro Ala Phe Asp Pro Arg Thr Val Ser Arg Ser Gly Pro Leu 340 345 350 Cys Leu Pro Glu Ser Arg Ala Leu Leu Ser Ala Ser Pro Glu Val Val 355 360 365 Val Ala Val Gly Phe Pro Gly Ala Gly Lys Ser Thr Phe Leu Lys Lys 370 375 380 His Leu Val Ser Ala Gly Tyr Val His Val Asn Arg Asp Thr Leu Gly 385 390 395 400 Ser Trp Gln Arg Cys Val Thr Thr Cys Glu Thr Ala Leu Lys Gln Gly 405 410 415 Lys Arg Val Ala Ile Asp Asn Thr Asn Pro Asp Ala Ala Ser Arg Ala 420 425 430 Arg Tyr Val Gln Cys Ala Arg Ala Ala Gly Val Pro Cys Arg Cys Phe 435 440 445 Leu Phe Thr Ala Thr Leu Glu Gln Ala Arg His Asn Asn Arg Phe Arg 450 455 460 Glu Met Thr Asp Ser Ser His Ile Pro Val Ser Asp Met Val Met Tyr 465 470 475 480 Gly Tyr Arg Lys Gln Phe Glu Ala Pro Thr Leu Ala Glu Gly Phe Ser 485 490 495 Ala Ile Leu Glu Ile Pro Phe Arg Leu Trp Val Glu Pro Arg Leu Gly 500 505 510 Arg Leu Tyr Cys Gln Phe Ser Glu Gly 515 520 <210> 102 <211> 1566 <212> DNA <213> Artificial Sequence <220> <223> Human PNKP human codon optimized nucleic acid sequence <400> 102 atgggcgagg tggaggcccc gggccgcttg tggctcgaga gcccccctgg gggagcgccc 60 cccatcttcc tgccctcgga cgggcaagcc ctggtcctgg gcaggggacc cctgacccag 120 gttacggacc ggaagtgctc cagaactcaa gtggagctgg tcgcagatcc tgagacccgg 180 acagtggcag tgaaacagct gggagttaac ccctcaacta ccgggaccca ggagttgaag 240 ccggggttgg agggctctct gggggtgggg gacacactgt atttggtcaa tggcctccac 300 ccactgaccc tgcgctggga agagacccgc acaccagaat cccagccaga tactccgcct 360 ggcacccctc tggtgtccca agatgagaag agagatgctg agctgccgaa gaagcgtatg 420 cggaagtcaa accccggctg ggagaacttg gagaagttgc tagtgttcac cgcagctggg 480 gtgaaacccc agggcaaggt ggctggcttt gatctggacg ggacgctcat caccacacgc 540 tctgggaagg tctttcccac tggccccagt gactggagga tcttgtaccc agagattccc 600 cgtaagctcc gagagctgga agccgagggc tacaagctgg tgatcttcac caaccagatg 660 agcatcgggc gcgggaagct gccagccgag gagttcaagg ccaaggtgga ggctgtggtg 720 gagaagctgg gggtcccctt ccaggtgctg gtggccacgc acgcaggctt gtaccggaag 780 ccggtgacgg gcatgtggga ccatctgcag gagcaggcca acgacggcac gcccatatcc 840 atcggggaca gcatctttgt gggagacgca gccggacgcc cggccaactg ggccccgggg 900 cggaagaaga aagacttctc ctgcgccgat cgcctgtttg ccctcaacct tggcctgccc 960 ttcgccacgc ctgaggagtt ctttctcaag tggccagcag ccggcttcga gctcccagcc 1020 tttgatccga ggactgtctc ccgctcaggg cctctctgcc tccccgagtc cagggccctc 1080 ctgagcgcca gcccggaggt ggttgtcgca gtgggattcc ctggggccgg gaagtccacc 1140 tttctcaaga agcacctcgt gtcggccgga tatgtccacg tgaacaggga cacgctaggc 1200 tcctggcagc gctgtgtgac cacgtgtgag acagccctga agcaagggaa acgggtcgcc 1260 atcgacaaca caaacccaga cgccgcgagc cgcgccaggt acgtccagtg tgcccgagcc 1320 gcgggcgtcc cctgccgctg cttcctcttc accgccactc tggagcaggc gcgccacaac 1380 aaccggtttc gagagatgac ggactcctct catatccccg tgtcagacat ggtcatgtat 1440 ggctacagga agcagttcga ggccccaacg ctggctgaag gcttctctgc catcctggag 1500 atcccgttcc ggctatgggt ggagccgagg ctggggcggc tgtactgcca gttctccgag 1560 ggctag 1566 <210> 103 <211> 857 <212> RNA <213> Artificial Sequence <220> <223> NtGFP-HDV-HH-CtGFP syntethic intron <400> 103 auggugagca agggcgagga gcuguucacc gggguggugc ccauccuggu cgagcuggac 60 ggcgacguaa acggccacaa guucagcgug uccggcgagg gcgagggcga ugccaccuac 120 ggcaagcuga cccugaaguu caucugcacc accggcaagc ugcccgugcc cuggcccacc 180 cucgugacca cccugaccua cggcgugcag ugcuucagcc gcuaccccga ccacaugaag 240 cagcacgacu ucuucaaguc cgccaugccc gaaggcuacg uccaggagcg caccaucuuc 300 uuggccggca uggucccagc cuccucgcug gcgccggcug ggcaacaugc uucggcaugg 360 cgaaugggac cccgggacau aacuaguuaa accaaauccu ugcugaugag uccgugagga 420 cgaaacgagu aagcucgucc aaggacgacg gcaacuacaa gacccgcgcc gaggugaagu 480 ucgagggcga cacccuggug aaccgcaucg agcugaaggg caucgacuuc aaggaggacg 540 gcaacauccu ggggcacaag cuggaguaca acuacaacag ccacaacguc uauaucaugg 600 ccgacaagca gaagaacggc aucaagguga acuucaagau ccgccacaac aucgaggacg 660 gcagcgugca gcucgccgac cacuaccagc agaacacccc caucggcgac ggccccgugc 720 ugcugcccga caaccacuac cugagcaccc aguccgcccu gagcaaagac cccaacgaga 780 agcgcgauca caugguccug cuggaguucg ugaccgccgc cgggaucacu cucggcaugg 840 acgagcugua caaguag 857 <210> 104 <211> 248 <212> RNA <213> Artificial Sequence <220> <223> sGCN4 5' UTR uORFs <400> 104 uuaaagauca uugaaaaaug gcuugcuaaa ccgauuauau uuuguuuuua aaguagauua 60 uuauuagaaa auuauuaaga gaauuaugug uuaaauuuau ugaaagagaa aauuuauuuu 120 cccuuauuaa uuaaaguccu uuacuuuuuu ugaaaacugu caguuuuuug aagaguuauu 180 uguuuuguua ccaauugcua ucauguaccc guagaauuuu auucaagaug uuuccguaac 240 gguuaccu 248 <210> 105 <211> 56 <212> RNA <213> Artificial Sequence <220> <223> Hammerhead (HH) for 3' <220> <221> misc_feature <222> (1)..(4) <223> n is a, c, g, or u <220> <221> misc_feature <222> (53)..(56) <223> n is a, c, g, or u <400> 105 nnnndwhacc ggauguguuu uccggucuga ugaguccggu agcggacgaa whnnnn 56 <210> 106 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> Twister WT with 5 nt P1 stem <220> <221> misc_feature <222> (1)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(54) <223> n is a, c, g, or u <400> 106 nnnnnuaaca cugccaaugc cggucccaag cccggauaaa aguggagggn nnnn 54 <210> 107 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> Twister Mutant with 5 nt P1 stem <220> <221> misc_feature <222> (1)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(54) <223> n is a, c, g, or u <400> 107 nnnnnuaacu cuuccaaugc cggucccaag cccggauaaa aguggagggn nnnn 54 <210> 108 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> Twister with 5 nt P1 stem with U1A mutation <220> <221> misc_feature <222> (1)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(54) <223> n is a, c, g, or u <400> 108 nnnnnaaaca cugccaaugc cggucccaag cccggauaaa aguggagggn nnnn 54 <210> 109 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> Twister with 5 nt P1 stem with U1C mutation <220> <221> misc_feature <222> (1)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(54) <223> n is a, c, g, or u <400> 109 nnnnncaaca cugccaaugc cggucccaag cccggauaaa aguggagggn nnnn 54 <210> 110 <211> 54 <212> RNA <213> Artificial Sequence <220> <223> Twister with 5 nt P1 stem with U1G mutation <220> <221> misc_feature <222> (1)..(5) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(54) <223> n is a, c, g, or u <400> 110 nnnnngaaca cugccaaugc cggucccaag cccggauaaa aguggagggn nnnn 54 <210> 111 <211> 41 <212> RNA <213> Artificial Sequence <220> <223> Hammerhead 4 nt overhang for 5' <220> <221> misc_feature <222> (1)..(4) <223> n is a, c, g, or u <400> 111 nnnncugaug aguccgugag gacgaaacga guaagcucgu c 41 <210> 112 <211> 43 <212> RNA <213> Artificial Sequence <220> <223> Hammerhead 6 nt overhang for 5' <220> <221> misc_feature <222> (1)..(6) <223> n is a, c, g, or u <400> 112 nnnnnncuga ugaguccgug aggacgaaac gaguaagcuc guc 43 <210> 113 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> Hammerhead 8 nt overhang for 5' <220> <221> misc_feature <222> (1)..(8) <223> n is a, c, g, or u <400> 113 nnnnnnnncu gaugaguccg ugaggacgaa acgaguaagc ucguc 45 <210> 114 <211> 47 <212> RNA <213> Artificial Sequence <220> <223> Hammerhead 10 nt overhang for 5' <220> <221> misc_feature <222> (1)..(10) <223> n is a, c, g, or u <400> 114 nnnnnnnnnn cugaugaguc cgugaggacg aaacgaguaa gcucguc 47 <210> 115 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> Hammerhead 12 nt overhang for 5' <220> <221> misc_feature <222> (1)..(12) <223> n is a, c, g, or u <400> 115 nnnnnnnnnn nncugaugag uccgugagga cgaaacgagu aagcucguc 49 <210> 116 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> Hammerhead 14 nt overhang for 5' <220> <221> misc_feature <222> (1)..(14) <223> n is a, c, g, or u <400> 116 nnnnnnnnnn nnnncugaug aguccgugag gacgaaacga guaagcucgu c 51 <210> 117 <211> 53 <212> RNA <213> Artificial Sequence <220> <223> Hammerhead 16 nt overhang for 5' <220> <221> misc_feature <222> (1)..(16) <223> n is a, c, g, or u <400> 117 nnnnnnnnnn nnnnnncuga ugaguccgug aggacgaaac gaguaagcuc guc 53 <210> 118 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> TX2 Hammerhead 4 nt overhang for 5' <220> <221> misc_feature <222> (1)..(4) <223> n is a, c, g, or u <400> 118 nnnncugaug aguccgguag cggacgaaac gcgcuucggu gcguc 45 <210> 119 <211> 47 <212> RNA <213> Artificial Sequence <220> <223> TX2 Hammerhead 6 nt overhang for 5' <220> <221> misc_feature <222> (1)..(6) <223> n is a, c, g, or u <400> 119 nnnnnncuga ugaguccggu agcggacgaa acgcgcuucg gugcguc 47 <210> 120 <211> 49 <212> RNA <213> Artificial Sequence <220> <223> TX2 Hammerhead 8 nt overhang for 5' <220> <221> misc_feature <222> (1)..(8) <223> n is a, c, g, or u <400> 120 nnnnnnnncu gaugaguccg guagcggacg aaacgcgcuu cggugcguc 49 <210> 121 <211> 51 <212> RNA <213> Artificial Sequence <220> <223> TX2 Hammerhead 10 nt overhang for 5' <220> <221> misc_feature <222> (1)..(10) <223> n is a, c, g, or u <400> 121 nnnnnnnnnn cugaugaguc cgguagcgga cgaaacgcgc uucggugcgu c 51 <210> 122 <211> 53 <212> RNA <213> Artificial Sequence <220> <223> TX2 Hammerhead 12 nt overhang for 5' <220> <221> misc_feature <222> (1)..(12) <223> n is a, c, g, or u <400> 122 nnnnnnnnnn nncugaugag uccgguagcg gacgaaacgc gcuucggugc guc 53 <210> 123 <211> 55 <212> RNA <213> Artificial Sequence <220> <223> TX2 Hammerhead 14 nt overhang for 5' <220> <221> misc_feature <222> (1)..(14) <223> n is a, c, g, or u <400> 123 nnnnnnnnnn nnnncugaug aguccgguag cggacgaaac gcgcuucggu gcguc 55 <210> 124 <211> 57 <212> RNA <213> Artificial Sequence <220> <223> TX2 Hammerhead 16 nt overhang for 5' <220> <221> misc_feature <222> (1)..(16) <223> n is a, c, g, or u <400> 124 nnnnnnnnnn nnnnnncuga ugaguccggu agcggacgaa acgcgcuucg gugcguc 57 <210> 125 <211> 55 <212> RNA <213> Artificial Sequence <220> <223> RzB Hammerhead for 5' <220> <221> misc_feature <222> (1)..(6) <223> n is a, c, g, or u <220> <221> misc_feature <222> (10)..(14) <223> n is a, c, g, or u <400> 125 nnnnnnuaan nnnncugaug agucgcuggg augcgacgaa acgccuucgg gcguc 55 <210> 126 <211> 832 <212> RNA <213> Artificial Sequence <220> <223> NtGFP-HDV-CARGO-HH-CtGFP <220> <221> misc_feature <222> (371)..(371) <223> n is a, c, g, or u <400> 126 auggugagca agggcgagga gcuguucacc gggguggugc ccauccuggu cgagcuggac 60 ggcgacguaa acggccacaa guucagcgug uccggcgagg gcgagggcga ugccaccuac 120 ggcaagcuga cccugaaguu caucugcacc accggcaagc ugcccgugcc cuggcccacc 180 cucgugacca cccugaccua cggcgugcag ugcuucagcc gcuaccccga ccacaugaag 240 cagcacgacu ucuucaaguc cgccaugccc gaaggcuacg uccaggagcg caccaucuuc 300 uuggccggca uggucccagc cuccucgcug gcgccggcug ggcaacaugc uucggcaugg 360 cgaaugggac nuccuugcug augaguccgu gaggacgaaa cgaguaagcu cguccaagga 420 cgacggcaac uacaagaccc gcgccgaggu gaaguucgag ggcgacaccc uggugaaccg 480 caucgagcug aagggcaucg acuucaagga ggacggcaac auccuggggc acaagcugga 540 guacaacuac aacagccaca acgucuauau cauggccgac aagcagaaga acggcaucaa 600 ggugaacuuc aagauccgcc acaacaucga ggacggcagc gugcagcucg ccgaccacua 660 ccagcagaac acccccaucg gcgacggccc cgugcugcug cccgacaacc acuaccugag 720 cacccagucc gcccugagca aagaccccaa cgagaagcgc gaucacaugg uccugcugga 780 guucgugacc gccgccggga ucacucucgg cauggacgag cuguacaagu ag 832 <210> 127 <211> 370 <212> RNA <213> Artificial Sequence <220> <223> NtGFP-HDV <400> 127 auggugagca agggcgagga gcuguucacc gggguggugc ccauccuggu cgagcuggac 60 ggcgacguaa acggccacaa guucagcgug uccggcgagg gcgagggcga ugccaccuac 120 ggcaagcuga cccugaaguu caucugcacc accggcaagc ugcccgugcc cuggcccacc 180 cucgugacca cccugaccua cggcgugcag ugcuucagcc gcuaccccga ccacaugaag 240 cagcacgacu ucuucaaguc cgccaugccc gaaggcuacg uccaggagcg caccaucuuc 300 uuggccggca uggucccagc cuccucgcug gcgccggcug ggcaacaugc uucggcaugg 360 cgaaugggac 370 <210> 128 <211> 461 <212> RNA <213> Artificial Sequence <220> <223> HH-CtGFP <400> 128 uccuugcuga ugaguccgug aggacgaaac gaguaagcuc guccaaggac gacggcaacu 60 acaagacccg cgccgaggug aaguucgagg gcgacacccu ggugaaccgc aucgagcuga 120 agggcaucga cuucaaggag gacggcaaca uccuggggca caagcuggag uacaacuaca 180 acagccacaa cgucuauauc auggccgaca agcagaagaa cggcaucaag gugaacuuca 240 agauccgcca caacaucgag gacggcagcg ugcagcucgc cgaccacuac cagcagaaca 300 cccccaucgg cgacggcccc gugcugcugc ccgacaacca cuaccugagc acccaguccg 360 cccugagcaa agaccccaac gagaagcgcg aucacauggu ccugcuggag uucgugaccg 420 ccgccgggau cacucucggc auggacgagc uguacaagua g 461 <210> 129 <211> 3724 <212> RNA <213> Artificial Sequence <220> <223> Nt-miniDys (deltaH2-R15) <400> 129 augcuuuggu gggaagaagu agaggacugu uaugaaagag aagauguuca aaagaaaaca 60 uucacaaaau ggguaaaugc acaauuuucu aaguuuggga agcagcauau ugagaaccuc 120 uucagugacc uacaggaugg gaggcgccuc cuagaccucc ucgaaggccu gacagggcaa 180 aaacugccaa aagaaaaagg auccacaaga guucaugccc ugaacaaugu caacaaggca 240 cugcggguuu ugcagaacaa uaauguugau uuagugaaua uuggaaguac ugacaucgua 300 gauggaaauc auaaacugac ucuugguuug auuuggaaua uaauccucca cuggcagguc 360 aaaaauguaa ugaaaaauau cauggcugga uugcaacaaa ccaacaguga aaagauucuc 420 cugagcuggg uccgacaauc aacucguaau uauccacagg uuaauguaau caacuucacc 480 accagcuggu cugauggccu ggcuuugaau gcucucaucc auagucauag gccagaccua 540 uuugacugga auaguguggu uugccagcag ucagccacac aacgacugga acaugcauuc 600 aacaucgcca gauaucaauu aggcauagag aaacuacucg auccugaaga uguugauacc 660 accuauccag auaagaaguc caucuuaaug uacaucacau cacucuucca aguuuugccu 720 caacaaguga gcauugaagc cauccaggaa guggaaaugu ugccaaggcc accuaaagug 780 acuaaagaag aacauuuuca guuacaucau caaaugcacu auucucaaca gaucacgguc 840 agucuagcac agggauauga gagaacuucu uccccuaagc cucgauucaa gagcuaugcc 900 uacacacagg cugcuuaugu caccaccucu gacccuacac ggagcccauu uccuucacag 960 cauuuggaag cuccugaaga caagucauuu ggcaguucau ugauggagag ugaaguaaac 1020 cuggaccguu aucaaacagc uuuagaagaa guauuaucgu ggcuucuuuc ugcugaggac 1080 acauugcaag cacaaggaga gauuucuaau gauguggaag uggugaaaga ccaguuucau 1140 acucaugagg gguacaugau ggauuugaca gcccaucagg gccggguugg uaauauucua 1200 caauugggaa guaagcugau uggaacagga aaauuaucag aagaugaaga aacugaagua 1260 caagagcaga ugaaucuccu aaauucaaga ugggaaugcc ucaggguagc uagcauggaa 1320 aaacaaagca auuuacauag aguuuuaaug gaucuccaga aucagaaacu gaaagaguug 1380 aaugacuggc uaacaaaaac agaagaaaga acaaggaaaa uggaggaaga gccucuugga 1440 ccugaucuug aagaccuaaa acgccaagua caacaacaua aggugcuuca agaagaucua 1500 gaacaagaac aagucagggu caauucucuc acucacaugg uggugguagu ugaugaaucu 1560 aguggagauc acgcaacugc ugcuuuggaa gaacaacuua agguauuggg agaucgaugg 1620 gcaaacaucu guagauggac agaagaccgc uggguucuuu uacaagacau ccuucucaaa 1680 uggcaacguc uuacugaaga acagugccuu uuuagugcau ggcuuucaga aaaagaagau 1740 gcagugaaca agauucacac aacuggcuuu aaagaucaaa augaaauguu aucaagucuu 1800 caaaaacugg ccguuuuaaa agcggaucua gaaaagaaaa agcaauccau gggcaaacug 1860 uauucacuca aacaagaucu ucuuucaaca cugaagaaua agucagugac ccagaagacg 1920 gaagcauggc uggauaacuu ugcccggugu ugggauaauu uaguccaaaa acuugaaaag 1980 aguacagcac agauuucaca ggaaauuucu uaugugccuu cuacuuauuu gacugaaauc 2040 acucaugucu cacaagcccu auuagaagug gaacaacuuc ucaaugcucc ugaccucugu 2100 gcuaaggacu uugaagaccu cuuuaagcaa gaggagucuc ugaagaauau aaaagauagu 2160 cuacaacaaa gcucaggucg gauugacauu auucauagca agaagacagc agcauugcaa 2220 agugcaacgc cuguggaaag ggugaagcua caggaagcuc ucucccagcu ugauuuccaa 2280 ugggaaaaag uuaacaaaau guacaaggac cgacaagggc gauuugacag auccguugag 2340 aaauggcggc guuuucauua ugauauaaag auauuuaauc aguggcuaac agaagcugaa 2400 caguuucuca gaaagacaca aauuccugag aauugggaac augcuaaaua caaaugguau 2460 cuuaaggaac uccaggaugg cauugggcag cggcaaacug uugucagaac auugaaugca 2520 acuggggaag aaauaauuca gcaauccuca aaaacagaug ccaguauucu acaggaaaaa 2580 uugggaagcc ugaaucugcg guggcaggag gucugcaaac agcugucaga cagaaaaaag 2640 aggcuagaag aacaaaagaa uaucuuguca gaauuucaaa gagauuuaaa ugaauuuguu 2700 uuaugguugg aggaagcaga uaacauugcu aguaucccac uugaaccugg aaaagagcag 2760 caacuaaaag aaaagcuuga gcaagucaag uuacuggugg aagaguugcc ccugcgccag 2820 ggaauccuca aacaauuaaa ugaaacugga ggacccgugc uuguaagugc ucccauaagc 2880 ccagaagagc aagauaaacu ugaaaauaag cucaagcaga caaaucucca guggauaaag 2940 guuuccagag cuuuaccuga gaaacaagga gaaauugaag cucaaauaaa agaccuuggg 3000 cagcuugaaa aaaagcuuga agaccuugaa gagcaguuaa aucaucugcu gcugugguua 3060 ucuccuauua ggaaucaguu ggaaauuuau aaccaaccaa accaagaagg accauuugac 3120 guuaaggaaa cugaaauagc aguucaagcu aaacaaccgg auguggaaga gauuuugucu 3180 aaagggcagc auuuguacaa ggaaaaacca gccacucagc cagugaagag gaaguuagaa 3240 gaccuguccu cugaguggaa ggcgguaaac cguuuacuuc aagagcugag ggcaaagcag 3300 ccugaccuag cuccuggacu gaccacuauu ggagccucuc cuacucagac uguuacucug 3360 gugacacaac cugugguuac uaaggaaacu gccaucucca aacuagaaau gccaucuucc 3420 uugauguugg agguaccugc ucuggcagau uucaaccggg cuuggacaga acuuaccgac 3480 uggcuuucuc ugcuugauca aguuauaaaa ucacaacgcg ugaugguggg cgaccuugag 3540 gauaucaacg agaugaucau caagcagaag gcaacaaugc aggauuugga acagaggcgu 3600 ccccaguugg aagaacucau uaccgcugcc caaaauuuga aaaacaagac cagcaaucaa 3660 gaggcuagaa caaucauuac ggaucgaauu gaaagaauuc agaaucagug ggaugaagua 3720 caag 3724 <210> 130 <211> 3362 <212> RNA <213> Artificial Sequence <220> <223> Ct-miniDys (deltaH2-R15) <400> 130 aacaccuuca gaaccggagg caacaguuga augaaauguu aaaggauuca acacaauggc 60 uggaagcuaa ggaagaagcu gagcaggucu uaggacaggc cagagccaag cuggagucau 120 ggaaggaggg ucccuauaca guagaugcaa uccaaaagaa aaucacagaa accaagcagu 180 uggccaaaga ccuccgccag uggcagacaa auguagaugu ggcaaaugac uuggcccuga 240 aacuucuccg ggauuauucu gcagaugaua ccagaaaagu ccacaugaua acagagaaua 300 ucaaugccuc uuggagaagc auucauaaaa gggugaguga gcgagaggcu gcuuuggaag 360 aaacucauag auuacugcaa caguuccccc uggaccugga aaaguuucuu gccuggcuua 420 cagaagcuga aacaacugcc aauguccuac aggaugcuac ccguaaggaa aggcuccuag 480 aagacuccaa gggaguaaaa gagcugauga aacaauggca agaccuccaa ggugaaauug 540 aagcucacac agauguuuau cacaaccugg augaaaacag ccaaaaaauc cugagauccc 600 uggaagguuc cgaugaugca guccuguuac aaagacguuu ggauaacaug aacuucaagu 660 ggagugaacu ucggaaaaag ucucucaaca uuagguccca uuuggaagcc aguucugacc 720 aguggaagcg ucugcaccuu ucucugcagg aacuucuggu guggcuacag cugaaagaug 780 augaauuaag ccggcaggca ccuauuggag gcgacuuucc agcaguucag aagcagaacg 840 augugcauag ggccuucaag agggaauuga aaacuaaaga accuguaauc augaguacuc 900 uugagacugu acgaauauuu cugacagagc agccuuugga aggacuagag aaacucuacc 960 aggagcccag agagcugccu ccugaggaga gagcccagaa ugucacucgg cuucuacgaa 1020 agcaggcuga ggaggucaau acugaguggg aaaaauugaa ccugcacucc gcugacuggc 1080 agagaaaaau agaugagacc cuugaaagac uccgggaacu ucaagaggcc acggaugagc 1140 uggaccucaa gcugcgccaa gcugagguga ucaagggauc cuggcagccc gugggcgauc 1200 uccucauuga cucucuccaa gaucaccugg agaaagucaa ggcacuucga ggagaaauug 1260 cgccucugaa agagaacgug agccacguca augaccuugc ucgccagcuu accacuuugg 1320 gcauucagcu cucaccguau aaccucagca cucuggaaga ccugaacacc agauggaagc 1380 uucugcaggu ggccgucgag gaccgaguca ggcagcugca ugaagcccac agggacuuug 1440 guccagcauc ucagcacuuu cuuuccacgu cuguccaggg ucccugggag agagccaucu 1500 cgccaaacaa agugcccuac uauaucaacc acgagacuca aacaacuugc ugggaccauc 1560 ccaaaaugac agagcucuac cagucuuuag cugaccugaa uaaugucaga uucucagcuu 1620 auaggacugc caugaaacuc cgaagacugc agaaggcccu uugcuuggau cucuugagcc 1680 ugucagcugc augugaugcc uuggaccagc acaaccucaa gcaaaaugac cagcccaugg 1740 auauccugca gauuauuaau uguuugacca cuauuuauga ccgccuggag caagagcaca 1800 acaauuuggu caacgucccu cucugcgugg auaugugucu gaacuggcug cugaauguuu 1860 augauacggg acgaacaggg aggauccgug uccugucuuu uaaaacuggc aucauuuccc 1920 uguguaaagc acauuuggaa gacaaguaca gauaccuuuu caagcaagug gcaaguucaa 1980 caggauuuug ugaccagcgc aggcugggcc uccuucugca ugauucuauc caaauuccaa 2040 gacaguuggg ugaaguugca uccuuugggg gcaguaacau ugagccaagu guccggagcu 2100 gcuuccaauu ugcuaauaau aagccagaga ucgaagcggc ccucuuccua gacuggauga 2160 gacuggaacc ccaguccaug guguggcugc ccguccugca cagaguggcu gcugcagaaa 2220 cugccaagca ucaggccaaa uguaacaucu gcaaagagug uccaaucauu ggauucaggu 2280 acaggagucu aaagcacuuu aauuaugaca ucugccaaag cugcuuuuuu ucuggucgag 2340 uugcaaaagg ccauaaaaug cacuauccca ugguggaaua uugcacuccg acuacaucag 2400 gagaagaugu ucgagacuuu gccaagguac uaaaaaacaa auuucgaacc aaaagguauu 2460 uugcgaagca uccccgaaug ggcuaccugc cagugcagac ugucuuagag ggggacaaca 2520 uggaaacucc cguuacucug aucaacuucu ggccaguaga uucugcgccu gccucguccc 2580 cucagcuuuc acacgaugau acucauucac gcauugaaca uuaugcuagc aggcuagcag 2640 aaauggaaaa cagcaaugga ucuuaucuaa augauagcau cucuccuaau gagagcauag 2700 augaugaaca uuuguuaauc cagcauuacu gccaaaguuu gaaccaggac uccccccuga 2760 gccagccucg uaguccugcc cagaucuuga uuuccuuaga gagugaggaa agaggggagc 2820 uagagagaau ccuagcagau cuugaggaag aaaacaggaa ucugcaagca gaauaugacc 2880 gucuaaagca gcagcacgaa cauaaaggcc uguccccacu gccguccccu ccugaaauga 2940 ugcccaccuc uccccagagu ccccgggaug cugagcucau ugcugaggcc aagcuacugc 3000 gucaacacaa aggccgccug gaagccagga ugcaaauccu ggaagaccac aauaaacagc 3060 uggagucaca guuacacagg cuaaggcagc ugcuggagca accccaggca gaggccaaag 3120 ugaauggcac aacggugucc ucuccuucua ccucucuaca gagguccgac agcagucagc 3180 cuaugcugcu ccgagugguu ggcagucaaa cuucggacuc caugggugag gaagaucuuc 3240 ucaguccucc ccaggacaca agcacagggu uagaggaggu gauggagcaa cucaacaacu 3300 ccuucccuag uucaagagga agaaauaccc cuggaaagcc aaugagagag gacacaaugu 3360 aa 3362

Claims (36)

  1. 관심 단백질을 코딩하는 RNA 분자를 생성하기 위한 시스템으로서,
    관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 코딩하는 핵산 분자; 및
    관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 코딩하는 핵산 분자를 포함하는, 시스템.
  2. 제1항에 있어서,
    상기 3' 리보자임이 제1 RNA 분자에서 스스로를 촉매화하여, 3'P 또는 2'3' cP 단부를 생성하는, 시스템.
  3. 제1항 내지 제2항 중 어느 한 항에 있어서,
    상기 5' 리보자임이 제2 RNA 분자에서 스스로를 촉매화하여, 5'OH 단부를 생성하는, 시스템.
  4. 제3항에 있어서,
    상기 3'P 또는 2'3' cP 단부가 5'OH 단부에 결찰되어, 제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역을 포함하는 RNA 분자를 형성하는, 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 3' 리보자임이 리보자임의 HDV 패밀리의 구성원인, 시스템.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 5' 리보자임이 리보자임의 HH 패밀리의 구성원인, 시스템.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 시스템이 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 추가로 포함하고, 각각의 추가적인 RNA 분자가 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임을 포함하는, 시스템.
  8. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 시스템이 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 추가로 포함하고, 각각의 추가적인 RNA 분자가 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함하는, 시스템.
  9. 제8항에 있어서,
    상기 시스템이 3' 인식 서열의 제거를 유도하는 3' 리보자임 인식 서열과 상호작용하는 리보자임을 추가로 포함하는, 시스템.
  10. 제9항에 있어서,
    상기 3' 리보자임 인식 서열이 VS-S를 포함하며, 리보자임이 VS-Rz인, 시스템.
  11. 관심 단백질을 코딩하는 RNA 분자를 생성하는 방법으로서,
    관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 코딩하는 핵산 분자를 세포 또는 조직에 투여하는 단계; 및
    관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 코딩하는 핵산 분자를 세포 또는 조직에 투여하는 단계를 포함하는 것인, 방법.
  12. 제11항에 있어서,
    상기 3' 리보자임이 제1 RNA 분자에서 스스로를 촉매화하여, 3'P 또는 2'3' cP 단부를 생성하는 것인, 방법.
  13. 제11항 내지 제12항 중 어느 한 항에 있어서,
    상기 5' 리보자임이 제2 RNA 분자에서 스스로를 촉매화하여, 5'OH 단부를 생성하는 것인, 방법.
  14. 제13항에 있어서,
    상기 3'P 또는 2'3' cP 단부가 5'OH 단부에 결찰되어, 제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역을 포함하는 RNA 분자를 형성하는 것인, 방법.
  15. 제11항 내지 제14항 중 어느 한 항에 있어서,
    상기 3' 리보자임이 리보자임의 HDV 패밀리의 구성원인 것인, 방법.
  16. 제11항 내지 제14항 중 어느 한 항에 있어서,
    상기 5' 리보자임이 리보자임의 HH 패밀리의 구성원인 것인, 방법.
  17. 제11항 내지 제16항 중 어느 한 항에 있어서,
    상기 방법이 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 세포 또는 조직에 투여하는 단계를 추가로 포함하고, 각각의 추가적인 RNA 분자가 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임을 포함하는 것인, 방법.
  18. 제11항 내지 제16항 중 어느 한 항에 있어서,
    상기 방법이 하나 이상의 추가적인 RNA 분자를 코딩하는 하나 이상의 추가적인 핵산 분자를 세포 또는 조직에 투여하는 단계를 추가로 포함하고, 각각의 추가적인 RNA 분자가 관심 단백질의 도메인을 코딩하는 코딩 영역; 5' 리보자임; 및 3' 리보자임 인식 서열을 포함하는 것인, 방법.
  19. 제18항에 있어서,
    상기 방법이 3' 인식 서열의 제거를 유도하는 3' 리보자임 인식 서열과 상호작용하는 리보자임을 세포 또는 조직에 투여하는 단계를 추가로 포함하는 것인, 방법.
  20. 제19항에 있어서,
    상기 3' 리보자임 인식 서열이 VS-S를 포함하며, 리보자임이 VS-Rz인 것인, 방법.
  21. 제11항 내지 제20항 중 어느 한 항에 있어서,
    상기 방법이 RNA 분자의 조립을 유도하기 위해 리가아제를 세포 또는 조직에 투여하는 단계를 추가로 포함하는 것인, 방법.
  22. 제20항에 있어서,
    상기 리가아제가 RNA 2',3'-사이클릭 포스페이트 및 5'-OH (RtcB) 리가아제인 것인, 방법.
  23. 관심 단백질을 코딩하는 RNA 분자를 생성하는 생체외 방법으로서,
    관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 제공하는 단계;
    관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 RNA 분자를 제공하는 단계; 및
    제1 RNA 분자의 코딩 영역 및 제2 RNA 분자의 코딩 영역으로부터 RNA 분자의 조립을 유도하기 위해 리가아제를 제공하는 단계를 포함하는 것인, 방법.
  24. 관심 반복 도메인 단백질을 코딩하는 RNA 분자를 생성하는 생체외 방법으로서,
    a) 관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 RNA 분자를 제공하는 단계;
    b) 관심 단백질의 도메인을 코딩하는 코딩 영역, 5' 리보자임 및 3' 리보자임 인식 서열을 포함하는 하나 이상의 추가적인 RNA 분자를 제공하는 단계;
    c) 제1 RNA 분자의 코딩 영역 및 하나 이상의 추가적인 RNA 분자의 코딩 영역을 결찰시키기 위해 리가아제를 제공하는 단계;
    d) 3' 리보자임 인식 서열을 인식하고 이의 제거를 촉매화하는 리보자임을 제공하는 단계;
    e) 단계 b)-d)를 1 회 이상 반복하여, 복수의 반복 도메인을 코딩하는 RNA 분자를 생성하는 단계;
    f) 관심 단백질의 마지막 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 마지막 RNA 분자를 제공하는 단계; 및
    g) 하나 이상의 추가적인 RNA 분자의 코딩 영역 및 마지막 RNA 분자의 코딩 영역을 결찰시키기 위해 리가아제를 제공하여, 반복 도메인 단백질을 코딩하는 완전한 RNA 분자를 생성하는 단계를 포함하는 것인, 방법.
  25. 큰 관심 단백질의 돌연변이에 의해 유발된 대상체의 질환 또는 장애를 치료하는 방법으로서,
    관심 단백질의 제1 부분을 코딩하는 코딩 영역 및 3' 리보자임을 포함하는 제1 핵산 분자를 상기 대상체에 투여하는 단계; 및
    관심 단백질의 제2 부분을 코딩하는 코딩 영역 및 5' 리보자임을 포함하는 제2 핵산을 상기 대상체에 투여하는 단계를 포함하는 것인, 방법.
  26. 제25항에 있어서,
    상기 질환 또는 장애가 뒤센 근이영양증, 상염색체 열성 다낭성 신장 질환, 혈우병 A, 스타가르트 황반변성, 사지대 근이영양증, DFNB9, 신경감각 비증후군 열성 난청, 낭포성 섬유증, 윌슨 질환, 미요시 근이영양증 및 난청, 상염색체 열성 9, 어셔 증후군, 유형 I 및 난청, 상염색체 열성 2, 난청, 상염색체 열성 3 및 비증후군성 청력 손실, 어셔 증후군 유형 I, 상염색체 열성 난청-16 (DFNB16), 메니에르 질환 (MD), 난청, 상염색체 우성 12 및 난청, 상염색체 열성 21, 어셔 증후군 유형 1F (USH1F) 및 DFNB23, 난청, 상염색체 열성 28 및 비증후군성 청력 손실, 난청, 상염색체 열성 30 및 비증후군성 청력 손실, 귀척추거대골단 이형성증, 상염색체 열성 및 귀척추거대골단 이형성증, 상염색체 우성, 난청, 상염색체 열성 77 및 상염색체 열성 비-증후군성 감각신경성 난청 유형 Dfnb, 상염색체-열성 비증후군성 청각 장해 DFNB84, 난청, 상염색체 열성 84B 및 희귀 유전성 난청, 말초 신경병증, 근병증, 쉰 목소리, 및 청각 손실 및 난청, 상염색체 우성 4A, 선천성 혈소판감소증, 감각 청력 손실, DFNA56, HXB, 난청, 상염색체 우성 56, 헥사브라키온(hexabrachion), 간질성 뇌병증, 티모시 증후군 및 긴 Qt 증후군8, X-연관 망막 장애, 고알도스테론증, 척수소뇌 운동실조증 42, 원발성 알도스테론증, 발작, 및 신경학적 이상 및 동방결절 기능장애 및 난청, 신경발달 장애, 저칼륨성 주기성 마비, 간질, 발달성 및 간질성 뇌병증, 브로디 근병증, 다리에 질환/심장 질환, 폰 빌레브란트 질환 및 젤웨거 증후군으로 이루어진 군으로부터 선택된 하나 이상인 것인, 방법.
  27. 관심 단백질을 코딩하는 RNA 분자 및 다음을 코딩하는 핵산을 포함하는 원형 RNA 분자를 생성하기 위한 시스템:
    관심 단백질의 제1 부분;
    5' 리보자임, 카고 서열 및 3' 리보자임을 포함하는 합성 인트론; 및
    관심 단백질의 제2 부분.
  28. 제27항에 있어서,
    상기 관심 단백질이 치료적 단백질, 리포터 단백질 및 Cas9 단백질로 이루어진 군으로부터 선택된 하나 이상인, 시스템.
  29. 제27항에 있어서,
    상기 카고 서열이 관심 치료적 단백질을 코딩하는 서열, CRISPR 가이드 RNA 서열, 작은 RNA 서열 및 트랜스-절단 리보자임 서열로 이루어진 군으로부터 선택된 하나 이상인, 시스템. 일 실시양태에서, 상기 작은 RNA 서열은 마이크로RNA (miRNA), Piwi-상호작용 RNA (piRNA), 작은 간섭 RNA (siRNA), 작은 핵소체 RNA (snoRNA), 작은 tRNA-유래 RNA (tsRNA), 작은 rDNA-유래 RNA (srRNA) 및 작은 핵 RNA (snRNA)로 이루어진 군으로부터 선택된 하나 이상을 포함한다.
  30. 제27항에 있어서,
    상기 합성 인트론의 3' 리보자임이 리보자임의 HH 패밀리의 구성원인, 시스템.
  31. 제27항에 있어서,
    상기 합성 인트론의 5' 리보자임이 리보자임의 HDV 패밀리의 구성원, 리보자임의 HDV 패밀리의 구성원 및 VS-S 리보자임 인식 서열로 이루어진 군으로부터 선택된 하나 이상인, 시스템.
  32. 제27항에 있어서,
    RtcB 리가아제 및 RtcB 리가아제를 코딩하는 핵산으로 이루어진 군으로부터 선택된 하나 이상을 추가로 포함하는, 시스템.
  33. 관심 단백질을 코딩하는 RNA 분자 및 원형 RNA 분자를 전달하는 방법으로서,
    관심 단백질의 제1 부분, 시스-절단 5' 리보자임, 카고 서열 및 시스-절단 3' 리보자임을 포함하는 합성 인트론, 및 관심 단백질의 제2 부분을 코딩하는 핵산을 세포 또는 조직에 투여하는 단계를 포함하는 것인, 방법.
  34. 제33항에 있어서,
    상기 관심 단백질이 치료적 단백질, 리포터 단백질 및 Cas9 단백질로 이루어진 군으로부터 선택된 하나 이상인 것인, 방법.
  35. 제33항에 있어서,
    상기 카고 서열이 관심 치료적 단백질을 코딩하는 서열, CRISPR 가이드 RNA 서열, 작은 RNA 서열, 및 트랜스-절단 리보자임 서열로 이루어진 군으로부터 선택된 하나 이상인 것인, 방법. 일 실시양태에서, 상기 작은 RNA 서열은 마이크로RNA (miRNA), Piwi-상호작용 RNA (piRNA), 작은 간섭 RNA (siRNA), 작은 핵소체 RNA (snoRNA), 작은 tRNA-유래 RNA (tsRNA), 작은 rDNA-유래 RNA (srRNA) 및 작은 핵 RNA (snRNA)로 이루어진 군으로부터 선택된 하나 이상을 포함한다.
  36. 제33항에 있어서,
    RtcB 리가아제 및 RtcB 리가아제를 코딩하는 핵산으로 이루어진 군으로부터 선택된 하나 이상을 세포 또는 조직에 투여하는 단계를 추가로 포함하는 것인, 방법.
KR1020227030839A 2020-02-07 2021-02-05 리보자임-매개 rna 조립 및 발현 KR20220141829A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062971356P 2020-02-07 2020-02-07
US62/971,356 2020-02-07
PCT/US2021/016885 WO2021158964A1 (en) 2020-02-07 2021-02-05 Ribozyme-mediated rna assembly and expression

Publications (1)

Publication Number Publication Date
KR20220141829A true KR20220141829A (ko) 2022-10-20

Family

ID=74858764

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227030839A KR20220141829A (ko) 2020-02-07 2021-02-05 리보자임-매개 rna 조립 및 발현

Country Status (7)

Country Link
US (1) US20230073250A1 (ko)
EP (1) EP4100533A1 (ko)
JP (1) JP2023514149A (ko)
KR (1) KR20220141829A (ko)
CN (1) CN115335526A (ko)
CA (1) CA3168903A1 (ko)
WO (1) WO2021158964A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116096905A (zh) 2020-02-21 2023-05-09 阿库斯股份有限公司 用于治疗人受试者的非年龄相关性听力损伤的组合物和方法
CN116555253A (zh) * 2022-01-30 2023-08-08 中国科学院分子细胞科学卓越创新中心 含高均一性poly(A)尾的mRNA及其制备方法
WO2023154749A2 (en) * 2022-02-09 2023-08-17 The Regents Of The University Of California In vitro and in vivo protein translation via in situ circularized rnas

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US5399346A (en) 1989-06-14 1995-03-21 The United States Of America As Represented By The Department Of Health And Human Services Gene therapy
US5585362A (en) 1989-08-22 1996-12-17 The Regents Of The University Of Michigan Adenovirus vectors for gene therapy
US5350674A (en) 1992-09-04 1994-09-27 Becton, Dickinson And Company Intrinsic factor - horse peroxidase conjugates and a method for increasing the stability thereof
US6156303A (en) 1997-06-11 2000-12-05 University Of Washington Adeno-associated virus (AAV) isolates and AAV vectors derived therefrom
CA2386270A1 (en) 1999-10-15 2001-04-26 University Of Massachusetts Rna interference pathway genes as tools for targeted genetic interference
US6326193B1 (en) 1999-11-05 2001-12-04 Cambria Biosciences, Llc Insect control agent
WO2001096584A2 (en) 2000-06-12 2001-12-20 Akkadix Corporation Materials and methods for the control of nematodes
DK1310571T3 (da) 2001-11-13 2006-06-19 Univ Pennsylvania Fremgangsmåde til identifikation af ukendte adeno-associerede virussekvenser (AAV-sekvenser) og et kit til fremgangsmåden
EP1453547B1 (en) 2001-12-17 2016-09-21 The Trustees Of The University Of Pennsylvania Adeno-associated virus (aav) serotype 8 sequences, vectors containing same, and uses therefor
ES2411479T3 (es) 2003-09-30 2013-07-05 The Trustees Of The University Of Pennsylvania Clados de virus adeno-asociados (AAV), secuencias, vectores que los contienen, y usos de los mismos
JP2007525571A (ja) 2004-01-07 2007-09-06 ソレクサ リミテッド 修飾分子アレイ
GB0427236D0 (en) 2004-12-13 2005-01-12 Solexa Ltd Improved method of nucleotide detection
US20100305197A1 (en) * 2009-02-05 2010-12-02 Massachusetts Institute Of Technology Conditionally Active Ribozymes And Uses Thereof
EP3436590A4 (en) * 2016-04-01 2019-12-04 National University of Singapore TRANSFERING RNA (TSRNA)
EP3642342A4 (en) * 2017-06-23 2021-03-17 Cornell University RNA MOLECULES, CIRCULAR RNA PRODUCTION METHODS, AND PROCESSING METHODS

Also Published As

Publication number Publication date
EP4100533A1 (en) 2022-12-14
WO2021158964A1 (en) 2021-08-12
US20230073250A1 (en) 2023-03-09
CA3168903A1 (en) 2021-08-12
JP2023514149A (ja) 2023-04-05
CN115335526A (zh) 2022-11-11

Similar Documents

Publication Publication Date Title
JP7416451B2 (ja) CRISPR-Casによる標的化された核内RNA切断及びポリアデニル化
US20240076698A1 (en) Methods and compositions for modulating a genome
KR20220141829A (ko) 리보자임-매개 rna 조립 및 발현
EP2982758A1 (en) Genome editing for the treatment of huntington&#39;s disease
KR20200083550A (ko) ACE-tRNA에 의한 유전자 재지정을 통해 정지 코돈을 구조하는 방법
KR20200032693A (ko) Cas-형질전환 마우스 배아 줄기 세포 및 마우스 및 이것의 용도
JP2008539698A (ja) 転写後レベルでの核酸発現調節のための方法および組成物
US20220133768A1 (en) Crispr/rna-guided nuclease-related methods and compositions for treating rho-associated autosomal-dominant retinitis pigmentosa (adrp)
JP2022513376A (ja) レトロウイルスインテグラーゼ-Cas9融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集
CA3214277A1 (en) Ltr transposon compositions and methods
RU2811724C2 (ru) РЕДАКТИРОВАНИЕ ГЕНОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННОЙ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК)
RU2812850C2 (ru) Модуляция активности rep белка при получении днк с замкнутыми концами (зкднк)
US20240002839A1 (en) Crispr sam biosensor cell lines and methods of use thereof
JP2024515715A (ja) レトロウイルスインテグラーゼ-Cas融合タンパク質を使用した指向性非相同DNA挿入によるゲノム編集及び治療の方法
JP2023513211A (ja) タンパク質合成を増強するためのCRISPR-Cas13による標的RNA翻訳
WO2023235726A2 (en) Crispr interference therapeutics for c9orf72 repeat expansion disease
JP2024514939A (ja) ヒトミトコンドリアゲノムを標的化する遺伝子操作メガヌクレアーゼ
WO2023108047A1 (en) Mutant myocilin disease model and uses thereof