KR20190133699A - Crispr-연관 단백질을 암호화하는 핵산 및 이의 용도 - Google Patents

Crispr-연관 단백질을 암호화하는 핵산 및 이의 용도 Download PDF

Info

Publication number
KR20190133699A
KR20190133699A KR1020197030080A KR20197030080A KR20190133699A KR 20190133699 A KR20190133699 A KR 20190133699A KR 1020197030080 A KR1020197030080 A KR 1020197030080A KR 20197030080 A KR20197030080 A KR 20197030080A KR 20190133699 A KR20190133699 A KR 20190133699A
Authority
KR
South Korea
Prior art keywords
nucleic acid
sequence
variant
fragment
utr
Prior art date
Application number
KR1020197030080A
Other languages
English (en)
Inventor
프레데릭 체베스시어-툰네센
마리온 포에니쉬
토마스 스크라케
Original Assignee
큐어백 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 큐어백 아게 filed Critical 큐어백 아게
Publication of KR20190133699A publication Critical patent/KR20190133699A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)

Abstract

본 발명은 생의학 분야, 특히 치료용 핵산 분야에 관한 것이다. 본 발명은 CRISPR-연관 단백질을 암호화하는 인공 핵산, 특히 RNA를 제공한다. (약제학적) 조성물 및 이를 포함하는 부품 키트를 제공한다. 또한, 본 발명은 약제, 특히 CRISPR-연관 단백질로 치료할 수 있는 질병의 치료 및/또는 예방에 사용하기 위한 인공 핵산, (약제학적) 조성물, 또는 부품 키트에 관한 것이다.

Description

CRISPR-연관 단백질을 암호화하는 핵산 및 이의 용도
본 발명은 CRISPR-연관 단백질(CRISPR-associated protein)을 암호화하는 인공 핵산(artificial nucleic acid), 특히 RNA, 및 (약제학적) 조성물(composition) 및 이를 포함하는 부품 키트에 관한 것이다. 상기 인공 핵산, 특히 RNA, (약제학적) 조성물 및 키트는 그 중에서도 약제, 예를 들어 유전자 치료법(gene therapy), 및 특히 유전자 편집(gene editing), 녹인(knock-in), 녹아웃(knock-out) 또는 관심 있는 표적 유전자의 발현 조절에 의해 CRISPR-연관 단백질로 치료할 수 있는 질환의 치료 및/또는 예방에 사용될 것으로 예상된다.
CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats)-Cas 시스템은 antisense RNA를 사용하여 서열-특이적 방식으로 외래 DNA를 인식하고 절단함으로써 침입 DNA 요소(예, 바이러스(virus), 플라스미드(plasmid))에 맞서 박테리아(bacteria)와 고세균류(archaea)에 적응 면역 보호를 제공한다. 최신 분류에서 다양한 CRISPR-Cas 시스템은 이펙터의 구성에 따라 두 가지 군으로 나뉜다: Class 1 CRISPR 시스템은 여러 Cas (CRISPR-연관) 단백질과 CRISPR-RNA (cr RNA)를 가이드 RNA (guide RNA, gRNA)로 사용하여 이펙터 복합체를 형성하는 반면에, Class 2 CRISPR 시스템은 외부 DNA 요소와의 간섭을 중재하기 위해 crRNA와 함께 큰 단일 성분 Cas 단백질을 사용한다. Type I 및 type III 시스템을 포함하는 다수의 Class 1 CRISPR-Cas system이 식별되고 기능적으로 상세히 특징되었다. 지금까지 식별되고 실험적으로 특징 지어진 대부분의 Class 2 CRISPR-Cas 시스템은 침입 표적 DNA의 양쪽 가닥을 절단하기 위해 crRNA 및 trans-activating crRNA (tracrRNA)와 함께 또는 그 대신에 단일-가이드 RNA (sgRNA)와 함께 다중-도메인 엔도뉴클레아제로 기능하는 이펙터로서 Cas9 군의 상동성 RNA-가이드된 엔도뉴클레아제를 사용한다 (Sander and Joung, Nat Biotechnol. 2014 Apr; 32(4): 347-355, Boettcher and McManus Mol Cell. 2015 May 21; 58(4): 575-585).
기본 CRISPR/Cas9 type II 시스템은 기본적으로 3 단계로 작동한다. 외래 DNA에 노출되면, CRISPR 유전자좌(loci)의 짧은 회문구조 반복 서열 사이에서 짧은 외래 DNA 서열(프로토스페이서)이 박테리아 게놈에 통합된다. 프로토스페이서에 인접한 보존된 뉴클레오티드의 짧은 스트레치 (프로토스페이서 인접 모티프(protospacer adjacent motif, PAM))는 프로토스페이서를 얻기 위해 사용된다(획득 또는 적응 단계). 이어서, 숙주 원핵생물은 성숙 CRISPR RNA (crRNA)를 생성하기 위해 CRISPR 유전자좌를 전사 및 가공한다. 실질적으로, 숙주 원핵생물은 CRISPR 반복 요소 및 이전의 비자기(non-self) DNA 요소에 상응하는 외래 DNA의 통합된 스페이서 유전적 분절을 포함하는 성숙 CRISPR RNA(crRNA)를 생성하기 위해 trans-activating CRISPR RNA(tracrRNA)와 함께 CRISPR 유전자좌를 전사 및 가공한다(발현 또는 성숙 단계). 마지막으로, crRNA 및 Cas9는 tracrRNA와 회합하여 침입DNA의 상보적 서열과 회합하는 crRNA:tracrRNA:Cas9 복합체를 생성한다. Cas9 엔도뉴클레아제는 DNA 이중 가닥 절단(double strand break, DSB)를 표적 DNA에 도입한다 (간섭 단계) (Sander and Joung, Nat Biotechnol. 2014 Apr; 32(4): 347-355).
포유류 세포는 비-상동 말단 연결(non-homologous end joining method, NHEJ) 또는 상동성 지시 수선(homology directed repair, HDR)에 의해 DSB와 반응한다. NHEJ는 유전자 돌연변이 및 기능 상실 효과를 초래하는 뉴클레오티드 염기의 짧은 스트레치의 무작위 삽입 또는 결실을 도입할 수 있다. HDR에서, DNA 이중가닥 절단의 양 측면에 있는 서열에 상동성을 갖는 영역으로 DNA 조각의 도입은 숙주 세포의 기작 에 의해 수선될 것이다 (Sander and Joung, Nat Biotechnol. 2014 Apr; 32(4): 347-355).
Class 2 CRISPR 시스템으로 추정되는, V형에 잠정적으로 할당된 두 번째는 최근 몇몇 박테리아 게놈에서 확인되었다. V형으로 추정되는 CRISPR-Cas 시스템은 Cpf1 또는 Cas12라 불리는 ~1,300개의 거대한 아미노산 단백질을 포함한다(Prevotella, Francisella 1, Acidaminococcus sp BV3L6 (AsCpf1) 및 Lachnospiraceae bacterium ND2006 (LbCpf1)의 CRISPR). Cpf1은 Cas9에 대해 ~100-nt guide RNA(crRNA 및 tracrRNA) 대신에 그의 표적 DNA 서열을 인식하고 이에 결합하기 위한 단 하나의 짧은 crRNA를 필요로 한다. 즉, Cpf1은 일반적으로 3' 말단에 23nt를 갖는 단일 42nt를 나타내고, 이는 프로토스페이서의 TTTN PAMs 5'인 표적 DNA 서열의 프로토스페이서에 상보적이며 spCas9에 대한 평활 말단과 비교하여 DSB 5' 돌출부(overhang)로 생성된다.
Cpf1은 Cas9 시스템에 대한 표적 DNA를 따르는 G-풍부 PAM과 대조적으로, 짧은 T-풍부 프로토스페이서 인접 모티프 (PAM)에 의해 진행되는 표적 DNA를 효율적으로 제거한다. 세 번째로, Cpf1은 4 또는 5-nt 5' 돌출부를 갖는 엇갈린 DNA 이중가닥 절단을 도입한다 (Zetsche et al. Cell. 2015 Oct 22; 163(3): 759-771). 인간 세포에서 Cpf1의 표적-내 효율은 spCas9와 유사하며 Cpf1은 표적-외 절단을 나타내지 않거나 감소시켰다.
포유류 게놈에 CRISPR/Cas 시스템을 적용한 이후, 기술은 빠르게 발전했다: 엔도뉴클레아제 활성을 나타내지 않는 촉매적으로 불활성이거나 “죽은” Cas9(dCas9)는 관심 있는 DNA 서열을 표적으로 하기 위해 적합한 gRNA에 의해 특이적으로 모집될 수 있다. 이러한 Cas 단백질 및 그 변이체와 유도체는 다용도, 서열-특이적 및 비-돌연변이성 유전자 조절 도구로서 관심의 대상이 된다. 예를 들어, 전사 억제(CRISPR 간섭, CRISPRi) 또는 활성(CRISPR 활성, CRISPRa)를 초래하는 전사 억제 또는 활성 도메인을 갖는 dCas9 유도체를 표적 유전자에 표적화하기 위해 적절한 gRNA가 사용될 수 있다.
이러한 연속적인 혁신으로, CRISPR-Cas 시스템은 게놈 공학에 광범위하게 적용되었다. 관심있는 표적 유전자에 특이적인 gRNA는 쉽게 제조될 수 있는 반면에 Cas 단백질은 어떠한 변형도 필요로 하지 않기 때문에 CRISPR-Cas 시스템은 다용도이며 쉽게 맞춤 가능할 수 있다. 다수의 유전자좌는 여러 gRNA를 도입함으로써 쉽게 표적화될 수 있다(“다중화(multiplexing)”).
CRISPR/Cas 시스템은 박테리아 및 진핵생물에서 게놈 편집 및 전사 활성화/억제를 위한 강력하고 다양하며 정확한 도구로 성공적으로 채택되었으며, 연구 및 치료 목적을 위한 유망한 새로운 접근법의 개발을 촉발시켰다. 그러나 많은 장점에도 불구하고, CRISPR/Cas 시스템의 적용은 종종 Cas 단백질의 열악한 발현에 의해 방해 받는다.
본 발명의 목적은 이러한 요구를 충족시키고 암, 감염성 질환 및 본 명세서에서 정의된 다른 질병 및 상태의 치료를 위해 개선된 치료적 접근법을 제공하는 것이다. 본 발명의 근본적인 목적은 청구항의 대상에 의해 해결된다.
본 발명을 이하에서 상세하게 설명하지만, 본 발명은 여기에 기술된 특정 방법론, 프로토콜 및 시약이 다양할 수 있으므로 제한되지 않는 것으로 이해되어야 한다. 또한, 본 명세서에서 사용된 용어는 첨부된 청구범위에 의해서만 제한될 본 발명의 범위를 제한하려는 것이 아님을 이해해야 한다. 달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술분야에서 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.
이하에서, 본 발명의 요소들이 설명될 것이다. 이들 요소는 특정 실시예와 함께 나열되지만, 추가적인 실시예를 생성하기 위해 임의의 방식 및 임의의 수로 조합될 수 있음을 이해해야 한다. 다양하게 설명된 예 및 바람직한 실시예는 본 발명을 명시적으로 기술된 실시예로만 제한하도록 해석되어서는 안된다. 이러한 서술은 명시적으로 기술된 실시예들을 임의의 수의 개시된 및/또는 바람직한 요소들과 결합하는 실시예들을 뒷받침하고 포함하는 것으로 이해되어야 한다. 또한, 본 출원에서 기술된 모든 요소들의 임의의 치환 및 조합은 문맥상 달리 나타내지 않는 한 본 출원의 설명에 의해 개시된 것으로 간주되어야 한다.
다음의 본 명세서 및 청구 범위 전체에서, 문맥상 달리 요구하지 않는 한, 용어 "포함하다(comprise)" 및 "포함하다(comprises)" 및 "포함하는(comprising)"과 같은 변형은 언급된 구성, 정수 또는 단계를 시사하지만 언급되지 않은 다른 구성, 정수 또는 단계를 배제하지 않는 것을 의미하는 것으로 이해 될 것이다. 용어 “구성하다(consist of)”는 용어 ”포함하다(comprise)”의 특정 실시예이며, 여기서 언급되지 않은 다른 구성, 정수 또는 단계는 제외된다. 본 발명과 관련하여, 용어”포함하다(comprise)”는 용어 “구성하다(consist of)”를 포함한다. 따라서 "포함하는(comprising)"이라는 용어는 "포함하는(including)"및 "구성되는(consisting)"을 포함하며, 예를 들어, X를 "포함하는(comprising)" 조성물은 X로만 구성되거나 X + Y와 같은 추가적인 것을 포함할 수 있다.
본 발명을 설명하는 문맥에서(특히 청구 범위와 관련하여) 사용된 용어 “a”및 “an”및 “the”및 유사한 참조는 본 명세서에서 달리 지시되거나 문맥상 명백하게 모순되지 않는 한 단수 및 복수를 모두 포함하는 것으로 해석되어야 한다. 본 명세서에서 값의 범위에 대한 인용은 단지 그 범위 내에 속하는 각각의 개별 값을 개별적으로 지칭하는 속기 방법으로 기능하도록 의도되었다. 본 명세서에서 달리 지시되지 않는 한, 각각의 개별 값은 본 명세서에서 개별적으로 인용된 것처럼 본 명세서에 포함된다. 본 명세서의 어떤 언어도 본 발명의 실시에 필수적인 임의의 청구되지 않은 요소를 나타내는 것으로 해석되어서는 안된다.
"실질적으로(substantially)"라는 단어는 "완전히(completely)"를 배제하지 않으며, 예를 들어, Y로부터 "실질적으로 없는(substantially free)" 조성물은 Y가 완전히 없을 수 있다. 필요한 경우, "실질적으로"라는 단어는 본 발명의 정의에서 생략될 수 있다.
수치 x와 관련하여 용어 "약"은 x ± 10 %를 의미한다.
본 발명에서, 달리 나타내지 않으면, 대안 및 실시예의 상이한 특징이 서로 결합될 수 있다.
명확성과 가독성을 위해 다음 정의가 제공된다. 이들 정의에 대해 언급된 임의의 기술적 특징은 본 발명의 각각 및 모든 실시예에서 읽을 수 있다. 추가적인 정의 및 설명은 이들 실시예의 문맥 속에서 구체적으로 제공될 수 있다.
정의
인공 핵산 분자: 인공 핵산 분자는 자연적으로 발생하지 않는 핵산 분자, 예를 들어 DNA 또는 RNA, 인 것으로 전형적으로 이해될 수 있다. 다시 말해, 인공 핵산 분자는 비천연 핵산 분자로 이해될 수 있다. 이러한 핵산 분자는 이의 (자연적으로 발생하지 않는) 개별 서열 때문에 및/또는 다른 변형, 예를 들어 자연적으로 발생하지 않는 뉴클레오티드의 구조적 변형 때문에 비천연적일 수 있다. 인공 핵산 분자는 DNA 분자, RNA 분자 또는 DNA 및 RNA 부분을 포함하는 하이브리드 분자일 수 있다. 전형적으로, 인공 핵산 분자는 원하는 인공 뉴클레오티드 서열 (이종(heterologous) 서열)에 상응하도록 유전자 조작 방법에 의해 설계 및/또는 생성될 수 있다. 이와 관련하여 인공 서열은 보통 자연적으로 발생하지 않을 수 있는 서열, 즉 적어도 하나의 뉴클레오티드에 의해 야생형 서열과 상이한 서열이다. “야생형"이라는 용어는 자연에서 발생하는 서열로 이해될 수 있다. 또한, "인공 핵산 분자"라는 용어는 "하나의 단일 분자"를 의미하는 것으로 제한되지 않지만, 전형적으로 동일한 분자의 총체(ensemble)를 포함하는 것으로 이해된다. 따라서, 이것은 표본(aliquot)에 포함된 복수의 동일한 분자에 관한 것일 수 있다.
DNA: 디옥시-리보핵산(deoxy-ribonucleic acid)의 일반적인 약어이다. 이는 핵산 분자, 즉 뉴클레오티드로 구성된 중합체이다. 이들 뉴클레오티드는 보통 디옥시-아데노신-모노포스페이트, 디옥시-티미딘-모노포스페이트, 디옥시-구아노신-모노포스페이트 및 디옥시-시티딘-모노포스페이트 단량체이며, 이들은 - 그들 자신에 의해 - 당 일부(디옥시리보스), 염기 일부 및 인산염 일부로 이루어지고, 특유의 백본(backbone) 구조에 의해 중합한다. 백본 구조는 전형적으로 첫번째 뉴클레오티드의 당 일부, 즉 디옥시리보스와 인접한 두번째 단량체의 인산 일부 사이의 이황화 결합에 의해 형성된다. 모노머의 특정 순서, 즉 당/인산-백본에 연결된 염기들의 순서를 DNA 서열이라고 한다. DNA는 단일 가닥 또는 이중 가닥일 수 있다. 이중 가닥 형태에서, 첫번째 가닥의 뉴클레오티드는 전형적으로 예를 들어 A/T 염기쌍 및 G/C 염기쌍에 의해 두번째 가닥의 뉴클레오티드와 혼성화된다.
이종 서열: 만약 2개의 서열이 만약 동일한 유전자에서 유래할 수 없는 경우 일반적으로 '이종'인 것으로 이해된다. 즉, 비록 이종 서열이 동일한 유기체로부터 유래될 수 있더라도, 이들은 동일한 mRNA에서와 같이, 동일한 핵산 분자에서 자연적으로(자연에서) 발생하지 않는다.
클로닝 부위: 클로닝 부위(cloning site)는 전형적으로 오픈 리딩 프레임(open reading frame)을 포함하는 핵산 서열과 같은 핵산 서열의 삽입에 적합한 핵산 분자의 일부인 것으로 이해된다. 삽입은 본 발명이 속하는 기술분야에서 통상의 기술자에게 공지된 임의의 분자 생물학적 방법, 예를 들어 제한(restriction) 및 결찰(ligation)에 의해 수행될 수 있다. 클로닝 부위는 전형적으로 하나 또는 그 이상의 제한 효소 인식 부위 (제한 부위)를 포함한다. 이들 하나 또는 그 이상의 제한 부위는 이들 부위에서 DNA를 절단하는 제한 효소에 의해 인식될 수 있다. 하나 이상의 제한 부위를 포함하는 클로닝 부위는 또한 다중 클로닝 부위(multiple cloning site, MCS) 또는 폴리링커(polylinker)로 지칭될 수 있다.
핵산 분자: 핵산 분자는 핵산 구성 성분들을 포함하는 분자, 바람직하게는 핵산 구성성분들로 이루어진 분자이다. 용어 핵산 분자는 바람직하게는 DNA 또는 RNA 분자를 지칭한다. 이는 바람직하게는 용어 "폴리뉴클레오티드(polynucleotide)"와 동의어로 사용된다. 바람직하게는 핵산 분자는 당/인산-백본의 인산디에스테르 결합(phosphodiester-bond)에 의해 서로 공유결합된 뉴클레오티드 단량체를 포함하거나 이로 구성된 중합체이다. 용어 "핵산 분자"는 또한 변형된 핵산 분자, 예컨대 염기-변형된, 당-변형된 또는 백본-변형된 등의 DNA 또는 RNA 분자를 포함한다.
오픈 리딩 프레임: 본 발명과 관련하여 오픈 리딩 프레임(ORF)은 전형적으로 펩티드 또는 단백질로 번역될 수 있는 몇 개의 뉴클레오티드 트리플렛(triplet)의 서열일 수 있다. 오픈 리딩 프레임은 바람직하게는 5'-말단에 개시코돈, 즉 일반적으로 아미노산 메티오닌 (ATG)을 암호화하는 3개의 연속 뉴클레오티드의 조합 및 일반적으로 3개의 뉴클레오티드의 배수인 길이를 나타내는 후속 영역을 포함한다. ORF는 바람직하게는 정지 코돈 (예를 들어, TAA, TAG, TGA)에 의해 종결된다. 일반적으로 이것은 오픈 리딩 프레임의 유일한 정지 코돈이다. 따라서, 본 발명과 관련하여 오픈 리딩 프레임은 바람직하게는 개시 코돈 (예를 들어 ATG)으로 시작하고 바람직하게는 정지 코돈(예를 들어 TAA, TGA 또는 TAG)으로 종결되는, 3개로 나눌 수 있는 다수의 뉴클레오티드 서열이다. 오픈 리딩 프레임은 분리될 수 있거나 더 긴 핵산 서열, 예를 들어 벡터 또는 mRNA에 병합될 수 있다. 오픈 리딩 프레임은 또한 "(단백질) 암호화 서열"또는 바람직하게는 "암호화 서열"로 지칭될 수 있다.
펩티드: 펩티드 또는 폴리펩티드는 전형적으로 펩티드 결합에 의해 연결된 아미노산 단량체의 중합체이다. 이는 일반적으로 50개 이하의 단량체 단위를 포함한다. 그럼에도 불구하고, 용어 펩티드는 50개 이상의 단량체 단위를 갖는 분자를 제외하는 것은 아니다. 전형적으로 50 내지 600개의 단량체 단위를 갖는 긴 펩티드도 마찬가지로 폴리펩티드로 지칭된다.
단백질: 단백질은 전형적으로 하나 또는 그 이상의 펩티드 또는 폴리펩티드를 포함한다. 단백질은 보통 단백질이 그의 생물학적 기능을 발휘하는데 필요할 수 있는 3차원 형태로 접힌다.
제한 부위: 제한 효소 인식 부위라고도 하는 제한 부위는 제한 효소에 의해 인식되는 뉴클레오티드 서열이다. 제한 부위는 전형적으로 짧은, 바람직하게는 회문식(palindromic) 뉴클레오티드 서열, 예를 들어 4 내지 8개의 뉴클레오티드를 포함하는 서열이다. 제한 부위는 바람직하게는 제한 효소에 의해 특이적으로 인식된다. 제한 효소는 전형적으로 이 부위에서 제한 부위를 포함하는 뉴클레오티드 서열을 절단한다. 이중 가닥 DNA 서열과 같은 이중 가닥 뉴클레오티드 서열에서, 제한 효소는 전형적으로 뉴클레오티드 서열의 양쪽 가닥 모두를 절단한다.
RNA, mRNA: RNA는 리보핵산의 일반적인 약어이다. 이는 핵산 분자, 즉 뉴클레오티드로 이루어진 중합체이다, 이러한 뉴클레오티드는 일반적으로 소위 백본을 따라 서로 연결된 아데노신-모노포스페이트, 우리딘-모노포스페이트, 구아노신-모노포스페이트 및 시티딘-모노포스페이트 단량체이다. 백본은 첫번째 단량체의 당, 즉 리보스와 이에 인접한 두번?? 단량체의 인산염 일부 사이의 인산디에스테르 결합에 의해 형성된다. 단량체들의 특이적인 연속을 RNA 서열이라고 한다. 보통 RNA는 예를 들어 세포 내에서 DNA 서열의 전사에 의해 얻을 수 있다. 진핵 세포에서, 전사는 통상 핵 또는 미토콘드리아 내에서 수행된다. 체내에서, DNA의 전사는 보통 mRNA로 축약되는 소위 메신저 RNA로 가공되는, 소위 미성숙 RNA를 생산한다. 예를 들어 진핵 생물 유기체 내 미성숙 RNA의 가공은, 예를 들어 스플라이싱(splicing), 5'-캡핑(5'-capping), 폴리아데닐화, 핵 또는 미토콘드리아로부터의 배출 등과 같은 다양한 다른 전사 후 변형을 포함한다. 이러한 가공 과정들을 통틀어 RNA의 성숙이라고도 칭한다. 성숙한 메신저 RNA는 보통 특정 펩티드 또는 단백질의 아미노산 서열로 번역될 수 있는 뉴클레오티드 서열을 제공한다. 일반적으로, 성숙 mRNA는 5'-캡, 5'-UTR, 오픈 리딩 프레임, 3'-UTR 및 폴리(A) 서열을 포함한다. 메신저 RNA 외에, 전사 및/또는 번역의 조절에 관여할 수 있는 몇몇 RNA의 비 암호화 유형이 존재한다.
핵산 분자의 서열: 핵산 분자의 서열은 전형적으로 특정적이고 개별적인 순서, 즉 이의 뉴클레오티드의 연속인 것으로 이해된다. 단백질 또는 펩티드의 서열은 통상 순서, 즉 이의 아미노산의 순연속인 것으로 이해된다.
서열 동일성: 2개 또는 그 이상의 서열이 뉴클레오티드 또는 아미노산의 동일한 길이 및 순서를 나타내는 경우 그 서열은 동일하다. 동일성 백분율은 전형적으로 2개의 서열이 동일한 정도를 설명하는, 즉 이는 전형적으로 참조-서열의 동일한 뉴클레오티드와 그들 서열 위치가 일치하는 뉴클레오티드의 백분율을 설명한다. 동일성 정도(“% 동일성”)를 결정하기 위해, 비교될 서열은 전형적으로 동일한 길이, 즉 비교될 서열의 가장 긴 서열의 길이를 나타내는 것으로 간주된다. 이는 8개의 뉴클레오티드로 이루어진 첫번째 서열이 첫번째 서열을 포함하는 10개의 뉴클레오티드로 이루어진 두번째 서열과 80% 동일하다는 것을 의미한다. 다시 말해서, 본 발명과 관련하여, 서열의 동일성은 바람직하게 동일한 길이를 갖는 2개 또는 그 이상의 서열에서 동일한 위치를 갖는 서열의 뉴클레오티드 또는 아미노산의 백분율에 관한 것이다. 구체적으로, 2개의 아미노산 서열 또는 2개의 핵산 서열의 “% 동일성”은 최적의 비교 목적을 위해 서열을 정렬시키고(예를 들어, 갭(gap)이 다른 서열과의 최상의 정렬을 위해 어느 하나의 서열에 도입될 수 있음) 상응하는 위치에서 아미노산 또는 뉴클레오티드를 비교함으로써 결정될 수 있다. 갭은 일반적으로 정렬에서의 그들의 실제 위치에 관계 없이 동일하지 않은 위치로 간주된다. "최상의 정렬(best alignment)"은 전형적으로 가장 높은 퍼센트 동일성을 야기하는 2개의 서열의 정렬이다. 동일성 백분율은 비교되는 서열에서 동일한 뉴클레오티드의 수에 의해 결정된다 (즉, % 동일성 = 동일한 위치의 # / 전체 위치의 # x 100). 두 서열 사이의 동일성 백분율의 결정은 본 발명이 속하는 기술 분야에서 통상의 기술자에게 공지된 수학적 알고리즘을 사용하여 달성될 수 있다.
안정화된 핵산 분자: 안정화된 핵산 분자는 변형이 없는 핵산 분자에 비해, 예를 들어 엑소- 또는 엔도뉴클레아제 분해(degradation)와 같은 환경적 요소 또는 효소적 소화에 의한 붕괴(disintegration) 또는 분해(degradation)에 보다 안정하게 변화된 핵산 분자, 바람직하게는 DNA 또는 RNA 분자이다. 바람직하게는 본 발명의 내용에 있어서 안정화된 핵산 분자는 세포, 예를 들어 원핵 또는 진핵 세포, 바람직하게는 인간 세포와 같은 포유동물 세포에서 안정화된다. 안정화 효과는 또한 예를 들어 안정화된 핵산 분자를 포함하는 약제학적 조성물을 제조하는 방법에서 예를 들자면 완충 용액 등에서 세포 외부에서 발휘될 수 있다.
형질주입(transfection): 용어 "형질주입"은 DNA 또는 RNA(예를 들어 mRNA) 분자와 같은 핵산 분자를 세포 내, 바람직하게는 진핵 세포 내로 도입하는 것을 지칭한다. 본 발명의 내용에 있어서, 용어 "형질주입"은 핵산 분자를 세포 내, 바람직하게는 포유 동물 내와같은 진핵 세포 내에 도입하기 위해 본 발명이 속하는 기술분야에서 통상의 기술자에게 공지된 임의의 방법을 포함한다. 이러한 방법은 예를 들어 전기 천공법, 예를 들어 양이온성 지질 및/또는 리포좀을 기초로 하는 리포펙션(lipofection), 칼슘 인산염 침전법, 나노입자 기반 형질주입, 바이러스 기반 형질주입 또는 DEAE-덱스트란 또는 폴리에틸렌이민 등과 같은 양이온성 중합체에 기초한 형질주입을 포함한다. 바람직하게는 도입은 비바이러스성이다.
벡터: 용어 "벡터"는 핵산 분자, 바람직하게는 인공 핵산 분자를 지칭한다. 본 발명의 내용에 있어서 벡터는 오픈 리딩 프레임을 포함하는 핵산 서열과 같은 원하는 핵산 서열을 통합 또는 보유하는데 적합하다. 이러한 벡터는 저장 벡터(storage vector), 발현 벡터(expression vector), 클로닝 벡터(cloning vector), 운반 벡터(transfer vector) 등일 수 있다. 저장 벡터는 핵산 분자, 예를 들어 mRNA 분자를 편리하게 저장할 수 있도록 하는 벡터이다. 따라서 벡터는, 예를 들어 mRNA의 3'-UTR 및 암호화 서열에 상응하는 서열과 같은 원하는 mRNA 서열 또는 그의 일부에 상응하는 서열을 포함할 수 있다. 발현 벡터는 RNA, 예를 들어 mRNA, 또는 펩티드, 폴리펩티드 또는 단백질과 같은 발현 생산물의 생산에 사용될 수 있다. 예를 들어, 발현 벡터는 프로모터 서열, 예를 들어 RNA 중합효소 프로모터 서열과 같은 벡터의 서열 신장의 전사에 필요한 서열을 포함할 수 있다. 클로닝 벡터는 전형적으로 핵산 서열을 벡터에 통합하는데 사용될 수 있는 클로닝 부위를 포함하는 벡터이다. 클로닝 벡터는, 예를 들어 플라스미드 벡터 또는 박테리오파지 벡터일 수 있다. 운반 벡터는 핵산 분자를 세포 또는 유기체에 운반하는데 적합한 벡터, 예를 들어 바이러스 벡터일 수 있다. 본 발명의 내용에 있어서 벡터는 예를 들어 RNA 벡터 또는 DNA 벡터일 수 있다. 바람직하게, 벡터는 DNA 분자이다. 바람직하게 본 출원의 관점에서 벡터는 클로닝 부위, 항생제 내성 인자와 같은 선별 마커, 및 복제 원점과 같은 벡터의 증식에 적합한 서열을 포함한다.
수송체(Vehicle): 수송체는 전형적으로 약학적 활성 화합물과 같은 화합물 저장, 수송, 및/또는 투여에 적합한 물질로 이해된다. 예를 들어, 이는 약학적 활성 화합물 저장, 수송, 및/또는 투여에 적합한 생리학적으로 허용 가능한 액체일 수 있다.
본 발명은 특정 3' 및/또는 5' UTR 요소가 암호화 서열, 특히 Cas9 또는 Cpf1과 같은 CRISPR-연관 (Cas) 단백질을 암호화하는 것의 증가된 발현을 매개할 수 있다는 놀라운 발견에 부분적으로 기초한다. 본 발명자들은 3' 및 5' UTR 요소의 특정 조합이 특히 바람직한 발현 프로파일 및 발현 된 단백질의 양을 제공하는데 유리하다는 것을 발견하였다. 특히, 짧은 시간 (약 24 시간, "펄스 발현(pulse expression)") 동안 높은 Cas 단백질 발현은 예를 들어, 표적 외 효과 (즉, 임의의 하나 또는 그 이상의 표적, 유전자, 또는 세포성 전사체에서 의도하지 않은 효과)를 감소시키기 위한 게놈 DNA의 노출을 최소화하기 위해 많은 응용에서 바람직할 수 있다. CRISPR-연관 단백질-암호화된 인공 핵산에서 3' 및 5' UTR 요소의 상승 작용은 시험관 내 또는 생체 내에서 많은 양의 이러한 단백질의 일시적 발현이 요구될 때 특히 유리하다. 따라서, 이러한 인공 핵산은 돌연변이, 유전자 녹아웃 또는 녹인을 도입하거나 관심 있는 유전자의 발현을 조절함으로써 치료가 가능한 다양한 치료 용도에 적합하다.
따라서, 첫번째 측면에서, 본 발명은 a. 적어도 하나의 CRISPR-연관 단백질을 암호화하는 적어도 하나의 암호화 영역; b. ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP 및 NDUFA4로 이루어진 군으로부터 선택된 유전자의 5' UTR로부터 유래된 적어도 하나의 5' 비번역 영역 (5' UTR) 요소; 그리고 c. GNAS, CASP1, PSMB3, ALB 및 RPS9로 이루어진 군으로부터 선택된 유전자의 3' UTR로부터 유래된 적어도 하나의 3' 비번역 영역 (3' UTR) 요소를 포함하는 인공 핵산 분자에 관한 것이다.
용어 "UTR"은 본 명세서에 정의된 바와 같이 인공 핵산의 암호화 서열에 인접한 "비번역 영역"을 지칭한다. 이와 관련하여, "UTR 요소"는 바람직하게는 본 명세서에 예시된 바와 같이 특정 유전자의 (자연적으로 발생하는, 야생형) UTR로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
특정 UTR로부터 "유래된" UTR 요소를 언급할 때, 상기 UTR의 서열("부모(parent) UTR") 또는 상기 UTR의 상동체, 변이체 또는 단편에 상응하는 핵산 서열이 참조된다. 상기 용어는 상기 UTR의 전체 (전체 길이) 야생형 서열, 또는 전체 길이 상동체 및 변이체를 포함하는 이의 상동체, 변이체 및 단편에 상응하는 서열뿐만 아니라 상기 전체 길이 야생형 서열의 단편, 상동체, 변이체 및 상기 단편의 변이체에 상응하는 서열을 포함한다. 용어 “대응하다(corresponds to)”는 “부모 UTR”로부터 유래된 핵산 서열이 RNA 서열(예를 들어 상기 부모 UTR 서열을 정의하는 데 사용된 RNA 서열과 동일) 또는 이러한 RNA 서열에 상응하는 DNA 서열(주형가닥(sense strand)과 비주형가닥(antisense strand) 둘 다 및 성숙과 미성숙 둘 다) 일 수 있음을 의미한다.
유전자, “또는 이의 상동체, 단편 또는 변이체”의 UTR로부터 유래된 UTR 요소를 언급할 때, 표현 "또는 이의 상동체, 단편 또는 변이체"는 유전자, 또는 UTR, 또는 둘 다를 지칭할 수 있다.
유전자(또는 UTR과 같이, 이로부터 유래되거나 상기 유전자에 의해 포함된 핵산 서열)와 관련하여 용어 "상동체"는 공통 조상 DNA 서열로부터의 하강에 의한 두번째 유전자 (또는 이러한 핵산 서열)와 관련된 유전자 (또는 이로부터 유래되거나 상기 유전자에 의해 포함된 핵산 서열)를 지칭한다. "상동성"이라는 용어는 종 분화에 의해 분리된 유전자 ("오쏘로그(ortholog)") 및 유전적 중복에 의해 분리된 유전자 ("파라로그(paralog)")를 포함한다.
유전자의 핵산 서열과 관련하여 용어 "변이체(variant)"는 핵산 서열 변이체, 즉 참조(또는 “부모”) 핵산 또는 유전자의 참조(또는 “부모”) 핵산 서열과 적어도 하나의 핵산이 상이한 핵산 서열을 포함하는 핵산 서열 또는 유전자를 지칭한다. 따라서 변이 핵산 또는 유전자는 바람직하게는 그들의 핵산 서열에서 각각의 참조 서열과 비교하여 적어도 하나의 돌연변이, 치환, 삽입 또는 결실을 포함할 수 있다. 바람직하게는, 본 명세서에 사용된 용어 "변이체"는 자연 발생 변이체 및 핵산 서열 또는 유전자의 조작된 변이체를 포함한다. 따라서, 본 명세서에 정의된 바와 같은 "변이체"는 참조 핵산 서열에서 유래하거나, 분리되거나, 관련되거나, 기초하거나 또는 상동일 수 있다. “변이체”는 바람직하게는 각각의 자연발생 (야생형) 핵산 서열 또는 유전자, 또는 이의 상동체, 단편 또는 유도체에 대해 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 가질 수 있다.
핵산 서열 또는 유전자와 관련하여 용어 "단편(fragment)"은 전체 길이 참조(또는 “부모”) 핵산 서열 또는 유전자의 연속적인 부분 서열을 지칭한다. 다시 말해서, "단편"은 전형적으로 전체 길이 핵산 서열 또는 유전자의 짧은 부분일 수 있다. 따라서, 단편은 전형적으로 전체 길이 핵산 서열 또는 유전자 내의 상응하는 스트레치와 동일한 서열로 구성된다. 이 용어는 자연적으로 생성된 단편뿐만 아니라 조작된 단편을 포함한다. 본 발명과 관련하여 서열의 바람직한 단편은, 단편이 유래된 핵산 또는 유전자에서 개체의 연속 스트레치에 상응하는 핵산의 연속 스트레치로 구성되며, 이는 단편이 유래된 서열로부터 전체(즉 전체-길이) 핵산 서열 또는 유전자의 적어도 20 %, 바람직하게는 30 %, 보다 바람직하게는 40 %, 보다 바람직하게는 50 %, 더욱 바람직하게는 60 %, 더욱 더 바람직하게는 70 %, 가장 바람직하게는 80 %를 나타낸다. 이러한 단편과 관련하여 나타낸 서열 동일성은 바람직하게는 전체 핵산 서열 또는 유전자를 지칭한다. 바람직하게는, “단편”은 이로부터 유래된 참조 핵산 서열 또는 유전자에 대해 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열을 포함할 수 있다.
본 발명과 관련하여 사용된 UTR 요소는 바람직하게는 기능적이며, 즉 이들이 유래하는 자연 발생 (야생형) UTR과 동일한 바람직한 생물학적 효과를 유발할 수 있는, 즉 특히 작동 가능하게 연결된 암호화 서열의 발현을 제어(즉, 조절, 바람직하게는 향상)할 수 있도록 기능적이다. 본 명세서에 사용된 용어 "작동 가능하게 연결된"은 "암호화 서열과 기능적 관계에 놓이는"을 의미한다. 본 명세서에 정의된 UTR 요소는 바람직하게는 작동 가능하게 연결되어, 즉 본 발명의 인공 핵산의 암호화 서열과 기능적으로 관련되어, 바람직하게는 상기 암호화 서열의 발현을 제어 (즉, 조절, 바람직하게는 향상)할 수 있는 방식으로 배치된다. 본 명세서에 사용된 용어 "발현"은 일반적으로 단백질 생합성의 모든 단계, 그 중에서도 전사, mRNA 가공 및 번역을 포함한다. 본 명세서에 특별히 기재된 조합으로 특정된 UTR요소는 본 명세서에 기재된 CRISPR-연관 단백질을 암호화하는 암호화 서열의 전사를 향상시킬 것으로 특히 예상된다.
따라서 본 발명의 인공 핵산은 유리하게는 5'UTR 요소 및 3'UTR 요소를 포함하며, 이들은 각각 본 명세서에 지시된 것들로부터 선택된 유전자로부터 유래된다. 적합한 5'UTR 요소는 바람직하게는 본 명세서에 정의된 바와 같이 ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP 및 NDUFA4로 이루어진 군으로부터 선택된 유전자의 5'UTR로부터 유래 된 5'-UTR 요소로부터 선택된다. 적합한 3'UTR 요소는 바람직하게는 본 명세서에 정의된 바와 같이 GNAS, CASP1, PSMB3, ALB 및 RPS9로 이루어진 군으로부터 선택된 유전자의 3'UTR로부터 유래된 3'UTR 요소로부터 선택된다.
전형적으로, 본 발명의 인공 핵산 분자의 5'- 또는 3'-UTR 요소는 적어도 하나의 암호화 서열과 이종이다.
바람직하게는, 본 명세서에 지시된 (본 발명의 인공 핵산의 UTR 요소에 "부모 UTR"로서 제공되는) UTR은 자연적으로 발생하는 (야생형) UTR뿐만 아니라 이의 상동체, 단편, 변이체 및 상응하는 RNA 서열을 포함한다.
다시 말해서, 인공 핵산은 바람직하게는 a. 적어도 하나의 CRISPR-연관 단백질을 암호화하는 하나 이상의 암호화 영역; b. ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP 및 NDUFA4, 또는 상동체, 단편, 변이체로 이루어진 군으로부터 선택된 유전자의 5'UTR로부터 유래 된 적어도 하나의 5'비 번역 영역 (5'UTR) 요소 또는 상기 5'UTR 중 어느 하나의 상응하는 RNA 서열; 및 c. GNAS, CASP1, PSMB3, ALB 및 RPS9 또는 상동체, 단편, 변이체로 이루어진 군으로부터 선택된 유전자의 3'UTR로부터 유래된 적어도 하나의 3'비 번역 영역 (3'UTR) 요소, 또는 상기 3'UTR 중 어느 하나의 상응하는 RNA 서열을 포함할 수 있다.
5'UTR 및 3'UTR은 바람직하게는 본 발명의 인공 핵산의 암호화 서열에 작동 가능하게 연결된다.
UTRs
5' UTR
본 명세서에 기재된 인공 핵산은 본 명세서에 지시된 바와 같은 유전자의 5'UTR로부터 유래된 적어도 하나의 5'-UTR 요소, 또는 이의 상동체, 변이체 또는 단편을 포함한다.
용어 "5'-UTR"은 오픈 리딩 프레임의 5'(즉, "상류")에 위치하고 단백질로 번역되지 않은 핵산 분자의 일부를 지칭한다. 본 발명과 관련하여, 5'-UTR은 전사 개시 부위로 시작하여 오픈 리딩 프레임의 개시 코돈 전 하나의 뉴클레오티드로 끝난다. 5'-UTR은 "조절 요소"로도 불리는 유전자 발현을 제어하기 위한 요소를 포함할 수 있다. 이러한 조절 요소는 예를 들어 리보솜 결합 부위 일 수 있다. 5'-UTR은 예를 들어 5'-캡을 추가하여 전사 후 변형될 수 있다. 따라서, 5'-UTR은 바람직하게는 핵산의 서열, 특히 5'-캡과 개시 코돈 사이에 위치한 성숙 mRNA, 및 보다 구체적으로 3' 내지 5'-캡에 위치된 뉴클레오티드로부터, 바람직하게는 3' 내지 5'-캡 바로 옆에 위치된 뉴클레오티드로부터 단백질 암호화 서열의 개시코돈에서 5'에 위치한 뉴클레오티드(전사 개시 부위), 바람직하게는 단백질 암호화 서열의 개시 코돈에서 5' 바로 옆에 위치한 뉴클레오티드(전사 개시 부위)까지 연장되는 서열과 상응할 수 있다. 성숙한 mRNA의 5'-Cap에서 3' 바로 옆에 위치한 뉴클레오티드는 전형적으로 전사 개시 부위와 일치한다. 5'UTR은 일반적으로 500, 400, 300, 250 이하 또는 200 이하의 뉴클레오티드 길이를 갖는다. 일부 실시예에서, 이의 길이는 적어도 10, 20, 30 또는 40, 바람직하게는 100 또는 150까지의 뉴클레오티드 범위일 수 있다.
바람직하게는, 적어도 하나의 5'UTR 요소는 척색동물 유전자, 바람직하게는 척추동물 유전자, 더바람직하게는 포유동물 유전자, 가장 바람직하게는 인간 유전자의 5'UTR로부터 또는 척색동물 유전자, 바람직하게는 척추동물 유전자, 더바람직하게는 포유동물 유전자, 가장 바람직하게는 인간 유전자의 3'UTR의 변이체로부터 유래되는 핵산 서열을 포함하거나 이로 구성된다.
확장자 ".1" 또는 "var"을 포함하는 UTR 이름은 상기 확장자가 없는 UTR과 동일하다.
TOP-gene 유래 5' UTR 요소
본 명세서에 명시된 5'UTR 요소 중 일부는 TOP 유전자의 5'UTR 또는 이의 상동체, 변이체 또는 단편으로부터 유래될 수 있다.
따라서 TOP 유전자는 전형적으로 5'말단 올리고피리미딘 트랙트(TOP)의 존재에 의해, 및 추가로, 전형적으로 성장 관련 번역 조절에 의해 특징지어진다. 그러나, 조직 특이적 번역 조절을 갖는 TOP 유전자는 5'TOP을 포함하는 mRNA로도 알려져 있으며 종종 TOP mRNA로 지칭된다. 따라서, 이러한 메신저 RNA를 제공하는 유전자를 TOP 유전자라고 한다. TOP 서열은 예를 들어 펩티드 신장 인자 및 리보솜 단백질을 암호화하는 유전자 및 mRNA에서 발견되었다.
5' 말단 올리고피리미딘 트랙트("5'TOP" 또는 "TOP")은 예를 들어 특정 mRNA 분자의 5' 말단 영역 또는 특정 유전자의 기능적 독립체, 예를 들어 전사된 영역의 5' 말단 영역과 같은 전형적으로 핵산 분자의 5' 말단 영역에 위치한 피리미딘 뉴클레오티드의 스트레치이다. TOP 유전자의 5'UTR은 바람직하게는 3'에 위치한 뉴클레오티드로부터 개시코돈에서 5'에 위치한 뉴클레오티드에서 5'-캡까지 연장되는 TOP 유전자로부터 유래된 성숙한 mRNA의 5'UTR의 서열에 상응한다. TOP 서열은 전형적으로 전사 개시 부위에 상응하는 시티딘으로 시작하고, 이어서 보통 약 3 내지 30개의 피리미딘 뉴클레오티드의 신장이 뒤따른다. 따라서 피리미딘 스트레치 및 5' TOP은 하나의 뉴클레오티드 5'를 TOP의 하류에 위치한 첫번째 퓨린 뉴클레오티드로 종결시킨다.
TOP 유전자의 5' UTR은 전형적으로 어떠한 개시 코돈을 포함하지 않으며, 바람직하게는 업스트림 AUG (uAUG) 또는 업스트림 오픈 리딩 프레임 (uORF)이 없다. 상기 업스트림 AUG 및 업스트림 오픈 리딩 프레임은 일반적으로 번역되어야 하는 오픈 리딩 프레임의 개시 코돈 (AUG)의 5'에서 발생하는 AUG 및 오픈 리딩 프레임인 것으로 이해된다. TOP 유전자의 5'UTR은 일반적으로 다소 짧다. TOP 유전자의 5'UTR의 길이는 20개 뉴클레오티드 내지 500개 뉴클레오티드 사이에서 다양할 수 있고, 전형적으로 약 200개 뉴클레오티드 미만, 바람직하게는 약 150개 뉴클레오티드 미만, 보다 바람직하게는 약 100개 뉴클레오티드 미만이다. 예를 들어, TOP은 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30개 또는 그 이상의 뉴클레오티드를 포함할 수 있다.
본 발명과 관련해서, "TOP 모티프"는 상기 정의된 5'TOP에 상응하는 핵산 서열이다. 따라서, 본 발명과 관련해서 TOP 모티프는 바람직하게는 길이가 3-30 뉴클레오티드인 피리미딘 뉴클레오티드의 스트레치이다. 바람직하게는, TOP-모티프는 적어도 3개, 바람직하게는 적어도 4개, 보다 바람직하게는 적어도 6개, 더욱 바람직하게는 적어도 7개, 가장 바람직하게는 적어도 8개의 피리미딘 뉴클레오티드로 구성되며, 상기 피리미딘 뉴클레오티드의 스트레치는 바람직하게는 시토신 뉴클레오티드로 5' 말단에서 시작한다. TOP 유전자 및 TOP mRNA에서, "TOP-모티프"는 바람직하게는 그것의 5' 말단에서 전사 개시 부위로 시작하여 상기 유전자 또는 mRNA의 첫번째 퓨린 잔기로 하나의 뉴클레오티드 5'를 종결한다. 본 발명의 의미에서 "TOP 모티프"는 바람직하게는 5'UTR을 나타내는 서열의 5'말단 또는 5'UTR을 암호화하는 서열의 5'말단에 위치한다. 따라서, 바람직하게는, 3개 또는 그 이상의 피리미딘 뉴클레오티드의 스트레치를 이 스트레치가 인공 핵산 분자, 인공 핵산 분자의 5'UTR 요소, 또는 본 명세서에 기재된 TOP 유전자의 5'UTR로부터 유래된 핵산 서열과 같은 각각의 서열의 5'말단에 위치하는 경우 본 발명의 의미에서 "TOP 모티프"라고 지칭된다. 다시 말해서, 5'UTR 또는 5'UTR 요소의 5'-말단에 위치하지 않지만 5'UTR 또는 5'UTR 요소 내의 임의의 위치에 위치하는 3개 또는 그 이상의 피리미딘 뉴클레오티드의 스트레치는 바람직하게는 "TOP 모티프"라고 하지 않는다.
특히 바람직한 실시예에서, 본 명세서에 예시된 TOP 유전자의 5'UTR로부터 유래된 5'UTR 요소는 상기 정의된 바와 같이 TOP-모티프 또는 5'TOP를 포함하지 않는다. 따라서, TOP 유전자의 5'UTR로부터 유래된 5'UTR 요소의 핵산 서열은 그로부터 유래된 유전자 또는 mRNA의 개시 코돈(예를 들어 A(U/T)G)의 위치 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 상류에 위치한 뉴클레오티드로 3'-말단에서 종결될 수 있다. 따라서 5'UTR 요소는 단백질 암호화 서열의 어떤 부분도 포함하지 않는다. 따라서, 바람직하게는, 인공 핵산의 유일한 아미노산 암호화 부분은 CRISPR-연관 단백질을 암호화하는 암호화 서열 (및 본 명세서에 기재된 바와 같은 추가의 아미노산 서열)에 의해 제공된다.
본 발명에 따라 예상되는 특정 5'UTR 요소가 아래에 상세히 설명된다.
HSD17B4-유래 5' UTR 요소
본 발명에 따른 인공 핵산은 17-베타-하이드록시스테로이드 탈수소효소 4를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된, 바람직하게는 5'TOP 모티프가 없는 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있다.
이러한 5'UTR 요소는 바람직하게는 17-베타-하이드록시스테로이드 탈수소효소 4(“SD17B4”또한 퍼옥시좀 다기능 효소 유형 2로 지칭됨) 유전자, 바람직하게는 척추동물 17-베타-하이드록시스테로이드 탈수소효소 4(HSD17B4) 유전자, 더 바람직하게는 포유동물 17-베타-하이드록시스테로이드 탈수소효소 4(HSD17B4) 유전자, 가장 바람직하게는 인간 17-베타-하이드록시스테로이드 탈수소효소 4(HSD17B4) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되며, 여기서 바람직하게 상기 5'UTR 요소는 상기 유전자의 5'TOP을 포함하지 않는다.
따라서, 본 발명에 따른 인공 핵산은 HSD17B4 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 1에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 1에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 2에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 2에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
RPL32-유래 5'-UTR 요소
본 발명에 따른 인공 핵산은 리보솜 라지 단백질 (ribosomal Large protein, RPL)를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된, 바람직하게는 5'TOP 모티프가 없는 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 바람직하게는 5'TOP (말단 올리고피리미딘 트랙트) 모티프가 결여되어 있다.
이러한 5'UTR 요소는 바람직하게는 리보솜 단백질 라지 32(ribosomal protein Large 32, “RPL32”유전자, 바람직하게는 척추동물 리보솜 단백질 라지 32(L32) 유전자, 더 바람직하게는 포유동물 리보솜 단백질 라지 32(L32) 유전자, 가장 바람직하게는 인간 리보솜 단백질 라지 32(L32) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되며, 여기서 바람직하게는 5'UTR 요소는 상기 유전자의 5'TOP을 포함하지 않는다. 용어 "RPL32"는 또한 본 명세서에서 "RPL32var"또는 "32L4"로도 지칭되는 이의 변이체 및 단편을 포함한다.
따라서, 본 발명에 따른 인공 핵산은 RPL32 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 21에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 21에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 22에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 22에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
NDUFA4-유래 5'-UTR 요소
본 발명에 따른 인공 핵산은 시토크롬 씨 옥시다아제 서브유닛 (NDUFA4)를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있다.
이러한 5'UTR 요소는 바람직하게는 시토크롬 씨 옥시다아제 서브유닛 (NDUFA4”또는 “Ndufa4.1”)유전자, 바람직하게는 척추동물 시토크롬 씨 옥시다아제 서브유닛 (NDUFA4) 유전자, 더 바람직하게는 포유동물 시토크롬 씨 옥시다아제 서브유닛 (NDUFA4) 유전자, 가장 바람직하게는 인간 시토크롬 씨 옥시다아제 서브유닛 (NDUFA4) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 NDUFA4 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 9에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 9에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 10에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 10에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
SLC7A3-유래 5'-UTR 요소
본 발명에 따른 인공 핵산은 솔루트 캐리어 패밀리 7 멤버 3 (solute carrier family 7 member 3, SLC7A3)를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있다.
이러한 5'UTR 요소는 바람직하게는 솔루트 캐리어 패밀리 7 멤버 3 (SLC7A3”또는 “Slc7a3.1”)유전자, 바람직하게는 척추동물 솔루트 캐리어 패밀리 7 멤버 3 (SLC7A3) 유전자, 더 바람직하게는 포유동물 솔루트 캐리어 패밀리 7 멤버 3 (SLC7A3) 유전자, 가장 바람직하게는 인간 솔루트 캐리어 패밀리 7 멤버 3 (SLC7A3) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 SLC7A3 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 15에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 15에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 16에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 16에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
NOSIP-유래 5' UTR 요소
본 발명에 따른 인공 핵산은 산화질소 합성효소-상호작용 단백질(Nitric oxide synthase-interacting protein)을 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있다.
이러한 5'UTR 요소는 바람직하게는 산화질소 합성효소-상호작용 단백질 (“NOSIP”또는 “Nosip.1")유전자, 바람직하게는 척추동물 산화질소 합성효소-상호작용 단백질 (NOSIP) 유전자, 더 바람직하게는 포유동물 산화질소 합성효소-상호작용 단백질 (NOSIP) 유전자, 가장 바람직하게는 인간 산화질소 합성효소-상호작용 단백질 (NOSIP) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 NOSIP 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 11에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 11에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 12에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 12에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
ATP5A1-유래 5'-UTR 요소
본 발명에 따른 인공 핵산은 미토콘드리아 ATP 합성효소 서브유닛 알파 (ATP5A1)를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 바람직하게는 5'TOP 모티프가 결여되어 있다.
이러한 5'UTR 요소는 바람직하게는 미토콘드리아 ATP 합성효소 서브유닛 알파 (“ATP5A1”) 유전자, 바람직하게는 척추동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (ATP5A1) 유전자, 더 바람직하게는 포유동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (ATP5A1) 유전자, 가장 바람직하게는 인간 미토콘드리아 ATP 합성효소 서브유닛 알파 (ATP5A1) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되며, 여기서 바람직하게 5'UTR 요소는 상기 유전자의 5'TOP을 포함하지 않는다.
따라서, 본 발명에 따른 인공 핵산은 ATP5A1 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 5에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 5에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 6에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 6에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
ASAH1 유래 5'-UTR 요소
본 발명에 따른 인공 핵산은 미토콘드리아 ATP 합성효소 서브유닛 알파 (ASAH1)를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 바람직하게는 5'TOP 모티프가 결여되어 있다.
이러한 5'UTR 요소는 바람직하게는 미토콘드리아 ATP 합성효소 서브유닛 알파 (“ASAH1”)유전자, 바람직하게는 척추동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (ASAH1) 유전자, 더 바람직하게는 포유동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (ASAH1) 유전자, 가장 바람직하게는 인간 미토콘드리아 ATP 합성효소 서브유닛 알파 (ASAH1) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되며, 여기서 바람직하게 5'UTR 요소는 상기 유전자의 5'TOP을 포함하지 않는다.
따라서, 본 발명에 따른 인공 핵산은 ASAH1 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 3에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 3에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 4에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 4에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
MP68-유래 5'-UTR 요소
본 발명에 따른 인공 핵산은 미토콘드리아 ATP 합성효소 서브유닛 알파 (MP68)를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 바람직하게는 5'TOP 모티프가 결여되어 있다.
이러한 5'UTR 요소는 바람직하게는 미토콘드리아 ATP 합성효소 서브유닛 알파 (“MP68”또는 “Mp68”)유전자, 바람직하게는 척추동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (MP68) 유전자, 더 바람직하게는 포유동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (MP68) 유전자, 가장 바람직하게는 인간 미토콘드리아 ATP 합성효소 서브유닛 알파 (MP68) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되며, 여기서 바람직하게 5'UTR 요소는 상기 유전자의 5'TOP을 포함하지 않는다.
따라서, 본 발명에 따른 인공 핵산은 Mp68 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 7에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 7에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 8에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 8에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
RPL31-유래 5'-UTR 요소
본 발명에 따른 인공 핵산은 미토콘드리아 ATP 합성효소 서브유닛 알파 (RPL31)를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 바람직하게는 5'TOP 모티프가 결여되어 있다.
이러한 5'UTR 요소는 바람직하게는 미토콘드리아 ATP 합성효소 서브유닛 알파 (“RPL31”또는 “Rpl31.1”)유전자, 바람직하게는 척추동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (RPL31) 유전자, 더 바람직하게는 포유동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (RPL31) 유전자, 가장 바람직하게는 인간 미토콘드리아 ATP 합성효소 서브유닛 알파 (RPL31) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되며, 여기서 바람직하게 5'UTR 요소는 상기 유전자의 5'TOP을 포함하지 않는다.
따라서, 본 발명에 따른 인공 핵산은 RPL31 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 13에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 13에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 14에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 14에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
TUBB4B-유래 5'-UTR 요소
본 발명에 따른 인공 핵산은 미토콘드리아 ATP 합성효소 서브유닛 알파 (TUBB4B)를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 바람직하게는 5'TOP 모티프가 결여되어 있다.
이러한 5'UTR 요소는 바람직하게는 미토콘드리아 ATP 합성효소 서브유닛 알파 (“TUBB4B”또는 “TUBB4B.1”)유전자, 바람직하게는 척추동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (TUBB4B) 유전자, 더 바람직하게는 포유동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (TUBB4B) 유전자, 가장 바람직하게는 인간 미토콘드리아 ATP 합성효소 서브유닛 알파 (TUBB4B) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되며, 여기서 바람직하게 5'UTR 요소는 상기 유전자의 5'TOP을 포함하지 않는다.
따라서, 본 발명에 따른 인공 핵산은 TUBB4B 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 17에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 17에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 18에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 18에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
UBQLN2-유래 5'-UTR 요소s
본 발명에 따른 인공 핵산은 미토콘드리아 ATP 합성효소 서브유닛 알파 (UBQLN2)를 암호화하는 유전자의 5'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 바람직하게는 5'TOP 모티프가 결여되어 있다.
이러한 5'UTR 요소는 바람직하게는 미토콘드리아 ATP 합성효소 서브유닛 알파 (“UBQLN2” 또는 “Ubqln2.1”)유전자, 바람직하게는 척추동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (UBQLN2) 유전자, 더 바람직하게는 포유동물 미토콘드리아 ATP 합성효소 서브유닛 알파 (UBQLN2) 유전자, 가장 바람직하게는 인간 미토콘드리아 ATP 합성효소 서브유닛 알파 (UBQLN2) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되며, 여기서 바람직하게 5'UTR 요소는 상기 유전자의 5'TOP을 포함하지 않는다.
따라서, 본 발명에 따른 인공 핵산은 UBQLN2 유전자로부터 유래된 5'UTR 요소를 포함할 수 있으며, 여기서 상기 5'UTR 요소는 서열번호: 19에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 19에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 5'UTR 요소는 서열번호: 20에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 20에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
3' UTR
본 명세서에 기재된 인공 핵산은 본 명세서에서 지시된 바와 같이 유전자의 3'UTR로부터 유래 된 적어도 하나의 3'-UTR 요소, 또는 상기 유전자의 상동체, 변이체, 단편을 추가로 포함한다. 용어 "3'-UTR"은 오픈 리딩 프레임의 3' (즉, "하류")에 위치하고 단백질로 번역되지 않은 핵산 분자의 일부를 지칭한다. 본 발명과 관련해서, 3'-UTR은 단백질 암호화 서열의 정지 코돈, 바람직하게는 단백질 암호화 서열의 정지 코돈 바로 옆의 3'과 인공 핵산 분자, 바람직하게는 RNA의 폴리 (A) 서열 사이에 위치한 서열에 상응한다.
바람직하게는, 적어도 하나의 3'UTR 요소는 척색동물 유전자, 바람직하게는 척추동물 유전자, 더바람직하게는 포유동물 유전자, 가장 바람직하게는 인간 유전자의 5'UTR로부터 또는 척색동물 유전자, 바람직하게는 척추동물 유전자, 더 바람직하게는 포유동물 유전자, 가장 바람직하게는 인간 유전자의 3'UTR의 변이체로부터 유래되는 핵산 서열을 포함하거나 이로 구성된다.
GNAS-유래 3'-UTR 요소
본 발명에 따른 인공 핵산은 구아닌 뉴클레오티드-결합 단백질 G(s) 서브유닛 알파 동형 쇼트 (Guanine nucleotide-binding protein G(s) subunit alpha isoforms short, GNAS)를 암호화하는 유전자의 3'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 3'UTR 요소를 포함할 수 있다.
이러한 3'UTR 요소는 바람직하게는 구아닌 뉴클레오티드-결합 단백질 G(s) 서브유닛 알파 동형 쇼트 (“GNAS”또는 “Gnas.1”)유전자, 바람직하게는 척추동물 구아닌 뉴클레오티드-결합 단백질 G(s) 서브유닛 알파 동형 쇼트 (GNAS) 유전자, 더 바람직하게는 포유동물 구아닌 뉴클레오티드-결합 단백질 G(s) 서브유닛 알파 동형 쇼트 (GNAS) 유전자, 가장 바람직하게는 인간 구아닌 뉴클레오티드-결합 단백질 G(s) 서브유닛 알파 동형 쇼트 (GNAS) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 GNAS 유전자로부터 유래된 3'UTR 요소를 포함할 수 있으며, 여기서 상기 3'UTR 요소는 서열번호: 29에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 29에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 3'UTR 요소는 서열번호: 30에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 30에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
CASP1-유래 3'-UTR 요소
본 발명에 따른 인공 핵산은 카스페이스-1 (Caspase-1, CASP1)를 암호화하는 유전자의 3'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 3'UTR 요소를 포함할 수 있다.
이러한 3'UTR 요소는 바람직하게는 카스페이스-1 (“CASP1”또는 “CASP1.1”)유전자, 바람직하게는 척추동물 카스페이스-1 (CASP1) 유전자, 더 바람직하게는 포유동물 카스페이스-1 (CASP1) 유전자, 가장 바람직하게는 인간 카스페이스-1 (CASP1) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 CASP1 유전자로부터 유래된 3'UTR 요소를 포함할 수 있으며, 여기서 상기 3'UTR 요소는 서열번호: 25에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 25에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 3'UTR 요소는 서열번호: 26에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 26에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
PSMB3-유래 3'-UTR 요소
본 발명에 따른 인공 핵산은 프로테아좀 서브유닛 베타 타입-3 (Proteasome subunit beta type-3, PSMB3)를 암호화하는 유전자의 3'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 3'UTR 요소를 포함할 수 있다.
이러한 3'UTR 요소는 바람직하게는 프로테아좀 서브유닛 베타 타입-3 (“PSMB3”또는 “PSMB3.1”)유전자, 바람직하게는 척추동물 프로테아좀 서브유닛 베타 타입-3 (PSMB3) 유전자, 더 바람직하게는 포유동물 프로테아좀 서브유닛 베타 타입-3 (PSMB3) 유전자, 가장 바람직하게는 인간 프로테아좀 서브유닛 베타 타입-3 (PSMB3) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 PSMB3 유전자로부터 유래된 3'UTR 요소를 포함할 수 있으며, 여기서 상기 3'UTR 요소는 서열번호: 23에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 23에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 3'UTR 요소는 서열번호: 24에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 24에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
ALB-유래 3'UTR 요소
본 발명에 따른 인공 핵산은 혈청 알부민 (Serum albumin, ALB)를 암호화하는 유전자의 3'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 3'UTR 요소를 포함할 수 있다.
이러한 3'UTR 요소는 바람직하게는 혈청 알부민 (“ALB”또는 “Albumin7”유전자, 바람직하게는 척추동물 혈청 알부민 (ALB) 유전자, 더 바람직하게는 포유동물 혈청 알부민 (ALB) 유전자, 가장 바람직하게는 인간 혈청 알부민 (ALB) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 ALB 유전자로부터 유래된 3'UTR 요소를 포함할 수 있으며, 여기서 상기 3'UTR 요소는 서열번호: 35에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 35에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 3'UTR 요소는 서열번호: 36에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 36에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
RPS9-유래 3'-UTR 요소
본 발명에 따른 인공 핵산은 40S 리보솜 단백질 S9 (ribosomal protein S9, RPS9)를 암호화하는 유전자의 3'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 3'UTR 요소를 포함할 수 있다.
이러한 3'UTR 요소는 바람직하게는 40S 리보솜 단백질 S9 (“RPS9”또는 “RPS9.1”)유전자, 바람직하게는 척추동물 40S 리보솜 단백질 S9 (RPS9) 유전자, 더 바람직하게는 포유동물 40S 리보솜 단백질 S9 (RPS9), 가장 바람직하게는 인간 40S 리보솜 단백질 S9 (RPS9) 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 RPS9 유전자로부터 유래된 3'UTR 요소를 포함할 수 있으며, 여기서 상기 3'UTR 요소는 서열번호: 33에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 33에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 3'UTR 요소는 서열번호: 34에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 34에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
COX6B1-유래 3'-UTR 요소
본 발명에 따른 인공 핵산은 COX6B1를 암호화하는 유전자의 3'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 3'UTR 요소를 포함할 수 있다.
이러한 3'UTR 요소는 바람직하게는 COX6B1 (또는 “COX6B1.1”)유전자, 바람직하게는 척추동물 COX6B1 유전자, 더 바람직하게는 포유동물 COX6B1 유전자, 가장 바람직하게는 인간 COX6B1 유전자의 5' UTR, 또는 상기 5' UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 COX6B1 유전자로부터 유래된 3'UTR 요소를 포함할 수 있으며, 여기서 상기 3'UTR 요소는 서열번호: 27에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 27에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 3'UTR 요소는 서열번호: 28에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 28에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
NDUFA1-유래 3'-UTR 요소
본 발명에 따른 인공 핵산은 NDUFA1를 암호화하는 유전자의 3'UTR, 또는 이의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성되는 3'UTR 요소를 포함할 수 있다.
이러한 3'UTR 요소는 바람직하게는 NDUFA1 (또는 “Ndufa.1”)유전자, 바람직하게는 척추동물 NDUFA1 유전자, 더 바람직하게는 포유동물 NDUFA1 유전자, 가장 바람직하게는 인간 NDUFA1 유전자의 5'UTR, 또는 상기 5'UTR 중 임의의 것의 상동체, 변이체 또는 단편으로부터 유래된 핵산 서열을 포함하거나 이로 구성된다.
따라서, 본 발명에 따른 인공 핵산은 NDUFA1 유전자로부터 유래된 3'UTR 요소를 포함할 수 있으며, 여기서 상기 3'UTR 요소는 서열번호: 31에 따른 DNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 31에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되거나, 상기 3'UTR 요소는 서열번호: 32에 따른 RNA 서열 또는 이의 상동체, 변이체 또는 단편, 특히 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열번호: 32에 따른 핵산 서열에 대한 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
UTR 조합
바람직하게는, 적어도 하나의 5'UTR 요소 및 적어도 하나의 3'UTR 요소는 상기 UTR에 작동가능하게 연결된 적어도 하나의 암호화 서열의 발현을 증가시키기 위해 상승 작용 한다. 인용된 5'-UTR 및 3'-UTR을 임의의 유용한 조합으로 활용하는 것이 본 명세서에서 예상된다. 특히 유용한 5'및 3'UTR이 아래 표 1A에 나열되어 있다. 5'UTR과 3'-UTR의 특히 유용한 조합은 아래 표 1B에 나열되어 있다. 본 발명의 특히 바람직한 실시예는 선택된 CDS의 조합, 즉 HSD17B4 / Gnas.1; Slc7a3.1 / Gnas.1; ATP5A1 / CASP.1; Ndufa4.1 / PSMB3.1; HSD17B4 / PSMB3.1; RPL32var / albumin7; 32L4 / albumin7; HSD17B4 / CASP1.1; Slc7a3.1 / CASP1.1; Slc7a3.1 / PSMB3.1; Nosip.1 / PSMB3.1; Ndufa4.1 / RPS9.1; HSD17B4 / RPS9.1; ATP5A1 / Gnas.1; Ndufa4.1 / COX6B1.1; Ndufa4.1 / Gnas.1; Ndufa4.1 / Ndufa1.1; Nosip.1 / Ndufa1.1; Rpl31.1 / Gnas.1; TUBB4B.1 / RPS9.1; 및 Ubqln2.1 / RPS9.1. 군으로부터 선택된 UTR-조합의 Cas9, Cpf1, CasX, CasY 또는 Cas13을 포함한다.
[표 1A]
Figure pct00001
[표 1B]
유용한 UTR-조합 및 상응하는 구성
Figure pct00002
일부 실시예에서, 본 발명의 CRISPR-연관 단백질을 암호화하는 인공 핵산은 HSD17B4 / Gnas.1; Slc7a3.1 / Gnas.1; ATP5A1 / CASP.1; Ndufa4.1 / PSMB3.1; HSD17B4 / PSMB3.1; RPL32var / albumin7; 32L4 / albumin7; HSD17B4 / CASP1.1; Slc7a3.1 / CASP1.1; Slc7a3.1 / PSMB3.1; Nosip.1 / PSMB3.1; Ndufa4.1 / RPS9.1; HSD17B4 / RPS9.1; ATP5A1 / Gnas.1; Ndufa4.1 / COX6B1.1; Ndufa4.1 / Gnas.1; Ndufa4.1 / Ndufa1.1; Nosip.1 / Ndufa1.1; Rpl31.1 / Gnas.1; TUBB4B.1 / RPS9.1;Ubqln2.1 / RPS9.1; MP68 / Gnas1.1 및 MP68 / Ndufa1.1.로 이루어진 군으로부터 선택된 적어도 하나의 UTR 조합을 포함한다.
일부 실시예에서, 본 발명에 따른 인공 핵산은 본 명세서에서 그 전체가 참조로 인용되는 CRISPR-연관 단백질을 암호화하는 인공 핵산과 관련하여 PCT/EP2017/076775에 개시된 UTR 조합으로부터 선택된 적어도 하나의 UTR 조합을 포함한다. 따라서, 일부 실시예에서, 본 발명에 따른 인공 핵산은 SLC7A3 / GNAS; ATP5A1 / CASP1; HSD17B4 / GNAS; NDUFA4 / COX6B1; NOSIP / NDUFA1, NDUFA4 / NDUFA1; ATP5A1 / GNAS; MP68 / NDUFA1; NDUFA4 / RPS9; NDUFA4 / GNAS; NDUFA4 / PSMB3; TUBB4B / RPS9.1; UQBLN2 / RPS9; RPL31 / GNAS) or HSD17B4 / PSMB3로 이루어진 군으로부터 선택된 적어도 하나의 UTR 조합을 포함한다.
일부 실시예에서, 본 발명에 따른 인공 핵산은 따라서 CRISPR-연관 단백질을 암호화하는 인공 핵산과 관련하여 PCT/EP2017/076775에 개시된 바와 같은 핵산 서열을 포함하거나 이로 구성 될 수 있다.
특정 서열번호을 참조하여 표 1에 정의된 UTR요소 각각은 그것의 특정 서열번호를 참조하여정의된 각각의 핵산 서열에 대해 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 나타내는 이의 변이체 또는 단편을 포함할 수 있다. 표 1의 마지막 열은 서열번호:를 포함하는 “5' UTR”열 및 서열번호를 포함하는 “3' UTR”열에 도시된 특정 유리한 UTR 조합과 결합될 수 있는 가능한 모든 Cas9 및 Cpf1 cd를 명확하게 하였으며, 즉 개시된 바와 같은 조합은 통상의 기술자에게 본 발명의 바람직한 실시예이다. 특히 바람직한 실시예는 5'UTR SLC7A3 (서열번호: 15/16) 또는 이로부터 유래된 서열 및 3'UTR GNAS (서열번호: 29/30) 또는 이로부터 유래된 서열을 갖는 본 발명의 Cas9 또는 Cpf1 서열과 유사하다.
용이한 참조를 위해, 표 A1은 특히 바람직하고 유익한 CDS 및 UTR 조합을 기술한다.
또한 그들의 특정 서열번호를 참조하여 표 1에서 확인된 각각의 서열은 본 명세서에서 지시된 바와 같이 상응하는 DNA 서열에 의해 정의 될 수 있다.
특정 서열번호를 참조하여 표 1에서 확인된 각각의 서열은 하기 기재된 바와 같이 (선택적으로 서로 독립적이게) 변형될 수 있다.
본 발명에 따른 바람직한 인공 핵산은
a. HSD17B4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 GNAS 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
b. SLC7A3 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 GNAS 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
c. ATP5A1 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 CASP1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
d. NDUFA4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 PSMB3 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
e. HSD17B4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 PSSLC7A3MB3 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
f. RPL32 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 ALB 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
g. HSD17B4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 CASP1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
h. SLC7A3 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 CASP1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
i. SLC7A3 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 PSMB3 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
j. NOSIP 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 PSMB3 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
k. NDUFA4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 RPS9 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
l. HSD17B4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 RPS9 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
m. ATP5A1 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 GNAS 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
n. NDUFA4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 COX6B1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
n. NDUFA4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 GNAS 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
o. NDUFA4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 NDUFA1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
p. NOSIP 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 NDUFA1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
q. RPL31 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 GNAS 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
r. TUBB4B 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 RPS9 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
s. UBQLN2 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 RPS9 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
t. MP68 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 GNAS 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 또는
u. MP68 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 NDUFA1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체; 를 포함할 수 있다.
특히 바람직한 인공 핵산은 d, e, g 또는 l에 따른 UTR의 조합을 포함할 수 있다.
일부 실시예에서, 본 발명에 따른 인공 핵산은 ALB 유전자의 3'UTR 또는 이의 상동체, 단편 또는 변이체로부터 유래된 3'UTR 요소를 포함하지 않을 수 있다.
암호화 서열
CRISPR-연관 단백질
본 발명에 따른 인공 핵산은 CRISPR-연관 단백질을 암호화하는 적어도 하나의 암호화 서열을 포함한다.
용어 "CRISPR-연관 단백질"은 CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) 시스템 (및 이들의 상동체, 변이체, 단편 또는 유도체)의 일부인 RNA-가이드된 엔도뉴클레아제를 지칭하며, 이는 원핵 생물에 의해 외래 DNA 요소에 대해 적응 면역을 부여하기 위해 사용된다. CRISPR-연관 단백질은 Cas9, Cpf1 (Cas12), C2c1, C2c3, C2c2, Cas13, CasX 및 CasY를 제한없이 포함한다. 본 명세서에 사용된 용어 "CRISPR-연관 단백질"은 야생형 단백질뿐만 아니라 이의 상동체, 변이체, 단편 및 유도체를 포함한다. 따라서, Cas9, Cpf1 (Cas12), C2c1, C2c3 및 C2c2, Cas13, CasX 및 CasY를 암호화하는 인공 핵산 분자를 언급할 때, 상기 인공 핵산 분자는 각각의 야생형 단백질 또는 이의 상동체, 변이체, 단편 및 유도체를 암호화할 수 있다.
CRISPR-연관 단백질은 임의의 유전자 또는 이의 상동체, 변이체 또는 단편에 의해 암호화될 수 있다. 유전자를 언급할 때, 용어 "상동성" 또는 "상동 유전자"라는 용어는 "이종상동성 유전자" 및 "유사 유전자"를 포함한다.
CRISPR-연관 단백질(및 이들의 상동체, 변이체, 단편 또는 유도체)은 바람직하게는 기능적이며, 즉 원하는 생물학적 특성을 나타내고/거나 원하는 생물학적 기능을 발휘한다. 상기 생물학적 특성 또는 생물학적 기능은 상응하는 기준(또는 "부모") 단백질과 비교하여 비교 가능하거나 심지어 향상 될 수 있다. 기능적 CRISPR-연관 단백질, 및 이의 상동체, 변이체, 단편 또는 유도체는 바람직하게는 서열-특이적 방식으로 가이드 RNA에 의해 관심 DNA 서열에 대한 표적화 능력을 보유한다. 그러나, 야생형 CRISPR-연관 단백질에 의해 전형적으로 발휘되는 엔도뉴클레아제 활성(즉, 관심 DNA 서열에 DSB를 도입하는 능력)은 본 명세서에 기재된 바와 같은 CRISPR-연관 단백질의 모든 “기능적” 상동체, 변이체, 단편 및 유도체에서 유지될 수는 있지만 반드시 유지되는 것은 아니다.
구체적으로, 기능적 상동체, 변이체, 단편 또는 유도체는 바람직하게는 (1) 표적 DNA 서열과 특이 적으로 상호 작용하고, (2) 적합한 가이드 RNA와 연관시키고 선택적으로 (3) 표적 DNA 서열에 병치된 프로토 스페이서 인접 모티프(PAM)를 인식 할 수 있다. 이와 관련하여, "상호 작용하는"은 바람직하게는 결합, (엔도뉴클레아제 또는 닉카아제(nickase) 활성에 의한) 선택적으로 (추가적인) 절단, 발현의 활성화 또는 억제, 및/또는 이펙터를 모집하는 것을 의미한다. "구체적으로"는 CRISPR-연관 단백질이 다른 비-표적 DNA 서열과 상호 작용하는 것보다 더 쉽게 표적 DNA 서열과 상호 작용한다는 것을 의미한다.
본 명세서에서 특정 CRISPR-연관 단백질(예를 들어 Cas9, Cpf1)을 언급 할 때, 각각의 단백질은 번역 후 변형된 모든 형태를 포함하는 것으로 이해되어야 한다. 번역 후 변형(PTM)은 주어진 단백질의 공유 또는 비공유 변형을 초래할 수 있다. 일반적인 번역 후 변형에는 글리코실화, 인산화, 유비퀴틴화, S-니트로실화, 메틸화, N-아세틸화, 지질화, 이황화결합 형성, 황화, 아실화, 탈아민화 등이 포함된다. 상이한 PTM은 예를 들어 상이한 화학적 성질, 활성, 국소화, 상호 작용 또는 입체 형태를 초래할 수 있다. 그러나, 본 발명과 관련하여 예상되는 모든 번역 후 변형된 CRISPR-연관 단백질은 바람직하게는 상기 정의된 바와 같이 기능적으로 유지된다.
상동체
본 명세서에 예시된 각각의 CRISPR-연관 단백질(예를 들어 Cas9, Cpf1)은 바람직하게는 이의 상동체를 포함한다. 단백질을 언급할 때, 용어 “상동체”는 “오쏘로그” (또는 “오쏘로그성 단백질”) 및 “파라로그” (또는 “파라로그성 단백질”)을 포함한다. 이와 관련하여, "오쏘로그"는 종에 의해 공통 조상 유전자로부터 진화된 상이한 종의 유전자에 의해 암호화된 단백질이다. 오쏘로그는 종종 진화 과정에서 동일한 기능을 유지한다. 따라서 한 쌍의 오쏘로그를 비교할 때 기능이 손실되거나 획득될 수 있다. 그러나, 본 발명과 관련하여, 오쏘로그성 CRISPR-연관 단백질은 바람직하게는 적합한 가이드 RNA와 회합하여 관심 있는 DNA 서열과 특이적으로 상호 작용하는 (즉, "기능적") 능력을 유지한다. "파라로그"는 게놈 내에서 유전자 복제를 통해 생성된 유전자이다. 파라로그는 일반적으로 새로운 기능을 진화시키거나 결국 위유전자(pseudogene)가 될 수 있다. 본 발명과 관련하여, 파라로그성 CRISPR-연관 단백질은 바람직하게는 상기 정의된 바와 같이 기능적이다.
변이체
본 명세서에 예시된 각각의 CRISPR-연관 단백질(예를 들어, Cas9, Cpf1)은 또한 그의 변이체를 포함한다.
단백질과 관련하여 본 명세서에 사용된 용어 "변이체"는 바람직하게는 "서열 변이체", 즉 기준(또는 “부모”) 단백질의 기준(또는 “부모”) 아미노산 서열로부터 적어도 하나의 아미노산 잔기가 상이한 아미노산 서열을 포함하는 단백질을 지칭한다.
따라서 변이 단백질은 바람직하게는 그들의 아미노산 서열에서 각각의 참조 서열과 비교하여 적어도 하나의 아미노산 돌연변이, 치환, 삽입 또는 결실을 포함할 수 있다. 치환은 보존적 또는 비 보존적 치환으로부터 선택될 수 있다. 일부 실시예에서, 본 발명의 인공 핵산의 적어도 하나의 암호화 서열에 의해 암호화된 단백질 "변이체"는 적어도 하나의 보존적 아미노산 치환을 포함하고, 동일한 클래스로부터 유래된 상기 아미노산은 서로 교환되는 것이 바람직하다. 특히, 이들은 지방족 곁사슬, 양 또는 음으로 하전된 곁사슬, 곁사슬 또는 아미노산에 방향족기를 갖는 아미노산이며, 곁사슬은 수소 브릿지, 예를 들어 하이드록실 기능을 갖는 곁사슬을 형성할 수 있다. 보존적 구성에 의해, 예를 들어 극성 곁사슬을 갖는 아미노산은 상응하는 극성 곁사슬을 갖는 다른 아미노산으로 대체될 수 있거나, 예를 들어 소수성 곁사슬을 특징으로 하는 아미노산은 상응하는 소수성 곁사슬을 갖는 다른 아미노산(예를 들어 트레오닌(세린)에 의해 세린(트레오닌) 또는 이소류신(류신)에 의해 류신(이소류신))으로 치환될 수 있다.
바람직하게는, 본 명세서에 사용된 용어 "변이체"는 자연 발생 변이체, 예를 들어 번역 후 단백질 가수분해 공정을 거친 프리프로단백질, 프로단백질 및 CRISPR-연관 단백질(이는 N-말단 메티오닌의 제거, 신호 펩티드, 및/또는 비활성 또는 비기능성 단백질의 활성 또는 기능성 단백질로의 전환을 포함할 수 있다), 및 자연 발생 변이 단백질을 포함한다. 용어 "변이체"는 특정 생물학적 특성 및/또는 기능성을 도입하거나 폐지하기 위해 (서열-)변형 될 수 있는 CRISPR-연관 단백질의 조작된 변이체를 추가로 포함한다. 조작된 Cas9 변형에 대해서는 아래에서 자세히 설명한다. 단백질과 관련하여 용어 "전사 변이체" 또는 "접합 변이체"는 동일한 유전자로부터 초기에 전사되지만 이후에 유전자의 특정 엑손이 최종 가공된 메신저 RNA(mRNA) 내에 포함되거나 배제될 수 있는 선택적 (또는 차별적) 스플라이싱을 받는 메신저 RNA로부터 생성된 변이체를 지칭한다. 그러나, CRISPR-연관 단백질의 "전사 변이체"는 바람직하게는 상기 정의된 바와 같이 원하는 생물학적 기능성을 보유한다. 용어 "변이체"는 기준 단백질과 비교하여 최소 정도의 서열 동일성 (및 바람직하게는 원하는 생물학적 기능/특성)에 의해 본질적으로 정의될 수 있음에 유의할 것이다. 따라서, 상동체, 단편 또는 특정 유도체 (기준 단백질로부터 아미노산 서열의 관점에서 상이함)도 "변이체"로 분류될 수 있다. 따라서, 본 명세서에 정의된 "변이체"는 본 명세서에 정의된 바와 같은 CRISPR-연관 단백질 (예를 들어 Cas9, Cpf1) 또는 이의 상동체, 단편, 변이체 또는 유도체일 수 있는 기준 단백질로부터 유래하거나, 분리되거나, 연관되거나, 기초될 수 있거나 상동성일 수 있다.
본 발명에 따른 CRISPR-연관 단백질(예를 들어 Cas9, Cpf1) 변이체는 바람직하게는 각각 자연적으로 발생하는 (야생형) CRISPR-연관 단백질(예를 들어 Cas9, Cpf1), 또는 이의 상동체, 단편 또는 변이체의 아미노산 서열과 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는다.
단편
본 명세서에 예시된 각각의 CRISPR-연관 단백질(예를 들어, Cas9, Cpf1)은 또한 그의 단편을 포함한다.
용어 "단편"은 기준 (또는 "부모") 단백질 또는 (폴리)펩티드의 전체 길이 아미노산 서열의 연속 부분 서열로 구성되는 단백질 또는 폴리펩티드를 의미하며, 이는 아미노산 서열과 관련해 상기 기준 단백질의 아미노산 서열과 비교하여 N-말단, C-말단 및/또는 내부순차적으로 절단된다. 이러한 절단은 각각 아미노산 수준 또는 핵산 수준에서 발생할 수 있다. 다시 말해서, "단편"은 전형적으로 아미노산 서열의 전체 길이 서열의 짧은 부분일 수 있다. 따라서, 단편은 전형적으로 전체 길이 아미노산 서열 내의 상응하는 스트레치와 동일한 서열로 구성된다. 상기 용어는 조작된 단편뿐만 아니라 자연적으로 발생하는 단편 (예를 들어 생체 내에서 자연적으로 발생하는 프로테아제 활성으로 인한 단편)을 포함한다.
본 명세서에 사용된 용어 "단편"은 본 명세서에 정의된 CRISPR-연관 단백질의 아미노산 서열 또는 이의 상동체, 변이체 또는 유도체의 적어도 5 개의 인접 아미노산 잔기, 적어도 10 개의 인접 아미노산 잔기, 적어도 15 개의 인접 아미노산 잔기, 적어도 20 개의 인접 아미노산 잔기, 적어도 25 개의 인접 아미노산 잔기, 적어도 40 개의 인접 아미노산 잔기, 적어도 50 개의 인접 아미노산 잔기, 적어도 60 개의 인접 아미노산 잔기, 적어도 70 개의 인접 아미노산 잔기, 적어도 80 개의 인접 아미노산 잔기, 적어도 90 개의 인접 아미노산 잔기, 적어도 100 개의 인접 아미노산 잔기, 적어도 125 개의 인접 아미노산 잔기, 적어도 150 개의 인접 아미노산 잔기, 적어도 175개의 인접 아미노산 잔기, 적어도 200개의 인접 아미노산 잔기, 또는 적어도 250개의 인접 아미노산 잔기의 아미노산 서열을 포함하는 펩티드 또는 폴리펩티드를 지칭할 수 있다.
본 발명과 관련하여 바람직한 서열의 단편은 단편이 유래된 단백질에서 개체의 연속 스트레치에 상응하는 아미노산의 연속 스트레치로 구성되며, 이는 그 단편이 유래된 전체(즉 전체길이) 단백질 또는 (폴리-)펩티드의 적어도 20 %, 바람직하게는 적어도 30 %, 보다 바람직하게는 적어도 40 %, 더욱 바람직하게는 적어도 50 %, 더욱 더 바람직하게는 적어도 60 %, 더욱 더 바람직하게는 적어도 70 %, 가장 바람직하게는 적어도 80 %를 나타낸다.
이러한 단편과 관련하여 나타낸 서열 동일성은 바람직하게는 기준 단백질의 전체 아미노산 서열 또는 상기 기준 단백질을 암호화하는 전체 핵산 서열을 지칭한다. 바람직하게는, CRISPR-연관 단백질(예를 들어 Cas9 또는 Cpf1)의 “단편” 또는 이의 상동체, 변이체 또는 유도체는 상기 CRISPR-연관 단백질(예를 들어 Cas9 또는 Cpf1), 또는 상기 상동체, 변이체 또는 유도체의 아미노산 서열과 함께 전형적으로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 아미노산 서열을 포함한다.
유도체
본 명세서에 예시된 각각의 CRISPR-연관 단백질(예를 들어, Cas9, Cpf1)은 또한 그의 유도체를 포함한다.
단백질을 언급할 때 용어 "유도체"는 새로운 또는 추가의 특성 또는 기능성을 포함하도록 기준 (또는 "부모") 단백질과 관련하여 변형된 단백질로 이해되어야 한다. 유도체는 원하는 생물학적 기능성(예를 들어, 표적 결합 친화성 또는 특이성 또는 효소 활성을 부여, 향상, 감소 또는 폐지하는 부분 또는 도메인을 도입 또는 제거함함으로써), 제조 특성(예를 들어, 증가된 용해도 또는 향상된 배설을 부여하거나 정제를 허용하는 부분을 도입함으로써), 의료용 약동학적/약역학적 특성(예를 들어, 안정성, 생체이용률, 흡수; 분포 및/또는 감소된 방해를 부여하는 부분을 도입함으로써)을 포함하도록 변형될 수 있다. 유도체는 생물학적 특성 또는 관심 기능을 부여하는 부분 또는 도메인을 도입하거나 제거함으로써 제조될 수 있다. 이러한 부분 또는 도메인은 번역 후 아미노산 서열에서(예를 들어 아미노 및/또는 카르복실 말단 잔기에서) 또는 표준 유전 공학 기술을 사용하여 핵산 서열 수준에서 도입될 수 있다(참조. Sambrook J et al., 2012 (4th ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, New York). "유도체"는 자연 발생 (야생형) CRISPR-연관 단백질 서열, 또는 이의 변이체 또는 단편으로부터 유래될 수 있다(따라서 선택적으로 포함한다).
CRISPR-연관 단백질 유도체는 아미노산 서열이 이들이 유래한 기준 단백질과 상이할 수 있으며(예를 들어, (폴리)펩티드 부분 및/또는 단백질 도메인의 도입 또는 제거에 의해), 따라서 "변이체"로서도 자격이 있을 수 있음이 이해될 것이다. 그러나, 서열 변이체는 주로 참조 아미노산 서열에 대한 서열 동일성 측면에서 정의되지만, 유도체는 바람직하게는 기준 단백질과 비교하여 특정 생물학적 특성 또는 기능성의 존재 또는 부재에 의해 특징지어진다.
많은 CRISPR-연관 단백질 유도체는 각각의 자연 발생 (야생형) CRISPR-연관 단백질의 변이체, 단편, 단편 변이체 또는 변이체 단편에 기초한다. 예를 들어, 본 발명에 따른 CRISPR-연관 단백질 유도체는 엔도뉴클레아제 및/또는 닉카아제 활성을 폐지하는 돌연변이를 포함하는 조작된 단백질 변이체에 기초한 유도체를 포함할 수 있으며, 이는 새로운 또는 추가의 생물학적 특성 또는 기능성을 부여하는 이펙터 또는 어댑터 도메인을 포함하도록 추가로 조작된다.
바람직한 실시예에서, 본 발명의 인공 핵산 분자는 따라서 본 명세서에 정의된 바와 같은 CRISPR-연관 단백질 (예를 들어, Cas9, Cpf1) 유도체를 암호화하며, 여기서 상기 유도체는 적어도 하나의 추가 이펙터 도메인을 포함한다.
"이펙터 도메인"은 추가적 및/또는 새로운 생물학적 특성 또는 기능성을 부여하는 단백질 부분으로 이해되어야 한다. 본 발명과 관련하여, 이펙터 도메인은 바람직하게는 적절한 가이드 RNA와 표적 DNA 서열이 특이적으로 상호 작용하는 능력을 방해하지 않으면서 CRISPR-연관 단백질에 (신규 또는 추가의) 생물학적 기능을 부여하는 능력에 기초하여 선택될 수 있다. 신규 또는 추가의 생물학적 기능은 예를 들어 전사 억제 (CRISPR 간섭, CRISPRi 유도) 또는 활성화 (CRISPR 활성화, CRISPRa 유도)일 수 있다. 따라서, 본 발명과 관련하여 관심있는 이펙터 도메인은 Kruppel associated box (KRAB) domains, MAX-interacting protein 1 (MXI1) domains, four concatenated mSin3 (SID4X) domains을 포함하는 전사 억제 도메인 또는 herpes simplex VP16 activation domains (VP64 or VP160), nuclear factor-κ(NF-κg subunit activation domain (p65AD)을 포함하는 전사 활성화 도메인으로부터 선택될 수 있다. 이러한 이펙터 도메인(들)은 CRISPR-연관 단백질의 아미노 (N-) 또는 카르복실 (C-) 말단, 또는 둘 다에 융합될 수 있다. 적합한 이펙터 도메인으로, 전사는 후성적 수준에서 조절될 수 있다. 히스톤 디메틸라아제 LSD1은 표적화된 원위 인핸서로부터 히스톤 3 Lys4 디메틸화 (H3K4me2) 마크를 제거하여 전사 억제를 초래한다. 히스톤 아세틸트랜스퍼라제 p300 (p300Core)의 촉매 코어는 표적화된 근위 및 원위 인핸서에서 H3K27 (H3K27ac)을 아세틸화할 수 있으며, 이는 전사 활성화를 초래한다. 신규 또는 추가의 생물학적 기능성은 추가로 또는 대안적으로 관심 있는 이펙터 도메인의 모집일 수 있다. 이를 위해, 이펙터 도메인은 "모집 도메인", 바람직하게는 단백질-단백질 상호 작용 도메인 또는 WRPW (Trp-Arg-Pro-Trp) 모티프와 같은 모티프일 수 있다 (Fisher et al. Mol Cell Biol. 1996 Jun;16(6):2670-7). 신규 또는 추가의 생물학적 기능은 추가적으로 또는 대안적으로 RNA와 같은 다른 관심 대상의 모집일 수 있다. 이를 위해, 이펙터 도메인은 냉 충격 도메인 (CSD)과 같은 단백질-RNA 상호 작용 도메인으로부터 선택될 수 있다.
이펙터 도메인을 포함하는 CRISPR-연관 단백질 유도체는 (a) 표적 DNA 서열과 상호 작용할 수 있는 이펙터 도메인에 (선택적으로 적합한 링커를 통해) 직접 융합된 CRISPR-연관 단백질 (또는 이의 상동체, 변이체, 단편) 및 (b) 표적 DNA 서열(또는 그에 작동 가능하게 연결된 조절 요소)과 상호작용할 수 있는 관심있는 추가의 이펙터 (도메인, 단백질 또는 핵산)를 모집하는 (선택적으로 적합한 링커를 통해) 이펙터 도메인에 융합된 CRISPR-연관 단백질 (또는 이의 상동체, 변이체, 단편)을 포함한다.
이펙터 도메인은 유전 공학의 표준 기술을 사용하여 임의로 적합한 (펩티드) 링커를 통해 CRISPR-연관 단백질(또는 이의 변이체 또는 단편)에 융합될 수 있다 (참조. Sambrook J et al., 2012 (4th ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, New York).
관심있는 펩티드 링커는 본 발명이 속하는 기술분야에 일반적으로 공지되어 있으며, 연성 링커(flexible linker), 강성 링커(rigid linker) 및 절단 가능한 링커(cleavable linker)의 3 가지 유형으로 분류될 수 있다. 연성 링커는 일반적으로 결합 된 도메인이 어느 정도의 이동 또는 상호 작용을 요구할 때 적용되며, 따라서 본 발명의 CRISPR-연관 단백질 유도체와 관련하여 특히 관심 있다. 이들은 일반적으로 작은 비극성 (예를 들어 Gly) 또는 극성 (예를 들어 Ser 또는 Thr) 아미노산이 풍부하여 우수한 유연성 및 용해도를 제공하고 연결된 단백질 도메인의 이동을 허용한다. Ser 또는 Thr의 혼입은 물 분자와 수소 결합을 형성함으로써 수용액에서 링커의 안정성을 유지할 수 있고, 따라서 링커와 단백질 부분 사이의 불리한 상호 작용을 감소시킨다.
가장 일반적으로 사용되는 연성 링커는 주로 Gly 및 Ser 잔기의 스트레치 ("GS" 링커)로 구성된 서열을 갖는다. 가장 널리 사용되는 연성 링커의 예는 (Gly-Gly-Gly-Gly-Ser) n의 서열을 갖는다. 사본 수 "n"을 조정함으로써, 이 GS 링커의 길이는 단백질 도메인의 적절한 분리를 달성하거나 필요한 도메인 간 상호 작용을 유지하도록 최적화될 수 있다. GS 링커 이외에도, 많은 다른 연성 링커가 재조합 융합 단백질을 위해 설계되었다. 이들 연성 링커는 또한 Gly 및 Ser와 같은 작은 또는 극성 아미노산이 풍부하지만, 유연성을 유지하기 위해 Thr 및 Ala와 같은 추가 아미노산뿐만 아니라 용해도를 향상시키기 위해 Lys 및 Glu와 같은 극성 아미노산을 포함할 수 있다.
KESGSVSSEQLAQFRSLD, EGKSSGSGSESKST, 및 GSAGSAAGSGEF를 포함한 여러 다른 유형의 플렉서블 링커가 구성 융합 단백질에 적용되었다. 다른 플렉서블 링커는 글리신 전용 링커 (Gly)6 또는 (Gly)8을 포함한다.
단백질 도메인의 분리 및 이들의 간섭의 감소가 보장될 때 강성 링커가 사용될 수 있다. 한편, 절단 가능한 링커는 생체 내에서 유리 기능성 도메인을 방출하기 위해 도입될 수 있다. Chen et al. Adv Drug Deliv Rev. 2013 Oct 15; 65(10): 1357-1369는 가장 일반적으로 사용되는 펩티드 링커 및 그 응용을 검토하고, 그 전문이 본 명세서에 참조로 포함된다.
원하는 이펙터 도메인을 CRISPR-연관 단백질에 융합시키는 것 외에도, 관심 있는 표적 서열에 원하는 생물학적 효과를 매개하기 위한 몇 가지 대안적인 접근법이 존재한다. 이들 접근법은 본질적으로 표적 DNA 서열에 관심 이펙터 도메인을 모집할 수 있는 CRISPR-연관 단백질 (또는 가이드 RNA)을 이용한다. 이들 접근법은 이펙터 도메인을 관심 있는 특정 표적 DNA 서열 (예를 들어 프로모터 또는 인핸서)에 다중 모집 하기 위한 추가 옵션 및 유연성을 제공할 수 있다.
SunTag 활성화 방법은 슈퍼 폴더 GFP(sfGFP; 단백질 접힘 향상)에 융합되고 이펙터 도메인(들), 예를 들어 VP64에 융합된 단일-사슬 가변 단편(scFV)의 다중 사본을 모집하는 CRISPR-연관 단백질(예를 들어 dCas9)이 융합된 작은 펩티드 에피토프 태그의 배열을 사용한다. 시너지 효과 트리파타이트 활성화 방법 (VPR)은 원하는 생물학적 기능성을 부여하기 위해 3가지 이펙터 도메인 (예를 들어, 전사 활성화제, VP64, p65 및 Epstein-Barr 바이러스 R 전이활성화제 (Rta))의 탠덤 융합을 사용한다. 압타머-기반 모집 시스템 (synergistic activation mediator (SAM))은 이펙터 도메인(예를 들어 p65 및 열 충격 인자 1 (HSF1)과 같은 전사 활성화제)에 융합된 파지 MS2 코트 단백질(MCP)을 모집하기 위해 2 개의 결합 부위 (예를 들어, 테트라 루프의 RNA 압 타머 및 제 2 스템-루프)를 갖는 가이드 RNA와 함께 CRISPR-연관 단백질 (예를 들어 dCas9)을 이용한다. 또한, 추가의 이펙터 도메인 (예를 들어 VP64)을 CRISPR-연관 단백질에 융합시켜 본 발명에 따른 유도체를 생성할 수 있다.
상기 기재된 활성화 방법은 전사 억제 기능 또는 다른 바람직한 생물학적 기능을 본 명세서에 기재된 CRISPR-연관 단백질 또는 이의 상동체, 변이체, 단편 또는 유도체에 부여하도록 쉽게 적용될 수 있다. CRISPR-연관 단백질 유도체 및 CRISPRa 및 CRISPRi를 매개하기 위한 다양한 접근법은 그 전문이 본 명세서에 참조로 포함된 Dominguez et al. Nat Rev Mol Cell Biol. 2016 Jan;17(1):5-15에서 검토된다.
신호 펩티드
일부 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA는 신호 펩티드를 암호화하는 적어도 하나의 핵산 서열을 포함한다. 상기 핵산 서열은 바람직하게는 본 발명의 인공 핵산 분자의 (CRISPR-연관 단백질을 암호화하는) 암호화 영역 내에 위치된다. 따라서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA는 바람직하게는 본 명세서에 정의된 바와 같은 CRISPR-연관 단백질을 암호화하는 암호화 영역, 또는 적어도 하나의 신호 펩티드를 포함하는 이의 상동체, 변이체, 단편 또는 유도체를 포함할 수 있다.
신호 펩티드 (때때로 신호 서열, 표적화 신호, 국소화 신호, 국소화 서열, 전이 펩티드, 리더 서열 또는 리더 펩티드로 지칭됨)는 바람직하게는 암호화된 CRISPR-연관 단백질 (또는 이의 상동체, 변이체, 단편 또는 유도체)의 N-말단에 위치한 짧은 (5-30 아미노산 길이) 펩티드이다.
신호 펩티드는 바람직하게는 암호화된 CRISPR -연관 단백질 (또는 이의 상동체, 변이체, 단편 또는 유도체)의 정의된 세포 구성물, 예를 들어 세포 표면, 소포체 (ER) 또는 엔도솜-리소좀 구획으로의 수송을 매개한다. 따라서 신호 펩티드는 생산 세포주로부터 발현된 단백질의 배출을 촉진하기 위해 특히 유용하다.
본 발명과 관련하여 예상되는 예시적인 신호 펩티드는 고전적 또는 비고전적 MHC-분자의 신호 서열 (예를 들어, MHC I 및 II 분자의 신호 서열, 예를 들어 MHC 클래스 I 분자 HLA-A*0201의 신호 서열), 사이토카인 또는 면역 글로불린의 신호 서열, 면역 글로불린 또는 항체의 불변 사슬의 신호 서열, Lamp1, Tapasin, Erp57, Calretikulin, Calnexin, PLAT, EPO 또는 알부민의 신호 서열 및 추가의 막 관련 단백질 또는 소포체(ER) 또는 엔도솜-리소좀 구획과 관련된 단백질의 신호 서열을 포함하지만, 이에 제한되지는 않는다. 가장 바람직하게는, 신호 서열은 (인간) HLA-A2, (인간) PLAT, (인간) sEPO, (인간) ALB, (인간) IgE-leader, (인간) CD5, (인간) IL2, (인간) CTRB2, (인간) IgG-HC, (인간) Ig-HC, (인간) Ig-LC, GpLuc, (인간) Igkappa 또는 상기 언급된 단백질, 특히 HLA-A2, HsPLAT, sHsEPO, HsALB, HsPLAT(aa1-21), HsPLAT(aa1-22), IgE-leader, HsCD5(aa1-24), HsIL2(aa1-20), HsCTRB2(aa1-18), IgG-HC(aa1-19), Ig-HC(aa1-19), Ig-LC(aa1-19), GpLuc(1-17) 또는 MmIgkappa의 단편 또는 변이체로부터 유래된다. 본 발명은 이러한 변이체 또는 단편이 기능적인 한, 즉 CRISPR-연관 단백질을 세포(내 또는 외) 관심 위치로 표적화 할 수 있는 상기 언급된 신호 서열, 또는 이의 변이체 또는 단편의 사용을 예상한다.
상기 신호 펩티드를 암호화하는 핵산 서열은 표준 유전자 공학 기술에 의해 본 발명의 인공 핵산의 암호화 영역에서 CRISPR-연관 단백질 (또는 이의 상동체, 변이체, 단편 또는 유도체)을 암호화하는 핵산 서열에 융합되는 것이 바람직하다 (Sambrook J et al., 2012 (4th ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, New York 참조). 상기 암호화 영역의 발현은 바람직하게는 암호화된 신호 펩티드를 포함하는 (바람직하게는 N-말단, C-말단, 또는 둘 다에서) CRISPR-연관 단백질을 생성한다.
핵 위치 서열 (NLS)
본 발명의 인공 핵산 분자, 바람직하게는 RNA는 바람직하게는 적어도 하나의 핵 위치 서열(NLS)을 암호화하는 핵산 서열을 추가로 포함할 수 있다. 상기 핵산 서열은 바람직하게는 본 발명의 인공 핵산 분자의 암호화 영역 (CRISPR-연관 단백질을 암호화함) 내에 위치된다. 따라서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA는 바람직하게는 본 명세서에 정의된 바와 같은 CRISPR-연관 단백질을 암호화하는 암호화 영역, 또는 적어도 하나의 핵 위치 서열 (NLS)을 포함하는 이의 상동체, 변이체, 단편 또는 유도체를 포함할 수 있다.
핵 위치 신호 또는 서열 (NLS)은 핵 단백질의 핵으로의 수송을 매개하는 아미노산의 짧은 스트레치다. 본 발명의 인공 핵산에 의해 암호화된 CRISPR-연관 단백질이 포유 동물 세포에서의 치료 및 연구를 위해 특히 예상됨에 따라, 그들은 게놈 DNA에 영향을 줄 수 있는 핵으로 그들의 유입을 가능하게 하기 위해 적어도 하나의 NLS를 부여받을 수 있다. NLS는 바람직하게는 CRISPR-연관 단백질의 핵으로의 수송을 용이하게 함으로써, 핵막에서 핵공 복합체(NPC)와 상호 작용한다.
다양한 NLS 서열이 본 발명이 속하는 기술분야에 공지되어 있고, 본 발명에 따른 이들의 사용 (또는 사용에 대한 적응)은 본 발명이 속하는 기술분야에서 통상의 기술자의 평균 기술 및 지식 내에 있다. 가장 특징적인 수송 신호는 염기성 아미노산의 1 개 (모노파타이트) 또는 2 개 (바이파타이트) 스트레치로 구성되는 핵 단백질 유입을 위한 고전적 NLS (cNLS)이다. 전형적으로, 모노파타이트 모티프는 나선-파괴 잔기가 선행된 염기성 잔기 클러스터를 특징으로 한다. 유사하게, 바이파타이트 모티프는 9-12 잔기로 분리 된 2 개의 염기성 잔기 클러스터로 구성된다. 모노파타이트 cNLS는 SV40 large T 항원 NLS (126PKKKRRV132; 서열번호: 381)로 예시되고, 바이파타이트 cNLS는 뉴클레오플라스민 NLS (155KRPAATKKAGQAKKKK170; 서열번호: 382)로 예시된다. 모노파타이트 NLS의 N-말단 리신으로부터의 연속적인 잔기는 P1, P2, 등으로 지칭된다. 모노파타이트 cNLS는 K(K/R)X(K/R)의 느슨한 공통 염기 배열을 생성하기 위해 일반적으로 P1 위치에 라이신이 필요하며, P2 및 P4 위치에 염기성 잔기가 필요하다 (서열번호: 384; Lange et al., J Biol Chem. 2007 Feb 23; 282(8): 5101-5105).
따라서, 바람직한 실시예에 따르면, 인공 핵산 분자는 핵 위치 신호 (NLS)를 암호화하는 적어도 하나의 핵산 서열을 추가로 포함하는 것으로 예상된다. 본 발명에 따른 인공 핵산 분자는 따라서 본 명세서에 예시된 NLS로부터 임의로 선택된 1, 2, 3, 4, 5 개 또는 그 이상의 NLS를 암호화할 수 있다. 상기 NLS-암호화 핵산 서열은 바람직하게는 본 발명의 인공 핵산의 암호화 영역에 위치하고, 바람직하게는 CRISPR-연관 단백질을 암호화하는 핵산 서열에 융합되어, 상기 암호화 영역의 발현은 상기 적어도 하나의 NLS, 바람직하게는 N-말단, C-말단 또는 둘 다에 포함된 CRISPR-연관 단백질을 생성한다. 다시 말해, 본 발명에 따른 인공 핵산 분자는 바람직하게는 적어도 하나의 NLS, 바람직하게는 N-말단, C-말단 또는 둘 다를 포함하는 CRISPR-연관 단백질을 암호화할 수 있다.
본 발명에 따른 적합한 NLS는 본 명세서에서 NLS2로도 지칭되는 서열번호: 409; 2538, 1378; 3698; 4858; 6018; 7178; 또는 8338 중 어느 하나에 따른 핵산 서열 또는 이의 (기능적) 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열에 의해 암호화될 수 있는 서열번호: 426 (MAPKKKRKVGIHGVPAA)에 따른 아미노산 서열을 포함하거나 이로 구성될 수 있다. 본 발명은 NLS2의 변이체 또는 단편이 바람직하게는 기능적이며, 즉 CRISPR-연관 단백질의 핵으로의 유입을 매개할 수 있다면 이들 변이체 또는 단편의 사용을 추가로 고려한다. 이러한 기능적 변이체 또는 단편은 서열번호: 426에 따른 아미노산 서열과 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성될 수 있다.
본 발명에 따른 다른 적합한 NLS는 본 명세서에서 NLS4로도 지칭되는 서열번: 410; 2539; 1379; 3699; 4859; 6019; 7179; 8339 중 어느 하나에 따른 핵산 서열 또는 이의 (기능적) 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열에 의해 암호화될 수 있는 서열번호: 427 (KRPAATKKAGQAKKKK)에 따른 아미노산 서열을 포함하거나 이로 구성될 수 있다. 본 발명은 NLS2의 변이체 또는 단편이 바람직하게는 기능적이며, 즉 CRISPR-연관 단백질의 핵으로의 유입을 매개할 수 있다면 이들 변이체 또는 단편의 사용을 추가로 고려한다. 이러한 기능적 변이체 또는 단편은 서열번호: 427에 따른 아미노산 서열과 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성될 수 있다.
본 발명에 따른 다른 적합한 NLS는 본 명세서에서 NLS4로도 지칭되는 서열번: 410; 2539; 1379; 3699; 4859; 6019; 7179; 8339 중 어느 하나에 따른 핵산 서열 또는 이의 (기능적) 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열에 의해 암호화될 수 있는 서열번호: 427 (KRPAATKKAGQAKKKK)에 따른 아미노산 서열을 포함하거나 이로 구성될 수 있다. 본 발명은 NLS4의 변이체 또는 단편이 바람직하게는 기능적이며, 즉 CRISPR-연관 단백질의 핵으로의 유입을 매개할 수 있다면 이들 변이체 또는 단편의 사용을 추가로 고려한다. 이러한 기능적 변이체 또는 단편은 서열번호: 427에 따른 아미노산 서열과 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성될 수 있다.
본 명세서에서 CRISPR-연관 단백질에 2 개 또는 그 이상의 NLS를 설치하는 것이 추가로 예상되며, 이러한 NLS는 예를 들어 NLS2 (서열번호: 426로 표시됨) 및 NLS4 (서열번호: 427로 표시됨) 또는 이들 핵 위치 신호 중 하나 또는 둘 다의 기능적 변이체 또는 단편으로부터 선택될 수 있다.
본 발명에 따른 다른 적합한 NLS는 본 명세서에서 NLS3로도 지칭되는 서열번: 410; 2539 1379; 3699; 4859; 6019; 7179; 8339, 10551; 10581, 10593; 10584; 10587; 10590; 10593; 10596 중 어느 하나에 따른 핵산 서열 또는 이의 (기능적) 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열에 의해 암호화될 수 있는 서열번호: 10575 (KRPAATKKAGQAKKKK)에 따른 아미노산 서열을 포함하거나 이로 구성될 수 있다. 본 발명은 NLS3의 변이체 또는 단편이 바람직하게는 기능적이며, 즉 CRISPR-연관 단백질의 핵으로의 유입을 매개할 수 있다면 이들 변이체 또는 단편의 사용을 추가로 고려한다. 이러한 기능적 변이체 또는 단편은 서열번호: 427에 따른 아미노산 서열과 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성될 수 있다.
따라서, 추가의 바람직한 NLS 서열은 409; 2538; 410; 2539; 10551; 10581; 11973; 11974-1198, 1378; 3698; 4858; 6018; 7178; 8338; 1379; 3699; 4859; 6019; 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005; 12013; 11966-11972; 11982-11988; 11990-11996; 11998-12004; 12006-12012; 또는 12014-12020에 따른 핵산 서열에 의해 암호화 될 수 있는 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964에 따른 아미노산 서열을 포함하거나 이로 구성될 수 있다.
더욱 바람직한 NLS는 서열번호: 12021-14274에 따른 아미노산 서열을 포함하거나 이로 구성될 수 있다.
본 명세서에 언급된 유전자 편집 효소 중 임의의 것, 즉 Cas9 또는 Cpf1은 본 발명이 속하는 기술분야에서 공지된 임의의 다른 NLS 및 서열에서 임의의 수의 NLS 서열과 조합될 수 있다. 또한, 상이한 NLS 서열의 조합은 본 발명의 상기 개시 내용에 의해 포함된다.
전술한 바와 같은 NLS 서열은 일반적으로 사용되고 수용되는 NLS의 비제한적 목록이다. 본 발명의 교시 내에는 본 명세서에 개시된 바와 같은 유전자 편집 단백질을 암호화하는 서열 또는 본 명세서에 개시되거나 본 발명이 속하는 기술 분야에서 공지된 임의의 NLS를 임의의 수 및/또는 NLS의 조합으로 포함하는 서열 목록(즉, 5'/3' NLS)이 포함된다.
단백질 및 펩티드 태그
일부 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA는 단백질 또는 펩티드 태그를 암호화하는 적어도 하나의 핵산 서열을 추가로 포함한다. 상기 핵산 서열은 바람직하게는 본 발명의 인공 핵산 분자의 암호화 영역 (CRISPR-연관 단백질을 암호화함) 내에 위치된다. 따라서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA는 바람직하게는 본 명세서에 정의된 바와 같은 CRISPR-연관 단백질을 암호화하는 암호화 영역, 또는 적어도 하나의 단백질 또는 펩티드 태그를 포함하는 이의 상동체, 변이체, 단편 또는 유도체를 포함할 수 있다.
단백질 및 펩티드 태그는 정제, 검출, 국소화 또는 다른 목적을 위해 관심 있는 단백질에 도입될 수 있는 아미노산 서열이다. 단백질 및 펩티드 태그는 이들의 기능에 기초하여 분류될 수 있으며, 친화성 태그 (예를 들어 키틴 결합 단백질 (chitin binding protein, CBP), 말토스 결합 단백질 (maltose binding protein, MBP), 글루타티온-S-전달효소 (glutathione-S-transferase, GST), 폴리(His)태그, Fc-태그, Strep-태그), 가용화 태그 (예를 들어 티오레독신 (TRX) 및 폴리 (NANP)), 크로마토그래피 태그 (예를 들어 FLAG-태그), 에피토프 태그 (V5-태그, Myc-태그, HA-태그 및 NE-태그), 형광 태그 (예를 들어 GFP-태그) 또는 기타 (비오틴화 및 후속 분리를 허용하는, Av-태그)를 포함하지만, 이에 제한되지는 않는다.
본 발명에 따른 인공 핵산 분자는 따라서 본 명세서에 예시된 단백질 태그로부터 선택적으로 선택된 1, 2, 3, 4, 5 개 또는 그 이상의 단백질 또는 펩티드 태그를 암호화할 수 있다. 상기 단백질 또는 펩티드 태그-암호화 핵산 서열은 바람직하게는 본 발명의 인공 핵산 분자의 암호화 영역에 위치하고, 바람직하게는 CRISPR-연관 단백질을 암호화하는 핵산 서열에 융합되어, 상기 암호화 영역의 발현은 상기 적어도 하나의 단백질 또는 펩티드 태그를 포함하는 CRISPR-연관 단백질을 생성한다. 다시 말해서, 본 발명에 따른 인공 핵산 분자는 바람직하게는 적어도 하나의 단백질 또는 펩티드 태그를 포함하는 CRISPR-연관 단백질을 암호화할 수 있다. 이러한 단백질 또는 펩티드 태그를 암호화하는 핵산을 도입하기 위한 수단 및 방법은 본 발명이 속하는 기술분야에서 통상의 기술자의 기술 및 상식 내에 있다.
본 발명의 인공 핵산 분자, 바람직하게는 RNA는 적합하거나 필요한 경우, 서로의 임의의 조합으로 상기 특성 또는 특징 중 임의의 것을 나타내는 CRISPR-연관 단백질 (예를 들어 Cas9, Cpf1)을 암호화할 수 있지만, 결합된 특성 또는 특징은 서로 간섭하지 않는다. 따라서, 인공 핵산 분자, 특히 RNA는 암호화된 CRISPR-연관 단백질(및 NLS, 신호 서열, 단백질/펩티드 태그)는 바람직하게는 상기 정의된 바와 같이 원하는 생물학적 기능 또는 특성을 유지한다면 하나 또는 그 이상의 NLS 및 선택적으로 하나 또는 그 이상의 신호 서열 및/또는 단백질 또는 펩티드 태그를 포함할 수 있는 본 명세서에 예시된 임의의 CRISPR-연관 단백질, 또는 본 명세서에 정의된 바와 같은 상동체, 변이체, 단편 또는 유도체를 암호화할 수 있다.
본 발명의 교시 내에는 정제, 검출, 국소화 또는 다른 목적으로 도입된 상기 태그 서열(들)이 없는 단백질 또는 펩티드 태그를 갖는 모든 서열이 포함된다. 다시 말해서, 펩티드 또는 단백질 태그와 함께 서열 목록에 개시된 서열은 또한 태그 서열이 제거될 때 본 발명의 교시 내에 명확하게 포함된다. 통상의 기술자는 태그된 단백질 서열로부터 임의의 태그 서열을 쉽게 제거할 수 있으며, 즉 태그되지 않은 형태로 본 발명의 서열을 또한 사용할 수 있다. 원하는 경우, 단백질에서 쉽게 제거되거나 단백질에 추가할 수 있는 PolyC 및 Histone 스템 루프 서열도 마찬가지이다.
Cas9
"Cas9"는 화농연쇄상구균(Streptococcus pyogenes) 항원형 M1 cas9 유전자 (NCBI 참조 서열: NC_002737.2, “SPy1046”S. pyogenes), 즉 spCas9, 또는 이의 상동체, 변이체 또는 단편에 의해 암호화될 수 있는 RNA-guided 유형 II CRISPR-Cas DNA 엔도뉴클레아제를 지칭한다. Cas9는 바람직하게는 가이드 RNA (gRNA)에 의해 모집되어 DNA의 이중 나선의 각 가닥마다 하나씩, 2 개의 별개의 엔도뉴클레아제 도메인 (HNH 및 RuvC / RNase H-유사 도메인)을 사용하여 표적 DNA 서열을 부위 특이 적으로 절단할 수 있다. RuvC와 HNH는 이중 가닥 절단(DSBs)을 함께 생성하고 각각 단일 가닥 절단을 생성할 수 있다 (미국특허출원공개번호 제 2014-0068797 호 및 Jinek M., et al. Science. 2012 Aug 17;337(6096):816-21). Cas9는 바람직하게는 표적 DNA 서열에 병치된 프로토스페이서 인접 모티프 (PAM)를 특이적으로 인식 (및 바람직하게는 결합)할 수 있다. PAM은 전형적으로 3-뉴클레오티드 서열 NGG를 포함하거나 이로 구성될 수 있는 표적 DNA의 3'에 위치한다. 일반적으로 Cas9의 C-말단 근처에 위치한 PAM-상호 작용 도메인 (PI 도메인)에 의해 인식된다.
다수의 Cas9 단백질이 본 발명이 속하는 기술분야에 공지되어 있고 본 발명과 관련하여 CRISPR-연관 단백질로서 예상된다. 적합한 Cas9 단백질은 하기 표 2에 열거되어 있다. 여기에서, 각 행은 상응하는 단백질의 데이터베이스 식별 번호 (제 1 열, "A", "Acc No.")에 의해 식별 된 Cas9 단백질에 해당한다. 표 2의 두 번째 열 ("B")은 본 명세서에 제공된 바와 같은 각각의 아미노산 서열에 상응하는 서열번호: 를 나타낸다. 바람직한 Cas9 단백질은 서열번호: 428-441; 서열번호: 10999-11001; 및 서열번호:442-1345 의 서열 목록에 제시되어 있다. 본 발명의 바람직한 실시예인 상응하는 최적화된 mRNA 서열은 서열번호: 411; 2540-2553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 6020-6033; 7180-7193; 8340-8353; 11237-11239; 11473-11475; 11591-11593; 11709-11711; 11827-11829; 11945-11947; 1394-2297; 3714-4617; 4874-5777; 6034-6937; 7194-8097; 및 8354-9257의 서열 목록에 제시되어 있다.
아미노산 서열
[표 2]
본 발명의 Cas9 단백질
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
바람직한 실시예에서, 본 발명의 인공 핵산 분자는 따라서 표 2의 각각의 열에 제공된 데이터베이스 수탁 번호(accession number)에 의해 정의된 Cas9 단백질을 암호화하는 핵산 서열, 또는 이의 상동체, 변이체, 단편 또는 유도체를 포함하거나 이로 구성된 암호화 서열을 포함한다. 특히, 암호화된 Cas9 단백질은 바람직하게는 표 2의 각각의 열에 나타낸 아미노산 서열, 또는 이의 상동체, 변이체, 단편 또는 유도체를 포함하거나 이로 구성될 수 있다.
구체적으로, 바람직한 실시예에서 본 발명의 인공 핵산 분자는 서열번호: 428-1375 중 어느 하나에 의해 정의된 아미노산 서열 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성된 Cas9 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성된 암호화 서열을 포함할 수 있다.
특히, 암호화된 Cas9 단백질은 바람직하게는 적어도 하나의 핵 위치 신호 (NLS), 보다 바람직하게는 상기 정의된 NLS2 및 NLS4로부터 선택된 2개의 NLS를 포함 할 수 있다. 바람직한 실시예에서, 본 발명의 인공 핵산 분자는 따라서 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 또는 서열번호: 12021-14274 중 어느 하나에 의해 정의된 아미노산 서열 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성된 핵 위치 신호를 갖는 Cas9 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성되는 암호화 서열을 포함할 수 있다.
본 명세서에서 예상되는 바람직한 기능적 Cas9 변이체는 특히 "deadCas9 (dCas9)" 및 "Cas9 닉카아제"를 포함한다.
용어 "dCas9"는 "촉매적으로 불활성", "촉매적으로 죽은 Cas9" 또는 "사멸 Cas9"로도 지칭되는 뉴 클레아제-비활성화된 Cas9를 지칭한다. 이러한 뉴클레아제는 엔도뉴클레아제 활성의 전부 또는 일부가 결여되어 있어 RNA-guided 방식에서 유전자의 조절에 사용될 수 있다 (Jinek M et al. Science. 2012 Aug 17;337(6096):816-21). dCas9 뉴클레아제는 전형적으로 2개의 촉매 잔기 (S. pyogenes Cas9 즉 spCas9에 대해 번호가 매겨진 RuvC-1 도메인의 D10A 및 HNH 도메인의 H840A) 모두에서 Cas9 엔도뉴클레아제 활성을 불활성화시키는 돌연변이를 포함한다. 그러나 다른 촉매 잔기도 뉴클레아제 도메인 중 하나 또는 둘 다의 활성을 감소시키기 위해 돌연변이될 수 있다. dCa는 바람직하게는 dsDNA를 절단할 수 없지만 적합한 gRNA와 연결하고 표적 DNA에 특이적으로 결합하는 능력을 유지한다. 아미노산 위치 D10A 및 H840A에서의 변화를 갖는 Cas9 이중 돌연변이체는 뉴클레아제 및 닉카아제 활성 둘 다를 완전히 불활성화시킨다. "dCas9"에 기초한 Cas9 유도체는 추가의 이펙터 도메인을 표적 DNA 서열로 운반하여 (본 명세서의 다른 곳에서 논의된 바와 같이) 예를 들어 CRISPRa 또는 CRISPRi 를 유도하는데 사용될 수 있다.
용어 "Cas9 닉카아제"는 표적 핵산 서열에서 이중 가닥 절단을 도입하는 능력을 보유하지 않지만 표적 부위에서 단일 가닥 절단에 결합하여 단일 가닥 절단을 도입하는 능력을 유지하는 Cas9 변이체를 지칭한다. 이러한 변이체는 전형적으로 Cas9 엔도뉴클레아제 도메인 (HNH 및 RuvC) 중 하나에서의 돌연변이를 포함하지만 둘다는 아니다. 따라서, S. pyogenes Cas9, 즉 spCas9에 대해 번호가 매겨진 Cas9의 위치 D10A 또는 H840A에서 아미노산 돌연변이는 뉴클레아제 촉매 활성을 불활성화시키고 Cas9를 닉카아제로 전환시킬 수 있다.
추가의 Cas9 변이체는 본 발명이 속하는 기술 분야에 공지되어 있으며 본 발명에 따른 변이체로 예상된다. 미국특허출원번호 제 20140273226 호는 S.pyogenes Cas9 유전자, Cas9 단백질, 및 숙주-특이적 코돈 최적화된 Cas9 암호화 서열 및 Cas9 융합 단백질을 포함하는 Cas9 단백질의 변이체를 논의한다.
미국특허출원번호 제 20140315985 호는 S. pyogenes (미국특허출원번호 제 20140273226 호의 서열번호: 8)로부터의 Cas9의 서열을 포함하는 다수의 예시적인 야생형 Cas9 폴리펩티드 (예를 들어, 미국특허출원번호 제 20140273226 호의 서열번호: 1-256, 서열번호: 795-1346)를 교시한다. Cas9 단백질의 변형 및 변이체가 또한 논의된다. 이들 참고 문헌의 개시는 그 전체가 본 명세서에 포함된다.
추가의 실시예에서, 본 발명에 따른 인공 핵산은 그 전문이 본 명세서에 참조로 포함된 PCT/EP2017/076775의 표 2에 나타낸 바와 같이 Cas9 단백질 또는 이의 동형, 상동체, 변이체, 단편 또는 유도체를 암호화한다. 예를 들어, 본 발명의 인공 핵산은 따라서 PCT/EP2017/076775의 서열번호: 428-1345 또는 1362-1375 중 어느 하나에 의해 정의된 아미노산 서열, 또는 이의 (기능적) 동형, 상동체, 변이체, 단편 또는 유도체를 포함하거나 이로 구성된 Cas9 단백질을 암호화하는 적어도 하나의 암호화 서열을 포함할 수 있다.
핵산 서열
바람직한 실시예에서, 본 발명의 인공 핵산 분자는 본 명세서에서 정의된 Cas9 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성된 암호화 서열을 포함할 수 있으며, 상기 핵산 서열은 서열번호: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311 ;2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 9690-9703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250 -10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; 27; 996-1009; 2156-2169; 3316-3329; 4476-4489; 5636-5649; 6796-6809; 7956-7969; 1010- 1913; 2170-3073; 3330-4233; 4490-5393; 5650-6553; 6810-7713; 7970-8873 중 어느 하나 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열이라고 정의된다.
바람직한 실시예에서, 본 발명의 인공 핵산은 암호화 영역에서 적어도 하나의 핵 위치 신호를 추가로 암호화한다. 핵 위치 신호(들)를 암호화하는 핵산 서열은 상기 Cas9 단백질 또는 이의 상동체, 변이체, 단편 또는 유도체의 핵으로의 수송을 용이하게 하기 위해 바람직하게는 Cas9 단백질 또는 이의 상동체, 변이체, 단편 또는 유도체를 암호화하는 핵산에 융합된다. 바람직한 실시예에서, 인공 핵산은 따라서 적어도 하나의 핵 위치 신호에 융합된 Cas9 단백질, 또는 이의 상동체, 변이체, 단편 또는 유도체를 암호화하는 핵산 서열을 포함하거나 이로 구성되며, 상기 핵산 서열은 바람직하게는 서열번호: 409; 2538; 410; 2539; 10551; 10581; 11973; 11974-11980; 1378; 3698; 4858; 6018; 7178; 8338; 1379; 3699; 4859; 6019; 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005; 12013; 11966-11972; 11982-11988; 11990-11996; 11998-12004; 12006-12012; 12014-12020 중 어느 하나 또는 단백질 서열번호: 12021-14274를 암호화하는 임의의 핵산 서열, 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열에 의해 정의된다.
본 발명은 바람직하게는 상기 암호화된 단백질의 발현을 증가시키기 위해 CRISPR-연관 단백질 암호화 영역과 본 명세서에 정의된 UTR의 유리한 조합을 고려한다. 바람직한 실시예에서, 인공 핵산은 따라서 적어도 하나의 핵 위치 신호에 융합된 Cas9 단백질, 또는 이의 상동체, 변이체, 단편 또는 유도체를 암호화하는 핵산 서열을 포함하거나 이로 구성되며, 상기 핵산 서열은 바람직하게는 서열번호: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 9690-9703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250 -10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391 중 어느 하나 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열에 의해 정의된다.
본 발명은 바람직하게는 상기 암호화된 단백질의 발현을 증가시키기 위해 CRISPR-연관 단백질 암호화 영역과 본 명세서에 정의된 UTR의 유리한 조합을 고려한다. 바람직한 실시예에서, 인공 핵산은 따라서 적어도 하나의 핵 위치 신호에 융합된 Cas9 단백질 또는 이의 상동체, 변이체, 단편 또는 유도체를 암호화하는 핵산 서열을 포함하거나 이로 구성되며, 상기 핵산 서열은 바람직하게는 서열번호: 14274, 서열번호: 14275, 서열번호: 14276, 서열번호: 14277, 서열번호: 14278, 서열번호: 14279, 서열번호: 14280, 서열번호: 14281, 및 서열번호: 14282; 보다 바람직하게는 서열번호: 14281, 서열번호: 417 (HSD17B4 / PSMB3.1 즉 construct HSD17B4_NLS2_STRP1(SF370)-cas9_HsOpt_NLS4_PSMB3.1; Hsopt = Homo sapiens optimization) 또는 서열번호:414 (Slc7a3.1 / Gnas1, i.e. construct Scl7a3.1_NLS2_STRP1(SF370)-cas9_HsOpt_NLS4_Gnas.1).로 이루어진 군으로부터 선택된 임의의 서열 번호에 의해 정의된다.
유리하게, 개시된 임의의 Cas9 서열, 즉 상기 언급된 바와 같이, 즉 본 명세서에 개시된 및/또는 서열 목록의 임의의 서열, 즉 Cas9 단백질 서열 및 각각의 Cas9 단백질 서열, 즉 WT 또는 최적화된 서열의 상이한 버전을 암호화하는 mRNA는 본 발명의 용도로 선택될 수 있다.
또한, Cas9 닉카아제에 의한 헌팅틴 유전자로부터 CAG 트랙트의 정확한 절제는 본 명세서에 참조로 포함된 PMID 29535594를 참고하여 본 발명의 교시 내에 포함된다. 또한, Neisseria meningitide로부터의 천연 CRISPR-Cas9 시스템에 의한 프로그램 가능한 RNA 절단 및 인식은 본 명세서에 참조로 포함된 PMID 29456189를 참고하여 본 발명의 교시 내에 포함된다. 또한, Campylobacter jejuni Cas9에 의한 내인성 RNA의 CRISPR RNA-의존적 결합 및 절단은 본 명세서에 참조로 포함된 PMID 29499139를 참고하여 본 발명의 교시 내에 포함된다. 또한 CRISPR/Cas9-매개 트랜스-후성적 조절을 통한 생체내 표적 유전자 활성화는 본 명세서에 참조로 포함된 PMID 29224783을 참고하여 본 발명의 교시 내에 포함된다.
추가의 실시예에서, 본 발명은 또한 표 2A에 나타낸 바와 같은 핵산 서열을 예상한다.
[표 2A]
본 발명의 더욱 바람직하게 최적화된 Cas9 서열
Figure pct00024
추가의 실시예에서, NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 (서열번호: 412)는 표 2A에 나타낸 바와 같이 UTR 조합, 즉 Slc7a3.1 (서열번호: 15/16) / Gnas.1 (서열번호: 29/30)과 결합된다.
[표 2B]
본 발명의 더욱 바람직하게 최적화된 Cas9 서열
Figure pct00025
추가적인 실시예에서, 본 발명에 따른 인공 핵산 서열은 PCT/EP2017/076775의 서열번호: 1380 - 1393; 1394 - 2297; 2314 - 2327; 2330 - 2343; 2346 - 2359; 2362 - 2375; 2378 - 2391; 2394 - 2407; 2410 - 2423; 2426 - 2439; 2442 - 2455; 2458 - 2471; 2474 - 2487; 2490 - 2503; 2506 - 2519; 2522 - 2535; 9498 - 9511; 9610 - 9623; 9722 - 9735; 9834 - 9847; 9946 - 9959; 10058 - 10071; 10170 - 10183 - 10282 - 10295; 2540 - 2553; 2554 - 3457; 3474 - 3887; 3490 - 3503; 3506 - 3519; 3522 - 3535; 3538 - 3551; 3554 - 3567; 3570 - 3583; 3586 - 3599; 3602 - 3615; 3618 - 3631; 3634 - 3647; 3650 - 3663; 3666 - 3679; 3682 - 3695; 9514 - 9527; 9626 - 9639; 9738 - 9751; 9850 - 9863; 9962 - 9975, 10074 - 10087; 10186 - 10199; 10298 - 10311; 3700 - 3713; 3714 - 4617; 4634 - 4647; 4650 - 4663; 4666 - 4679; 4682 - 4695; 4698 - 4711; 4714 - 4727; 4730 - 4743; 4746 - 4759; 4762 - 4775; 4778 - 4791; 4794 - 4807; 4810 - 4823; 4826 - 4839; 4842 - 4855; 9530 - 9543; 9642 - 9655; 9754 -9767; 9866 -9879; 9978 - 9991; 10090 - 10103; 10202 - 10215; 10314 - 10327; 4860 - 4873; 4874 - 5777; 5794 - 5807; 5810 - 5823; 5826 - 5839; 5842 - 5855; 5858 - 5871; 5874 - 5887; 5890 - 5903; 5906 - 5919; 5922 - 5935; 5938 - 5951; 5954 - 5967; 5970 - 5983, 5986 - 5999; 6002 - 6015; 9546 - 9559; 9658 - 9671; 9770 - 9783; 9882 - 9895; 9994 - 10007; 10106 - 10119; 10218 - 10231; 10330 - 10343; 6020 - 6033; 6034 - 6937; 6954 - 6967; 6970 - 6983; 6986 - 6999; 7002 - 7015; 7018 - 7031; 7034 - 7047; 7050 - 7063; 7066 -7079; 7082 - 7095; 7098 - 7111; 7114 - 7127; 7130 - 7143; 7146 - 7159; 7162 - 7175; 9562 - 9575; 9674 - 9687; 9786 - 9799; 9898 - 9911; 10010 - 10023; 10122 - 10135; 10234 - 10247; 10346 - 10359; 7180 - 7193; 7194 - 8097; 8114 - 8127; 8130 - 8143; 8146 - 8159; 8162 - 8175; 8178 - 8191; 8194 - 8207; 8210 - 8223; 8226 - 8239; 8242 - 8255; 8258 - 8271; 8274 - 8287; 8290 - 8302; 8306 - 8319; 8322 - 8335; 9578 - 9591; 9690 - 9703; 9802 - 9815; 9914 - 9927; 10026 - 10039; 10138 - 10151; 10250 -10263; 10362 - 10375; 8340 - 8353; 8354 - 9257; 9274 - 9287; 9290 - 9303; 9306 - 9319; 9322 - 9335; 9338 - 9351; 9354 - 9367; 9370 - 9383; 9386 - 9399; 9402 - 9415; 9418 - 9431; 9434 - 9447; 9450 - 9463; 9466 - 9479; 9482 - 9495; 9594 -9607; 9706 - 9719; 9818 - 9831; 9930 - 9943; 10042 - 10055; 10154 - 10167; 10266 - 10279; 10378 - 10391; 411; 1380 - 1393; 2540 - 2553; 3700 - 3713; 4860 - 4873; 6020 - 6033; 7180 - 7193; 8340 - 8353; 1394 - 2297; 2554 - 3457; 3714 - 4617; 4874 - 5777; 6034 - 6937; 7194 - 8097; 8354 - 9257; 2314 - 2327; 3474 - 3887 ; 4634 - 4647; 5794 - 5807; 6954 - 6967; 8114 - 8127; 9274 - 9287; 413 - 425; 2330 - 2343; 2346 - 2359; 2362 - 2375; 2378 - 2391; 2394 - 2407; 2410 - 2423; 2426 - 2439; 2442 - 2455; 2458 - 2471; 2474 - 2487; 2490 - 2503; 2506 - 2519; 2522 - 2535; 9498 - 9511; 9610 - 9623; 9722 - 9735; 9834 - 9847; 9946 - 9959; 10058 - 10071; 10170 - 10183 - 10282 - 10295; 3490 - 3503; 3506 - 3519; 3522 - 3535; 3538 - 3551; 3554 - 3567; 3570 - 3583; 3586 - 3599; 3602 - 3615; 3618 - 3631; 3634 - 3647; 3650 - 3663; 3666 - 3679; 3682 - 3695; 9514 - 9527; 9626 - 9639; 9738 - 9751; 9850 - 9863; 9962 - 9975, 10074 - 10087; 10186 - 10199; 10298 - 10311; 4650 - 4663; 4666 - 4679; 4682 - 4695; 4698 - 4711; 4714 - 4727; 4730 - 4743; 4746 - 4759; 4762 - 4775; 4778 - 4791; 4794 - 4807; 4810 - 4823; 4826 - 4839; 4842 - 4855; 9530 - 9543; 9642 - 9655; 9754 -9767; 9866 -9879; 9978 - 9991; 10090 - 10103; 10202 - 10215; 10314 - 10327; 5810 - 5823; 5826 - 5839; 5842 - 5855; 5858 - 5871; 5874 - 5887; 5890 - 5903; 5906 - 5919; 5922 - 5935; 5938 - 5951; 5954 - 5967; 5970 - 5983, 5986 - 5999; 6002 - 6015; 9546 - 9559; 9658 - 9671; 9770 - 9783; 9882 - 9895; 9994 - 10007; 10106 - 10119; 10218 - 10231; 10330 - 10343; 6970 - 6983; 6986 - 6999; 7002 - 7015; 7018 - 7031; 7034 - 7047; 7050 - 7063; 7066 -7079; 7082 - 7095; 7098 - 7111; 7114 - 7127; 7130 - 7143; 7146 - 7159; 7162 - 7175; 9562 - 9575; 9674 - 9687; 9786 - 9799; 9898 - 9911; 10010 - 10023; 10122 - 10135; 10234 - 10247; 10346 - 10359; 8130 - 8143; 8146 - 8159; 8162 - 8175; 8178 - 8191; 8194 - 8207; 8210 - 8223; 8226 - 8239; 8242 - 8255; 8258 - 8271; 8274 - 8287; 8290 - 8302; 8306 - 8319; 8322 - 8335; 9578 - 9591; 9690 - 9703; 9802 - 9815; 9914 - 9927; 10026 - 10039; 10138 - 10151; 10250 -10263; 10362 - 10375; 9290 - 9303; 9306 - 9319; 9322 - 9335; 9338 - 9351; 9354 - 9367; 9370 - 9383; 9386 - 9399; 9402 - 9415; 9418 - 9431; 9434 - 9447; 9450 - 9463; 9466 - 9479; 9482 - 9495; 9594 -9607; 9706 - 9719; 9818 - 9831; 9930 - 9943; 10042 - 10055; 10154 - 10167; 10266 - 10279; 10378 - 10391 에 따른 핵산 서열, 또는 이의 (기능적) 상동체, 단편, 변이체 또는 유도체를 포함하거나 이로 구성될 수 있다.
Cpf1
"Cpf1" ("Prevotella 및 Francisella 1의 CRISPR") 또는 "Cas12"는 추정 클래스 2 유형 V CRISPR-Cas 시스템에 속하는 RNA-가이드된 DNA 엔도뉴클레아제 (Zetsche et al., Cell. 2015 Oct 22; 163(3): 759-771), 및 이의 상동체, 변이체, 단편 및 유도체를 지칭한다. Cpf1-암호화 유전자는 Francisella tularensis subsp. novicida (균주 U112) cpf1 유전자 (NCBI 참조 서열: NZ_CP009633.1, "AW25_RS03035") 또는 그의 상동체, 변이체 또는 단편을 포함한다. 서열 분석에 기초하여, Cpf1은 단지 하나의 검출 가능한 RuvC 엔도뉴클레아제 도메인 및 두 번째 추정 신규 뉴클레아제 (NUC) 도메인을 포함한다 (Zetsche et al., Cell. 2015 Oct 22; 163 (3) : 759-771, Gao et al. Res. 2016 Aug; 26 (8) : 901-13).
Cpf1 단백질은 바람직하게는 crRNA와 결합하여 바람직하게는 표적 DNA 서열과 특이적으로 상호 작용할 수 있는 Cpf1:crRNA 복합체를 형성한다. Cpf1:crRNA 복합체는 바람직하게는 표적 DNA의 5'에 위치한 짧은 T-풍부 프로토스페이서 인접 모티프 (PAM)에 의해 진행된 표적 DNA를 효율적으로 절단할 수 있고, 4 또는 5-nt 5' 돌출부와 함께 엇갈린 DNA 이중 가닥 절단을 도입할 수 있다.
아미노산 서열
몇몇 Cpf1 단백질은 본 발명의 기술 분야에 공지되어 있으며 본 발명과 관련하여 CRISPR-연관 단백질로서 예상된다. 적합한 Cpf1 단백질은 하기 표 3에 열거되어 있다. 여기에서, 각 행은 데이터베이스 수탁 번호 (첫 번째 열, "A", "Acc No.")에 의해 식별된 Cpf1 단백질에 해당한다. 표 3의 두 번째 열("B")은 본 명세서에 제공된 바와 같은 각각의 아미노산 서열에 상응하는 서열 번호를 나타낸다. 바람직한 Cpf1 단백질은 서열번호: 1346-1347; 10576-10577; 및 1348-1361의 서열 목록에 제시되어 있다. 본 발명의 바람직한 실시예인 상응하는 최적화된 mRNA 서열은 서열번호: 10552; 3458-3459; 3460-3473 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 및 9260-9273의 서열 목록에 제시되어 있다.
Cpf1 단백질
A열 B열
Acc. No. 서열번호
1 U2UMQ6 1346
2 A0Q7Q2 1347
3 A8WNM2 1348
4 E3LGD2 1349
5 A0A182DWE3 1350
6 A0A0B6KQP9 1351
7 A0A0E1N6W4 1352
8 V6HCU8 1353
9 A0A0E1N9S2 1354
10 A0A1B8PW75 1355
11 A0A1J0L0B6 1356
12 A0A1F3JTA5 1357
13 A0A1G2R4W1 1358
14 A0A1F5S360 1359
15 A0A1F5ENJ2 1360
16 A0A1J4U637 1361
17 U2UMQ6 (NLS2_cpf1_U2UMQ6_NLS4_prot) 1376
18 A0Q7Q2 (NLS2_cpf1_A0Q7Q2_NLS4_prot) 1377
바람직한 실시예에서, 본 발명의 인공 핵산 분자는 따라서 표 3의 각각의 열에 제공된 데이터베이스 수탁 번호에 의해 정의된 Cpf1 단백질을 암호화하는 핵산 서열, 또는 이의 상동체, 변이체, 단편 또는 유도체를 포함하거나 이로 구성된 암호화 서열을 포함한다. 특히, 암호화된 Cpf1 단백질은 바람직하게는 표 3의 각각의 열에 나타낸 아미노산 서열, 또는 이의 상동체, 변이체, 단편 또는 유도체를 포함하거나 이로 구성될 수 있다.
구체적으로, 바람직한 실시예에서 본 발명의 인공 핵산 분자는 서열번호: 1346-1347; 10576-10577; 또는 1348-1361 중 어느 하나에 의해 정의된 아미노산 서열 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된 Cpf1 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성되는 암호화 서열을 포함할 수 있다.
특히, 암호화된 Cpf1 단백질은 바람직하게는 적어도 하나의 핵 위치 신호 (NLS), 보다 바람직하게는 상기 정의된 바와 같이 NLS2 및 NLS4로부터 선택된 2 개의 NLS를 포함할 수 있다. 바람직한 실시예에서, 본 발명의 인공 핵산 분자는 서열번호: 992-993 중 어느 하나에 의해 정의된 아미노산 서열 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성된 Cpf1 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성되는 암호화 서열을 포함할 수 있다.
추가의 실시예에서, 본 발명에 따른 인공 핵산은 본 명세서에 그 전문이 참조로 포함된 PCT/EP2017/076775의 표 3에 지시된 바와 같이 Cpf1 단백질, 또는 이의 동형, 상동체, 변이체, 단편 또는 유도체를 암호화한다. 구체적으로, 본 발명의 인공 핵산 (RNA) 분자는 따라서 PCT/EP2017/076775의 서열번호: 1346-1361, 또는 1376-1377 또는 10576-10577 중 어느 하나에 의해 정의된 아미노산 서열 또는 (기능적) 동형, 상동체, 변이체, 단편 또는 유도체를 포함하거나 이로 구성된 Cpf1 단백질을 암호화하는 암호화 서열을 포함할 수 있다.
핵산 서열
바람직한 실시예에서, 본 발명의 인공 핵산 분자는 본 명세서에 정의된 Cpf1 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성된 암호화 서열을 포함할 수 있으며, 여기서 상기 핵산 서열은 서열번호: 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 8208-8209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583; 10579-10580; 10585-10586; 10588-10589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881; 10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 9352-9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448-9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 9832-9833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 10392-10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548; 중 어느 하나 또는 이의 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열로 정의된다.
다른 바람직한 실시예에서, 본 발명의 인공 핵산 분자는 본 명세서에 정의된 Cpf1 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성되는 암호화 서열을 포함할 수 있으며, 여기서 상기 핵산 서열은 서열번호: 10549 (i.e. AsCpf1 = 32L4_AsCpf1(Hsopt)-NLS3-3xHA-tag_albumin7) 또는 서열번호: 10550 (i.e. LbCpf1 = 32L4_LbCpf1(Hsopt)-NLS3-3xHA-tag_albumin7) 중 어느 하나 또는 이의 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열에 의해 정의된다.
바람직한 실시예에서, 본 발명의 인공 핵산은 암호화 영역에서 적어도 하나의 핵 위치 신호를 추가로 암호화한다. 핵 위치 신호(들)를 암호화하는 핵산 서열은 바람직하게는 본 명세서에 정의된 Cpf1 단백질, 또는 이의 상동체, 변이체, 단편 또는 유도체를 암호화하는 핵산에 융합되어 상기 Cpf1 단백질, 또는 이의 상동체, 변이체, 단편 또는 유도체의 핵으로의 수송을 용이하게 한다. 바람직한 실시예에서, 인공 핵산은 따라서 적어도 하나의 핵 위치 신호에 융합된 Cpf1 단백질을 암호화하는 핵산 서열을 포함하거나 이로 구성되며, 상기 핵산 서열은 바람직하게는 서열번호: 10551; 10581; 10593; 10584; 10587; 10590; 10593; 10596; 409; 2538; 410; 2539; 10551; 10581; 11973; 11974-11980; 1378; 3698; 4858; 6018; 7178; 8338; 1379; 3699; 4859; 6019; 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005; 12013; 11966-11972; 11982-11988; 11990-11996; 11998-12004; 12006-12012; 12014-12020 중 어느 하나 또는 서열번호: 12021-14274 중 어느 하나 또는 이들의 조합을 암호화하는 핵산, 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열에 의해 정의된다.
유리하게는, Cpf1과 같은 CRISPR-연관 단백질을 암호화하는 핵산 서열, 또는 그의 상동체, 변이체, 단편 또는 유도체는 본 발명에 따른 인공 핵산의 암호화 영역 내에서 본 명세서에 정의된 UTR과 조합하여 바람직하게는 상기 암호화된 단백질의 발현을 증가시킨다. 바람직한 실시예에서, 인공 핵산은 적어도 하나의 핵 위치 신호에 추가로 융합된 Cpf1 단백질을 암호화하는 핵산 서열, 또는 이의 상동체, 변이체 또는 단편을 포함하거나 이로 구성되며, 상기 핵산 서열은 바람직하게는 서열번호: 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 8208-8209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583 10579-10580; 10585-10586; 10588-10589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881; 10882 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 9352-9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448-9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 9832-9833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 10392-10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 중 어느 하나 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열에 의해 정의된다.
유리하게는, 개시된 임의의 Cpf1 서열은 본 발명의 용도, 즉 상기 언급된 바와 같은 즉 본 명세서에 개시된 및/또는 서열 목록에 기재된 임의의 서열, 즉 Cpf1 단백질 서열 및 각각의 Cpf1 단백질 서열 즉 WT 또는 최적화된 서열의 다양한 버전을 암호화하는 mRNA를 위해 선택될 수 있다.
추가의 실시예에서, 본 발명에 따른 인공 핵산 서열은 PCT/EP2017/076775의 서열번호: 2298 - 2299; 3458 - 3459; 4618 - 4619; 5778 - 5779; 6938 - 6939; 8098 - 8099; 9258 - 9259; 2300 - 2313; 3460 - 3473; 4620 - 4633; 5780 - 5793; 6940 - 6953; 8100 - 8113; 9260 - 9273; 2328 - 2329; 10395; 3488 - 3489; 10396; 4648 - 4649; 10397; 5808 - 5809; 10398; 6968 - 6969; 10399; 8128 - 8129; 10400 ; 9288 - 9289; 10401; 2344 - 2345; 2360 - 2361; 2376 - 2377; 2392 - 2393; 2408 - 2409; 2424 - 2425; 2440 - 2441; 2456 - 2457; 2472 - 2473; 2489 - 2490; 2504 - 2505; 2520 - 2521; 2536 - 2537; 9512 - 9513; 9624 - 9625; 9736 - 9737; 9848 - 9849; 9960 - 9961; 10072 - 10073; 10184 - 10185; 10296 - 10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 3504 - 3505; 3520 - 3521; 3536 - 3537; 3552 - 3553; 3568 - 3669; 3584 - 3585; 3600 - 3601; 3616 - 3617; 3632 - 3633; 3648 - 3649; 3664 - 3665; 3680 - 3681; 3696 - 3697; 9528 - 9529; 9640 - 9641; 9752 - 9753; 9864 - 9865; 9976 - 9977; 10088 - 10089; 10200 - 10201; 10312 - 10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 4664 - 4665; 4680 - 4681; 4696 - 4697; 4712 - 4713; 4728 - 4729; 4744 - 4745; 4760 - 4761; 4776 - 4777; 4792 - 4793; 4808 - 4809; 4824 - 4825; 4840 - 4841; 4856 - 4857; 9544 - 9545; 9656 - 9657; 9768 - 9769; 9880 - 9881; 9992 - 9993; 10104 - 10105; 10216 - 10217; 10328 - 10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824 - 5825; 5840 - 5841; 5856 - 5857; 5872 - 5873; 5888 - 5889; 5904 - 5905; 5920 - 5921; 5936 - 5937; 5952 - 5953; 5968 - 5969; 5984 - 5985; 6000 - 6001; 6016 - 6017; 9560 - 9561; 9672 - 9673; 9784 - 9785; 9896 - 9897; 10008 - 10009; 10120 - 10121; 10232 - 10233; 10344 - 10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 6984 - 6985; 7000 - 7001; 1016 - 7017; 7032 - 7033; 7048 - 7049; 7064 - 7065; 7080 - 7081; 7096 - 7097; 7112 - 7113; 7128 - 7129; 7144 - 7145; 7160 - 7161; 7176 - 7177; 9576 - 9577; 9688 - 9689; 9800 - 9801; 9912 - 9913; 10024 - 10025; 10136 - 10137; 10248 - 10249; 10360 - 10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160 - 8160; 8176 - 8177; 8192 - 8193; 8208 - 8209; 8224 - 8225; 8240 - 8241; 8256 - 8257; 8272 - 8273; 8288 -8289; 8304 - 8305; 8320 - 8321; 8336 - 8337; 9592 - 9593; 9704 - 9705; 9816 - 9817; 9928 - 9929; 10040 - 10041; 10152 - 10153; 10264 - 10265; 10376 - 10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9304 - 9305; 9320 - 9321; 9336 - 9337; 9352 - 9353; 9368 - 9369; 9384 - 9385; 9400 - 9401; 9416 - 9417; 9432 - 9433; 9448 - 9449; 9464 - 9465; 9480 - 9481; 9496 - 9497; 9608 - 9609; 9720 - 9721; 9832 - 9833; 9944 - 9945; 10056 - 10057; 10168 - 10169; 10280 - 10281; 10392 - 10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548; 10552; 10594 - 10595; 10582 - 10583; 10585 - 10586; 10588 - 10589; 10591 - 10592; 10594 - 10595; 10597 - 10598; 10553; 10599; 10600; 10613; 10614; 10627; 10628; 10641; 10642; 10655; 10656; 10669; 10670; 10683; 10684; 10697; 10698; 10711; 10712; 10725; 10726; 10739; 10740; 10753; 10754; 10767; 10768; 10781; 10782; 10795; 10796; 10809; 10810; 10823; 10824; 10837; 10838; 10851; 10852; 10865; 10866; 10879; 10880; ; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881; 10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892; 2298 - 2299; 3458 - 3459; 4618 - 4619; 5778 - 5779; 6938 - 6939; 8098 - 8099; 9258 - 9259 ; 10552; 2300 - 2313; 3460 - 3473; 4620 - 4633; 5780 - 5793; 6940 - 6953; 8100 - 8113; 9260 - 9273; 2314 - 2327; 3474 - 3887 ; 4634 - 4647; 5794 - 5807; 6954 - 6967; 8114 - 8127; 9274 - 9287; 2328 - 2329; 10395; 3488 - 3489; 10396; 4648 - 4649; 10397; 5808 - 5809; 10398; 6968 - 6969; 10399; 8128 - 8129; 10400 ; 9288 - 9289; 10401; 10553; 2344 - 2345; 2360 - 2361; 2376 - 2377; 2392 - 2393; 2408 - 2409; 2424 - 2425; 2440 - 2441; 2456 - 2457; 2472 - 2473; 2489 - 2490; 2504 - 2505; 2520 - 2521; 2536 - 2537; 9512 - 9513; 9624 - 9625; 9736 - 9737; 9848 - 9849; 9960 - 9961; 10072 - 10073; 10184 - 10185; 10296 - 10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 3504 - 3505; 3520 - 3521; 3536 - 3537; 3552 - 3553; 3568 - 3669; 3584 - 3585; 3600 - 3601; 3616 - 3617; 3632 - 3633; 3648 - 3649; 3664 - 3665; 3680 - 3681; 3696 - 3697; 9528 - 9529; 9640 - 9641; 9752 - 9753; 9864 - 9865; 9976 - 9977; 10088 - 10089; 10200 - 10201; 10312 - 10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 4664 - 4665; 4680 - 4681; 4696 - 4697; 4712 - 4713; 4728 - 4729; 4744 - 4745; 4760 - 4761; 4776 - 4777; 4792 - 4793; 4808 - 4809; 4824 - 4825; 4840 - 4841; 4856 - 4857; 9544 - 9545; 9656 - 9657; 9768 - 9769; 9880 - 9881; 9992 - 9993; 10104 - 10105; 10216 - 10217; 10328 - 10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824 - 5825; 5840 - 5841; 5856 - 5857; 5872 - 5873; 5888 - 5889; 5904 - 5905; 5920 - 5921; 5936 - 5937; 5952 - 5953; 5968 - 5969; 5984 - 5985; 6000 - 6001; 6016 - 6017; 9560 - 9561; 9672 - 9673; 9784 - 9785; 9896 - 9897; 10008 - 10009; 10120 - 10121; 10232 - 10233; 10344 - 10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 6984 - 6985; 7000 - 7001; 1016 - 7017; 7032 - 7033; 7048 - 7049; 7064 - 7065; 7080 - 7081; 7096 - 7097; 7112 - 7113; 7128 - 7129; 7144 - 7145; 7160 - 7161; 7176 - 7177; 9576 - 9577; 9688 - 9689; 9800 - 9801; 9912 - 9913; 10024 - 10025; 10136 - 10137; 10248 - 10249; 10360 - 10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160 - 8160; 8176 - 8177; 8192 - 8193; 8208 - 8209; 8224 - 8225; 8240 - 8241; 8256 - 8257; 8272 - 8273; 8288 -8289; 8304 - 8305; 8320 - 8321; 8336 - 8337; 9592 - 9593; 9704 - 9705; 9816 - 9817; 9928 - 9929; 10040 - 10041; 10152 - 10153; 10264 - 10265; 10376 - 10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9304 - 9305; 9320 - 9321; 9336 - 9337; 9352 - 9353; 9368 - 9369; 9384 - 9385; 9400 - 9401; 9416 - 9417; 9432 - 9433; 9448 - 9449; 9464 - 9465; 9480 - 9481; 9496 - 9497; 9608 - 9609; 9720 - 9721; 9832 - 9833; 9944 - 9945; 10056 - 10057; 10168 - 10169; 10280 - 10281; 10392 - 10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548; 10554 - 10574; 10594 - 10595; 10582 - 10583; 10585 - 10586; 10588 - 10589; 10591 - 10592; 10594 - 10595; 10597 - 10598; 10599; 10600; 10613; 10614; 10627; 10628; 10641; 10642; 10655; 10656; 10669; 10670; 10683; 10684; 10697; 10698; 10711; 10712; 10725; 10726; 10739; 10740; 10753; 10754; 10767; 10768; 10781; 10782; 10795; 10796; 10809; 10810; 10823; 10824; 10837; 10838; 10851; 10852; 10865; 10866; 10879; 10880; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881; 10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892에 따른 핵산 서열, 또는 이의 (기능적) 상동체, 단편, 변이체 또는 유도체를 포함하거나 이로 구성될 수 있다.
Cas13, CasX, CasY 및 다른 (엔도)뉴클레아제
아미노산 서열
몇몇 Cas13, CasX 및 CasY 단백질은 본 발명이 속하는 기술 분야에 공지되어 있고 본 발명과 관련하여 CRISPR-연관 단백질로서 예상된다. 적합한 Cas13, CasX 및 CasY 단백질은 서열번호: 10893-10925; 10926-10998 (Cas13, 즉 WP15770004, WP18451595, WP21744063, WP21746774, ERK53440, WP31473346, CVRQ01000008, CRZ35554, WP22785443, WP36091002, WP12985477, WP13443710, ETD76934, WP38617242, WP2664492, WP4343973, WP44065294, ADAR2DD, WP47447901, ERI81700, WP34542281, WP13997271, WP41989581, WP47431796, WP14084666, WP60381855, WP14165541, WP63744070, WP65213424, WP45968377, EHO06562, WP6261414, EKB06014, WP58700060, WP13446107, WP44218239, WP12458151, ERJ81987, ERJ65637, WP21665475, WP61156637, WP23846767, ERJ87335, WP5873511, WP39445055, WP52912312, WP53444417, WP12458414, WP39417390, EOA10535, WP61156470, WP13816155, WP5874195, WP39437199, WP39419792, WP39431778, WP46201018, WP39442171, WP39426176, WP39418912, WP39434803, WP39428968, WP25000926, EFU31981, WP4343581, WP36884929, BAU18623, AFJ07523, WP14708441, WP36860899, WP61868553, KJJ86756, EGQ18444, EKY00089, WP36929175, WP7412163, WP44072147, WP42518169, WP44074780, WP15024765, WP49354263, WP4919755, WP64970887, WP61710138); 11002; 11003 (CasX, 즉 OGP07438, OHB99618); 및 11004-11010 (CasY, 즉 OJI08769, OGY82221, OJI06454, APG80656, OJI07455, OJI09436, PIP58309)로 나타내었다.
유리하게는, Cas13과 같은 CRISPR-연관 단백질을 암호화하는 핵산 서열, 또는 그의 상동체, 변이체, 단편 또는 유도체는 본 발명에 따른 인공 핵산의 암호화 영역 내에서 본 명세서에 정의된 UTR과 조합하여 바람직하게는 상기 암호화된 단백질의 발현을 증가시킨다. 바람직한 실시예에서, 인공 핵산은 적어도 하나의 핵 위치 신호에 추가로 융합된 Cas13 단백질, 또는 이의 상동체, 변이체 또는 단편을 암호화하는 핵산 서열을 포함하거나 이로 구성되며, 상기 핵산 서열은 바람직하게는 서열번호: 11011-11042; 11249-11280; 11044-11116; 11282-11354; 11131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944 중 어느 하나 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열로 정의된다. 또한 다른 Cas13 단백질, 즉 Cas13a, Cas13b, Cas13c 및 Cas13d (본 명세서에 참조로 포함된 PMID 29551514 및 29551272로부터 명백함)가 본 발명의 개시 내용 내에 포함된다. 또한 Cas13 관련 공보 PMID 26593719, 28976959, 및 29070703이 본 명세서에 참조로 포함된다.
다수의 Cas13 단백질이 본 발명이 속하는 기술분야에 공지되어 있고 본 발명과 관련하여 CRISPR-연관 단백질로서 예상된다. 본 발명의 바람직한 Cas13d 서열은 Cas13d 단백질 (서열번호: 14294-14321) 및 서열번호: 14322-14349, 서열번호:14322-14349, 서열번호:14350-14377, 서열번호:14378-14405, 서열번호:14406-14433, 서열번호:14434-14461, 서열번호:14462-14489, 및 서열번호:14490-14517를 갖는 그들의 최적화된 mRNA 서열이다.
유리하게는, CasX와 같은 CRISPR-연관 단백질을 암호화하는 핵산 서열, 또는 그의 상동체, 변이체, 단편 또는 유도체는 본 발명에 따른 인공 핵산의 암호화 영역 내에서 본 명세서에 정의된 UTR과 조합하여 바람직하게는 상기 암호화 된 단백질의 발현을 증가시킨다. 바람직한 실시예에서, 인공 핵산은 적어도 하나의 핵 위치 신호에 추가로 융합된 CasX 단백질, 또는 이의 상동체, 변이체 또는 단편을 암호화하는 핵산 서열을 포함하거나 이로 구성되며, 상기 핵산 서열은 바람직하게는 서열번호: 11120-11122; 11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712; 11713; 11830; 11831; 11948; 11949 중 어느 하나 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열로 정의된다.
유리하게는, 본 명세서 또는 서열 목록에 개시된 바와 같은 임의의 Cas13, CasX 또는 CasY 서열즉 상기 언급된 즉 본 명세서 및/또는 서열 목록에 개시된 바와 같은 임의의 서열, 즉 Cas13, CasX 또는 CasY 단백질 서열 및 각각의 Cas13, CasX 또는 CasY 단백질 서열 즉 WT 또는 최적화된 서열의 의 다양한 버전을 암호화하는 mRNA는 본 발명과 관련하여 CRISPR-연관 단백질로서 본 발명의 용도로 선택될 수 있다.
또한, PMID 29160308에 기재된 바와 같이 게놈 DNA에서 A?T의 G?C로의 전환을 매개하는 아데닌 염기 편집기 (adenine base editors, ABE)는 공보 PMID 29160308 자체와 함께 본 명세서에 참조로 포함된다. 저자에 따르면, ABE는 현재 Cas9 뉴클레아제 기반 방법보다 표적 외 게놈 변형이 적으며 점 돌연변이를 보다 효율적이고 깨끗하게 도입하고 인간 세포에 질병 교정 또는 질병 억제 돌연변이를 설치할 수 있다.
ARMAN 엔도뉴클레아제
또한, 배양되지 않은 미생물, 즉 ARMAN Cas9, 즉 nanoarchaea ARMAN-1 (Candidatus Micrarchaeum acidiphilum ARMAN-1) 및 ARMAN-4 (Candidatus Parvarchaeum acidiphilum ARMAN-4)로부터의 새로운 CRISPR-Cas 시스템의 사용은 본 명세서에 참조로 포함된 PMID 28005056, 20421484 및 17185602를 참고하여 본 발명의 교시 내에 포함된다.
유리하게는, CasY와 같은 CRISPR-연관 단백질을 암호화하는 핵산 서열, 또는 이의 상동체, 변이체, 단편 또는 유도체는 바람직하게는 상기 암호화된 단백질의 발현을 증가시키기 위해, 본 명세서에 정의된 UTR과 본 발명에 따른 인공 핵산의 암호화 영역 내에서 조합된다. 바람직한 실시예에서, 인공 핵산은 적어도 하나의 핵 위치 신호에 추가로 융합된 CasY 단백질을 암호화하는 핵산 서열, 또는 이의 상동체, 변이체 또는 단편을 포함하거나 이로 구성되며, 상기 핵산 서열은 바람직하게는 서열번호: 11123-11130; 11360-11366; 11242-11248; 11478-11484; 11596-11602; 11714-11720; 11832-11838; 11950-11956 중 어느 하나 또는 이의 (기능적) 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열로 정의된다.
gRNAs
본 명세서에서 논의된 바와 같이, 기능적 CRISPR-Cas 시스템은 전형적으로 CRISPR-연관 단백질을 상보적인 표적 DNA 서열에 회합하고 동원하는 가이드 RNA ("gRNA")의 존재를 필요로한다. 가이드 RNA의 구조 및 특성은 전형적으로 특정 CRISPR-연관 단백질의 선택에 의존한다.
본 명세서에서 사용되는 용어 "가이드 RNA"는 CRISPR-연관 단백질을 관심 있는 표적 DNA 서열에 표적화할 수 있는 임의의 RNA 분자에 관한 것이다. 가이드 RNA (gRNA)는 바람직하게는 i) 표적 DNA 서열과 특이적으로 혼성화할 수 있는 상보성의 제 1 영역 및 ii) CRISPR-연관 단백질과 상호작용하는 제 2 영역을 포함한다.
전형적으로 gRNA의 5' 말단에 위치하는 상기 영역은 표적 DNA 서열에 상보적인 짧은 뉴클레오티드 서열을 포함하고, 본 명세서에서 "표적화 영역"으로도 지칭된다. 용어 "영역"은 분자의 섹션/세그먼트, 예를 들어 RNA에서 뉴클레오티드의 연속 스트레치를 지칭한다. 표적화 영역은 길이가 약 17-20 개, 예를 들어 약 21-23 개의 뉴클레오티드일 수 있거나 더 길거나 더 짧을 수 있다 ("truncated gRNA"). 바람직하게는 상보적 염기쌍 (즉, 짝을 이룬 염기) 사이의 수소 결합을 통해 표적 DNA 서열과 상호 작용할 수 있다.
"gRNA"는 "표적화 영역"을 포함하고 바람직하게는 서열-특이적 방식으로 CRISPR-연관 단백질을 표적 DNA 서열로 동원할 수 있는 경우 임의의 길이일 수 있다. 따라서, "gRNA"는 적어도 10개, 적어도 11개, 적어도 12개, 보다 바람직하게는 적어도 13개, 적어도 14개, 적어도 15개, 및 가장 바람직하게는 적어도 16개 또는 적어도 17개 뉴클레오티드 또는 적어도 18개 뉴클레오티드 또는 적어도 19개 뉴클레오티드 또는 적어도 20개 뉴클레오티드 길이일 수 있다. 일부 실시예에서, “gRNA”는 바람직하게는 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개 또는 그 이상의 길이인 표적화 영역 및 ii) CRISPR-연관 단백질과 상호 작용하는 제2영역을 포함한다.
본 명세서에 사용된 용어 "gRNA"는 2-분자 gRNA뿐만 아니라 단일 분자 RNA를 포함한다. gRNA는 CRISPR-연관 단백질과 상호 작용하기 위한 2차 구조 특징을 포함하거나 포함하지 않을 수 있다.
유형 II CRISPR-Cas9 시스템은 자연적으로 2-분자 gRNA를 사용한다. 이러한 2-분자 gRNA( "tracrRNA/crRNA")는 전형적으로 crRNA ("CRISPR RNA" 또는 "타게터-RNA" 또는 "crRNA" 또는 "crRNA 반복") 및 상응하는 tracrRNA ("트랜스-작용 CRISPR RNA" 또는 "액티베이터-RNA" 또는 "tracrRNA") 분자를 포함한다. crRNA는 gRNA의 Cas9-결합 영역의 dsRNA 듀플렉스의 절반을 형성하는 뉴클레오티드의 표적화 영역 (단일 가닥) 및 스트레치 (“듀플렉스-형성 영역") 둘 다를 포함한다. 상응하는 tracrRNA는 gRNA의 Cas9-결합 영역의 dsRNA 듀플렉스의 다른 절반을 형성하는 뉴클레오티드 스트레치 (듀플렉스-형성 영역)를 포함한다. 다시 말하면, crRNA의 뉴클레오티드의 스트레치는 gRNA의 Cas9-결합 영역의 dsRNA 듀플렉스를 형성하기 위해 tracrRNA의 뉴클레오티드의 스트레치에 상보적이며 혼성화된다. 이와 같이, 각 crRNA는 상응하는 tracrRNA를 가진다고 말할 수 있다. crRNA는 단일 가닥 표적화 영역을 추가로 제공한다. 따라서, crRNA 및 (상응하는 쌍으로서) tracrRNA는 혼성화하여 gRNA를 형성한다.
crRNA 및 tracrRNA는 또한 (인공) 단일 분자 가이드 RNA ( "단일 가이드 RNA", "sgRNA")를 제공하기 위해 연결될 수 있다. "sgRNA"는 전형적으로 "루프" 서열을 통해 tracrRN의 3' 말단에서 tracrRNA의 5'말단으로 연결된 crRNA를 포함한다 (예를 들어, 미국특허출원번호 제 US20140068797 호 참조). crRNA와 유사하게, sgRNA는 전형적으로 2 차 구조, 전형적으로 스템 구조를 형성하는 염기쌍 수소 결합을 형성하는 두 번째 영역에 인접하는 표적 폴리뉴클레오티드 서열에 상보성의 표적화 영역을 포함한다. "sgRNA"는 전형적으로 ~100 뉴클레오티드 길이이지만, 상기 용어는 또한 약 17-18 nt의 절단된 단일-가이드 RNA (tru-sgRNA)를 포함한다 (Fu, Y. et. al. Nat Biotechnol. 2014 Mar;32(3):279-84 참조). 이 용어는 또한 소모성 특징이 제거된 기능적 소형 sgRNA를 포함하며, 이는 tracrRNA (crRNA가 아님)에 상응하는 sgRNA의 부분에 위치한 "넥서스 (nexus)"라 불리는 필수적이고 보존된 모듈을 유지한다 (미국특허출원번호 제 20140315985 호 및 Briner AE et al. Mol Cell. 2014 Oct 23;56(2):333-9 참조). 넥서스는 유형 II CRISPR-Cas9 시스템에서 하부 스템의 바로 하류 (즉, 3'방향으로부터 위치)에 위치한다. 용어 "sgRNA"는 또한 11-15 개 뉴클레오티드의 짧아진 표적화 영역을 포함하는 "deadRNA"("dRNA")를 포함한다. 이러한 dRNA는 DSB를 유도하지 않고 유전자 발현을 변경하기 위해 DNA 서열을 표적으로 하기 위해 촉매적으로 활성인 Cas9 엔도 뉴클레아제를 모집하는데 사용될 수 있다 (Dahlman JE et al. Nat Biotechnol. 2015 Nov;33(11):1159-61 참조). sgRNA 유도체는 또한 용어로 구성된다. 이러한 유도체는 전형적으로 새로운 또는 추가의 기능을 부여하는 추가의 부분 또는 개체를 포함한다. 특히, sgRNA 테트라루프 및/또는 스템-루프 구조에 첨가된 MS2 압타머는 상기 MS2 도메인을 포함하는 이펙터 단백질을 표적 DNA로 선택적으로 모집할 수 있다 ("sgRNA-MS2") (Konermann S et al. Nature. 2015 Jan 29; 517(7536): 583-588 참조). 본 명세서에서 추가의 수정이 또한 고려되고 예상될 수 있다.
gRNA로서 tracrRNA/crRNA 또는 sgRNA의 사용은 Cas9 단백질로 제한되지 않는다. 바람직하게는 유형 II CRISPR-Cas 시스템의 임의의 다른 CRISPR-연관 시스템이 이러한 gRNA와 관련하여 사용될 수 있다. 그러나, 다른 CRISPR-Cas 단백질의 기능성을 보장하기 위해 다른 gRNA가 필요할 수 있으며, 이러한 gRNA도 각각의 정의에 포함된다. 예를 들어, Cpf1과 같은 유형 V CRISPR-연관 단백질은 gRNA로서 단일 및 짧은 (42-44nt) crRNA에 의해 유도되며, 전형적으로 직접 반복 서열에서 단일 스템 루프를 포함한다.
tracrRNA/crRNA, sgRNA 또는 crRNA와 같은 gRNA는 임의의 적합한 수단에 의해, 예를 들어 인공 핵산 분자와 관련하여, 예를 들어 지질 또는 (다가-)양이온성 담체를 사용하여 본 명세서에 기재 된 바와 같이 네이키드 또는 복합체 형태로 제공될 수 있지만, 일반적으로 벡터에 의해 전달된다. 적합한 벡터("정의" 섹션에 정의된 바와 같이)는 바람직하게는 기능성 gRNA를 편재적으로 발현할 수 있는 (즉, 각각의 CRISPR-연관 단백질을 표적 DNA 서열로 동원할 수 있는) 임의의 핵산을 포함한다. 따라서 벡터는 플라스미드 및 바이러스 벡터, 특히 렌티바이러스 벡터 및 아데노-관련 바이러스 벡터 (AAV)를 포함한다.
RNAs
본 발명의 인공 핵산 분자는 바람직하게는 RNA일 수 있다. 용어 "RNA"는 상기 분자(즉, 그들의 RNA 서열)를 형성하기 위해 결합된 뉴클레오티드의 특이적인 연속성을 특징으로 하는 리보핵산 분자를 지칭하는 것으로 이해될 것이다. 따라서, 용어 "RNA"는 각각의 맥락에서 통상의 기술자가 쉽게 이해할 수 있는 RNA 분자 또는 RNA 서열을 지칭하기 위해 사용될 수 있다. 예를 들어, 본 발명과 관련하여 사용되는 용어 "RNA"는 바람직하게는 RNA 분자를 지칭한다(특히 상기 분자는 그의 특정 RNA 서열에 의해 특징지어진다). 서열 변형과 관련하여 용어 "RNA"는 변형된 RNA 서열과 관련이 있는 것으로 이해되지만, (그들의 RNA 서열과 관련하여 변형된) 전형적으로 생성된 RNA 분자도 포함한다. 바람직한 실시예에서, RNA는 mRNA, 바이러스 RNA 또는 레플리콘 RNA, 바람직하게는 mRNA일 수 있다.
모노-, 바이- 또는 멀티시스트로닉 RNAs
본 발명의 일부 실시예에 따르면, 인공 핵산 분자, 바람직하게는 RNA는 바람직하게는 본 명세서에 정의된 바와 같이 모노-, 바이-또는 멀티시스트로닉일 수 있다. 바이- 또는 멀티시스트로닉 RNA는 전형적으로 2개 (바이시스트로닉) 또는 그 이상 (멀티시스트로닉)의 오픈 리딩 프레임 (ORF)을 포함한다. 이러한 맥락에서 오픈 리딩 프레임은 펩티드 또는 단백질로 번역될 수 있는 코돈 서열이다. 바이- 또는 멀티시스트로닉 인공 핵산 분자, 바람직하게는 RNA에서의 암호화 서열은 바람직하게는 본 명세서에 정의된 바와 같이 별개의 단백질을 암호화한다. 바이- 또는 심지어 멀티시스트로닉 인공 핵산 분자, 바람직하게는 RNA는, 예를 들어 본 명세서에 정의된 바와 같이 적어도 2, 3, 4, 5, 6 개 또는 그 이상의 (바람직하게 다른) 단백질 (또는 이의 상동체, 변이체, 단편 또는 유도체)을 암호화할 수 있다. "두 개 또는 그 이상의 단백질을 암호화하는"이라는 용어는, 이에 제한되지는 않지만, 바이-또는 멀티시스트로닉 인공 핵산 분자, 바람직하게는 RNA가, 예를 들어 적어도 2, 3, 4, 5, 6 개 또는 그 이상 (바람직하게는)의 단백질(또는 이의 상동체, 변이체, 단편 또는 유도체)을 암호화할 수 있음을 의미할 수 있다.
일부 실시예에서, 본 명세서에 정의된 바와 같은 2 개 또는 그 이상의 CRISPR-연관 단백질, 또는 이의 상동체, 변이체, 단편 또는 유도체를 암호화하는 암호화 서열은 적어도 하나의 IRES (내부 리보솜 진입 부위)에 의해 바이- 또는 멀티시스트로닉 RNA에서 분리될 수 있다. 용어 "IRES"(내부 리보솜 진입 부위)는 번역 개시를 허용하는 RNA 서열을 지칭한다. IRES는 유일한 리보솜 결합 부위로서 기능할 수 있지만, 또한 리보솜에 의해 서로 독립적으로 번역될 몇몇 단백질 (또는 이의 상동체, 변이체, 단편 또는 유도체)을 암호화하는 바이-또는 심지어 멀티시스트로닉 인공 핵산 분자, 바람직하게는 상기 정의된 바와 같은 RNA를 제공하는 역할을 할 수 있다. 본 발명에 따라 사용될 수 있는 IRES 서열의 예는 피코르나바이러스 (예를 들어 FMDV), 페스티바이러스 (CFFV), 폴리오바이러스 (PV), 뇌심근염 바이러스 (ECMV), 구제역 바이러스 (FMDV), C형 간염 바이러스 (HCV), 돼지 콜레라 바이러스 (CSFV), 쥐 백혈병 바이러스(mouse leukoma virus, MLV), 유인원 면역 결핍 바이러스 (SIV)또는 귀뚜라미 마비 바이러스 (CrPV)로부터 유래된 것들이다.
추가의 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA의 적어도 하나의 암호화 서열은 아미노산 링커 서열과 함께 또는 아미노산 링커 서열 없이 연결된 본 명세서에 정의된 적어도 2, 3, 4, 5, 6, 7, 8 개 또는 그 이상의 CRISPR-연관 단백질 (또는 이의 상동체, 변이체, 단편 또는 유도체)을 암호화할 수 있으며, 상기 링커 서열은 강성 링커, 연성 링커, 절단 가능한 링커(예를 들어 자가-절단 펩티드) 또는 이들의 조합을 포함할 수 있다. 예시적인 링커는 "유도체" 섹션에 기재되어있다. 각각의 개시 내용은 다수의 CRISPR-연관 단백질의 연결에 준용 가능하다. 여기에서, 본 명세서에 정의된 CRISPR-연관 단백질은 동일하거나 상이하거나 이의 조합일 수 있다.
바람직하게는, 인공 핵산 분자, 바람직하게는 RNA는 약 50 내지 약 20000, 또는 약 100 내지 약20000 뉴클레오티드, 바람직하게는 약 250 내지 약 20000 뉴클레오티드, 보다 바람직하게는 약 500 내지 약 10000 뉴클레오티드, 더욱 바람직하게는 약 500 내지 약 5000의 뉴클레오티드 길이를 포함한다.
본 발명의 인공 핵산 분자, 바람직하게는 RNA는 추가로 단일 가닥 또는 이중 가닥일 수 있다. 이중 가닥 RNA로서 제공될 때, 인공 핵산 분자는 바람직하게는 전사 및 상응하는 역전사 가닥을 포함한다
핵산 변형
본 발명의 인공 핵산 분자, 바람직하게는 RNA, 또는 본 명세서에 정의된 임의의 다른 핵산 (예를 들어 벡터)은 변형된 핵산의 형태로 제공될 수 있다. 본 발명과 관련하여 예상되는 적합한 핵산 변형은 하기에 기재되어 있다. "본 명세서에 정의된 바와 같은 임의의 다른 핵산"이라는 표현은 gRNA를 지칭할 수 있지만, 전형적으로는 아니다.
바람직한 실시예에 따르면, 본 발명의 적어도 하나의 인공 핵산 분자, 바람직하게는 RNA (서열) (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 본 명세서에 정의된 바와 같이 변형된다. 본 명세서에 정의된 변형은 바람직하게는 상기 인공 핵산 분자, 바람직하게는 RNA의 안정화를 초래한다. 보다 바람직하게는, 본 발명은 "안정화된" 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)를 제공한다.
바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의 된 임의의 다른 핵산, 특히 RNA)는 "안정화된", 즉 본질적으로 생체 내 분해에 내성이 있는 인공 핵산 분자, 바람직하게는 RNA로 제공될 수 있다(예를 들어, 엑소-또는 엔도-뉴클레아제에 의해).
이러한 안정화는 예를 들어 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 변형된 인산염 백본에 의해 수행될 수 있다. 본 발명과 관련된 백본 변형은 상기 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)에 포함된 뉴클레오티드 백본의 인산염이 화학적으로 변형된 변형이다. 이러한 연결에서 바람직하게 사용될 수 있는 뉴클레오티드는 예를 들어 바람직하게는 인산염 백본에 포함된 인산염 산소 중 적어도 하나가 황 원자로 대체된 포스포로티오에이트-변형 인산염 백본을 포함한다. 안정화된 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 다른 핵산, 특히 RNA)는 예를 들어, 하전된 포스포네이트 산소는 알킬 또는 아릴기, 또는 포스포디에스테르 및 알킬포스포트리에스테르로 대체되며, 하전된 산소 잔기는 알킬화된 형태로 존재하는 알킬 및 아릴 포스포네이트와 같은 비이온성 인산염 유사체를 더 포함할 수 있다. 이러한 백본 변형은 전형적으로 메틸포스포네이트, 포스 포르아미데이트 및 포스포로티오에이트(예를 들어 시티딘-5'-O-(1-티오포스페이트))로 이루어진 군으로부터의 변형을 포함하지만, 이에 제한되지는 않는다.
이하에서, 바람직하게는 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)를 "안정화"할 수 있는 특정 변형이 기재된다.
화학적 변형
본 명세서에 사용된 용어 "변형"은 당 변형 또는 염기 변형뿐만 아니라 백본 변형을 포함하는 화학적 변형을 지칭할 수 있다.
이와 관련하여, "변형된" 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 뉴클레오티드 유사체/변형(변형된 뉴클레오티드 또는 뉴클레오시드), 예를 들어 백본 변형, 당 변형 또는 염기 변형을 포함할 수 있다.
본 발명과 관련된 백본 변형은 상기 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의 된 바와 같은 임의의 다른 핵산, 특히 RNA)에 포함된 뉴클레오티드의 백본의 인산염이 화학적으로 변형된 변형이다. 본 발명과 관련하여 당 변형은 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 뉴클레오티드의 당의 화학적 변형이다. 또한, 본 발명과 관련된 염기 변형은 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 뉴클레오티드의 염기 부분의 화학적 변형이다. 이와 관련하여, 뉴클레오티드 유사체 또는 변형은 바람직하게는 전사 및/또는 번역에 적용 가능한 뉴클레오티드 유사체로부터 선택된다.
당 변형:
(화학적으로) 변형된 핵산, 특히 본 발명에 따른 인공 핵산 분자는 당 변형, 즉 그들의 당 부분에서 변형된 뉴클레오시드/뉴클레오티드를 포함할 수 있다.
예를 들어, 2' 하이드록실기 (OH)는 다수의 상이한 "옥시"또는 "디옥시" 치환기로 변형되거나 대체 될 수 있다. "옥시"-2' 하이드록실기 변형의 예는 알콕시 또는 아릴옥시 (-OR, 예를 들어, R = H, 알킬, 사이클로알킬, 아릴, 아랄킬, 헤테로아릴 또는 당); 폴리에틸렌글리콜(PEG), -O(CH2CH2O)nCH2CH2OR; 2' 하이드록실이 예를 들어 메틸렌 브릿지에 의해 동일한 리보스 당의 4' 탄소에 연결된 “잠금” 핵산(LNA); 및 아미노기(-O- 아미노, 상기 아미노기, 예를 들어 NRR은 알킬아미노, 디알킬아미노, 헤테로시클릴, 아릴아미노, 디아릴아미노, 헤테로아릴아미노 또는 디헤테로아릴아미노, 에틸렌 디아민, 폴리아미노일 수 있다) 또는 아미노 알콕시를 포함하지만, 이에 제한되지는 않는다.
“디옥시" 변형은 수소, 아미노 (예를 들어, NH2; 알킬아미노, 디알킬아미노, 헤테로시클릴, 아릴아미노, 디아릴아미노, 헤테로아릴 아미노, 디헤테로아릴 아미노 또는 아미노산); 또는 아미노기는 링커를 통해 당에 부착될 수 있으며, 여기서 링커는 하나 또는 그 이상의 원자 C, N 및 O를 포함한다.
당 기는 또한 리보스에서 상응하는 탄소와 반대의 입체 화학 구조를 갖는 하나 또는 그 이상의 탄소를 포함할 수 있다. 따라서, 변형된 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)는 당으로서 예를 들어 아라비노스를 포함하는 뉴클레오티드를 포함할 수 있다.
백본 변형:
(화학적으로) 변형된 핵산, 특히 본 발명에 따른 인공 핵산 분자는 백본 변형, 즉 그들의 인산염 백본에서 변형된 뉴클레오시드/뉴클레오티드를 포함할 수 있다.
백본의 인산염기는 하나 또는 그 이상의 산소 원자를 상이한 치환기로 대체함으로써 변형될 수 있다. 또한, 변형된 뉴클레오시드 및 뉴클레오티드는 본 명세서에 기재된 바와 같이 변형되지 않은 인산염 부분을 변형된 인산염 부분으로 완전히 교체하는 것을 포함할 수 있다.
변형된 인산염 기의 예는 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스테르, 수소 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴포스포네이트 및 포스포트리에스테르를 포함 하나, 이에 제한되지는 않는다. 포스포로디티오에이트는 비연결 산소 모두 황으로 대체된다. 인산염 링커는 또한 연결 산소를 질소 (가교된 포스포로아미데이트), 황 (가교된 포스포로티오에이트) 및 탄소 (가교된 메틸렌포스포네이트)로 대체함으로써 변형될 수 있다.
염기 변형:
(화학적으로) 변형된 핵산, 특히 본 발명에 따른 인공 핵산 분자는 (핵-)염기 변형, 즉 핵염기 부분에서 변형된 뉴클레오시드/뉴클레오티드를 포함할 수 있다.
RNA에서 발견되는 핵염기의 예는 아데닌, 구아닌, 시토신 및 우라실을 포함하지만 이에 제한되지는 않는다. 예를 들어, 본 명세서에 기재된 뉴클레오시드 및 뉴클레오티드는 큰 홈(major groove) 표면에서 화학적으로 변형될 수 있다. 일부 실시예에서, 큰 홈의 화학적 변형은 아미노기, 티올 기, 알킬기 또는 할로기를 포함할 수 있다.
일부 실시예에서, 뉴클레오티드 유사체/변형은 바람직하게는 2-아미노-6-클로로퓨린리보사이드-5'-트리포스페이트, 2-아미노퓨린-리보사이드-5'-트리포스페이트; 2-아미노아데노신-5'-트리포스페이트, 2'-아미노-2'-디옥시시티딘-트리포스페이트, 2-티오시티딘-5' 트리포스페이트, 2- 티오우리딘-5'-트리포스페이트, 2'-플루오로티미딘-5'-트리포스페이트, 2'-O-메틸-이노신-5'-트리포스페이트 4-티오우리딘-5'-트리포스페이트, 5-아미노알릴시티딘-5'-트리포스페이트,5-아미노알릴우리딘-5'-트리포스페이트, 5-브로모시티딘-5'-트리포스페이트, 5-브로모우리딘-5'-트리포스페이트, 5-브로모-2'-디옥시시티딘-5'-트리포스페이트, 5-브로모-2'-디옥시우리딘-5'-트리포스페이트, 5-요오드시티딘-5'-트리포스페이트, 5-요오드-2'-디옥시시티딘-5'-트리 포스페이트, 5-요오드우리딘-5'-트리포스페이트, 5-요오드-2'-디옥시우리딘-5'-트리포스페이트, 5-메틸시티딘-5'-트리포스페이트, 5-메틸우리딘-5'-트리포스페이트, 5-프로피닐-2'-디옥시시티딘-5'-트리포스페이트, 5-프로피닐-2'-디옥시우리딘-5'-트리포스페이트, 6-아자시티딘-5'-트리포스페이트, 6-아자우리딘-5'-트리포스페이트, 6-클로로퓨린리보사이드-5'-트리포스페이트, 7-데자아데노신-5'-트리포스페이트, 7-데자구 아노신-5'-트리포스페이트, 8-아자아데노신-5'-트리포스페이트, 8-아지도아데노신-5'-트리포스페이트, 벤즈이미다졸-리보사이드-5'-트리포스페이트, N1-메틸아데노신-5'-트리포스페이트, N1-메틸구아노 신-5'-트리포스페이트, N6-메틸아데노신-5'-트리포스페이트, O6-메틸구아노신-5'-트리포스페이트, 수도우리딘-5'-트리포스페이트, 또는 퓨로마이신-5'-트리포스페이트, 크산토신-5'-트리포스페이트로부터 선택되는 염기 변형으로부터 선택된다. 5-메틸시티딘-5'-트리포스페이트, 7-데자구아노신-5'-트리포스페이트, 5-브로모시티딘-5'-트리포스페이트 및 수도우리딘-5'-트리포스페이트로 구성된 염기 변형된 뉴클레오티드 그룹으로부터 선택된 염기 변형을 위한 뉴클레오티드가 특히 바람직하다.
일부 실시예에서, 변형된 뉴클레오시드는 피리딘-4-온 리보뉴클레오시드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오수도우리딘, 2-티오수도우리딘, 5-하이드록시우리딘, 3-메틸우리 딘, 5-카르복시메틸-우리딘, 1-카르복시메틸수도우리딘, 5-프로피닐-우리딘, 1-프로피닐-수도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸수도우리딘, 5-타우리노메틸-2-티오-우리딘, 1-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸수도우리딘, 4-티오-1-메틸-수도우리딘, 2-티오-1-메틸-수도우리딘, 1-메틸-1-데자-수도우리딘, 2-티오-1-메틸-1-데자-수도우리딘, 디하이드로우리딘, 디하이드로수도우리딘, 2-티오-디하이드로우리딘, 2-티오-디하이드로수도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시수도우리딘, 및 4-메톡시-2-티오-수도우리딘을 포함한다.
일부 실시예에서, 변형된 뉴클레오시드는 5-아자-시티딘, 수도이소시티딘, 3-메틸-시티딘, N4-아세틸시티딘, 5-포밀시티딘, N4-메틸시티딘, 5-하이드록시메틸시티딘, 1-메틸수도이소시티딘, 피롤로-시티딘, 피롤로-수도이소시티딘, 2-티오-시티딘, 2-티오-5-메틸-시티딘, 4-티오-수도이소시티딘, 4-티오-1-메틸-수도이소시티딘, 4-티오-1-메틸-1-데자-수도이소시티딘, 1-메틸-1-데자-수도이소시티 딘, 제불라린, 5-아자-제불라린, 5-메틸-제불라린, 5-아자-2-티오-제불라린, 2-티오-제불라린, 2-메톡시시티딘, 2-메톡시-5-메틸-시티딘, 4-메톡시수도이소시티딘, 및 4-메톡시-1-메틸-수도이소시티딘을 포함한다.
다른 실시예에서, 변형된 뉴클레오시드는 2-아미노 퓨린, 2,6-디아미노퓨린, 7- 데자-아데닌, 7-데자-8-아자-아데닌, 7-데자-2-아미노퓨린, 7-데자-8-아자-2-아미노퓨린, 7-데자-2,6-디아미노퓨린, 7-데자-8-아자-2,6-디아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-이소펜테닐아데노신, N6-(시스-하이드록시이소펜테닐)아데노신, 2-메틸티오-N6-(시스-하이드록시이소펜테닐)아데노신, N6-글리시닐카르바모일아데노신, N6-트레오닐카르바모일아데노신, 2-메틸티오-N6-트레오닐카르바모일아데노신, N6,N6-디메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌, 및 2-메톡시-아데닌을 포함한다.
다른 실시예에서, 변형된 뉴클레오시드는 이노신, 1-메틸-이노신, 와이오신, 와이부토신, 7-데자-구아노신, 7-데자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-데자-구아노신, 6-티오-7-데자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸이노신, 6-메톡시-구아노신, 1-메틸구아노 신, N2-메틸구아노신, N2,N2-디메틸구아노신, 8-옥소구아노신, 7-메틸-8-옥소-구아노신, 1-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신, 및 N2,N2-디메틸-6-티오-구아노신을 포함한다.
일부 실시예에서, 뉴클레오티드는 큰 홈 표면에서 변형될 수 있고 우라실의 C-5상의 수소를 메틸 기 또는 할로기로 대체하는 것을 포함할 수 있다. 특정 실시예에서, 변형된 뉴클레오시드는 5'-O- (1-티오포스페이트)-아데노신, 5'-O-(1-티오포스페이트)-시티딘, 5'-O-(1-티오포스페이트)-구아노신, 5'-O-(1-티오포스페이트)-우리딘 또는 5'-O-(1-티오포스페이트)-수도우리딘이다.
일부 실시예에서, 본 발명의 변형된 RNA (또는 본 명세서에 정의된 바와 같은 임의의 변형된 다른 핵산, 특히 RNA)는 6-아자-시티딘, 2-티오-시티딘, α-티오-시티딘, 수도-이소-시티딘, 5-아미노알릴-우리딘, 5-요오드-우리딘, N1-메틸-수도우리딘, 5,6-디하이드로우리딘, α-티오우리딘, 4 -티오-우리 딘, 6-아자-우리딘, 5-하이드록시-우리딘, 디옥시-티미딘, 5-메틸-우리딘, 피롤로-시티딘, 이노신, α- 티오-구아노신, 6-메틸-구아노신, 5-메틸-시티딘, 8-옥소-구아노신, 7-데자-구아노신, N1-메틸-아데노신, 2-아미노-6-클로로-퓨린, N6-메틸-2-아미노-퓨린, 수도-이소-시티딘, 6-클로로-퓨린, N6-메틸-아데노신, α-티오-아데노신, 8-아지도-아데노신, 7-데자-아데노신으로부터 선택된 뉴클레오시드 변형을 포함할 수 있다.
일부 실시예에서, 변형된 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)는 본 명세서에 기재된 바와 같은 화학적 변형 중 어느 것도 포함하지 않는다. 그럼에도 불구하고, 이러한 변형된 인공 핵산은 하기 기재된 바와 같은 지질 변형 또는 서열 변형을 포함할 수 있다.
지질 변형
추가의 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 적어도 하나의 지질 변형을 포함한다.
이러한 본 발명의 지질-변형 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 기재된 상기 다른 핵산, 특히 RNA)는 전형적으로 (i) 인공 핵산 분자, 바람직하게는 본 명세서에 정의된 바와 같은 RNA (또는 상기 핵산 , 특히 RNA), (ii) 상기 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)와 공유 결합된 적어도 하나의 링커, 및 (iii) 각각의 링커와 공유 결합된 적어도 하나의 지질을 포함한다.
대안적으로, 지질-변형 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서 정의된 바와 같은 다른 핵산)는 적어도 하나의 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA) 및 상기 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)와 (링커 없이) 공유 결합된 적어도 하나의 (이 작용성) 지질을 포함한다.
대안적으로, 지질-변형 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 (i) 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA), (ii) 상기 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)와 공유 결합된 적어도 하나의 링커, 및 (iii) 각각의 링커와 공유 결합된 적어도 하나의 지질, 및 iv) 상기 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)와 (링커 없이) 공유 결합된 적어도 하나의 (이 작용성) 지질을 포함한다.
이와 관련하여, 지질 변형은 선형 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)의 말단에 존재하는 것이 특히 바람직하다.
서열 변형
바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA, 바람직하게는 mRNA, 또는 본 명세서에 정의된 임의의 다른 핵산은 "서열-변형된", 즉, 후술되는 바와 같은 적어도 하나의 서열 변형을 포함한다. 특정 이론에 구속되지 않고, 이러한 서열 변형은 본 발명의 인공 핵산 분자, 바람직하게는 RNA의 안정성을 증가시키고/시키거나 발현을 향상시킬 수 있다.
G/C 함량 변형
바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA, 보다 바람직하게는 mRNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 그의 구아노신/시토신(G/C) 함량을 변형시킴으로써, 바람직하게는 적어도 하나의 암호화 서열의 G/C 함량을 변형시킴으로써 변형될 수 있고 따라서 안정화될 수 있다. 다시 말해, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA) 및 바람직하게는 이의 서열은 G/C 변형될 수 있다.
"G/C-변형된" 핵산 (바람직하게는 RNA) 서열은 전형적으로 변형된 야생형 핵산 (바람직하게는 RNA) 서열에 기초하고 상기 야생형 핵산 (바람직하게는 RNA) 서열과 비교하여 변경된 수의 구아노신 및/또는 시토신 뉴클레오티드를 포함하는 핵산 (바람직하게는 RNA) 서열을 포함하는 핵산 (바람직하게는 RNA)을 지칭한다. 이러한 변경된 수의 G/C 뉴클레오티드는 구아노신 또는 시토신 뉴클레오티드를 포함하는 "동의" 코돈에 의해 아데노신 또는 티미딘 뉴클레오티드를 포함하는 코돈을 대체함으로써 생성될 수 있다. 따라서, 코돈 치환은 바람직하게는 암호화된 아미노산 잔기를 변경시키지 않지만, 핵산 (바람직하게는 RNA)의 G/C 함량을 독점적으로 변경시킨다.
본 발명의 특히 바람직한 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 암호화 서열의 G/C 함량은 각각의 야생형, 즉 변형되지 않은 핵산의 암호화 서열의 G/C 함량과 비교하여 변형, 특히 증가된다. 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)에 의해 암호화된 아미노산 서열은 바람직하게는 각각의 야생형 핵산, 바람직하게는 RNA에 의해 암호화된 아미노산 서열과 비교하여 변형되지 않는다.
본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)의 이러한 변형은 번역될 임의의 RNA (또는 다른 핵산) 영역의 서열이 상기 RNA (또는 상기 다른 핵산)의 효율적인 번역을 위해 중요하다는 사실에 기초한다. 따라서, RNA (또는 상기 다른 핵산)의 조성 및 다양한 뉴클레오티드의 서열이 중요하다. 특히, 증가된 G (구아노신)/C (시토신) 함량을 갖는 서열은 증가된 A (아데노신)/U (우라실) 함량을 갖는 서열보다 더 안정적이다.
본 발명에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)의 코돈은 증가된 양의 G/C 뉴클레오티드를 포함하도록 번역된 아미노산 서열을 유지하면서 각각의 야생형 핵산, 바람직하게는 RNA (또는 상기 다른 핵산)와 비교하여 변화된다.
여러 코돈이 하나의 동일한 아미노산 (소위 유전자 코드의 변성)을 암호화한다는 사실과 관련하여, 안정성에 가장 유리한 코돈이 결정될 수 있다 (소위 대체 코돈 사용). 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)에 의해 암호화될 아미노산에 따라, 그의 야생형 서열과 비교하여 핵산 서열을 변형시킬 다양한 가능성이 존재한다. 독점적으로 G 또는 C 뉴클레오티드를 포함하는 코돈에 의해 암호화되는 아미노산의 경우, 코돈의 변형이 필요하지 않다.
따라서, A 또는 U가 존재하지 않기 때문에, Pro (CCC 또는 CCG), Arg (CGC 또는 CGG), Ala (GCC 또는 GCG) 및 Gly (GGC 또는 GGG)에 대한 코돈은 변형이 필요하지 않다. 대조적으로, A 및/또는 U 뉴클레오티드를 포함하는 코돈은 동일한 아미노산을 암호화하지만 A 및/또는 U를 포함하지 않는 다른 코돈의 치환에 의해 변형될 수 있다. 이들의 예는 다음과 같다 : Pro에 대한 코돈은 CCU 또는 CCA에서 CCC 또는 CCG로 변형될 수 있고; Arg에 대한 코돈은 CGU 또는 CGA 또는 AGA 또는 AGG에서 CGC 또는 CGG로 변형될 수 있고; Ala에 대한 코돈은 GCU 또는 GCA에서 GCC 또는 GCG로 변형될 수 있고; Gly의 코돈은 GGU 또는 GGA에서 GGC 또는 GGG로 변형될 수 있다. 다른 경우에, A 또는 U 뉴클레오티드는 코돈으로부터 제거될 수 없지만, 더 적은 함량의 A 및/또는 U 뉴클레오티드를 포함하는 코돈을 사용함으로써 A 및 U 함량을 감소시킬 수 있다. 이들의 예는 다음과 같다 : Phe에 대한 코돈은 UUU에서 UUC로 변형 될 수 있고; Leu에 대한 코돈은 UUA, UUG, CUU 또는 CUA에서 CUC 또는 CUG로 변형될 수 있고; Ser에 대한 코돈은 UCU 또는 UCA 또는 AGU에서 UCC, UCG 또는 AGC로 변형될 수 있고; Tyr에 대한 코돈은 UAU에서 UAC로 변형될 수 있고; Cys에 대한 코돈은 UGU에서 UGC로 변형될 수 있고; His의 코돈은 CAU에서 CAC로 변형될 수 있고; Gln에 대한 코돈은 CAA에서 CAG로 변형될 수 있고; Ile에 대한 코돈은 AUU 또는 AUA에서 AUC로 변형될 수 있고; Thr에 대한 코돈은 ACU 또는 ACA에서 ACC 또는 ACG로 변형될 수 있고; Asn에 대한 코돈은 AAU에서 AAC로 변형될 수 있고; Lys에 대한 코돈은 AAA에서 AAG로 변형될 수 있고; Val에 대한 코돈은 GUU 또는 GUA에서 GUC 또는 GUG로 변형될 수 있고; Asp에 대한 코돈은 GAU에서 GAC로 변형될 수 있고; Glu에 대한 코돈은 GAA에서 GAG로 변형될 수 있고; 정지 코돈 UAA는 UAG 또는 UGA로 변형될 수 있다. 한편, Met (AUG) 및 Trp (UGG)에 대한 코돈의 경우, 서열 변형 가능성은 없다. 상기 열거된 치환은 특정 야생형 핵산 서열 (즉, 원래 서열)과 비교하여 본 발명의 인공 핵산 서열, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산 서열) 서열의 G/C 함량을 증가시키기 위해 개별적으로 또는 모든 가능한 조합으로 사용될 수 있다. 따라서, 예를 들어, 야생형 서열에서 발생하는 Thr에 대한 모든 코돈은 ACC (또는 ACG)로 변형될 수 있다. 그러나 바람직하게는, 예를 들어 상기 치환 가능성의 조합이 사용된다:
원래 서열 (야생형 RNA)에서 Thr을 암호화하는 모든 코돈의 ACC (또는 ACG) 로의 치환 및
Ser을 원래 암호화하는 모든 코돈의 UCC (또는 UCG 또는 AGC)로의 치환; 원래 서열에서 Ile을 암호화하는 모든 코돈의 AUC로의 치환 및
Lys를 원래 암호화하는 모든 코돈의 AAG로의 치환 및
Tyr을 원래 암호화하는 모든 코돈의 UAC로의 치환; 원래 서열에서 Val을 암호화하는 모든 코돈의 GUC (또는 GUG)로의 치환
Glu를 원래 암호화하는 모든 코돈의 GAG로의 치환 및
Ala를 원래 암호화하는 모든 코돈의 GCC (또는 GCG)로의 치환 및
Arg를 원래 암호화하는 모든 코돈의 CGC (또는 CGG)로의 치환; 원래 서열에서 Val을 암호화하는 모든 코돈의 GUC (또는 GUG)로의 치환 및
Glu를 원래 암호화하는 모든 코돈의 GAG로의 치환 및
Ala를 원래 암호화하는 모든 코돈의 GCC (또는 GCG)로의 치환 및
Gly를 원래 암호화하는 모든 코돈의 GGC (또는 GGG)로의 치환 및
Asn을 원래 암호화하는 모든 코돈의 AAC로의 치환; 원래 서열에서 Val을 암호화하는 모든 코돈의 GUC (또는 GUG)로의 치환 및
Phe를 원래 암호화하는 모든 코돈의 UUC로의 치환 및
Cys를 원래 암호화하는 모든 코돈의 UGC로의 치환 및
Leu를 원래 암호화하는 모든 코돈의 CUG (또는 CUC)로의 치환 및
Gln을 원래 암호화하는 모든 코돈의 CAG로의 치환 및
Pro를 원래 암호화하는 모든 코돈의 CCC (또는 CCG)로의 치환; 등.
바람직하게는, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 암호화 서열의 G/C 함량은 본 명세서에 정의된 적어도 하나의 단백질을 암호화하는 야생형 핵산, 바람직하게는 RNA(또는 상기 다른 핵산, 특히 RNA)의 암호화 서열의 G/C 함량과 비교하여 적어도 7 %, 더 바람직하게는 적어도 15 %, 특히 바람직하게는 적어도 20 % 증가된다.
바람직한 실시예에 따르면, 본 명세서에서 정의된 CRISPR-연관 단백질, 또는 상동체, 변이체, 단편또는 유도체를 암호화하는 영역에서 치환 가능한 코돈의 적어도 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 더욱 바람직하게는 적어도 70 %, 더욱 더 바람직하게는 적어도 80 % 및 가장 바람직하게는 적어도 90 %, 95 % 또는 심지어 100% 또는 야생형 RNA 서열의 전체 서열이 치환되어, 상기 서열의 G/C 함량을 증가시킨다.
이와 관련하여, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)의 적어도 하나의 암호화 서열의 G/C 함량을 야생형 서열과 비교하여 최대로(즉, 치환 가능한 코돈의 100%) 증가시키는 것이 특히 바람직하다.
본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)의 추가의 바람직한 변형은 번역 효율이 또한 세포에서 tRNA의 발생에서 상이한 빈도로 결정된다는 발견에 기초한다. 따라서, 소위 "희귀 코돈"이 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)에 증가된 정도로 존재하는 경우, 상응하는 변형된 RNA (또는 상기 다른 핵산, 특히 RNA) 서열은 상대적으로 “빈번한” tRNA를 암호화하는 코돈이 존재하는 경우보다 현저하게 열악한 정도로 번역된다.
일부 바람직한 실시예에서, 본 명세서에 정의된 변형된 인공 핵산 분자, 바람직하게는 RNA (또는 임의의 다른 핵산)에서, 단백질을 암호화하는 영역은 야생형 핵산, 바람직하게는 RNA의 상응하는 영역에 비해 변형되어 세포에 비교적 드문 tRNA를 암호화하는 야생형 서열의 적어도 하나의 코돈은 세포에서 비교적 빈번한 tRNA를 암호화하고 상대적으로 드문 tRNA와 동일한 아미노산을 운반하는 tRNA를 암호화하는 코돈과 교환된다.
이에 의해, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 서열은 자주 발생하는 tRNA가 이용 가능한 코돈이 삽입되도록 변형된다. 다시 말해서, 본 발명에 따르면, 이러한 변형에 의해, 세포에서 비교적 드문 tRNA를 암호화하는 야생형 서열의 모든 코돈은 각각의 경우에 세포에서 비교적 빈번한 tRNA를 암호화하고 각각의 경우에 비교적 드문 tRNA와 동일한 아미노산을 운반하는 코돈으로 교환될 수 있다. 어떤 tRNA가 세포에서 비교적 빈번하게 발생하고 대조적으로 비교적 드물게 발생하는지는 본 발명이 속하는 기술 분야에서 통상의 기술자에게 공지되어 있다; 참조. 예를 들어 Akashi, Curr. Opin. Genet. Dev. 2001, 11(6): 660-666. 특정 아미노산에 가장 빈번하게 발생하는 tRNA, 예를 들어 (인간) 세포에서 가장 빈번하게 발생하는 tRNA를 사용하는 Gly 코돈을 사용하는 코돈이 특히 바람직하다.
본 발명에 따르면, 본 발명의 변형된 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)에서 증가된, 특히 최대화된 순차적 G/C 함량을 상기 인공 핵산 분자, 바람직하게는 RNA의 암호화 서열에 의해 암호화된 아미노산 서열을 변형시키지 않고 “빈번한” 코돈과 연결하는 것이 특히 바람직하다. 이러한 바람직한 실시예는 특히 효율적으로 번역되고 안정화된 (변형된) 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)의 제공을 허용한다.
상기 기재된 바와 같이 변형된 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산)의 결정 (증가된 G/C 함량; tRNA의 교환)은 WO 02/098443에 설명된 컴퓨터 프로그램을 사용하여 수행될 수 있으며, 이 개시 내용은 본 발명의 전체 범위에 포함된다. 이 컴퓨터 프로그램을 사용하여, 임의의 원하는 핵산, 특히 RNA의 뉴클레오티드 서열은 최대 G/C 함량이 세포에서 가능한 한 자주 발생하는 tRNA를 암호화하는 코돈의 사용과 결합하여 바람직하게는 비변형 서열과 비교하여 변형되지 않는 변형된 핵산, 특히 RNA에 의해 암호화된 아미노산 서열을 초래하도록 하는 유전자 코드 또는 이의 퇴행적 특성을 이용하여 변형될 수 있다.
대안적으로, 원래의 서열과 비교하여 G/C 함량 또는 코돈 용법만을 수정할 수도 있다. Visual Basic 6.0의 소스 코드 (사용된 개발 환경: Microsoft Visual Studio Enterprise 6.0 with Servicepack 3)도 WO 02/098443에 설명되어 있다.
A/U 함량 변형
본 발명의 추가의 바람직한 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 리보솜 결합 부위의 환경에서 A/U 함량은 각각의 야생형 핵산, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)의 리보섬 결합 부위의 환경에서 A/U 함량과 비교하여 증가된다.
이러한 변형 (리보솜 결합 부위 주위의 증가된 A/U 함량)은 상기 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)에 대한 리보솜 결합 효율을 증가시킨다. 리보솜 결합 부위 (Kozak 서열)에 대한 리보솜의 효과적인 결합은 차례로 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 효율적인 번역의 효과를 갖는다.
DSE 변형
본 발명의 추가의 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 잠재적으로 불안정화되는 서열 요소와 관련하여 변형될 수 있다. 특히, 상기 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)의 암호화 서열 및/또는 5' 및/또는 3' 비번역 영역은 각각의 야생형 핵산, 바람직하게는 RNA(또는 상기 다른 야생형 핵산)와 비교하여 불안정화 서열 요소를 함유하지 않으며, 변형된 인공 핵산 분자, 바람직하게는 RNA의 암호화된 아미노산 서열이 바람직하게는 각각의 야생형 핵산, 바람직하게는 RNA (또는 상기 다른 야생형 핵산)과 비교하여 변형되지 않도록 변형될 수 있다.
예를 들어, 진핵 생물 RNA의 서열에서, 신호 단백질이 결합하고 생체 내에서 RNA의 효소에 의한 분해를 조절하는 불안정화 서열 요소 (DSE)가 발생하는 것으로 알려져 있다. 본 명세서에 정의된 바와 같은 CRISPR-연관 단백질 또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산을 암호화하는 영역에서 선택적으로 변형된 인공 핵산 분자, 바람직하게는 RNA의 추가적인 안정화를 위해, 따라서 야생형 핵산, 바람직하게는 RNA의 상응하는 영역과 비교하여 하나 또는 그 이상의 변형이 수행될 수 있어서, 불안정화 서열 요소가 포함되지 않거나 실질적으로 포함되지 않는다.
본 발명에 따르면, 비번역 영역 (3'- 및/또는 5'-UTR)에 존재하는 DSE는 또한 이러한 변형에 의해인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)로부터 제거될 수 있다. 이러한 불안정화 서열은 예를 들어 수많은 불안정한 RNA의 3'-UTR 섹션에서 발생하는 AU-풍부 서열 (AURES)이다 (Caput et al., Proc. Natl. Acad. Sci. USA 1986, 83: 1670 to 1674). 따라서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 바람직하게는 각각의 야생형 핵산, 바람직하게는 RNA (또는 상기 각각의 다른 야생형 핵산)과 비교하여 상기 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)는 이러한 불안정화 서열을 포함하지 않도록 변형된다. 이는 또한 가능한 엔도뉴클레아제, 예를 들어 트랜스페린 수용체를 암호화하는 유전자의 3'-UTR 세그먼트에 포함된 서열 GAACAAG에 의해 인식되는 서열 모티프에 적용된다 (Binder et al., EMBO J. 1994, 13: 1969 to 1980). 이들 서열 모티프는 바람직하게는 상기 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)로부터 제거된다.
인간 코돈 사용에 적합한 서열:
본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 추가의 바람직한 변형은 동일한 아미노산을 암호화하는 코돈이 전형적으로 상이한 빈도로 발생한다는 발견에 기초한다. 추가의 바람직한 실시예에 따르면, 변형된 인공 핵산 분자, 바람직하게는 RNA(또는 상기 다른 핵산, 특히 RNA)에서, 암호화 서열은 각각의 야생형 핵산 서열, 바람직하게는 RNA(또는 상기 다른 야생형 핵산)의 상응하는 영역과 비교하여 동일한 아미노산을 암호화하는 코돈의 빈도가 예를 들어 표 4에 도시된 바와 같이 인간 코돈 사용에 따라 그 코돈의 자연 발생 빈도에 상응하도록 변형된다.
예를 들어, 본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)의 적어도 하나의 암호화 서열에 의해 암호화된 아미노산 서열에 존재하는 아미노산 알라닌 (Ala)의 경우, 야생형 암호화 서열은 바람직하게는 코돈 "GCC"가 0.40의 빈도로 사용되고 코돈 "GCT"가 0.28의 빈도로 사용되고, 코돈 "GCA"가 0.22의 빈도로 사용되며 코돈 "GCG"는 0.10의 빈도 등으로 사용되는 방식으로 적응된다(표 4 참조).
인간 코돈 이용 표
아미노산 코돈 분수 /1000 아미노산 코돈 분수 /1000
Ala GCG 0.10 7.4 Pro CCG 0.11 6.9
Ala GCA 0.22 15.8 Pro CCA 0.27 16.9
Ala GCT 0.28 18.5 Pro CCT 0.29 17.5
Ala GCC* 0.40 27.7 Pro CCC* 0.33 19.8
Cys TGT 0.42 10.6 Gln CAG* 0.73 34.2
Cys TGC* 0.58 12.6 Gln CAA 0.27 12.3
Asp GAT 0.44 21.8 Arg AGG 0.22 12.0
Asp GAC* 0.56 25.1 Arg AGA* 0.21 12.1
Glu GAG* 0.59 39.6 Arg CGG 0.19 11.4
Glu GAA 0.41 29.0 Arg CGA 0.10 6.2
Phe TTT 0.43 17.6 Arg CGT 0.09 4.5
Phe TTC* 0.57 20.3 Arg CGC 0.19 10.4
Gly GGG 0.23 16.5 Ser AGT 0.14 12.1
Gly GGA 0.26 16.5 Ser AGC* 0.25 19.5
Gly GGT 0.18 10.8 Ser TCG 0.06 4.4
Gly GGC* 0.33 22.2 Ser TCA 0.15 12.2
His CAT 0.41 10.9 Ser TCT 0.18 15.2
His CAC* 0.59 15.1 Ser TCC 0.23 17.7
Ile ATA 0.14 7.5 Thr ACG 0.12 6.1
Ile ATT 0.35 16.0 Thr ACA 0.27 15.1
Ile ATC* 0.52 20.8 Thr ACT 0.23 13.1
Lys AAG* 0.60 31.9 Thr ACC* 0.38 18.9
Lys AAA 0.40 24.4 Val GTG* 0.48 28.1
Leu TTG 0.12 12.9 Val GTA 0.10 7.1
Leu TTA 0.06 7.7 Val GTT 0.17 11.0
Leu CTG* 0.43 39.6 Val GTC 0.25 14.5
Leu CTA 0.07 7.2 Trp TGG* 1 13.2
Leu CTT 0.12 13.2 Tyr TAT 0.42 12.2
Leu CTC 0.20 19.6 Tyr TAC* 0.58 15.3
Met ATG* 1 22.0 Stop TGA* 0.61 1.6
Asn AAT 0.44 17.0 Stop TAG 0.17 0.8
Asn AAC* 0.56 19.1 Stop TAA 0.22 1.0
*: 가장 빈번한 코돈
코돈-최적화 서열:
전술한 바와 같이, 본 발명에 따르면, 세포에서 비교적 드문 tRNA를 암호화하는 야생형 서열의 모든 코돈은 각각의 경우에 비교적 드문 tRNA와 동일한 아미노산을 운반하며 세포에 비교적 빈번한 tRNA를 암호화하는 코돈으로 교환된다.
따라서, 가장 빈번한 코돈이 각각의 암호화된 아미노산에 사용되는 것이 특히 바람직하다(표 4 참조, 가장 빈번한 코돈은 별표로 표시됨). 이러한 최적화 과정은 코돈 적응 지수(codon adaptation index, CAI)를 증가시키고 궁극적으로 CAI를 최적화한다. 본 발명과 관련하여, 증가 또는 최대화된 CAI를 갖는 서열은 전형적으로 “코돈-최적화” 서열 및/또는 CAI 증가 및/또는 최대화된 서열로 지칭된다. 바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)는 적어도 하나의 암호화 서열을 포함하며, 상기 암호화 서열은 본 명세서에 기재된 바와 같이 코돈-최적화된다. 보다 바람직하게는, 적어도 하나의 암호화 서열의 코돈 적응 지수(CAI)는 적어도 0.5, 적어도 0.8, 적어도 0.9 또는 적어도 0.95이다. 가장 바람직하게는, 적어도 하나의 암호화 서열의 코돈 적응 지수(CAI)는 1이다.
예를 들어, 본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)의 적어도 하나의 암호화 서열에 의해 암호화된 아미노산 서열에 존재하는 아미노산 알라닌(alanine, Ala)의 경우, 야생형 암호화 서열은 가장 빈번한 인간 코돈 "GCC"가 상기 아미노산에 항상 사용되는 방식으로 조정되며, 또는 아미노산 시스테인(cysteine, Cys)의 경우, 야생형 서열은 가장 빈번한 인간 코돈 "TGC"가 상기 아미노산 등에 항상 사용되는 방식으로 조정된다.
C-최적화된 서열:
바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의 된 임의의 다른 핵산, 특히 RNA)는 특히 적어도 하나의 암호화 서열에서 상기 인공 핵산, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)의 시토신(C) 함량을 변경, 바람직하게 증가시킴으로써 변형된다.
바람직한 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의 된 임의의 다른 핵산, 특히 RNA)의 암호화 서열의 C 함량은 각각의 야생형 (변형되지 않은) 핵산의 암호화 서열의 C 함량과 비교하여 변형, 바람직하게는 증가된다. 본 발명의 인공 핵산 분자, 바람직하게는 RNA의 적어도 하나의 암호화 서열에 의해 암호화된 아미노산 서열은 바람직하게는 각각의 야생형 핵산, 바람직하게는 RNA(또는 각각의 다른 야생형 핵산)에 의해 암호화된 아미노산 서열과 비교하여 변형되지 않는다.
바람직한 실시예에서, 상기 변형된 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70% 또는 80%이 되도록 변형되거나, 또는 이론적으로 가능한 최대 시토신-함량의 90% 또는 심지어 최대 시토신-함량이 되도록 달성된다.
추가의 바람직한 실시예에서, "시토신 함량 최적화 가능"한 야생형 핵산, 바람직하게는 RNA 서열의 코돈의 적어도 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 % 또는 심지어 100 %은 야생형 서열에 존재하는 것보다 더 높은 시토신-함량을 갖는 코돈으로 대체된다.
추가의 바람직한 실시예에서, 야생형 암호화 서열의 일부 코돈은 추가로 변형될 수 있고, 비교적 빈번한 tRNA에 대한 치환된 코돈이 원래 야생형 코돈의 비교적 드문 tRNA와 동일한 아미노산을 보유한다면 세포에서 비교적 드문 tRNA에 대한 코돈이 세포에서 비교적 빈번한 tRNA에 대한 코돈으로 대체될 수 있다. 바람직하게는, 비교적 드문 tRNA에 대한 모든 코돈은 시토신을 포함하지 않는 코돈에 의해 배타적으로 암호화되는 아미노산을 암호화하는 코돈을 제외하거나 각각 동일한 수의 시토신을 포함하는 2개의 코돈에 의해 암호화되는 글루타민 (Gln)을 제외하고 세포에서 비교적 빈번한 tRNA에 대한 코돈으로 대체된다.
본 발명의 추가의 바람직한 실시예에서, 변형된 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)는 아미노산 서열이 변하지 않은 채로 존재하는 세포의 상대적으로 빈번한 tRNA를 암호화하는 코돈에 의해 이론적으로 가능한 최대 시토신 함량의 적어도 80 %, 또는 적어도 90 % 또는 심지어 최대 시토신 함량이 달성되도록 변형된다.
유전적 코드의 자연적으로 발생하는 퇴화로 인해 적어도 하나의 코돈이 특정 아미노산을 암호화할 수 있다. 따라서, 20개의 자연적으로 발생하는 아미노산 중 18개는 적어도 하나의 코돈(Tryp 및 Met은 예외), 예를 들어 2개의 코돈(예 : Cys, Asp, Glu), 3개의 코돈(예 : Ile), 4개의 코돈(예 : Al, Gly, Pro), 또는 6개의 코돈(예 : Leu, Arg, Ser)에 의해 암호화된다. 그러나 동일한 아미노산을 암호화하는 모든 코돈이 생체 내 조건 하에서 동일한 빈도로 사용되는 것은 아니다. 각 단일 유기체에 따라, 전형적인 코돈 사용 프로필이 설정된다.
본 발명과 관련하여, 사용되는 용어 '시토신 함량-최적화 코돈(cytosine content-optimizable codon)은 동일한 아미노산을 암호화하는 다른 코돈보다 시토신 함량이 낮은 코돈을 지칭한다. 따라서, 동일한 아미노산을 암호화하고 그 코돈 내에 더 많은 수의 시토신을 나타내는 다른 코돈으로 대체될 수 있는 임의의 야생형 코돈은 시토신-최적화 (C-최적화, C-optimizable)인 것으로 간주된다. 야생형 암호화 서열 내에서 특정한 C-최적화 코돈에 의한 C-최적화 야생형 코돈의 임의의 이러한 치환은 그의 전체 C-함량을 증가시키고 C-풍부화된 변형 RNA 서열을 반영한다.
일부 바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의 된 바와 같은 임의의 다른 핵산, 특히 RNA) 및 특히 그의 적어도 하나의 암호화 서열은 잠재적으로 C-최적화 가능한 모든 코돈에 대한 C-최적화된 코돈을 포함하는 C-최대화된 서열을 포함하거나 이로 구성된다. 따라서, 이론적으로 대체 가능한 C-최적화 코돈의 100% 또는 전부는 바람직하게는 암호화 서열의 전체 길이에 걸쳐 C-최적화 된 코돈으로 대체된다.
이와 관련하여, 시토신-함량 최적화 가능한 코돈은 동일한 아미노산을 암호화하는 다른 코돈보다 적은 수의 시토신을 포함하는 코돈이다.
코돈 GCG, GCA, GCU 중 어느 하나는 동일한 아미노산을 암호화하는 코돈 GCC에 의해 교환될 수 있는 아미노산 Ala를 암호화하고/하거나
Cys를 암호화하는 코돈 UGU는 동일한 아미노산을 암호화하는 코돈 UGC에 의해 교환될 수 있고/있거나
Asp를 암호화하는 코돈 GAU는 동일한 아미노산을 암호화하는 코돈 GAC에 의해 교환될 수 있고/있거나
Phe를 암호화하는 코돈 UUU는 동일한 아미노산을 암호화하는 코돈 UCC에 의해 교환될 수 있고/있거나
코돈 GGG, GGA, GGU 중 어느 하나는 동일한 아미노산을 암호화하는 코돈 GGC에 의해 교환 될 수 있는 Gly를 암호화하고/하거나
His를 암호화하는 코돈 CAU는 동일한 아미노산을 암호화하는 코돈 CAC에 의해 교환될 수 있고/있거나
Ile를 암호화하는 코돈 AUA, AUU 중 어느 하나는 코돈 AUC에 의해 교환될 수 있고/있거나
Leu를 암호화하는 코돈 UUG, UUA, CUG, CUA, CUU 중 어느 하나는 동일한 아미노산을 암호화하는 코돈 CUC에 의해 교환될 수 있고/있거나
Asn를 암호화하는 코돈 AAU는 동일한 아미노산을 암호화하는 코돈 AAC에 의해 교환될 수 있고/있거나
Pro를 암호화하는 코돈 CCG, CCA, CCU 중 어느 하나는 동일한 아미노산을 암호화하는 코돈 CCC에 의해 교환될 수 있고/있거나
Arg를 암호화하는 코돈 AGG, AGA, CGG, CGA, CGU 중 어느 하나는 동일한 아미노산을 암호화하는 코돈 CGC에 의해 교환될 수 있고/있거나
Ser을 암호화하는 코돈 AGU, AGC, UCG, UCA, UCU 중 어느 하나는 동일한 아미노산을 암호화하는 코돈 UCC에 의해 교환될 수 있고/있거나
Thr을 암호화하는 코돈 ACG, ACA, ACU 중 어느 하나는 동일한 아미노산을 암호화하는 코돈 ACC에 의해 교환될 수 있고/있거나
Val을 암호화하는 코돈 GUG, GUA, GUU 중 어느 하나는 동일한 아미노산을 암호화하는 코돈 GUC에 의해 교환될 수 있고/있거나
Tyr을 암호화하는 코돈 UAU는 동일한 아미노산을 암호화하는 코돈 UAC에 의해 교환될 수 있다.
임의의 상기 예에서, 시토신의 수는 교환된 코돈당 1씩 증가한다. 암호화 서열의 (C- 최적화 코돈에 상응하는) 모든 비 C-최적화 된 코돈의 교환은 C-최대화된 암호화 서열을 야기한다. 본 발명과 관련하여, 본 발명의 인공 핵산 분자, 바람직하게는 RNA의 적어도 하나의 암호화 서열 내에서 비 C-최적화된 코돈의 적어도 70 %, 바람직하게는 적어도 80 %, 보다 바람직하게는 적어도 90 % (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)는 C-최적화 된 코돈으로 대체된다.
다른 아미노산의 경우, 대체된 코돈의 백분율은 암호화 서열의 모든 C-최적화 야생형 코돈의 적어도 70 %의 C-최적화의 전체 백분율을 충족시키기 위해 70 %보다 높은 반면, 일부 아미노산의 경우, C-최적화된 코돈으로 대체된 C-최적화된 코돈의 백분율이 70 % 미만인 것이 바람직할 수 있다.
바람직하게는, C-최적화된 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)에서, 임의의 주어진 아미노산에 대한 C-최적화 야생형 코돈의 적어도 50%는 C-최적화 코돈에 의해 대체된다, 예를 들어 임의의 변형된 C-풍부 RNA(또는 다른 핵산, 특히 RNA)는 바람직하게는 상기 언급된 아미노산 Ala, Cys, Asp, Phe, Gly, His, Ile, Leu, Asn, Pro, Arg, Ser, Thr, Val 및 Tyr 중 어느 하나를 암호화하는 C-최적화 야생형 코돈 위치에서 적어도 50%, 바람직하게는 적어도 60% C-최적화된 코돈을 포함한다.
이와 관련하여, 시토신 함량-최적화되지 않지만 적어도 두 개의 코돈에 의해 암호화되는 아미노산을 암호화하는 코돈은 추가 선택 과정 없이 사용될 수 있다. 하지만, 세포(예 : 사람 세포)에서 비교적 드문 tRNA를 암호화하는 야생형 서열의 코돈은 세포에서 비교적 빈번한 tRNA를 암호화하는 코돈으로 교환될 수 있으며, 여기서 둘 다 동일한 아미노산을 암호화한다. 따라서, Glu를 암호화하는 비교적 드문 코돈 GAA는 동일한 아미노산을 암호화하는 상대적으로 빈번한 코돈 GAG에 의해 교환될 수 있고/있거나
Lys를 암호화하는 상대적으로 드문 코돈 AAA는 동일한 아미노산을 암호화하는 상대적으로 빈번한 코돈 AAG에 의해 교환될 수 있고/있거나
Gln를 암호화하는 상대적으로 드문 코돈 CAA는 동일한 아미노산을 암호화하는 상대적으로 빈번한 코돈 CAG에 의해 교환될 수 있다.
이와 관련하여, 각각 하나의 코돈에 의해 암호화된 아미노산 Met (AUG) 및 Trp (UGG)는 변하지 않은 채로 유지된다. 정지 코돈은 시토신 함량이 최적화되어 있지 않지만, 상대적으로 드문 정지 코돈 앰버, 오커(UAA, UAG)는 비교적 빈번한 정지 코돈 오팔(UGA)에 의해 교환될 수 있다.
야생형 서열과 비교하여 변형된 인공 핵산 분자, 바람직하게는 RNA의 시토신 함량을 최적화하기 위해 상기 열거된 단일 치환은 모든 가능한 조합뿐만 아니라 개별적으로 사용될 수 있다.
따라서, 본 명세서에 정의된 바와 같은 적어도 하나의 암호화 서열은 각각의 야생형 핵산, 바람직하게는 RNA의 암호화 서열과 비교하여 하나의 추가적인 시토신을 포함하는 적어도 2 개 또는 그 이상의 코돈, 예를 들어 하나의 추가적인 시토신을 포함하는 C-최적화된 코돈에 의해 교환될 수 있는 코돈과 같은 방식으로 암호화된 아미노산이 되도록 변경될 수 있고, 여기서 아미노산은 바람직하게는 야생형 서열과 비교하여 변경되지 않는다.
특히 바람직한 실시예에 따르면, 본 발명의 조합은 본 명세서에 정의된 바와 같은 적어도 하나의 암호화 서열을 (본 명세서에 명시된 5' UTR 및 3' UTR에 추가하여) 포함하는 인공 핵산 분자, 바람직하게는 RNA를 포함하며, 여기서 (a) 상기 인공 핵산 분자, 바람직하게는 RNA의 적어도 하나의 암호화 서열의 G/C 함량은 상응하는 야생형 핵산 (바람직하게는 RNA)의 상응하는 암호화 서열의 G/C 함량과 비교하여 증가된다, 및/또는 (b) 상기 인공 핵산 분자, 바람직하게는 RNA의 적어도 하나의 암호화 서열의 C 함량은 상응하는 야생형 핵산(바람직하게는 RNA)의 상응하는 암호화 서열의 C 함량과 비교하여 증가된다, 및/또는 (c) 상기 인공 핵산 분자, 바람직하게는 RNA의 적어도 하나의 암호화 서열에서 상기 코돈은 인간 코동 사용에 적합하고, 상기 코돈 적응 지수(CAI)는 바람직하게는 상기 인공 핵산 분자, 바람직하게는 RNA의 적어도 하나의 암호화 서열에서 증가 또는 최대화되고 상기 인공 핵산 분자, 바람직하게는 RNA에 의해 암호화된 상기 아미노산 서열은 바람직하게는 상응하는 야생형 핵산(바람직하게는 RNA)에 의해 암호화되는 아미노산 서열과 비교하여 변형되지 않는다.
변형된 핵산 서열
상기 나타낸 서열 변형은 일반적으로 본 명세서에 기재된 임의의 핵산 서열에 적용될 수 있고, 특히 본 명세서에 정의된 바와 같은 CRISPR-연관 단백질을 암호화하는 핵산 서열, 및 선택적으로 NLS 또는 다른 펩티드 또는 단백질 부분, 도메인 또는 태그를 포함하거나 이로 구성된 암호화 서열에 적용될 것으로 예상된다. 변형 (화학 변형, 지질 변형 및 서열 변형 포함)은, 적절하거나 필요한 경우, 결합된 변형이 서로 간섭하지 않는 한, 바람직하게는 암호화된 CRISPR-연관 단백질(및 NLS, 신호 서열, 단백질/펩티드 태그)이 상기 정의된 바와 같이 그의 바람직한 생물학적 기능성 또는 특성을 유지하는 한 임의의 조합으로 서로 조합될 수 있다.
바람직한 실시예에서, 본 발명에 따른 인공 핵산은 CRISPR-연관 단백질을 암호화하는 암호화 서열을 포함하며, 여기서 상기 암호화 서열은 상기 서술된 바와 같이 변형되었다.
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 Cas9 단백질 또는 이의 상동체, 변이체, 단편 또는 유도체를 암호화하는 암호화 서열을 포함하고, 여기서 상기 암호화 서열은 서열번호: 412; 3474-3887 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 9690-9703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250 -10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391 중 어느 하나 또는 이의 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 Cpf1 단백질 또는 이의 상동체, 변이체, 단편 또는 유도체를 암호화하는 암호화 서열을 포함하고, 여기서 상기 암호화 서열은 서열번호: 10552; 3458-3459; 3460-3473; 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 8208-8209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583 10579-10580; 10585-10586; 10588-10589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881; 10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 9352-9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448-9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 9832-9833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 10392-10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 중 어느 하나 또는 이의 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다.
본 발명에 따른 인공 핵산은 동일한 (모노시스트로닉 핵산) 또는 상이한 (멀티시스트로닉 핵산) 암호화 영역(들)에서 추가 단백질 또는 펩티드를 암호화할 수 있다. 각각의 암호화 핵산 서열은 상기 기재된 바와 동일한 서열 변형을 겪을 수 있다. 특히, 본 발명의 인공 핵산의 암호화 서열은 바람직하게는 CRISPR-연관 단백질을 암호화하는 핵산 서열에 융합된 하나 또는 그 이상의 핵 위치 신호 (NLS)를 암호화하는 하나 또는 그 이상의 서열(들)을 포함할 수 있다. 이들 서열은 또한 전술한 바와 같이 변형될 수 있다.
변형된 (또는 "최적화된") 암호화 서열은 본 명세서에 개시된 임의의 UTR과 조합될 수 있다.
따라서, 일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 본 명세서에 정의된 적어도 하나의 5' UTR 요소, 본 명세서에 정의된 적어도 하나의 3' UTR 요소 및 Cas9 또는 Cpf1 단백질 또는 이의 상동체, 변이체, 단편 또는 유도체를 암호화하는 암호화 서열을 포함하고, 여기서 상기 인공 핵산 분자는 서열번호: 413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130-8145; 9290-9305; 10402-10408; 10554; 10599-10612 (HSD17B4 / Gnas.1); 서열번호:414; 2346-2361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 9306-9321; 10409-10415; 10555; 10613-10626 (Slc7a3.1 / Gnas.1); 서열번호:415; 2362-2377; 3522-3537; 4682-4697; 5842-5857; 7002-7017; 8162-8177; 9322-9337; 10416-10422; 10556; 10627-10640 (ATP5A1 / CASP.1); 서열번호:416; 2378-2393; 3538-3553; 4698-4713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654 (Ndufa4.1 / PSMB3.1); 서열번호:417; 2394-2409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 9354-9369; 10430-10436; 10558; 10655-10668 (HSD17B4 / PSMB3.1); 서열번호:418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682 (RPL32var / albumin7); 서열번호:419; 2426-2441; 3586-3601; 4746-4761; 5906-5921; 7066-7081; 8226-8241; 9386-9401; 10444-10450; 10560; 10683-10696 (32L4 / albumin7); 서열번호:420; 2442-2457; 3602-3617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710 (HSD17B4 / CASP1.1); 서열번호:421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724 (Slc7a3.1 / CASP1.1); 서열번호:422; 2474-2489; 3634-3649; 4794-4809; 5954-5969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 10725-10738 (Slc7a3.1 / PSMB3.1); 서열번호:423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 8290-8305; 9459-9450; 10472-10478; 10564; 10739-10752 (Nosip.1 / PSMB3.1); 서열번호:424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 8306-8321; 9466-9481; 10479-10485; 10565; 10753-10766 (Ndufa4.1 / RPS9.1); 서열번호:425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 7162-7177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780 (HSD17B4 / RPS9.1); 서열번호:9498- 9609; 10493-10499; 10567; 10781-10794 (ATP5A1 / Gnas.1); 서열번호:9610-9721; 10500-10506; 10568; 10795-10808 (Ndufa4.1 / COX6B1.1); 서열번호:9722-9833; 10507-10513; 10569; 10809-10822 (Ndufa4.1 / Gnas.1); 서열번호:9834-9945; 10514-10520; 10570; 10823-10836 (Ndufa4.1 / Ndufa1.1); 서열번호:9946-10057; 10521-10527; 10571; 10837-10850 (Nosip.1 / Ndufa1.1); 서열번호:10058-10169; 10528-10534; 10572; 10851-10864 (Rpl31.1 / Gnas.1); 서열번호:10170-10281; 10535-10541; 10573; 10865-10878 (TUBB4B.1 / RPS9.1); 서열번호:10282-10393; 10542-10548; 10574; 10879-10892 (Ubqln2.1 / RPS9.1) 중 어느 하나 또는 이의 상동체, 변이체, 단편 또는 유도체, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성된다. <223>의 서열 목록에서 "기타 정보" 라인에 제공된 지침에 의해 서열번호가 어느 단백질 (Cas9 또는 Cpf1)에 속하는 것은 본 발명이 속하는 기술분야의 통상의 기술자에게는 용이하게 명백하며, 여기서 각각의 서열번호:가 Cpf1 변이 mRNA 생성물 또는 Cas9 변이 mRNA 생성물과 유사한지 개시되어 있다.
5' 캡(5' Cap)
본 발명의 추가적인 바람직한 실시예에 따르면, 변형된 인공 핵산 분자, 바람직하게는 본 명세서에 정의된 바와 같은 RNA (또는 임의의 다른 핵산, 특히 RNA)는 바람직하게는 본 명세서에 기재된 상기 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)를 안정화시키는 소위 '5' 캡 '구조의 추가에 의해 변형될 수 있다.
5'-캡은, 일반적으로 성숙한 mRNA의 5'-말단을 "덮는(cap)"하는 독립체, 전형적으로 변형된 뉴클레오티드 독립체이다. 5'-캡은 전형적으로 변형된 뉴클레오티드, 특히 구아닌 뉴클레오티드의 유도체에 의해 형성될 수 있다. 바람직하게는, 5'-캡은 5'-5'-삼인산염 결합을 통해 5'-말단에 연결된다. 5'-캡은 메틸화될 수 있으며, 예를 들어 m7GpppN, 상기 N은 5'-캡을 운반하는 핵산의 말단 5' 뉴클레오티드, 전형적으로 mRNA의 5'-말단이다. m7GpppN은 중합효소 II에 의해 전사된 mRNA에서 자연적으로 발생하는 5'-캡 구조이고, 그러므로 바람직하게는 이 문맥에서 변형된 mRNA에 포함되는 변형으로 간주되지 않는다. 따라서, "변형된"인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 5'-캡으로서 m7GpppN을 포함할 수 있지만, 추가적으로 상기 변형된 인공 핵산 분자, 바람직하게는 RNA(또는 다른 핵산)은 전형적으로 본 명세서에 정의된 바와 같은 적어도 하나의 추가적인 변형을 포함한다.
5'-캡 구조의 추가적인 예시에는 글리세릴, 역 디옥시 비염기 잔기(inverted deoxy abasic residue)(일부), 4',5' 메틸렌 뉴클레오티드, 1-(베타-D-에리스로푸라노실) 뉴클레오티드, 4'-티오 뉴클레오티드, 카르보사이클릭 뉴클레오티드, 1,5-무수헥시톨 뉴클레오티드, L-뉴클레오티드, 알파-뉴클레오티드, 변형 염기 뉴클레오티드, 트레오-펜토푸라노실 뉴클레오티드, 비환형 3',4'-세코 뉴클레오티드, 비환형 3,4-디하이드록시부틸 뉴클레오티드, 비환형 3,5-디하이드록시펜틸 뉴클레오티드, 3'-3'-역 뉴클레오티드 일부, 3'-3'-역 비염기 일부, 3'-2'-역 뉴클레오티드 일부, 3'-2'-역 비염기 일부, 1,4-부탄디올포스페이트, 3'-포스포라미데이트, 헥실포스페이트, 아미노헥실 포스페이트, 3'-포스페이트, 3'-포스포로티오에이트, 포스포로디티오에이트, 또는 가교형 또는 비가교형 메틸포스포네이트 일부를 포함한다. 이러한 변형 5'-캡 구조는 이 문맥에서 적어도 하나의 변형으로 간주된다.
특히 바람직하게 변형된 5'-캡 구조는 캡1(m7G의 인접 뉴클레오티드의 리보스 메틸화), 캡2 (m7G의 두번째 뉴클레오티드 하류의 리보스의 추가 메틸화), 캡3(m7G의 세번째 뉴클레오티드 하류의 리보스의 추가 메틸화), 캡4 (m7G의 네번째 뉴클레오티드 하류의 리보스 메틸화), ARCA(안티-리버스 캡 유사체, 변형된 ARCA(에를 들어 포스포티오에이트 변형된 ARCA), CleanCap(TriLink) 및/또는 WO2017053297A1에서 개시된 캡-구조(여기서는 참조에 포함됨), 이노신, N1-메틸-구아노신, 2'-플루오로-구아노신, 7-데자-구아노신, 8-옥소-구아노신, 2-아미노-구아노신, LNA-구아노신, 및 2-아지도-구아노신이다.
바람직한 실시예에서, 인공 핵산은 RNA의 5' 말단에서 캡 구조에 인접한 첫번째 뉴클레오티드의 리보스-2'-O 위치의 2'-O 위치에 메틸기를 포함한다(cap-1). 전형적으로, 메틸화는 캡-1 구조를 야기하는 덮인 RNA(캡-0)를 메틸화하기 위해 기질로서 인공 핵산(바람직하게는 RNA)를 덮는 m7GpppN 및 메틸 공여체로서 S-아데노실메티오닌(SAM)을 사용하여 캡 2'-O-메틸기전이효소의 작용에 의해 달성될 수 있다. 캡-1 구조는 mRNA 번역 효율을 향상시키는 것으로 보고되었으며, 따라서 본 명세서에 기재된 본 발명의 인공 핵산, 바람직하게는 RNA의 발현 효능을 개선시키는 것을 도울 수 있다.
폴리(A)
추가의 바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 폴리(A)서열을 포함한다.
폴리(A) 서열, 소위 폴리(A) 꼬리 또는 3'-폴리(A) 꼬리는 전형적으로 아데노신 뉴클레오티드, 예를 들어 약 400 아데노신 뉴클레오티드에 이르는, 예를 들어 약 20 내지 약 400, 바람직하게는 약 50 내지 약 400, 더욱 바람직하게는 약 50 내지 약 300, 더욱 더 바람직하게는 약 50 내지 약 250, 가장 바람직하게는 약 60 내지 약 250 아데노신 뉴클레오티드의 서열로 이해된다. 본 명세서에서 사용된, 폴리(A) 서열은 또한 약 10 내지 200 아데노신 뉴클레오티드, 바람직하게는 약 10 내지 100 아데노신 뉴클레오티드, 더욱 바람직하게는 약 40내지 80 아데노신 뉴클레오티드 또는 더욱 더 바람직하게는 약 50 내지 70 아데노신 뉴클레오티드를 포함할 수 있다. 폴리(A) 서열은 전형적으로 RNA, 특히 mRNA의 3' 말단에 위치한다.
따라서, 추가의 바람직한 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 그의 3' 말단에 전형적으로 약 10 내지 200 아데노신 뉴클레오티드, 바람직하게는 약 10 내지 100 아데노신 뉴클레오티드, 더욱 바람직하게는 약 40내지 80 아데노신 뉴클레오티드 또는 더욱 더 바람직하게는 약 50 내지 70 아데노신 뉴클레오티드의 폴리(A)꼬리를 포함한다.
바람직하게는, 본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 상기 다른 핵산, 특히 RNA)에서의 폴리(A) 서열은 RNA 시험관 내 전사에 의해 DNA 주형으로부터 유래된다. 대안적으로, 폴리 (A) 서열은 DNA 전구체로부터 필연적으로 전사되지 않고 일반적인 화학 합성 방법에 의해 시험 관 내에서 얻어질 수도 있다.
또한, 폴리(A)서열, 또는 폴리(A)꼬리는 시판되는 폴리아데닐화 키트 및 해당 기술분야에서 공지 된 상응하는 프로토콜을 사용하여 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)의 효소에 의한 폴리아데닐화에 의해 생성될 수 있다. 폴리아데닐화는 전형적으로 RNA 분자, 예를 들어 미성숙 mRNA와 같은 핵산 분자에 폴리(A)서열의 첨가로 이해된다. 폴리아데닐화는 소위 폴리아데닐화 신호에 의해 유도될 수 있다. 이러한 신호는 바람직하게는 폴리아데닐화될 mRNA의 3'-말단에 뉴클레오티드의 스트레치 내에 위치한다. 폴리아데닐화 신호는 전형적으로 아데닌 또는 우라실/티민 뉴클레오티드, 바람직하게는 헥사머 서열 AAUAAA로 이루어진 헥사머를 포함한다. 다른 서열, 바람직하게는 헥사머 서열이 또한 고려될 수 있다. 폴리아데닐화는 전형적으로 pre-mRNA(소위 미성숙-mRNA)의 가공 중에 발생한다. 전형적으로, RNA 성숙(pre-mRNA로부터 성숙 mRNA로)은 폴리아데닐화 단계를 포함한다.
따라서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 특정 단백질 인자(예를 들어, 절단 및 폴리아데닐화 특이성 인자(CPSF), 절단 자극 인자(CstF), 절단 인자 I 및 II(CF I 및 CF II), 폴리(A) 중합효소(PAP))에 의해 (전사된) RNA에 폴리아데닐화를 전하는 폴리아데닐화 신호를 포함할 수 있다.
이와 관련하여, NN(U/T)ANA 공통 염기 서열을 포함하는 공통 폴리아데닐화 신호가 바람직하다. 특히 바람직한 측면에서, 폴리아데닐화 신호는 다음 서열 중 하나를 포함한다: AA(U/T)AAA 또는 A(U/T)(U/T)AAA (상기 우리딘은 일반적으로 RNA에 존재하고 티미딘은 일반적으로 DNA에 존재한다).
폴리(C)
추가의 바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자는 3' 말단에 전형적으로 약 10 내지 200 시토신 뉴클레오티드, 바람직하게는 약 10 내지 100 시토신 뉴클레오티드, 더욱 바람직하게는 약 20 내지 70 시토신 뉴클레오티드, 또는 더욱 더 바람직하게는 약 20 내지 60 또는 10 내지 40 시토신 뉴클레오티드의 폴리(C)꼬리를 포함한다.
히스톤 스템-루프 (HSL)
일부 바람직한 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의 된 임의의 다른 핵산, 특히 RNA)는 히스톤 스템-루프(HSL) 서열/구조를 포함한다. 이러한 히스톤 스템-루프 서열은 바람직하게는 WO 2012/019780에 개시된 바와 같은 히스톤 스템-루프 서열로부터 선택되며, 그 개시 내용은 본 명세서에 참조로 포함된다.
본 발명에서 사용하기에 적합한 히스톤 스템-루프 서열은 바람직하게는 하기 화학식 (I) 또는 (II) 중 적어도 하나로부터 선택된다:
화학식 (I) (스템 경계 요소(stem bordering elements)가 없는 스템-루프 서열):
Figure pct00026
화학식 (II) (스템 경계 요소(stem bordering elements)가 있는 스템-루프 서열):
Figure pct00027
상기:
스템1 또는 스템2 경계 요소 N1-6은 1 내지 6, 바람직하게는 2 내지 6, 더 바람직하게는 2 내지 5, 더욱 더 바람직하게는 3 내지 5, 가장 바람직하게는 4 내지 5 또는 5 N의 연속적인 서열이고, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이다;
스템1 [N0-2GN3-5]은 성분 스템2와 역으로 상보적 또는 부분적으로 역으로 상보적이며, 5 내지 7 뉴클레오티드 사이의 연속적인 서열이고;
상기 N0-2 는 0 내지 2, 바람직하게는 0 내지 1, 더 바람직하게는 1 N의 연속적인 서열이고, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며;
상기 N3-5 는 3 내지 5, 바람직하게는 4 내지 5, 더 바람직하게는 4 N의 연속적인 서열이고, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며; 그리고
상기 G는 구아노신 또는 이의 유사체이고, 스템2에서 그것의 상보적인 뉴클레오티드 시티딘이 구아노신으로 치환되는 경우, 선택적으로 시티딘 또는 이의 유사체로 치환될 수 있다;
루프 서열 [N0-4(U/T)N0-4] 은 성분 스템1과 스템2 사이에 위치하고, 3 내지 5 뉴클레오티드, 더 바람직하게는 4 뉴클레오티드의 연속적인 서열이며;
상기 각각의 N0-4 은 0 내지 4의, 바람직하게 1 내지 3, 더 바람직하게 1 내지 2 N의 다른 연속적인 서열로부터 독립적이며, 상기 각각의 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며; 그리고 상기 U/T는 우리딘, 또는 선택적으로 티미딘을 나타낸다;
스템2 [N3-5CN0-2]는 성분 스템1과 역으로 상보적이거나 또는 부분적으로 역으로 상보적이며, 5 내지 7 뉴클레오티드 사이의 연속적인 서열이고;
상기 N3-5은 3 내지 5, 바람직하게는 4 내지 5, 더 바람직하게는 4 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며;
상기 N0-2은 0 내지 2, 바람직하게는 0 내지 1, 더 바람직하게는 1 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며; 그리고
상기 C는 시티딘 또는 이의 유사체이고, 스템1에서 그것의 상보적인 뉴클레오티드 구아노신이 시티딘으로 치환되는 경우, 선택적으로 구아노신 또는 이의 유사체로 치환될 수 있다;
상기
스템1 및 스템2는 서로 역상보적인 서열을 형성하여 염기쌍을 이룰 수 있으며, 상기 염기쌍은 스템1과 스템2 사이에서, 예를 들어 뉴클레오티드 A와 U/T 또는 G와 C의 왓슨-크릭 염기쌍에 의해 또는 워블 염기쌍과 같은 비-왓슨-크릭 염기쌍, 역 왓슨-크릭 염기쌍, 후그스틴 염기쌍, 역 후그스틴 염기쌍 또는 부분적으로 역상보적인 서열을 형성하여 염기쌍을 이룰 수 있으며, 상기 불완전한 염기쌍은 스템1과 스템2 사이에서 발생할 수 있고, 하나의 스템에서 하나 또는 그 이상의 염기는 다른 스템의 역상보적인 서열에서 상보성 염기를 갖지 않는다는 것을 기초로 한다.
추가의 바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 하기 특정 화학식 (Ia) 또는 (IIa) 중 적어도 하나에 따른 적어도 하나의 히스톤 스템-루프(HSL) 서열을 포함한다:
화학식 (Ia) (스템 경계 요소를 갖지 않는 스템-루프 서열):
Figure pct00028
화학식 (IIa) (스템 경계 요소를 갖는 스템-루프 서열):
Figure pct00029
상기:
N, C, G, T 및 U는 상기 정의된 바와 같다.
특히 더 바람직한 측면에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 하기 특정 화학식 (Ib) 또는 (IIb) 중 적어도 하나에 따른 적어도 하나의 히스톤 스템-루프 서열을 포함할 수 있다:
화학식 (Ib) (스템 경계 요소를 갖지 않는 스템-루프 서열):
Figure pct00030
화학식 (IIb) (스템 경계 요소를 갖는 스템-루프 서열):
Figure pct00031
상기:
N, C, G, T 및 U은 상기 정의된 바와 같다.
특히 바람직한 히스톤 스템-루프 서열은 서열 CAAAGGCTCTTTTCAGAGCCACCA 또는 더욱 바람직하게는 상응하는 RNA 서열 CAAAGGCUCUUUUCAGAGCCACCA이다.
miRNA 부분
추가적인 실시예에서, 비 암호화 부분, 즉 예를 들어 miRNA 부분은 본 발명의 서열과 결합된다. 비 암호화 부분은 하기 목록에 개시된 하나 또는 그 이상의 핵산 서열로부터 선택될 수 있다:
5'-UTR;
3'-UTR;
miRNA 부분;
캡;
폴리(C) 서열
히스톤 스템-루프 서열
폴리(A) 서열 또는 폴리아데닐화 신호;
IRES 부분
헤어핀 부분
RNA 결합 단백질을 위한 부분
3'-5' 분해를 방지하는 부분
RNA 붕괴 속도를 조절하는 부분
상기 용어는 일반적인 용어이다. 이들 일반적인 용어에 속하는 특정 부분이 또한 본 발명에 의해 제공된다. 특정 실시예와 관련된 서열을 포함하여 상기 목록으로부터의 부분의 세부 사항은 하기에 제공된다.
상기 목록은 단일 형태로 항목을 제공하지만, 하나 이상의 각각의 부분이 선택될 수 있다. 상기 목록에 포함되지 않은 핵산 부분은 동일하게 선택될 수 있다. 바람직하게는, 적어도 하나의 모듈 또는 부분은 상기 목록으로부터 온 것이다.
전형적인 실시예에서, 적어도 하나의 5'-UTR 부분 및/또는 적어도 하나의 3'-UTR 부분이 선택된다. 바람직하게는, 적어도 하나의 5'-UTR 및 적어도 하나의 3'-UTR이 선택된다.
miRNA는 또한 본 발명에서 부분으로서 선택될 수 있다. 본 발명이 속하는 기술 분야에서 공지 된 임의의 miRNA 부분이 선택될 수 있다. 이러한 부분은 마이크로RNA 표적 서열, 마이크로RNA 서열, 또는 마이크로RNA 시드(seed)로부터 선택될 수 있다. 예를 들어, miRNA 서열 (microRNA 표적 서열, microRNA 서열, 또는 마이크로 RNA 시드)은 WO2015085318A2, US2005/0261218, US20170211066, WO2017201332, WO2017201328, WO2017201349, WO2017201347, WO2017201348, WO2017201342, WO2017201346, US20160177295, WO2014113089, EP2946014, WO2016100812, WO2013126803 및 US2005/0059005에 기재되어 있다(전술한 모든 참고 문헌은 본 명세서에 참조로 포함됨). 마이크로RNA, 마이크로RNA 표적 영역의 확인 및 생물학에서 이들의 발현 패턴 및 역할이 보고되었다(Bonauer et al., Curr Drug Targets 2010 11 :943-949; Anand and Cheresh, Curr Opin Hematol 2011, 18: 171-176; Contreras and Rao Leukemia, 2012 26:404-413; Barrel, Cell, 2009 136:215-233; Landgraf et al., Cell, 2007 129: 1401-1414 (전술한 모든 참고 문헌은 본 명세서에 참조로 포함됨).
일반적으로, 마이크로RNA (또는 miRNA)는 19-25 개의 뉴클레오티드 길이의 비암호화 RNA이다. miRNA는 핵산 분자의 3'-UTR에 결합한다. 이것은 핵산 분자 안정성을 감소시키거나 번역을 억제함으로써 유전자 발현의 하향 조절을 야기한다. 본 발명의 모듈로서, 본 발명의 폴리뉴클레오티드는 하나 또는 그 이상의 마이크로RNA 표적 서열, 마이크로RNA 서열 또는 마이크로 RNA 시드를 포함할 수 있다.
본 명세서에 사용된 용어 "마이크로RNA 부위"는 마이크로RNA가 결합하거나 달리 회합할 수 있는 폴리뉴클레오티드 서열을 지칭한다. "결합"은 전형적으로 왓슨-크릭 혼성화에 의해 발생한다; 그러나, 그렇지 않으면 마이크로RNA 부위 또는 마이크로RNA 부위에 인접한 표적 서열과 마이크로 RNA의 임의의 다른 안정적인 회합은 또한 본 발명에 따른 "마이크로RNA 부위"의 개념에 포함된다.
일반적으로, 마이크로 RNA 서열은 "시드" 영역, 즉 성숙한 마이크로RNA의 위치 2 내지 8의 영역에 있는 서열을 포함한다. 시드 영역 서열은 miRNA 표적 서열에 대한 완벽한 왓슨-크릭 상보성을 갖는다. 이러한 마이크로RNA 시드는 성숙한 마이크로 RNA의 위치 2-8, 또는 대안적으로 2-7을 포함할 수 있다. 따라서, 한 실시예에서, 마이크로 RNA 시드는 7 개의 뉴클레오티드(예를 들어, 성숙한 마이크로RNA의 뉴클레오티드 2-8)를 포함하고, 상기 상응하는 miRNA 표적 내의 시드-상보적 부위는 마이크로 RNA 위치 1과 반대되는 아데닌 (A)에 의해 측면에 위치된다. 다른 실시예에서, 마이크로 RNA 시드는 6 개의 뉴클레오티드 (예를 들어, 성숙한 마이크로RNA의 뉴클레오티드 2-7)를 포함하고, 상기 상응하는 miRNA 표적 내의 시드-상보적 부위는 마이크로RNA 위치 1과 반대되는 아데닌 (A)에 의해 측면에 위치된다. 각각의 핵산 모듈은 Grimson et al.; Mol Cell. 2007 Jul 6;27(1):91-105에 개시되어 있다.
본 발명에서, 마이크로RNA 표적 서열은 전형적으로 오픈 리딩 프레임의 3'-UTR 또는 그렇지 않으면 3' (상류)에 포함되도록 설계된다. 이러한 경우, 문제의 상응하는 마이크로RNA가 이용 가능하다면, miRNA 표적 서열은 분해 또는 감소된 번역을 위해 분자를 표적화하는 것으로 생각된다. 이는 본 발명의 핵산 분자의 전달시 바람직하지 않은 오프-타겟 효과를 제어할 수 있게 한다.
간에서 mRNA를 번역하는 것이 바람직하지 않지만, mRNA가 간으로 전달되거나 그렇지 않으면 거기서 끝나는 경우에 대비해서, miR-122의 하나 또는 다수의 표적 부위가 본 발명의 폴리뉴클레오티드의 3'-UTR 영역에서 존재(예를 들어 설계됨)한다면, 간에서 풍부한 마이크로RNA인 miR-122는 본 발명의 핵산의 발현을 억제할 수 있다. 상이한 마이크로RNA에 대한 하나 또는 다수의 결합 부위의 도입은 폴리뉴클레오티드의 수명, 안정성 및 단백질 번역에 추가로 영향을 미치도록 (예를 들어 감소) 조절될 수 있다.
대조적으로, mRNA를 번역하는 것이 실제로 필요한 경우에, 마이크로RNA 결합 부위는 예를 들어 특정 조직에서 단백질 발현을 증가시키기 위해 이들이 발생하는 서열로부터 조절(즉 제거됨)될 수 있다. 예를 들어, 간에서 단백질 발현을 개선시키기 위해 하나 또는 그 이상의 miR-122 결합 부위가 제거될 수 있다.
이에 의해, 특정 조직에서의 발현 조절은 도입 또는 제거 또는 하나 또는 몇몇의 마이크로RNA 결합 부위를 통해 달성될 수 있다. 예를 들어, 마이크로RNA는 간 (miR-122), 심장 (miR-ld, miR-149), 내피 세포 (miR-17-92, miR-126), 지방 세포 (let-7, miR-30c), 신장 (miR-192, miR-194, miR-204), 골수 세포 (miR-142-3p, miR-142-5p, miR-16, miR-21, miR -223, miR-24, miR-27), 근육 (miR-133, miR-206, miR-208) 및 폐 상피 세포 (let-7, miR-133, miR-126)에서 제한 없이 mRNA를 조절하여 단백질 발현을 조절하는 것으로 알려져 있다. MicroRNA는 또한 혈관 신생 (miR-132)과 같은 복잡한 생물학적 과정을 조절할 수 있다 (예를 들어 Anand and Cheresh, Curr. Opin. Hematol. 2011, 18: 171-176;).
따라서, 일반적으로, 본 발명의 모듈식 설계 원리에 따르면, 폴리뉴클레오티드 발현의 발현을 원하는 세포 유형 또는 조직, 또는 관련 생물학적 과정의 맥락에 맞추기 위해 마이크로RNA에 대한 결합 부위를 제거 또는 도입할 수 있다. miRNA 서열 및 결합 부위의 목록이 공개적으로 이용 가능하다. 본 명세서에 논의된 문헌에 개시된 임의의 서열이 본 발명과 관련하여 사용될 수 있다: 조직- 또는 질병-특이적 유전자 발현을 유도하는 마이크로 RNA의 예는 Getner and Naldini, Tissue Antigens. 2012, 80:393-403에 열거되어 있다. 마이크로 RNA 시드 부위의 혼입의 예는 miR-142 부위를 UGT1A1-발현 렌티바이러스 벡터 내로 혼입시키는데, 이는 항원-제시 세포에서 감소된 발현을 유발하여 Schmitt et al., Gastroenterology 2010; 139:999-1007; Gonzalez-Asequinolaza et al. Gastroenterology 2010, 139:726-729에 개시된 바와 같이 바이러스 발현된 UGT1A1에 대한 면역 반응의 부재로 이어진다. 따라서, 완전한 단백질 결핍 (UGT1A1 유형 I, LDLR-결핍 환자, CRIM-음성 폼페 환자, 등)을 치료하는 환자의 경우 하나 또는 그 이상의 miR-142 시드 부위를 mRNA에 포함시키는 것이 중요한 것으로 생각된다. 이에 의해, 본 발명의 핵산 분자는 이러한 목적에 적합하도록 설계될 수 있다.
임의의 이러한 miRNA 서열에 대해 적어도 80 % 동일성, 적어도 85 % 동일성, 바람직하게는 적어도 90 % 동일성, 및 더욱 바람직하게는 적어도 95 % 동일성을 특징으로 하는 임의의 폴리뉴클레오티드가 선택될 수 있다.
상이한 세포 유형에서 마이크로RNA의 상이한 발현 패턴으로 인해, 본 발명은 특정 세포 유형 또는 특정 생물학적 조건 하에서 표적화된 발현을 위한 폴리뉴클레오티드 분자를 구체적으로 설계할 수 있게 한다. 조직-특이적 마이크로RNA 결합 부위의 도입을 통해, 폴리뉴클레오티드는 조직에서 또는 생물학적 조건과 관련하여 단백질 발현을 위해 설계될 수 있다.
본 발명의 한 실시예에서, 본 발명의 CRISPR-연관 단백질(예를 들어, Cas9, Cpf1)을 암호화하는 본 발명의 인공 핵산 분자는 hsa-miR-27a-3p, hsa-miR-99b-5p, hsa-miR-21-5p, hsa-miR-142-5p, hsa-miR-27a-3p, hsa-miR-21-5p, hsa-miR-223-3p, hsa-miR-150-5p, 및 hsa-miR-142-5p로 이루어진 군으로부터 선택된 적어도 하나의 miRNA 서열을 포함한다.
구조물
본 명세서에 정의된 바와 같은 적어도 하나의 암호화 서열을 포함하는 본 발명의 인공 핵산 분자, 바람직하게는 RNA는 본 명세서에 기재된 바와 같은 적어도 하나의 5' UTR 및 적어도 하나의 3'UTR, 및 선택적으로 적어도 하나의 히스톤 스템-루프를 포함한다.
본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)의 3' UTR은 본 명세서에 정의된 바와 같은 폴리(A) 및/또는 폴리(C) 서열을 추가로 포함할 수 있다. 3' UTR의 단일 요소는 본 발명의 인공 핵산 분자, 바람직하게는 RNA의 서열을 따라 5'에서 3'의 순서로 발생할 수 있다.
또한, 본 명세서에 정의된 안정화 서열 (예를 들어, 글로빈 유전자의 UTR로부터 유래됨), IRES 서열 등과 같이 본 명세서에 기재된 바와 같은 추가의 요소가 또한 포함될 수 있다. 각각의 요소는 또한 본 발명의 인공 핵산 분자, 바람직하게는 RNA에서 적어도 한 번 (특히 디- 또는 멀티시스트로닉 구성에서), 예를 들어 두 번 또는 그 이상 반복될 수 있다. 예로서, 단일 요소는 본 발명의 인공 핵산 분자, 바람직하게는 RNA에 다음과 같은 순서로 존재할 수 있다:
5'-암호화 서열-히스톤 스템-루프-폴리(A)/(C) 서열-3'; 또는
5'-암호화 서열-폴리(A)/(C) 서열-히스톤 스템-루프-3'; 또는
5'-암호화 서열-히스톤 스템-루프-폴리아데닐화 신호-3'; 또는
5'-암호화 서열-폴리아데닐화 신호-히스톤 스템-루프-3'; 또는
5'-암호화 서열-히스톤 스템-루프-히스톤 스템-루프-폴리(A)/(C) 서열-3'; 또는
5'-암호화 서열-히스톤 스템-루프-히스톤 스템-루프-폴리아데닐화 신호-3'; 또는
5'-암호화 서열-안정화 서열-폴리(A)/(C) 서열-히스톤 스템-루프-3'; 또는
5'-암호화 서열-안정화 서열-폴리(A)/(C) 서열-폴리(A)/(C) 서열-히스톤 스템-루프-3'; 등.
추가의 실시예에 따르면, 인공 핵산 분자, 바람직하게는 RNA는 바람직하게는 하기 구조적 요소 중 적어도 하나를 추가로 포함한다: 히스톤-스템-루프 구조, 바람직하게는 3' 비번역 영역의 히스톤-스템-루프; 5'-캡 구조; 폴리-A 꼬리; 또는 폴리(C) 서열.
일부 실시예에 따르면, CRISPR-연관 단백질에 더하여, 추가의 펩티드 또는 단백질이 본 명세서에 정의된 바와 같은 적어도 하나의 암호화 서열에 의해 암호화되는 경우, 암호화된 펩티드 또는 단백질은 바람직하게는 히스톤 단백질이 아닌, 리포터 단백질(예를 들어 Luciferase, GFP 및 (eGFP, RFP 또는 BFP와 같은) 그 변이체)이 아닌, 및/또는 알파-글로빈, 갈락토키나아제 및 크산틴:구아닌 포스포리보실 전이효소 (GPT), 하이포크산틴-구아닌 포스포리보실 전이효소 (HGPRT), 베타-갈락토시다아제, 갈락토키나아제, 알칼리 포스파타아제, 분비 배아 알칼리 포스파타아제 (SEAP) 또는 (네오마이신, 퓨로마이신, 히그로마이신 및 제오신에 대한 저항성 유전자와 같은) 저항성 유전자를 포함하는 마커 또는 선택 단백질이 아닌 것이 특히 바람직하다. 바람직한 실시예에서, 인공 핵산 분자, 바람직하게는 RNA는 리포터 유전자 또는 마커 유전자를 암호화하지 않는다. 바람직한 실시예에서, 인공 핵산 분자, 바람직하게는 RNA는 루시퍼라아제를 암호화하지 않는다. 다른 실시예에서, 인공 핵산 분자, 바람직하게는 RNA는 GFP 또는 이의 변이체를 암호화하지 않는다.
구체적으로, 본 발명에 따른 인공 핵산 분자, 특히 RNA는 바람직하게는 5' 내지 3' 방향으로 다음 요소를 포함할 수 있다:
a) 5'-CAP 구조, 바람직하게는 m7GpppN 또는 Cap1
b) 본 명세서에 정의된 바와 같은 5'-UTR로부터 유래된 핵산 서열, 바람직하게는 서열번호: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; 또는 21에 따른 핵산 서열에 상응하는 핵산 서열 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성된 5'-UTR 요소;
c) 본 명세서에 정의된 바와 같은 적어도 하나의 암호화 서열;
d) 본 명세서에 정의된 바와 같은 3'-UTR로부터 유래된 핵산 서열, 바람직하게는 서열번호: 23; 25; 27; 29; 31; 33 또는 35에 따른 핵산 서열에 상응하는 핵산 서열 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성된 3'-UTR 요소;
e) 선택적으로 바람직하게는 10 내지 1000, 10 내지 500, 10 내지 300, 10 내지 200, 10 내지 100, 40 내지 80 또는 50 내지 70 아데노신 뉴클레오티드로 이루어진 폴리 (A) 꼬리,
f) 선택적으로 바람직하게는 10 내지 200, 10 내지 100, 20 내지 70, 20 내지 60 또는 10 내지 40시토신 뉴클레오티드로 이루어진 폴리 (C) 꼬리,
g) 선택적으로 히스톤 스템-루프.
바람직한 인공 핵산 구성물은 아래에서 상세하게 논의된다.
HSD17B4-유래 5' UTR 요소 및 GNAS-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 HSD17B4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 GNAS 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130-8145; 9290-9305; 10402-10408; 10554; 10599-10612, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
SLC7A3-유래 5' UTR 요소 및 GNAS-유래 3'UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 SLC7A3 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 GNAS 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 414; 2346-2361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 9306-9321; 10409-10415; 10555; 10613-10626, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
ATP5A1-유래 5' UTR 요소 및 CASP1-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 ATP5A1 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 CASP1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 415; 2362-2377; 3522-3537; 4682-4697; 5842-5857; 7002-7017; 8162-8177; 9322-9337; 10416-10422; 10556; 10627-10640, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
NDUFA4-유래 5' UTR 요소 및 PSMB3-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 NDUFA4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 PSMB3 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 416; 2378-2393; 3538-3553; 4698-4713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
HSD17B4-유래 5' UTR 요소 및 PSMB3-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 HSD17B4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 PSMB3 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 417; 2394-2409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 9354-9369; 10430-10436; 10558; 10655-10668, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
RPL32-유래 5' UTR 요소 및 ALB-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 RPL32 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 ALB 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
HSD17B4-유래 5' UTR 요소 및 CASP1-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 HSD17B4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 CASP1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 420; 2442-2457; 3602-3617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
SLC7A3-유래 5' UTR 요소 및 CASP1-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 SLC7A3 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 CASP1 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
SLC7A3-유래 5' UTR 요소 및 PSMB3-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 SLC7A3 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 PSMB3 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 422; 2474-2489; 3634-3649; 4794-4809; 5954-5969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 10725-10738, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
NOSIP-유래 5' UTR 요소 및 PSMB3-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 NOSIP 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 PSMB3 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 8290-8305; 9459-9450; 10472-10478; 10564; 10739-10752, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
NDUFA4-유래 5' UTR 요소 및 RPS9-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 NDUFA4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 RPS9 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 8306-8321; 9466-9481; 10479-10485; 10565; 10753-10766, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
HSD17B4-유래 5' UTR 요소 및 RPS9-유래 3' UTR 요소:
일부 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 HSD17B4 유전자의 5'UTR로부터 유래된 적어도 하나의 5'UTR 요소, 또는 이의 상동체, 단편 또는 변이체 및 RPS9 유전자의 3'UTR로부터 유래된 적어도 하나의 3'UTR 요소, 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성되며, 여기서 상기 인공 핵산은 서열번호: 425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 7162-7177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780, 또는 이의 상동체, 변이체 또는 단편, 특히 이들 서열 중 임의의 서열에 대해 선호도가 증가하는 순서대로 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%, 바람직하게는 적어도 70%, 더 바람직하게는 적어도 80%, 더욱 더 바람직하게는 적어도 90% 이상 및 가장 바람직하게는 적어도 95% 또는 심지어 97%의 서열 동일성을 갖는 핵산 서열.
다른 바람직한 실시예에서, 본 발명에 따른 인공 핵산은 하기 본 명세서에 기재된 바와 같은 (또는 이의 상동체, 단편 또는 변이체로부터) 적어도 하나의 5' UTR 및 3' UTR 요소 를 포함하거나 이로 구성되며, 상기 인공 핵산은 특정 UTR-조합 뒤의 괄호 안에 서열번호: 에 따른 핵산 서열을 포함하거나 이로 구성된다:
ATP5A1 / Gnas.1 (서열번호: 9498- 9609; 10493-10499; 10567; 10781-10794);
Ndufa4.1 / COX6B1.1 (서열번호: 9610-9721; 10500-10506; 10568; 10795-10808);
Ndufa4.1 / Gnas.1 (서열번호: 9722-9833; 10507-10513; 10569; 10809-10822);
Ndufa4.1 / Ndufa1.1 (서열번호: 9834-9945; 10514-10520; 10570; 10823-10836);
Nosip.1 / Ndufa1.1 (서열번호: 9946-10057; 10521-10527; 10571; 10837-10850);
Rpl31.1 / Gnas.1 (서열번호: 10058-10169; 10528-10534; 10572; 10851-10864);
TUBB4B.1 / RPS9.1 (서열번호: 10170-10281; 10535-10541; 10573; 10865-10878);
Ubqln2.1 / RPS9.1 (서열번호: 10282-10393; 10542-10548; 10574; 10879-10892).
다른 바람직한 실시예에서, 본 발명의 구성물의 3' 말단은 A64-C30-HSL-N5; A64-HSL-N5; A64-N5; A64-N5; A64-C5-N5; A64-C5-N5; A64-C10-N5; A64-C10-N5; A64-C15-N5; A40-HSL-A50-N5; HSL-N5; A64-HSL-NR; A64-N5; 및 A64-C15-N5로 이루어진 군으로부터 선택된다.
복합체화
바람직한 실시예에서, 본 발명의 적어도 하나의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 기재된 임의의 다른 핵산)는 복합체 형태, 즉 하나 또는 그 이상의 (다가-)양이온성 화합물, 바람직하게는 (다가)양이온성 중합체, (다가-)양이온성 펩타이드 또는 단백질, 예를 들어 프로타민, (다가-)양이온성 다당류 및/또는 (다가-)양이온 지질과 복합체화되거나 결합된 형태로 제공된다. 이와 관련하여, 용어 "복합체화된" 또는 "결합된"은 적어도 하나의 인공 핵산 분자, 바람직하게는 RNA(또는 상기 다른 핵산)와 하나 또는 그 이상의 상기 언급된 화합물을 공유 결합 없이 큰 복합체 또는 어셈블리로 본질적으로 안정한 조합을 지칭한다.
지질
바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA는 하나 또는 그 이상의 리포좀, 리포플렉스, 지질 나노 입자, 또는 나노리포좀을 형성하기 위해 지질(특히 양이온성 및/또는 중성 지질)과 복합체화되거나 결합된다.
따라서, 일부 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 바와 같은 임의의 다른 핵산, 특히 RNA)는 지질-기반 제제의 형태, 특히 상기 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산, 특히 RNA)를 포함하는 리포좀, 리포플렉스, 및/또는 지질 나노 입자의 형태로 제공된다.
지질 나노입자
일부 바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 지질 (특히 양이온성 및/또는 중성 지질)과 복합체화되거나 결합되어 하나 또는 그 이상의 지질 나노 입자를 형성한다. 일부 실시예에서, 본 발명의 나노 입자(들)는 본 명세서에 기재된 바와 같은 CRISPR-연관 단백질을 암호화하는 적어도 하나의 인공 핵산 분자, 및 추가로 본 명세서에 기재된 적어도 하나의 gRNA를 포함한다.
바람직하게는, 지질 나노 입자 (LNP)는 다음을 포함한다: (a) 본 발명의 적어도 하나의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산), (b) 양이온성 지질, (c) 응집 감소제 (예를 들어 폴리에틸렌 글리콜 (PEG) 지질 또는 PEG-변형 지질), (d) 선택적으로 비양이온 성 지질 (예를 들어 중성 지질) 및 (e) 선택적으로, 스테롤.
일부 실시예에서, LNP는 본 발명의 적어도 하나의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)에 더하여, (i) 적어도 하나의 양이온성 지질; (ii) 중성 지질; (iii) 스테롤, 예를 들어 콜레스테롤; 및 (iv) 약 20-60 % 양이온성 지질 : 5-25 % 중성 지질 : 25-55 % 스테롤; 0.5-15 % PEG-지질의 몰비로 PEG-지질을 포함한다.
일부 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)는 아미노알코올 리피도이드로 제형화될 수 있다. 본 발명에 사용될 수 있는 아미노알코올 리피도이드는 그 전문이 본 명세서에 참조로 포함된 미국특허 제 8,450,298 호에 기재된 방법에 의해 제조될 수 있다.
(i) 양이온성 지질
LNP는 지질 나노 입자를 형성하기에 적합한 임의의 양이온성 지질을 포함할 수 있다. 바람직하게는, 양이온성 지질은 대략 생리학적 pH에서 순 양전하를 운반한다.
양이온성 지질은 아미노 지질일 수 있다. 본 명세서에 사용된 용어 "아미노 지질"은 생리학적 pH에서 양이온성 지질을 형성하기 위해 양성자화될 수 있는 하나 또는 두 개의 지방산 또는 지방 알킬 사슬 및 아미노 헤드기(알킬아미노 또는 디알킬아미노기를 포함)를 갖는 지질을 포함하는 것을 의미한다.
양이온성 지질은 예를 들어, N,N-디올레일-N,N-디메틸암모늄클로라이드 (DODAC), N,N-디스테아릴-N,N-디메틸암모늄브로마이드 (DDAB), 1,2-디올레오일트리메틸 암모늄 프로판 클로라이드 (DOTAP) (N-(2,3-디올레오일옥시) 프로필)-N,N,N-트리메틸암모늄 클로라이드 및 1,2-디올레일옥시-3-트리메틸아미노프로판 클로라이드 염으로도 알려져 있음), N-(1-(2,3-디올레일옥시)프로필)-N,N,N-트리메틸암모늄클로라이드 (DOTMA), N,N-디메틸-2,3-디올레일옥시)프로필아민 (DODMA), 1,2-디리놀레일옥시-N,N-디메틸아미노프로판 (DLinDMA), 1,2-디리놀레닐옥시-N,N-디메틸아미노프로판 (DLenDMA), 1,2-디-이-리놀레닐 옥시-N,N-디메틸아미노프로판 (γ1,2-디리놀레일카르바모일옥시-3-디메틸아미노프로판 (DLin-C-DAP), 1,2-디리놀레일옥시-3-(디메틸아미노)아세톡시프로판 (DLin-DAC), 1,2-디리놀레이옥시-3-모르폴리노프로판 (DLin-MA), 1,2-디리놀레오일-3-디메틸아미노프로판 (DLinDAP), 1,2-디리놀레일티오-3-디메틸아미노프로판 (DLin-S-DMA), 1-리놀레오일-2-리놀레일옥시-3-디메틸아미노프로판 (DLin-2-DMAP), 1,2-디리놀레일옥시-3-트리메틸아미노프로판 클로라이드 염 (DLin-TMA.Cl), 1,2-디리놀레오일-3-트리메틸아미노프로판 클로라이드 염 (DLin-TAP.Cl), 1,2-디리놀레일옥시-3-(N-메틸피 페라지노)프로판 (DLin-MPZ), 또는 3-(N,N-디리놀레일아미노)-1,2-프로판디올 (DLinAP), 3-(N,N-디올레일아미노)-1,2-프로판디오 (DOAP), 1,2-디리놀레일옥소-3-(2-N,N-디메틸아미노)에톡시프로판 (DLin-EG-DM A), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란 (DLin-K-DMA) 또는 이의 유사체, (3aR,5s,6aS)-N,N-디메틸-2,2-디((9Z,12Z)-옥타데카-9,12-디에닐)테트라하이드로-3aH-사이클로펜타[d][1,3]디옥솔-5-아민, (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일 4-(디메틸아미노) 부타노에이트 (MC3), 1,1'-(2-(4-(2-((2-(비스(2-하이드록시도데실)아미노)에틸) (2-하이드록시-도데실) 아미노)에틸)(2-하이드록시-도데실)아미노)에틸)피페라진-1-일)에틸아제인디일)디도데칸-2-올(C12-200), 2,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란 (DLin-K-C2-DMA), 2,2-디리놀레일-4-디메틸아미노메틸-[1,3]-디옥솔란 (DLin-K-DMA), (6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일 4-(디메틸아미노) 부타노에이트 (DLin-M-C3-DMA), 3-((6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,3 l-테트라엔-19-일옥시)-N,N-디메틸프로판-1-아민 (MC3 에테르), 4-((6Z,9Z,28Z,31Z)-헵타트리아콘타-6,9,28,31-테트라엔-19-일옥시)-N,N-디메틸부탄-1-아민 (MC4 에테르), 또는 상기의 임의의 조합일 수 있다.
다른 양이온성 지질은 N, N-디스테아릴-N, N-디메틸암모늄 브로마이드 (DDAB), 3P-(N-(N',N'-디메틸아미노에탄)-카르바모일)콜레스테롤 (DC-Choi), N-(1-(2,3-디올레일옥시)프로필)-N-2-(스페르민카르복스아미도)에틸)-N,N-디메틸암모늄트리플루오로아세테이트 (DOSPA), 디옥타데실아미도글리실 카르복시스페르민 (DOGS), 1,2-디올레오일-sn-3-포스포에탄올아민 (DOPE), 1,2-디올레오일-3-디메틸암모늄프로판 (DODAP), N-(1,2-디미리스틸옥시프로프-3-일)-N,N-디메틸-N-하이드록시에틸암모늄브로마이드 (DMRIE), 및 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란 (XTC)을 포함하나, 이에 제한되지는 않는다. 또한, 예를 들어 LIPOFECTIN (GIBCO / BRL에서 입수 가능한 DOTMA 및 DOPE 포함) 및 LIPOFECTAMINE (GISCO/BRL에서 입수 가능한 DOSPA 및 DOPE 포함)과 같은 양이온 성 지질의 상업적 제제가 사용될 수 있다.
다른 적합한 양이온성 지질은 International Publication Nos. WO 09/086558, WO 09/127060, WO 10/048536, WO 10/054406, WO 10/088537, WO 10/129709, 및 WO 2011/153493; U.S. Patent Publication Nos. 2011/0256175, 2012/0128760, 및 2012/0027803; U.S. Patent Nos. 8,158,601; 및 Love et al, PNAS, 107(5), 1864-69, 2010. 에 게시되어 있다.
다른 적합한 아미노 지질은 알킬 치환기가 다른 것을 포함하여 대안적인 지방산기 및 다른 디알킬아미노기를 갖는 것들이 포함된다(예를 들어, N-에틸-N-메틸아미노- 및 N-프로필-N-에틸아미노-). 일반적으로, 덜 포화된 아실 사슬을 갖는 아미노 지질은 특히 필터 멸균을 위해 복합체가 약 0.3 미크론 이하로 크기를 정해야할 때 더 쉽게 크기가 정해진다. C14 내지 C22 범위의 탄소 사슬 길이를 갖는 불포화 지방산을 포함하는 아미노 지질이 사용될 수 있다. 다른 스캐폴드는 또한 아미노기 및 아미노 지질의 지방산 또는 지방 알킬 부분을 분리하기 위해 사용될 수 있다.
일부 실시예에서, 아미노 또는 양이온성 지질은 적어도 하나의 양성자화 가능하거나 탈양성자화가능한 기를 가지므로, 지질은 생리학적 pH(예를 들어 pH 7.4) 또는 그 이하에서 양으로 하전되고, 두 번째 pH, 바람직하게는 생리학적 pH 또는 그 이상에서 중성이다. 물론, pH의 함수로서 양성자의 첨가 또는 제거는 평형 과정이며, 하전된 또는 중성 지질에 대한 언급은 우세한 종의 성질을 지칭하고 모든 지질이 하전된 또는 중성 형태로 존재할 것을 요구하지 않는 것으로 이해 될 것이다. 하나 이상의 양성자화 가능하거나 탈양성자화 가능한 기를 갖거나 양쪽 이온성인 지질은 본 발명의 사용에서 제외되지 않는다.
일부 실시예에서, 양성자화 가능한 지질은 약 4 내지 약 11 범위에서, 예를 들어 약 5 내지 약 7의 pKa인 양성자화 가능기의 pKa를 갖는다.
LNP는 둘 또는 그 이상의 양이온성 지질을 포함할 수 있다. 양이온성 지질은 상이한 유리한 특성에 기여하도록 선택될 수 있다. 예를 들어, 아민 pKa, 화학적 안정성, 순환 반감기, 조직 반감기, 조직 내 순 축적 또는 독성과 같은 특성이 다른 양이온성 지질이 LNP에서 사용될 수 있다. 특히, 양이온성 지질은 혼합-LNP의 특성이 개별 지질의 단일-LNP의 특성보다 더 바람직하도록 선택될 수 있다.
일부 실시예에서, 양이온성 지질은 LNP에 존재하는 총 지질의 약 20 mol % 내지 약 70 또는 75 mol % 또는 약 45 내지 약 65 mol % 또는 약 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 또는 약 70 mol %의 비율로 존재한다. 추가의 실시예에서, LNP는 양이온성 지질의 몰 기준으로 약 25 % 내지 약 75 %, 예를 들어 몰 기준(지질 나노 입자에서 100 % 지질 총 몰 기준)으로 약 20 내지 약 70 %, 약 35 내지 약 65 %, 약 45 내지 약 65 %, 약 60 %, 약 50 % 또는 약 40 %를 차지한다. 일부 실시에에서, 양이온성 지질 대 핵산의 비는 약 3 내지 약 15, 예컨대 약 5 내지 약 13 또는 약 7 내지 약 11이다.
일부 실시예에서, 리포좀은 그 전문이 본 명세서에 참조로 포함된 International Publication No. WO2013/006825A1에 기재된 바와 같이 1:1 내지 20:1 사이의 양이온성 지질 중 질소 원자 대 RNA 중 인산염에 대한 몰 비(N:P 비)를 가질 수 있다. 다른 실시예에서, 리포좀은 20:1 이상 또는 1:1 이하의 N:P 비를 가질 수 있다.
일부 측면에서, 지질은 98N12-5, C12-200 및 cKK-E12로 이루어진 군으로부터 선택된다. 일 실시예에서, 핵산은 아미노알코올 리피도이드로 제형화될 수 있다. 본 발명에 사용될 수 있는 아미노 알코올 리피도이드는 그 전문이 본 명세서에 참조로 포함된 미국특허 제 8,450,298 호에 기재된 방법에 의해 제조될 수 있다.
다른 실시예에서, 이온화 가능한 지질은 그 전문이 본 명세서에 참조로 포함된 국제공개번호 제 WO2015/074085A1 호, 미국특허출원번호 제 61/905,724 호및 제 15/614,499 호, 제 WO2015074085A1 호, 또는 미국특허공개번호 또는 미국특허출원번호 제 9,593,077 호, 제 61/905,724 호, 제 9,593,077 호, 제 9,567,296 호, 제 15/614,499 호 및 제 9,567,296 호에 개시된 바와 같은 화합물일 수 있다.
이온화 가능한 지질은 또한 그 전문이 본 명세서에 참조로 포함된 국제공개번호 제 WO2017/075531A1 호의 표 1, 2 및 3 및 청구항 1-24에 개시된 바와 같은 화합물일 수 있다. 다른 실시예에서, 이온화 가능한 지질은 또한 그 전문이 본 명세서에 참조로 포함된 국제공개번호 제 WO2015/074085A1 호(즉 ATX-001 내지 ATX-032 또는 청구항 1-26에 언급된 화합물), 미국특허출원번호 제 61/905,724 호 및 제 15/614,499 호 또는 미국특허공개번호 제 9,593,077 호 및 제 9,567,296 호에 개시된 바와 같은 화합물일 수 있다.
(ii) 중성 및 비양이온성 지질
비양이온성 지질은 중성 지질, 음이온성 지질 또는 양친매성 지질일 수 있다. 중성 지질은 존재하는 경우 생리학적 pH에서 하전되지 않은 또는 중성 양쪽성 이온 형태로 존재하는 임의의 다수의 지질 종일 수 있다. 이러한 지질은 예를 들어 디아실포스파티딜콜린, 디아실포스파티딜에탄올아민, 세라마이드, 스핑고미엘린, 디하이드로스핑고미엘린, 세팔린 및 세레브로시드를 포함한다. 본 명세서에 기재된 입자에 사용하기 위한 중성 지질의 선택은 일반적으로 예를 들어 혈류에서 LNP 크기 및 LNP의 안정성을 고려하여 안내된다. 바람직하게는, 중성 지질은 2개의 아실기를 갖는 지질 (예를 들어, 디아실포스파티딜콜린 및 디아실포스파티딜에탄올아민)이다.
일부 실시예에서, 중성 지질은 C10 내지 C20 범위의 탄소 사슬 길이를 갖는 포화 지방산을 포함한다. 다른 실시예에서, C10 내지 C20 범위의 탄소 사슬 길이를 갖는 단일 또는 불포화 지방산을 갖는 중성 지질이 사용된다. 또한, 포화 및 불포화 지방산 사슬의 혼합물을 갖는 중성 지질이 사용될 수 있다.
적합한 중성 지질은 디스테아로일포스파티딜콜린 (DSPC), 디올레오일포스파티딜콜린 (DOPC), 디 팔미토일포스파티딜콜린 (DPPC), 디올레오일포스파티딜글리세롤 (DOPG), 디팔미토일포스파티딜글리세롤 (DPPG), 디올레오일-포스파티딜에탄올아민 (DOPE), 팔미토일올레오일포스파티딜콜린 (POPC), 팔미토일올레오일포스파티딜에탄올아민 (POPE), 디올레오일-포스파티딜에탄올아민 4-(N-말레이미도메틸)-사이클로헥산-1-카르복실레이트 (DOPE-mal), 디팔미토일 포스파티딜 에탄올아민 (DPPE), 디미리스토일포스포에탄올아민 (DMPE), 디미리스토일 포스파티딜콜린 (DMPC), 디스테아로일-포스파티딜-에탄올아민 (DSPE), SM, 16-0-모노메틸 PE, 16-O-디메틸 PE, 18-1-트랜스 PE,  1-스테아로일-2-올레오일-포스파티딜에탄올아민 (SOPE), 콜레스테롤, 또는 이들의 혼합물을 포함하지만 이에 제한되지 않는다. LNP에 사용하기에 적합한 음이온성 지질은 포스파티딜 글리세롤, 카디오리핀, 디아실포스파티딜세린, 디아실포스파티드산, N-도데카노일 포스파티딜 에탄올아민, N-숙시닐 포스파티딜에탄올아민, N-글루타릴 포스파티딜에탄올아민, 리실포스파티딜글리세롤, 및 중성 지질에 결합된 다른 음이온성 변형기를 포함하나, 이에 제한되지 않는다.
양친매성 지질은 임의의 적합한 물질을 지칭하며, 상기 지질 물질의 소수성 부분은 소수성 상으로 배향되는 반면, 친수성 부분은 수성 상으로 배향된다. 이러한 화합물은 인지질, 아미노지질 및 스핑고지질을 포함하나, 이에 제한되지는 않는다. 대표적인 인지질은 스핑고마이엘린, 포스파티딜콜린, 포스파티딜에탄올아민, 포스파티딜세린, 포스파티딜이노시톨, 포스파티드산, 팔미토일올레오일 포스파티딜콜린, 리소포스파티딜콜린, 리소포스파티딜디에탄올아민, 디팔미토일포스파티딜콜린, 디올레오일포스파티딜콜린, 디스테아로일포스파티딜콜린, 또는 디리놀레오일포스파티딜콜린을 포함한다. 스핑고지질, 글리코스핑고지질 패밀리, 디아실글리세롤 및 베타-아실옥시산과 같은 다른 인-부족 화합물이 또한 사용될 수 있다.
일부 실시예에서, 비양이온성 지질은 LNP에 존재하는 총 지질의 약 5 mol % 내지 약 90 mol %, 약 5 mol % 내지 약 10 mol %, 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 또는 약 90 mol %의 비로 존재한다.
일부 실시예에서, LNP는 중성 지질의 몰 기준으로 약 0 % 내지 약 15 또는 45 %의 중성 지질, 예를 들어 약 3 내지 약 12 % 또는 약 5 내지 약 10 %를 포함한다. 예를 들어, LNP는 몰 기준(LNP에서 100 % 지질 총 몰 기준)으로 중성지질의 약 15 %, 약 10 %, 약 7.5 % 또는 약 7.1 %을 포함 할 수 있다.
(iii) 스테롤(Sterols)
스테롤은 바람직하게는 콜레스테롤이다.
스테롤은 LNP의 약 10 mol % 내지 약 60 mol % 또는 약 25 mol % 내지 약 40 mol %의 비율로 존재할 수 있다. 일부 실시예에서, 스테롤은 LNP에 존재하는 총 지질의 약 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 또는 약 60 mol %의 비율로 존재한다. 다른 실시예에서, LNP는 스테롤의 몰기준으로 약 5 % 내지 약 50 %, 예를 들어 몰 기준(LNP에서 100 % 지질 총 몰 기준)으로 약 15 % 내지 약 45 %, 약 20 % 내지 약 40 %, 약 48 %, 약 40 %, 약 38.5 %, 약 35 %, 약 34.4 %, 약 31.5 % 또는 약 31 % 를 포함한다.
(iv) 응집 감소제(Aggregation Reducing Agents)
응집 감소제는 응집을 감소시킬 수 있는 지질일 수 있다.
이러한 지질의 예시는 본 명세서에 그 전문이 참조로 포함된 미국 특허 제 6,320,017 호에 기재된 것과 같이 폴리에틸렌 글리콜 (PEG)-변형 지질, 모노시알로강글리오시드 Gml, 및 폴리 아미드 올리고머 (PAO)를 포함하지만 이에 제한되지는 않는다. PEG, Gml 또는 ATTA와 같이 제제화 동안 응집을 방지하는 하전되지 않은, 친수성, 입체 장벽 부분을 갖는 다른 화합물도 지질에 연결될 수 있다. ATTA-지질은 예를 들어 미국 특허 제 6,320,017 호에 기재되어 있고, PEG-지질 접합체는 예를 들어 미국 특허 제 5,820,873 호, 제 5,534,499 호 및 제 5,885,613 호에 기재되어 있으며, 이들 각각은 그 전문이 참조로 포함된다.
응집 감소제는, 예를 들어, PEG-디아실글리세롤 (DAG), PEG-디알킬글리세롤, PEG-디알킬옥시프로필 (DAA), PEG-인지질, PEG-세라마이드 (Cer), 또는 이들의 혼합물 (예를 들어 PEG-Cerl4 또는 PEG-Cer20)을 포함하나 이에 제한되지 않는 폴리에틸렌글리콜 (PEG)-지질로부터 선택될 수 있다. PEG-DAA 접합체는, 예를 들어 PEG-디라우릴옥시프로필 (C12), PEG-디미리스틸옥시프로필 (C14), PEG- 디팔미틸옥시프로필 (C16) 또는 PEG-디스테아릴옥시프로필 (C18)일 수 있다. 다른 페길화된-지질은 폴리에틸렌 글리콜-디디미리스토일 글리세롤 (C14-PEG 또는 PEG-C14, 여기서 PEG의 평균 분자량은 2000 Da) (PEG-DMG); (R)-2,3-비스(옥타데실옥시)프로필-1-(메톡시폴리(에틸렌 글리콜)2000) 프로필카르바메이트) (PEG-DSG); PEG의 평균 분자량이 2000 Da (PEG-cDMA)인 PEG-카르바모일-1,2-디미리스틸옥시프로필아민; N-아세틸갈락토사민-((R)-2,3-비스(옥타데실옥시)프로필-1-(메톡시 폴리(에틸렌 글리콜)2000)프로필카르바메이트)) (GalNAc-PEG-DSG); mPEG (mw2000)-디아스테아로 일포스파티딜-에탄올아민 (PEG-DSPE); 및 폴리에틸렌 글리콜-디팔미토일글리세롤 (PEG-DPG)을 포함하나, 이에 제한되지는 않는다.
일부 실시예에서, 응집 감소제는 PEG-DMG이다. 다른 실시예에서, 응집 감소제는 PEG-c-DMA이다.
다른 실시예에서, PEG-지질은 또한 본 명세서에 그 전문이 참조로 포함된 US20150376115A1 또는 WO2015199952에 개시된 바와 같은 화합물일 수 있다.
LNP 조성
LNP의 조성은 특히 양이온성 지질 성분의 선택, 양이온성 지질 포화도, PEG화의 성질, 모든 성분의 비율 및 그의 크기와 같은 생물물리학적 파라미터에 의해 영향을 받을 수 있다. Semple et al.의 한 예시에서(Semple et al. Nature Biotech. 2010 28: 172-176; 본 명세서에 그 전문이 참조로 포함됨), LNP 조성물은 57.1 % 양이온성 지질, 7.1 % 디팔미토일포스파티딜콜린, 34.3 % 콜레스테롤 및 1.4 % PEG-c-DMA로 구성되었다(Basha et al. Mol Ther. 2011 19:2186-2200; 본 명세서에 그 전문이 참조로 포함됨).
일부 실시예에서, LNP는 약 35 내지 약 45 % 양이온성 지질, 약 40 % 내지 약 50 % 양이온성 지질, 약 50 % 내지 약 60 % 양이온성 지질 및/또는 약 55 % 내지 약 65 % 양이온성 지질을 포함할 수 있다. 일부 실시예에서, 지질 대 핵산의 비는 약 5 : 1 내지 약 20 : 1, 약 10 : 1 내지 약 25 : 1, 약 15 : 1 내지 약 30 : 1 및/또는 적어도 30 : 1의 범위일 수 있다.
PEG-변형 지질에서 PEG 부분의 평균 분자량은 약 500 내지 약 8,000 달톤 (예를 들어, 약 1,000 내지 약 4,000 달톤)일 수 있다. 하나의 바람직한 실시예에서, PEG 부분의 평균 분자량은 약 2,000 달톤이다.
응집 감소제의 농도는 LNP 중 지질 100 % 전체 몰당 약 0.1 내지 약 15 몰 %의 범위일 수 있다. 일부 실시예에서, LNP는 LNP에서 지질의 총 몰을 기준으로 약 3, 2 또는 1 몰 퍼센트 이하의 PEG 또는 PEG-변형 지질을 포함한다. 추가의 실시예에서, LNP는 몰 기준으로 약 0.1 % 내지 약 20 %의 PEG-변형 지질을, 예를 들어 몰 기준으로 약 0.5 내지 약 10 %, 약 0.5 내지 약 5 %, 약 10 %, 약 5 %, 약 3.5 %, 약 1.5 %, 약 0.5 %, 또는 약 0.3 % (LNP에서 지질 100 % 총 몰 기준)을 포함한다.
다른 LNP는 하기 표5에 도시된 바와 같이 (지질 나노입자에서 지질의 총 몰에 기초한) 몰 기준으로 양이온성 지질, 비양이온성(또는 중성) 지질, 스테롤(예를 들어, 콜레스테롤), 및 응집 감소제 (예를 들어, PEG-변형 지질)의 다양한 몰비를 갖는다. 바람직한 실시예에서, 본 발명의 지질 나노 입자 제제는 본질적으로 약 20-70 % 양이온성 지질 : 5-45 % 중성 지질 : 20-55 % 콜레스테롤, 0.5-15 % PEG-변형 지질, 더 바람직하게는 약 20-60 % 양이온성 지질 : 5-25 % 중성 지질 : 25-55 % 콜레스테롤 : 0.5-15 % PEG-변형 지질의 몰비의 지질 혼합물로 구성된다.
지질-기반 제제
# 지질의 몰비
(지질 나노 입자에서 지질의 전체 몰 100%를 기준으로 함)
양이온성 지질 비-양이온성 (또는 중성) 지질 스테롤 응집 감소제 (예를 들어, PEG-지질)
1 약 35% 내지 약 65 % 약 3% 내지 약 12% or 15 % 약 15% 내지 약 45 % 약 0.1% 내지 약 10% (바람직하게는 약 0.5% 내지 약 2% or 3%
2 약 20% 내지 약 70% 약 5% 내지 약 45% 약 20% 내지 약 55% 약 0.1% 내지 약 10% (바람직하게는 약 0.5% 내지 약 2% or 3%
3 약 45% 내지 약 65% 약 5% 내지 약 10% 약 5% 내지 약 45% 약 0.1% 내지 약 3%
4 약 20% 내지 약 60% 약 5% 내지 약 25% 약 25% 내지 약 40% 약 0.1% 내지 약 5% (바람직하게는 약 0.1% 내지 약 3%)
5 약 40% 약 10% 약 25% 내지 약 55% 약 10%
6 약 35% 약 15% 약 10%
7 약 52% 약 13% 약 5%
8 약 50% 약 10% 약 1.5%
일부 실시예에서, LNP는 하기 더욱 상세하게 기재된 바와 같이 리포좀 또는 리포플렉스로서 발생한다.
LNP 크기
일부 실시예에서, LNP는 약 50 nm 내지 약 300 nm, 예를 들어 약 50 nm 내지 약 250 nm, 예를 들어 약 50 nm 내지 약 200 nm의 중앙 직경 크기를 갖는다.
일부 실시예에서, 더 작은 LNP가 사용될 수 있다. 이러한 입자는 0.1 um 이하, 1.0 um 이하, 5 um 이하, 10 um 이하, 15 um 이하, 20 um 이하, 25 um 이하, 30 um 이하, 35 um 이하, 40 um 이하, 50 um 이하 55um 이하, 60um 이하, 65um 이하, 70um 이하, 75um 이하, 80um 이하, 85um 이하, 90um 이하, 95um 이하, 100um 이하 125um 이하, 150um 이하, 175um 이하, 200um 이하, 225um 이하, 250um 이하, 275um 이하, 300um 이하, 325um 이하, 350um 이하 375um 이하, 400um 이하, 425um 이하, 450um 이하, 475um 이하, 500um 이하, 525um 이하, 550um 이하, 575um 이하, 575um 이하, 600um 이하 , 625um 이하, 650um 이하, 675um 이하, 700um 이하, 725um 이하, 750um 이하, 775um 이하, 775um 이하, 800um 이하, 825um 이하, 850um 이하 875um 이하, 900um 이하, 925um 이하, 950um 이하, 975um 이하와 같은 0.1 um 이하 내지 100 ㎚의 직경을 포함할 수 있지만, 이에 제한되지는 않는다. 다른 실시예에서, 핵산은 약 1 nm 내지 약 100 nm, 약 1 nm 내지 약 10 nm, 약 1 nm 내지 약 20 nm, 약 1 nm 내지 약 30 nm, 약 1 nm 내지 약 40 nm, 약 1 nm 내지 약 50 nm, 약 1 nm 내지 약 50 nm 약 60nm, 약 1nm 내지 약 70nm, 약 1nm 내지 약 80nm, 약 1nm 내지 약 90nm, 약 5nm 내지 약 100nm, 약 5nm 내지 약 10nm, 약 5nm 내지 약 20nm, 약 5nm 내지 약 30nm, 약 5nm 내지 약 40nm, 약 5nm 내지 약 50nm, 약 5nm 내지 약 60nm, 약 5nm 내지 약 60nm 70 nm, 약 5 nm 내지 약 80 nm, 약 5 nm 내지 약 90 nm, 약 10 내지 약 50 nM, 약 20 내지 약 50 nm, 약 30 내지 약 50 nm, 약 40 내지 약 50 nm, 약 20 내지 약 60nm, 약 30 내지 약 60nm, 약 40 내지 약 60nm, 약 20 내지 약 70nm, 약 30 내지 약 70nm, 약 40 내지 약 70nm, 약 50 내지 약 70nm, 약 60 내지 약 70nm, 약 20 내지 약 80nm, abou로부터 t 30 내지 약 80nm, 약 40 내지 약 80nm, 약 50 내지 약 80nm, 약 60 내지 약 80nm, 약 20 내지 약 90nm, 약 30 내지 약 90nm, 약 40 약 90 nm, 약 50 내지 약 90 nm, 약 60 내지 약 90 nm 및/또는 약 70 내지 약 90 nm의 직경을 포함할 수 있는 더 작은 LNP를 사용하여 전달될 수 있다.
일부 실시예에서, LNP는 100 nm보다 큰, 150 nm보다 큰, 200 nm보다 큰, 250 nm보다 큰, 300 nm보다 큰, 350 nm보다 큰, 400 nm보다 큰, 450 nm보다 큰, 500 nm보다 큰, 550 nm보다 큰, 600 nm보다 큰, 650 nm보다 큰, 700 nm보다 큰, 750 nm보다 큰, 800 nm보다 큰, 850 nm보다 큰, 900 nm보다 큰, 950 nm보다 큰 또는 1000 nm보다 큰 직경을 가질 수 있다.
다른 실시예에서, LNP는 단일 모드 입자 크기 분포를 갖는다(즉, 이들은 이중- 또는 다중-모드가 아님).
다른 성분
LNP는 상기 언급된 것 이외에 하나 또는 그 이상의 지질 및/또는 다른 성분을 추가로 포함할 수 있다.
지질 산화를 방지하거나 리간드를 리포좀 표면에 부착시키는 것과 같은 다양한 목적을 위해 다른 지질이 리포좀 조성물에 포함될 수 있다. 양친매성, 중성, 양이온성 및 음이온성 지질을 포함하여 다수의 지질 중 임의의 것이 LNP에 존재할 수 있다. 이러한 지질은 단독으로 또는 조합하여 사용될 수 있다.
LNP에 존재할 수 있는 추가 성분은 폴리아미드 올리고머와 같은 이중층 안정화 성분 (예를 들어, 전체 내용이 참조로 포함된 미국 특허 제 6,320,017 호 참조), 펩티드, 단백질 및 세제를 포함한다.
리포좀
일부 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA의 조합(또는 본 명세서에 정의된 임의의 다른 핵산)은 리포좀으로서 제형화된다.
양이온성 지질-기반 리포좀은 정전기적 상호작용을 통해 음으로 하전된 핵산(예를 들어, RNA)과 복합체를 형성할 수 있어 생체 적합성, 낮은 독성 및 생체내 임상 적용에 필요한 대규모 생산 가능성을 제공하는 복합체를 생성한다. 리포좀은 흡수를 위해 원형질막과 융합될 수 있다; 일단 세포 내부에서, 리포좀은 식균작용 경로를 통해 처리되고 핵산은 엔도솜/담체에서 세포질로 방출된다. 리포좀은 기본적으로 생물학적 막의 유사체이고 천연 및 합성 인지질 모두로부터 제조될 수 있다는 점에서 리포좀은 우수한 생체 적합성으로 인해 약물 전달 비히클로 오랫동안 인식되어왔다 (Int J Nanomedicine. 2014; 9: 1833-1843).
리포좀은 전형적으로 수성 코어를 둘러싸는 양이온성, 음이온성 또는 중성 (인)지질 및 콜레스테롤로 구성될 수 있는 지질 이중층으로 구성된다. 지질 이중층 및 수성 공간은 각각 소수성 또는 친수성 화합물을 포함할 수 있다. 리포좀은 하나 또는 그 이상의 지질막을 가질 수 있다. 리포좀은 유니라멜라로 지칭되는 단일층이거나 멀티라멜라로 지칭되는 다중층일 수 있다.
생체 내 리포좀 특성 및 작용은 친수성 중합체 코팅, 예를 들어 폴리에틸렌 글리콜 (PEG)을 리포좀 표면에 첨가하여 입체 안정화를 제공함으로써 변형될 수 있다. 또한, 리포좀은 리간드 (예를 들어, 항체, 펩티드 및 탄수화물)를 그 표면 또는 부착된 PEG 사슬의 말단에 부착함으로써 특정 표적화에 사용될 수 있다 (Front Pharmacol. 2015 Dec 1;6:286).
리포좀은 전형적으로 구형 소포로 존재하며 크기는 20 nm 내지 수 미크론 범위일 수 있다.
리포좀은 직경이 수백 나노미터일 수 있고 좁은 수성 구획에 의해 분리된 일련의 동심원의 이중층을 포함할 수 있는 다중라멜라 소포(MLV), 50 nm보다 작은 직경인 작은 단세포 소포(SUV), 및 50 내지 500 nm 사이의 직경일 수 있는 큰 유니라멜라 소포(LUV)와 같이 상이한 크기일 수 있지만, 이에 제한되지는 않는다. 리포좀 디자인은 건강하지 않은 조직에 대한 리포좀의 부착을 개선하거나 엔도사이토시스와 같은, 하지만 이에 제한되지 않는 이벤트를 활성화시키기 위해 옵소닌 또는 리간드를 포함할 수 있으나, 이에 제한되지는 않는다. 리포좀은 약제학적 제형의 전달을 향상시키기 위해 낮은 또는 높은 pH를 포함할 수 있다.
비제한적인 예로서, 합성 막 소포와 같은 리포좀은 각각의 내용의 그 전문이 본 명세서에 참조로 포함된 미국특허공개번호 제 US20130177638 호, 제 US20130177637 호, 제 US20130177636 호, 제 US20130177635 호, 제 US20130177634 호, 제 US20130177633 호, 제 US20130183375 호, 제 US20130183373 호 및 US20130183372 호에 기재된 방법, 기구 및 장치에 의해 제조될 수 있다. 본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 키트 (또는 본 명세서에 정의된 임의의 다른 핵산, 특히 RNA)는 리포좀에 의해 캡슐화될 수 있고/있거나 이는 리포좀에 의해 캡슐화될 수 있는 수성 코어에 포함된다(국제공개번호 제 WO2012031046 호, 제WO2012031043 호, 제 WO2012030901 호 및 제 WO2012006378 호 및 미국특허공개번호 제 US20130189351 호, 제 20130195969 호 및 제 US20130202684 호; 각각의 내용의 그 전문이 본 명세서에 참조로 포함됨).
일부 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 본 발명에 정의된 바와 같은 임의의 다른 핵산)는 리포좀, 예를 들어 DiLa2 리포좀 (Marina Biotech, Bothell, WA), SMARTICLES®(Marina Biotech, Bothell, WA), 중성 DOPC (l,2-디올레오-sn-글리세로-3-포스포콜린) 기반 리포좀(예를 들어 난소암에 siRNA 전달(Landen et al. Cancer Biology & Therapy 2006 5(12)1708-1713); 그 전문이 본 명세서에 참조로 포함됨) 및 히알루로난-코팅된 리포좀 (Quiet Therapeutics, Israel)으로 제형화될 수 있지만, 이에 제한되지는 않는다.
리포플렉스
일부 실시예에서, 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)는 리포플렉스, 즉 핵산층 사이에 끼여 있는 양이온성 지질 이중층으로서 제형화된다.
DOTAP(1,2-dioleoyl-3-trimethylammonium-propane) 및 DOTMA(N-[1-(2,3-dioleoyloxy)propyl]-N,N,N-trimethyl-ammonium methyl sulfate)와 같은 양이온성 지질은 높은 시험관내 형질 주입 효율을 제공하는 정전기적 상호 작용에 의해 나노 입자를 형성하여 음으로 하전된 핵산과 복합체 또는 리포플렉스를 형성할 수 있다.
나노리포좀
일부 실시예에서, 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)는 1,2-dioleoyl-sn-glycero-3- phosphatidylcholine (DOPC) 기반 나노리포좀과 같은 중성 지질 기반 나노리포좀으로 제형화된다(Adv Drug Deliv Rev. 2014 Feb; 66: 110-116.).
에멀젼
일부 실시예에서, 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)는 에멀젼으로 제형화된다. 다른 실시예에서, 상기 인공 핵산 분자, 바람직하게는 RNA는 양이온 성 수중유 에멀젼으로 제형화되며, 여기서 에멀젼 입자는 분자를 에멀젼 입자에 고정시키는 핵산 (들)과 상호 작용할 수 있는 오일 코어 및 양이온성 지질을 포함한다 (국제공개번호 제 WO2012006380 호; 본 명세서에 그 전문이 참조로 포함됨). 일부 실시예에서, 상기 인공 핵산 분자, 바람직하게는 RNA는 친수성 상이 분산되는 연속적인 소수성 상을 포함하는 유중수 에멀젼으로 제형화된다. 비제한적인 예로서, 에멀젼은 국제공개번호 제 WO201087791 호에 기재된 방법에 의해 제조될 수 있으며, 이의 내용은 그 전문이 본 명세서에 참조로 포함된다.
(다가-)양이온성 화합물 및 담체
바람직한 실시예에서, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)는 양이온성 또는 다가양이온성 화합물("(다가-)양이온성 화합물") 및/또는 중합체성 담체와 착화되거나 결합된다.
용어 "(다가-) 양이온성 화합물"은 전형적으로 1 내지 9의 pH 값, 바람직하게는 9 이하 (예를 들어 5 내지 9)의 pH 값, 또는 8 이하 (예를 들어 5 내지 8), 또는 7 이하 (예 : 5 내지 7), 가장 바람직하게는 생리학적 pH, 예를 들어 7.3에서 7.4에서 양으로 하전된 (양이온) 전형적으로 하전된 분자를 지칭한다.
따라서, "(다가-)양이온성 화합물"은 생리학적 조건 하에서, 특히 생체내 생리학적 조건 하에서 양으로 하전된, 임의의 양으로 하전된 화합물 또는 중합체, 바람직하게는 양이온성 펩티드 또는 단백질일 수 있다. "(다가-)양이온성 펩티드 또는 단백질"은 예를 들어 Arg, His, Lys 또는 Orn에서 선택된 적어도 하나의 양으로 하전된 아미노산, 또는 하나 이상의 양으로 하전된 아미노산을 포함할 수 있다.
(다가-)양이온성 아미노산, 펩티드 및 단백질
본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)의 복합체화 또는 회합에 특히 바람직한 제제인 (다가-)양이온성 화합물은 프로타민, 뉴클레오린, 스퍼민 또는 스페르미딘, 또는 다른 양이온성 펩티드 또는 단백질, 예를 들어 폴리-L-리신(PLL), 폴리-아르기닌, 염기성 폴리펩티드, HIV-결합 펩티드를 포함하는 세포 침투 펩티드(CPPs), HIV-1 Tat (HIV), Tat-유래 펩티드, 페너트라틴, VP22 유래 또는 유사 펩티드, HSV VP22 (Herpes simplex), MAP, KALA 또는 단백질 형질 도입 도메인 (PTD), PpT620, 프롤린-풍부 펩티드, 아르기닌-풍부 펩티드, 리신-풍부 펩티드 , MPG-펩티드(들), Pep-1, L-올리고머, 칼시토닌 펩티드(들), 안테나페디아-유도 펩티드 (특히 Drosophila antennapedia), pAntp, pIsl, FGF, 락토페린, 트랜스포탄, 부포린-2, Bac715-24 , SynB, SynB(1), pVEC, hCT-유래 펩티드, SAP 또는 히스톤을 포함한다.
보다 바람직하게는, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)는 하나 또는 그 이상의 다가양이온, 바람직하게는 프로타민 또는 올리고펙타민(하기에서 논의됨), 가장 바람직하게는 프로타민과 복합체화된다. 이와 관련하여, 프로타민이 특히 바람직하다.
또한, 바람직한 (다가-)양이온성 단백질 또는 펩티드는 하기 전체 화학식 (III)을 갖는 하기 단백질 또는 펩티드로부터 선택될 수 있다:
(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x, (화학식 (III))
상기 l + m + n + o + x = 8-15이고, l, m, n 또는 o는 Arg, Lys, His 및 Orn의 전체 함량이 올리고펩티드의 모든 아미노산의 적어도 50 %을 나타낸다면 서로 독립적으로 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15 중에서 선택된 임의의 수일 수 있고; Xaa는 Arg, Lys, His 또는 Orn을 제외한 천연 (= 자연적으로 발생하는) 또는 비-천연 아미노산으로부터 선택된 임의의 아미노산일 수 있고; Xaa의 전체 함량이 올리고펩티드의 모든 아미노산의 50 %를 초과하지 않는 한, x는 0, 1, 2, 3 또는 4 중에서 선택된 임의의 수일 수 있다. 이와 관련하여 특히 바람직한 양이온성 펩티드는 예를 들어 Arg7, Arg8, Arg9, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R, 등이다. 이와 관련하여, WO 2009/030481의 개시 내용은 본 명세서에 참조로 포함된다.
(다가-)양이온성 다당류
본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 임의의 다른 핵산)의 착화 또는 회합을 위한 추가의 바람직한 (다가)양이온성 화합물은 키토산, 폴리브렌과 같은 (다가)양이온성 다당류, 폴리에틸렌이민(PEI)과 같은 양이온성 중합체를 포함한다.
(다가-)양이온성 지질
본 발명의 인공 핵산 분자, 바람직하게는 RNA의 복합체화 또는 회합을 위한 추가의 바람직한 (다가-)양이온성 화합물 (또는 본 명세서에 정의된 임의의 다른 핵산)은 예를 들어 DOTMA: [1-(2,3-시 올레일옥시)프로필)]-N,N,N-트리메틸암모늄 클로라이드, DMRIE, 디-C14-아미딘, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: 디올레일 포스파티딜에탄올-아민, DOSPA, DODAB, DOIC, DMEPC, DOGS: 디옥타데실아미도글리실스퍼민, DIMRI: 디미리스토-옥시프로필 디메틸 하이드록시에틸 암모늄 브로마이드, DOTAP: 디올레오일옥시-3-트리메틸암모늄)프로판, DC-6-14: O,O-디테트라데카노일-N-(알파-트리메틸암모늄아세틸)디에탄올아민 클로라이드, CLIP1: rac-[(2,3-디옥타데실옥시프로필)(2-하이드록시에틸)]-디메틸암모늄 클로라이드, CLIP6: rac-[2(2,3-디헥사데실옥시프로필-옥시메틸옥시)에틸]트리메틸암모늄, CLIP9: rac-[2(2,3-디헥사데실옥시프로필-옥시숙시닐옥시)에틸]-트리메틸암모늄, 또는 올리고펙타민과 같은 (다가-)양이온성 지질을 포함한다.
(다가-)양이온성 중합체
본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 임의의 다른 핵산)의 복합체화 또는 회합을 위한 추가의 바람직한 (다가-)양이온성 화합물은 (다가-)양이온성 중합체, 예를 들어 베타-아미노산-중합체 또는 역 폴리아미드 등과 같은 변형된 폴리아미노산, PVP (폴리(N-에틸-4-비닐피리디늄 브로마이드)) 등과 같은 변형된 폴리에틸렌, pDMAEMA (폴리(디메틸아미노에틸 메틸아크릴레이트)) 등과 같은 변형된 아크릴레이트, pAMAM (폴리(아미도아민)) 등과 같은 변형된 아미도아민, 디아민 말단 변형된 1,4 부탄디올 디아크릴레이트-co-5-아미노-1-펜타놀 중합체 등과 같은 변형된 폴리베타아미노에스테르 (PBAE), 폴리프로필아민 덴드리머 또는 pAMAM계 덴드리머 등과 같은 덴드리머, PEI : 폴리(에틸렌이민), 폴리(프로필렌이민) 등과 같은 폴리이민(들), 사이클로덱스트린계 중합체, 덱스트란계 중합체, 키토산 등과 같은 당 백본 기반 중합체, PMOXA-PDMS 공중합체 등과 같은 실란 백본 기반 중합체 또는 하나 또는 그 이상의 양이온성 블록(예를 들어, 상기 언급된 양이온성 중합체로부터 선택됨)의 조합 및 하나 또는 그 이상의 친수성 또는 소수성 블록(예를 들어 폴리에틸렌글리콜)의 조합으로 이루어진 블록중합체를 포함한다.
중합체성 담체
바람직한 실시예에 따르면, 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)는 중합체성 담체와 복합체화되거나 회합된다.
본 발명에 따라 사용되는 "중합체성 담체"는 이황화-교차 결합 양이온성 성분에 의해 형성된 중합체성 담체일 수 있다. 이황화-교차 결합 양이온성 성분은 서로 동일하거나 상이할 수 있다. 중합체성 담체는 또한 추가 성분을 포함할 수 있다.
또한, 본 발명에 따라 사용되는 중합체성 담체는 양이온성 펩티드, 단백질 또는 중합체 및 선택적으로 본 명세서에 기재된 바와 같은 이황화 결합으로 교차 결합된 본 명세서에 정의된 바와 같은 추가적인 성분의 혼합물을 포함하는 것이 특히 바람직하다. 이와 관련하여, WO 2012/013326의 개시 내용은 여기서 참조로 포함된다.
이와 관련하여, 이황화-교차 결합에 의해 중합체성 담체의 기초를 형성하는 양이온성 성분은 전형적으로 이러한 목적에 적합한 임의의 적합한 (다가-)양성자성 펩티드, 단백질 또는 중합체, 특히 본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)를 복합체화하고, 이에 의해 축합시킬 수 있는 임의의 (다가-)양이온성 펩티드, 단백질 또는 중합체로부터 선택된다. (다가-)양이온성 펩티드, 단백질 또는 중합체는 바람직하게는 선형 분자이지만, 분지형 (다가-)양이온성 펩티드, 단백질 또는 중합체가 또한 사용될 수 있다.
인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)를 복합체화하는 데 사용될 수 있는 중합체성 담체의 모든 이황화-교차 결합 (다가-)양이온성 단백질, 펩티드 또는 중합체는 본 명세서에 언급된 바와 같이 중합체성 담체의 양이온성 성분으로서 적어도 하나의 추가적인 (다가-)양이온성 단백질, 펩티드 또는 중합체와 축합시 이황화 결합을 형성할 수 있는 적어도 하나의 -SH 부분, 가장 바람직하게는 적어도 하나의 시스테인 잔기 또는 -SH 부분을 나타내는 추가적인 화학기를 포함한다.
상기 정의된 바와 같이, 본 발명의 인공 핵산 분자, 바람직하게는 RNA(또는 본 명세서에 정의된 임의의 다른 핵산)를 복합체화하는데 사용될 수 있는 중합체성 담체는 이황화-교차결합된 양이온성 (또는 다가양이온성) 성분에 의해 형성될 수 있다. 바람직하게는, 적어도 하나의 -SH 부분을 포함하거나 포함하도록 추가로 변형된 중합체성 담체의 이러한 (다가-)양이온성 펩티드 또는 단백질 또는 중합체는 본 명세서에 정의된 바와 같은 단백질, 펩티드 및 중합체로부터 선택된다.
일부 실시예에서, 중합체성 담체는 일반 화학식 (IV)에 따른 중합체 담체 분자로부터 선택될 수 있다:
L-P1-S-[S-P2-S]n-S-P3-L 화학식 (IV)
상기,
P1 및 P3은 서로 상이하거나 동일하며 선형 또는 분지형 친수성 중합체 사슬을 나타내며, 각각의 P1 및 P3은 성분 P2와의 축합시 이황화 결합을 형성할 수 있거나, 대안적으로 이러한 성분이 P1과 P2 또는 P3과 P2의 링커로 사용되는 경우 (AA), (AA)x, 또는 [(AA)x]z와 이황화 결합을 형성할 수 있고/있거나 추가 성분(예를 들어 (AA), (AA)x, [(AA)x]z 또는 L), 폴리에틸렌 글리콜 (PEG), 폴리-N-(2-하이드록시프로필)메타크릴아미드, 폴리-2-(메타크릴로일옥시)에틸 포스포릴콜린, 폴리(하이드록시알킬 L-아스파라긴), 폴리(2-(메타크릴로일옥시)에틸 포스포릴콜린), 하이드록시 에틸스타치 또는 폴리(하이드록시알킬 L-글루타민)로부터 서로 독립적으로 선택된 선형 또는 분지형 친수성 중합체 사슬; 약 1 kDa 내지 약 100 kDa, 바람직하게는 약 2 kDa 내지 약 25 kDa; 또는 더욱 바람직하게는 약 2 kDa 내지 약 10 kDa, 예를 들어 약 5 kDa 내지 약 25 kDa 또는 5 kDa 내지 약 10 kDa;의 분자량을 나타내는 상기 친수성 중합체 사슬과 이황화 결합을 형성할 수 있는 적어도 하나의 -SH-부분을 나타낸다.
P2는 예를 들어 상기 정의된 바와 같은 이황화-공유 결합된 양이온 성분에 의해 형성되고 바람직하게는 약 3 내지 약 100 개의 아미노산 길이, 보다 바람직하게는 약 3 내지 약 50 개의 아미노산 길이, 더욱 더 바람직하게는 약 3 내지 약 25 개의 아미노산, 예를 들어 약 3 내지 10, 5 내지 15, 10 내지 20 또는 15 내지 25 개의 아미노산 길이, 더욱 바람직하게는 약 5 내지 약 20의 길이, 및 심지어 더욱 더 바람직하게는 약 10 내지 약 20의 길이를 갖는 중합체성 담체에 대한 (다가-)양이온성 펩티드 또는 단백질이다; 또는
예를 들어 전형적으로 약 1 kDa 내지 약 20 kDa, 더욱 더 바람직하게는 약 1.5 kDa 내지 약 10kDa의 분자량을 포함하는 약 0.5 kDa 내지 약 30 kDa의 분자량을 갖는 또는 약 10kDa 내지 약 50kDa, 더욱더 바람직하게는 약 10kDa 내지 약 30kDa의 분자량을 포함하는 약0.5kDa 내지 약100kDa의 분자량을 갖는 이황화-교차 결합된 양이온성 성분에 의해 형성된 중합체성 담체에 대해 상기 정의된 바와 같은 (다가-)양이온성 중합체이다;
각각의 P2는 적어도 2 개의 -SH- 부분을 나타내며, 추가의 성분 P2 또는 성분 (들) P1 및/또는 P3과의 축합시 또는 대안적으로 추가 성분(예를 들어 (AA), (AA)x, 또는 [(AA)x]z)과의 축합시에 이황화 결합을 형성할 수 있다;
-S-S- 는 (가역적) 이황화 결합이고 (가독성을 높이기 위해 괄호는 생략됨), 상기 S는 바람직하게는 (가역적) 이황화 결합을 형성한 황 또는 -SH 운반 부분을 나타낸다. (가역적) 이황화 결합은 바람직하게는 성분 P1 및 P2, P2 및 P2, or P2 및 P3 의 -SH- 부분의 축합, 또는 선택적으로 본 명세서에 정의된 바와 같은 추가의 성분 (예를 들어 L, (AA), (AA)x, [(AA)x]z, 등)의 축합에 의헤 형성된다; -SH- 부분은 이들 성분의 구조의 일부일 수 있거나 하기 정의된 바와 같은 변형에 의해 첨가될 수 있다;
L은 존재하거나 존재하지 않을 수 있는 선택적 리간드이며, RGD, 트랜스페린, 엽산, 신호 펩티드 또는 신호 서열, 위치 신호 또는 서열, 핵 위치 신호 또는 서열 (NLS), 항체, 세포 침투 펩티드 (예를 들어 TAT 또는 KALA), 수용체의 리간드 (예를 들어 사이토카인, 호르몬, 성장 인자 등), 소분자 (예를 들어 만노스 또는 갈락토스와 같은 탄수화물 또는 합성 리간드), 소분자 작용제, 수용체의 억제제 또는 길항제 (예를 들어 RGD 펩티도미메틱 유사체), 또는 본 명세서에 정의된 임의의 추가 단백질 등으로부터 서로 독립적으로 선택될 수 있다.;
n은 전형적으로 예를 들어 약 4 내지 9, 4 내지 10, 3 내지 20, 4 내지 20, 5 내지 20 또는 10 내지 20의 범위, 또는 약 3 내지 15, 4 내지 15, 5 내지 15, 또는 10 내지 15의 범위, 또는 약 6 내지 11또는 약 7 내지 10의 범위를 포함하는 약 1 내지 50의 범위, 바람직하게는 약 1, 2 또는 3 내지 30의 범위, 보다 바람직하게는 약 1, 2, 3, 4 또는 5 내지 25의 범위, 또는 약 1, 2, 3, 4 또는 5 내지 20의 범위, 또는 약 1, 2, 3, 4 또는 5 내지 15의 범위, 또는 약 1, 2, 3, 4, 또는 5 내지 10의 범위에서 선택되는 정수이다. 가장 바람직하게는, n은 약 1, 2, 3, 4 또는 5 내지 10의 범위, 더욱 바람직하게는 약 1, 2, 3, 또는 4 내지 9의 범위, 약 1, 2, 3 또는 4 내지 8의 범위, 또는 약 1, 2 또는 3 내지 7의 범위에 있다.
이와 관련하여, WO 2011/026641의 개시 내용은 본 명세서에 참조로 포함된다. 각각의 친수성 중합체 P1 및 P3은 전형적으로 적어도 하나의 -SH-부분을 나타내며, 상기 적어도 하나의 -SH- 부분은 아래 정의된 바와 같이 P1과 P2 또는 P3과 P2 사이의 링커로서 사용되는 경우 성분 P2 또는 성분 (AA) 또는 (AA)x와 반응시 이황화 결합을 형성할 수 있고 예를 들어 2개 또는 그 이상의 -SH- 부분이 포함된 경우 선택적으로 추가 성분, 예를 들어 L 및/또는 (AA) 또는 (AA)x와 반응시 이황화 결합을 형성할 수 있다. 상기 일반 화학식 (IV) (가독성을 높이기 위해 괄호는 생략됨)에서 S, P1 및 P3 중 임의의 것은 본 명세서에 정의된 바와 같은 하기 하위 식 " P1-S-S-P2" 및 " P2-S-S-P3"은 전형적으로 상기 친수성 중합체 P1 및 P3의 하나의 -SH-부분이 상기 일반 화학식 (IV)의 성분 P2의 하나의 -SH-부분과 축합된, 상기 -SH- 부분의 모든 황은 화학식 (IV)에서 정의된 바와 같이 이황화 결합 -S-S-를 형성하는 상황을 나타낸다. 이들 -SH- 부분은 전형적으로 예를 들어 내부 시스테인 또는 -SH 부분을 갖는 임의의 추가적인 (변형된) 아미노산 또는 화합물을 통해 각각의 친수성 중합체 P1 및 P3에 의해 제공된다. 따라서, 하위 식 " P1-S-S-P2" 및 " P1-S-S-P3"은 또한 -SH- 부분이 시스테인에 의해 제공되는 경우 " P1-Cys-Cys-P2" 및 "P2-Cys-Cys- P3"으로 기록될 수 있으며, 상기 용어 Cys-Cys는 펩티드 결합이 아닌 이황화 결합을 통해 연결된 2개의 시스테인을 나타낸다. 이 경우, 이들 식에서 용어 "-S-S-"는 또한 "-S-Cys", "-Cys-S" 또는 "-Cys-Cys-"로 표기될 수 있다. 이와 관련하여, 용어 "-Cys-Cys-"는 펩티드 결합이 아니라, 이황화 결합을 형성하는 -SH- 부분을 통한 2개의 시스테인의 연결을 나타낸다. 따라서, 용어 "-Cys-Cys-"는 또한 일반적으로 "-(Cys-S)-(S-Cys)-"로 이해될 수 있으며, 이러한 특정 경우에 상기 S는 시스테인의 -SH- 부분의 황을 나타낸다. 마찬가지로, 용어 "-S-Cys"및 "-Cys-S"는 -SH 포함 부분과 시스테인 사이의 이황화 결합을 나타내며, 이는 "-S-(S-Cys)"및 "-(Cys-S)-S”로 기재될 수 있다. 대안적으로, 친수성 중합체 P1 및 P3은 -SH 부분으로, 바람직하게는 -SH 부분을 갖는 화합물과의 화학 반응을 통해 변형되어, 각각의 친수성 중합체 P1 및 P3은 적어도 하나의 이러한 -SH 부분을 보유할 수 있다. -SH 부분을 갖는 이러한 화합물은 예를 들어 (추가) 시스테인 또는 -SH 부분을 갖는 임의의 추가의 (변형된) 아미노산일 수 있다. 이러한 화합물은 또한 본원에 정의된 바와 같이 친수성 중합체 P1 및 P3에 -SH 부분을 포함하거나 도입할 수 있는 임의의 비-아미노 화합물 또는 부분일 수 있다. 이러한 비-아미노 화합물은 화학적 반응 또는 화합물의 결합, 예를 들어 3-티오 프로피온산 또는 티오이몰레인의 결합에 의해, 아미드 형성(예를 들어 카르복실산, 술폰산, 아민, 등)에 의해, 마이클 첨가(예를 들어 말레인이미드 부분, α,β불포화 카르보닐, 등)에 의해, 클릭 케미스트리(예를 들어 아자이드 또는 알킨)에 의해, 알켄/알킨 복분해 (예를 들어 알켄 또는 알킨), 이민 또는 하이드라존 형성(알데히드 또는 케톤, 하이드라진, 하이드록실아민, 아민), 복합체화 반응(아비딘, 비오틴, 단백질 G) 또는 Sn-형 치환 반응(예를 들어 할로알칸, 티올, 알코올, 아민, 하이드라진, 하이드라지드, 술폰산 에스테르, 옥시포스포늄 염)을 허용하는 성분 또는 추가 성분의 부착에 사용될 수 있는 다른 화학적 부분에 의해 본 발명에 따른 중합체 담체의 화학식 (IV)의 친수성 중합체 P1 및 P3에 부착될 수 있다. 이와 관련하여 특히 바람직한 PEG 유도체는 알파-메톡시-오메가-메르캅토 폴리(에틸렌 글리콜)이다. 각각의 경우에, 예를 들어 시스테인 또는 임의의 추가의 (변형된) 아미노산 또는 화합물의 SH-부분은 은 종결 말단에 또는 친수성 중합체 P1 및 P3의 임의의 위치에 내부적으로 존재할 수 있다. 본 명세서에 정의된 바와 같이, 각각의 친수성 중합체 P1 및 P3은 바람직하게는 하나의 종결 말단에서 전형적으로 적어도 하나의 -SH-부분을 나타내지만, 본 명세서에 정의된 바와 같은 추가의 성분, 바람직하게는 추가의 기능성 펩티드 또는 단백질, 예를 들어 리간드, 아미노산 성분(AA) 또는 (AA)x, 항체, 세포 침투 펩티드 또는 인핸서 펩티드(예를 들어 TAT, KALA), 등을 추가적으로 부착하는 데 사용될 수 있는 2개 또는 그 이상의 -SH-부분을 포함할 수 있다.
중량비 및 N/P 비
본 발명의 일부 실시예에서, 인공 핵산 분자, 바람직하게는 RNA (또는 상기 다른 핵산)는 선택적으로 핵산 대 (다가-)양이온성 화합물 및/또는 중합체성 담체의 약 6:1 (w/w) 내지 약 0.25:1 (w/w), 보다 바람직하게는 약 5:1 (w/w) 내지 약 0.5:1 (w/w), 더욱 더 바람직하게는 약 4:1 (w/w) 내지 약 1:1 (w/w) 또는 약 3:1 (w/w) 내지 약 1:1 (w/w), 가장 바람직하게는 약 3:1 (w/w) 내지 약 2:1 (w/w)의 범위에서 선택되는 중량비; 또는 선택적으로 핵산 대 (다가-)양이온성 화합물 및/또는 중합체성 담체의 질소/인산염 (N/P) 비의 약 0.1-10의 범위, 바람직하게는 약 0.3-4 또는 0.3-1의 범위, 가장 바람직하게는 약 0.5-1 또는 0.7-1, 더욱 더 가장 바람직하게는 약 0.3-0.9 또는 0.5-0.9의 범위인 (다가-)양이온성 화합물 또는 중합체성 담체와 회합되거나 복합체화된다. 보다 바람직하게는, 적어도 하나의 인공 핵산 분자, 바람직하게는 RNA 대 하나 또는 그 이상의 폴리 양이온에 대한 N/P 비는 약 0.3 내지 4의, 약 0.5 내지 2, 약 0.7 내지 2 및 약 0.7 내지 1.5의 범위를 포함하는 약 0.1 내지 10의 범위에 있다.
본 발명의 인공 핵산 분자, 바람직하게는 RNA (또는 본 명세서에 정의된 임의의 다른 핵산)는 또한 상기 인공 핵산 분자, 바람직하게는 RNA의 형질 주입 효율을 증가시키기 위한 비히클, 형질 주입 또는 착화제와 관련될 수 있다.
이와 관련하여, 본 발명의 (약제학적) 조성물은 (다가-)양이온성 화합물 및/또는 중합체 담체, 바람직하게는 양이온성 단백질 또는 펩티드와 적어도 부분적으로 복합체화된 인공 핵산 분자, 바람직하게는 RNA를 포함하는 것이 특히 바람직하다. 이와 관련하여, WO 2010/037539 및 WO 2012/113513의 개시 내용은 본 명세서에 참조로 포함된다. "부분적으로"는 상기 인공 핵산 분자, 바람직하게는 RNA의 일부가 (다가-)양이온성 화합물 및/또는 중합체 담체와 복합체화되는 반면, 상기 인공 핵산 분자, 바람직하게는 RNA의 나머지는 비복합체화 형태(“자유”)로 존재함을 의미한다.
바람직하게는, 복합체화된 인공 핵산 분자, 바람직하게는 RNA 대 유리 인공 핵산 분자, 바람직하게는 RNA의 몰비는 약 1:1의 비를 포함하여 약 0.001:1 내지 약 1:0.001의 몰비로부터 선택된다. 보다 바람직하게는 복합체화된 인공 핵산 분자, 바람직하게는 RNA 대 유리 인공 핵산 분자, 바람직하게는 RNA의 비는 약 5:1 (w/w) 내지 약 1:10 (w/w)의 범위, 보다 바람직하게는 약 4:1 (w/w) 내지 약 1:8 (w/w)의 범위, 더욱 더 바람직하게는 약 3:1 (w/w) 내지 약 1:5 (w/w)의 범위 또는 1:3 (w/w), 및 가장 바람직하게는 복합체화된 인공 핵산 분자, 바람직하게는 RNA 대 유리 인공 핵산 분자, 바람직하게는 RNA의 비는 약 1:1 (w/w)의 비로부터 선택된다.다른 실시예에서, 인공 핵산 분자, 바람직하게는 RNA는 임의의 추가 비히클, 형질 주입 또는 착화제와 관련되지 않고 자유 형태 또는 네이키드 형태로 제공되고 사용될 수 있다.
본 발명의 복합체화된 인공 핵산 분자, 바람직하게는 RNA는 바람직하게는 인공 핵산 분자, 바람직하게는 RNA를 (다가-)양이온성 화합물 및/또는 중합체성 담체와, 바람직하게는 본 명세서에서 정의된 바와 같이 복합체화함으로써 특정 비율로 안정한 복합체를 형성하기 위한 제 1 단계에 따라 제조되는 것이 바람직하다. 이와 관련하여, 유리된 (다가-)양이온성 화합물 또는 중합체성 담체 또는 그것의 무시할만한 소량만이 바람직하게는 상기 인공 핵산 분자, 바람직하게는 RNA를 복합체화한 후에 복합체화된 인공 핵산 분자, 바람직하게는 RNA의 부분에 잔류하지 않는 것이 매우 바람직하다. 따라서, 인공 핵산 분자, 바람직하게는 RNA 및 (다가-)양이온성 화합물 및/또는 복합체화된 RNA 부분에서의 중합체 담체의 비율은 전형적으로 인공 핵산 분자, 바람직하게는 RNA가 완전히 복합체화되고 유리 (다가-)양이온성 화합물 또는 중합체성 담체가 없거나 상기 분율에 무시할 정도로 적은 양만이 남아있도록 하는 범위에서 선택된다.
바람직하게는, 인공 핵산 분자, 바람직하게는 RNA 대 (다가-)양이온성 화합물 및/또는 중합체성 담체의 비는 바람직하게는 본 명세서에 정의된 바와 같이 약 6:1 (w/w) 내지 약 0,25:1 (w/w), 더욱 바람직하게는 약 5:1 (w/w) 내지 약 0,5:1 (w/w), 더욱 더 바람직하게는 약 4:1 (w/w) 내지 약 1:1 (w/w) 또는 약 3:1 (w/w) 내지 약 1:1 (w/w), 가장 바람직하게는 약 3:1 (w/w) 내지 약 2:1 (w/w)의 범위에서 선택된다.
대안적으로, 인공 핵산 분자, 바람직하게는 RNA 대 (다가-)양이온성 화합물 및/또는 중합체성 담체의 비율은 또한 전체 착화물의 질소/인산염 비 (N/P-비)에 기초하여 계산될 수 있다. 본 발명과 관련하여, N/P-비는 바람직하게는 착화물에서 (다가-)양이온성 화합물은 (다가-)양이온성 단백질 또는 펩티드 및/또는 상기 정의 된 바와 같은 중합체성 담체인 경우, 바람직하게는 본 명세서에 정의된 바와 같이 착화물에서 인공 핵산 분자, 바람직하게는 RNA 대 (다가-)양이온성 화합물 및/또는 중합체성 담체의 비율에 관하여 바람직하게는 약 0.1-10의 범위, 바람직하게는 약 0.3-4의 범위, 가장 바람직하게는 약 0.5-2 또는 0.7-2의 범위에 있고, 가장 바람직하게는 약 0.7-1,5, 0.5-1 또는 0.7-1의 범위, 및 더욱 가장 바람직하게는 약 0.3-0.9 또는 0.5-0.9의 범위에 있다.
다른 실시예에서, 인공 핵산 분자, 바람직하게는 RNA는 임의의 추가 비히클, 형질 주입 또는 착화제와 관련되지 않고 자유 형태 또는 네이키드 형태로 제공되고 사용될 수 있다.
표적화된 전달
일부 실시예에서, (다가)양이온성 화합물, 담체, 리포좀 또는 LNP는 상이한 기관 및/또는 세포 유형에 도달하기 위해 표적화된 전달을 위해 제형화될 수 있다. 비제한적인 예시로서, (다가)양이온성 화합물, 담체, 캐리어, 리포좀 또는 LNP는 간으로의 표적화된 전달을 위해 제형화될 수 있다. 표적화된 전달에 사용되는 (다가)양이온성 화합물, 담체, 리포좀 또는 LNP는 본 명세서에 기재된 (다가)양이온성 화합물, 담체, 리포좀 또는 LNP를 포함할 수 있으나, 이에 제한되지는 않는다. 본 발명의 RNA는 컨쥬게이트, 예를 들어 담체 또는 표적기에 공유결합된 치료용 단백질 또는 이의 단편 또는 변이체를 암호화할 수 있다.
표적기는 당단백질과 같은 단백질 또는 공-리간드에 특이적 친화성을 갖는 분자와 같은 펩티드 또는 상피 세포, 케라티노사이트 등의 특정 세포 유형에 결합하는 항체와 같은 항체일 수 있다. 표적기는 또한 호르몬 및 호르몬 수용체를 포함할 수 있다. 또한 지질, 렉틴, 탄수화물, 비타민, 보조인자, 다가 락토스, 다가 갈락토스, N-아세틸-갈락토사민, N-아세틸-글루코사민, 다가 만노스, 다가 푸코스, 또는 압타머와 같은 비펩타이드성 종류를 포함할 수 있다. 표적기는 특정 수용체를 표적화할 수 있는 임의의 리간드일 수 있다.
일부 실시예에서, 인공 핵산 분자, 바람직하게는 RNA 및 선택적으로 이를 포함하는 (약제학적) 조성물 또는 키트는 간을 표적화하기에 적합하다. 이러한 인공 핵산 분자, 바람직하게는 RNA 및 선택적으로 이를 포함하는 (약제학적) 조성물 또는 키트는 대사 질환, 예를 들어 선천적 유전적 오류에 의해 유발되는 대사 질환, 예를 들어 오르니틴 트랜스카바미라제 결핍 관련 질환의 치료, 예방 또는 약화에 특히 적합할 수 있다.
(약제학적) 조성물
추가적인 측면에서, 본 발명은 본 발명에 따른 인공 핵산 분자, 바람직하게는 RNA 및 적어도 하나의 약제학적으로 허용되는 담체 또는 부형제를 포함하는 조성물을 제공한다. 본 발명에 따른 조성물은 바람직하게는 약제학적 조성물로 제공된다.
인공 핵산 분자, 바람직하게는 RNA는 본 명세서의 다른 곳에 기재된 "복합" 또는 "자유" 형태로 (약제학적) 조성물의 일부로서 또는 이들의 혼합물로 제공될 수 있다.
본 발명에 따른 (약제학적) 조성물은 본 명세서의 다른 곳에 정의된 바와 같이 이를 제공하는 적어도 하나의 gRNA 또는 벡터를 추가로 포함 할 수 있다.
본 발명에 따른 (약제학적) 조성물은 인공 핵산 분자, 바람직하게는 RNA, 또는 이를 포함하는 (약제학적) 조성물로 치료되는 질환 또는 상태의 치료에 유용한 적어도 하나의 추가적인 활성제를 추가로 포함할 수 있다.
약제학적으로 허용되는 부형제 및 담체
바람직하게는, 본 발명에 따른 (약제학적) 조성물은 적어도 하나의 약제학적으로 허용되는 담체 및/또는 부형제를 포함한다. 용어 "약제학적으로 허용되는"은 하나 또는 그 이상의 활성제(들) (상기 인공 핵산 분자, 바람직하게는 RNA)와 양립할 수 있고 그들의 약제학적 활성을 방해 및/또는 실질적으로 감소시키지 않는 화합물 또는 약제를 지칭한다. 약제학적으로 허용되는 담체는 바람직하게는 치료될 대상체에게 투여하기에 적합하도록 충분히 높은 순도 및 충분히 낮은 독성을 갖는다.
부형제(Excipients)
약제학적으로 허용되는 부형제는 상이한 기능적 역할을 나타낼 수 있으며 희석제(diluent), 충전제(filler), 증량제(bulking agent), 담체(carrier), 붕괴제(disintegrant), 결합제(binder), 윤활제(lubricant), 활택제(glidant), 코팅제(coating), 용매(solvent) 및 조용매(co-solvent), 완충제(buffering agent), 방부제(preservative), 보조제(adjuvant), 산화 방지제(anti-oxidant), 습윤제(wetting agent), 소포제(anti-foaming agent), 증점제(thickening agent), 감미제(sweetening agent), 향미제(flavouring agent) 및 보습제(humectant)가 포함될 수 있지만, 이에 제한되지는 않는다.
액체 형태의 (약제학적) 조성물의 경우, 일반적으로 유용한 약제학적으로 허용되는 부형제는 (발열원이 없는)물, 인산염 또는 구연산염 완충 식염수와 같은 (등장성) 식염수 용액, 불휘발성 기름, 예를 들어 땅콩 기름, 면실유, 참기름, 올리브유, 옥수수 기름, 에탄올, 폴리올(예를 들어, 글리세롤, 프로필렌 글리콜, 폴리에틸렌 글리콜, 등)와 같은 식물성 오일; 레시틴; 계면활성제; 벤질 알코올, 파라벤, 클로로부탄올, 페놀, 아스코르브산, 티메로살, 등과 같은 방부제; 맨니톨, 소르비톨 또는 염화나트륨과 같은 폴리알콜, 당과 같은 등장성 물질; 알루미늄모노스테아레이트 또는 젤라틴; 아스코르브산 또는 아황산수소나트륨과 같은 항산화제; 에틸렌디아민테트라아세트산(EDTA)과 같은 킬레이트제; 아세트산염, 구연산염 또는 인산염과 같은 완충제 및 염화나트륨 또는 덱스트로스와 같은 장성 조절제와 같은 용매, 희석제 또는 담체를 포함한다. pH는 염산 또는 수산화 나트륨과 같은 산 또는 염기로 조정할 수 있습니다. 완충제는 특정 기준 배지와 관련하여 고장성, 등장성 또는 저장성일 수 있으며, 즉 완충제는 특정 기준 배지와 관련하여 더 높거나 동일하거나 더 낮은 염 함량을 가질 수 있으며, 바람직하게는 삼투 또는 다른 농도 효과로 인한 세포 손상을 초래하지 않는 상기 언급된 염의 농도가 사용될 수 있다. 기준 배지는 예를 들어 혈액, 림프액, 세포액 또는 다른 체액과 같은 "생체내" 방법에서 발생하는 액체, 또는 일반적인 완충제 또는 액체와 같은 "시험관내" 방법에서 기준 배지로서 사용될 수 있는 액체이다. 이러한 일반적인 완충제 또는 액체는 통상의 기술자에게 공지되어 있다. 링거-락테이트 용액이 액체 기반으로서 특히 바람직하다.
(반-)고체 형태의 (약제학적) 조성물의 경우, 유용한 약제학적으로 허용되는 부형제는 미세결정 셀룰로스, 검 트라가칸스 또는 젤라틴; 녹말 또는 락토스; 당, 예를 들어, 락토스, 글루코스 및 수크로스와 같은 당; 녹말, 예를 들어 옥수수 전분 또는 감자 전분과 같은 녹말; 셀룰로스 및 이의 유도체, 예를 들어 나트륨 카복시메틸셀룰로스, 에틸셀룰로스, 셀룰로스 아세테이트; 알긴산과 같은 붕괴제; 스테아린산 마그네슘과 같은 윤활제; 스테아린산, 스테아린산 마그네슘과 같은 활택제; 황산 칼슘, 콜로이드 이산화규소 등; 수크로스 또는 사카린과 같은 감미제; 및/또는 향미제, 예를 들어 페퍼민트, 메틸 살리실레이트 또는 오렌지 향미제와 같은 결합제(binder)를 포함한다.
담체(Carriers)
적합한 약제학상 허용되는 담체는 전형적으로 (약제학적) 조성물의 제형에 기초하여 선택된다.
주사 및 특히 정맥 내 투여를 통해 투여되는 액체 (약제학적) 조성물은 제조 및 보관 조건에서 멸균되고 안정적이어야 한다. 이러한 조성물은 전형적으로 발열원이 없고, 적합한 pH를 가지며, 등장성이고 활성 성분(들)의 안정성을 유지하는 비경구적으로 허용되는 수용액으로서 제형화된다.
본 발명에 따른 액체 (약제학적) 조성물에 특히 유용한 약제학적으로 허용되는 담체는 물, 전형적으로 발열원이 없는 물; 등장성 식염수 또는 완충 (수성) 용액, 예를 들어 인산염, 구연산염 등의 완충 용액을 포함한다. 특히 본 발명의 (약제학적) 조성물의 주사를 위해, 나트륨염, 바람직하게는 적어도 50 mM의 나트륨염, 칼슘염, 바람직하게는 적어도 0.01mM의 칼슘염, 및 선택적으로 칼륨 염, 바람직하게는 적어도 3mM의 칼륨염을 포함하는 물 또는 바람직하게는 완충제, 더 바람직하게는 수성 완충제가 사용될 수 있다.
바람직한 실시예에 따르면, 나트륨, 칼슘 및 선택적으로 칼륨 염은 할로겐화물, 예를 들어 염화물, 요오드화물 또는 브롬화물의 형태, 수산화물, 탄산염, 탄산수소염 또는 황산염 등의 형태로 발생할 수 있다. 이에 제한되지 않고, 나트륨염의 예는 예를 들어 NaI, NaBr, Na2CO3, NaHCO3, Na2SO4를 포함하고, 임의의 칼륨 염의 예는 예를 들어 KCl, KI, KBr, K2CO3, KHCO3, K2SO4를 포함하고, 칼슘 염의 예는 예를 들어 CaCl2, CaI2, CaBr2, CaCO3, CaSO4, Ca(OH)2를 포함한다. 또한 상기 양이온의 유기 음이온이 완충제에 포함될 수 있다.
보다 바람직한 실시예에 따르면, 상기 정의된 바와 같은 주사 목적에 적합한 완충제는 염화나트륨 (NaCl), 염화칼슘 (CaCl2) 및 선택적으로 염화칼륨 (KCl)으로부터 선택된 염을 포함할 수 있으며, 여기서 추가적인 음이온은 염화물에 추가로 존재할 수 있다. CaCl2는 또한 KCl과 같은 다른 염으로 대체될 수 있다. 전형적으로, 주사 완충제 중의 염은 적어도 50mM의 염화나트륨 (NaCl), 적어도 3mM의 염화칼륨 (KCl) 및 적어도 0.01mM의 염화칼슘 (CaCl2)의 농도로 존재한다. 주입 완충제는 특정 기준 배지와 관련하여 고장성, 등장성 또는 저장성일 수 있으며, 즉 완충제는 특정 기준 배지와 관련하여 더 높거나 동일하거나 더 낮은 염 함량을 가질 수 있으며, 바람직하게는 상기 언급된 염의 이러한 농도는 삼투 또는 기타 농도 효과로 인한 세포 손상을 유발하지 않게 사용될 수 있다. 기준 배지는 예를 들어 혈액, 림프액, 세포액 또는 다른 체액과 같은 액체를 발생시키는 “생체내” 방법에 있거나 일반적인 완충제 또는 액체와 같은 "시험관내" 방법에서 기준 배지로 사용될 수 있는 액체이다. 이러한 일반적인 완충액 또는 액체는 본 발명이 속하는 기술 분야에서 통상의 기술자에게 공지되어 있다. Ringer-Lactate 용액이 액체 기반으로서 특히 바람직하다.
제제(Formulation)
일반적으로, 국소 투여용 (약제학적) 조성물은 크림, 연고, 겔, 페이스트 또는 분말로서 제형 화될 수 있다. 경구 투여용 (약제학적) 조성물은 정제, 캡슐제, 액체, 분말 또는 서방형으로 제형화 될 수 있다. 그러나, 바람직한 실시예에 따르면, 본 발명의 (약제학적) 조성물은 비경구, 특히 피내 또는 근육 내 주사를 통해, 투여되며 따라서 본 명세서의 다른 곳에서 논의된 바와 같이 비경구 투여를 위해 액체 또는 동결 건조 형태로 제제화된다. 비경구 제제는 전형적으로 바이알, IV 백, 앰플, 카트리지 또는 미리 채워진 주사기에 저장되고 주사, 흡입제 또는 에어로졸로서 투여될 수 있으며, 주사가 바람직하다.
동결 건조 제제
추가적인 바람직한 실시예에서, (약제학적) 조성물은 동결 건조된 형태로 제공된다. 바람직하게는, 동결 건조된 (약제학적) 조성물은 투여 전에 유리하게는 수성 담체를 기준으로 적합한 완충제, 예를 들어 바람직하게는 링거-락테이트 용액, 링거 용액, 포스페이트 버퍼 용액으로 재구성된다. 일부 실시예에서, 본 발명에 따른 (약제학적) 조성물은 동결 건조된 형태로 (선택적으로 적어도 하나의 추가적인 첨가제와 함께) 개별적으로 제공되며 바람직하게는 상기 인공 핵산 분자, 바람직하게는 RNA 각각의 개별적인 투여를 허용하기 위해 사용 전 적합한 완충제에서 개별적으로 재구성되는 적어도 2개, 3개, 4개, 5개, 6개 또는 그 이상의 인공 핵산 분자, 바람직하게는 RNA를 포함한다.
액체 제제
추가적인 바람직한 실시예에서, (약제학적) 조성물은 식염수(saline) 또는 지질계 제형의 형태로 제공된다. 지질계 제형은 "복합체(complexation)" 섹션에 상기 기재된 리포좀(liposome), 리포플렉스(lipoplex), 나노 리포좀(nanoliposome) 및 지질 나노 입자를 포함할 수 있다.
키트(Kit)
추가적인 측면에서, 본 발명은 인공 핵산 분자, 바람직하게는 RNA 및/또는 (약제학적) 조성물을 포함하는 키트 또는 부품 키트에 관한 것이다. 키트는 하나 이상의 gRNA (또는 이를 제공하는 벡터)를 추가로 포함할 수 있다.
상기 언급된 성분은 부품 키트에서 약제학적 조성물의 형태로 각각 제공될 수 있다. 지금까지, (약제학적) 조성물에 대해 상기 제공된 정의 및 설명은 부품 키트의 개별 성분에 필요한 부분만 약간 수정하여 동일하게 적용될 수 있다.
예를 들어, 적어도 하나의 인공 핵산 분자, 바람직하게는 RNA, 및 임의로 적어도 하나의 gRNA 또는 이를 암호화하는 핵산은 동결 건조 또는 액체 형태로, 임의로 상기 기재된 하나 또는 그 이상의 약제학적 조성물과 관련하여 약제학적으로 허용되는 담체(들), 부형제 또는 추가 제제와 함께 서로 독립적으로 제공될 수 있다.
선택적으로, 상기 부품 키트는 약제학적 조성물, 항미생물제, RNAse 억제제, 가용화제 등과 관련하여 본 명세서에 정의된 바와 같은 적어도 하나의 추가 제제를 포함할 수 있다.
부품 키트는 2개 이상의 부품으로 이루어진 키트일 수 있으며 전형적으로 적합한 용기에 구성 요소를 포함한다. 예를 들어, 각 용기는 바이알, 병, 스퀴즈 병, 단지, 밀봉된 슬리브, 엔벨로프 또는 파우치, 튜브 또는 블리스터 패키지 또는 용기가 구성 요소의 조기 혼합을 방지하도록 구성된 임의의 다른 적합한 형태일 수 있다. 상이한 구성 요소들 각각은 개별적으로 제공될 수 있거나, 또는 상이한 구성 요소들 중 일부가 함께 (즉, 동일한 용기 내에) 제공될 수 있다.
용기는 또한 약사 또는 의사가 의도적으로 혼합하기 전에 다른 구획의 내용물과 물리적으로 어울릴 수 없는 경우 바이알, 튜브, 단지, 또는 엔벨로프의 구획 또는 챔버 또는 슬리브, 또는 블리스터 패키지 또는 병일 수 있다.
부품 키트는 또한 임의의 성분의 투여 및 투여량에 대한 정보를 갖는 기술 설명서를 포함할 수 있다.
의학적 사용 및 치료
본 명세서에 정의된 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트는 인간 및 수의학적 목적, 바람직하게는 인간의 의학 목적으로 사용될 수 있다.
추가적인 측면에 따르면, 본 발명은 약제로서 사용하기 위한 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트에 관한 것이다.
인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트는 특히 그 중에서도암호화된 CRISPR-연관 단백질의 발현에 의한 치료 가능한, 바람직하게는 관심 유전자의 발현을 녹인, 녹아웃, 조작 또는 조절함으로써 치료 가능한 질병의 치료 및/또는 예방에 유용하다.
추가적인 측면에 따르면, 본 발명은 유전자 치료 방법 및/또는 암호화된 CRISPR-연관 단백질의 발현에 의한 치료 가능한, 바람직하게는 관심 유전자의 발현을 녹인, 녹아웃, 조작 또는 조절함으로써 치료 가능한 질병의 치료에 사용하기 위한 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트에 관한 것이다. 이러한 질환은 유전자 질환, 암, 자가 면역 질환, 염증성 질환, 감염성 질환, 대사성 질환, 신경 질환, 심혈관 질환 또는 다른 질환 또는 상태로부터 선택될 수 있다.
"유전자 치료"는 치료 효과를 달성하기 위해 환자에서 유전자 발현의 조절(즉, 복원, 향상, 감소 또는 억제)을 포함하는 것이 바람직하다. 이를 위해, 유전자 치료는 전형적으로 세포 내로 핵산의 도입을 포함한다. 이 용어는 일반적으로 치료 목적의 게놈의 조작을 말하며 질병을 유발하는 돌연변이의 교정, 게놈에 치료 유전자의 추가, 유해한 유전자 또는 게놈 서열의 제거, 및 유전자 발현의 조절을 위한 게놈 편집 기술의 사용을 포함한다. 유전자 치료는 숙주 세포의 생체 내 또는 생체 외 형질전환을 수반할 수 있다.
질병의 "치료(treatment)"또는 "치료하는(treating)"이라는 용어는 질병을 방지 또는 예방(즉, 임상 증상이 발생하지 않도록 하는 것); 질병 억제(즉, 임상 증상의 발달을 정지 또는 억제); 및/또는 질병 완화 (즉, 임상 증상의 퇴행을 야기)를 포함한다. 알 수 있는 바와 같이, 궁극적인 유도성 사건 또는 알려지지 않았거나 잠재적일 수 있는 사건 때문에 질병 또는 장애를 "예방" 및 "억제"하는 것이 항상 가능한 것은 아니다. 따라서, "예방"이라는 용어는 "방지" 및 "억제" 둘 다를 포함하는 한 유형의 "치료"를 구성하는 것으로 이해될 것이다. 그러므로 "치료"라는 용어는 "예방"을 포함한다.
본 명세서에 사용된 용어 "대상체", "환자"또는 "개체"는 일반적으로 인간 및 비인간 동물 및 바람직하게는 키메라 동물 및 형질전환 동물 및 질병 모델을 포함하는 포유 동물 (예를 들어, 마모셋, 타마린, 거미 원숭이, 올빼미 원숭이, 긴꼬리 원숭이, 다람쥐 원숭이, 개코원숭이, 마카크, 침팬지, 오랑우탄, 고릴라를 포함하는 비인간 영장류; 소; 말; 양; 돼지; 닭; 고양이; 개; 마우스; 랫; 토끼; 기니피그; 등)을 포함한다. 본 발명과 관련하여, 용어 "대상체"는 바람직하게는 비인간 영장류 또는 인간, 가장 바람직하게는 인간을 지칭한다.
따라서, 본 발명은 암호화된 CRISPR-연관 단백질의 발현에 의해 치료할 수 있는 질환, 바람직하게는 관심 유전자의 발현을 녹인, 녹아웃, 조작 또는 조절함으로써 치료할 수 있는 질환을 이를 필요로 하는 대상체에게 약학적 유효량의 인공 핵산 분자, 바람직하게는 RNA 또는 (약제학적) 조성물 또는 부품 키트를 투여함으로써 치료하는 방법을 제공한다. 이러한 방법은 본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트를 제조하는 임의의 제 1 단계 및 (약학적 및/또는 치료 유효량의) 상기 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적)조성물 또는 부품키트를 이를 필요로하는 환자/대상체에게 투여하는 것을 포함할 수 있다.
투여는 바람직하게는 비경구, 예를 들어 피하, 근육 내 또는 피내 주사, 바람직하게는 근육내 또는 피내 주사, 더욱 바람직하게는 피내 주사에 의해 달성된다. 바람직하게는, 주사는 통상적인 바늘 주사 또는 (바늘 없는) 제트 주사를 사용하여, 바람직하게는 (바늘 없는) 제트 주사를 사용하여 수행된다.
본 발명은 또한 바람직하게는 녹인, 녹아웃, 조작 또는 조절, 바람직하게는 관심 유전자의 발현을 유도 또는 향상시키기 위한 본 발명의 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트의 용도에 관한 것이다.
투여 경로
본 발명의 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트는 예를 들어 전신 또는 국부적으로 투여될 수 있다.
일반적으로 전신 투여 경로는 예를 들어 피하, 정맥내, 근육내, 동맥내, 피내, 주사 및/또는 비강내 투여 경로를 포함하는 경피, 경구, 비경구 경로를 포함한다.
일반적으로 국소 투여 경로는 예를 들어 topical 투여 경로뿐만 아니라 피내, 경피, 피하, 또는 근육내 주사 또는 병변내, 종양내, 두개내, 폐내, 심장내, 및 설하주사를 포함한다.
예를 들어 상기 (약제학적) 조성물 또는 부품 키트가 여러 상이한 핵산(예를 들어CRISPR-연관 단백질을 암호화하는 적어도 하나의 인공 핵산 및 이를 제공하는 적어도 하나의 gRNA 또는 벡터)을 포함하는 경우, 본 발명의 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트의 상이한 성분에 대해 상이한 투여 경로를 사용하는 것이 추가로 고려될 수 있다.
바람직한 실시예에 따르면, 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트는 비경구 경로, 바람직하게는 피내, 피하 또는 근육내 경로를 통해 투여된다. 바람직하게는, 상기 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트는 바늘이 없는 및/또는 바늘 주사일 수 있는 주사, 예를 들어 피하, 근육내 또는 피내 주사에 의해 투여된다. 따라서, 바람직한 실시예에서, 본 발명에 따른 의학적 용도 및/또는 치료 방법은 피하, 근육내 또는 피내 주사, 바람직하게는 근육내 또는 피내 주사, 더욱 바람직하게는 피내 주사에 의한 상기 인공 핵산 분자, 바람직하게는 RNA, 또는 (약제학적) 조성물 또는 부품 키트의 투여를 포함한다. 주사는 바람직하게는 근육 내 또는 피내 주사, 더욱 바람직하게는 피내 주사에 의해 수행된다. 이러한 주사는 통상적인 바늘 주사 또는 (바늘 없는) 제트 주사를 사용하여, 바람직하게는 (바늘 없는) 제트 주사를 사용하여 수행될 수 있다.
투여 요법
본 발명의 (약제학적) 조성물 또는 부품 키트의, 즉 적어도 하나의 인공 핵산 분자, 바람직하게는 RNA, 및 임의의 적어도 하나의 다른 핵산(예를 들어, 이를 제공하는 gRNA 또는 벡터)의 성분이 하루에 수 차례, 매일, 격일로, 매주 또는 매월 이를 필요로 하는 대상에게; 순차적으로 또는 동시에 투여될 수 있다. 상기 성분은 상기 정의 된 바와 같이 상이한 투여 경로를 통해 이를 필요로 하는 환자에게 투여될 수 있다.
일부 바람직한 실시예에 따르면, 본 발명의 (약제학적) 조성물의 성분은 동시에 (즉, 동일하거나 상이한 투여 경로를 통해 동시에) 투여된다.
다른 바람직한 실시예에 따르면, 본 발명의 (약제학적) 조성물 또는 부품 키트의 성분은 개별적으로 (즉, 연속적으로 상이한 시점에서 및/또는 상이한 투여 경로를 통해) 투여된다. 이러한 순차 투여 방식은 "시간-지연(time-staggered)"투여라고도 한다. 시간-지연 투여는 인공 핵산 분자, 바람직하게는 RNA가 예를 들어 동일한 것을 제공하는 gRNA 또는 벡터에 앞서, 동시에 또는 후속하거나 그 반대로 투여되는 것을 의미할 수 있다.
복용량
본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 키트는 바람직하게는 안전하고 치료상 유효한 양으로 투여된다.
본 명세서에 사용된 "안전하고 치료상 유효한 양"은 찾고 있는 조직, 시스템, 동물 또는 인간에서 원하는 생물학적 또는 의약 반응을 이끌어 내기에 충분한 양의 활성 물질(들)을 의미한다. 안전하고 치료상 유효한 양은 바람직하게는 치료될 질환의 긍정적인 변형을 유도하기 위해, 즉 치료될 질환의 증상의 완화, 질환 진행의 감소 또는 예방되는 질환의 증상의 예방을 위해 충분하다. 그러나 동시에, “안전하고 치료상 유효한 양”은 심각한 부작용을 피하기 위해 충분한 작은 양이며, 즉 이점과 위험 사이의 합리적인 관계를 허용한다.
"안전하고 치료상 유효한 양"은 또한 치료될 특정 상태 및 치료될 환자의 연령, 신체 상태, 체중, 성별 및 식이, 상태의 중증도, 치료 기간, 수반되는 요법의 성질, 특정 약제학적으로 허용되는 담체 또는 부형제, 치료 식이 요법 및 유사한 인자와 관련하여 더욱 다양할 것이다. 인공 핵산 분자, 바람직하게는 RNA의 “안전하고 (치료상) 유효한 양”은 또한 인공 핵산 분자, 바람직하게는 RNA의 유형, 예를 들어 모노-, 바이- 또는 심지어 멀티시스트로닉 RNA에 따라 선택될 수 있으며, 이는 바이- 또는 심지어 멀티시스트로닉 RNA는 동일한 양의 모노시스트로닉 RNA를 사용하는 것보다 암호화된 CRISPR-연관 단백질(들)의 발현이 상당히 높아질 수 있기 때문이다.
본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트의 치료 효능 및 독성은 예를 들어, LD50 (인구의 50 %에 치사량) 및 ED50 (인구의 50 %에서 치료 유효량)을 결정하기 위해 세포 배양 또는 실험 동물에서의 표준 약학 절차에 의해 결정될 수 있다. 독성 효과와 치료 효과 사이의 용량 비율은 치료 지수이며 LD50 / ED50 비로 표현될 수 있다. 큰 치료 지수를 나타내는 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트가 일반적으로 바람직하다. 세포 배양 분석 및 동물 연구로부터 얻은 데이터는 인간에게 사용하기 위한 투여량의 범위를 공식화하는데 사용될 수 있다. 이러한 화합물의 투여량은 바람직하게는 독성이 거의 없거나 전혀 없는 ED50을 포함하는 순환 농도 범위 내에 있다.
예를 들어, 본 명세서에 기술된 본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트의 치료상 유효량은 투여 단위당 약 0.001 mg 내지 10 mg, 바람직하게는 약 0.01mg 내지 5 mg, 더욱 바람직하게는 약 0.1 mg 내지 2 mg 또는 투여 단위당 약 0.01 nmol 내지 약 0.01 nmol의 범위, 특히 투여 단위 1 nmol 내지 1 mmol, 바람직하게는 투여 단위당 1 μmol 내지 1 mmol일 수 있다. 또한 본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트의 치료상 유효량은 (체중 kg당) 약 0.01 mg/kg 내지 10 g/kg, 바람직하게는 약 0.05 mg/kg 내지 5 g/kg, 보다 바람직하게는 약 0.1 mg/kg 내지 2.5 g/kg 의 범위일 수 있다.
투여될 본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트의 안전하고 치료상 유효한 양은 예를 들어 동물 모델을 사용하는 상용 실험에 의해 결정할 수 있다. 이러한 모델에는 토끼, 양, 마우스, 랫, 개 및 비인간 영장류 모델이 제한없이 포함된다.
질병
CRISPR 기술은 유전자의 기능적 녹아웃 또는 녹인, 유전자 편집 또는 전사 활성화 또는 억제를 포함하는 다양한 목적으로 사용될 수 있다. 따라서, 본 발명에 따른 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 키트는 다양한 질병의 치료에 사용될 수 있다. 인공 핵산 분자의 적어도 하나의 암호화 서열에 의해 암호화된 CRISPR-연관 단백질의 발현에 의해 치료될 수 있는 질환, 장애 또는 상태에서의 유전자 요법에 사용이 특히 예상된다.
바람직하게는, 치료될 질환은 관심 유전자의 녹인, 녹아웃 또는 조작 (예를 들어, 돌연변이 도입 또는 제거), 또는 그 발현을 조절 (즉, 변경, 유도, 증가, 감소, 예방 또는 방해)함으로써 치료할 수 있다.
본 발명에 따른 인공 핵산 분자, 바람직하게는 RNA, 또는 이를 포함하는 (약제학적) 조성물 또는 키트는 유전자 녹아웃을 유도하기 위해 사용될 수 있다 (즉, 유전자를 기능하지 않게 하거나 게놈으로부터 유전자를 제거한다). 따라서, 엔도뉴클레아제 활성을 나타내는 CRISPR-연관 단백질을 암호화하는 인공 핵산 분자, 바람직하게는 RNA가 이용될 수 있으며, 이는 게놈 DNA 내로 DSB를 도입할 수 있다. 상기 DSB는 비상동성 말단 결합(NHEJ)을 유도하여, 코돈-리딩 프레임 (프레임 시프트)의 파괴로 이어지는 뉴클레오티드의 짧은 스트레치의 무작위 삽입 또는 결실을 야기하여, 잘못된 전사체 및 유전자 발현의 제거를 초래한다(기능 상실). 이러한 전략은 예를 들어 종양 세포 증식 및 생존을 매개하는 유전자를 녹아웃하거나 숙주 세포의 게놈으로부터 통합된 바이러스를 제거하는데 유용할 수 있다.
본 발명에 따른 인공 핵산 분자, 바람직하게는 RNA, 또는 이를 포함하는 (약제학적) 조성물 또는 키트를 사용하여 유전자 녹인을 유도할 수 있다 (즉, 게놈에 새로운 또는 변형된 유전자를 도입). 따라서, 닉카아제 활성을 나타내는 CRISPR-연관 단백질을 암호화하는 인공 핵산 분자, 바람직하게는 RNA가 이용될 수 있으며, 따라서 게놈 DNA 내로 닉을 도입(즉, 이중가닥 게놈 DNA의 한 가닥의 포스포디에스테르 결합의 가수분해)할 수 있다. 이러한 nick은 바람직하게는 DNA 이중가닥 절단의 양 측면에 있는 서열에 상동성을 갖는 영역을 갖는 DNA segment의 결합을 야기하는 상동성 지시 수선 (HDR)을 유도한다. HDR을 사용하여, 예를 들어 기능 상실, 기능 획득 또는 기능 변경(신형태적), 또는 알 수 없는 기능 상태의 변형을 조사하도록 유도하는 임의의 원하는 DNA 서열을 게놈 DNA에 삽입할 수 있다. HDR을 이용하여 게놈을 편집하기 위해, 원하는 서열을 갖는 DNA 수선 주형이 전형적으로 본 발명의 인공 핵산(및 gRNA)과 함께 제공된다. 이 전략은 예를 들어 치료상의 유전자를 녹인하는 데 유용할 수 있다.
본 발명에 따른 인공 핵산 분자, 바람직하게는 RNA, 또는 이를 포함하는 (약제학적) 조성물 또는 키트는 유전자 발현, 특히 유전자 전사를 조절하는데 사용될 수 있다. 따라서, 적합한 이펙터 도메인을 포함하는 CRISPR-연관 단백질 유도체를 암호화하는 인공 핵산 분자, 바람직하게는 RNA가 이용될 수 있다. 이펙터 도메인은 그의 발현을 조절하기 위해 표적 유전자 (또는 이에 작동 가능하게 연결된 조절 서열)와 상호 작용할 수 있다. 이러한 접근법은 관심 있는 표적 유전자의 바람직하지 않은 (존재 또는 부재, 증가 또는 감소) 발현과 관련된 임의의 질환에 유용할 수 있다.
바람직한 실시예에서, 인공 핵산, 바람직하게는 RNA, (약제학적) 조성물 또는 키트는 암의 치료 또는 예방에 사용된다.
본 명세서에 사용된 용어 “암”은 주변 조직을 침범하고 먼 신체 부위로 전이하는 경향이 있는 세포의 제어되지 않고 일반적으로 빠른 증식을 특징으로 하는 종양을 지칭한다. 이 용어는 양성 및 악성 종양을 포함한다. 암의 악성 종양은 일반적으로 역형성(anaplasia), 침습성, 및 전이를 특징으로 한다; 반면 양성 악성 종양은 일반적으로 이러한 특징을 갖지 않는다. 이 용어에는 혈액 및 림프계 암뿐만 아니라 종양 성장이 특징인 종양이 포함된다.
일부 실시예에서, 본 발명에 따른 인공 핵산, 바람직하게는 RNA, (약제학적) 조성물 또는 키트는 약제, 특히 종양 또는 암 질환의 치료를 위해 사용될 수 있다. 이와 관련하여, 치료는 바람직하게는 특히 종양 내 주사에 의한 종양 내 적용을 포함한다. 따라서 본 발명에 따른 인공 핵산, 바람직하게는 RNA, (약제학적) 조성물 또는 키트는 종양 또는 암 질환의 치료를 위한 약제 제조에 사용될 수 있으며, 상기 약제는 종양 또는 암 질환의 치료를 위한 종양내 적용(투여)에 특히 적합하다.
바람직하게는, 본 명세서에 언급된 종양 및 암 질환은 바람직하게는 예를 들어 급성 림프구성 백혈병, 급성 골수성 백혈병, 부신피질 암종, AIDS 관련 암, AIDS 관련 림프종, 항문암, 충수암, 성상세포종, 기저세포 암종, 담관암, 방광암, 골암, 골육종/악성 섬유성 조직구종, 뇌간신경교종, 뇌종양, 소뇌 성상세포종, 뇌성 성상세포종/악성 신경교종, 상의세포종, 수모세포종, 천막상 속질모세포종, 시각경로 및 시상하부신경교종, 유방암, 기관지선종/암종, 버킷림프종, 소아유암종, 위장카르시노이드암종, 원발부위 미상암, 원발성 중추신경계 림프종, 소뇌성상세포종, 소아 소뇌 성상세포종, 소아 뇌성 성상세포종/악성 신경교종, 자궁경부암, 소아암, 만성 림프구성 백혈병, 만성 골수성 백혈병, 만성 척수증식성장애, 대장암, 피부 T-cell 림프종, 결합조직성소원형세포종양, 자궁내막암, 상의세포종, 식도암, 유잉 종양군의 유잉 육종, 소아 두개골외생식세포종양, 생식선외생식세포종, 간외담관암, 안구내흑색종, 망막모세포종, 담낭암, 위암, 위장유암종, 위장관기질종양, 두개골 또는 생식선외 또는 난소생식세포종양, 임신성 융모종양, 뇌간신경교종, 소아뇌성성상세포종, 소아 시각경로 및 시상하부신경교종(childhood visual pathway and hypothalamic glioma), 위유암종, 털세포백혈병, 두경부암, 심장암, 간암, 호지킨 림프종, 하인두암, 소아 시상하부 및 시각경로 신경교종(childhood hypothalamic and visual pathway glioma), 안구내흑색종, 섬세포암(내분비 췌장), 카포시 육종, 신장암(신장세포암), 후두암, 백혈병, 급성 림프구성 백혈병, 급성 골수성 백혈병, 만성 림프구성 백혈병, 만성 골수성 백혈병, 털세포백혈병, 구순암 및 구강암, 지방육종, 간암, 비소세포폐암, 소세포폐암, 림프종, AIDS 관련 림프종, 버킷림프종, 피부 T-cell 림프종, 호지킨 림프종, 비호지킨 림프종, 원발성 중추신경계 림프종, 발덴스트룀 거대글로불린혈증, 뼈/골육종의 악성 섬유성 조직구종, 소아 수모세포종, 흑색종, 안구내흑색종, 메르켈세포암, 성인 악성중피종, 소아 중피종, 잠복 원발성 전이성 편평 경부암, 구강암, 소아 다발성내분비선종증, 다발성 골수종/형질세포 종양, 균상식육종, 골수형성이상증후군, 골수형성이상/골수증식성질환, 만성 골수성 백혈병, 성인 급성 골수성 백혈병, 소아 급성 골수성 백혈병, 다발성 골수종(골수암), 만성 골수 증식성 질환, 비부비동암, 비인두암, 신경모세포종, 구강암, 구인두암, 뼈의 골육종/악성 섬유성 조직구종, 난소암, 난소상피암(표면 상피-기질 종양), 난소 생식세포 종양, 난소저악성도종양, 췌장암, 췌장섬세포암, 비부비동암, 부갑상선암, 음경암, 인두암, 갈색세포종, 송과선성상세포종, 송과선배세포종, 송과체모세포종 및 원시신경외배엽종양, 뇌하수체선종, 형질세포종양형성/다발성골수종, 흉막폐아세포종, 원발성 중추신경계 림프종, 전립선암, 직장암, 신장세포암종(신장암), 신우 및 요관암, 망막모세포종, 소아횡문근육종, 침샘암, 유잉 종양군의 육종, 카포시육종, 연부조직육종, 자궁육종, 세자리증후군, 피부암(비흑색종), 피부암(흑색종), 메르켈 세포 피부 암종, 소장암, 편평세포암종, 잠복 원발성 전이성 편평 경부암, 소아천막상원시신경외배엽종양, 고환암, 인후암, 소아흉선종, 흉선종 및 흉선암, 갑상선암, 소아갑상선암, 신우 및 요관의 이행세포암, 임신성 융모종양, 요도암, 자궁내막암, 자궁육종, 질암, 소아 시각경로 및 시상하부신경교종, 외음부암, 발덴스트룀 거대글로불린혈증, 소아윌림스종양(신장암)을 포함하는 종양 또는 암 질환으로부터 선택된다.
종양 내 투여에 적합한 종양 또는 암의 특히 바람직한 예는 전립선암, 폐암, 유방암, 뇌암, 두경부암, 갑상선암, 대장암, 위암, 간암, 췌장암, 난소암, 피부암, 방광, 자궁 및 자궁 경부이다.
감염성 질환
본 발명의 조합물, 약제학적 조성물 또는 키트는 감염성 질환의 치료에 사용될 수 있다. 용어 "감염" 또는 "감염성 질병"은 일반적으로 체내에 존재하지 않는 박테리아, 바이러스 및 기생충과 같은 미생물의 침입 및 증식에 관한 것이다. 감염은 증상을 일으키지 않고 잠재적이거나 증상을 유발하고 임상적으로 명백할 수 있다. 감염은 국소적으로 남아 있거나 혈액이나 림프계를 통해 퍼져 전염될 수 있다. 이와 관련해서 감염성 질환은 바람직하게는 바이러스성, 세균성, 진균성 또는 원생동물성 감염성 질환을 포함한다.
본 발명의 인공 핵산, 바람직하게는 RNA에 의해 암호화된 CRISPR-연관 단백질에 의한 숙주 세포로부터의 바이러스의 박멸은 바람직하게는 그 생활환에서 DNA 중간체를 갖는 임의의 DNA 바이러스 또는 RNA 바이러스에 적용 가능하다. 따라서, 본 발명에 따른 인공 핵산, 바람직하게는 RNA, (약제학적) 조성물 및 키트는 특히 인간 유두종 바이러스 HPV16 및 HPV18 감염, B형 간염 바이러스 (HBV) 감염, 엡슈타인-바 바이러스 (EBV), HIV-1 감염, 헤르페스바이러스 감염 (카포시 육종 관련 헤르페스바이러스 (KSHV, HHV8) 감염 포함) 및 폴리오마바이러스 감염 (메르켈 세포 암종 바이러스 (MCV), 폴리오마바이러스 JC (JCV) 및 폴리오마바이러스 BK (BKV) 감염 및 관련 감염성 질병의 치료를 위해 예상된다.
병용 요법
본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트는 또한 병용 요법에 사용될 수 있다. 본 명세서에 정의된 질환 및 장애를 치료 또는 예방하는데 유용한 임의의 다른 요법은 본 명세서에 개시된 용도 및 방법과 조합될 수 있다.
예를 들어, 본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트를 제공받는 대상은 본 명세서에 정의된 바와 같은 암 또는 관련 상태의 화학 요법(chemotherapy) (예를 들어 1차 또는 2차 화학 요법), 방사선 요법, 화학 방사선 요법(chemoradiation)(화학 요법과 방사선 요법의 조합), 티로신 키나아제(tyrosine kinase) 억제제(예를 들어 EGFR tyrosine kinase 억제제), 항체 요법 및/또는 억제성 및/또는 자극성 체크 포인트 분자(예를 들어 CTLA4 억제제)를 받는 환자 또는 상기 명시된 치료 중 적어도 하나를 받은 후 부분 반응 또는 안정 병변을 달성한 환자일 수 있다. 또는, 본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트를 제공받는 대상은 본 명세서에 정의된 바와 같은 감염성 질환을 갖는 환자, 바람직하게는 항생제, 항진균 또는 항바이러스 요법을 받는 환자일 수 있다.
추가적인 측면에서, 본 발명은 상기 인공 핵산 분자, (약제학적) 조성물 또는 키트로 치료할 수 있는 또한 암, 감염성 질환 또는 다른 질환의 또 다른 치료법을 지지하기 위한 본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트의 용도에 관한 것이다.
암의 치료 또는 예방의 “지원”은 수술, 방사선 요법, 화학 요법(chemotherapy) (예를 들어 1 차 또는 2 차 화학 요법), 화학 방사선 요법(chemoradiation), 티로신 키나아제(tyrosine kinase) 억제제에 의한 치료, 억제성 및/또는 자극성 체크 포인트 분자, 바람직하게는 CTLA4 억제제, 항체 요법 또는 이들의 임의의 조합, 및 본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트를 사용하는 요법과 같은 통상적인 암 치료법의 임의의 조합일 수 있다.
본 발명의 인공 핵산 분자, 바람직하게는 RNA, (약제학적) 조성물 또는 부품 키트의 투여는 동시에 및/또는 후속하여 다른 치료제를 투여하거나 환자를 치료될 특정 질환 또는 상태의 치료에 유용한 다른 치료법에 적용하기 전에 달성될 수 있다.
항목(ITEMS)
상기를 고려하여, 본 발명은 다음 항목에 의해 특징 지어질 수 있다:
1.
a. 적어도 하나의 CRISPR-연관 단백질을 암호화하는 적어도 하나의 암호화 영역;
b. SLC7A3, ATP5A1, RPL32, HSD17B4, NOSIP, ASAH1, RPL31, TUBB4B, UBQLN2, MP68 및 NDUFA4로 이루어진 군으로부터 선택된 유전자의 5' 비번역 영역(5' UTR)으로부터 유래된 적어도 하나의 5' UTR 요소; 및
c. GNAS, CASP1, PSMB3, ALB, COX6B1, NDUFA1 및 RPS9로 이루어진 군으로부터 선택된 유전자의 3' 비번역 영역(3' UTR)으로부터 유래된 적어도 하나의 3' UTR 요소
를 포함하는 인공 핵산 분자.
2. 제1항목에 있어서, 상기 각각의 유전자는 자연적으로 발생한 DNA 서열, 및 이의 상동체, 변이체, 단편, 및 상응하는 RNA 서열을 포함하는 인공 핵산 분자.
3. 제1항목 또는 제2항목에 있어서,
a. SLC7A3 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
b. HSD17B4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
c. ATP5A1 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 CASP1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
d. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 PSMB3 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
e. HSD17B4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 PSMB3 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
f. RPL32 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 ALB 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
g. HSD17B4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 CASP1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
h. SLC7A3유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 CASP1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
i. SLC7A3유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 PSMB3 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
j. NOSIP 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 PSMB3 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
k. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 RPS9 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
l. HSD17B4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 RPS9 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
m. ATP5A1 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
n. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 COX6B1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
n. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
o. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 NDUFA1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
p. NOSIP 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 NDUFA1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
q. RPL31 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
r. TUBB4B 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 RPS9 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
s. UBQLN2 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 RPS9 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
t. MP68 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
u. MP68 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 NDUFA1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소;
4. 제3항목에 있어서, d, e, g 또는 l에 따른 UTR 요소를 포함하는 인공 핵산 분자.
5. 제1항목 내지 제4항목 중 어느 한 항목에 있어서,
- HSD17B4 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 1에 따른 DNA 서열 또는 서열번호: 1에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 2에 따른 RNA 서열 또는 서열번호: 2에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- RPL32 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 21에 따른 DNA 서열 또는 서열번호: 21에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 22에 따른 RNA 서열 또는 서열번호: 22에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- NDUFA4 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 9에 따른 DNA 서열 또는 서열번호: 9에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 10에 따른 RNA 서열 또는 서열번호: 10에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- SLC7A3 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 15에 따른 DNA 서열 또는 서열번호: 15에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 16에 따른 RNA 서열 또는 서열번호: 16에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- NOSIP 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 11에 따른 DNA 서열 또는 서열번호: 11에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 12에 따른 RNA 서열 또는 서열번호: 12에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- ATP5A1 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 5에 따른 DNA 서열 또는 서열번호: 5에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 6에 따른 RNA 서열 또는 서열번호: 6에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
ASAH1 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 3에 따른 DNA 서열 또는 서열번호: 3에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 4에 따른 RNA 서열 또는 서열번호: 4에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
Mp68 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 7에 따른 DNA 서열 또는 서열번호: 7에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 8에 따른 RNA 서열 또는 서열번호: 8에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
Rpl31 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 13에 따른 DNA 서열 또는 서열번호: 13에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 14에 따른 RNA 서열 또는 서열번호: 14에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
TUBB4B 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 17에 따른 DNA 서열 또는 서열번호: 17에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 18에 따른 RNA 서열 또는 서열번호: 18에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
Ubqln2 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 19에 따른 DNA 서열 또는 서열번호: 19에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 20에 따른 RNA 서열 또는 서열번호: 20에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- GNAS 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 29에 따른 DNA 서열 또는 서열번호: 29에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 30에 따른 RNA 서열 또는 서열번호: 30에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- CASP1 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 25에 따른 DNA 서열 또는 서열번호: 25에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 26에 따른 RNA 서열 또는 서열번호: 26에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- PSMB3 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 23에 따른 DNA 서열 또는 서열번호: 23에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 24에 따른 RNA 서열 또는 서열번호: 24에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- ALB 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 35에 따른 DNA 서열 또는 서열번호: 35에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 36에 따른 RNA 서열 또는 서열번호: 36에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- RPS9 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 33에 따른 DNA 서열 또는 서열번호: 33에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 34에 따른 RNA 서열 또는 서열번호: 34에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- COX6B1 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 27에 따른 DNA 서열 또는 서열번호: 27에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 28에 따른 RNA 서열 또는 서열번호: 28에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
- Ndufa1 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 31에 따른 DNA 서열 또는 서열번호: 31에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 32에 따른 RNA 서열 또는 서열번호: 32에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되는 인공 핵산 분자.
6. 제1항목 내지 제5항목 중 어느 한 항목에 있어서, 상기 CRISPR-연관 단백질은 이의 CRISPR-연관 야생형 단백질, 상동체, 변이체, 단편 및 유도체를 포함하는 인공 핵산 분자.
7. 제1항목 내지 제6항목 중 어느 한 항목에 있어서, 상기 CRISPR-연관 단백질은 Cas9, Cpf1 (Cas12), C2c1, C2c3, Cas13, CasX 또는 CasY로부터 선택된 인공 핵산 분자.
8. 제1항목 내지 제7항목 중 어느 한 항목에 있어서, 상기 인공 핵산은 서열번호: 428-441; 10999-11001; 442-1345 중 어느 하나에 따른 아미노산 서열 또는 서열번호: 428-441; 10999-11001; 442-1345 중 어느 하나에 따른 아미노산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열 또는 이들 서열 중 임의의 것의 변이체 또는 단편을 포함하거나 이로 구성되는 CRISPR-연관 단백질을 암호화하는 핵산 서열을 포함하는 인공 핵산 분자.
9. 제8항목에 있어서, 상기 CRISPR-연관 단백질 유도체는 KRAB, CSD, WRPW, VP64, p65AD 및 Mxi로부터 임의로 선택된 적어도 하나의 추가적인 이펙터 도메인을 포함하는 인공 핵산 분자.
10. 제1항목 내지 제9항목 중 어느 한 항목에 있어서, 상기 인공 핵산은 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964에 따른 아미노산 서열 또는 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964에 따른 아미노산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성되는 NLS 및 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964에 따른 아미노산 서열 또는 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964에 따른 아미노산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성되는 NLS 또는 서열번호: 12021-14274에 따른 아미노산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 갖는 NLS로부터 임의로 선택된 핵 위치 신호(NLS)를 암호화하는 적어도 하나의 핵산 서열을 추가로 포함하는 인공 핵산 분자.
11. 제1항목 내지 제10항목 중 어느 한 항목에 있어서, 상기 인공 핵산은 단백질 또는 펩티드 태그를 암호화하는 적어도 하나의 핵산을 추가적으로 포함하는 인공 핵산 분자.
12. 제1항목 내지 제11항목 중 어느 한 항목에 있어서, 상기 인공 핵산 분자의 적어도 하나 이상의 암호화 영역은 서열번호: 411; 2540-2553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 6020-6033; 7180-7193; 8340-8353; 11237-11239; 11473-11475; 11591-11593; 11709-11711; 11827-11829; 11945-11947; 1394-2297; 3714-4617; 4874-5777; 6034-6937; 7194-8097; 8354-9257; 412; 3474-3887 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754-9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 9690-9703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250-10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594-9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; 중 어느 하나에 따른 핵산 서열 또는 상기 핵산 서열 중 어느 하나에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되는 인공 핵산 분자.
13. 제1항목 내지 제12항목 중 어느 한 항목에 있어서, 상기 인공 핵산 분자는 서열번호: 10552; 3458-3459; 3460-3473; 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 8208-8209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583 10579-10580; 10585-10586; 10588-10589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881; 10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 9352-9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448-9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 9832-9833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 10392-10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 중 어느 하나에 따른 핵산 서열 또는 상기 핵산 서열 중 어느 하나에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 핵산 서열을 포함하는 인공 핵산 분자.
14. 제1항목 내지 제13항목 중 어느 한 항목에 있어서, 상기 인공 핵산 분자는 서열번호: 11011-11042; 11249-1128011131-11162; 11367-11398; 11485-11516; 11603-11634; 11721-11752; 11839-11870; 11044-11116; 11282-11354; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11011-11042; 11249-11280; 11044-11116; 11282-11354 11131-11162; 11367-11398; 11485-11516; 11603-11634; 11721-11752; 11839-11870; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11120-11122 ; 11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712; 11713; 11830; 11831; 11948; 11949; 11123-11130; 11360-11366 11242-11248; 11478-11484; 11596-11602; 11714-11720; 11832-11838; 11950-11956 중에 어느 하나에 따른 핵산 서열 또는 상기 핵산 서열 중 어느 하나에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되는 인공 핵산 분자.
15. 제1항목 내지 제14항목 중 어느 한 항목에 있어서, 상기 인공 핵산 분자는 RNA인 인공 핵산 분자.
16. 제15항목에 있어서, 상기 RNA가 모노-, 바이-, 또는 멀티시스트로닉인 RNA.
17. 제14항목 또는 제15항목에 있어서, 상기 RNA는 mRNA, 바이러스 RNA 또는 레플리콘 RNA인 RNA.
18. 제1항목 내지 제17항목 중 어느 한 항목에 있어서, 상기 인공 핵산은 변형된 핵산, 바람직하게는 안정화된 핵산인 인공 핵산, 바람직하게는 RNA.
19. 제1항목 내지 제18항목 중 어느 한 항목에 있어서,
- 상기 인공 핵산의 적어도 하나의 암호화 영역의 G/C 함량이 상응하는 야생형 인공 핵산의 상응하는 암호화 서열의 G/C함량과 비교할 때 증가되며, 및/또는
- 상기 인공 핵산의 하나 이상의 암호화 영역의 C 함량이 상응하는 야생형 인공 핵산의 상응하는 암호화 서열의 C 함량과 비교할 때 증가되며, 및/또는
- 상기 인공 핵산의 적어도 하나의 암호화 영역에 있는 코돈은 인간 코돈 사용에 적합하며, 코돈 적응 지수(CAI)는 적어도 하나의 인공 핵산의 암호화 서열에서 바람직하게 증가 또는 최대화되며,
- 상기 인공 핵산에 의해 암호화된 아미노산 서열은 상응하는 야생형 인공 핵산에 의해 암호화된 아미노산 서열에 비해 바람직하게는 변형되지 않은
인공 핵산, 바람직하게는 RNA.
20. 제1항목 내지 제19항목 중 어느 한 항목에 있어서, 5'-CAP 구조, 바람직하게는 m7GpppN 또는 Cap1를 포함하는 인공 핵산, 바람직하게는 RNA.
21. 제1항목 내지 제20항목 중 어느 한 항목에 있어서, 적어도 하나의 히스톤 스템-루프를 포함하는 인공 핵산, 바람직하게는 RNA.
22. 제21항목에 있어서, 상기 적어도 하나의 히스톤 스템-루프는 하기 화학식 (I) 또는 (II)에 따른 핵산 서열을 포함하며:
화학식 (I) (스템 경계 요소가 없는 스템-루프 서열):
Figure pct00032
화학식 (II) (스템 경계 요소가 있는 스템-루프 서열):
Figure pct00033
상기:
스템1 또는 스템2 경계 요소 N1-6은 1 내지 6, 바람직하게는 2 내지 6, 더 바람직하게는 2 내지 5, 더욱 더 바람직하게는 3 내지 5, 가장 바람직하게는 4 내지 5 또는 5 N의 연속적인 서열이고, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이다;
스템1 [N0-2GN3-5]은 요소 스템2와 역으로 상보적 또는 부분적으로 역으로 상보적이며, 5 내지 7 뉴클레오티드 사이의 연속적인 서열이고;
상기 N0-2 는 0 내지 2, 바람직하게는 0 내지 1, 더 바람직하게는 1 N의 연속적인 서열이고, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며;
상기 N3-5 는 3 내지 5, 바람직하게는 4 내지 5, 더 바람직하게는 4 N의 연속적인 서열이고, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며; 그리고
상기 G는 구아노신 또는 이의 유사체이고, 스템2에서 그것의 상보적인 뉴클레오티드 시티딘이 구아노신으로 치환되는 경우, 선택적으로 시티딘 또는 이의 유사체로 치환될 수 있다;
루프 서열 [N0-4(U/T)N0-4] 는 요소 스템1과 스템2 사이에 위치하며 3 내지 5 뉴클레오티드, 더 바람직하게는 4 뉴클레오티드의 연속적인 서열이고;
상기 각각의 N0-4 은 0 내지 4의, 바람직하게 1 내지 3, 더 바람직하게 1 내지 2 N의 다른 연속적인 서열로부터 독립적이며, 상기 각각의 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며; 그리고
상기 U/T는 우리딘, 또는 선택적으로 티미딘을 나타낸다;
스템2 [N3-5CN0-2]는 요소 스템1과 역으로 상보적이거나 또는 부분적으로 역으로 상보적이며, 5 내지 7 뉴클레오티드 사이의 연속적인 서열이고;
상기 N3-5은 3 내지 5, 바람직하게는 4 내지 5, 더 바람직하게는 4 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며;
상기 N0-2은 0 내지 2, 바람직하게는 0 내지 1, 더 바람직하게는 1 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며; 그리고
상기 C는 시티딘 또는 이의 유사체이고, 스템1에서 그것의 상보적인 뉴클레오티드 구아노신이 시티딘으로 치환되는 경우, 선택적으로 구아노신 또는 이의 유사체로 치환될 수 있다;
상기
스템1 및 스템2는 서로 역 상보적 서열을 형성하면서 염기 짝짓기를 할 수 있고, 상기 염기 짝짓기는 스템1 및 스템2 사이에서 일어날 수 있으며, 또는
서로 부분적으로 역 상보적 서열을 형성하면서 염기 짝짓기를 할 수 있고, 불완전한 염기 짝짓기는 스템1과 스템2 사이에서 일어날 수 있는 인공 핵산, 바람직하게는 RNA.
24. 제19항목 또는 제20항목에 있어서, 상기 적어도 하나의 히스톤 스템-루프는 다음의 화학식 (Ia) 또는 (IIa)에 따른 핵산 서열을 포함하는 인공 핵산, 바람직하게는 RNA:
화학식 (Ia) (스템 경계 요소가 없는 스템-루프 서열):
Figure pct00034
화학식 (IIa) (스템 경계 요소가 있는 스템-루프 서열):
Figure pct00035
25. 제1항목 내지 제24항목 중 어느 한 항목에 있어서, 선택적으로 폴리 (A) 서열, 바람직하게는 10 내지 200, 10 내지 100, 40 내지 80, 또는 50 내지 70 아데노신 뉴클레오티드를 포함하는 인공 핵산, 바람직하게는 RNA.
26. 제1항목 내지 제25항목 중 어느 한 항목에 있어서, 선택적으로 폴리 (C) 서열, 바람직하게는 10 내지 200, 10 내지 100, 20 내지 70, 20 내지 60, 10 내지 40 시토신 뉴클레오티드를 포함하는 인공 핵산, 바람직하게는 RNA.
27. 제1항목 내지 제26항목 중 어느 한 항목에 있어서, 바람직하게는 5'에서 3' 방향으로 다음 요소를 포함하는 인공 핵산, 바람직하게는 RNA:
a) 5'-CAP 구조, 바람직하게는 m7GpppN 또는 Cap1
b) 제1항목 내지 제5항목 중 어느 한 항목에서 정의된 5'-UTR로부터 유래된 핵산 서열, 바람직하게는 서열번호: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19 또는 21에 따른 핵산 서열에 상응하는 핵산 서열 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성된 5'-UTR 요소,
c) 제7항목 내지 제13항목 중 어느 한 항목에서 정의된 적어도 하나의 암호화 서열
d) 제1항목 내지 제5항목 중 어느 한 항목에서 정의된 3'-UTR로부터 유래된 핵산 서열, 바람직하게는 서열번호: 15; 17; 19; 21 29; 31; 33 또는 35에 따른 핵산 서열에 상응하는 핵산 서열 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성된 3'-UTR 요소,
e) 선택적으로 폴리(A) 꼬리, 바람직하게는 10 내지 1000, 10 내지 500, 10 내지 300, 10 내지 200, 10 내지 100, 40 내지 80, 또는 50 내지 70 아데노신 뉴클레오티드로 이루어진 폴리(A) 꼬리,
f) 선택적으로 폴리(C) 꼬리, 바람직하게는 10 내지 200, 10 내지 100, 20 내지 70, 20 내지 60, 또는 10 내지 40 시토신 뉴클레오티드로 이루어진 폴리(C) 꼬리, 및
g) 선택적으로 히스톤 스템-루프(HSL).
28. 제1항목 내지 제26항목 중 어느 한 항목에 있어서 인공 핵산 분자, 바람직하게는 RNA 및 약제학적으로 허용 가능한 담체 및/또는 부형제를 포함하는 조성물.
29. 제28항목에 있어서, 상기 인공 핵산 분자, 바람직하게 RNA는 하나 이상의 양이온성 또는 다가양이온성 화합물, 바람직하게는 양이온성 또는 다가양이온성 중합체, 양이온성 또는 다가양이온성 펩티드 또는 단백질(예를 들어, 프로타민), 양이온성 또는 다가양이온성 다당류 및/또는 양이온 또는 다가양이온성 지질과 복합체화되어 있는 조성물.
30. 제29항목에 있어서, 상기 하나 이상의 양이온성 또는 다가양이온성 펩티드 또는 단백질 대비 상기 인공 핵산 분자, 바람직하게는 RNA의 N/P비는 약 0.3 내지 4, 약 0.5 내지 2, 약 0.7 내지 2 및 약 0.7 내지 1.5를 포함하여 약 0.1 내지 10 범위인 조성물.
31. 제28항목 내지 제30항목 중 어느 한 항목에 있어서, 인공 핵산 분자, 바람직하게는 RNA가 하나 이상의 지질과 복합체를 형성하여 리포좀, 지질 나노 입자 및/또는 리포플렉스를 형성하는 조성물.
32. 제28항목 내지 제31항목 중 어느 한 항목에 있어서, 적어도 하나의 가이드 RNA (gRNA) 또는 이를 암호화하는 핵산 또는 이에 작동 가능하게 연결된 조절 인자를 추가로 포함하며, 상기 gRNA는 CRISPR-연관 단백질을 관심 있는 표적 DNA 서열에 표적화할 수 있는 조성물.
33. 제1항목 내지 제27항목 중 어느 한 항목에 있어서 인공 핵산 분자, 바람직하게는 RNA 또는 제28항목 내지 제32항목 중 어느 한 항목에 있어서 조성물 및 선택적으로 액체 비히클 및/또는 인공 핵산 분자 또는 조성물의 투여와 복용량에 관한 정보를 가지는 기술 지침을 포함하는 키트, 바람직하게는 부품 키트.
34. 제33항목에 있어서, 상기 키트는 일부 링거-락테이트 용액을 포함하는 키트.
35. 제33항목 또는 제34항목에 있어서, 추가적으로 가이드 RNA(gRNA) 또는 이를 암호화하는 핵산 또는 이에 작동 가능하게 연결된 조절 인자를 포함하며, 상기 gRNA는 CRISPR-연관 단백질을 관심 있는 표적 DNA 서열에 표적화할 수 있는 키트.
36. 약제로 사용하기 위한 제1항목 내지 제27항목 중 어느 한 항목에 따른 인공 핵산 분자, 바람직하게는 RNA, 제28항목 내지 제32항목 중 어느 한 항목에 따른 조성물 또는 제33항목 내지 제35항목 중 어느 한 항목에 따른 키트.
37. 유전자 치료법에 사용하기 위한 제1항목 내지 제27항목 중 어느 한 항목에 따른 인공 핵산 분자, 바람직하게는 RNA, 제28항목 내지 제32항목 중 어느 한 항목에 따른 조성물, 또는 제33항목 내지 제35항목 중 어느 한 항목에 따른 키트.
38. (a) 상기 인공 핵산 분자, 바람직하게 RNA, 상기 조성물 또는 상기 키트 및 (b) 가이드 RNA(gRNA) 또는 이를 암호화하는 핵산을 이를 필요로 하는 환자에 투여하는 단계를 포함하는 관심 있는 유전자의 발현을 조절하는 방법에 사용하기 위한 것으로, 상기 sgRNA는 CRISPR-연관 단백질을 관심 유전자 또는 그에 작동 가능하게 연결된 조절 요소로 표적화할 수 있는, 제1항목 내지 제27항목 중 어느 한 항목에 따른 인공 핵산 분자, 바람직하게는 RNA, 제28항목 내지 제32항목 중 어느 한 항목에 따른 조성물, 또는 제33항목 내지 제35항목 중 어느 한 항목에 따른 키트.
39. 적어도 하나의 암호화 서열에 의해 암호화된 CRISPR-연관 단백질의 발현에 의해 치료될 수 있는 질환, 장애 또는 상태의 약제로서 또는 유전자 치료법에 사용하기 위한 제1항목 내지 제27항목에 따른 인공 핵산 분자, 바람직하게는 RNA, 제28항목 내지 제32항목에 따른 조성물, 또는 제33항목 내지 제35항목에 따른 키트.
40. 관심 유전자를 녹인, 녹아웃 또는 조작하거나 관심 유전자의 발현을 조절함으로써 치료될 수 있는 질환, 장애 또는 상태의 약제로서 또는 유전자 치료법에 사용하기 위한 제1항목 내지 제27항목에 따른 인공 핵산 분자, 바람직하게는 RNA, 제28항목 내지 제32항목에 따른 조성물, 또는 제33항목 내지 제35항목에 따른 키트.
41. 제40항목에 있어서, 상기 질환, 장애 또는 상태는 유전자 질환, 암, 자가 면역 질환, 염증성 질환 및 감염성 질환으로부터 선택되는 인공 핵산 분자, 바람직하게는 RNA, 조성물, 또는 키트.
42. 선택적으로 유전자 치료법에서, 상기 암호화된 CRISPR-연관 단백질의 발현을 증가시키기 위한 제1항목 내지 제27항목 중 어느 한 항목에 따른 인공 핵산 분자, 바람직하게는 RNA, 제28항목 내지 제32항목 중 어느 한 항목에 따른 조성물, 또는 제33항목 내지 제35항목 중 어느 한 항목에 따른 키트의 용도.
43. 상기 암호화된 CRISPR-연관 단백질에 의해 표적화된 관심 유전자의 발현을 조절하기 위한 제1항목 내지 제27항목 중 어느 한 항목에 따른 인공 핵산 분자, 바람직하게는 RNA, 제28항목 내지 제32항목 중 어느 한 항목에 따른 조성물, 또는 제33항목 내지 제35항목 중 어느 한 항목에 따른 키트의 용도.
44. 다음의 단계들을 포함하는 관심 유전자의 발현을 조절하는 방법:
a) 제1항목 내지 제27항목 중 어느 한 항목에 따른 인공 핵산 분자, 바람직하게는 RNA를 제공하는 단계;
b) 가이드 RNA(gRNA) 또는 이를 암호화하는 핵산을 제공하는 단계로서, 상기 gRNA는 CRISPR-연관 단백질을 관심 있는 표적 DNA 서열 또는 이와 작동 가능하게 연결된 조절 요소에 표적화할 수 있는 단계.
c) 상기 관심 유전자의 발현 효능을 조절하기에 적합한 조건 하에서 세포, 조직, 또는 유기체를 상기 인공 핵산 분자, 바람직하게는 RNA 및 상기 gRNA 또는 이를 암호화하는 핵산과 접촉시키는 단계.
45. 장애를 치료 또는 예방하는 방법으로서, 상기 방법은 이를 필요로 하는 대상에게 유효량의 제1항목 내지 제27항목 중 어느 한 항목에 따른 인공 핵산 분자, 바람직하게는 RNA, 제28항목 내지 제32항목 중 어느 한 항목에 따른 조성물 또는 제33항목 내지 제35항목에 따른 키트, 및 가이드 RNA(gRNA) 또는 이를 암호화하는 핵산을 투여하는 단계를 포함하며, 상기 gRNA는 CRISPR-연관 단백질을 관심 있는 표적 DNA 서열 또는 그에 작동 가능하게 연결된 조절 요소에 표적화할 수 있는 방법.
46. 제45항목에 있어서, 상기 장애는 암호화된 CRISPR-연관 단백질의 발현에 의해 치료될 수 있는, 바람직하게는 상기 CRISPR-연관 단백질에 의해 표적화된 관심 유전자의 발현을 조절함으로써 치료될 수 있는 질환, 장애 또는 상태인 방법.
47. 제45항목 또는 제46항목에 있어서, 상기 장애는 관심 유전자를 녹인, 녹아웃 또는 돌연변이시킴으로써 또는 관심 유전자의 발현을 변경시킴으로써 치료될 수 있는 질환, 장애 또는 상태인 방법.
48.
(a) 상기 암호화 영역을 ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP, 또는 NDUFA4로 이루어진 군으로부터 또는 상응하는 RNA 서열, 상동체, 단편 또는 그 변이체로부터 선택된 유전자의 5' UTR로부터 유래된 적어도 하나의 5' UTR 요소와 회합시키는 단계;
(b) 상기 암호화 영역을 GNAS, CASP1, PSMB3, ALB, 또는 RPS9로 이루어진 군으로부터 또는 상응하는 RNA 서열, 상동체, 단편 또는 그 변이체로부터 선택된 유전자의 3' UTR로부터 유래된 적어도 하나의 3' UTR 요소와 회합시키는 단계;
(c) 제1항목 내지 제47항목 중 어느 한 항목에 따른 인공 핵산 분자, 바람직하게는 RNA를 획득하는 단계
를 포함하는 CRISPR-연관 단백질을 암호화하는 암호화 영역을 포함하는 인공 핵산 분자, 바람직하게는 RNA의 발현 효능을 증가시키는 방법.
유전자 치료법, 및 특히 유전자 편집, 녹인, 녹아웃 또는 관심 있는 표적 유전자의 발현 조절에 의해 CRISPR-연관 단백질로 치료할 수 있는 질환의 치료 및/또는 예방에 효과가 있다.
도면 1은 실시예 1 (In-Cell Western)에 상세히 기재된 바와 같이 HeLa 세포에서 Cas9의 발현 수준에 대한 상이한 UTR 조합의 효과를 보여준다. y-축은 정규화되어 UTR 조합 RPL32/ALB7.1에 대해 100 %의 발현 수준을 나타낸다.
도면 2는 실시예 2 (In-Cell Western)에 상세히 기재된 바와 같이 Hek293T 세포에서 Cas9의 발현 수준에 대한 상이한 UTR 조합의 효과를 보여준다. y-축은 정규화되어 UTR 조합 RPL32/ALB7.1에 대해 100 %의 발현 수준을 나타낸다.
도면 3은 실시예 1 (Western blot)에 상세히 기재된 바와 같이 HepG2 세포에서 Cas9의 발현 수준에 대한 상이한 UTR 조합의 효과를 나타낸다. y-축은 정규화되어 UTR 조합 RPL32/ALB7.1에 대해 100 %의 발현 수준을 나타낸다.
도면 4는 실시예 2 (Western blot)에 상세히 기재된 바와 같이 HeLa 세포에서 최적화된 spCas9 mRNA 구조물의 발현 수준을 나타낸다. y-축은 정규화되어 UTR 조합 RPL32/ALB7.1에 대해 100 %의 발현 수준을 나타낸다.
도면 5는 실시예 2 (In-cell Western)에 상세히 기재된 바와 같이 HeLa 세포에서 최적화된 spCas9 mRNA 구조물의 발현 수준을 나타낸다. y-축은 정규화되어 UTR 조합 RPL32/ALB7.1에 대해 100 %의 발현 수준을 나타낸다.
도면 6은 상업적으로 이용 가능한 Cas9 mRNA와 비교하여 실시예 1 (In-cell Western)에 상세히 기재된 바와 같이 HeLa 세포에서 최적화된 spCas9 mRNA 구조물의 발현 수준을 나타낸다. y-축은 정규화되어 상업적인 Cas9 mRNA에 대해 100 %의 발현 수준을 나타낸다.
도면 7은 실시예 1 (In-cell Western)에 상세히 기술 된 바와 같이 HeLa 세포에서 최적화 된 spCas9 mRNA 구조물의 발현 수준을 나타낸다. y-축은 정규화되어 상업적인 UTR 조합 RPL32/ALB7.1에 대해 100 %의 발현 수준을 나타낸다.
도면 8은 상업적으로 이용 가능한 Cas9 mRNA와 비교하여 실시예 2 (In-cell Western)에 상세히 기재된 바와 같이 Hek293T 세포에서 최적화 된 spCas9 mRNA 구조물의 발현 수준을 나타낸다.
도면 9는 상업적으로 이용 가능한 Cas9 mRNA와 비교하여 실시예 2 (Western blot)에 상세히 기재된 바와 같이 HepG2 세포에서 최적화 된 spCas9 mRNA 구조물의 발현 수준을 나타낸다. y-축은 정규화되어 상업적인 Cas9 mRNA에 대해 100 %의 발현 수준을 나타낸다.
도면 10은 mismatch nuclease assay/mismatch detection assay에 의해 실시예 3에 설명된 바와 같이 mRNA 구조물로부터 발현된 spCas9의 DNA editing 활성을 보여준다. A: PCR 증폭, B: mismatch detection assay.
도면 11은 %로 RPL32/ALB7 대비 HepG2에서 최적화된 Cpf1 mRNA 구조물의 발현 수준을 보여준다. y-축은 정규화되어 RPL32/ALB7 UTR 조합 Cpf1 mRNA에 대해 100 %의 발현 수준을 나타낸다.
도면 12는 %로 RPL32/ALB7 대비 HeLa에서 최적화된 Cpf1 mRNA 구조물의 발현 수준을 보여준다. y-축은 정규화되어 RPL32/ALB7 UTR 조합 Cpf1 mRNA에 대해 100 %의 발현 수준을 나타낸다.
실시예
이하에서, 본 발명의 다양한 실시예 및 측면을 나타내는 특정 예시가 제시된다. 그러나, 본 발명은 여기에 설명된 특정 실시예에 의해 범위가 제한되지 않아야 한다. 하기 제조 및 실시예는 본 발명이 속하는 기술분야에서 통상의 기술자가 본 발명을 보다 명확하게 이해하고 실시할 수 있도록 제공된다. 그러나, 본 발명은 본 발명의 단일 측면의 예시로서 의도된 예시된 실시예에 의해 범위가 제한되지 않으며 기능적으로 동등한 방법들은 본 발명의 범위 내에 있다. 실제로, 본 명세서에 기술된 것들에 추가하여 본 발명의 다양한 변형은 상기 설명, 첨부 도면 및 하기 실시예로부터 본 발명이 속하는 기술분야에서 통상의 기술자에게 명백해질 것이다. 이러한 모든 변형은 첨부된 청구범위의 범위 내에 속한다.
실시예 1: 세포 내 웨스턴(In-cell-Western) 및 웨스턴 블롯 분석(Western Blot analysis)을 이용한 HeLa, Hek293T 및 HepG2 세포에서 Cas9 발현의 검출
완전 세포 배지 (200 μl)에서 HeLa에 대해 10,000 세포/웰; Hek293T 및 HEPG2에 대해 20,000 세포/웰의 밀도로 96- 웰 플레이트(Nunc Microplate Black w/Clear Optical Bottom; Thermo Fisher)에 세포를 시딩하였다. 세포를 37 ℃, 5 % CO2에서 24 시간 동안 유지시켰다. 형질 주입 당일, 완전 배지를 50 μl의 무혈청 Opti-MEM medium (Thermo Fisher)로 교체하였다. 100 ng의 각 mRNA, 즉 서열번호: 14274 (RPL32/ALB7.1), 서열번호: 14275 (HSD17B4/CASP1.1), 서열번호: 14276 (SLC7A3.1/PSMB3.1), 서열번호: 14277 (SLC7A3.1/CASP1.1), 서열번호: 14278 (NOSIP.1/PSMB3.1), 서열번호: 14279 (NDUFA4.1/RPS9.1), 서열번호: 14280 (NDUFA4.1/PSMB3.1), 서열번호: 14281 (HSD17B4/PSMB3.1) 및 서열번호: 14282 (HSD17B4/RPS9.1)를 mRNA:Lipofectamine 3000를 1:1.5 비율로 Opti-MEM의 50 μl에서 Lipofectamine 3000을 사용하여 리포착화하였다. 이어서, 리포착화된 mRNA를 상응하는 96-well-plate에 첨가하였다. 형질 주입 3시간 후, 완전 배지를 100 μl의 완전 세포 배지로 교체하였다. 세포 내 웨스턴을 수행하기 전에 세포를 37 ℃, 5% CO2에서 24 시간 동안 추가로 유지시켰다.
세포 내 웨스턴 분석(western analysis) (HeLa 및 Hek293T)의 경우, 세포를 PBS1X로 2 회 세척하고 메탄올/아세톤(1:1)의 용액으로 10 분 동안 고정시켰다. 고정 후, 세포를 PBS1X로 각각 5 분 동안 3 회 세척 하였다. 세포 내 웨스턴 분석 (HeLa, HepG2 및 Hek293T)의 경우, 세포를 PBS1X로 트리스(trice) 세척하고, 파라포름알데히드(paraformaldehyde) 4 %로 10분간 고정시켰다. 고정 후, 세포를 각각 5분 동안 PBS1X로 3회 세척하고 15분 동안 PBS에서 2 % 트리톤 X100으로 투과시켰다. 비특이적 결합을 피하기 위해, 세포를 0.01% Triton X100이 보충된 Odyssey blocking buffer (PBS, LI-COR)으로 1시간 동안 상온에서 블록시킨 다음, 1차 항체, 즉 spCas9에 대한 다클론성 토끼 항체 (1/1000; #632606; Clontech/Takara)와 함께 1시간 반 동안 배양하였다. 이어서, 세포를 약한 진탕 (80rpm)하에 5분 동안 PBS1X 중 0.1 % Tween-20으로 4회 세척하였다.
이어서, 2차 항체, 즉 infrared dye®800CW 염소 항-토끼 다클론성 항체 (1/250; LI-COR)를 Odyssey blocking buffer 중의 Cell-Tag 700 (1/5000; LI-COR) 염색체와 혼합하고, 상온에서 1시간동안 암실 배양하였다. 스캔하기 전에 Odyssey®CLx Imaging system (LI-COR)을 사용하여 상기 서술한 바와 같이 세척 단계를 수행하였다. 상대 정량 (800/700)은 Image StudioTM Lite Software를 사용하여 얻었다. mRNA 없이 리포펙션된 웰로부터 수득된 배경 형광을 측정에서 제외하고 그 결과를 상업적으로 이용가능한 Cas9-encoding RNA (TriLink BioTechnologies, LLC, Cat. No. L-6125)로부터의 발현과 비교하였다.
HepG2 세포의 경우, 웨스턴 블롯을 사용하여 분석을 수행하였다. 플레이트를 PBS1X에서 2회 세척하고, Benzonase Endonuclease (Millipore)를 포함하는 50μl의 샘플 로딩 버퍼 1X (Biorad)와 20분동안 상온에서 직접 배양하였다. 이어서, 플레이트를 95 ℃에서 5 분 동안 배양하고 원심분리하였다.
15μl의 용해물을 10% Mini-Protean TGX gels (Biorad)에서 작동시키고 nitrocellulose membranes (100V; 90분)으로 옮겼다. 막을 각각 10 분 동안 PBS 중의 0.1 Triton X100으로 3 회 세척하고 4 ℃에서 밤새 PBS1X 중의 10 % Milk로 적셨다.
PBS1X의 5 % Milk에서 spCas9 (1/1000; #632606; Clontech/Takara)에 대한 다클론성 토끼 항체 및 대조군 mouse monoclonal Anti-beta Actin antibody (1/10000; ab6276; Abcam)를 1시간 동안 상온에서 배양하였다. 이어서, 막을 TBS1X의 0.1 % Tween-20에서 3회 세척 하였다. Infrared dye®800CW 염소 항-토끼 다클론성 및 infrared dye®염소 항-쥐 항체 (각각 1/7500 및 1/10000) 이 검출에 사용되었다. 아래 설명된 세척 단계는 스캔하기 전에 Odyssey®CLx Imaging system (LI-COR)을 사용하여 3 번 반복되었다. StudioTM Lite Software (LI-COR)를 사용하여 밴드 강도 및 상대 정량을 수행하였다.
본 발명에 따른 UTR-조합을 포함하는 Cas9-encoding mRNA는 상업적으로 이용 가능한 Cas9 mRNA와 비교하여 매우 우수한 발현 증가 (도면 1, 도면 3, 도면 7)를 나타낸다 (도면 6).
실시예 2: 웨스턴 블롯 분석을 이용한 HeLa 세포에서 Cas9 발현의 검출
완전 세포 배지 (RPMI; 10% 태아 송아지 혈청; 1% penicillin/streptomycin 및 1% L-Glutamine; Lonza)에서 HeLa에 대한 최종 밀도가 200,000 세포 / 웰인 12- 웰 플레이트 (Nunc; Thermo Fisher) 에 HeLa 세포를 시딩하였다. 세포를 37 ℃5 % CO2에서 24 시간 동안 유지시켰다. 형질 주입 당일, 완전 배지를 750 μl의 무혈청 Opti-MEM medium (Thermo Fisher)로 교체하였다. 본 발명의 UTR 조합(Figure Legends 참조)을 포함하는 1 μg의 Cas9-encoding mRNA, 즉 서열번호: 14274 (RPL32/ALB7.1), 서열번호: 14275 (HSD17B4/CASP1.1), 서열번호: 14276 (SLC7A3.1/PSMB3.1), 서열번호: 14277 (SLC7A3.1/CASP1.1), 서열번호: 14278 (NOSIP.1/PSMB3.1), 서열번호: 14279 (NDUFA4.1/RPS9.1), 서열번호: 14280 (NDUFA4.1/PSMB3.1), 서열번호: 14281 (HSD17B4/PSMB3.1) 및 서열번호: 14282 (HSD17B4/RPS9.1)는 mRNA: Lipofectamine 3000를 1:1.5 비율로 Opti-MEM의 250 μl에서 Lipofectamine 3000을 사용하여 리포착화하였다. 이어서, 리포착화된 mRNA를 각 웰에 첨가하였다. 형질 주입 3시간 후, 완전 배지를 1ml의 완전 세포 배지로 교체하였다. 단백질 추출을 수행하기 전에 세포를 37 ℃, 5% CO2에서 24 시간 동안 추가로 유지시켰다.
웰을 PBS1X에서 2회 세척하고, Benzonase Endonuclease (Millipore)를 포함하는 100μl의 샘플 로딩 버퍼 1X (Biorad)와 20분동안 상온에서 직접 배양하였다. 세포를 긁어 내고 용해물을 Eppendorf tube로 옮겼다. 이어서, 샘플을 95℃에서 5분 동안 변성시키고, 얼음에서 5분 동안 냉각시키고, 로딩하기 전에 최대 속도로 2분 동안 원심분리 하였다.
15μl의 용해물을 10% Mini-Protean TGX gels (Biorad)에서 작동시키고 nitrocellulose membranes (100V; 90분)으로 옮겼다. 막을 각각 10 분 동안 PBS 중의 0.1 Triton X100으로 3 회 세척하고 4 ℃에서 밤새 PBS1X 중의 10 % Milk로 적셨다.
PBS1X의 5 % Milk에서 spCas9 (1/1000; #632606; Clontech/Takara)에 대한 다클론성 토끼항체 및 쥐 단클론성 안티-베타 액틴 항체 (1/10000; ab6276; Abcam)를 1시간 동안 상온에서 배양하였다. 이어서, 막을 TBS1X의 0.1 % Tween-20에서 3회 세척 하였다. Infrared dye®800CW 염소 항-토끼 다클론성 및 infrared dye®염소 항-쥐 항체 (각각 1/7500 및 1/10000) 이 검출에 사용되었다. 아래 설명된 세척 단계는 스캔하기 전에 Odyssey®CLx Imaging system (LI-COR)을 사용하여 3 번 반복되었다. StudioTM Lite Software (LI-COR)를 사용하여 밴드 강도 및 상대 정량을 수행하였다.
본 발명의 mRNA로부터의 Cas9 발현을 상업적으로 이용 가능한 Cas9-encoding RNA (TriLink BioTechnologies, LLC, Cat. No. L-6125)로부터의 발현과 비교하였다. 본 발명에 따른 UTR-조합을 포함하는 Cas9-encoding mRNA는 상업적으로 이용 가능한 Cas9 mRNA (도면 8, 도면 9)와 비교하여 매우 우수한 발현 증가 (도면 2, 도면 4, 도면 5)를 나타낸다.
실시예 3: 불일치 검출 분석(mismatch detection assay)을 이용한 시험관 내 spCas 9 활성의 측정
완전 세포 배지 (200 μl of RPMI; 10% 태아 송아지 혈청; 1% penicillin/streptomycin 및 1% L-Glutamine; Lonza)에서 Hela에 대해 밀도가 50,000 세포 / 웰인 96- 웰 플레이트에 세포를 시딩하였다. 세포를 37 ℃5 % CO2에서 24 시간 동안 유지시켰다. 형질주입 당일, 수 백ng의 spCas9 mRNA(서열번호: 14274 = RPL32/ALB7.1, 서열번호: 14281 = HSD17B4/PSMB3.1 - 각각의 mRNA는 추가적인 효소에 의한 폴리아데닐화 없이 1 회 및 추가적인 효소에 의한 폴리아데닐화로 1회; 참고로 상업적으로 이용가능한 Cas9-encoding RNA TriLink BioTechnologies, LLC, Cat. No. L-6125가 사용됨)를 TransIT®mRNA transfection (Mirus Bio)를 사용하여 인간 peptidylprolyl isomerase B (PPIB, i.e. Cyclophilin B; Dharmacon; SO-2544646G) (25nM)에 대한 crRNA 및 tracrRNA (25nM; Dharmacon; U-002000-20)의 혼합물로 리포착화시켰다. 음성 대조군으로서 spCas9 mRNA 또는 가이드 RNA 또는 둘 다는 형질 주입 혼합물에서 제외되었다. 96-웰 플레이트의 최종 부피 10 μl를 배지에 첨가하였다. 형질주입 3시간 후, 완전 배지를 100μl의 완전 세포 배지로 교체 하였다. 세포 추출을 수행하기 전에 세포를 37 ℃5 % CO2에서 24 시간 동안 추가로 유지시켰다.
웰을 PBS1X로 1 회 세척하고 1mg/ml Proteinase K 및 0.5mg/ml RNAse A (Thermo Fisher)를 포함하는 100μl의 Phusion HF 완충액 1X를 사용하여 56 ℃에서 30 분 동안 세포를 용해시켰다. 용해 종료시 95 ℃에서 5 분 동안 변성 단계를 추가하였다.
인간 PPIB (Edit-R PPIB crRNA Control Kit; UK-007060; Dharmacon) 및 Phusion hot-start II high fidelity DNA polymerase (Thermo Fisher) 에 대한 특정 프라이머를 사용하여 hPPIB 단편의 PCR 증폭을 위해 5 μl의 세포 용해물 을 사용하였다. 증폭을 위한 PCR 조건은 다음과 같다:
1) 변성 단계 : 98 ℃에서 3 분;
2) touchdown PCR 순환 반응 10x (98 ℃에서 10 초 동안 변성; 72 ℃에서 15 초 동안 touchdown annealing -1 ℃72 ℃에서 30 초 동안 연장);
3) 정상 PCR cyclic 반응 25x (98 ℃에서 10 초 동안 변성; 62 ℃에서 15 초 동안 annealing; 72 ℃에서 30 초 동안 연장);
4) 72 ℃에서 10 분 동안 최종 연장.
이어서 PCR 샘플을 95 ℃에서 10 분 동안 가열하고 상온에서 15 분 이상 동안 천천히 냉각시켰다.
불일치 검출 분석은 37℃에서 25분의 배양 기간 동안 10μl의 PCR 반응, NEB 완충액 2 및 T7 엔도뉴클레아제(New England BioLabs)를 사용하여 수행되었다. 전체 반응 부피를 2 % 아가로스 겔 상에서 즉시 진행시켰다. 예상 밴드는 505bp (편집 없음) 또는 각각 330bp 및 174bp (편집 있음)이다.
본 발명의 UTR 조합을 포함하는 mRNA로부터 발현된 spCas9는 표적 DNA를 편집할 수 있어서 기능적이었다 (도면 10 A, B)
실시예 4: 세포 내 웨스턴을 사용하여 HeLa, Hek293T 및 HepG2 세포에서 Cpf1 발현의 검출
세포는 이전에 사용된 호환 가능한 완전 세포 배지(200 μl)에서 Hela에 대해 10,000 세포/웰의; HepG2 및 Hek293T에 대해 20,000 세포/웰의 밀도를 갖는 96-웰 플레이트 (Nunc Microplate Black w / Clear Optical Bottom; Thermo Fisher)에 시딩되었다. 세포를 37 ℃5 % CO2에서 24 시간 동안 유지시켰다. 형질 주입(transfection) 당일, 100ng의 mRNA, 즉 서열번호: 10549 (RPL32/ALB7), 서열번호: 14289 (Mp68/Gnas.1), 서열번호: 14290 (Ndufa4.1/PSMB3.1), 서열번호: 14291 (HSD17B4/Gnas.1), 서열번호: 14292 (HSD17B4/PSMB3.1) 및 서열번호: 14293 (Ndufa4.1/Alb7)(Hek293T 및 HeLa 세포의 형질 주입용) 및 500ng의 mRNA, 즉 동일한 서열번호 (HepG2)를 Lipofectamine Messenger Max를 이용하여 50 μl의 Opti-MEM에서 mRNA : Lipofectamine Messenger Max를 1:1.5의 비율로 리포착화시켰다. 이어서, 리포착화된 mRNA를 상응하는 96-웰 플레이트에 첨가하였다. 세포 내 웨스턴을 수행하기 전에 세포를 37 ℃5 % CO2에서 24 시간 동안 추가로 유지시켰다.
세포 내 웨스턴 분석 (HeLa, HepG2 및 Hek293T)의 경우, 세포를 PBS1X로 트리스(trice) 세척하고, 파라포름알데히드(paraformaldehyde) 4 %로 10분간 고정시켰다. 고정 후, 세포를 각각 5분 동안 PBS1X로 3회 세척하고 15분 동안 PBS에서 2 % 트리톤 X100으로 투과시켰다. 비특이적 결합을 피하기 위해, 세포를 Odyssey blocking buffer (PBS, LI-COR)으로 1시간 동안 상온에서 블록시킨 다음, 1차 항체, 즉 HA에 대한 다클론성 토끼 항체 (1/1000; H6908; Sigma Aldrich)와 함께 1시간 반 동안 배양 하였다. 이어서, 세포를 약한 진탕 (80rpm)하에 5분 동안 PBS1X 중 0.1 % Tween-20으로 4회 세척 하였다.
이어서, 2차 항체, 즉 infrared dye®800CW 염소 항-토끼 다클론성 항체 (1/500; LI-COR)를 Odyssey blocking buffer에서 Cell-Tag 700 Stain (1/5000; LI-COR)과 혼합하고 상온에서 1시간동안 암실에서 배양하였다. Odyssey®CLx Imaging system (LI-COR)을 사용하여 스캔하기 전에 상기 서술한 바와 같이 세척 단계를 수행하였다. 상대 정량 (800/700)은 Image StudioTM Lite Software를 사용하여 얻었다. mRNA 없이 리포펙션된 웰로부터 수득된 배경 형광을 측정에서 제외하고 그 결과를 표준 mRNA로부터의 발현과 비교하였다.
본 발명에 따른 UTR-조합을 포함하는 Cpf1-암호화 mRNA는 기준 Cpf1 mRNA RPL32 / Alb7과 비교하여 매우 우수한 발현을 강하게 나타낸다. 도면 11 및 도면 12 (HepG2 및 HeLa 세포)에서 명백한 바와 같이 RPL32 / ALB7에 대해 %로 표현이 제공된다.

Claims (47)

  1. a. 적어도 하나의 CRISPR-연관 단백질을 암호화하는 적어도 하나의 암호화 영역;
    b. SLC7A3, ATP5A1, RPL32, HSD17B4, NOSIP, ASAH1, RPL31, TUBB4B, UBQLN2, MP68 및 NDUFA4로 이루어진 군으로부터 선택된 유전자의 5' 비번역 영역(5' UTR)으로부터 유래된 적어도 하나의 5' UTR 요소; 및
    c. GNAS, CASP1, PSMB3, ALB, COX6B1, NDUFA1 및 RPS9로 이루어진 군으로부터 선택된 유전자의 3' 비번역 영역(3' UTR)으로부터 유래된 적어도 하나의 3' UTR 요소
    를 포함하는 인공 핵산 분자.
  2. 제1항에 있어서, 상기 각각의 유전자는 자연적으로 발생한 DNA 서열, 및 이의 상동체, 변이체, 단편, 및 상응하는 RNA 서열을 포함하는 인공 핵산 분자.
  3. 제1항 또는 제2항에 있어서,
    a. SLC7A3 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    b. HSD17B4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    c. ATP5A1 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 CASP1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    d. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 PSMB3 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    e. HSD17B4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 PSMB3 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    f. RPL32 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 ALB 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    g. HSD17B4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 CASP1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    h. SLC7A3유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 CASP1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    i. SLC7A3유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 PSMB3 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    j. NOSIP 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 PSMB3 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    k. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 RPS9 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    l. HSD17B4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 RPS9 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    m. ATP5A1 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    n. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 COX6B1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    n. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    o. NDUFA4 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 NDUFA1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    p. NOSIP 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 NDUFA1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    q. RPL31 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    r. TUBB4B 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 RPS9 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    s. UBQLN2 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 RPS9 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    t. MP68 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 GNAS 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소; 또는
    u. MP68 유전자의 5' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 5' UTR 요소 및 NDUFA1 유전자의 3' UTR로부터, 또는 상응하는 이의 RNA 서열, 상동체, 단편 또는 변이체로부터 유래된 적어도 하나의 3' UTR 요소;
  4. 제3항에 있어서, d, e, g 또는 l에 따른 UTR 요소를 포함하는 인공 핵산 분자.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    - HSD17B4 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 1에 따른 DNA 서열 또는 서열번호: 1에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 2에 따른 RNA 서열 또는 서열번호: 2에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - RPL32 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 21에 따른 DNA 서열 또는 서열번호: 21에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 22에 따른 RNA 서열 또는 서열번호: 22에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - NDUFA4 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 9에 따른 DNA 서열 또는 서열번호: 9에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 10에 따른 RNA 서열 또는 서열번호: 10에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - SLC7A3 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 15에 따른 DNA 서열 또는 서열번호: 15에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 16에 따른 RNA 서열 또는 서열번호: 16에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - NOSIP 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 11에 따른 DNA 서열 또는 서열번호: 11에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 12에 따른 RNA 서열 또는 서열번호: 12에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - ATP5A1 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 5에 따른 DNA 서열 또는 서열번호: 5에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 6에 따른 RNA 서열 또는 서열번호: 6에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    ASAH1 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 3에 따른 DNA 서열 또는 서열번호: 3에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 4에 따른 RNA 서열 또는 서열번호: 4에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    Mp68 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 7에 따른 DNA 서열 또는 서열번호: 7에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 8에 따른 RNA 서열 또는 서열번호: 8에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    Rpl31 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 13에 따른 DNA 서열 또는 서열번호: 13에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 14에 따른 RNA 서열 또는 서열번호: 14에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    TUBB4B 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 17에 따른 DNA 서열 또는 서열번호: 17에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 18에 따른 RNA 서열 또는 서열번호: 18에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    Ubqln2 유전자로부터 유래된 상기 5' UTR 요소는 서열번호: 19에 따른 DNA 서열 또는 서열번호: 19에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 20에 따른 RNA 서열 또는 서열번호: 20에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - GNAS 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 29에 따른 DNA 서열 또는 서열번호: 29에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 30에 따른 RNA 서열 또는 서열번호: 30에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - CASP1 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 25에 따른 DNA 서열 또는 서열번호: 25에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 26에 따른 RNA 서열 또는 서열번호: 26에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - PSMB3 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 23에 따른 DNA 서열 또는 서열번호: 23에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 24에 따른 RNA 서열 또는 서열번호: 24에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - ALB 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 35에 따른 DNA 서열 또는 서열번호: 35에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 36에 따른 RNA 서열 또는 서열번호: 36에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - RPS9 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 33에 따른 DNA 서열 또는 서열번호: 33에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 34에 따른 RNA 서열 또는 서열번호: 34에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - COX6B1 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 27에 따른 DNA 서열 또는 서열번호: 27에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 28에 따른 RNA 서열 또는 서열번호: 28에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되며;
    - Ndufa1 유전자로부터 유래된 상기 3' UTR 요소는 서열번호: 31에 따른 DNA 서열 또는 서열번호: 31에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 DNA 서열 또는 그의 단편 또는 변이체; 또는 서열번호: 32에 따른 RNA 서열 또는 서열번호: 32에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 RNA 서열 또는 그의 단편 또는 변이체를 포함하거나 이로 구성되는 인공 핵산 분자.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 CRISPR-연관 단백질은 이의 CRISPR-연관 야생형 단백질, 상동체, 변이체, 단편 및 유도체를 포함하는 인공 핵산 분자.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 CRISPR-연관 단백질은 Cas9, Cpf1 (Cas12), C2c1, C2c3, Cas13, CasX 또는 CasY로부터 선택된 인공 핵산 분자.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 인공 핵산은 서열번호: 428-441; 10999-11001; 442-1345 중 어느 하나에 따른 아미노산 서열 또는 서열번호: 428-441; 10999-11001; 442-1345 중 어느 하나에 따른 아미노산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열 또는 이들 서열 중 임의의 것의 변이체 또는 단편을 포함하거나 이로 구성되는 CRISPR-연관 단백질을 암호화하는 핵산 서열을 포함하는 인공 핵산 분자.
  9. 제8항에 있어서, 상기 CRISPR-연관 단백질 유도체는 KRAB, CSD, WRPW, VP64, p65AD 및 Mxi로부터 임의로 선택된 적어도 하나의 추가적인 이펙터 도메인을 포함하는 인공 핵산 분자.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 인공 핵산은 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964에 따른 아미노산 서열 또는 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964에 따른 아미노산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성되는 NLS 및 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964에 따른 아미노산 서열 또는 서열번호: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964에 따른 아미노산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 포함하거나 이로 구성되는 NLS 또는 서열번호: 12021-14274에 따른 아미노산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 아미노산 서열을 갖는 NLS로부터 임의로 선택된 핵 위치 신호(NLS)를 암호화하는 적어도 하나의 핵산 서열을 추가로 포함하는 인공 핵산 분자.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 인공 핵산은 단백질 또는 펩티드 태그를 암호화하는 적어도 하나의 핵산을 추가적으로 포함하는 인공 핵산 분자.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 인공 핵산 분자의 적어도 하나 이상의 암호화 영역은 서열번호: 411; 2540-2553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 6020-6033; 7180-7193; 8340-8353; 11237-11239; 11473-11475; 11591-11593; 11709-11711; 11827-11829; 11945-11947; 1394-2297; 3714-4617; 4874-5777; 6034-6937; 7194-8097; 8354-9257; 412; 3474-3887 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754-9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 9690-9703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250-10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594-9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; 중 어느 하나에 따른 핵산 서열 또는 상기 핵산 서열 중 어느 하나에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되는 인공 핵산 분자.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 서열번호: 10552; 3458-3459; 3460-3473; 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 8208-8209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583 10579-10580; 10585-10586; 10588-10589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881; 10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 9352-9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448-9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 9832-9833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 10392-10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 중 어느 하나에 따른 핵산 서열 또는 상기 핵산 서열 중 어느 하나에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 핵산 서열을 포함하는 인공 핵산 분자.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 서열번호: 11011-11042; 11249-1128011131-11162; 11367-11398; 11485-11516; 11603-11634; 11721-11752; 11839-11870; 11044-11116; 11282-11354; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11011-11042; 11249-11280; 11044-11116; 11282-11354 11131-11162; 11367-11398; 11485-11516; 11603-11634; 11721-11752; 11839-11870; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11120-11122 ; 11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712; 11713; 11830; 11831; 11948; 11949; 11123-11130; 11360-11366 11242-11248; 11478-11484; 11596-11602; 11714-11720; 11832-11838; 11950-11956 중에 어느 하나에 따른 핵산 서열 또는 상기 핵산 서열 중 어느 하나에 따른 핵산 서열에 대해 선호도가 증가하는 순서로 적어도 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는 핵산 서열을 포함하거나 이로 구성되는 인공 핵산 분자.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 인공 핵산 분자는 RNA인 인공 핵산 분자.
  16. 제15항에 있어서, 상기 RNA는 모노-, 바이-, 또는 멀티시스트로닉인 RNA.
  17. 제14항 또는 제15항에 있어서, 상기 RNA는 mRNA, 바이러스 RNA 또는 레플리콘 RNA인 RNA.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 인공 핵산은 변형된 핵산, 바람직하게는 안정화된 핵산인 인공 핵산, 바람직하게는 RNA.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서,
    - 상기 인공 핵산의 적어도 하나의 암호화 영역의 G/C 함량이 상응하는 야생형 인공 핵산의 상응하는 암호화 서열의 G/C함량과 비교할 때 증가되며, 및/또는
    - 상기 인공 핵산의 하나 이상의 암호화 영역의 C 함량이 상응하는 야생형 인공 핵산의 상응하는 암호화 서열의 C 함량과 비교할 때 증가되며, 및/또는
    - 상기 인공 핵산의 적어도 하나의 암호화 영역에 있는 코돈은 인간 코돈 사용에 적합하며, 코돈 적응 지수(CAI)는 적어도 하나의 인공 핵산의 암호화 서열에서 바람직하게 증가 또는 최대화되며,
    - 상기 인공 핵산에 의해 암호화된 아미노산 서열은 상응하는 야생형 인공 핵산에 의해 암호화된 아미노산 서열에 비해 바람직하게는 변형되지 않은
    인공 핵산, 바람직하게는 RNA.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 5'-CAP 구조, 바람직하게는 m7GpppN 또는 Cap1를 포함하는 인공 핵산, 바람직하게는 RNA.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 적어도 하나의 히스톤 스템-루프를 포함하는 인공 핵산, 바람직하게는 RNA.
  22. 제21항에 있어서, 상기 적어도 하나의 히스톤 스템-루프는 하기 화학식 (I) 또는 (II)에 따른 핵산 서열을 포함하며:
    화학식 (I) (스템 경계 요소가 없는 스템-루프 서열):
    Figure pct00036

    화학식 (II) (스템 경계 요소가 있는 스템-루프 서열):
    Figure pct00037

    상기:
    스템1 또는 스템2 경계 요소 N1-6은 1 내지 6, 바람직하게는 2 내지 6, 더 바람직하게는 2 내지 5, 더욱 더 바람직하게는 3 내지 5, 가장 바람직하게는 4 내지 5 또는 5 N의 연속적인 서열이고, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이다;
    스템1 [N0-2GN3-5]은 요소 스템2와 역으로 상보적 또는 부분적으로 역으로 상보적이며, 5 내지 7 뉴클레오티드 사이의 연속적인 서열이고;
    상기 N0-2 는 0 내지 2, 바람직하게는 0 내지 1, 더 바람직하게는 1 N의 연속적인 서열이고, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며;
    상기 N3-5 는 3 내지 5, 바람직하게는 4 내지 5, 더 바람직하게는 4 N의 연속적인 서열이고, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며; 그리고
    상기 G는 구아노신 또는 이의 유사체이고, 스템2에서 그것의 상보적인 뉴클레오티드 시티딘이 구아노신으로 치환되는 경우, 선택적으로 시티딘 또는 이의 유사체로 치환될 수 있다;
    루프 서열 [N0-4(U/T)N0-4] 는 요소 스템1과 스템2 사이에 위치하며 3 내지 5 뉴클레오티드, 더 바람직하게는 4 뉴클레오티드의 연속적인 서열이고;
    상기 각각의 N0-4 은 0 내지 4의, 바람직하게 1 내지 3, 더 바람직하게 1 내지 2 N의 다른 연속적인 서열로부터 독립적이며, 상기 각각의 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며; 그리고
    상기 U/T는 우리딘, 또는 선택적으로 티미딘을 나타낸다;
    스템2 [N3-5CN0-2]는 요소 스템1과 역으로 상보적이거나 또는 부분적으로 역으로 상보적이며, 5 내지 7 뉴클레오티드 사이의 연속적인 서열이고;
    상기 N3-5은 3 내지 5, 바람직하게는 4 내지 5, 더 바람직하게는 4 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며;
    상기 N0-2은 0 내지 2, 바람직하게는 0 내지 1, 더 바람직하게는 1 N의 연속적인 서열이며, 상기 각 N은 A, U, T, G 및 C로부터 선택된 뉴클레오티드 또는 그의 뉴클레오티드 유사체로부터 선택된 다른 것과 독립적이며; 그리고
    상기 C는 시티딘 또는 이의 유사체이고, 스템1에서 그것의 상보적인 뉴클레오티드 구아노신이 시티딘으로 치환되는 경우, 선택적으로 구아노신 또는 이의 유사체로 치환될 수 있다;
    상기
    스템1 및 스템2는 서로 역 상보적 서열을 형성하면서 염기 짝짓기를 할 수 있고, 상기 염기 짝짓기는 스템1 및 스템2 사이에서 일어날 수 있으며, 또는
    서로 부분적으로 역 상보적 서열을 형성하면서 염기 짝짓기를 할 수 있고, 불완전한 염기 짝짓기는 스템1과 스템2 사이에서 일어날 수 있는 인공 핵산, 바람직하게는 RNA.
  23. 제21항 또는 제22항에 있어서, 적어도 하나의 히스톤 스템-루프는 다음의 화학식 (Ia) 또는 (IIa)에 따른 핵산 서열을 포함하는 인공 핵산, 바람직하게는 RNA:
    화학식 (Ia) (스템 경계 요소가 없는 스템-루프 서열):
    Figure pct00038

    화학식 (IIa) (스템 경계 요소가 있는 스템-루프 서열):
    Figure pct00039
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 선택적으로 폴리 (A) 서열, 바람직하게는 10 내지 200, 10 내지 100, 40 내지 80, 또는 50 내지 70 아데노신 뉴클레오티드를 포함하는 인공 핵산, 바람직하게는 RNA.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 선택적으로 폴리 (C) 서열, 바람직하게는 10 내지 200, 10 내지 100, 20 내지 70, 20 내지 60, 10 내지 40 시토신 뉴클레오티드를 포함하는 인공 핵산, 바람직하게는 RNA.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 바람직하게는 5'에서 3' 방향으로 다음 요소를 포함하는 인공 핵산, 바람직하게는 RNA:
    a) 5'-CAP 구조, 바람직하게는 m7GpppN 또는 Cap1
    b) 제1항 내지 제5항 중 어느 한 항에서 정의된 5'-UTR로부터 유래된 핵산 서열, 바람직하게는 서열번호: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19 또는 21에 따른 핵산 서열에 상응하는 핵산 서열 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성된 5'-UTR 요소,
    c) 제7항 내지 제13항 중 어느 한 항에서 정의된 적어도 하나의 암호화 서열
    d) 제1항 내지 제5항 중 어느 한 항에서 정의된 3'-UTR로부터 유래된 핵산 서열, 바람직하게는 서열번호: 15; 17; 19; 21 29; 31; 33 또는 35에 따른 핵산 서열에 상응하는 핵산 서열 또는 이의 상동체, 단편 또는 변이체를 포함하거나 이로 구성된 3'-UTR 요소,
    e) 선택적으로 폴리(A) 꼬리, 바람직하게는 10 내지 1000, 10 내지 500, 10 내지 300, 10 내지 200, 10 내지 100, 40 내지 80, 또는 50 내지 70 아데노신 뉴클레오티드로 이루어진 폴리(A) 꼬리,
    f) 선택적으로 폴리(C) 꼬리, 바람직하게는 10 내지 200, 10 내지 100, 20 내지 70, 20 내지 60, 또는 10 내지 40 시토신 뉴클레오티드로 이루어진 폴리(C) 꼬리, 및
    g) 선택적으로 히스톤 스템-루프(HSL).
  27. 제1항 내지 제26항 중 어느 한 항에 있어서 인공 핵산 분자, 바람직하게는 RNA 및 약제학적으로 허용 가능한 담체 및/또는 부형제를 포함하는 조성물.
  28. 제27항에 있어서, 상기 인공 핵산 분자, 바람직하게 RNA는 하나 이상의 양이온성 또는 다가양이온성 화합물, 바람직하게는 양이온성 또는 다가양이온성 중합체, 양이온성 또는 다가양이온성 펩티드 또는 단백질(예를 들어, 프로타민), 양이온성 또는 다가양이온성 다당류 및/또는 양이온 또는 다가양이온성 지질과 복합체화되어 있는 조성물.
  29. 제28항에 있어서, 상기 하나 이상의 양이온성 또는 다가양이온성 펩티드 또는 단백질 대비 상기 인공 핵산 분자, 바람직하게는 RNA의 N/P비는 약 0.3 내지 4, 약 0.5 내지 2, 약 0.7 내지 2 및 약 0.7 내지 1.5를 포함하여 약 0.1 내지 10 범위인 조성물.
  30. 제27항 내지 제29항 중 어느 한 항에 있어서, 인공 핵산 분자, 바람직하게는 RNA가 하나 이상의 지질과 복합체를 형성하여 리포좀, 지질 나노 입자 및/또는 리포플렉스를 형성하는 조성물.
  31. 제27항 내지 제30항 중 어느 한 항에 있어서, 적어도 하나의 가이드 RNA (gRNA) 또는 이를 암호화하는 핵산 또는 이에 작동 가능하게 연결된 조절 인자를 추가로 포함하며, 상기 gRNA는 CRISPR-연관 단백질을 관심 있는 표적 DNA 서열에 표적화할 수 있는 조성물.
  32. 제1항 내지 제26항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게는 RNA 또는 제27항 내지 제31항 중 어느 한 항에 따른 조성물 및 선택적으로 액체 비히클 및/또는 인공 핵산 분자 또는 조성물의 투여와 복용량에 관한 정보를 가지는 기술 지침을 포함하는 키트, 바람직하게는 부품 키트.
  33. 제32항에 있어서, 상기 키트는 일부 링거-락테이트 용액을 포함하는 키트.
  34. 제32항 또는 제33항에 있어서, 추가적으로 가이드 RNA(gRNA) 또는 이를 암호화하는 핵산 또는 이에 작동 가능하게 연결된 조절 인자를 포함하며, 상기 gRNA는 CRISPR-연관 단백질을 관심 있는 표적 DNA 서열에 표적화할 수 있는 키트.
  35. 약제로 사용하기 위한 제1항 내지 제26항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게는 RNA, 제27항 내지 제31항 중 어느 한 항에 따른 조성물 또는 제32항 내지 제34항 중 어느 한 항에 따른 키트.
  36. 유전자 치료법에 사용하기 위한 제1항 내지 제26항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게는 RNA, 제27항 내지 제31항 중 어느 한 항에 따른 조성물, 또는 제32항 내지 제34항 중 어느 한 항에 따른 키트.
  37. (a) 상기 인공 핵산 분자, 바람직하게 RNA, 상기 조성물 또는 상기 키트 및 (b) 가이드 RNA(gRNA) 또는 이를 암호화하는 핵산을 이를 필요로 하는 환자에 투여하는 단계를 포함하는 관심 있는 유전자의 발현을 조절하는 방법에 사용하기 위한 것으로, 상기 sgRNA는 CRISPR-연관 단백질을 관심 유전자 또는 그에 작동 가능하게 연결된 조절 요소로 표적화할 수 있는, 제1항 내지 제26항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게는 RNA, 제27항 내지 제31항 중 어느 한 항에 따른 조성물, 또는 제32항 내지 제34항 중 어느 한 항에 따른 키트.
  38. 적어도 하나의 암호화 서열에 의해 암호화된 CRISPR-연관 단백질의 발현에 의해 치료될 수 있는 질환, 장애 또는 상태의 약제로서 또는 유전자 치료법에 사용하기 위한 제1항 내지 제26항에 따른 인공 핵산 분자, 바람직하게는 RNA, 제27항 내지 제31항에 따른 조성물, 또는 제32항 내지 제34항에 따른 키트.
  39. 관심 유전자를 녹인(knocking in), 녹아웃(knocking out) 또는 조작하거나 관심 유전자의 발현을 조절함으로써 치료될 수 있는 질환, 장애 또는 상태의 약제로서 또는 유전자 치료법에 사용하기 위한 제1항 내지 제26항에 따른 인공 핵산 분자, 바람직하게는 RNA, 제27항 내지 제31항에 따른 조성물, 또는 제32항 내지 제34항에 따른 키트.
  40. 제39항에 있어서, 상기 질환, 장애 또는 상태는 유전자 질환, 암, 자가 면역 질환, 염증성 질환 및 감염성 질환으로부터 선택되는 인공 핵산 분자, 바람직하게는 RNA, 조성물, 또는 키트.
  41. 선택적으로 유전자 치료법에서, 상기 암호화된 CRISPR-연관 단백질의 발현을 증가시키기 위한 제1항 내지 제26항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게는 RNA, 제27항 내지 제31항 중 어느 한 항에 따른 조성물, 또는 제32항 내지 제34항 중 어느 한 항에 따른 키트의 용도.
  42. 상기 암호화된 CRISPR-연관 단백질에 의해 표적화된 관심 유전자의 발현을 조절하기 위한 제1항 내지 제26항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게는 RNA, 제27항 내지 제31항 중 어느 한 항에 따른 조성물, 또는 제32항 내지 제34항 중 어느 한 항에 따른 키트의 용도.
  43. 다음의 단계들을 포함하는 관심 유전자의 발현을 조절하는 방법:
    a) 제1항 내지 제26항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게는 RNA를 제공하는 단계;
    b) 가이드 RNA(gRNA) 또는 이를 암호화하는 핵산을 제공하는 단계로서, 상기 gRNA는 CRISPR-연관 단백질을 관심 있는 표적 DNA 서열 또는 이와 작동 가능하게 연결된 조절 요소에 표적화할 수 있는 단계.
    c) 상기 관심 유전자의 발현 효능을 조절하기에 적합한 조건 하에서 세포, 조직, 또는 유기체를 상기 인공 핵산 분자, 바람직하게는 RNA 및 상기 gRNA 또는 이를 암호화하는 핵산과 접촉시키는 단계.
  44. 장애를 치료 또는 예방하는 방법으로서, 상기 방법은 이를 필요로 하는 대상에게 유효량의 제1항 내지 제26항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게는 RNA, 제27항 내지 제31항 중 어느 한 항에 따른 조성물 또는 제32항 내지 제34항에 따른 키트, 및 가이드 RNA(gRNA) 또는 이를 암호화하는 핵산을 투여하는 단계를 포함하며, 상기 gRNA는 CRISPR-연관 단백질을 관심 있는 표적 DNA 서열 또는 그에 작동 가능하게 연결된 조절 요소에 표적화할 수 있는 방법.
  45. 제44항에 있어서, 상기 장애는 암호화된 CRISPR-연관 단백질의 발현에 의해 치료될 수 있는, 바람직하게는 상기 CRISPR-연관 단백질에 의해 표적화된 관심 유전자의 발현을 조절함으로써 치료될 수 있는 질환, 장애 또는 상태인 방법.
  46. 제44항 또는 제45항에 있어서, 상기 장애는 관심 유전자를 녹인, 녹아웃 또는 돌연변이시킴으로써 또는 관심 유전자의 발현을 변경시킴으로써 치료될 수 있는 질환, 장애 또는 상태인 방법.
  47. (a) 상기 암호화 영역을 ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP, 또는 NDUFA4로 이루어진 군으로부터 또는 상응하는 RNA 서열, 상동체, 단편 또는 그 변이체로부터 선택된 유전자의 5' UTR로부터 유래된 적어도 하나의 5' UTR 요소와 회합시키는 단계;
    (b) 상기 암호화 영역을 GNAS, CASP1, PSMB3, ALB, 또는 RPS9로 이루어진 군으로부터 또는 상응하는 RNA 서열, 상동체, 단편 또는 그 변이체로부터 선택된 유전자의 3' UTR로부터 유래된 적어도 하나의 3' UTR 요소와 회합시키는 단계;
    (c) 제1항 내지 제46항 중 어느 한 항에 따른 인공 핵산 분자, 바람직하게는 RNA를 획득하는 단계
    를 포함하는 CRISPR-연관 단백질을 암호화하는 암호화 영역을 포함하는 인공 핵산 분자, 바람직하게는 RNA의 발현 효능을 증가시키는 방법.
KR1020197030080A 2017-03-24 2018-03-23 Crispr-연관 단백질을 암호화하는 핵산 및 이의 용도 KR20190133699A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EPPCT/EP2017/057110 2017-03-24
EP2017057110 2017-03-24
EPPCT/EP2017/076775 2017-10-19
EP2017076775 2017-10-19
PCT/EP2018/057552 WO2018172556A1 (en) 2017-03-24 2018-03-23 Nucleic acids encoding crispr-associated proteins and uses thereof

Publications (1)

Publication Number Publication Date
KR20190133699A true KR20190133699A (ko) 2019-12-03

Family

ID=61801946

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197030080A KR20190133699A (ko) 2017-03-24 2018-03-23 Crispr-연관 단백질을 암호화하는 핵산 및 이의 용도

Country Status (11)

Country Link
US (2) US11739335B2 (ko)
EP (1) EP3601576A1 (ko)
JP (2) JP2020513824A (ko)
KR (1) KR20190133699A (ko)
CN (1) CN110914433A (ko)
AU (1) AU2018240515A1 (ko)
BR (1) BR112019015244A2 (ko)
CA (1) CA3050616A1 (ko)
MX (1) MX2019011215A (ko)
SG (2) SG10202110491PA (ko)
WO (1) WO2018172556A1 (ko)

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112015018989B1 (pt) 2013-02-22 2023-11-14 Curevac Ag Combinação de vacina/inibidor da via de pd-1, inibidor da via de pd-1 e vacina de rna
MX369469B (es) 2013-08-21 2019-11-08 Curevac Ag Vacuna contra el virus respiratorio sincitial.
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
ES2791152T3 (es) 2014-12-12 2020-11-03 Curevac Ag Moléculas de ácido nucleico artificiales para una expresión proteica mejorada
WO2016180430A1 (en) 2015-05-08 2016-11-17 Curevac Ag Method for producing rna
EP3294896A1 (en) 2015-05-11 2018-03-21 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
CN107873055B (zh) 2015-05-29 2021-09-17 库瑞瓦格房地产有限公司 包括至少一个切向流过滤步骤的产生和纯化rna的方法
AU2016276702B2 (en) 2015-06-09 2022-07-28 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for improving transplantation
AU2016326711B2 (en) 2015-09-24 2022-11-03 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/Cas-mediated genome editing
US11413346B2 (en) 2015-11-09 2022-08-16 Curevac Ag Rotavirus vaccines
EP3701963A1 (en) 2015-12-22 2020-09-02 CureVac AG Method for producing rna molecule compositions
EP3416683A1 (en) 2016-02-17 2018-12-26 CureVac AG Zika virus vaccine
US11920174B2 (en) 2016-03-03 2024-03-05 CureVac SE RNA analysis by total hydrolysis and quantification of released nucleosides
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
US11236313B2 (en) 2016-04-13 2022-02-01 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
US11293021B1 (en) 2016-06-23 2022-04-05 Inscripta, Inc. Automated cell processing methods, modules, instruments, and systems
AU2017335890B2 (en) 2016-09-30 2024-05-09 The Regents Of The University Of California RNA-guided nucleic acid modifying enzymes and methods of use thereof
WO2018096179A1 (en) 2016-11-28 2018-05-31 Curevac Ag Method for purifying rna
EP3558355A2 (en) 2016-12-23 2019-10-30 CureVac AG Henipavirus vaccine
US11141476B2 (en) 2016-12-23 2021-10-12 Curevac Ag MERS coronavirus vaccine
PT3526324T (pt) * 2017-03-28 2021-10-20 Locanabio Inc Proteína associada a crispr (cas)
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
WO2018227114A1 (en) 2017-06-09 2018-12-13 Editas Medicine, Inc. Engineered cas9 nucleases
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
HRP20220615T1 (hr) 2017-06-30 2022-06-24 Inscripta, Inc. Postupci, moduli, instrumenti i sustavi za automatiziranu obradu stanica
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
US10476825B2 (en) 2017-08-22 2019-11-12 Salk Institue for Biological Studies RNA targeting methods and compositions
US11602557B2 (en) 2017-08-22 2023-03-14 Cure Vac SE Bunyavirales vaccine
US11970720B2 (en) 2017-08-22 2024-04-30 Salk Institute For Biological Studies RNA targeting methods and compositions
KR20200071081A (ko) * 2017-10-19 2020-06-18 큐어백 아게 신규 인공 핵산 분자
US11970719B2 (en) 2017-11-01 2024-04-30 The Regents Of The University Of California Class 2 CRISPR/Cas compositions and methods of use
EP3704239A4 (en) 2017-11-01 2021-08-18 The Regents of The University of California CASZ COMPOSITIONS AND METHOD OF USE
WO2019092153A1 (en) 2017-11-08 2019-05-16 Curevac Ag Rna sequence adaptation
EP3723796A1 (en) 2017-12-13 2020-10-21 CureVac AG Flavivirus vaccine
WO2019122371A1 (en) 2017-12-21 2019-06-27 Curevac Ag Linear double stranded dna coupled to a single support or a tag and methods for producing said linear double stranded dna
US20220010293A1 (en) * 2018-02-23 2022-01-13 Pioneer Hi-Bred International, Inc. Novel cas9 orthologs
JP7399876B2 (ja) * 2018-04-16 2023-12-18 ジョージア テック リサーチ コーポレーション 病態治療のためのRNAエディターのmRNA駆動型発現
US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
US10557216B2 (en) 2018-04-24 2020-02-11 Inscripta, Inc. Automated instrumentation for production of T-cell receptor peptide libraries
EP4070802A1 (en) 2018-06-30 2022-10-12 Inscripta, Inc. Instruments, modules, and methods for improved detection of edited sequences in live cells
US20210284981A1 (en) * 2018-07-24 2021-09-16 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
US11142740B2 (en) 2018-08-14 2021-10-12 Inscripta, Inc. Detection of nuclease edited sequences in automated modules and instruments
RU2706298C1 (ru) * 2018-09-14 2019-11-15 Закрытое Акционерное Общество "Биокад" НУКЛЕАЗА PaCas9
US20210395709A1 (en) * 2018-10-18 2021-12-23 Chan Zuckerberg Biohub, Inc. Methods and compositions involving thermostable cas9 protein variants
SG11202104432YA (en) * 2018-11-12 2021-05-28 Aptarion Biotech Ag Cxcl8 binding nucleic acids
AU2019387219A1 (en) * 2018-11-28 2021-06-10 Bayer Healthcare Llc Optimized mRNA encoding CAS9 for use in LNPs
EP3894550A4 (en) 2018-12-14 2023-01-04 Pioneer Hi-Bred International, Inc. NEW CRISPR-CAS SYSTEMS FOR GENOME EDITING
WO2020142739A1 (en) * 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. COMPOSITIONS AND METHODS FOR DETECTING MODIFIED NUCLEIC ACIDS AND AMPLIFYING ssDNA
CA3125511A1 (en) 2019-02-08 2020-08-13 Curevac Ag Coding rna administered into the suprachoroidal space in the treatment of ophthalmic diseases
US10913941B2 (en) 2019-02-14 2021-02-09 Metagenomi Ip Technologies, Llc Enzymes with RuvC domains
US20220298494A1 (en) * 2019-02-14 2022-09-22 Metagenomi Ip Technologies, Llc Enzymes with ruvc domains
EP4219700A1 (en) * 2019-03-07 2023-08-02 The Regents of the University of California Crispr-cas effector polypeptides and methods of use thereof
CA3134168A1 (en) 2019-03-25 2020-10-01 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
WO2020223553A2 (en) * 2019-04-30 2020-11-05 Emendobio Inc. Novel omni crispr nucleases
AU2020288623A1 (en) 2019-06-06 2022-01-06 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
CN114375334A (zh) 2019-06-07 2022-04-19 斯克里贝治疗公司 工程化CasX系统
EP3999117A4 (en) * 2019-07-12 2023-07-26 Duke University NANOPARTICLE SYSTEMS FOR TARGETED CRISPR/CAS13 DELIVERY AND METHODS OF USE THEREOF
CA3147783A1 (en) * 2019-08-12 2021-02-18 Tyson D. BOWEN Rna-guided nucleases and active fragments and variants thereof and methods of use
WO2021102059A1 (en) 2019-11-19 2021-05-27 Inscripta, Inc. Methods for increasing observed editing in bacteria
EP4069837A4 (en) * 2019-12-10 2024-03-13 Inscripta, Inc. NEW MAD NUCLEASES
WO2021121921A1 (en) * 2019-12-16 2021-06-24 BASF Agricultural Solutions Seed US LLC Codon-optimized cas9 endonuclease encoding polynucleotide
WO2021126886A1 (en) 2019-12-18 2021-06-24 Inscripta, Inc. Cascade/dcas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells
KR20220133257A (ko) 2020-01-27 2022-10-04 인스크립타 인코포레이티드 전기천공 모듈 및 기구
US11241493B2 (en) 2020-02-04 2022-02-08 Curevac Ag Coronavirus vaccine
US11576966B2 (en) 2020-02-04 2023-02-14 CureVac SE Coronavirus vaccine
CA3177051A1 (en) 2020-03-31 2021-10-07 Metagenomi, Inc. Class ii, type ii crispr systems
US20230346978A1 (en) * 2020-04-14 2023-11-02 University Of Massachusetts Dcas13-mediated therapeutic rna base editing for in vivo gene therapy
TW202208626A (zh) * 2020-04-24 2022-03-01 美商生命編輯公司 Rna引導核酸酶及其活性片段與變體,以及使用方法
US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
JP2023531384A (ja) * 2020-06-04 2023-07-24 エメンドバイオ・インコーポレイテッド 新規なomni-59、61、67、76、79、80、81及び82クリスパーヌクレアーゼ
US11299731B1 (en) 2020-09-15 2022-04-12 Inscripta, Inc. CRISPR editing to embed nucleic acid landing pads into genomes of live cells
WO2022098681A2 (en) * 2020-11-03 2022-05-12 Caspr Biotech Corporation Novel class 2 crispr-cas rna-guided endonucleases
US20230407275A1 (en) * 2020-11-05 2023-12-21 New York University Enhancement of predictable and template-free gene editing by the association of cas with dna polymerase
US11512297B2 (en) 2020-11-09 2022-11-29 Inscripta, Inc. Affinity tag for recombination protein recruitment
MX2023007574A (es) 2020-12-22 2023-09-29 CureVac SE "vacuna de arn contra variantes de sars-cov-2.
WO2022146497A1 (en) 2021-01-04 2022-07-07 Inscripta, Inc. Mad nucleases
CA3204128A1 (en) * 2021-01-05 2022-07-14 Fahim FARZADFARD Methods for detection of nucleic acids
US11332742B1 (en) 2021-01-07 2022-05-17 Inscripta, Inc. Mad nucleases
EP4288085A2 (en) * 2021-02-08 2023-12-13 Emendobio Inc. Omni 103 crispr nuclease
US11884924B2 (en) 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
WO2022272294A1 (en) * 2021-06-23 2022-12-29 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for efficient retron recruitment to dna breaks
CN118103503A (zh) * 2021-08-13 2024-05-28 埃门多生物公司 新型omni 115、124、127、144-149、159、218、237、248、251-253和259 crispr核酸酶
IL309505A (en) 2021-09-03 2024-02-01 CureVac SE Lipid nanoparticles for nucleic acid delivery
AU2022401869A1 (en) * 2021-12-01 2024-07-11 Emendobio Inc. Engineered high activity omni-79 nuclease variants
CA3240917A1 (en) * 2021-12-17 2023-06-22 Bernd ZETSCHE Crispr enzymes, methzods, systems and uses thereof
WO2023139557A1 (en) * 2022-01-24 2023-07-27 LifeEDIT Therapeutics, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
WO2023150637A1 (en) * 2022-02-02 2023-08-10 Inscripta, Inc. Nucleic acid-guided nickase fusion proteins
CN114807104B (zh) * 2022-04-11 2024-02-20 西南大学 肺炎克雷伯菌噬菌体裂解酶及其制备方法和应用
WO2024042165A2 (en) * 2022-08-26 2024-02-29 UCB Biopharma SRL Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases

Family Cites Families (163)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5534499A (en) 1994-05-19 1996-07-09 The University Of British Columbia Lipophilic drug derivatives for use in liposomes
US5885613A (en) 1994-09-30 1999-03-23 The University Of British Columbia Bilayer stabilizing components and their use in forming programmable fusogenic liposomes
US5820873A (en) 1994-09-30 1998-10-13 The University Of British Columbia Polyethylene glycol modified ceramide lipids and liposome uses thereof
US6320017B1 (en) 1997-12-23 2001-11-20 Inex Pharmaceuticals Corp. Polyamide oligomers
DE50214200D1 (de) 2001-06-05 2010-03-25 Curevac Gmbh Stabilisierte Tumorantigen-mRNA mit erhöhtem G/C-Gehalt
EP2428568B1 (en) 2001-09-28 2018-04-25 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Microrna molecules
DE10162480A1 (de) 2001-12-19 2003-08-07 Ingmar Hoerr Die Applikation von mRNA für den Einsatz als Therapeutikum gegen Tumorerkrankungen
DE10229872A1 (de) 2002-07-03 2004-01-29 Curevac Gmbh Immunstimulation durch chemisch modifizierte RNA
EP1648914A4 (en) 2003-07-31 2009-12-16 Regulus Therapeutics Inc OLIGOMERIC COMPOUNDS AND COMPOSITIONS USEFUL FOR MODULATING SMALL NON-CODING RNA
DE10335833A1 (de) 2003-08-05 2005-03-03 Curevac Gmbh Transfektion von Blutzellen mit mRNA zur Immunstimulation und Gentherapie
DE102004042546A1 (de) 2004-09-02 2006-03-09 Curevac Gmbh Kombinationstherapie zur Immunstimulation
DE102005023170A1 (de) 2005-05-19 2006-11-23 Curevac Gmbh Optimierte Formulierung für mRNA
DE102006035618A1 (de) 2006-07-31 2008-02-07 Curevac Gmbh Nukleinsäure der Formel (I): GlXmGn, insbesondere als immunstimulierendes Adjuvanz
DE102006061015A1 (de) 2006-12-22 2008-06-26 Curevac Gmbh Verfahren zur Reinigung von RNA im präparativen Maßstab mittels HPLC
DE102007001370A1 (de) 2007-01-09 2008-07-10 Curevac Gmbh RNA-kodierte Antikörper
WO2009030254A1 (en) 2007-09-04 2009-03-12 Curevac Gmbh Complexes of rna and cationic peptides for transfection and for immunostimulation
WO2009046739A1 (en) 2007-10-09 2009-04-16 Curevac Gmbh Composition for treating prostate cancer (pca)
WO2009046738A1 (en) 2007-10-09 2009-04-16 Curevac Gmbh Composition for treating lung cancer, particularly of non-small lung cancers (nsclc)
CA3044134A1 (en) 2008-01-02 2009-07-09 Arbutus Biopharma Corporation Improved compositions and methods for the delivery of nucleic acids
US9226959B2 (en) 2008-01-31 2016-01-05 Curevac Ag Nucleic acids comprising formula (NuGlXmGnNv)a and derivatives thereof as immunostimulating agent/adjuvant
US20110054009A1 (en) 2008-02-28 2011-03-03 The Ohio State University Research Foundation MicroRNA-Based Methods and Compositions for the Diagnosis, Prognosis and Treatment of Prostate Related Disorders
CN102119217B (zh) 2008-04-15 2015-06-03 普洛体维生物治疗公司 用于核酸递送的新型制剂
WO2010037408A1 (en) 2008-09-30 2010-04-08 Curevac Gmbh Composition comprising a complexed (m)rna and a naked mrna for providing or enhancing an immunostimulatory response in a mammal and uses thereof
CA2740000C (en) 2008-10-09 2017-12-12 Tekmira Pharmaceuticals Corporation Improved amino lipids and methods for the delivery of nucleic acids
WO2010048536A2 (en) 2008-10-23 2010-04-29 Alnylam Pharmaceuticals, Inc. Processes for preparing lipids
JP6087504B2 (ja) 2008-11-07 2017-03-01 マサチューセッツ インスティテュート オブ テクノロジー アミノアルコールリピドイドおよびその使用
KR102344392B1 (ko) 2008-11-10 2021-12-28 알닐람 파마슈티칼스 인코포레이티드 치료제 운반용 신규 지질 및 조성물
WO2010087791A1 (en) 2009-01-27 2010-08-05 Utc Power Corporation Distributively cooled, integrated water-gas shift reactor and vaporizer
AU2010208035B2 (en) 2009-01-29 2016-06-23 Arbutus Biopharma Corporation Improved lipid formulation for the delivery of nucleic acids
NZ621981A (en) 2009-05-05 2015-09-25 Tekmira Pharmaceuticals Corp Lipid compositions
EA201791744A3 (ru) 2009-06-10 2018-07-31 Арбутус Биофарма Корпорэйшн Улучшенная липидная композиция
DK2459231T3 (en) 2009-07-31 2016-09-05 Ethris Gmbh RNA with a combination of unmodified and modified nucleotides for protein expression
US20110053829A1 (en) 2009-09-03 2011-03-03 Curevac Gmbh Disulfide-linked polyethyleneglycol/peptide conjugates for the transfection of nucleic acids
WO2011069529A1 (en) 2009-12-09 2011-06-16 Curevac Gmbh Mannose-containing solution for lyophilization, transfection and/or injection of nucleic acids
CN104959087B (zh) 2010-04-09 2017-08-15 帕西拉制药有限公司 用于配制大直径合成膜囊泡的方法
DK2575764T3 (en) 2010-06-03 2017-08-07 Alnylam Pharmaceuticals Inc BIODEGRADABLE LIPIDS FOR THE ACTIVATION OF ACTIVE AGENTS
EP2590626B1 (en) 2010-07-06 2015-10-28 GlaxoSmithKline Biologicals SA Liposomes with lipids having an advantageous pka-value for rna delivery
JP6025721B2 (ja) 2010-07-06 2016-11-16 ノバルティス アーゲー カチオン性水中油型エマルジョン
EP2449113B8 (en) 2010-07-30 2015-11-25 CureVac AG Complexation of nucleic acids with disulfide-crosslinked cationic components for transfection and immunostimulation
WO2012019630A1 (en) 2010-08-13 2012-02-16 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded protein
EP4119155A1 (en) 2010-08-31 2023-01-18 GlaxoSmithKline Biologicals S.A. Pegylated liposomes for delivery of immunogen-encoding rna
PL2611467T3 (pl) 2010-08-31 2022-08-16 Glaxosmithkline Biologicals Sa Małe liposomy do dostarczania rna kodującego immunogen
BR112013004865A2 (pt) 2010-08-31 2016-06-07 Novartis Ag lípidos adequados para entrega lipossomal de codificadores de proteínas rna
WO2012089225A1 (en) 2010-12-29 2012-07-05 Curevac Gmbh Combination of vaccination and inhibition of mhc class i restricted antigen presentation
WO2012116715A1 (en) 2011-03-02 2012-09-07 Curevac Gmbh Vaccination in newborns and infants
WO2012113413A1 (en) 2011-02-21 2012-08-30 Curevac Gmbh Vaccine composition comprising complexed immunostimulatory nucleic acids and antigens packaged with disulfide-linked polyethyleneglycol/peptide conjugates
WO2012116714A1 (en) 2011-03-02 2012-09-07 Curevac Gmbh Vaccination in elderly patients
JP2014520806A (ja) 2011-07-06 2014-08-25 ノバルティス アーゲー Rna分子の送達のための有用なn:p比を有するリポソーム
WO2013113325A1 (en) 2012-01-31 2013-08-08 Curevac Gmbh Negatively charged nucleic acid comprising complexes for immunostimulation
WO2013113326A1 (en) 2012-01-31 2013-08-08 Curevac Gmbh Pharmaceutical composition comprising a polymeric carrier cargo complex and at least one protein or peptide antigen
EP2623121A1 (en) 2012-01-31 2013-08-07 Bayer Innovation GmbH Pharmaceutical composition comprising a polymeric carrier cargo complex and an antigen
WO2013120497A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein
WO2013120499A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly (a) sequence or a polyadenylation signal for increasing the expression of an encoded pathogenic antigen
WO2013120500A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded tumour antigen
WO2013120498A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded allergenic antigen or an autoimmune self-antigen
HUE041494T2 (hu) 2012-02-24 2019-05-28 Arbutus Biopharma Corp Trialkil-kationos lipidek és alkalmazási módszereik
MX358706B (es) * 2012-03-27 2018-08-31 Curevac Ag Moleculas de acido nucleico artificiales que comprenden un top 5´utr.
DK3578659T3 (da) 2012-03-27 2024-02-05 CureVac SE Kunstige nukelinsyremolekyler til forbedret protein- eller peptidekspression
EP2831240B1 (en) * 2012-03-27 2017-11-15 CureVac AG Artificial nucleic acid molecules comprising a 5'top utr
SG10201607962RA (en) 2012-03-27 2016-11-29 Curevac Ag Artificial nucleic acid molecules
EP2854857B1 (en) 2012-05-25 2018-11-28 CureVac AG Reversible immobilization and/or controlled release of nucleic acid containing nanoparticles by (biodegradable) polymer coatings
DK3401400T3 (da) * 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
JP2016504050A (ja) 2013-01-17 2016-02-12 モデルナ セラピューティクス インコーポレイテッドModerna Therapeutics,Inc. 細胞表現型の改変のためのシグナルセンサーポリヌクレオチド
BR112015018989B1 (pt) 2013-02-22 2023-11-14 Curevac Ag Combinação de vacina/inibidor da via de pd-1, inibidor da via de pd-1 e vacina de rna
EP2971167B1 (en) 2013-03-14 2019-07-31 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
EP3011029B1 (en) 2013-06-17 2019-12-11 The Broad Institute, Inc. Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
EP3971287A1 (en) * 2013-07-11 2022-03-23 ModernaTX, Inc. Compositions comprising synthetic polynucleotides encoding crispr related proteins and synthetic sgrnas and methods of use
BR112016001192A2 (pt) 2013-08-21 2017-08-29 Curevac Ag Vacina contra a raiva
CA2915730A1 (en) 2013-08-21 2015-02-26 Karl-Josef Kallen A combination rsv/influenza a vaccine
MX369469B (es) 2013-08-21 2019-11-08 Curevac Ag Vacuna contra el virus respiratorio sincitial.
WO2015024666A1 (en) 2013-08-21 2015-02-26 Curevac Gmbh Composition and vaccine for treating lung cancer
SG11201510751YA (en) 2013-08-21 2016-03-30 Curevac Ag Composition and vaccine for treating prostate cancer
SG11201510747RA (en) 2013-08-21 2016-03-30 Curevac Ag Method for increasing expression of rna-encoded proteins
CA2925021A1 (en) 2013-11-01 2015-05-07 Curevac Ag Modified rna with decreased immunostimulatory properties
WO2015074085A1 (en) 2013-11-18 2015-05-21 Arcturus Therapeutics, Inc. Ionizable cationic lipid for rna delivery
WO2015085318A2 (en) 2013-12-06 2015-06-11 Moderna Therapeutics, Inc. Targeted adaptive vaccines
SG11201604198YA (en) 2013-12-30 2016-07-28 Curevac Ag Methods for rna analysis
KR102399799B1 (ko) 2013-12-30 2022-05-18 큐어백 아게 인공 핵산 분자
JP6584414B2 (ja) 2013-12-30 2019-10-02 キュアバック アーゲー 人工核酸分子
CA2935878C (en) 2014-03-12 2023-05-02 Curevac Ag Combination of vaccination and ox40 agonists
WO2015149944A2 (en) 2014-04-01 2015-10-08 Curevac Gmbh Polymeric carrier cargo complex for use as an immunostimulating agent or as an adjuvant
BR112016026980B1 (pt) 2014-06-10 2022-05-03 Curevac Real Estate Gmbh Método para sintetizar uma molécula de rna de uma dada sequência
CA2953341C (en) 2014-06-25 2023-01-24 Acuitas Therapeutics Inc. Lipids and lipid nanoparticle formulations for delivery of nucleic acids
ES2791152T3 (es) 2014-12-12 2020-11-03 Curevac Ag Moléculas de ácido nucleico artificiales para una expresión proteica mejorada
EP3233113A1 (en) 2014-12-16 2017-10-25 CureVac AG Ebolavirus and marburgvirus vaccines
US20170362605A1 (en) 2014-12-19 2017-12-21 Modernatx, Inc. Terminal modifications of polynucleotides
EP3240558A1 (en) 2014-12-30 2017-11-08 CureVac AG Artificial nucleic acid molecules
EP4353257A2 (en) 2015-04-13 2024-04-17 CureVac Manufacturing GmbH Method for producing rna compositions
WO2016165831A1 (en) 2015-04-17 2016-10-20 Curevac Ag Lyophilization of rna
US10293058B2 (en) 2015-04-22 2019-05-21 Curevac Ag RNA containing composition for treatment of tumor diseases
US20180208957A1 (en) 2015-04-30 2018-07-26 Curevac Ag Method for in vitro transcription using an immobilized restriction enzyme
SG11201708867UA (en) 2015-04-30 2017-11-29 Curevac Ag Immobilized poly(n)polymerase
US10179918B2 (en) * 2015-05-07 2019-01-15 Sangamo Therapeutics, Inc. Methods and compositions for increasing transgene activity
WO2016180430A1 (en) 2015-05-08 2016-11-17 Curevac Ag Method for producing rna
DK3294326T3 (da) 2015-05-15 2021-05-31 Curevac Ag Prime-boost-regimer indbefattende indgivelse af mindst én mrna-konstruktion
EP3916091A3 (en) 2015-05-20 2022-03-30 CureVac AG Dry powder composition comprising long-chain rna
CN107530448A (zh) 2015-05-20 2018-01-02 库瑞瓦格股份公司 包含长链rna的干粉组合物
US11608513B2 (en) 2015-05-29 2023-03-21 CureVac SE Method for adding cap structures to RNA using immobilized enzymes
CN107873055B (zh) 2015-05-29 2021-09-17 库瑞瓦格房地产有限公司 包括至少一个切向流过滤步骤的产生和纯化rna的方法
US20180245074A1 (en) * 2015-06-04 2018-08-30 Protiva Biotherapeutics, Inc. Treating hepatitis b virus infection using crispr
US20180296663A1 (en) 2015-06-17 2018-10-18 Curevac Ag Vaccine composition
EP4239080A3 (en) 2015-07-01 2023-11-01 CureVac Manufacturing GmbH Method for analysis of an rna molecule
WO2017009376A1 (en) 2015-07-13 2017-01-19 Curevac Ag Method of producing rna from circular dna and corresponding template dna
EP3331555A1 (en) 2015-08-05 2018-06-13 CureVac AG Epidermal mrna vaccine
DK3332019T3 (da) 2015-08-07 2020-02-17 Curevac Ag Fremgangsmåde til in vivo-produktionen af rna i en værtscelle
CN108138187B (zh) 2015-08-10 2022-07-19 库瑞瓦格房地产有限公司 增加环状dna分子复制的方法
JP7304155B2 (ja) * 2015-08-28 2023-07-06 キュアバック エスイー 人工核酸分子
ES2968391T3 (es) 2015-09-21 2024-05-09 Trilink Biotechnologies Llc Cebadores oligonucleotídicos iniciadores con caperuza para sintetizar ARN con caperuza 5'
EP3362576A1 (en) 2015-10-12 2018-08-22 CureVac AG Automated method for isolation, selection and/or detection of microorganisms or cells comprised in a solution
AU2016343803B2 (en) 2015-10-28 2021-04-29 Acuitas Therapeutics, Inc. Novel lipids and lipid nanoparticle formulations for delivery of nucleic acids
US20180312545A1 (en) 2015-11-09 2018-11-01 Curevac Ag Optimized nucleic acid molecules
US11413346B2 (en) 2015-11-09 2022-08-16 Curevac Ag Rotavirus vaccines
EP3394237A1 (en) 2015-12-21 2018-10-31 CureVac AG Inlay for a culture plate and corresponding method for preparing a culture plate system with such inlay
EP3701963A1 (en) 2015-12-22 2020-09-02 CureVac AG Method for producing rna molecule compositions
WO2017109161A1 (en) 2015-12-23 2017-06-29 Curevac Ag Method of rna in vitro transcription using a buffer containing a dicarboxylic acid or tricarboxylic acid or a salt thereof
EP4289965A3 (en) 2016-02-12 2024-02-21 CureVac SE Method for analyzing rna
US20190049414A1 (en) 2016-02-15 2019-02-14 Curevac Ag Method for analyzing by-products of rna in vitro transcription
EP3416683A1 (en) 2016-02-17 2018-12-26 CureVac AG Zika virus vaccine
US11920174B2 (en) 2016-03-03 2024-03-05 CureVac SE RNA analysis by total hydrolysis and quantification of released nucleosides
WO2017162297A1 (en) 2016-03-24 2017-09-28 Curevac Ag Immobilized inorganic pyrophosphatase (ppase)
EP3445392A1 (en) 2016-04-22 2019-02-27 CureVac AG Rna encoding a tumor antigen
EP3448427A1 (en) 2016-04-29 2019-03-06 CureVac AG Rna encoding an antibody
EP3452493A1 (en) 2016-05-04 2019-03-13 CureVac AG Nucleic acid molecules and uses thereof
EP3452101A2 (en) 2016-05-04 2019-03-13 CureVac AG Rna encoding a therapeutic protein
US20180126003A1 (en) 2016-05-04 2018-05-10 Curevac Ag New targets for rna therapeutics
WO2017191258A1 (en) 2016-05-04 2017-11-09 Curevac Ag Influenza mrna vaccines
CA3024624A1 (en) 2016-05-18 2017-11-23 Modernatx, Inc. Polynucleotides encoding porphobilinogen deaminase for the treatment of acute intermittent porphyria
EP3458107B1 (en) 2016-05-18 2024-03-13 ModernaTX, Inc. Polynucleotides encoding jagged1 for the treatment of alagille syndrome
WO2017201332A1 (en) 2016-05-18 2017-11-23 Modernatx, Inc. Polynucleotides encoding acyl-coa dehydrogenase, very long-chain for the treatment of very long-chain acyl-coa dehydrogenase deficiency
MY201498A (en) 2016-05-18 2024-02-27 Modernatx Inc Polynucleotides encoding citrin for the treatment of citrullinemia type 2
EP3458105B1 (en) 2016-05-18 2024-01-17 Modernatx, Inc. Polynucleotides encoding galactose-1-phosphate uridylyltransferase for the treatment of galactosemia type 1
MA45053A (fr) 2016-05-18 2019-03-27 Modernatx Inc Polynucléotides codant pour un régulateur de conductance transmembranaire de fibrose kystique pour le traitement de la fibrose kystique
WO2017201328A1 (en) 2016-05-18 2017-11-23 Modernatx, Inc. POLYNUCLEOTIDES ENCODING α-GALACTOSIDASE A FOR THE TREATMENT OF FABRY DISEASE
US20190194760A1 (en) 2016-05-25 2019-06-27 Curevac Ag Novel biomarkers
WO2017212006A1 (en) 2016-06-09 2017-12-14 Curevac Ag Hybrid carriers for nucleic acid cargo
EP3468612A1 (en) 2016-06-09 2019-04-17 CureVac AG Hybrid carriers for nucleic acid cargo
KR20190029576A (ko) 2016-06-09 2019-03-20 큐어백 아게 핵산 카고용 하이브리드 담체
WO2017212007A1 (en) 2016-06-09 2017-12-14 Curevac Ag Cationic carriers for nucleic acid delivery
SG11201811432WA (en) 2016-08-19 2019-03-28 Curevac Ag Rna for cancer therapy
KR20190093816A (ko) 2016-10-26 2019-08-26 큐어백 아게 지질 나노입자 mRNA 백신
WO2018096179A1 (en) 2016-11-28 2018-05-31 Curevac Ag Method for purifying rna
US11542490B2 (en) 2016-12-08 2023-01-03 CureVac SE RNAs for wound healing
EP3808380A1 (en) 2016-12-08 2021-04-21 CureVac AG Rna for treatment or prophylaxis of a liver disease
US11141476B2 (en) 2016-12-23 2021-10-12 Curevac Ag MERS coronavirus vaccine
EP3558355A2 (en) 2016-12-23 2019-10-30 CureVac AG Henipavirus vaccine
EP3558354A1 (en) 2016-12-23 2019-10-30 CureVac AG Lassa virus vaccine
WO2018167320A1 (en) 2017-03-17 2018-09-20 Curevac Ag Rna vaccine and immune checkpoint inhibitors for combined anticancer therapy
EP3625363A1 (en) 2017-05-17 2020-03-25 CureVac Real Estate GmbH Method for determining at least one quality parameter of an rna sample
KR20200024905A (ko) 2017-07-04 2020-03-09 큐어백 아게 신규 핵산 분자
US11602557B2 (en) 2017-08-22 2023-03-14 Cure Vac SE Bunyavirales vaccine
IL311278A (en) 2017-09-29 2024-05-01 Intellia Therapeutics Inc Polynucleotides, preparations, and methods for genome editing
KR20200071081A (ko) 2017-10-19 2020-06-18 큐어백 아게 신규 인공 핵산 분자
WO2019092153A1 (en) 2017-11-08 2019-05-16 Curevac Ag Rna sequence adaptation
EP3723796A1 (en) 2017-12-13 2020-10-21 CureVac AG Flavivirus vaccine
WO2019122371A1 (en) 2017-12-21 2019-06-27 Curevac Ag Linear double stranded dna coupled to a single support or a tag and methods for producing said linear double stranded dna
WO2019193183A2 (en) 2018-04-05 2019-10-10 Curevac Ag Novel yellow fever nucleic acid molecules for vaccination
BR112020020933A2 (pt) 2018-04-17 2021-04-06 Curevac Ag Moléculas de rna de rsv inovadoras e composições para vacinação
EP3813874A1 (en) 2018-06-27 2021-05-05 CureVac AG Novel lassa virus rna molecules and compositions for vaccination
WO2020002598A1 (en) 2018-06-28 2020-01-02 Curevac Ag Bioreactor for rna in vitro transcription
TW202039534A (zh) 2018-12-14 2020-11-01 美商美國禮來大藥廠 KRAS變體mRNA分子
BR112021009422A2 (pt) 2018-12-21 2021-10-26 Curevac Ag Rna para vacinas contra malária
EP3899034A1 (en) 2018-12-21 2021-10-27 CureVac AG Methods for rna analysis

Also Published As

Publication number Publication date
CN110914433A (zh) 2020-03-24
JP2024038121A (ja) 2024-03-19
US11739335B2 (en) 2023-08-29
RU2019132890A3 (ko) 2021-07-14
SG11201906297QA (en) 2019-10-30
CA3050616A1 (en) 2018-09-27
JP2020513824A (ja) 2020-05-21
AU2018240515A1 (en) 2019-08-01
US20230332163A1 (en) 2023-10-19
US20210403925A1 (en) 2021-12-30
RU2019132890A (ru) 2021-04-26
SG10202110491PA (en) 2021-11-29
WO2018172556A1 (en) 2018-09-27
MX2019011215A (es) 2020-02-12
EP3601576A1 (en) 2020-02-05
BR112019015244A2 (pt) 2020-04-14

Similar Documents

Publication Publication Date Title
US20230332163A1 (en) Nucleic acids encoding crispr-associated proteins and uses thereof
US20230158126A1 (en) Rna for treatment or prophylaxis of a liver disease
US20220296628A1 (en) Rna combinations and compositions with decreased immunostimulatory properties
US20220340886A1 (en) Therapeutics for glycogen storage disease type iii
JP2022519184A (ja) Rna編集オリゴヌクレオチド及びその使用
JP2021519071A (ja) シュードウリジン化のための核酸分子
JP2022510041A (ja) Msh3活性に関連するトリヌクレオチドリピート伸長障害の処置のための方法
US11939600B2 (en) Compositions and methods for treating phenylketonuria
JP2022515744A (ja) Kcnt1関連障害の治療のための組成物及び方法
CA3171750A1 (en) Mrnas for treatment or prophylaxis of liver diseases
EP3887516A1 (en) Methods of modulating rna

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application